将两个id组合成一个新表?

时间:2016-10-03 11:56:20

标签: python mysql database text-processing information-retrieval

我有一个关于文本处理的任务,我不知道如何将来自不同表的一些列合并到一个表中

所以情况如下: 我有一个名为list的表格,其中包含id_doctitle列 然后我创建一个名为term_list的新表,其中包含一个结果术语列表,当我对list的标题进行一些文本处理时。

term_list表包含id_termtermdfidf列。最后,我想要一个名为term_freq的表,其中包含idid_termid_doctfnormalized_tf

示例: 表list是这样的:

id_doc             titles
  11      information retrieval system
  12          operating system
  13         business information

term_list位于此之下:

id_term     term         df    idf
   21     information     2     --
   22      retrieval      1     --
   23       system        2     --
   24      operating      1     --
   25       business      1     --

我想问一下如何创建一个表term_freq,以便表格变成这样?

id    id_term     id_doc    tf      normalized_tf
31      21          11       1           -- 
32      22          11       1           --
33      23          11       1           --
34      24          12       1           --
35      23          12       1           --
36      25          13       1           --
37      21          13       1           --

主要问题是我必须将id_termid_doc加入一个表{1}}与多个id_doc有关,但我不知道如何关联因为id_termlist没有任何相似的列。

请帮助:(

1 个答案:

答案 0 :(得分:0)

您可以在term_list中迭代行:

SELECT id_term, term FROM term_list

为每个term制作:

SELECT id_doc FROM list WHERE titles LIKE "term"

并将对id_termid_doc保存在表term_freq中。