来自DBpedia查找API的常见单词的奇怪结果

时间:2012-06-22 19:09:14

标签: dbpedia

我运行关键字和前缀搜索一些通用关键字,例如 it 那里等。 关于这些的最令人惊讶的部分是它给出了错误的结果,并且处理请求的时间比一些命名实体多了大约10倍,例如诺基亚三星麦当劳

任何人都可以解释我为这些关键字获得的奇怪结果

为什么结果错了,为什么需要这么多时间来处理这些请求?

1 个答案:

答案 0 :(得分:1)

我想知道你用“那里”或“它”之类的查询寻找什么样的结果?

在搜索引擎术语的上下文中,这些通常被称为停用词,并且有时被完全忽略,因为它们非常常见,因此它们与搜索查询或结果的相关性非常小。我认为实际上这就是查找工具现在所做的,因为我没有得到你提到的相同结果。

为什么查询需要更长时间?这可能是因为单词非常频繁,并且对它们的查询会返回更多结果。这意味着搜索引擎在确定最相关的结果方面还有很多工作要做。

为什么United_States是最好的结果?可能是因为United_States的维基页面在其他维基百科页面的入站链接方面排名最高。这是查找工具中使用的相关性算法的核心。基本上有更多的链接,其中“there”,“it”等指向United_States,而不是任何其他页面,所以它被认为是这些术语中最相关的。