search - 查询一个缺少的字段

从Lucene中获取灵感，您可以从磁盘上的反向索引结构开始，然后在所讨论的所有字段中执行一个跨越迭代器。

E.g。

示例文档

{"id": 1, "network": "NBC", "show": "Wheel of Fortune", "host": "Pat Sajak", "sponsor": "NordicTrack"}

{"id": 2, "network": "NBC", "show": "Jeopardy", "host": "Alex Trebek", "sponsor": "IBM Watson"}

{"id": 3, "network": "NBC", "show": "The Wizard of Odds", "host": "Alex Trebek", "sponsor": "NordicTrack"}

倒置指数

网络：=＆＃34; NBC＆＃34; （1,2,3）

show ：=＆＃34; Jeopardy＆＃34; （2），＆＃34;赔率精灵＆＃34; （3），＆＃34;财富之轮＆＃34; （1）

主持人：=＆＃34; Alex Trebek＆＃34; （2,3），＆＃34; Pat Sajak＆＃34; （1）

赞助商：=＆＃34; IBM Watson＆＃34; （2），＆＃34; NordicTrack＆＃34; （1,3），

发出的查询：

网络： NBC

主持人： Alex Trebek

赞助商： NordicTrack

显示：未知

查询执行

迭代步骤1

网络：=＆＃34; NBC＆＃34; （1 ...



将共识ID更新为 1



在所有其他查询字段（如果存在）中进入共识ID



迭代步骤2

网络：=＆＃34; NBC＆＃34; （1 ...

主持人：=＆＃34; Alex Trebek＆＃34; （2 ...

错误：id:2高于共识ID，



将共识ID更新为 2



在所有其他查询字段中进入新的共识ID（如果存在）



迭代步骤3

网络：=＆＃34; NBC＆＃34; （ 1 ，2 ......

主持人：=＆＃34; Alex Trebek＆＃34; （2 ...

赞助商：=＆＃34; NordicTrack＆＃34; （ 1 ，3）

错误：id:3高于共识ID，



将共识ID更新为 3



在所有其他查询字段中进入新的共识ID（如果存在）



迭代步骤4

网络：=＆＃34; NBC＆＃34; （ 1 ， 2 ， 3 ）

主持人：=＆＃34; Alex Trebek＆＃34; （ 2 ， 3 ）

赞助商：=＆＃34; NordicTrack＆＃34; （ 1 ， 3 ）

匹配：所有查询的字段都同意，


将 3 添加到匹配列表


...

使用线性迭代，由leapfrog执行的比较次数是查询的所有字段的过帐列表长度的总和。

但是使用Skip Lists可以减少比较次数。（虽然这需要快速随机访问帖子）。

查询一个缺少的字段

1 个答案: