我正在使用Pysolr的Python代码将SOLR中的所有文档移动到elasticsearch。
使用pysolr我只能访问499个文档,有一种方法可以访问整个文档集。
答案 0 :(得分:0)
可以使用pysolr API中的offset和size参数以499的方式访问文档,我在详细检查了Pysolr api后发现了这一点。示例代码如下:
limit = 499
offset = 0
while True:
kwargs = {'sort':'id DESC'}
response = source.search(q='projectid:774 AND source:FACEBOOK', start=offset, rows=limit, **kwargs )
print(len(response.docs))
offset = offset + limit
if len(response.docs) == 0:
break
# Do neccessary Operations
pass