将某些文档从一个集合移到Solr中的另一个集合

时间:2019-05-01 09:58:29

标签: solr

我有一个收藏夹,我想将其中一些移到另一个收藏夹。

例如,我在集合A中有很多文档,我想将所有1个月前的旧文档移到集合B中(这些1个月前的文档不应在集合A中)。

我使用Python来完成这项工作。 如何控制从馆藏A转移到馆藏B的文档?纪录片还没有消失吗?

我知道的一个解决方案是:

  • 第一步:

    我将文档移动到临时位置(例如MySql)

  • 第二步:

    第二个代码从临时位置读取所有文档,然后移至集合B。

  • 第三步:

    第三个代码从集合A中删除。

您知道另一种解决方案吗?仅在成功插入Collection A的情况下,才能确保从Collection B中删除文档

1 个答案:

答案 0 :(得分:0)

对我来说,这听起来更好(只要存储了所有字段):

  1. 将DIH与SolrEntityProcessor结合使用,以将所需文档编入新集合
  2. 使用按查询删除来删除文档

当然,您可以通过问题搜索来验证与新馆藏和当前馆藏(而不是删除馆藏)匹配的文档数

相关问题