Solr delta导入不起作用

时间:2013-09-06 14:34:18

标签: sql solr

我正在使用solr 4.2。请注意,完全导入有效,但某种方式delta导入不起作用。 Delta导入不会出现任何错误,但从不提取任何更改。这是数据配置文件。

<dataConfig> 
<dataSource type="JdbcDataSource" 
                   driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" 
                   url="jdbc:sqlserver:testsql;databaseName=test" 
                   user="dba" 
                   password="dba"/> 


  <script>
    <![CDATA[
    function metadataTransformer (row) {
        var attributeName = row.get("attribute_name");
        var attributeValue = row.get("attribute_value");
        row.put(attributeName, attributeValue);

        return row;
    }
    ]]>
  </script>

<document name="PRODUCTS">

<entity name="product" query="select distinct  p.product_id as id from products p
                              inner join products_meta pm on p.product_id = pm.product_id
                              inner join meta m on pm.meta_id = m.meta_id
                              where m.meta_type_id = 11 order by id desc" 

deltaImportQuery="select distinct  p.product_id as id from products p
                              inner join products_meta pm on p.product_id = pm.product_id
                              inner join meta m on pm.meta_id = m.meta_id
                              where m.meta_type_id = 11 and p.product_id='${dih.delta.product_id}'"

deltaQuery= "select distinct  product_id as id from products 
                              where updtime > '${dih.last_index_time}'">

<field column="id" name="id"/> 

<entity name="attribute" query="select attribute_name,attribute_value from solr_import
                                where id =${product.id}" transformer= "script:metadataTransformer">

</entity>
</entity>

</document> 
</dataConfig>

这是我没有运气的尝试。

将p.product_id ='$ {dih.delta.product_id}更改为p.product_id ='$ {dih.delta.id}以及其他方式。 改变updtime的位置&gt; '$ {dih.last_index_time}'“到updtime&gt;'$ {dih.last_index_time}''”

请帮忙。

2 个答案:

答案 0 :(得分:1)

这是固定的。问题是solr box是在UTC时区。一旦我将其转换为ET时区,delta导入就开始正常工作了。 希望这有助于其他人。

答案 1 :(得分:0)

如果您不想使用$ {dih.last_index_time}(服务器的时间配置问题),您可以尝试mysql查询,如:

deltaImportQuery="SELECT * FROM table_name where id='${dataimporter.delta.id}'"
deltaQuery="select id from table_name where update_time  > SUBTIME( NOW( ) , '0:15:0' )

我和crontab一起使用并且工作正常!