如何在Solr中使用dih索引csv文件

时间:2018-07-05 19:33:34

标签: csv indexing solr mapping dih

我是Solr的新手,所以我可能错误地写入了dih。我的solr数据库中已经有数据,我需要扩展我的dih文件,以便它可以索引包含更多信息以及csv和solr db数据的csv文件。由通用ID映射。我所做的是-在下面的代码中查找

这是我的csv文件->

Node_IP            probe_name      Global_ID    
10.53.3.87         ILRNAPSUD03     4b44aaff1e09f3d793fe9    
10.224.47.26       ILRNAPSUD03     47eebea2c2d485b59

这是一个简短的摘录->

<entity name="tmin"
 processor="XPathEntityProcessor"
 dataSource="FileDataSource"
 stream="true"
 url="${pickupdir.fileAbsolutePath}"
 onError="skip"
 forEach="/execution/" 
 transformer="script:makePair,script:makeLogPair, TemplateTransformer, 
 RegexTransformer, HTMLStripTransformer" 
>
<field column="jobid_t"  xpath="/execution/@jobId" />
<field column="destinationid_t"  xpath="/execution/@destinationid" />
<field column="id"  template="${tmin.destinationid_t}"  />
<field column="log_param"  xpath="/execution/log/@severity"  />
<field column="log"  xpath="/execution/log" />

<entity name="importcsv"
 processor="LineEntityProcessor"
 url="C:\Users\arpiagar\Desktop\IP Probe name_ILRNAPSUD01.csv"
 rootEntity="false"
 dataSource="FileDataSource" 
 header="true"
 separator="," 
 transformer="TemplateTransformer, RegexTransformer,script:mapcsv"  
>
<field column="rawLine"  groupNames="Node_IP,probe_name,Global_ID"/>
<field column="id"  name="Global_ID"  />
<field column="probe_name" name="probe_name" />

</entity>
</entity>

我需要将tmin实体中的id映射为索引csv数据并以该特定id索引probe_name和node_ip之后将获得的id。

0 个答案:

没有答案
相关问题