我们如何创建自定义solr索引和自定义lucen索引来搜索alfresco中的文档?

时间:2016-12-01 07:52:53

标签: indexing solr lucene alfresco alfresco-share

实际上我参加过一些关于露天的采访,但我常常会遇到如何创建自定义索引以及如何重新索引文档的问题。

我用谷歌搜索过,但没有找到任何有用的答案,或者我仍然无法理解究竟是什么,怎么做?

任何人都可以帮我理解这一点,我们必须为自定义索引编制所需的配置吗?

先谢谢

1 个答案:

答案 0 :(得分:3)

1 /让我们承认您创建了自己的模型,并希望选择如何自定义字段的索引

我的解释将基于这个页面:http://docs.alfresco.com/5.0/concepts/search-fts-config.html和特别是这一部分:

  

数据字典选项

     

可以在内容中设置每个属性的索引行为   模型。默认情况下,它们以原子方式编制索引。物业价值是   没有存储在索引中,并且属性是标记化的   索引。以下示例显示了如何控制索引。

     

启用="假"       如果为false,则索引中不会有此属性的条目。

     

原子="真"       如果这是真的,则在事务中索引属性,否则属性在后台索引。

     

facetable ="真"       如果为true,则该属性将用于分面,如果为false,则不能将其用于分面。

     

标记化="真"       如果" true",则在索引之前对属性的字符串值进行标记化。       if" false",它被编入索引"按原样#34;作为单个字符串。       如果"两者"然后两个指定的表格都在索引中。

基本上,如果启用为true,则表示该字段可以搜索。

如果标记化为真,则意味着(简而言之)如果只查看其中的一部分,那么您要编制索引的字段将会返回:

具有值" Blue cat"的字段如果

将会返回
  • 它是标记化的,而且是" cat"或者"蓝色"被查询
  • 它没有被标记化和确切的句子"蓝猫"会被问到。 通常,文档内容是标记化的,这就是为什么你不能通过他的内容找到一个文档,只用几句话。

2 /我们承认您要更改数据类型分析器:

对于每种数据类型,选择分析器来处理相应的字段。您可以在此处查看配置文件:https://github.com/Alfresco/community-edition/tree/master/projects/system-build-test/config/alfresco/model

在默认配置文件(dataTypeAnalyzers.properties)中,您可以看到(例如)AlfrescoStandardAnalyser处理文本字段。 现在,由于我使用法语区域设置配置了我的Alfresco,我的露天将使用dataTypeAnalyzers_fr.properties文件覆盖此行为,因此文本字段将由FrenchAnalyzer处理。 这款分析仪对我来说更好,因为它可以处理一些法国特色。如果需要,您可以使用雪球覆盖此分析器(具有不同的行为)。

3 /我们承认您有技术需求,您想自定义您的Solr配置

我的解释仍将基于此页面:http://docs.alfresco.com/5.0/concepts/search-fts-config.html

  

Solr 4索引属性

     

solr.host =本地主机       Solr实例所在的主机名。

     

solr.port = 8080       正在运行Solr实例的端口号。

     

solr.port.ssl = 8443       正在运行Solr SSL支持的端口号。

     

solr.solrUser = solr的       Solr用户名。

     

solr.solrPassword = solr的       Solr密码。

     

solr.secureComms = HTTPS       HTTPS连接。

     

solr.solrConnectTimeout = 5000       Solr连接超时(以ms为单位)。

     

solr.solrPingCronExpression = 0 0/5 * * *? *       cron表达式定义了Solr Admin客户端(由JMX使用)在Solr 4消失时的频率。

如果需要,您可以更改一些Solr参数。我不会再进一步​​了,因为我觉得这不是你想要的。

4 /对于reindex部分,由于Gagravarr已经为您提供了文档链接,我不会非常具体:http://docs.alfresco.com/5.1/tasks/solr-reindex.html 请记住,索引是可重新调整的,因此您只需删除索引文件夹即可开始重建索引。

我最后会说,我只涵盖了索引主题的一小部分。由于这是一个巨大的领域,我们真的需要您指定您的需求,以便给您正确的答案。