跨多种工具集的Intranet搜索引擎有哪些工具?

时间:2013-08-22 13:58:32

标签: search search-engine intranet

基本要求:

  • 应该可以索引像MediaWiki,Confluence,Sharepoint,GitHub:Enterprise,Askbot
  • 这样的内容
  • 对于重复删除结果应该相当聪明(Confluence搜索非常痛苦的一个原因)。
  • 应该明确地包含启发信息,例如链接到文档的页数,搜索条件是否在文档的标题中等。如果有一种方法可以让用户低估特定结果,那么这可能是一种奖励。
  • 应该是可调的(例如,更喜欢Confluence over Sharepoint,将某些路径列入黑名单)。

是否有可以执行上述操作的现成产品? FOSS项目?是否有FOSS项目可以提供上述基础知识并且易于扩展或构建前端?

3 个答案:

答案 0 :(得分:3)

你可以尝试Apache Solr,这是一个很棒的工具。

根据网站:

  

Solr是一种流行的,快速的开源企业搜索   来自Apache Lucene项目的平台。其主要特点包括   强大的全文搜索,点击突出显示,分面搜索,附近   实时索引,动态聚类,数据库集成,丰富   文档(例如,Word,PDF)处理和地理空间搜索。索尔是   高度可靠,可扩展且容错,提供分布式   索引,复制和负载均衡查询,自动故障转移   和恢复,集中配置等。 Solr为此提供动力   许多世界上最大的互联网的搜索和导航功能   位点。

答案 1 :(得分:0)

您可以尝试捆绑的Solr版本以及其他工具,例如OpenESPConstellio。期望花一些时间调整源和进口。与OpenESP捆绑在一起的ManifoldCF是一个开源连接器/爬虫框架,用于将连接器插入到您描述的各种系统中,并且几个连接器都是开箱即用的。

答案 2 :(得分:-1)

你可以试试Moogle。它是开源的,可以在带有IIS的Windows中轻松使用。只是看看谷歌,所以你觉得它有点熟悉。试试http://techstuff.smsjuju.com/intranet-search-engine/

相关问题