本地/离线网站“网站”的全文搜索

时间:2012-04-27 19:13:57

标签: javascript solr lucene full-text-search

  

可能重复:
  Full-text search for static HTML files on CD-Rom via javascript

我开始开发一个应用程序,在本地创建一堆HTML文件,然后可以在系统(包括移动设备)上复制的任何Web浏览器中进行浏览。 HTML文件具有许多交互功能,因此它本质上是一个离线Web应用程序。我的问题是,实现这些HTML文件的全文搜索的最佳方法是什么?基本上,应用程序应该索引它生成的HTML文件,但我们希望能够使HTML文件和生成的索引可供下载并供用户脱机浏览和搜索。在没有编写实际应用程序来管理它的情况下,最好的方法是什么?例如,我使用Solr实现了它,用于演示/概念验证,并且工作正常......但是当然需要HTTP POST和GET请求到服务器进行索引和查询。因此,由于索引实际上只是文件,我想知道是否有一种方法可以在HTML文件中使用Javascript,而不是使用Lucene而不是Solr来离线查询它们(并且不会为Solr启动本地Web服务器)

1 个答案:

答案 0 :(得分:1)

感谢您向我介绍一些完全用Javascript编写的文本搜索解决方案!我想查看文本搜索的代码。


Lucene是用Java编写的,它需要一个Java(技术上是一个JVM)进程才能访问。

PS1:如果您正在进行自己的简单文本搜索,a stemmer in JS会使其更有用。

original: run running cat cats love loving crap crapping
stemmed: run run cat cat love love crap crap 

PS2:您也可以运行另一个“Ngram-ized”索引进行拼写检查。


相关问题