索引pdf文档

时间:2010-09-17 21:34:47

标签: pdf solr full-text-indexing apache-tika solr-cell

索引pdf文档的最佳方法是什么?我应该通过将pdf文档转换为txt来索引它们,还是有更好的方法来索引pdf文件?

1 个答案:

答案 0 :(得分:3)

假设您在谈论solr:请参阅ExtractingRequestHandler