搜索文件内容而不将文件存储在db

时间:2016-05-14 04:30:23

标签: database filesystems alfresco

我最近一直在玩alfresco。它基本上是一个看起来非常可靠的文档管理系统。我做了一些搜索,看看alfresco是如何管理他们的文件,看他们是将文件存储在数据库中还是通过文件系统。

经过一番挖掘后,我发现一些露天​​员工stating that in fact the files are not stored in the db but stored on the filesystem之间的来回回复非常好。

这是我似乎没有理解的东西。在露天的顶部,您可以“搜索”一个文件。我通过输入实际出现在文件内容中的文本来搜索,我不是按文件名搜索。出于某种原因,搜索会返回正确的结果......

考虑到露天只是在数据库中存储元数据,而不是实际的文件内容。他们的搜索如何工作,以便它可以搜索文件内容? 我问,因为我目前正在开发一个基于dms的系统,就像露天一样,如果有一些其他进程读取文件内容以将它们编入索引,那将会很好理解吗?

2 个答案:

答案 0 :(得分:1)

Alfresco将元数据存储在数据库中,将文件存储在磁盘上。但是,使用OOTB配置时,它还会将所有元数据和文件内容编入索引到Lucene / SOLR子系统。

以后的大部分搜索都是针对该索引完成的,即使可以对数据库进行搜索。

您的Alfresco配置的一部分是决定要索引哪些元数据,以及是否完全使用FTS。

文档并不完美,但您应该能够找到一个足够好的解释。例如:

http://docs.alfresco.com/ http://docs.alfresco.com/4.0/concepts/admin-indexes.html

答案 1 :(得分:0)

当您将文件上传到alfresco时,它会在后端调用变换器。将其转换为txt,然后从中提取文本。使用搜索引擎索引内容,因此您可以根据文件内容进行搜索。 希望你现在很清楚

您可以通过更改“cm:indexControl”方面

的值来控制索引行为

http://docs.alfresco.com/4.0/concepts/admin-indexes.html

相关问题