我最近一直在玩alfresco。它基本上是一个看起来非常可靠的文档管理系统。我做了一些搜索,看看alfresco是如何管理他们的文件,看他们是将文件存储在数据库中还是通过文件系统。
经过一番挖掘后,我发现一些露天员工stating that in fact the files are not stored in the db but stored on the filesystem之间的来回回复非常好。
这是我似乎没有理解的东西。在露天的顶部,您可以“搜索”一个文件。我通过输入实际出现在文件内容中的文本来搜索,我不是按文件名搜索。出于某种原因,搜索会返回正确的结果......
考虑到露天只是在数据库中存储元数据,而不是实际的文件内容。他们的搜索如何工作,以便它可以搜索文件内容? 我问,因为我目前正在开发一个基于dms的系统,就像露天一样,如果有一些其他进程读取文件内容以将它们编入索引,那将会很好理解吗?
答案 0 :(得分:1)
Alfresco将元数据存储在数据库中,将文件存储在磁盘上。但是,使用OOTB配置时,它还会将所有元数据和文件内容编入索引到Lucene / SOLR子系统。
以后的大部分搜索都是针对该索引完成的,即使可以对数据库进行搜索。
您的Alfresco配置的一部分是决定要索引哪些元数据,以及是否完全使用FTS。
文档并不完美,但您应该能够找到一个足够好的解释。例如:
http://docs.alfresco.com/ http://docs.alfresco.com/4.0/concepts/admin-indexes.html
答案 1 :(得分:0)
当您将文件上传到alfresco时,它会在后端调用变换器。将其转换为txt,然后从中提取文本。使用搜索引擎索引内容,因此您可以根据文件内容进行搜索。 希望你现在很清楚
您可以通过更改“cm:indexControl”方面
的值来控制索引行为