.NET api提取不同文件类型的文件内容

时间:2016-12-10 11:13:06

标签: .net file

我正在尝试为我的主要项目制作一个e发现软件。任何人都可以建议开源api提取文件内容并保存到另一种格式或数据库。我正在考虑从不同的文件中挖掘并将它们保存为我自己的格式或数据库。文件类型包括所有办公室类型文件,电子邮件,pdf。类似于" Stellent"会很好但是开源。请找不到任何好的api。

1 个答案:

答案 0 :(得分:1)

Apache Tika有一个.Net包装器 - TikaOnDotNet

这将从各种文件类型中提取文本。