从各种文档类型中删除文本

时间:2012-10-02 14:35:30

标签: c# asp.net-mvc

我正在编写一个C#asp.net Web应用程序,它接收各种格式的CV,即doc,docx,pdf,text等。

我想知道是否有一种简单的方法可以从文档中删除某些信息,无论文件类型是什么,然后将编辑后的文件传递给最终用户?

要删除的信息将保存在字符串

2 个答案:

答案 0 :(得分:2)

您需要使用单独的API解析每种文件类型。

答案 1 :(得分:0)

如果您使用streamreader(http://msdn.microsoft.com/en-us/library/system.io.streamreader.aspx)来阅读文档,您可以使用ReadToEnd函数将所有内容存储在字符串,然后使用函数:

 MyString.Replace("Something to replace", "");

删除匹配项。如果无法以字符串形式读取文件格式,则必须考虑不同的选项。但是,考虑到文件格式,可能会有更快的解决方案,并且可能不会简单地存储。