以编程方式阅读Microsoft Word文档

时间:2013-02-01 21:27:21

标签: javascript coldfusion ms-word

我让我的学生将他们的Microsoft Word作业提交给ColdFusion 10服务器。我想编写一个错误检查程序来检查常见错误,例如标题中没有页码,标题页上的学校名称,标题页上的名称等等。我指定了很多APA规则。示例:短语“Running head:”必须位于第1页的标题部分,而不是纸张的其余部分。我为每个规则分配一个点值。

理想情况下,此错误检查程序会在提交作业并立即告知时运行。这可能需要使用

parser.parseFromString(str, "text/xml");

但作为替代方案,如果我可以编写一个程序来运行以检查错误,那么这可以帮助自动化我的评分。换句话说,使用Microsoft Access或Visual Studio。 但是我不想这样做因为那时我必须在服务器上安装Visual Studio而我认为这不可行。

最后一个选项是从服务器下载所有文件并在本地运行程序,这比手动评分所有内容要好一步。

2 个答案:

答案 0 :(得分:2)

几年前我使用VBA做了这个,参考这个article。以下是解析文档每个段落的摘录:

Public Sub ParseLines()
    Dim singleLine As Paragraph
    Dim lineText As String

    For Each singleLine In ActiveDocument.Paragraphs
        lineText = singleLine.Range.Text

        '// parse the text here...

    Next singleLine
End Sub

答案 1 :(得分:1)

试试:

http://docxextractor.riaforge.org/

我提取所有清晰和部分格式

免责声明:我写了