计算doc和docx文件中的单词

时间:2013-06-19 07:58:55

标签: php ms-word word-count

我想计算 .doc .docx 文件中的字数。

我试过下面的代码: -

$file_upload = 'test.docx';
$zip = new ZipArchive;
$file_content = " ";
if ($zip -> open($file_upload) === true)
{
   if ( ($index = $zip -> locateName("word/document.xml")) !== false ) 
   {
                $data = $zip -> getFromIndex($index);
                $xml->formatOutput = true;
                $xml = DOMDocument::loadXML($data, LIBXML_NOENT | LIBXML_XINCLUDE | LIBXML_NOERROR | LIBXML_NOWARNING);

                $file_content = strip_tags($xml -> saveXML());
    }


   echo str_word_count($file_content);
}

但上面的代码没有给我预期的结果。

我还搜索了谷歌和stackoverflow搜索部分。但我没有找到我想要的答案。

注意: - 代码不依赖于操作系统或服务器。

1 个答案:

答案 0 :(得分:0)

  

Microsoft目前不建议也不支持从任何无人参与的非交互式客户端应用程序或组件(包括ASP,ASP.NET,DCOM和NT服务)自动化Microsoft Office应用程序,因为Office可能会出现不稳定Office在此环境中运行时的行为和/或死锁。

看看PHPDocX

(来源here

相关问题