将Word文档另存为UTF-8编码的HTML

时间:2019-05-07 13:00:47

标签: perl utf-8 win32ole

我有一个Perl脚本,可将Word文档另存为HTML文档。 以下代码有效:

use strict;
use Win32::OLE::Const 'Microsoft Word';
[...]
$go_word_doc->SaveAs2({
    FileName => $gs_html_name,
    FileFormat => wdFormatFilteredHTML
    });

为了以UTF-8编码输出文件,我这样写:

use strict;
use Win32::OLE::Const 'Microsoft Word';
use Win32::OLE::Const 'Microsoft Office [0-9.]+ Object Library';
[...]
$go_word_doc->SaveAs2({
    FileName => $gs_html_name,
    FileFormat => wdFormatFilteredHTML,
    Encoding => msoEncodingUTF8
    });

代码运行,但是生成的文件未正确编码。

然后我想知道如何继续。 我读过有关使用WebOptions的信息,但找不到解决方法。

有人可以帮忙吗? 预先感谢。

0 个答案:

没有答案