如何在使用Pandoc

时间:2018-01-02 00:56:34

标签: pandoc

我有一个像这样的html文件:

<!DOCTYPE html>
<html>
<head>
<style>
h1 {text-align:center;}
p {text-align:center;}
</style>
</head>
<body>

<h1>My heading</h1>
<p>Some poetry here.</p>

</body>
</html>

我想在pandoc中将其转换为docx。我尝试了通常的命令

  

pandoc -s test.html -o test.docx

文本正确呈现,但不是居中。我自动生成数百个htmls,因此手动修复不在预算范围内。基本上我需要让一些段落左对齐(默认)和一些居中,因为它们是诗歌。如何实现这一目标?

谢谢。

PS:我也可以使用markdown作为输入语言而不是Html。

1 个答案:

答案 0 :(得分:2)

您需要自定义一个 docx 模板,并在将 HTML 转换为 docx 时应用该模板。在您的情况下,<h1> 在 Word 中转换为 Heading 1,而 <p> 转换为 First Paragraph

步骤:

  1. 创建 docx 模板。

    pandoc -o custom-reference.docx --print-default-data-file reference.docx

  2. 打开 custom-reference.docx 并修改样式。

    1. 中心Heading 1
    2. 中心First Paragraph
  3. 保存custom-reference.docx

  4. 转换。

    pandoc input.html -o output.docx --reference-doc custom-reference.docx