如何在保留非降价HTML标记的同时将HTML转换为Markdown?

时间:2013-04-27 06:16:27

标签: markdown pandoc

我希望能够获取现有的HTML代码段并将其转换为markdown。 为此我试过pandoc:

pandoc test.html -o test.md

test.html看起来像这样:

Hello

<!-- more -->

and some more text

<h2>some heading</h2>       

结果如下:

Hello and some more text

some heading
------------

因此,它不仅可以转换在降价中具有直接含义的标签。它还删除了我想要保留为HTML的标记(例如,HTML评论,iframe标记等等。)

  • 如何将HTML转换为markdown,使得任何没有markdown等效标记的标记都保留为原始HTML?
  • 更一般地说,如何控制HTML到降价转换的方式?

特别是,我对命令行程序选项感兴趣。例如,也许有可以提供给pandoc的选项。

1 个答案:

答案 0 :(得分:20)

经过一番搜索后,我了解了thread on table parsing中的--parse-raw选项。

添加--parse-raw选项似乎不会删除非降价等效的HTML标记。

pandoc test.html -o test.md --parse-raw