使用pandoc将knitr html转换为Word docx

时间:2013-11-10 12:01:38

标签: r knitr pandoc

我一直使用pandoc将一些示例R markdown html输出保存到Word。我实际上只是这样做,所以我可以添加一些分页符,以便于打印:

system("pandoc -s Exercise1.html -o Exercise1.docx")

虽然输出是可以接受的,但我想知道是否有办法保持R块的原始语法高亮(就像它们在原始的编织HTML文档中一样)?

此外,我似乎在转换过程中丢失了所有图像,并且必须手动将它们粘贴到Word中。这是正常的吗?

2 个答案:

答案 0 :(得分:3)

为什么不直接将降价转换为Word格式?

无论如何,Pandoc不支持Word中的语法高亮:“Currently, the only output formats that uses this information are HTML and LaTeX.

关于图像:如果您将markdown直接转换为Word,Word文件肯定会包含这些图像。我不确定HTML源代码,但我想你可能有路径问题。

答案 1 :(得分:3)

使用rmarkdown package(烘焙到RStudio版本0.98.682,the current preview release)将Rmd转换为docx非常简单,并且代码突出显示包含在docx文件中。

您只需将其包含在降价文字的顶部:

---
title: "Untitled" # obviously you can change this
output: word_document # specifies docx output
---

但是,此转换似乎仍不支持分页符。