自动将标签添加到HTML

时间:2014-12-01 10:59:43

标签: html parsing dom beautifulsoup

我有一个充满.html文件的文件夹。我想编辑所有这些文件。我想编辑它们如下。这是我的原始代码:

<td class="class1" align="left" valign="top" height="100%" width="100%">Text to edit</td>

我希望用以下内容替换所有出现的内容:

<td class="class1" align="left" valign="top" height="100%" width="100%"><h2>Text to edit</h2></td>

注意添加的h2标签。

我可以使用哪种最好,最简单的程序/方法将这些规则应用于Windows 7中的整个文件夹? BeautifulSoup?有一个简单的方法来做到这一点?你会为类似的工作推荐哪些程序/ API?

感谢。

2 个答案:

答案 0 :(得分:1)

我宁愿使用正则表达式。

只需用您喜欢的脚本语言编写一个脚本,然后打开所有这些文件并使用PHP preg_replace 方法。

XPath也是杰罗姆推荐的选项,但我相信它有点&#34;矫枉过正&#34;为了这么简单的需要。

答案 1 :(得分:0)

如果您将html视为xml,则可以使用xpath完成此操作。

相关问题