如何识别HTML标记并替换其间的字符?

时间:2014-11-20 08:41:14

标签: java html regex

我有这个字符串:

String s="<div style='font: 12px arial, sans-serif;'><b>Menu:<<>></b></div>"

我想将<<>>更改为&amp;lt;&amp;lt;&amp;gt;&amp;gt;以获取输出:

String s="<div style='font: 12px arial, sans-serif;'><b>Menu:&amp;lt;&amp;lt;&amp;gt;&amp;gt;</b></div>"

我曾经使用正则表达式从标签中检索文本,但这怎么可能?我需要正确的输出。

我的目标是将其用于通用HTML标记,而不仅仅是本文中的特定标记。

1 个答案:

答案 0 :(得分:1)

你可以使用commons-lang的StringEscapeUtils类来做到这一点。

string s="<div style='font: 12px arial, sans-serif;'><b>Menu:<<>></b></div>";    
System.out.println(StringEscapeUtils.escapeHtml(s));

PS:你的问题是这样的:Is there a quick way to recognize HTML ASCII codes in a String or TextView?