我怎么不把JSOUP变成一个破折号并且引用一个引用而不是"?"

时间:2014-07-15 23:05:36

标签: jsoup

我成功使用“\ 00a0”进行空白,但无法将其他两个替换掉。我在Sun OS盒子上。

这是我尝试过的,可以替换& nbsp(需要能够扩展到html中的其他&n; n变量。

doc.select("h1").toString().replace("\u00a0", " ").replace("\u0096", "-").replace("\u0092", "'");

我也尝试过(使用各种参数)

Jsoup.parse(myvariable, "UTF-8"));
doc.outputSettings().escapeMode(EscapeMode.xhtml); doc.outputSettings().charset("UTF-8");

上述任何内容似乎都无效。

1 个答案:

答案 0 :(得分:0)

我遇到过这个问题,为了使你的语句有效,你应该首先使用.text()函数来检索节点的文本。然后从那里,你应该做一个.replaceAll(“\ u00A0”,“”)。这是我做什么来调节输出。我一直认为角色应该更像一个空间,就像Selenium在jsoup中那样。但是,为了解决这个问题,使用.text()。replaceAll(“\ u00A0”,“”)一直对我有用。