你如何使用org.jsoup.examples中的HtmlToPlainText()方法

时间:2013-07-23 22:31:30

标签: jsoup

请注意,我现在只使用java编程一周了,所以要保持速度。我正在编写一个程序,以获取在线新闻文章和所有读者评论并将它们转换为graphml文档,我已经掌握了java和jsoup,但现在我正在尝试将评论转换为轻微格式化的带行的文字

Elements comments = qaDoc.select("li[data-comment-id]");

for (Element comment : comments) {

//code

  commentText = comment.select("div[class$=d2-body]").first().HtmlToPlainText();

//code

}

但是当我尝试编译时,我一直收到“错误:无法找到符号”指向.HtmlToPlainText()

我已经把

import java.lang.Object; import org.jsoup.examples.HtmlToPlainText;

在课程开始时以及其他必要的导入 我也找不到HtmlToPlainText的来源,因为ListLinks不在Cookbook中 顺便说一下,不使用eclipse ide,只需要在windows中使用je编辑器和命令提示符 感谢

1 个答案:

答案 0 :(得分:1)

HtmlToPlainText是JSoup库中的一个类,你尝试调用的“方法”是它的构造函数,因此你将无法编译和运行你拥有的代码到目前为止。

由于您的代码不完整,我假设commentText是注释的简单字符串表示,然后您应该能够执行以下操作来实现您想要的:

commentText = comment.select("div[class$=d2-body]").first().text();

将返回带有文本及其所有子项的字符串。

您也可以使用简单的toString() - 方法。

commentText = comment.select("div[class$=d2-body]").first().toString();

我强烈建议您随时咨询JSoup API,它可以帮助您解决很多问题。在'examples'子包中,您可以找到类HtmlToPlainText

相关问题