jSoup提取从DIV标记到String的文本

时间:2014-01-31 09:31:50

标签: java android text jsoup

我想从网站中提取一些文本并存储在String中。

<div class="textclass" id="textid" itemprop="itemtext">I want to get this Text</div>

问号是什么?

protected Void doInBackground(Void... params) {
            try {
                Document document = Jsoup.connect(url).get();

                Elements text = document.select("???");

                desc = text.attr("???");
            } catch (IOException e) {
                e.printStackTrace();
            }
            return null;
        }

2 个答案:

答案 0 :(得分:4)

使用以下

Elements text = document.select("div");
String desc = text.text();
Log.i(".........",+desc);

尝试结束后的日志

01-31 04:45:15.272: I/.........(1233): I want to get this Text

编辑:

您可以使用

Elements text = document.select("div[class=textclass");

或使用id

Elements text = document.select("div[id=textid]");

Elements text = document.select("div[itemprop=itemtext]");

答案 1 :(得分:0)

你可以试试这个:

    Document doc1 = Jsoup.connect(url).get();
    Element contentDiv = doc1.select("div[id=textid]").first();
    String text=contentDiv.getElementsByTag("div").text();

    System.out.println(text); // The result

所以在div中输入id为“textid”的文本保存在变量“text”中。