我无法使用jsoup:element.text()获取文本

时间:2018-01-16 18:55:41

标签: java html jsoup google-translate

我无法使用Jsoup获取文字:element.text()
它没有告诉我任何事情,有人帮助我。

 org.jsoup.nodes.Document d = Jsoup.connect("https://translate.google.com/#en/ar/scraping").get();
 org.jsoup.nodes.Element element = d.getElementById("result_box");
 out.print(element.text());       

1 个答案:

答案 0 :(得分:0)

当您在此处查看静态页面来源时:https://translate.google.com/#en/ar/scraping您会看到它包含以下内容:

<span id="result_box" class="short_text"></span>

但是在浏览器中加载页面时,您会看到该元素已更改为:

<span id="result_box" class="short_text" lang="ar">
    <span class="">...</span>
</span>

因此,动态填充result_box范围的内容

这意味着它不能被JSoup刮掉。

要阅读动态内容,您需要使用Selenium等网络驱动程序。

相关问题