我正在使用jsoup lib从html文件中获取一些数据。我正在使用Volley来获取请求和jsoup来获取数据。但是当我记录html的主体时,我可以丢失数据,但是没有
但是在内部。
网址:http://zodia123.gr/widget4_show.php#
我的代码:
@Override
public void onResponse(String response) {
String charset = "ISO-8859-1";
Document doc = Jsoup.parse(response, charset);
Log.e("Web", "Response body :" + doc.body());
}
丢失数据:
<p></p>Βάζετε νέες προκλήσεις μπροστά σας και νιώθετε έτοιμοι να εντυπωσιάσετε με τις επιδόσεις σας. Εσείς που είστε μόνοι θα κάνετε πολλές καινούργιες γνωριμίες αλλά δεν αποκλείεται να γυρίσετε πίσω σε μια σχέση του πρόσφατου παρελθόντος. Οι αδέσμευτοι του ζωδίου, θα νιώσετε μπερδεμένοι γιατί θα δείτε πρόσωπα του παρελθόντος που θα σας αναστατώσουν και συγχρόνως θα γοητευτείτε από καινούργιες παρουσίες που θα μπουν στη ζωή σας.
</div>
Log.e输出:
E/Web: Response body :<body> <!-- --> <div class="widget-border with-img" style="text-align:center;width:320px;height:450px"> <div class="scrollable"> <div class="items"> <div class="item"> <img src="/images/widget_signs/aries.png"> <h5>ÎÏιÏÏ</h5> </div> <div class="item"> <img src="/images/widget_signs/taurus.png"> <h5>ΤαÏÏοÏ</h5> </div> <div class="item"> <img src="/images/widget_signs/gemini.png">
- 编辑 -
排球响应:
...
<div class="item">
<img src="/images/widget_signs/aries.png">
<h5>ÎÏιÏÏ</h5>
<p></p>ÎάζεÏε νÎÎµÏ ÏÏοκλήÏÎµÎ¹Ï Î¼ÏÏοÏÏά ÏÎ±Ï ÎºÎ±Î¹ νιÏθεÏε ÎÏοιμοι να ενÏÏÏÏÏιάÏεÏε με ÏÎ¹Ï ÎµÏιδÏÏÎµÎ¹Ï ÏαÏ. ÎÏÎµÎ¯Ï ÏÎ¿Ï ÎµÎ¯ÏÏε μÏνοι θα κάνεÏε ÏολλÎÏ ÎºÎ±Î¹Î½Î¿ÏÏÎ³Î¹ÎµÏ Î³Î½ÏÏÎ¹Î¼Î¯ÎµÏ Î±Î»Î»Î¬ δεν αÏοκλείεÏαι να γÏÏίÏεÏε ÏίÏÏ Ïε μια ÏÏÎÏη ÏÎ¿Ï ÏÏÏÏÏαÏÎ¿Ï ÏαÏελθÏνÏοÏ. Îι αδÎÏμεÏÏοι ÏÎ¿Ï Î¶ÏδίοÏ, θα νιÏÏεÏε μÏεÏδεμÎνοι γιαÏί θα δείÏε ÏÏÏÏÏÏα ÏÎ¿Ï ÏαÏελθÏνÏÎ¿Ï ÏÎ¿Ï Î¸Î± ÏÎ±Ï Î±Î½Î±ÏÏαÏÏÏοÏν και ÏÏγÏÏÏνÏÏ Î¸Î± γοηÏεÏÏείÏε αÏÏ ÎºÎ±Î¹Î½Î¿ÏÏÎ³Î¹ÎµÏ ÏαÏοÏÏÎ¯ÎµÏ ÏÎ¿Ï Î¸Î± μÏοÏν ÏÏη ζÏή ÏαÏ.
</div>
<div class="item">
...
谢谢:)
答案 0 :(得分:1)
一方面,这里使用了错误的方法。在您的代码中,使用此方法:
parse(String html, String baseUri)
而您想使用以下方法之一:
另一方面,url内容以UTF-8编码。 Jsoup自动默认使用此编码。所以试试这个:
@Override
public void onResponse(String response) {
Document doc = Jsoup.parse(response);
Log.e("Web", "Response body :" + doc.select("div.item > h5 ~ *").size());
}