Jsoup解析HTML但我丢失了数据

时间:2016-05-20 06:55:08

标签: android jsoup

我正在使用jsoup lib从html文件中获取一些数据。我正在使用Volley来获取请求和jsoup来获取数据。但是当我记录html的主体时,我可以丢失数据,但是没有

但是在内部。

网址:http://zodia123.gr/widget4_show.php#

我的代码:

@Override
    public void onResponse(String response) {
        String charset = "ISO-8859-1";
        Document doc = Jsoup.parse(response, charset);
        Log.e("Web", "Response body :" + doc.body());
    }

丢失数据:

<p></p>Βάζετε νέες προκλήσεις μπροστά σας και νιώθετε έτοιμοι να εντυπωσιάσετε με τις επιδόσεις σας. Εσείς που είστε μόνοι θα κάνετε πολλές καινούργιες γνωριμίες αλλά δεν αποκλείεται να γυρίσετε πίσω σε μια σχέση του πρόσφατου παρελθόντος. Οι αδέσμευτοι του ζωδίου, θα νιώσετε μπερδεμένοι γιατί θα δείτε πρόσωπα του παρελθόντος που θα σας αναστατώσουν και συγχρόνως θα γοητευτείτε από καινούργιες παρουσίες που θα μπουν στη ζωή σας. 
        </div>

Log.e输出:

E/Web: Response body :<body> <!-- --> <div class="widget-border with-img" style="text-align:center;width:320px;height:450px"> <div class="scrollable"> <div class="items"> <div class="item"> <img src="/images/widget_signs/aries.png"> <h5>ÎÏιÏÏ</h5> </div> <div class="item"> <img src="/images/widget_signs/taurus.png"> <h5>ΤαÏÏοÏ</h5> </div> <div class="item"> <img src="/images/widget_signs/gemini.png">

- 编辑 -

排球响应:

...
 <div class="item">
   <img src="/images/widget_signs/aries.png">
   <h5>ÎÏιÏÏ</h5>
   <p></p>ÎάζεÏε Î½Î­ÎµÏ ÏÏοκλήÏÎµÎ¹Ï Î¼ÏÏοÏÏά ÏÎ±Ï ÎºÎ±Î¹ νιÏθεÏε έÏοιμοι να ενÏÏÏÏÏιάÏεÏε με ÏÎ¹Ï ÎµÏιδÏÏÎµÎ¹Ï ÏαÏ. ÎÏÎµÎ¯Ï ÏÎ¿Ï ÎµÎ¯ÏÏε μÏνοι θα κάνεÏε ÏÎ¿Î»Î»Î­Ï ÎºÎ±Î¹Î½Î¿ÏÏÎ³Î¹ÎµÏ Î³Î½ÏÏÎ¹Î¼Î¯ÎµÏ Î±Î»Î»Î¬ δεν αÏοκλείεÏαι να γÏÏίÏεÏε ÏίÏÏ Ïε μια ÏÏέÏη ÏÎ¿Ï ÏÏÏÏÏαÏÎ¿Ï ÏαÏελθÏνÏοÏ. Îι αδέÏμεÏÏοι ÏÎ¿Ï Î¶ÏδίοÏ, θα νιÏÏεÏε μÏεÏδεμένοι γιαÏί θα δείÏε ÏÏÏÏÏÏα ÏÎ¿Ï ÏαÏελθÏνÏÎ¿Ï ÏÎ¿Ï Î¸Î± ÏÎ±Ï Î±Î½Î±ÏÏαÏÏÏοÏν και ÏÏγÏÏÏνÏÏ Î¸Î± γοηÏεÏÏείÏε αÏÏ ÎºÎ±Î¹Î½Î¿ÏÏÎ³Î¹ÎµÏ ÏαÏοÏÏÎ¯ÎµÏ ÏÎ¿Ï Î¸Î± μÏοÏν ÏÏη ζÏή ÏαÏ. 
 </div>
 <div class="item">
...

谢谢:)

1 个答案:

答案 0 :(得分:1)

一方面,这里使用了错误的方法。在您的代码中,使用此方法:

parse(String html, String baseUri)

而您想使用以下方法之一:

另一方面,url内容以UTF-8编码。 Jsoup自动默认使用此编码。所以试试这个:

@Override
public void onResponse(String response) {
    Document doc = Jsoup.parse(response);
    Log.e("Web", "Response body :" + doc.select("div.item > h5 ~ *").size());
}
相关问题