图像Scrapy的抓取类名称

时间:2020-04-16 19:41:33

标签: python scrapy

我正试图从tripadvisor.com上获取评论详细信息,但要使其物有所值,我还必须能够检索评分。但是,它们以图像而不是实际数字给出。该图像具有不同的类别名称,例如5星评级图像具有以下代码class="ui_bubble_rating.bubble_50,而1星评级具有以下代码:class="ui_bubble_rating.bubble_10"

我已经能够检索以下内容:

In [19]: response.css('div.location-review-review-list-parts-RatingLine__bubbles--GcJvM > span').extract_first()                                                                                            
Out[19]: '<span class="ui_bubble_rating.bubble_40"></span>'

但是,我只想检索ui_bubble_rating.bubble_40,因为这样会使过程更容易。

有没有一种方法可以刮我的班级名称,以便我可以检索评分?

我曾在以下酒店尝试过,但可能是任何一家: https://www.tripadvisor.com/Hotel_Review-g188590-d6767297-Reviews-or15-XO_Hotels_Couture-Amsterdam_North_Holland_Province.html

非常感谢!

0 个答案:

没有答案