BeautifulSoup中的自定义属性?

时间:2019-04-04 15:20:46

标签: python beautifulsoup

我正在尝试使用Beautiful汤来定位具有非标准属性的DIV。这是DIV:

`<div data-asin="099655596X" data-index="1" class="sg-col-20-of-24 s-result-item sg-col-0-of-12 sg-col-28-of-32 sg-col-16-of-20 sg-col sg-col-32-of-36 sg-col-12-of-16 sg-col-24-of-28" data-cel widget="search_result_1">`

我需要使用data-asin属性找到find_all DIV,并同时获取asin。 BS似乎支持此功能,但是我正在做的事没有用。这是我的无效代码:

`rows = soup.find_all(attrs={"data-asin": "value"})`

我需要如何在Python3.7中制作BS才能找到所有这些DIV?

1 个答案:

答案 0 :(得分:4)

使用CSS选择器即可实现。

from bs4 import BeautifulSoup
html = '''
<div data-asin="099655596X" data-index="1" class="sg-col-20-of-24 s-result-item sg-col-0-of-12 sg-col-28-of-32 sg-col-16-of-20 sg-col sg-col-32-of-36 sg-col-12-of-16 sg-col-24-of-28" data-cel widget="search_result_1">
'''
soup = BeautifulSoup(html,'html.parser')
items=soup.select('div[data-asin="099655596X"]')
for item in items:
    print(item['data-asin'])

输出:

099655596X

OR

from bs4 import BeautifulSoup
html = '''
<div data-asin="099655596X" data-index="1" class="sg-col-20-of-24 s-result-item sg-col-0-of-12 sg-col-28-of-32 sg-col-16-of-20 sg-col sg-col-32-of-36 sg-col-12-of-16 sg-col-24-of-28" data-cel widget="search_result_1">
'''
soup = BeautifulSoup(html,'html.parser')
items=soup.select('div[data-asin$="X"]')
for item in items:
    print(item['data-asin'])