Question

我对获取段落标记的内容感到有点困惑。

list = soup.find_all("div","SomeID")

我此时已达到

import urllib
from bs4 import BeautifulSoup

html = urllib.urlopen('http://www.dawn.com/news/1267272/democracys-woes').read()
soup = BeautifulSoup(html, 'html.parser')
list = soup.find_all("div","comment__body cf")
print list

但如何获得段落内容。（多么有声音！）

基本问题是从

获取所有段落标记的内容

public final Class MoneyI implements Money {

    public MoneyI(int a, Currency b) {
    }

    public MoneyI(int a, String b) { 
        this(a, Currency.getInstance(b.equals("A") ? "B" : b));
        b = b.equals("A") ? "B" : b;
    }

}

Answer 1

您可以使用CSS selector实际执行此操作：

for p in soup.select("div.SomeID > p"):
    print(p.get_text(strip=True))

或者，如果您需要一个p元素：

soup.select_one("div.SomeID > p").get_text(strip=True)

请注意，此处>表示直接的父子关系。

获取段落内容

1 个答案: