获取段落内容

时间:2016-06-28 05:13:29

标签: python python-2.7 beautifulsoup pydev

我对获取段落标记的内容感到有点困惑。

list = soup.find_all("div","SomeID")

我此时已达到

import urllib
from bs4 import BeautifulSoup

html = urllib.urlopen('http://www.dawn.com/news/1267272/democracys-woes').read()
soup = BeautifulSoup(html, 'html.parser')
list = soup.find_all("div","comment__body cf")
print list

但如何获得段落内容。(多么有声音!)

基本问题是从

获取所有段落标记的内容
public final Class MoneyI implements Money {

    public MoneyI(int a, Currency b) {
    }

    public MoneyI(int a, String b) { 
        this(a, Currency.getInstance(b.equals("A") ? "B" : b));
        b = b.equals("A") ? "B" : b;
    }

}

1 个答案:

答案 0 :(得分:1)

您可以使用CSS selector实际执行此操作:

for p in soup.select("div.SomeID > p"):
    print(p.get_text(strip=True))

或者,如果您需要一个p元素:

soup.select_one("div.SomeID > p").get_text(strip=True)

请注意,此处>表示直接的父子关系。