Question

我正在尝试从this site中提取地址，而html看起来像这样：

<div class="col-xs-12 col-sm-6 col-address">
<div>ul. Małachowskiego 45<br />42-500 Będzin<br />woj. śląskie</div>
</div>

到目前为止，我使用

soup = BeautifulSoup(firma, "lxml")
address = soup.find("div", class_="col-address")
if address:
    address_firmy = (address.text)

我得到："ul. Małachowskiego 4542-500 Będzinwoj. śląskie"

现在有两个问题：

这可能非常简单，但我对编程和Python都是全新的......;）

Answer 1

In [56]: soup.div.get_text(separator=',', strip=True)
Out[56]: 'ul. Małachowskiego 45,42-500 Będzin,woj. śląskie'