不一致的结果是美丽的汤吗?

时间:2018-09-06 07:04:29

标签: python beautifulsoup

因此,我正在抓取一个网站,尽管我能够返回该网页的html,但美丽的“查找”结果却不一致。 在一遍又一遍地运行检索同一页面时,BS4有时可以找到某个标签,有时却找不到。

我测试了len网页,当Beautiful soup能够检索想要的标签时,len是9220189(正确大小),而在不能的情况下是103557968。 我以两种尺寸打印了网页,并且它们是一致的。实际上,在两个网页打印中都可以找到我要查找的字符串。

这可能是美丽汤的大小限制吗? 我不知道发生了什么事?

编辑: 链接: https://www.brenda-enzymes.org/ligand.php?brenda_ligand_id=1

我正在寻找什么: soup.find(string ='Molecular Formula')

有时可以找到该字符串,有时找不到。文本始终在网页中,并且未使用javascript加载。

1 个答案:

答案 0 :(得分:0)

我已经通过减小html的大小解决了这一问题。虽然我没有找到更好的解决方案,但是必须这样做。

相关问题