现在我有一个脚本解析所有项目,将它放入一个集合(目前是一个很慢的列表),然后我想返回与我关注的关键字列表相匹配的元素。事先输入。
为此目的,什么是最好的收藏类型,有什么方法可以找到我想要的元素,而不必遍历整个集合?
谢谢。
编辑:
示例sitemap
def parse(sitemap):
req = urllib.request.urlopen(sitemap)
soup = BeautifulSoup(req, 'xml')
soup.prettify()
inventory_url = []
for item in soup.find_all('url'):
inventory_url.append(item.find('loc').text)
#matches all keywords
#keywords is a list of string
for item in inventory_url:
if all(kw in item for kw in keywords):
return item