使用BeautifulSoup将文件中的HTML表解析为csv

时间:2013-08-21 14:06:43

标签: python html python-2.7 beautifulsoup

嗨,我是一个Python noob,甚至更大的BeautifulSoup和html noob。我有一个下载的文件,里面有一个html表。在我看过的所有BeautifulSoup解析的例子中,他们都使用urllib访问表url,然后读取响应并将其传递给BeautifulSoup进行解析。我的问题是,对于本地存储的文件,我是否必须将整个文件加载到内存中?所以不要说:

    contenturl = "http://www.bank.gov.ua/control/en/curmetal/detail/currency?period=daily"
    soup = BeautifulSoup(urllib2.urlopen(contenturl).read())

我是否这样做:

    soup = BeautifulSoup(open('/home/dir/filename').read())

这似乎并不合适。所以我收到以下错误:

    Traceback (most recent call last):
    File "<string>", line 1, in <fragment>
    TypeError: 'module' object is not callable

我很抱歉,如果它真的很傻我正在做,但感谢帮助

更新:问题已解决,需要从BeautifulSoup的模块导入类。谢谢!

0 个答案:

没有答案