使用pd.read_html抓取多个表

时间:2016-12-07 19:23:32

标签: python pandas html-table

我正试图从谷歌财务中获取公司财务数据的表数据。这是我的代码:

    url = 'https://www.google.com/finance?q=googl&fstype=ii'
    dfs = pd.read_html(url, flavor='html5lib')
    writer = pd.ExcelWriter('output.xlsx', engine='xlsxwriter')
    for df in dfs:
        print(df)
        df.to_excel(writer, sheet_name='Sheet1')
        writer.save()

但是,当我打印(df)时返回的是所有表数据,但是保存到excel的只是收入表的季度数据表。有谁知道为什么不将所有数据保存到excel?任何帮助将不胜感激。

谢谢!

1 个答案:

答案 0 :(得分:0)

看起来程序会覆盖与循环相同的工作表/位置中的每个数据帧。

因为需要将每个数据帧写入新工作表或将每个数据帧放在同一工作表中。

请参阅XlsxWriter文档中的这些示例: