for循环没有在python

时间:2015-07-30 22:14:32

标签: python algorithm

我也是Python和编程的新手。 让我首先解释一下我尝试使用下面的代码完成的任务,然后我将解释我遇到的问题。

该程序的目的是从EDGAR数据库中提取10-k文件的URL。 10-k文件基本上是上市公司的年度报告。

tk_sr_3q是我之前创建的一个python文件,其中包含一个包含大约10万个元素的列表。所有元素都是EDGAR数据库中10-k文件的搜索结果的URL。

例如:

http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=51143&type=10-k&dateb=&owner=exclude&count=100

http://www.sec.gov/cgi-bin/browse-edgar?action=getcompany&CIK=1595703&type=10-k&dateb=&owner=include&count=100

有些公司有很多10-k文件,有些有几个,有些则没有。我想从每个公司获得不超过六个10-k文件URL,然后以列表格式在文本文件中写入它们。

当我运行程序时,它没有完成。但它产生的文本文件包含大约三千个元素,如果它正确运行则不可能。

非常感谢您阅读我的问题。

import tk_sr_3q
tkfd_url_list_file = open('tkfd_url_list.txt', 'w')

for url in tk_sr_3q.list:
    tk_sr_src = requests.get(url)
    tk_sr_src_soup = BeautifulSoup(tk_sr_src.content)
    fd_link_list = tk_sr_src_soup.find_all('a', {'id': 'documentsbutton'}, limit=6)
    for link in fd_link_list:
        tkfd_url = 'http://www.sec.gov'+link['href']
        tkfd_url_list_file.write("%s" % "'"+tkfd_url+"'"+',')

tkfd_url_list_file.close()

0 个答案:

没有答案