检查txt文件中是否存在多个URL(Python)

时间:2013-01-17 00:35:14

标签: python url

我是python的新手,我想做我上面所说的,但我没有任何想法,所以我该怎么办?

2 个答案:

答案 0 :(得分:0)

Open该文件。 Iterate through the linesFetch the files并检查错误。

答案 1 :(得分:0)

从你评论中的代码(你应该把它放在你的问题中),它是从你正在努力的文件中读取行。

这样做的惯用方法是这样的:

with open("hello.txt") as f:
    for line in f:
        print line,

[见File Objects中的the official Python documentation]

将其插入到您的代码中(并使用str.strip()删除换行符和每行的任何空格):

#!/usr/bin/env python

import mechanize

br = mechanize.Browser()
br.set_handle_redirect(False)
with open('urls.txt') as urls:
    for url in urls:
        stripped = url.strip()
        print '[{}]: '.format(stripped),
        try:
            br.open_novisit(stripped)
            print 'Funfando!'
        except Exception, e:
            print e

请注意,网址以方案名称(通常称为协议,例如http)开头,后跟冒号,因此有两个斜杠:

  

[stackoverflow.com]:无法获取相对引用:不查看任何文档

但是

  

[http://stackoverflow.com/]:Funfando!