获取此网站的源代码

时间:2016-07-08 09:36:28

标签: bash url curl cookies lynx

我想从我想要购买的一些书籍中获取一些数据。但为此,我需要获取页面的源代码,但我不能。

示例网址为:

http://www.mcu.es/webISBN/tituloDetalle.do?sidTitul=793927&action=busquedaInicial&noValidating=true&POS=0&MAX=50&TOTAL=0&prev_layout=busquedaisbn&layout=busquedaisbn&language=es

我正在测试curl,wget,lynx,接受cookie等各种可能性。

  # curl http://www.mcu.es/webISBN/tituloDetalle.do?sidTitul=793927&action=busquedaInicial&noValidating=true&POS=0&MAX=50&TOTAL=0&prev_layout=busquedaisbn&layout=busquedaisbn&language=es
[1] 1680
[2] 1681
[3] 1682
[4] 1683
[5] 1684
[6] 1685
[7] 1686
[8] 1687

如果我看到标题,我标记了302

   curl -I 'http://www.mcu.es/webISBN/tituloDetalle.do?sidTitul=793927&action=busquedaInicial&noValidating=true&POS=0&MAX=50&TOTAL=0&prev_layout=busquedaisbn&layout=busquedaisbn&language=es'
**HTTP/1.1 302 Movido tempor�lmente**
Date: Fri, 08 Jul 2016 09:31:07 GMT
Server: Apache
X-Powered-By: Servlet 2.4; JBoss-4.2.1.GA (build: SVNTag=JBoss_4_2_1_GA date=200707131605)/Tomcat-5.5
Location: http://www.mcu.es/paginaError.html
Vary: Accept-Encoding,User-Agent
Content-Type: text/plain; charset=ISO-8859-1

如果我使用'',“”,\? \&,wget,lynx -source,接受cookies等。我唯一得到的是下载错误页面(我发送代码302的地方)

您知道如何下载我举例说明的网址源代码吗? (Bash,php,python,perl ......)

非常感谢。

1 个答案:

答案 0 :(得分:0)

您要查找的页面不可用。尝试访问浏览器上的网站,您仍然无法获得所需的信息。如果你需要源代码,你需要给出-L标志,它将获得源代码。