我的网络收获认证配置有什么问题?

时间:2012-04-07 02:03:25

标签: xml web-scraping webobjects webharvest

我最近开始使用Web-Harvest作为网络抓取工具。目前,我正在一个项目的开始工作,我想要验证/登录到一个网站。在开始之前,我想说明代码中的[URL]替换了网页的实际网址。

所以,我试图通过执行以下配置来发布登录信息:

<config>
    <var-def name="result"> 
        <http method="post" url="[URL]/webreservations/WebObjects/WebReservations.woa/wa/Login?language=1&amp;server=1" multipart="true"> 
        <http-param name="login">[myusername]</http-param>
        <http-param name="password">[mypassword]</http-param>
    </http>
</var-def>
</config>

如何检索结果信息并按照重定向进行操作?手动登录时,下面的扩展名会添加到URL中。似乎有某种随机化以及添加的会话ID。我想这是我需要在我的解决方案中加入的内容吗?

[URL]/nP8oIdbhk8MTXkrQ7Y2Z1g/0.3.0;jsessionid=2EF81CDA9A2EFF0B14E45889BC279BFA

以下是页面源代码的一部分,可能是问题的关键。这是一个WebObjects问题吗?这是一个JavaScript问题吗?我是问题吗? :)

<body onload="document.form.login.focus();">
   <form name="form" onsubmit="showDiv();return true;" method="post" action="/webreservations/WebObjects/WebReservations.woa/wa/Login">
...
</form>
</body>

非常感谢任何帮助。

1 个答案:

答案 0 :(得分:0)

确保您已获得登录所需的所有参数。它可能需要的不仅仅是密码和用户名。

相关问题