以编程方式访问网页

时间:2013-11-09 15:19:43

标签: java html parsing

有一个网站在输入卷号并单击提交按钮后显示结果。我需要以编程方式访问某些可用卷号的结果。

泡沫的HTML代码是:

<form action="http://www.rtuportal.com/result/65-b-tech-ivth-sem-main-exam-result-2013/" method="post">
    <input type="" name="roll_number" value="" placeholder="enter your roll number">
    <input type="submit" value="Submit">
</form><div style="margin-top: 30px;"><div class="fb-comments" data-href="http://www.rtuportal.com/result/65-b-tech-ivth-sem-main-exam-result-2013/" data-width="730" data-num-posts="10"></div></div>
  1. 是否要将代码号发送到action代码的form属性中提到的网址?
  2. 需要发送哪些数据以及如何格式化?
  3. 我将使用jsoup在Java中执行此操作。

    更新:我能够获取存在结果数据的URL,但是当我使用jsoup连接到它时,我收到“发生错误”但是当我通过浏览器访问相同的URL时,结果显示正确。我是否需要一些东西来使这个jsoup请求看起来像浏览器请求?我已经在使用Mozilla作为UA。

1 个答案:

答案 0 :(得分:1)

  1. 表单使用post方法。看看这段代码。它以Mozilla Firefox的形式打开结果页面。 <input type="" name="roll_number"中定义名称的变量将使用data()方法传递到页面。
  2. 代码格式无法正常工作

    Document doc = Jsoup.connect("url")
    .data("roll_number", "yourValue")
    .userAgent("Mozilla")
    .post();
    
相关问题