从sup标签中检索文本

时间:2012-06-20 08:27:06

标签: java html jsoup

我必须从给定代码中提取一个href值

<table>
<tr>
<td class="left ">
<a href="reference" >Refer</a>see this
<sup class="super"><a href=​"#src1" onclick=​"dosomething;​" title=​"1" >​1​</a>​</sup>
</td>
<td class="td_right2" style="padding-top: .25em"></td>
</tr>
..

</table>

我的代码是

 for(Element info: div3.select("tr")){
 Elements aqInfo= companyB.select("td") 
 String href=aqInfo.text(); 
 }

href只为我提供了标签

内的文字以外的文字

如何获取sup标签内的text和href标签?

编辑:我意识到页面源看起来像这样

<tr><td class="left "><a href="reference" ">Reference</a>see this <sup class="super_src"></sup></td><td class="right" style="padding-top: .25em"></td></tr>

firefox中的'inspect元素'显示<a>内的<sup>,我需要此<a>的内容。 如果我错了,请纠正我,但我认为Jsoup.connect(url).get();给出了源文档,而Inspect元素给出了当前加载的页面。有没有办法在页面完全加载后检索页面?

1 个答案:

答案 0 :(得分:0)

试试这个:

Element mySup= doc.select("sup.super").first();
String linkHref = mySup.child(0).attr("href");
String linkVal = mySup.child(0).text();

说明:

选择包含sup代码和super类的元素 访问其第一个a标记的子项,然后访问其href属性

从您应该执行的所有href中获取所有text inside the aa

Elements links = doc.select("a[href]");
for (Element link : links) {
  String linkHref = link.attr("href");
  String linkText = link.text();
}