使用HTMLAgilitypack从具有特定颜色属性的表中提取值

时间:2014-03-18 16:53:04

标签: html parsing xpath html-agility-pack

我试图在数据上提取数月的红色网页上的表格。我尝试使用带有//font[@color='#ff0000']的XPath,它返回了我想要的月份,但是我失去了那些月份的那一年。我想我必须逐行提取几个月并将这一年追加到几个月。我可能会遗漏一些东西,因为我是使用HTMLAgilitypack的新手。该表来自http://www.raws.dri.edu/cgi-bin/rawNAME.pl?idIAN1

<td> <b> 2014 </b> </td> 
<td><font color=\"#ff0000\"> <b> Jan </b></font> </td>
<td><font color=\"#ff0000\"> <b> Feb </b></font> </td> 
<td><font color=\"#ff0000\"> <b> Mar </b></font> </td> 
<td> Apr  </td> 
<td> May  </td> 
<td> Jun  </td> 
<td> Jul  </td> 
<td> Aug  </td> 
<td> Sep  </td> 
<td> Oct  </td> 
<td> Nov  </td> 
<td> Dec  </td>

1 个答案:

答案 0 :(得分:1)

您可以将该条件作为谓词传递,即使用XPath:

//td[font[@color='#ff0000']]

或者您可以遍历当前XPath返回的节点的ParentNode ...