从网站上刮取数据(费率)

时间:2016-02-03 23:32:27

标签: xml web-scraping screen-scraping

我正试图从网站下面扫描这个速度(“5.55”)并将其导入谷歌电子表格。我努力了很多次,只有ERROS作为答案出来了,我知道已经有人对此提出疑问。

网站:http://www.alphatransfers.co.uk/

我试过了两个:

1)IMPORTXML(B3,/ html [@ class ='js'] / body [@ class ='主页page-id-55 page-template-default template-slider with_aside aside_right color-custom style-default layout -full-width header-modern sticky-header sticky-white subheader-title-left nice-scroll'] / div [@ id ='Wrapper'] / div [@ id ='Content'] / div [@ id =' content_home'] / div [@ class ='content_wrapper clearfix'] / div [@ class ='sidebar sidebar-1 four columns'] / div / form [@ id ='bottom_form'] / div [@ class ='mkt_strip' ] [2] /跨度[@ ID = 'mkt_rate_02'])

2)= IMPORTXML(B3,“// div [@ class =`mkt_strip'] | // div [@ class ='span_id']”)

非常感谢。

1 个答案:

答案 0 :(得分:0)

为了获得纯值的基本目的,您要使用的公式是:

=IMPORTXML("http://www.alphatransfers.co.uk/","//*[@id='mkt_rate_02']")

如果你想清理额外的空间而冒号使用它:

=SUBSTITUTE(IMPORTXML("http://www.alphatransfers.co.uk/","//*[@id='mkt_rate_02']"),": ","")