r - R用rvest，xml，iframe的第二页抓取文本

您好我想通过以下链接从投资目标中提取页面：

http://quote.morningstar.com/etf-filing/Prospectus/2018/1/18/t.aspx?t=SPY&ft=497&d=0833554effb2f4d14d1f23a561738303

我有以下代码，但问题是它刮擦并给了我第一页，而我希望提取实际部分和文本的第二页

linke = 'http://quote.morningstar.com/etf-filing/Prospectus/2018/1/18/t.aspx?t=SPY&ft=497&d=0833554effb2f4d14d1f23a561738303'

read_html(linke) %>% 
html_node("iframe.sec_frame") %>% 
html_attr("src") %>% 
read_html() -> pg

text1<-html_node(pg, xpath=".//div[contains(., 'Investment Objective')]") %>% 
html_text()

R用rvest，xml，iframe的第二页抓取文本

0 个答案: