Rvest:并非所有行都被废弃

时间:2018-05-15 07:32:12

标签: html r rvest

我想使用rvest包在R中刮取HTML表。它有效,但我有一个问题:并非所有行都被删除。对于这个例子,我使用来自Yahoo!的数据金融。以下是我的代码:

library("rvest")

# I use AAPL as an example
# Time period: Jan 1, 2012 - May 14, 2018

url = 'https://finance.yahoo.com/quote/AAPL/history?period1=1325350800&period2=1526230800&interval=1d&filter=history&frequency=1d'

df = url %>%
  read_html() %>%
  html_nodes("table") %>%
  html_table()
df = data.frame(df[[1]])
nrow(df)

当我看到总行数(仅为101(2017年12月20日 - 2018年5月11日))时,问题就出现了。我错过了什么?

谢谢。

0 个答案:

没有答案
相关问题