用 R 抓取下拉菜单内容

时间:2021-03-16 14:30:18

标签: r screen-scraping rvest

我对 this site

有问题

使用 Rvest,我可以抓取页面中的所有表格,除了表格末尾的菜单,即带有滚动条的菜单。而这个菜单的内容正是我想要的。 有像这样一个 010007300 这样的 9 位代码,我想获取。

这是我想要获取的一些代码:

  <option value="010007300" disabled="">010007300 - CLINIQUE AMBULATOIRE CENDANEG</option>
  <option value="010007987" disabled="">010007987 - CH HAUTEVILLE-LOMPNES</option>
  <option value="010008407" disabled="">010008407 - CH DU HAUT BUGEY</option>
  <option value="010009132" disabled="">010009132 - CHIC AIN VAL DE SAONE</option>
  <option value="010780054" disabled="">010780054 - CH BOURG EN BRESSE</option>
  <option value="010780062" disabled="">010780062 - CH BUGEY SUD</option>
  <option value="010780096" disabled="">010780096 - CH MONTPENSIER TREVOUX</option>
  <option value="010780120" disabled="">010780120 - CH DE MEXIMIEUX</option>
  <option value="010780138" disabled="">010780138 - CH DE PONT DE VAUX</option>
  <option value="010780195" disabled="">010780195 - CLINIQUE CONVERT BOURG-EN-B.</option>
  <option value="010780203" disabled="">010780203 - HÔPITAL PRIVÉ D'AMBERIEU</option>

整个东西都放在一张桌子上,这是我在 R 中使用的代码:

url_finess_list <- "https://scansante.fr/applications/casemix_ghm_cmd"

finess_page = read_html(url_finess_list)

finess_codes = finess_page %>%
  html_nodes("table") %>% .[1] %>%
  html_table() %>% .[[1]]

0 个答案:

没有答案