循环显示值

时间:2017-04-20 23:14:54

标签: r web-scraping rvest rcurl httr

我正在尝试在网站中执行多次搜索,并且很难设计插入不同值的函数并将结果转换为数据框

下面是我提出的一组命令,但它只对单个搜索有帮助

fn  = 'HARVEY'

ln  = 'ADELSON'

mydf = data.frame(fn,ln);




  root = 'https://npiregistry.cms.hhs.gov/'


  u = paste(root,'registry/search-results-table?','first_name=', mydf$fn, '&last_name=', 
            mydf$ln, sep = "");

            # encode url correctly

            zero <- httr::GET(u);
  tables <- rvest::html_table(content(zero));


tab<-as.data.frame(tables)

r中是否有一个函数可以为第一个和最后一个名称插入不同的值并运行命令集,最后将所有结果存储在一个数据帧中。

由于

1 个答案:

答案 0 :(得分:1)

通常,您可以使用Mapmapply将函数应用于data.frame列的相应元素。结果作为data.frames列表返回。然后,您可以对它们进行行绑定(使用plyr::rbind.filldata.table::rbindlist)来创建单个data.frame

library(httr)
library(rvest)

fn <- c('HARVEY', "Dollar")
ln <- c('ADELSON', "Vora")
mydf <- data.frame(FirstName=fn, LastName=ln);
root <- 'https://npiregistry.cms.hhs.gov/'

#you can use data.table::rbindlist or plyr::rbind.fill to row bind a list of data.frames
as.data.frame(data.table::rbindlist(Map(function(fn, ln) {
    u <- paste0(root,'registry/search-results-table?',
        'first_name=', fn, '&last_name=',  ln)
    zero <- GET(u)
    tables <- html_table(content(zero))

    as.data.frame(tables)
}, mydf$FirstName, mydf$LastName), fill=TRUE))