从R中的句子中提取动词?

时间:2019-06-19 10:59:19

标签: r nlp

请注意,我知道Extracting Nouns and Verbs from Text 对我来说不起作用,因为openNLP包中不存在他们使用的功能。

这是我的字符串列:

tibble(recipe_name = c("Easter Leftover Sandwich", "Pasta with Pesto Cream Sauce", 
"Herb Roasted Pork Tenderloin with Preserves", "Chicken Florentine Pasta", 
"Perfect Iced Coffee", "Easy Green Chile Enchiladas", "Krispy Easter Eggs", 
"Patty Melts", "Yum. Doughnuts!", "Buttery Lemon Parsley Noodles", 
"Roast Chicken", "Baked French Toast", "Yummy Slice-and-Bake Cookies", 
"Yummy Grilled Zucchini", "Chocolate Covered S’mores", "T-Bone Steaks with Hotel Butter", 
"Mango Margaritas!", "Tuscan Bean Soup with Shrimp", "Hoppin’ John", 
"Turkey Bagel Burger"))

我想进行分析,找出每个名称中的所有动词/名词等。

如何在R中做到这一点? 我已经检查了qdaptm软件包,但没有找到将其解压缩的函数。

请告知操作方法。

1 个答案:

答案 0 :(得分:3)

您可以通过使用udpipe库中的udpipe_annotate函数来获取它:

library(udpipe)
ud_model <- udpipe_download_model(language = "english")
ud_model <- udpipe_load_model(ud_model$file_model)
system.time(
  x <- udpipe_annotate(ud_model, x = df$recipe_name, doc_id = df$id)
)
x <- as.data.frame(x)
abc <- c("NN","VB")
stats <- dplyr::filter(x,grepl(pattern = paste(abc, collapse = "|"), x = xpos, ignore.case = T))

您还可以使用this列表中的单词类型列表。