从嵌套列表中创建对象或矢量对象的可读列表

时间:2014-03-03 15:43:05

标签: r list nested praat

我创建了许多函数,我想在列表的子列表中应用(即嵌套列表)。

例如

# Getintervalduration
list.dur <- function(x){
  # x is a (non nested...) list
  dur <- x$xmax-x$xmin
  return(dur)
}

所以我可以开始应用这个功能:

(1)我的列表中的简单数据框

list.dur(intrad_02.textgrid$phones)

(2)我列表中的所有数据框

 lapply(intrad_02.textgrid, list.dur)

(3)我的主列表中的所有嵌套列表和列表中的数据框

durations <- lapply(txtgridnames,list.dur)

第三个例子是我想成功自动完成的事情。

目前,txtgridnames或多或少与names(list)相对应但我必须半自动修改它,因为:

R允许:

durations <- lapply(c(firstnestedlist, second.nested.list, etc.),list.dur)

但不幸的是不允许这样:

 durations <- lapply(names(list.with.nested.lists.inside),list.dur)

names(list)可以改变或想要在不同的研究案例中复制时,这是一个问题。

目前,我的解决方案(思考这里)是写一个名称没有“引用”和coma作为eol的表,读取我刚刚用名称创建的文件,然后手动创建一个对象所有的名字。

write.table(x=names(corpus),file="txtgridnames.txt", quote=FALSE, row.names=FALSE, append=FALSE, eol=",",col.names=FALSE)

txtgridnames <- readLines("txtgridnames.txt")

txtgridnames 

!手动复制输出!并手动粘贴,以便:

txtgridnames<-c(cnf_01_be,cnf_02_ch[...]) 

如何自动让R了解列表(名称(主列表)),即如何自动创建此对象“txtgridnames”?


以下是我正在处理的数据结构示例:(在主列表中构成我的语料库的24个子列表中约有502个数据帧)

以前的帖子还描述了我正在处理的数据类型(要知道xmin和xmax对应点击here

#-------------------------------------------
## Data structure example 
$ cnf_01_be  :List of 17
  ..$ phones        :'data.frame':  2505 obs. of  3 variables:
  .. ..$ xmin : num [1:2505] 0 0.427 0.472 0.512 0.562 ...
  .. ..$ xmax : num [1:2505] 0.427 0.472 0.512 0.562 0.632 ...
  .. ..$ value: chr [1:2505] "_" "v" "w" "a" ...
  ..$ syll          :'data.frame':  1146 obs. of  3 variables:
  .. ..$ xmin : num [1:1146] 0 0.427 0.562 0.752 0.952 ...
  .. ..$ xmax : num [1:1146] 0.427 0.562 0.752 0.952 1.022 ...
  .. ..$ value: chr [1:1146] "_" "vwa" "la" "do~k" ...
  ..$ delivery      :'data.frame':  1146 obs. of  3 variables:
  .. ..$ xmin : num [1:1146] 0 0.427 0.562 0.752 0.952 ...
  .. ..$ xmax : num [1:1146] 0.427 0.562 0.752 0.952 1.022 ...
  .. ..$ value: chr [1:1146] "_" "" "" "" ...
  ..$ link          :'data.frame':  806 obs. of  3 variables:
  .. ..$ xmin : num [1:806] 0 0.427 0.752 0.952 1.082 ...
  .. ..$ xmax : num [1:806] 0.427 0.752 0.952 1.082 1.256 ...
  .. ..$ value: chr [1:806] "_" "" "" "l" ...
  ..$ words         :'data.frame':  806 obs. of  3 variables:
  .. ..$ xmin : num [1:806] 0 0.427 0.752 0.952 1.082 ...
  .. ..$ xmax : num [1:806] 0.427 0.752 0.952 1.082 1.256 ...
  .. ..$ value: chr [1:806] "_" "voilà" "donc" "vous" ...
  ..$ POS           :'data.frame':  806 obs. of  3 variables:
  .. ..$ xmin : num [1:806] 0 0.427 0.752 0.952 1.082 ...
  .. ..$ xmax : num [1:806] 0.427 0.752 0.952 1.082 1.256 ...
  .. ..$ value: chr [1:806] "_" "VER:pres:entatif" "CON:coo" "PRO:sjt" ...
  ..$ discourse     :'data.frame':  750 obs. of  3 variables:
  .. ..$ xmin : num [1:750] 0 0.427 0.752 0.952 1.082 ...
  .. ..$ xmax : num [1:750] 0.427 0.752 0.952 1.082 1.256 ...
  .. ..$ value: chr [1:750] "SIL:l" "MD" "CON" "" ...
  ..$ disfluency    :'data.frame':  806 obs. of  3 variables:
  .. ..$ xmin : num [1:806] 0 0.427 0.752 0.952 1.082 ...
  .. ..$ xmax : num [1:806] 0.427 0.752 0.952 1.082 1.256 ...
  .. ..$ value: chr [1:806] "SIL:l" "" "" "" ...
  ..$ boundary-dismo:'data.frame':  750 obs. of  3 variables:
  .. ..$ xmin : num [1:750] 0 0.427 0.752 0.952 1.082 ...
  .. ..$ xmax : num [1:750] 0.427 0.752 0.952 1.082 1.256 ...
  .. ..$ value: chr [1:750] "MAJ" "MAJ" "MINg" "" ...
  ..$ speaker       :'data.frame':  1 obs. of  3 variables:
  .. ..$ xmin : num 0
  .. ..$ xmax : num 244
  .. ..$ value: chr "1"
  ..$ ortho         :'data.frame':  101 obs. of  3 variables:
  .. ..$ xmin : num [1:101] 0 0.427 3.571 4.3 7.659 ...
  .. ..$ xmax : num [1:101] 0.427 3.571 4.3 7.659 8.341 ...
  .. ..$ value: chr [1:101] "_" "voilà donc vous avez bien perçu même intuitivement qu'y avait euh" "_" "des choses issues de radios commerciales ou de radios classiques etcaetera" ...
  ..$ rection       :'data.frame':  117 obs. of  3 variables:
  .. ..$ xmin : num [1:117] 0 0.427 0.752 0.952 7.659 ...
  .. ..$ xmax : num [1:117] 0.427 0.752 0.952 7.659 8.341 ...
  .. ..$ value: chr [1:117] "" "md" "md" "urv" ...
  ..$ sequences     :'data.frame':  183 obs. of  3 variables:
  .. ..$ xmin : num [1:183] 0 0.427 0.752 0.952 1.942 ...
  .. ..$ xmax : num [1:183] 0.427 0.752 0.952 1.942 2.848 ...
  .. ..$ value: chr [1:183] "" "md" "md" "SV" ...
  ..$ boundary      :'data.frame':  0 obs. of  3 variables:
  .. ..$ xmin : num(0) 
  .. ..$ xmax : num(0) 
  .. ..$ value: chr(0) 
  ..$ contours      :'data.frame':  1143 obs. of  3 variables:
  .. ..$ xmin : num [1:1143] 0 0.427 0.562 0.752 0.952 ...
  .. ..$ xmax : num [1:1143] 0.427 0.562 0.752 0.952 1.022 ...
  .. ..$ value: chr [1:1143] "" "" "C" "" ...
  ..$ bdu-auto      :'data.frame':  53 obs. of  3 variables:
  .. ..$ xmin : num [1:53] 0 0.427 7.659 8.341 18.861 ...
  .. ..$ xmax : num [1:53] 0.427 7.659 8.341 18.861 19.624 ...
  .. ..$ value: chr [1:53] "" "bdu-1-c_C" "" "bdu-2-s_C" ...
  ..$ EPG           :'data.frame':  54 obs. of  3 variables:
  .. ..$ xmin : num [1:54] 0 0.427 0.952 8.341 8.806 ...
  .. ..$ xmax : num [1:54] 0.427 0.952 8.341 8.806 19.624 ...
  .. ..$ value: chr [1:54] "" "PGC-R" "" "PGC-R" ...
 $ cnf_02_ch  :List of 17
  ..$ phones        :'data.frame':  2304 obs. of  3 variables:
  .. ..$ xmin : num [1:2304] 0 0.001 0.219 0.866 0.886 ...
  .. ..$ xmax : num [1:2304] 0.001 0.219 0.866 0.886 0.944 ...
  .. ..$ value: chr [1:2304] "_" "n" "y" "m" ...
  ..$ syll          :'data.frame':  1080 obs. of  3 variables:
  .. ..$ xmin : num [1:1080] 0 0.001 0.866 1 1.089 ...
  .. ..$ xmax : num [1:1080] 0.001 0.866 1 1.089 1.239 ...
  .. ..$ value: chr [1:1080] "_" "na~" "m9~t" "" ...
  ..$ delivery      :'data.frame':  1080 obs. of  3 variables:
  .. ..$ xmin : num [1:1080] 0 0.001 0.866 1 1.089 ...
  .. ..$ xmax : num [1:1080] 0.001 0.866 1 1.089 1.239 ...
  .. ..$ value: chr [1:1080] "_" "" "" "" ...
  ..$ words         :'data.frame':  784 obs. of  3 variables:
  .. ..$ xmin : num [1:784] 0 0.219 0.866 1.089 1.239 ...
  .. ..$ xmax : num [1:784] 0.219 0.866 1.089 1.239 1.691 ...
  .. ..$ value: chr [1:784] "_" "humains" "maintenant" "la" ...
  ..$ link          :'data.frame':  784 obs. of  3 variables:
  .. ..$ xmin : num [1:784] 0 0.219 0.866 1.089 1.239 ...
  .. ..$ xmax : num [1:784] 0.219 0.866 1.089 1.239 1.691 ...
  .. ..$ value: chr [1:784] "_" "" "" "" ...
  ..$ POS           :'data.frame':  784 obs. of  3 variables:
  .. ..$ xmin : num [1:784] 0 0.219 0.866 1.089 1.239 ...
  .. ..$ xmax : num [1:784] 0.219 0.866 1.089 1.239 1.691 ...
  .. ..$ value: chr [1:784] "_" "ADJ:adj" "ADV:adv" "DET:def" ...
  ..$ disfluency    :'data.frame':  785 obs. of  3 variables:
  .. ..$ xmin : num [1:785] 0 0.219 0.866 1.089 1.239 ...
  .. ..$ xmax : num [1:785] 0.219 0.866 1.089 1.239 1.691 ...
  .. ..$ value: chr [1:785] "SIL:l" "" "" "CORR-B" ...
  ..$ discourse     :'data.frame':  728 obs. of  3 variables:
  .. ..$ xmin : num [1:728] 0 0.219 0.866 1.089 1.239 ...
  .. ..$ xmax : num [1:728] 0.219 0.866 1.089 1.239 1.691 ...
  .. ..$ value: chr [1:728] "SIL:l" "" "" "" ...
  ..$ boundary-dismo:'data.frame':  728 obs. of  3 variables:
[...]

提前致谢!

2 个答案:

答案 0 :(得分:1)

假设你的列表结构有些规律,你可以使用melt然后使用任何标准的“split / apply / combine”样式工具(我们在这里使用data.table) 。另外,我修改了我正在申请的函数是xmin-xmax的总和,这样输出就很好而简短:

library(data.table)  
library(reshape2)     # for `melt`
dt.mlt <- data.table(melt(my.list, id.vars=c("xmin", "xmax", "value")))
dt.mlt[, list(sum.duratin=sum(xmax - xmin)), by=list(L1, L2)]

产生:

          L1        L2 sum.duratin
 1: cnf_01ch    phones -1.36252011
 2: cnf_01ch     words  0.21568715
 3: cnf_01ch       POS -0.40070784
 4: cnf_01ch discourse -1.02992545
 5: cnf_01ch      link  1.50889336
 6: cnf_01be    phones -0.34931685
 7: cnf_01be     words -0.27385093
 8: cnf_01be       POS  0.70835139
 9: cnf_01be discourse  0.84285652
10: cnf_01be      link -2.76651670
11: cnf_01fr    phones  0.02533455
12: cnf_01fr     words  3.25470332
13: cnf_01fr       POS  0.97342401
14: cnf_01fr discourse -1.00580501
15: cnf_01fr      link -0.15233178

所以我将一个函数(或者在这种情况下只是sum(xmax - xmin))应用到我的嵌套列表my.list中的每个数据帧,并将结果输出为前两列指示的数据框统计数据来自哪个数据框。这是我使用的数据(两个深层嵌套列表):

col.names <- c("phones", "words", "POS", "discourse", "link")
my.list <- 
  setNames(
    replicate(
      3, 
      setNames(
        replicate(5, data.frame(xmin=runif(10), xmax=runif(10), value=runif(10)), s=F), 
        col.names
      ),
      s=F
    ),
    paste0(c("cnf_01"), c("ch", "be", "fr"))
  )

请注意,我从 Joran to this question 的最新答案中偷了这个。

答案 1 :(得分:0)

结论:如果您有嵌套List,请进行嵌套lapply! _

lapply(yourdata, function(x) lapply(x, list.dur))