我有一个csv文件。此csv文件中的字段包含引号。在这些引号中可能会有逗号,但情况并非总是如此。如果我使用以下方法提取列:
awk -F, '{ print $3 }' testfile.csv
这行不通。因此,我的想法是将带引号的字段中的更改为_并“转义”该问题。
这是我文件的内容:
chromosome,position,marker,sample1,sample2
chr1,100,NA,A,C
chr1,200,"test1,test2",A,C
chr1,300,NA,A,C
chr1,400,"test6",A,C
chr1,500,NA,A,C
chr1,600,"test3,test4,test5",A,C
我想要的内容是:
chromosome,position,marker,sample1,sample2
chr1,100,NA,A,C
chr1,200,"test1_test2",A,C
chr1,300,NA,A,C
chr1,400,"test6",A,C
chr1,500,NA,A,C
chr1,600,"test3_test4_test5",A,C
有什么建议吗?