我有一个fasta文件,其中序列用换行符分解。我想删除换行符。这是我的文件示例:
>accession1
ATGGCCCATG
GGATCCTAGC
>accession2
GATATCCATG
AAACGGCTTA
我想把它转换成这个:
>accession1
ATGGCCCATGGGATCCTAGC
>accession2
GATATCCATGAAACGGCTTA
任何人都可以用R解决这个问题?谢谢!
答案 0 :(得分:0)
可能有以下几点:
genelist <- list(accession1,accession2)
lappy(genelist, paste0, collapse="")
答案 1 :(得分:0)
尝试提供read.fasta()
和write.fasta()
功能的seqinr包。后者允许您控制输出的包装宽度。
因此,假设您的fasta数据位于文件sequences.fa
install.packages('seqinr') # do this once
library(seqinr)
seqs = read.fasta(file='sequences.fa')
write.fasta(seqs, names(seqs), nbchar=80, file.out='sequences2.fa')