删除r中FASTA文件中的换行符

时间:2015-07-28 02:52:07

标签: r line-breaks fasta

我有一个fasta文件,其中序列用换行符分解。我想删除换行符。这是我的文件示例:

>accession1
ATGGCCCATG
GGATCCTAGC
>accession2
GATATCCATG
AAACGGCTTA

我想把它转换成这个:

>accession1
ATGGCCCATGGGATCCTAGC
>accession2
GATATCCATGAAACGGCTTA

任何人都可以用R解决这个问题?谢谢!

2 个答案:

答案 0 :(得分:0)

可能有以下几点:

 genelist <- list(accession1,accession2)
lappy(genelist, paste0, collapse="")

答案 1 :(得分:0)

尝试提供read.fasta()write.fasta()功能的seqinr包。后者允许您控制输出的包装宽度。

因此,假设您的fasta数据位于文件sequences.fa

install.packages('seqinr') # do this once
library(seqinr)

seqs = read.fasta(file='sequences.fa')
write.fasta(seqs, names(seqs), nbchar=80, file.out='sequences2.fa')