当地爆炸的长度选项

时间:2017-05-26 14:43:23

标签: awk blast

我有一个相对较大的blastn输出文件。由于没有选项来指定查询序列的最小核苷酸长度,我的想法是在使用awk进行爆破后搜索它。

该文件的一个例子是:

> abc
Length=4553119

 Score = 273 bits (302),  Expect = 3e-74
 Identities = 151/151 (100%), Gaps = 0/151 (0%)
 Strand=Plus/Plus

Query  1        CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC  60
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  4297151  CCCACATCGAACTCGACGGTGACCATTCCCATGTTGCGCCGGGACGCCGAGTAGACGTGC  4297210

Query  61       TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC  120
                ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Sbjct  4297211  TTGACCCCCGGAATTTCGCTCATGATGCGCTCGAGCGGCTGCATCGCCAGGTTCGACACC  4297270

Query  121      TGCTGCGCGGAGGCCCCCGGGTACTGCACCA  151
                |||||||||||||||||||||||||||||||
Sbjct  4297271  TGCTGCGCGGAGGCCCCCGGGTACTGCACCA  4297301


 Score = 28.3 bits (30),  Expect = 1.7
 Identities = 15/15 (100%), Gaps = 0/15 (0%)
 Strand=Plus/Minus

Query  97     GGCTGCATCGCCAGG  111
              |||||||||||||||
Sbjct  63261  GGCTGCATCGCCAGG  63247

使用awk,我正在搜索包含Identities = [>=50]

的所有行
awk 'Identities =  >= 50'

我不关心该行的其余部分(来自/151 (100%))。

但是我遇到了语法错误,所以我如何把"大于等于#34;在那里?

1 个答案:

答案 0 :(得分:0)

$ awk '/Identities =/ && ($3+0)>=50' file
 Identities = 151/151 (100%), Gaps = 0/151 (0%)
相关问题