python正则表达式重复的字符

时间:2012-11-16 01:30:25

标签: python regex

我希望在python中创建一个正则表达式,匹配所有以T开头,后跟18个字符(任意字符)的DNA序列,然后以AA,{{ {1}},TTCC。我可以管理第一部分,但我似乎无法找到一种方法来编写结束(双字符)而不复制正则表达式4次。 这是我对以GG结尾的序列所拥有的:

TT

1 个答案:

答案 0 :(得分:5)

查看a good tutorial

有一个名为交替的概念。它匹配给定选项中的任何一个:

r'T.{18}(?:TT|AA|CC|GG)'

请注意,您应该使用原始字符串在Python中对正则表达式进行编码,否则以后会出现转义字符的问题。