Question

我有序列DNA，我想在人们选择的位置找到序列的核苷酸。以下是示例：

输入序列DNA： ACTAAAAATACAAAAATTAGCCAGGCGTGGTGGCAC（序列长度为33）输入位置：（12）

我希望结果是核苷酸为AAA的第12位。

我找到该位置的氨基酸没有问题。以下是我目前的代码。

print "ENTER THE FILENAME OF THE DNA SEQUENCE:= ";
$DNAfilename = <STDIN>;
chomp $DNAfilename;
unless ( open(DNAFILE, $DNAfilename) ) {
  print "Cannot open file \"$DNAfilename\"\n\n";
}
@DNA = <DNAFILE>;
close DNAFILE;
$DNA = join( '', @DNA);
print " \nThe original DNA file is:\n$DNA \n";
$DNA =~ s/\s//g;

print" enter the number ";
$po=<STDIN>;

@pos=$DNA;
if ($po>length($DNA)) 
{
  print" no data";
}

else 
{
  print " @pos\n\n";
}

请告知我如何在DNA序列中找到位置。

Answer 1

my $nucleotide = substr $DNA, $po, 3;

这将从位置$po到$po+2取3个核苷酸并将其分配给$nucleotide。

Answer 2

这将是这样的：

use strict;
use warnings;

print 'ENTER THE FILENAME OF THE DNA SEQUENCE:= ';
my $DNA_filename = <STDIN>;
chomp $DNA_filename;
unless (open(DNAFILE, $DNA_filename))
{
    die 'Cannot open file "' . $DNA_filename . '"' . "\n\n";
}

my @DNA = <DNAFILE>;
close DNAFILE;

my $DNA_string = join('', @DNA);
print "\n" . 'The original DNA file is:' . "\n" . $DNA_string . "\n";
$DNA_string =~ s/\s//g;

print ' enter the number ';
my $pos = <STDIN>;

if ($pos > length($DNA_string)) 
{
    print ' no data';
}
else
{
    print ' ' . substr($DNA_string, $pos, 3) . "\n\n";
}

一些意见：

始终use strict和use warnings - 它可以帮助您编写更好且无错误的代码。
我个人不喜欢在双引号字符串中使用插值，因此这些连接。
结果的位置从0开始 - 如果您愿意，您可以更改最后一个条件，否则。

编辑：我误读了关于核苷酸的部分问题，正如@hexcoder所写，你想要substr($DNA_string, $pos, 3)。

用perl在DNA序列中找到核苷酸

2 个答案: