Ler uma sequências fasta e separar por tamanho [Bioinformática]
Publicado por José Cleydson Ferreira da Silva (última atualização em 03/06/2017)
[ Hits: 3.583 ]
Homepage: geminivirus.org
O presente script lê um arquivo no formato fasta e separa por tamanhos < 9000; < 18000; >18000 em três arquivos diferentes.
Como utilizar?
1) Após download é preciso alterar a permissão do arquivo:
chmod +x get_by_length.pl
2) O script pode ser executado assim:
./get_by_length.pl arquivo.fasta
ou
perl get_by_length.pl arquivo.fasta
O resultado será direcionado para três arquivos diferentes:
arquivo.fasta_9000.fasta
arquivo.fasta_9000_18000.fasta
arquivo.fasta_18000_20504.fasta
#!/usr/bin/perl
open in,"<$ARGV[0]";
$i=0;
while($line = <in>){
chomp $line;
if($line =~ m/>/){
$key = $line;
}else{
$fasta{$key} .= $line;
}
}
$i=0;
while( ($key,$seq) = each %fasta){
if( $i < 9000){
open out,">>1000/$key_9000.fasta";
print out $key,"\n";
print out $seq,"\n";
close out;
}elsif($i < 18000){
open out,">>1000/$key_9000_18000.fasta";
print out $key,"\n";
print out $seq,"\n";
close out;
}else{
open out,">>1000/$key_18000_20504.fasta";
print out $key,"\n";
print out $seq,"\n";
close out;
}
}
close in;
Calculadora de notas versão Perl
Verificação de IP em blacklists
Nenhum comentário foi encontrado.
LazyDocker – Interface de Usuário em Tempo Real para o Docker
Instalando COSMIC no Linux Mint
Turbinando o Linux Mint: o poder das Nemo Actions
Inteligência Artificial no desenvolvimento de software: quando começar a usar?
[Resolvido] Algo deu errado ao abrir seu perfil
Usando o VNSTAT para medir o seu consumo de internet
Habilitando clipboard manager no ambiente COSMIC
Problema com som no laptop (5)
Quando vocês pararam de testar distros? (11)
Não estou conseguindo fazer funcionar meu Postfix na versão 2.4 no Deb... (2)









