Bioinformática - PhyML: alinhamento de sequências nucleotídicas em ambiente paralelo

O PhyML é um software utilizado para se fazer estimativa e probabilidade filogênica em alinhamento de sequências nucleotídicas ou sequências de anino ácido. Atualmente está na versão 3.0, seu desenvolvimento teve participação de diversos cientistas de algumas universidades no mundo.

[ Hits: 30.548 ]

Por: José Cleydson Ferreira da Silva em 27/07/2010


Usando PhyML em linha de comando



Pode-se usar as os parâmetros em linha de comando para iniciar o PhyML, os mesmos conceitos de usabilidade podem ser aplicado em comandos, bastando colocar os parâmetros que caracterizem a necessidade de sua análise. O software pode ser iniciado da seguinte forma:

# ./phyml -i arquivo.phy

O manual pode ser encontrado com o comando ./phyml -h, uma série de parâmetros serão descritos abaixo.

-i ( --input) arquivo de sequência
sequência de nucleotídio ou aminoácido em formato PHYLIP (arquivo.phy)

-d (--datatype) nt
O tipo de dado pode ser nt para nucleotídio e aa para aminoácido

-q (--sequential)
Formato alteração intercalada para sequencial

-n (--multiple) 4
É o número inteiro indicando o numero de conjunto de dados para análise

-b (--bootstrap)

int > 0 : Numero de replicações bootstrap
int = 0 : Aproximação Verosimilhança sem computar valores de bootstrap
int = -1 : Taxa de aproximação de Verosimilhança retornando aLTR
int = -2 - Taxa de aproximação de Verosimilhança retornando métrica Chi2-based, suporte a brunch
int = -3 - Mínimo de métrica Chi2-based e suporte SH-like
int = -4 - Suporte Chi2-based sozinho

-m (--model) HKY85 (default)
Nome do modelo de substituição

Modelo baseado em nucleotídio: HKY85 (default) | JC69 | K80 | F81 | F84 | TN93 | GTR | custom

Modelo baseado em aminoácido: LG (default) WAG | JTT | MtREV | Dayhoff | DCMut | RtREV | CpREV | VT Blosum62 | MtMam | MtArt | HIVw | HIVb | custom

-f e, d, ou "fA fC fG Ft"
Nucleotídio de sequência de aminoácido

-e Sequências Nucleotídicas:
Sequências de Aminoácidos: São estimadas usando Máxima Verosimilhança

Sequência de Aminoácidos:
Aproximação por contagem de diferentes aminoácidos nos dados

-d Sequências Nucleotídicas:
Aproximação por contagem de diferentes aminoácidos nos alinhamento

Sequência de Aminoácidos:
Aproximação usando frequências definidas por modelo de substituição

- "fA fC fG fT"
Válido apenas para modelos de nucleotídios. fA, fC, fG e fT corresponde a A, C, G e T

-t (--ts/tv)
Taxa de transição e transversão. Apenas para sequências de DNA, pode-se fixar um valor positivo (4.0) ou o tipo e obter estimativa de Máxima Verosimilhança.

-v (--pinv)
Proporção de inviabilidade, pode ser definido o valor [0,1]

-c (--nclasses) nb subst cat =1
nb subst cat:
Valor inteiro positivo. Numero de substituição às Categorias.

-a (--alpha) gamma
gamma
Pode ser um valor positivo para o parâmetro gamma. Ou o valor de Máxima Verossimilhança

-s (--search) move
Opção de pesquisa na topologia da árvore. Podem ser:
NNI - Padrão
SPR - mais lento que NNI
BEST - A melhor opção de pesquisa que NNI e SPR

-u (--inputtree) nome da arquivo
O Arquivo precisa ser em formato newick

-o params
params: Parâmetro de otimização

params=tlr
t - Topologia da árvore
l - Comprimento Brunch
r - Parâmetros de substituição de taxas
n - Parâmetro não é otimizado


--rand start
Define o início da árvore aleatória, porém é valido apenas se a pesquisa SPR for realizada.

--n rand starts num
num é o número aleatórios de arvores que serão utilizados, validos para pesquisa SPR

--r seed num
Número de semente usada pelo gerador de números aleatórios

--print site lnl
Imprime em arquivos * phyml lk.txt o valores de Verosimilhança

--print trace
Imprime no arquivo * phyml trace.txt cada exploração filogênica durante o processamento de pesquisa em árvores.

Página anterior     Próxima página

Páginas do artigo
   1. Sumário - Sobre o PhyML
   2. Usando PhyML em linha de comando
   3. Instalando PHYML em ambiente paralelizado
   4. Sobre autor
Outros artigos deste autor

Conheça tudo sobre os hardwares que compõem o seu computador com um simples comando

Bioinformática - Clustalw-MPI: Análise Filogenética utilizando computação paralela e distribuída

Compiz - Janelas à 360 graus no Linux

Cadê o cubo?

Implementando servidor de aplicações PHP utilizando Zend Framework

Leitura recomendada

eDonkey para Linux

Mendeley - Gerenciador de bibliografias e artigos

Criando um web álbum

Instalação da Suíte BrOffice 2.4.x em sistemas Mandriva Linux

Resolvendo dependências no Slackware com slackpkg

  
Comentários
[1] Comentário enviado por dailson em 28/07/2010 - 10:54h

Grande Kuruma!!

Parabéns pelo artigo. Apesar de eu não estar familiarizado com coisas como:
probabilidade filogênica
alinhamento de sequências nucleotídicas
sequências de anino ácido

Eu acho que isso irá e muito ajudar a comunidade do software livre.
E mais do que nunca

VIDA LONGA AO SL!!

Dailson Fernandes
http://www.dailson.com.br

[2] Comentário enviado por cleysinhonv em 28/07/2010 - 16:01h

Olá Dailson,

Grande Guerreiro, obrigado pelo incentivo meu camarada. Vou começar uma serie longa desses artigos, estou pensando em enviar um trabalho para o VOL DAY, em Bebedouro-SP, mas estou pensando se poderá ser aceito ou não. Esses artigos com certeza deram muito trabalho para validar a prática. Mas com certeza resolverá a vida dos Biologos e dos Bioinformatas.

Um abraço!


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts