Computação Distribuída com TORQUE Resource Manager - Parte 2
A intenção deste artigo, é fornecer uma visão geral para submissão e controle de trabalhos na estrutura do PBS/TORQUE.
[ Hits: 15.534 ]
Por: Juno Kim em 21/10/2013 | Blog: http://www.kim.eti.br
Diretiva Interpretador Shell Interpretador PBS # Comentário Comentário #PBS Comentário Diretiva #PBS Comentário ComentárioA tabela a seguir, apresenta um resumo de algumas diretivas comumente usadas no PBS TORQUE. Para mais informações, por favor, consulte o manual TORQUE.
------------------------------------------------------------------------------ Diretiva Exemplo Descrição N #PBS N testjob Nome do JOB usado no PBS TORQUE M #PBS M user@domain Envia um e-mail de notificação m #PBS m e Envia um e-mail quando termina o JOB e #PBS e Cria um arquivo de erro o #PBS o ~/out Redireciona a saída para $HOME/out q #PBS q all.q Especifica a fila exemplo: all.q d #PBS d /home/testuser Determina o diretório de trabalho l #PBS l walltime=00:30:00 resource request, i.e. 30 minutes run time l #PBS l nodes=2:ppn=2 request two CPUs on two nodes each --------------------------------------------------------------------------------
Queue Memory CPU Time Walltime Node Run Que Lm State
------------ ------ -------- -------- ---- --- --- -- -----
default -- -- -- -- 0 0 -- E R
special -- -- -- -- 0 0 -- E R
--- ---
0 0
Em seguida, envie o seu trabalho, por exemplo, diretamente para a fila "special". Após o envio bem-sucedido, PBS TORQUE responde à identificação do trabalho com o JOB ID.
95.masterPara exibir o status do(s) trabalho(s) executado(s), use o comando qstat. Note, enquanto qstat mostra todas as tarefas atualmente submetidas ao cluster.
Job id Name User Time Use S Queue ----------------- ------------- ----------- ---- --- - ----- 95.master testjob.sh testuser 0 R special# qstat -u testuser
testuser:
Req'd Elap
Job ID Username Queue Jobname SessID NDS TSK Memory Time S Time
------------ -------- -------- ----------- ------ ----- --- ------ ----- - -----
93.master testuse batch test2.sh 16452 1 -- -- 01:00 C 01:41
95.master testuse special testjob.sh 17564 1 -- -- 01:00 C 00:01
jobname.e#{JOBID}
jobname.o#{JOBID}
Os arquivos de saída, em resumo, contém a saída de suas aplicações, mas quando existe algum erro, é importante analisar o mesmo.
Computação Distribuída com TORQUE Resource Manager
Configurando o proftpd com autenticação de usuário pelo passwd
Atualizar Debian Online de uma Versão para outra
Colocando ícones no menu do Fluxbox
KnowledgeTree - Um Gerenciador Eletrônico de Documentos funcional
Abrindo os logs automaticamte em consoles e monitorando-os pelo browser
Relato do 7° FGSL - Fórum Goiano de Software Livre
Nenhum comentário foi encontrado.
Modo Simples de Baixar e Usar o bash-completion
Monitorando o Preço do Bitcoin ou sua Cripto Favorita em Tempo Real com um Widget Flutuante
Como implementar Raid (0, 1, 5, 6, 10 e 50)
fusermount3 no Ubuntu 25.10 - mantenha o perfil do AppArmor
[Resolvido] dlopen(): error loading libfuse.so.2 AppImages require FUSE to run.
Criação de diretórios e aplicação de restrições de acesso no Linux
diferença entre o Tor baixado pelo Gerenciador de Aplicativos e o Tor ... (9)
Monte o Google Drive como uma pasta remota no Linux [RESOLVIDO] (3)
Compartilhar ZEBRA ZD220 na rede (1)
Debian Stable travado em atualizações: dist-upgrade não resolve [RESOL... (12)









