Skip to content

Tutorial do HTCondor

Tiago Almeida edited this page Feb 4, 2026 · 1 revision

Tutorial do HTCondor

1. O que é o HTCondor?

HTCondor é um sistema de gerenciamento de jobs para clusters de computação. Ele permite submeter tarefas para execução em nós remotos, gerenciar filas e recuperar resultados automaticamente.

É amplamente utilizado em ambientes acadêmicos e científicos.


2. Estrutura básica de um job

Um job é descrito por um arquivo com extensão .sub.

Exemplo: job.sub

Executable = programa.sh
Arguments  = entrada.txt
Output     = saida.out
Error      = erro.err
Log        = log.log

Queue

3. Script de execução

Criar o script que será executado no nó de computação.

Arquivo: programa.sh

#!/bin/bash
echo "Processando arquivo..."
wc -l entrada.txt > resultado.txt

Dar permissão de execução:

chmod +x programa.sh

4. Enviando arquivos para o servidor

A partir da sua máquina local:

scp programa.sh entrada.txt job.sub sarue:/home/<usuario>/condor_jobs/

Conectar no servidor:

ssh cser
cd ~/condor_jobs

5. Submetendo o job

No servidor, dentro do diretório do job:

condor_submit job.sub

Saída típica:

Submitting job(s).
1 job(s) submitted to cluster 1234.

6. Acompanhando o job

Ver jobs na fila:

condor_q

Ver detalhes:

condor_q -long

Ver histórico de jobs finalizados:

condor_history

7. Recuperando os arquivos de saída

Após o término do job, os arquivos aparecem no diretório de submissão:

  • saida.out

  • erro.err

  • resultado.txt

Para baixar para sua máquina local:

scp sarue:/home/<usuario>/condor_jobs/resultado.txt .

Ou baixar todos os arquivos de saída:

scp sarue:/home/<usuario>/condor_jobs/*.out .

8. Cancelando um job

Cancelar um job específico:

condor_rm 1234

Cancelar todos os seus jobs:

condor_rm <usuario>

9. Exemplo completo de workflow

Na máquina local:

scp -r condor_jobs sarue:/home/<usuario>/
ssh cser
cd condor_jobs
condor_submit job.sub
condor_q

Após a finalização:

scp sarue:/home/<usuario>/condor_jobs/resultado.txt .

Boas práticas

  • Organize jobs por diretório

  • Sempre verifique o arquivo erro.err em caso de falha

  • Use scripts simples e reprodutíveis

  • Nomeie os arquivos de saída de forma clara

  • Evite executar programas interativos em jobs Condor