Ferramentas incríveis! Converta diversos tipos de arquivos com o xPDF e ffmpeg

Apresento ferramentas que fazem a conversão de arquivos de mídia e texto, tudo de forma simples, por linha de comando. Isso é possível através das diversas ferramentas do xpdf, xpdf-tools e ffmpeg. Desta forma é possível converter texto em pdf, pdf em html, flv em mpeg, entre outras coisas. Existem muita ferramentas simples e poderosas do GNU/Linux que passam desapercebidas.

[ Hits: 56.049 ]

Por: Marcus-RJ em 03/01/2007


Execução: pdffonts, pdftohtml, pdfinfo, pdfopt



PDFFONTS

Exibe informações detalhadas sobre fontes de arquivo pdf.

Sintaxe:

pdffonts [opções] arquivo.pdf

Opções:
  • -f n = primeira pagina a ser pesquisada
  • -l n = ultima pagina a ser pesquisada
  • -opw senha = senha de grupo (para arquivos seguros)
  • -upw senha = senha para usuário (para arquivos seguros)
  • -v = exibe versão do arquivo

Mais informações, "pdffonts -help".

PDFTOHTML

Na minha opinião uns dos mais interessantes, converte arquivos pdf em html.

Sintaxe:

pdftohtml [opções] arquivo.pdf

Após o comando serão gerados três arquivos: um arquivo.html, arquivo_ind.html e arquivos.html.

O arquivos.html exibe um documento html grande, numerado pelas paginas html equivalentes, o arquivo_ind.html funciona como um index.html do arquivos.html, chamando a página desejada deste arquivo. Já o arquivo.html funciona como uma junção dos dois, abre-se uma tela com as páginas a direita e o índice a esquerda, bem parecido com o layout de um pdf, porem em html. È possível visualizar e modificar código fonte da pagina, bastando liberar a permissão via chmod.

As opções são bem parecidas com a de outras comandos. Caso queira ignorar imagens, basta usar a opção -i. Mais informações, "pdftohtml -help".

PDFINFO

Exibe informações detalhadas sobre arquivo pdf. Como autor, número de paginas, data e hora de criação, versão e etc...

Sintaxe:

pdfinfo [opções] arquivo.pdf

Mais informações, "pdfinfo -help".

PDFOPT

Otimizador de arquivo pdf, geralmente aumenta um pouco o tamanho do arquivo.

Sintaxe:

pdfopt [opções] arquivo.pdf arquivo1.pdf

Infelizmente não consigo decifrar todas as opções desse programas, mas muitas delas se parecem com as do programas anteriores. Mais informações: man pdfopt. Para conferir se o documento esta otimizado é só digitar pdfinfo arquivo1.pdf e observar a linha Optimized.

Página anterior     Próxima página

Páginas do artigo
   1. Introdução
   2. Descrição
   3. Instalação
   4. Execução. Pdftotex, pdftoppm, pdftops
   5. Execução: pdftotext, pdfcrop, pdfcsplain
   6. Execução: pdffonts, pdftohtml, pdfinfo, pdfopt
   7. Execução: ffmpeg
   8. Considerações finais
Outros artigos deste autor

XEN - Instalação e configuração no Debian Etch

VirtualBox 2.1.0: Rede no VirtualBox agora é fácil!

Leitura recomendada

KnowledgeTree - Um Gerenciador Eletrônico de Documentos funcional

Backup remoto usando SSH

Rode o Blackbox no Windows XP

Servidor de monitoramento Nagios

Falta de padronização no Linux

  
Comentários
[1] Comentário enviado por andreuebe em 04/01/2007 - 12:44h

Marcus

Obrigado por compartilhar conosco estas pérolas. Principalmente em relação ao ffmpeg.

Você saberia de algum programa que converta 3gp (formato de video do celular nokia) para avi?

Abs

Andre

[2] Comentário enviado por marcus-rj em 13/01/2007 - 22:05h

Obrigado pelo comentário!! Poxa cara, infelizmente nao vou poder te ajudar. Caso consiga algo, eu posto aqui.

[3] Comentário enviado por darkstarfire em 22/01/2007 - 00:07h

olá andré uebe...
o ffmpeg faz isso bem facinho

[4] Comentário enviado por viniciuspgomes em 26/03/2007 - 15:37h

Boa tarde Marcus,
Estou com o seguinte problema: Tenho vários arquivos em minha máquina (.doc, .xls. htm, .tct, etc).
Preciso criar um script onde transformo estes arquivos em pdfsem perda alguma. Já fiz vários testes, mas até agora não vi nenhuma ferramenta eficaz para isso.
Será que você pode me ajudar?
Qualquer coisa meu e-mail é viniciuspgomes@gmail.com
Fico no aguardo.
Obrigado.

[5] Comentário enviado por lane.sou em 08/04/2007 - 00:12h

Olá,
c sabe dizer se eu posso pegar o código html que o pdftohtml gera e se, na conversão, ele mantém a formatação do pdf? Tipo, se uma palavra ta em negrito no pdf, então no código fonte html tem as tags correspondentes?

Vc saberia ainda onde eu posso pegar o código (source code) desses programas? =X

por favor, se souber meu e-mail é lane.sou@gmail.com

Agradecida ^^

[6] Comentário enviado por lane.sou em 08/04/2007 - 00:37h

Eu outra vez,

baixei o pdftohtml mas quando eu rodo o programa dá uns erros do tipo:

bad font

creio que falta instalar alguma coisa - ou instalar o programa direito, sei lá.

Vc saberia me dizer como faço para instalar o pdftohtml no Ubuntu?

[7] Comentário enviado por marcus-rj em 08/04/2007 - 07:30h

Se o documento vai manter exatamente a fonte? vai depender de um pouco de sorte, mas geralmente ele mantém sim!

O link para obter o fonte do programa, eh no http://sourceforge.net. Segue o link direto do pdftohtml, inclusive para versao windows!
http://sourceforge.net/project/showfiles.php?group_id=45839

Espero ter ajudado!

[8] Comentário enviado por juliaojunior em 01/10/2007 - 16:23h

muito bom mesmo.


Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts