Convertendo arquivo PDF em HTML e DOC / ODT

Publicado por andre uebe em 11/07/2007

[ Hits: 58.669 ]

 


Convertendo arquivo PDF em HTML e DOC / ODT



Quem já não se viu na necessidade de converter um arquivo PDF em DOC?

Apesar desta não ser uma solução completa, ajuda bastante e é bem simples:

1) Instale o programa pdf2html

Para que usa Debian digite no shell:

$ sudo apt-get install pdf2html

2) Converta o PDF em HTML

Digite no shell:

$ pdftohtml <nome_do_arquivo.pdf>

3) Converta o HTML em DOC / ODT

Abra o arquivo HTML no BrOficce e salve-o como texto.

É isso!

Abs
Andre Uebe

Outras dicas deste autor

Corrigindo 'bug' em placa de Vídeo NVIDIA: segundo monitor não aparece disponível no Ubuntu 11.10

Editando PDF no BrOffice / LibreOffice / OpenOffice

Utilizando o recurso inteligente de formatação de recuo de texto no LibreOffice

Ativando as funcionalidades do gerenciador de janelas Compiz no Linux Mint com ambiente gráfico Mate

PixelView PlayTV MPEG2 no Ubuntu Linux 8.04 - configurando corretamente

Leitura recomendada

Instalar programas da Adobe pelo Yum no Acer Aspire One

aria2 - downloads mistos ou de torrents

Baixando arquivos por extensões com o wget

Recuperando o lilo usando o Kurumin

Ubuntu leve? Que tal o U-lite

  

Comentários
[1] Comentário enviado por bjverde em 10/06/2008 - 01:13h

Outras possibilidades são utilizar os conversores on-line. http://www.zamzar.com/ e http://media-convert.com/converter/

[2] Comentário enviado por andreuebe em 12/04/2009 - 17:55h

Valeu pela dica!

Agora o pdftihtml e pdftotext estão dentro do pacote:

popple-utils

digite:

sudo apt-get install popple-utils

Para instalar o pdftohtml e o pdftotext

[3] Comentário enviado por apgomes88 em 01/12/2010 - 17:21h

O nome do pacote é poppler-utils.

Muito útil a dica!

[4] Comentário enviado por ucastrobr em 02/05/2012 - 16:20h

No Ubuntu

O pacote openoffice.org-pdfimport permite que o Openoffice edite arquivos PDF.
Basta instalar pelo Synaptic.

Ou comando
sudo apt-get install openoffice.org-pdfimport

[5] Comentário enviado por gpr.ppg.br em 06/11/2013 - 17:46h

pdftotext = perfeito.

$ cd /home/usuario/Downloads
$ pdftotext seu-arquivo.pdf
= seu-arquivo.txt

abra com o LibreOffice e pronto.



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts