Olá,
gostaria de saber se há algum programa que converta de pdf para html (não em uma imagem que seja chamada no código html).
E que tenha as seguintes restrições:
*mantenha a formatação original do pdf; por exemplo, se no pdf uma palavra esta em negrito, então no código html tenha as tags correspondentes;
*seja de código aberto e que eu possa modificá-lo;
Já usei o pdftohtml mas ele gera uma imagem igual ao pdf que é colocada na página html. E eu preciso que com as tags para poder fazer a extração de dados do pdf a partir da formatação original.
Se vcs souberem de algum programa que faça essa conversão ou para outro formato (mas que tenha a marcação para ajudar na extração dos dados), por favor me avisem =)
Aguardo resposta,
t+
WhatsApp com Chamadas no Linux via Waydroid
XFCE - quase um Gnome ou Plasma mas muito mais leve
LXQT - funcional para máquinas pererecas e usuários menos exigentes
Manutenção básica para Gentoo Linux (com script)
Conheça o Zashterminal, um terminal moderno com IA
DOOM Carniceiro: rode o Meatgrinder com uzdoom (Gentoo e Ubuntu)
Samba 4 AD-DC 2026: Como instalar e configurar um Active Directory (via APT-GET)
[Resolvido] Sumiço de redes e micro quedas no iwd/iwgtk (Realtek rtw88)
eu queria saber no lenovo slim, se tem como ver os mhz de memoria e tu... (1)









