Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 11/01/2008
[ Hits: 6.883 ]
Homepage: http://mayroncachina.net
Conversão de caracteres ISO-8859-1 em UTF-8.
#! /usr/bin/env python
# -*- coding: iso-8859-15 -*-
'''
Script para unescape de caracteres especiais ISO-8859-1
Autor: Mayron Cachina
Contato: mayroncachina@gmail.com
Site: http://cachina.wordpress.com
'''
import htmlentitydefs
import re
import cgi
#Informações
origem = raw_input("Local do arquivo do arquivo original: ")
fim = raw_input("Local do arquivo final: ")
pattern = re.compile("&(\w+?);")
def descape_entity(m, defs=htmlentitydefs.entitydefs):
# callback: translate one entity to its ISO Latin value
try:
return defs[m.group(1)]
except KeyError:
return m.group(0) # use as is
def descape(string):
return pattern.sub(descape_entity, string)
#Abre os arquivos para manipulação de dados
f = open(origem)
w = open(fim,'w')
#Operações
try:
novo = descape(f.read())
w.write(novo)
finally:
f.close()
w.close()
print "Finalizado!!!"
Organizador de Arquivos em Python + tkinter
Probabilidade de Vencer - Poker Texas Hold
Nenhum comentário foi encontrado.
Cirurgia para acelerar o openSUSE em HD externo via USB
Void Server como Domain Control
Modo Simples de Baixar e Usar o bash-completion
Monitorando o Preço do Bitcoin ou sua Cripto Favorita em Tempo Real com um Widget Flutuante
Script de montagem de chroot automatica
Atualizar Linux Mint 22.2 para 22.3 beta
Jogar games da Battle.net no Linux com Faugus Launcher
Como fazer a Instalação de aplicativos para acesso remoto ao Linux
Assisti Avatar 3: Fogo e Cinzas (4)
Conky, alerta de temperatura alta (11)









