Unescape de caracteres especiais ISO-8859-1
Publicado por Mayron Cachina 11/01/2008
[ Hits: 6.856 ]
Homepage: http://mayroncachina.net
Conversão de caracteres ISO-8859-1 em UTF-8.
#! /usr/bin/env python
# -*- coding: iso-8859-15 -*-
'''
Script para unescape de caracteres especiais ISO-8859-1
Autor: Mayron Cachina
Contato: mayroncachina@gmail.com
Site: http://cachina.wordpress.com
'''
import htmlentitydefs
import re
import cgi
#Informações
origem = raw_input("Local do arquivo do arquivo original: ")
fim = raw_input("Local do arquivo final: ")
pattern = re.compile("&(\w+?);")
def descape_entity(m, defs=htmlentitydefs.entitydefs):
# callback: translate one entity to its ISO Latin value
try:
return defs[m.group(1)]
except KeyError:
return m.group(0) # use as is
def descape(string):
return pattern.sub(descape_entity, string)
#Abre os arquivos para manipulação de dados
f = open(origem)
w = open(fim,'w')
#Operações
try:
novo = descape(f.read())
w.write(novo)
finally:
f.close()
w.close()
print "Finalizado!!!"
Cálculo de pontuação em Tranca
Mighty Are's Tool of Easily Promote Combats
Correios - Rastreador de encomendas
Nenhum comentário foi encontrado.
Modo Simples de Baixar e Usar o bash-completion
Monitorando o Preço do Bitcoin ou sua Cripto Favorita em Tempo Real com um Widget Flutuante
Adicionar botão "mostrar área de trabalho" no Zorin OS
Como montar um servidor de backup no linux
Trazendo de volta o Serviços em Segundo Plano no Plasma6









