Pular para o conteúdo

Unescape de caracteres especiais ISO-8859-1

Conversão de caracteres ISO-8859-1 em UTF-8.
Mayron Cachina mayroncachina
Hits: 6.995 Categoria: Python Subcategoria: Miscelânea
  • Download
  • Nova versão
  • Indicar
  • Denunciar

Descrição

Conversão de caracteres ISO-8859-1 em UTF-8.
Download IsotoUtf.py Enviar nova versão

Esconder código-fonte

#! /usr/bin/env python
# -*- coding: iso-8859-15 -*-
'''
Script para unescape de caracteres especiais ISO-8859-1
Autor: Mayron Cachina
Contato: mayroncachina@gmail.com
Site: http://cachina.wordpress.com
'''
import htmlentitydefs
import re
import cgi

#Informações
origem = raw_input("Local do arquivo do arquivo original: ")
fim = raw_input("Local do arquivo final: ")
pattern = re.compile("&(\w+?);")
def descape_entity(m, defs=htmlentitydefs.entitydefs):
   # callback: translate one entity to its ISO Latin value
   try:
      return defs[m.group(1)]
   except KeyError:
      return m.group(0) # use as is

def descape(string):
   return pattern.sub(descape_entity, string)

#Abre os arquivos para manipulação de dados
f = open(origem)
w = open(fim,'w')

#Operações
try:
   novo = descape(f.read())
   w.write(novo)
finally:
   f.close()
   w.close()
print "Finalizado!!!"

Jogo da Velha com IA (Inteligencia Artificial)

Resolução de Matriz NxM

Troca de wallpaper temporizado para LXDE

Busca!!!

Jogo da Forca - Python 3

Nenhum comentário foi encontrado.

Contribuir com comentário

Entre na sua conta para comentar.