Pular para o conteúdo

Unescape de caracteres especiais ISO-8859-1

Script para conversões de caracteres especiais ISO-8859-1 para UTF-8
Mayron Cachina mayroncachina
Hits: 6.058 Categoria: Python Subcategoria: Miscelânea
  • Download
  • Nova versão
  • Indicar
  • Denunciar

Descrição

Script para conversões de caracteres especiais ISO-8859-1 para UTF-8
Download IsotoUtf.py Enviar nova versão

Esconder código-fonte

#! /usr/bin/env python
# -*- coding: iso-8859-15 -*-
'''
Script para unescape de caracteres especiais ISO-8859-1
Autor: Mayron Cachina
Contato: mayroncachina@gmail.com
Site: http://cachina.wordpress.com
'''
import htmlentitydefs
import re
import cgi

#Informações
origem = raw_input("Local do arquivo do arquivo original: ")
fim = raw_input("Local do arquivo final: ")
pattern = re.compile("&(\w+?);")
def descape_entity(m, defs=htmlentitydefs.entitydefs):
   # callback: translate one entity to its ISO Latin value
   try:
      return defs[m.group(1)]
   except KeyError:
      return m.group(0) # use as is

def descape(string):
   return pattern.sub(descape_entity, string)

#Abre os arquivos para manipulação de dados
f = open(origem)
w = open(fim,'w')

#Operações
try:
   novo = descape(f.read())
   w.write(novo)
finally:
   f.close()
   w.close()
print "Finalizado!!!"

Par ou ímpar no Python

Script para screen shot

Procura músicas em diretório local

QFacil 0.2... Qemu Facil

Teclado Virtual

Nenhum comentário foi encontrado.

Contribuir com comentário

Entre na sua conta para comentar.