Conversão de encodings

Publicado por Robson Fernando Gomes em 23/08/2011

[ Hits: 7.194 ]

Blog: http://maguscode.blogspot.com/

 


Conversão de encodings



Um problema que surge as vezes é ter um arquivo com um tipo especifico de encoding e ser necessário converter para outro tipo específico de encoding.

Caso você esteja utilizando o sistema operacional Linux você poder utilizar o comando iconv para resolver tal problema através do terminal.

Sintaxe:

iconv --from-code = encoding-origem --to-code = encoding-destino arquivo-origem > arquivo-destino

Onde:
  • encoding-origem = Encoding do arquivo de origem;
  • encoding-destino = Encoding do arquivo destino;
  • arquivo-origem = Arquivo original que tem como seu encoding o encoding-origem;
  • arquivo-destino = Arquivo a ser gerado que tem como seu encoding o encoding-destino.
Exemplo:

iconv --from-code=ISO-8859-1 --to-code=UTF-8 fileIso.txt > fileUtf.txt

Neste exemplo o arquivo origem (fileIso.txt) tem como tem como encoding ISO-8859-1 , já o arquivo destino (fileUtf.txt) terá como encoding UTF-8.

Fonte: http://maguscode.blogspot.com/


Outras dicas deste autor

Criando e usando arquivos de propriedades em Java

Instalação do soapUI no Linux

Montando dispositivos

Desligar e reiniciar o computador através da linha de comando

Concatenando String de Forma Eficiente em Java

Leitura recomendada

O comando nice

Agendando tarefas com o AT

Instalando o Helper e o Handbrake 0.9.5 no Ubuntu 10.10

Conversão de arquivos EBCDIC para ASCII

Como gerar uma imagem ISO incluindo os "diretórios-pai" originais na raiz

  

Comentários
[1] Comentário enviado por ZeroTrinta1 em 02/04/2014 - 10:59h

Essa dica é muito importante na hora de resolver velhos problemas com caracteres estranhos e engraçados!
Apenas para complementar a dica do Robson, é possível descobrir o tipo de arquivo com o comando
$file -i arquivo.txt



Contribuir com comentário




Patrocínio

Site hospedado pelo provedor RedeHost.
Linux banner

Destaques

Artigos

Dicas

Tópicos

Top 10 do mês

Scripts