QConv – conversão de codeset

Quantas vezes você já teve dificuldades em ler algum texto ou mensagem digital, seja em computadores ou celulares, pois encontrou o texto todo bagunçado?

Batatinha quando nasce espalha ramas pelo chão,
mamãezinha quando dorme bota a mão no coração.


Este post apresenta um pequeno script (aprox. 60 linhas) como um front-end de um utilitário do GNU/Linux (iconv) para corrigir esse problema.

Um pouco de cultura…

Por razões históricas, os textos nos computadores são gravados utilizando uma codificação dependente da língua em que foram escritos. Com a popularização da internet ocorreu um aumento no acesso e troca de textos entre nações, o simples ato de entrar em um site representava a necessidade de conversão entre idiomas. Dessa maneira, conversões tornaram-se essenciais. Devido a quantidade de codificações existentes começou a existir uma incompatibilidade nessa troca de textos. A solução foi unir esses caracteres em uma codificação que tornou-se um padrão chamado Unicode.

Contudo, muitos computadores ainda trabalham com codificações locais, com capacidade limitada para suportar caracteres de outros idomas. Softwares como browsers e mailsers devem se capazes de converter entre os padrões. Para facilitar a vida, o projeto GNU desenvolveu a biblioteca libiconv para fazer a conversão entre as diferetentes codificações (codesets).

QConv – Introdução

Basta colocar o nome do arquivo que se deseja converter, escolher a codifiação de entrada e o formato de saída. Lembrando que é apenas um script para facilitar a utilização do programa iconv. Portando, os formatos suportados são os suportados pelo iconv. Você irá perceber que existem vários codesets, mas muitos são apelidos. Os mais comuns são o ISO8859-1 e o UTF-8.

Tela do QConv

Eu utilizo quando faço downloads de arquivos no formato txt, doc, odt e html e não consigo lê-los de forma clara.

Para fazer o download do programa clique aqui.

QConv – Utilização

Descompacte o arquivo em uma pasta qualquer

# cd ~ 
# tar zxvf qconv-0.1.tar.gz

 

Serão descompactados 3 arquivos:

qconv/qconv.py – arquivo principal
qconv/ui_viewform.py – referência aos widgets do script
qconv/viewForm.ui – arquivo criado no Qt Designer

Para utilizar o programa digite no diretório em que descompactou os arquivos:

# cd qconv/
# python qconv.py

 

Lembrando que é preciso ter o PyQt4 instalado. Caso não tenha faça o download.

 

QConv – Conclusão

Fiz esse programa para conhecer melhor a linguagem Python e o suporte ao Qt desenvolvida pela RiverBank. Maiores informações aqui.

Algumas coisas podiam ser melhoradas, uma delas é a detecção automática do codeset, mas isso fica para outro post

Como precisei aprender várias particularidades da linguagem Python eu pretendo, futuramente, mostrar alguma coisa, enquanto isso aproveite parar dar uma lida no código-fone. Não exite em comentar bugs, melhorias a serem feitas no código-fonte, críticas, etc;

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s

%d blogueiros gostam disto: