El blog de Juan Palómez

13 mayo 2011

Detecting charsets with recode

Filed under: Uncategorized — Etiquetas: , , — thisisoneball @ 13:07

– source.txt is the file containing unreadable characters
– ‘Ñ’ is one character that we now that appears inside source.txt and is not readable
recode is a free program that translates text between different encodings

This just tries to recode source.txt using every encoding supported by recode, then checks the recoded file for the special character, if it is found, it means that the character was recoded correctly, so it prints the name of the encoding

for a in $(recode --list | cut -f1 -d\ )
    if recode $a < source.txt 2> /dev/null | grep 'Ñ' > /dev/null
       echo $a

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI


Por favor, inicia sesión con uno de estos métodos para publicar tu comentario:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )


Conectando a %s

Blog de WordPress.com.

A %d blogueros les gusta esto: