El blog de Juan Palómez

13 mayo 2011

Detecting charsets with recode

Filed under: Uncategorized — Etiquetas: , , — thisisoneball @ 13:07

– source.txt is the file containing unreadable characters
– ‘Ñ’ is one character that we now that appears inside source.txt and is not readable
recode is a free program that translates text between different encodings

This just tries to recode source.txt using every encoding supported by recode, then checks the recoded file for the special character, if it is found, it means that the character was recoded correctly, so it prints the name of the encoding

for a in $(recode --list | cut -f1 -d\ )
do
    if recode $a < source.txt 2> /dev/null | grep 'Ñ' > /dev/null
    then
       echo $a
    fi
done

Dejar un comentario »

Aún no hay comentarios.

RSS feed for comments on this post. TrackBack URI

Responder

Por favor, inicia sesión con uno de estos métodos para publicar tu comentario:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s

Crea un blog o un sitio web gratuitos con WordPress.com.

A %d blogueros les gusta esto: