07/05/2008 - Las páginas web pueden usar una variedad muy extensa de diferentes
codificaciones de caracteres. La mayoría de estas codificaciones solo
representan a unos pocos idiomas.
Unicode es un estandar con el que se identifica cada carácter de cada alfabeto con un número.
Desde el pasado mes de diciembre parece que Unicode se ha convertido en
el codificador de paginas web mas usado superando
entre otros a ASCII
Google lleva tiempo usando Unicode como el formato interno con el que
buscar cualquier texto. Ahora además el buscador de Google soporta búsquedas en
cualquier idioma gracias a Unicode.
La última versión
Unicode 5.1 que apenas lleva un mes desde que salio a
la luz ya es soportada por Google, esto es debido a que obviamente Google tiene interés en codificar los documentos de textos que se publican en
la web con un estandar de codificación único.