07/11/2008 - Google anuncia a través de su
blog oficial que empezará a indexar y ofrecer entre sus resultados documentos escaneados.
A diferencia de los documentos de texto estándar, los archivos escaneados no contienen datos de texto que Google pueda indexar, sin embargo gracias a un procedimiento llamado OCR o Reconocimiento Óptico de Caracteres (Optical character recognition) el buscador puede ahora convertir una imagen de un documento que contenga mil palabras en mil palabras en texto plano que puedan ser indexadas y posteriormente buscadas.
Gracias a OCR, ahora Google puede "leer" una imagen de un documento e interpretar lo que en él se dice. Este paso dado supone una mejora sustancial en la accesibilidad y en la cantidad de información que podremos encontrar en adelante a través de sus motores de búsqueda.
Desde el blog oficial de Google podemos ver varios ejemplos de documentos ya escaneados gracias a la tecnología OCR: