Hay un método mucho más potente.
Consiste en crear un array que contenga las cadenas que delatan a los navegadores de Internet (la cifra es de varias docenas, pero es factible). No es necesario usarlas literalmente, sino que podemos guiarnos por las palabras que identifiquen de forma sencilla a un navegador en particular.
Luego, cuando un usuario (o un robot) solicite una página, se coteja la información de su user agent (véase $_SERVER) con el array, de tal modo que intentamos descubrir si el visitante es un navegador de Internet conocido (IE, firefox, opera, konqueror, etc). En caso negativo, lo calificamos como sospechoso y registramos su visita en algún lugar (por ejemplo, un fichero especializado en visitantes raros), dejando constancia de cuantos datos podamos sacarle (típicamente la IP y sus datos identificativos, por ser lo más interesantes), la página solicitada y la fecha/hora.
La única pega es que hay robots que emplean en sus User Agent cadenas propias de navegadores conocidos. Y eso cuando no se hacen pasar por un usuario cualquiera, sin nada que los delate. Pero no es una mala heurística. |