Portada | Monotemáticos | Secciones | Desarrolladores | Comunidad | Servicios | Servicios profesionales | RSS
Desde 0 | HTML | CSS | ASP | PHP | AJAX | Javascript | Diseño web | Promoción web | Ganar dinero
Directorio | Manuales | Scripts | FAQs | Programas | Artículos Copyleft | Actualidad | La Cosecha | Colabora
Registrarse | Vuestras páginas | Foros del web | Lista de correo | Boletín de novedades
Generador METAs | Compras | Busca cursos
Alojamiento | Dominios.es | Micropagos SMS | Buscadores | Patentes, marcas | Creación web | Multimedia | Videos
Desarrollo Freelance | Buscar proyectos | Buscar profesionales | Solicitar desarrollo
ARTICULO: Rastrear a los robots de buscadores

 Se muestran 2 comentarios sin revisar

Tino  31/5/05 
Que buen articulo.... probare!!

Antonio  17/4/07 
Hay un método mucho más potente.
Consiste en crear un array que contenga las cadenas que delatan a los navegadores de Internet (la cifra es de varias docenas, pero es factible). No es necesario usarlas literalmente, sino que podemos guiarnos por las palabras que identifiquen de forma sencilla a un navegador en particular.
Luego, cuando un usuario (o un robot) solicite una página, se coteja la información de su user agent (véase $_SERVER) con el array, de tal modo que intentamos descubrir si el visitante es un navegador de Internet conocido (IE, firefox, opera, konqueror, etc). En caso negativo, lo calificamos como sospechoso y registramos su visita en algún lugar (por ejemplo, un fichero especializado en visitantes raros), dejando constancia de cuantos datos podamos sacarle (típicamente la IP y sus datos identificativos, por ser lo más interesantes), la página solicitada y la fecha/hora.
La única pega es que hay robots que emplean en sus User Agent cadenas propias de navegadores conocidos. Y eso cuando no se hacen pasar por un usuario cualquiera, sin nada que los delate. Pero no es una mala heurística.

Ver el articulo / faq completo Ver el articulo y todos sus comentarios
Añadir un comentario al artículo Añadir un comentario del artículo
  Ir arriba

Comentarios no revisados de:

+ Rastrear a los robots de buscadores


DesarrolloWeb.com | Copyright | Anunciese | Acerca de | Datos legales | Contacta | Por GuiarteMultimedia