Detectar cuando Google visita tu web

Email this to someoneShare on FacebookShare on Google+Share on LinkedInTweet about this on Twitter

A pesar de que existen otras formas de detectar cuando Google visita nuestra web, la siguiente puede servirnos especialmente cuando lanzamos una web que aún no tiene mucho contenido y por lo tanto, no esperamos que los rastreadores de Google, también llamados spider, nos visiten muy a menudo.

La idea es pegar el siguiente script en tu web y que cada vez que Googlebot se pasa por ella, nos llegue un email a la dirección que nosotros especifiquemos para avisarnos de que el spider de Google ha visitado nuestra página.

<?php if ( strpos( $_SERVER[‘HTTP_USER_AGENT’], ‘Googlebot’ ) !== false )
{
// Escribe tu correo electronico
$email_address = ‘tu@email.com’;
// Enviar un email cada vez que Google pase por tu web
mail($email_address,’Spider de Google’,’El spider
de Google ha visitado tu pagina: ‘.$_SERVER[‘REQUEST_URI’]);
}
?>

También podemos utilizarlo en nuestro blog para saber la frecuencia de rastreo del sitio, aunque un buen consejo es configurar filtros en el programa de correo electrónico, ya que la cantidad de correos que puede llegarnos al cabo de los días a la bandeja de recibidos puede llegar a ser estresante.

Nota: Este truco también es aplicable a otros user-agent, por ejemplo podríamos conocer con que frecuencia de rastreo el spider de Adsense, visitan nuestra página:

Lista de los user-agent

Googlebot:  Spider de Google

Googlebot/2.1 (+http://www.googlebot.com/bot.html)
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)

Yahoo! Slurp: Buscador de Yahoo!

Mozilla/5.0 (compatible; Yahoo! Slurp; http://help.yahoo.com/help/us/ysearch/slurp)
Mozilla/5.0 (compatible; Yahoo! Slurp China; http://misc.yahoo.com.cn/help.html)

msnbot: robot de Microsoft Live.

msnbot/1.0 (+http://search.msn.com/msnbot.htm)
msnbot-media/1.0 (+http://search.msn.com/msnbot.htm)

noxtrumbot: Buscador de TPI (paginas amarillas).

noxtrumbot/1.0 (crawler@noxtrum.com)

ia_archiver: Robot de Alexa e Internet Archive.

Snapbot: Robot se encarga de realizar capturas de pantalla para utilizar en el servicio de snapshots.

Snapbot/1.0 (Snap Shots, +http://www.snap.com)

W3C: Robot del validador HTML y CSS.

W3C_Validator/1.555
Jigsaw/2.2.5 W3C_CSS_Validator_JFouffa/2.0

Sé la primera persona en comentar

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

De conformidad con lo establecido en la LOPD, Adpv Advertising Provider S.L. garantiza la adopción de las medidas necesarias para asegurar el tratamiento confidencial de los datos de carácter personal. Así mismo le informamos de la inclusión de sus datos en un fichero con la finalidad de mantener su relación negocial o contractual con Adpv Advertising Provider S.L. y de la posibilidad de ejercer los derechos de acceso, rectificación, cancelación y oposición en la siguiente dirección: Ercilla, 26, 1Dcha., 48011, Bilbao, Bizkaia. Privacidad.