A través de este vídeo en Youtube, Matt Cuts nos explica cómo eliminar URLs de Google, y las diferentes formas que tenemos para conseguirlo. Parece ser que no es tan fácil eliminar completamente algún contenido o URL del índice de Google, ya que incluso meses después de dejar de existir una página sigue apareciendo como resultado en el buscador.

 

Empieza el vídeo comentando algunos errores que comete la gente, como pensar que si no se enlaza a una página escondida en nuestra web, Google no la encontrará, siendo posible por cualquier otra cosa.

 

Los métodos que comenta son, por orden de eficacia:

 

  1. URL removal tool – La herramienta de eliminación de Google – que ahora permite eliminar todo el dominio, subdirectorios o una URL individual. El tema está en que Google no borra la información que ya tiene de tu página, la almacena por si en un futuro quieres reindexarla.
  2. .htaccess – Si restringimos una URL a la que solo se pueda acceder con la contraseña, Google no será capaz de entrar en ella, por lo tanto no la indexará.
  3. Robots.txt – Diciéndole al bot de Google qué páginas URLs o directorios de nuestra web no queremos que indexe. Sin embargo, como comenta Matt, si no damos acceso a una web a ningún robot, Google aún puede mostrar la información de esa página y su URL como si lo hubiera indexado si tiene una entrada en el directorio DMOZ. Es decir, bloquear una URL con el Robot.txt le dice a Google que no indexe la página, pero eso no evita que por otros medios muestre la información en el buscador.
  4. Etiqueta noindex – Le dice a Google que no muestre en absoluto la página en su buscador, pero sí navegará a través de ella y encontrará enlaces. El problema que tiene es que Yahoo y MSN no hacen mucho caso de esa etiqueta. Tiene algunas complicaciones, como que aunque una página tenga la etiqueta noindex, si alguien enlaza esa página, es posible que Google muestre la referencia a esa página, sin snipet, ya que no a indexado el contenido.

 

Es decir, que una vez que Google ha indexado una página es muy difícil, sino imposible, que la elimine completamente de su sistema. Lo que sí es fácil es decirle que deje de mostrar esa información en su buscador, y solo es posible a través de su solicitud de eliminación de URL, el resto de métodos solo son para prevenir la indexación, siendo el mejor el .htaccess.

 

De cualquier forma, muy interesante el vídeo, ya que explica algunos conceptos complicados y liosos a veces como el noindex y el nofollow. Para ver el vídeo: