¿Cómo eliminar contenido no deseado de Google? - Guillermo Wolf

¿Cómo eliminar contenido no deseado de Google?

by Guillermo Wolf
Google es un robot de búsqueda, las páginas son indexadas automáticamente por un software robot que se llama “Googlebot” que chequea todo el contenido disponible en el web. Google hace un “crawl” de tú página e indexa o agrega el contenido de acuerdo a su algoritmo de búsqueda el cual incluye más de 200 factores que hacen que tú página aparezca de primero o en “x” lugar dentro de las páginas de resultado de búsqueda. El asunto es que quizás te hayas preguntado que tal si quiero que una página determinada no aparezca en Google o si no quiero que mi sitio web aparezca. Si este es tu caso entonces tiene que decirle al “Googlebot” que no indexe o agregue tu página en las páginas de resultado de Google.

 

¿Y si elimino la página?

Si elimina la página del servidor, obviamente la página seguirá apareciendo en la página de resultado de Google por un buen tiempo, obviamente la dirección ya no estará disponible pero el URL y descripción si por un buen tiempo hasta que el “Googlebot” se de cuenta y la saque naturalmente del resultado. Si tiene una urgencia de eliminar ese contenido inmediatamente ya que es comprometedor o no le interesa, entonces usa la herramienta de solicitud de eliminación de URL en Google Webmaster Tools

 

Ahora si lo que quiero es que “Googlebot” no indexe una página ya sea por motivos de SEO (Search Engine Optimization) o porque contiene contenido duplicado o porque contiene contenido que no se quiere que aparezca en Google, entonces hay que usar otros métodos, los cuales explico brevemente a continuación:

  • Bloquear la página usando un archivo robots.txt. Los archivos robots.txt restringen el acceso de los robots de motores de búsqueda que rastrean la Web a un sitio. Este es un archivo de texto que contiene instrucciones que le dicen a los motores de búsquedas que hacer cuando llegan a tú página, usualmente se deben grabar en el servidor web en la raiz o root. (Ejemplo: tudominio.com/robots.txt).

     

    • Para que todo el website no sea indexado en Google solo basta con agregar esta instrucción en el robots.txt
      Disallow: /
    • Para bloquear solo una página dentro de un web site:
      Disallow: /directorio/archivo.html
  • Bloquear la página usando una metaetiqueta “noindex”. En el código HTML de la página basta con colocar “NOINDEX”, “NOFOLLOW” como se muestra a continuación y “Googlebot” entenderá que no debe agregar esta página en sus páginas de resultados.
<head>
<META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
</head>
 
  • Indicar que la página ya no existe devolviendo un código de estado 404 ó 410. Si eliminastes la página del servidor entonces cuando alguien la solicite o bien porque la tiene grabada en su marca libros o porque la vió en una página de resultado de Google, el navegador de Internet le devolverá un error 404 o 410 automáticamente. El usuario sólo dirá “ah la página no existe”, “esta gente ya no vende ese producto o servicio”. Si la página contenía contenido no deseado, ok no pasa nada ya no está disponible. Ahora bien desde el punto de vista de SEO es recomendable que cada vez que alguien solicite una página que no exista, en vez mostrarse un error 404 o 410 se muestre una página amigable diciendo que esa página ya no esta disponible e invitando a la gente a ir a otro lugar dentro del mismo website, de esta manera estamos manteniendo nuestra posición en la página de resultado de Google al menos por un tiempo. Otra cosa es usar un redireccionamiento 301, el cual no es más que decirle a los search engines que dicha página ya no existe más y que cada vez que alguien solicite esa página esta vaya a una nueva dirección. En otra ocasión escribiré como funciona esto de los redireccionamientos 301.
En conclusión si el contenido no deseado es removido del servidor, la URL o dirección web seguirá apareciendo en las páginas de resultado de Google por un tiempo al menos que se use uno de los métodos arriba especificados, si no nos importa esto, si no nos interesa cuidar nuestra reputación online o si los rankings en las páginas de resultado no son nuestro problema, entonces “deje así”.

You may also like

This website uses cookies to improve your experience. We'll assume you're ok with this, but you can opt-out if you wish. Accept Read More

Privacy & Cookies Policy