Hoy en día existe una gran variedad de contenidos en Internet. A veces publicas algo que no deberías publicar; por ejemplo, publicas una entrada de blog con ira y luego te arrepientes o filtras accidentalmente datos confidenciales; En la mayoría de los casos, simplemente eliminar el contenido o restringir el acceso evitará que aparezca en los resultados de búsqueda. Sin embargo, si está desesperado por eliminar contenido no deseado que ya está indexado por Google, puede utilizar nuestra herramienta de eliminación de URL, que elimina contenido de nuestros resultados de búsqueda siempre que cumpla con ciertos criterios (que se analizan a continuación). Publicaremos una serie de publicaciones de blog que le enseñarán cómo eliminar con éxito varios tipos de contenido y cómo evitar errores comunes. En esta primera publicación de blog, analizaré algunos escenarios básicos: eliminar una única URL, eliminar un directorio o sitio web completo y volver a agregar contenido eliminado.
Eliminar una sola URL
En términos generales, para que una solicitud de eliminación tenga éxito, el propietario de la URL en cuestión (ya sea usted u otra persona) debe dar su consentimiento para que se elimine el contenido. Para una única URL, hay tres formas de indicar el consentimiento:
Bloquee páginas mediante el archivo robots.txt para evitar que se busquen en ellas
Bloquear páginas mediante la metaetiqueta noindex impide que se indexen
Indica que la página actual no existe al devolver un código de estado 404 o 410
Antes de enviar una solicitud de eliminación, primero puede verificar si la URL ha sido bloqueada:
robots.txt: utilice la función Buscar como robot de Google o Probar robots.txt en Herramientas para webmasters de Google para comprobar si se ha denegado el acceso a la URL.
Metaetiqueta noindex: puede utilizar Explorar como robot de Google para asegurarse de que la metaetiqueta aparezca entre las etiquetas. Si desea ver una página que no se puede verificar con las Herramientas para webmasters de Google, puede abrir la URL en su navegador, hacer clic en Ver > Recursos web y asegurarse de que la metaetiqueta esté entre las etiquetas.
Códigos de estado 404/410: puede utilizar Explorar como robot de Google o una herramienta como Live HTTP Headers o web-sniffer.net para confirmar que la URL realmente devuelve el código correcto. A veces, una página "eliminada" puede mostrar "404" o "No se puede encontrar la página", pero devolver un código de estado 200 en el encabezado. Por lo tanto, es una buena idea volver a verificar utilizando una herramienta de verificación de encabezado adecuada.
Si ha eliminado contenido no deseado de una página web pero no ha bloqueado la página utilizando los métodos anteriores, aún no podrá eliminar completamente la URL de nuestros resultados de búsqueda. Esto es común si el contenido se publica en un sitio web que no es de su propiedad, y hablaremos sobre cómo lidiar con esto en la segunda parte de nuestra serie sobre cómo eliminar URL.
Si una URL cumple alguna de las condiciones anteriores, puede visitar http://www.google.com/webmasters/tools/removals , ingresar la URL que desea eliminar y seleccionar la opción "El webmaster ha bloqueado esta página" para eliminarla. está eliminado. Nota: Debe ingresar la URL que contiene el contenido, no la URL en la que Google busca el contenido. Por ejemplo, debes ingresar
http://www.example.com/cosas-embarrassing.html
en vez de
http://www.google.com/search ? q=cosas+vergonzosas
Este artículo también detalla cómo asegurarse de ingresar la URL correcta. Recuerde, no podremos eliminar su contenido no deseado si no nos indica la URL exacta que le molesta.
Eliminar un directorio o sitio web completo
Para eliminar correctamente un directorio o sitio web completo, se debe denegar el acceso al directorio o sitio web en el archivo robots.txt del sitio web. Por ejemplo, para eliminar el directorio http://www.example.com/secret/ , el archivo robots.txt debe contener:
Agente de usuario: *
No permitir: /secreto/
El directorio raíz devuelve un código de estado 404, pero esto no es suficiente porque incluso si el directorio devuelve un código de estado 404, aún es posible mostrar archivos debajo. El uso de robots.txt para bloquear un directorio (o un sitio web completo) puede garantizar que todas las URL del directorio (o sitio web) estén bloqueadas. Puede utilizar las funciones Buscar como robot de Google o Probar robots.txt en Herramientas para webmasters de Google para comprobar si el directorio está completamente bloqueado.
Solo los propietarios de sitios verificados pueden solicitar la eliminación de un sitio o directorio completo en Webmaster Tools. Para solicitar la eliminación de un directorio o sitio web, primero ingrese el sitio web correspondiente y luego haga clic en Configuración del sitio web > Acceso del rastreador > Eliminar URL. Si se encuentra en la raíz del sitio y desea eliminar la URL, deberá confirmar que desea eliminar todo el sitio. Si está ingresando a un subdirectorio, debe seleccionar la opción "Eliminar directorio" en el menú desplegable.
Agregar contenido nuevamente
Puede cancelar una solicitud para eliminar su sitio en cualquier momento, incluidas las solicitudes enviadas por otros. Para hacer esto, debe ser propietario de un sitio verificado en Webmaster Tools. Una vez que esté verificado, puede ir a Configuración del sitio > Acceso del rastreador > Eliminar URL (o > Enviar por otros) y hacer clic en el botón "Cancelar" junto a la solicitud que desea cancelar.
¿Aún tienes preguntas? Manténgase atento a las actualizaciones mientras continuamos nuestra serie de publicaciones de blog sobre cómo eliminar contenido de los resultados de búsqueda de Google.