De nos jours, il existe une grande variété de contenus sur Internet. Parfois, vous publiez quelque chose que vous ne devriez pas publier : par exemple, vous publiez un article de blog avec colère et le regrettez plus tard ou vous divulguez accidentellement des données confidentielles ; Dans la plupart des cas, le simple fait de supprimer le contenu ou de restreindre l’accès l’empêchera d’apparaître dans les résultats de recherche. Toutefois, si vous souhaitez désespérément supprimer du contenu indésirable déjà indexé par Google, vous pouvez utiliser notre outil de suppression d'URL, qui supprime le contenu de nos résultats de recherche à condition qu'il réponde à certains critères (discutés ci-dessous). Nous publierons une série d'articles de blog vous expliquant comment supprimer avec succès différents types de contenu et comment éviter les erreurs courantes. Dans ce premier article de blog, j'aborderai quelques scénarios de base : supprimer une seule URL, supprimer l'intégralité d'un répertoire ou d'un site Web et rajouter du contenu supprimé.
Supprimer une seule URL
De manière générale, pour qu'une demande de suppression aboutisse, le propriétaire de l'URL en question - que ce soit vous ou quelqu'un d'autre - doit donner son consentement pour que le contenu soit supprimé. Pour une seule URL, il existe trois manières d’indiquer le consentement :
Bloquer les pages via le fichier robots.txt pour empêcher leur recherche
Le blocage des pages via la balise méta noindex empêche leur indexation
Indique que la page actuelle n'existe pas en renvoyant un code d'état 404 ou 410
Avant de soumettre une demande de suppression, vous pouvez d'abord vérifier si l'URL a été bloquée :
robots.txt : utilisez la fonction Récupérer comme Googlebot ou Tester robots.txt dans les outils pour les webmasters pour vérifier si l'accès à l'URL a été refusé.
Balise méta noindex : vous pouvez utiliser Fetch comme Googlebot pour vous assurer que la balise méta apparaît entre les balises. Si vous souhaitez afficher une page qui ne peut pas être vérifiée à l'aide des outils pour les webmasters, vous pouvez ouvrir l'URL dans votre navigateur, cliquer sur Afficher > Ressources Web et vous assurer que la balise méta se trouve entre les balises.
Codes d'état 404/410 : vous pouvez utiliser Fetch comme Googlebot, ou un outil comme Live HTTP Headers ou web-sniffer.net pour confirmer que l'URL renvoie bien le code correct. Parfois, une page « supprimée » peut afficher « 404 » ou « La page est introuvable » mais renvoyer un code d'état 200 dans l'en-tête. C'est donc une bonne idée de revérifier à l'aide d'un outil de vérification d'en-tête approprié.
Si vous avez supprimé le contenu indésirable d'une page Web mais que vous n'avez pas bloqué la page à l'aide des méthodes ci-dessus, vous ne pouvez toujours pas supprimer complètement l'URL de nos résultats de recherche. Ceci est courant si le contenu est publié sur un site Web qui ne vous appartient pas, et nous expliquerons comment résoudre ce problème dans la deuxième partie de notre série sur la suppression d'URL.
Si une URL répond à l'une des conditions ci-dessus, vous pouvez visiter http://www.google.com/webmasters/tools/removals , saisir l'URL que vous souhaitez supprimer et sélectionner l'option "Le webmaster a bloqué cette page" pour la supprimer. il. il est supprimé. Remarque : Vous devez saisir l'URL qui contient le contenu, et non l'URL recherchée par Google pour le contenu. Par exemple, vous devez saisir
http://www.example.com/embarrassing-stuff.html
plutôt que
http://www.google.com/search ? q=embarrassant+trucs
Cet article explique également comment vous assurer que vous saisissez l'URL correcte. N'oubliez pas que nous ne pourrons pas supprimer votre contenu indésirable si vous ne nous indiquez pas l'URL exacte qui vous dérange.
Supprimer un répertoire ou un site Web entier
Pour réussir à supprimer l'intégralité d'un répertoire ou d'un site Web, l'accès au répertoire ou au site Web doit être refusé dans le fichier robots.txt du site Web. Par exemple, pour supprimer le répertoire http://www.example.com/secret/ , le fichier robots.txt doit contenir :
Agent utilisateur : *
Interdire : /secret/
Le répertoire racine renvoie un code d'état 404, mais cela ne suffit pas car même si le répertoire renvoie un code d'état 404, il est toujours possible d'afficher des fichiers en dessous. L'utilisation de robots.txt pour bloquer un répertoire (ou un site Web entier) peut garantir que toutes les URL du répertoire (ou du site Web) sont bloquées. Vous pouvez utiliser les fonctions Récupérer comme Googlebot ou Test robots.txt dans les Outils pour les webmasters pour tester si le répertoire est complètement bloqué.
Seuls les propriétaires de sites vérifiés peuvent demander la suppression de l'intégralité d'un site ou d'un répertoire dans les outils pour les webmasters. Pour demander la suppression d'un répertoire ou d'un site Web, entrez d'abord le site Web concerné, puis cliquez sur Configuration du site Web > Accès au robot > Supprimer l'URL. Si vous êtes à la racine du site et souhaitez supprimer l'URL, vous devrez confirmer que vous souhaitez supprimer l'intégralité du site. Si vous entrez dans un sous-répertoire, vous devez sélectionner l'option "Supprimer le répertoire" dans le menu déroulant.
Ajouter à nouveau du contenu
Vous pouvez annuler une demande de suppression de votre site à tout moment, y compris les demandes soumises par d'autres. Pour ce faire, vous devez être un propriétaire de site vérifié dans les outils pour les webmasters. Une fois que vous êtes vérifié, vous pouvez accéder à Configuration du site > Accès au robot > Supprimer l'URL (ou > Soumettre par d'autres) et cliquer sur le bouton « Annuler » à côté de la demande que vous souhaitez annuler.
Vous avez encore des questions ? Restez à l'écoute des mises à jour alors que nous poursuivons notre série d'articles de blog sur la façon de supprimer du contenu des résultats de recherche Google.