| Par Michel.L, le 16 Mai 2009, 16:42 |
Revenir en haut de page |
|
Erreur 404
J’ai supprimé certaines pages indésirables sur un site. Il s’agit de diverses pages d’essais que j’avais oublié de supprimer et qui ont malheureusement été indexées pas Google.
Pour éviter que les internautes tombent sur une erreur 404, j’ai les renvois simplement sur la page d’accueil avec «ErrorDocument 404 http://monsite.com/» dans le .htaccess à la racine de mon site.
Google dit qu’il est important que le site renvoie une erreur 404 quand on demande des pages qui n’existent pas.
Je voudrai savoir si «ErrorDocument 404 http://monsite.com/» dans le .htaccess n’empêche pas les moteurs de recevoir le message d’erreur en question. Je me pose la question, car les pages que j’ai supprimées depuis 3 mois ne veulent pas disparaître de l’index de Google.
Merci de vos conseils. |
|
 |
| Par Cédric, le 19 Mai 2009, 19:32 |
Revenir en haut de page |
|
Bonsoir,
| Michel.L a écrit: | | Je voudrais savoir si [...] dans le .htaccess n’empêche pas les moteurs de recevoir le message d’erreur en question. |
Pour le savoir, il suffit d'analyser l'en-tête de la page, ce qui peut être fait très simplement avec cet outil pour vérifier les en-têtes (headers HTTP)
Si la page renvoie bien le code 404, le moteur comprendra bien que la page est inexistante (l'URL n'a pas à exister).
| Michel.L a écrit: | "Pour éviter que les internautes tombent sur une erreur 404"
[...]
"Google dit qu’il est important que le site renvoie une erreur 404" |
C'est un peu contradictoire, non ?
En fait il est préférable de créer une page spécifique pour les erreurs (404 ou autres), ne serait-ce que :
- pour que le visiteur comprenne bien que le contenu a existé mais n'est plus disponible
- pour proposer un plan du site au visiteur, afin qu'il trouve plus rapidement ce qu'il cherche (si bien sûr ce qu'il cherche est susceptible de se trouver quelque part dans le site)
Et c'est d'autre part plus pertinent, du point de vue des moteurs également. Vois cette page pour plus d'informations sur la façon dont tes pages sont vues par Google
Cédric |
|
 |
| Par Michel.L, le 20 Mai 2009, 10:37 |
Revenir en haut de page |
|
| Cédric a écrit: |
| Michel.L a écrit: | "Pour éviter que les internautes tombent sur une erreur 404"
[...]
"Google dit qu’il est important que le site renvoie une erreur 404" |
C'est un peu contradictoire, non ?
|
En effet !
C'est pourtant bien ce qu'ils disent (me semble t-il !)
Il est important que le site retourne une erreur 404 pour que Google vire la mauvaise URL, ça c'est bien écrit.
Il faut rediriger les erreur 404 : c'est écrit aussi.
Sinon,
Réponse très intéressante, merci beaucoup.
en utilisant l’analyseur d’en-tête, je constate que mon site retourne une erreur 302 (document déplacé de façon temporaire) et non une erreur 301 (document déplacé de façon permanente) comme ce serait préférable.
Je n’ai pas besoin de créer une page pour les erreurs 404, dans mon cas, car il s’agit seulement de faire disparaître certaines pages d’essais que j’ai laissés trop longtemps par erreur sur le site de l’index de Google.
En fait, donc :
| Code: | | ErrorDocument 404 http://lesite.com/ |
dans le .htaccess serait suffisant, s’il retournait une erreur 301 au lieu d’une erreur 302.
J’ai essayé :
| Code: | | ErrorDocument 404 http://lesite.com/ [R=301,L] |
Mais ça ne marche pas. Ça fait une boucle !
Y a-t-il un moyen générique de retourner TOUTES les erreurs d’URL vers la page d’accueil tout en retournant un code 301 ?
Merci beaucoup pour ta réponse quoi qu’il en soit. Elle m’a appris pas mal de choses |
|
 |
| Par Cédric, le 20 Mai 2009, 23:23 |
Revenir en haut de page |
|
Pour aller tout de suite à l'essentiel:
- Supprime ton .htaccess (qui doit contenir une erreur, tu ne devrais pas avoir le code 301 en retour!)
- Ajoute un fichier robot.txt (code ci-dessous) à la racine du site
- Vérifie que le code renvoyé est bien 404, pas 301, 302, 200...
- Après t'être connecté à ton compte Google, visite la page de demande de suppression (outils pour webmasters / Configuration du site / Accès du robot d'exploration / Supprimer URL / Nouvelle demande de suppression). Ce n'est pas nécessaire, mais ça accélèrera le traitement
-----------------
- Poste ici le contenu de ton .htaccess (pour voir d'où peut venir la redirection)
- Lis la suite
Code du fichier robot.txt avec tes pages ou ton répertoire à supprimer):
| Code: | User-Agent: *
Disallow: /perso/page1.html
Disallow: /perso/page2.html
Disallow: /repertoire-complet/ |
| Citation: | | C'est pourtant bien ce qu'ils disent (me semble t-il !) |
Qu'il faut renvoyer une erreur 404 (=entête HTTP not found, page non trouvée), oui... et donc pas "éviter que les internautes tombent sur une erreur 404"
| Citation: | | Il faut rediriger les erreur 404 : c'est écrit aussi. |
Je ne sais pas sur quelle page tu as lu ça, ni comment c'est écrit, mais par "rediriger", il faut comprendre "renvoyer vers une page spécifique à cette erreur (page non trouvée) avec l'entête 404"
| Citation: | | en utilisant l’analyseur d’en-tête, je constate que mon site retourne une erreur 302 (document déplacé de façon temporaire) et non une erreur 301 (document déplacé de façon permanente) comme ce serait préférable. |
Aïe aïe aïe! Ni l'un ni l'autre
Jette un oeil aux codes http qu'une page peut renvoyer.
Dans un premier temps: les codes 30x ne correspondent pas à une erreur mais à une redirection, ce qui sous-entend que le contenu existe encore. Comme tu l'auras compris: 301 pour contenu déplacé temporairement et 302 déplacé définitivement... et pas supprimé
Google précise donc bien qu'il faut renvoyer le code http 404 (erreur "NOT FOUND").
Donc, si ta page renvoie un code 301, le contenu existe encore pour google! C'est pourquoi la page n'a pas été supprimée.
| Citation: | | Je n’ai pas besoin de créer une page pour les erreurs 404, dans mon cas, car il s’agit seulement de faire disparaître certaines pages d’essais que j’ai laissés trop longtemps par erreur sur le site de l’index de Google. |
A noter: sans .htaccess, le serveur renvoie toujours une erreur 404 lorsqu'une page est inexistante. Le .htaccess te sert seulement à définir quelle page sera affichée à la place de la page 404 par défaut.
Pour faire le test, supprime temporairement ton htaccess et tente d'afficher l'une des pages supprimées. En voyant cette page par défaut, tu te rendras mieux compte de l'intérêt de personnaliser cette page 404 (qui est vraiment très... sommaire ).
Cédric |
|
 |
|
 |
| Par Michel.L, le 22 Mai 2009, 16:19 |
Revenir en haut de page |
|
J’ai trouvé ce qui posait problème :
Avec cette syntaxe :
| Code: | | ErrorDocument 404 http://lesite.com/ |
Le site retournait un code 302
Avec cette syntaxe :
| Code: | | ErrorDocument 404 / |
Le site retourne bien un code 404 tout en montrant la page d'accueil, comme je le voulais.
Tout est donc entré dans l’ordre.
Merci beaucoup pour ton aide. |
|
 |
| Par Cédric, le 23 Mai 2009, 08:26 |
Revenir en haut de page |
|
Salut,
Donc tu n'es toujours pas convaincu de créer une page spécifique (plan du site) pour les erreurs 404 ?!
Alors tu nous diras si ça n'a pas posé de problèmes pour ton référencement...
Je pense plutôt que tu devrais créer une page 404 (une page pour les vraies erreurs) et ajouter le fichier robot.txt avec les URL des pages que tu veux retirer de l'index Google (le but de ce fichier étant justement d'interdire l'accès aux moteurs à certains contenus).
Après c'est toi qui vois, si le référencement n'est pas important pour toi, le 404 suffira à supprimer les URL (tout en faisant la demande à Google pour accélérer la suppression).
Cédric |
|
 |
| Par Michel.L, le 23 Mai 2009, 08:55 |
Revenir en haut de page |
|
Bonjour!
| Cédric a écrit: | Salut,
Donc tu n'es toujours pas convaincu de créer une page spécifique (plan du site) pour les erreurs 404 ?!
Alors tu nous diras si ça n'a pas posé de problèmes pour ton référencement...
|
Ça dépend des sites. Pour l'un d'entre eux, je pense que ce n'est pas nécessaire ; celui-ci n'a qu'une vingtaine de pages. De toute façon, qu'est-ce que ça peut changer pour Google que la page 404 personnalisée s'appelle page404 ou index.php ? Le principe n'est-il pas le même?
J'avais déjà fait un robot.txt avec les URL à ne pas indexer. Mais sans doute à cause du non-retour du code 404 Google n'en tenait pas compte.
| Citation: |
Après c'est toi qui vois, si le référencement n'est pas important pour toi…
|
Je n'ai pas à me plaindre du référencement. C'est juste un problème d'URL qui ne voulaient pas se supprimer.
Merci beaucoup pour ton aide et ton intérêt.
Cordialement |
|
 |