lundi 4 mai 2009

[referencement] Contrôler un petit peu l'indexation des moteurs de recherche

Empêcher les moteurs de recherche d'accéder à vos pages



Parce que le site n'est pas prêt, parce qu'il s'agit d'un site sans aucun intérêt pour le public mais que vous ne souhaitez pas mettre sous mot de passe pour autant, vous pouvez avoir plein de raisons de ne pas souhaiter que certaines pages d'un site soient indexées. Voici ce qu'il faut ajouter dans le <head> ... <head> de vos pages :
- Pour tous les moteurs : <meta name="robots" content="noindex, nofollow" />
- Uniquement pour Google : <meta name="googlebot" content="noindex, nofollow" />

Supprimer les pages en cache dans les moteurs de recherche



Votre site a changé, le contenu est obsolète, bref vous souhaitez que le moteur de recherche mette à jour son cache et supprime vos pages depuis son cache :
- Pour tous les moteurs : <meta name="robots" content="noarchive" />
- Uniquement pour Google : <meta name="googlebot" content="noarchive" />

Supprimer une image de "Google image"



Créez un fichier robots.txt, placez-le à la racine de votre site web, et écriver dedans :
- Pour supprimer une image :
User-Agent: Googlebot-Image
Disallow: /images/votreimage.jpg

- Pour supprimer toutes les images :
User-Agent: Googlebot-Image
Disallow: /


A noter : Google fait le tour de votre site web tous les 4 mois environ, les modifications seront donc prises en compte au bout de 4 mois maximum.

0 commentaires: