Lanfeust.ch - forum
20 Mai 2012, 01:25 *
Bienvenue, Invité. Veuillez vous connecter ou vous inscrire.
Avez-vous perdu votre courriel d'activation?

Connexion avec identifiant, mot de passe et durée de la session
Nouvelles: Bienvenue !
 
 Retour au site  Accueil   Aide Rechercher Membres Identifiez-vous Inscrivez-vous  
Pages: [1]   Bas de page
  Imprimer  
Auteur Fil de discussion: Robots.txt  (Lu 1560 fois)
Lanfeust
Administrator
Hero Member
*****
Hors ligne Hors ligne

Messages: 508



Voir le profil
« le: 29 Octobre 2006, 14:16 »

Avant de parcourir votre site web, la plupart des robots (spiders) font appel au fichier robots.txt. Comme son nom l'indique, il s'agit d'un fichier texte qui contient des règles d'exclusion qui définissent le moteur de recherche concerner et les fichiers à ignorer. C'est le cas par exemple des pages en construction qui n'ont aucun intérêt d'être repris par les moteurs de recherche.

Ce fichier n'est évidemment pas obligatoire et à défaut, le robot considère qu'il peut tout indexer. Il répond également à une norme d'exclusion (Robots Exclusion Standard) qui est censée être universelle.

Créer un fichier robots.txt

Pour créer le fichier, ouvrez un éditeur de texte de type Bloc-notes de Windows. Enregistrer le document sous le nom de « robots.txt » (en minuscules et au pluriel) puis envoyez-le sur le serveur distant à la racine du site www.monsite.com/robots.txt Il faut pour cela posséder un nom de domaine car les offres d'hébergement gratuites ne permettent pas de remonter à la racine du site.

Configurer le contenu



La première ligne est un commentaire. Il doit toujours commencer par # et tenir sur une ligne.

Le bloc des 3 lignes suivantes forme ce qu'on appelle un enregistrement. Chaque enregistrement commence par définir le type de robot visé (User-agent) ensuite les instructions à suivre. Dans l'exemple, l'enregistrement s'adresse à tous les robots (*) et doit ignorer (disallow) tout ce qui se trouve dans le répertoire private ainsi que tout les documents private.

Le deuxième enregistrement est séparé par un retour à la ligne vide. Il interdit au robot de Google d'indexer tous les fichiers textes dans le dossier import ainsi que la page referencement.html qui se trouve dans le dossier acorriger.

Quelques noms de robots
    Nom du moteur : User-Agent[/li]
  • Alta Vista : Scooter
  • Excite : ArchitextSpider
  • Google : Googlebot
  • HotBot : Slurp
  • Lycos : T-Rex
  • Msn : MsnBot
  • Voilà : Echo
Statistiques



On l'a vu ce fichier est facultatif. Cela dit, si aucun document n'est disponible pour le robot, il renvoie au serveur un message d'erreur qui est comptabilisé dans vos statistiques. Rien de bien méchant mais personnellement je préfère éviter ce genre de retour.

Dans l'exemple ci-contre, j'indique que tous les moteurs sont autorisés à indexer tout le contenu du site.
« Dernière édition: 29 Octobre 2006, 14:16 par Lanfeust » Journalisée


acid
Jr. Member
**
Hors ligne Hors ligne

Messages: 84


Voir le profil
« Répondre #1 le: 31 Octobre 2006, 10:52 »

Il y a des soupcons qui concerne google. Il ne respecterait pas les demandes de non indexations.
Journalisée
Lanfeust
Administrator
Hero Member
*****
Hors ligne Hors ligne

Messages: 508



Voir le profil
« Répondre #2 le: 31 Octobre 2006, 10:56 »

Citation de: acid
Il y a des soupcons qui concerne google. Il ne respecterait pas les demandes de non indexations.
Rien d'étonnant   imagine seulement la quantité d'informations qu'il a sur nous...
Journalisée


acid
Jr. Member
**
Hors ligne Hors ligne

Messages: 84


Voir le profil
« Répondre #3 le: 02 Novembre 2006, 12:52 »

Par contre quand tu veut te faire indexer il met 3 mois ...
Journalisée
Lanfeust
Administrator
Hero Member
*****
Hors ligne Hors ligne

Messages: 508



Voir le profil
« Répondre #4 le: 03 Novembre 2006, 00:19 »

Citation de: acid
Par contre quand tu veut te faire indexer il met 3 mois ...
Ouais trop j'ai remarqué...
ça doit bien faire 3 semaines que j'ai fait ma demande d'indexation
mais il en est vraiment pas loin...
Journalisée


ben-76
Newbie
*
Hors ligne Hors ligne

Messages: 5


Voir le profil WWW
« Répondre #5 le: 18 Novembre 2006, 14:10 »

Salut, ca fesait longtemp...

Pour le referencement tu doit t'inscrire sur plusieur annuaire car le system de google "ne marche pas".

Sinon je voi que tu evolu CSS, PHP ...
Journalisée
Pages: [1]   Haut de page
  Imprimer  
 
Aller à:  

Propulsé par MySQL Propulsé par PHP Powered by SMF 1.1.11 | SMF © 2006-2009, Simple Machines LLC XHTML 1.0 Transitionnel valide ! CSS valide !