Je suis tombée sur cette infographie expliquant comment marche Google. Je l’ai trouvé bien fichue. Voilà en gros, le résumé. (Je n’ai traité que la partie « référencement naturel« . Ceci étant, le « mot » est bien sûr également archi présent dans toute la partie ads). Vous verrez, toute la mécanique vertueuse démarre – ô surprise ! – par un beau contenu ;-).
1. Contenu & crawler
Vous écrivez un post de blog, vous twittez, vous mettez à jour un contenu ou tout simplement, vous ajoutez un contenu a votre site web. Les robots de Google crawlent votre site et tombent sur votre post. Quasi simultanément (en à peines quelques secondes), votre page est indexée.
2.
Je suis tombée sur cette infographie expliquant comment marche Google. Je l’ai trouvé bien fichue. Voilà en gros, le résumé. (Je n’ai traité que la partie « référencement naturel« . Ceci étant, le « mot » est bien sûr également archi présent dans toute la partie ads). Vous verrez, toute la mécanique vertueuse démarre – ô surprise ! – par un beau contenu ;-).
1. Contenu & crawler
Vous écrivez un post de blog, vous twittez, vous mettez à jour un contenu ou tout simplement, vous ajoutez un contenu a votre site web. Les robots de Google crawlent votre site et tombent sur votre post. Quasi simultanément (en à peines quelques secondes), votre page est indexée.
2. Robots de google (après vous, c’est eux qui font tout le boulot !)
Les robots de Google suivent les liens hypertextes (base de fonctionnement d’un moteur de recherche et à l’origine de l’idée de partage de l’information fondant le web). Si votre site ne contient pas de liens hypertextes, il ne sera ni crawlé régulièrement ni crawlé en profondeur ! Clairement donc, on évite les robots txt, les liens no follows. Bon point bien sûr, donné aux plateformes de blogs ou aux sitemaps xml. Ça, google aime bien. Enfin, plus les liens hypertextes sont présents dans les pages clés de votre site, plus cela augmente l’autorité de la page.
3. Index
Votre page de contenus est alors rangée dans un index inversé. Les titres des pages et les données relatives aux liens sont stockées dans un index spécial dédié aux recherches larges et concurrentielles. Le contenu même de la page est lui, stocké dans un autre index utilisé pour les recherches sur des termes de longue traine.
=> En gros cela signifie que lorsque vous utilisez le moteur de recherche de Google, contrairement à ce que vous pensez vous n’êtes pas en train de rechercher votre info dans l’internet global, vous le faites sur le cache de Google qui lui, est régulièrement mis à jour. Naturellement, Google note également la qualité de votre nom de domaine et la popularité de vos pages, toujours basée selon la qualité des liens qu’elle contient.
4. Politique éditoriale de Google
L’algorithme est sans cesse révisé par les meilleures équipes de Google (équipe qualité et anti-spam). Bien sûr, il sait dédecter les contenus dupliqués (pages « piratées »). Sur ces bases, chaque page est notée et à chacune d’elle est jointe un certain nombre de données utiles aux recherches utilisateurs.
5. Requêtes utilisateurs Google
Lorsque vous tapez une requête, Google vous suggère des requêtes voisines utilisant votre mot clé ou des mots clés relevant du même champ lexical et/ou basées sur les requêtes les plus tapées. Google utilise aussi les synonymes pour rechercher des mots similaires à inclure dans la requête de recherche. Un « pack » de recherche initiale est créé : bien que votre recherche ait pu générer des millions de résultats, Google n’en affichera « que » 1.000 (voire moins parfois). En gros, les résultats de recherche qui sont affichés sont triés selon l’autorité de la page et son page rank. Les pages dupliquées sont automatiquement retirées des résultats de recherche.
6. Filtres Google
Eux aussi, jouent un rôle important. D’abord, ils permettent à Google d’afficher sur la page de résultat une variété de sites présents autour d’un même terme. Si Google estime que des news, un livre, un site de e-shopping, une vidéo ou n’importe quelle recherche verticale autour du mot requêté, sont pertinents, il affichera les résultats. Chaque site ou chaque gabarit de contenu a donc sa chance. Pas uniquement les sites de contenus, si ceux qui ne diffusent que de l’écrit. Enfin, l’infographie rappelle plusieurs points majeurs :
– Popularité d’un site : Google met plus en avant que d’autres, les sites « anciens » ou disons, présents sur la toile depuis longtemps qui, par nature, ont reçu un nombre importants de visites.
– Manipulation d’un contenu : répéter trop fréquemment (et donc abusivement) un mot clé ou un nombre trop fréquent d’ancres de pages sont à éviter. Si Google estime que les pages en contiennent un nombre anormal, vous risquez de voir votre page retirée des résultats de recherche.
– Maillage interne : bien sur, Google va vérifier le maillage interne et le backlink de votre site. Google aime les liens intra-sites et les liens externes (ceux vers lesquels votre site va pointer, surtout si leur pagerank est bon). Idem pour ceux qui pointent vers le vôtre.
Après tout ça (qui se déroule en moins d’une seconde…!) les résultats naturels d’une recherche sont affichés. Ce mécanisme se reproduit des milliards de fois dans une même journée. Je vous laisse lire (tout en bas de l’infographie) ce que cela rapporte à Google…
Infographic by the Pay Per Click Blog