Mettre en place un lien de qualitéCréer un lien n'est pas difficile en soi, mais en créer un de qualité est primordial pour augmenter la visibilité d'un site Web. Nous allons donc voir dans ce point quels critères les moteurs de recherche retiennent pour considérer un lien comme optimal.
Tout d'abord, il faut savoir que dans le langage HTML, un lien se présente sous cette forme : <A href="/http://www.adressedusite.com/index.html">texte du lien</A> Lorsque le robot du moteur de recherche explore une page Web, il suit les liens présents sur celle-ci. Afin de faciliter sa compréhension, il faut que leur forme soit la plus simple possible. Autrement dit, qu'elle se rapproche au plus de l'exemple ci-dessus. Les liens images, formulaires, JavaScript ou Flash doivent être évités car ils risquent de ne pas être reconnus comme tels pas les moteurs (nous y reviendrons dans le chapitre suivant).
Pour qu'un lien soit optimalisé, l'idéal est qu'il contienne les mêmes mots-clefs dans l'adresse cible que dans son intitulé (anchor text ). Si le robot retrouve en plus ces mots dans la page de destination, il considérera que la page source est de qualité, ce qui augmentera inévitablement son indice de confiance. Il est donc nécessaire de soigner le libellé des liens pour favoriser le positionnement d'une page Web. Notons que tous les moteurs de recherche majeurs tiennent compte de ce système. Le PageRank ou l'indice de popularité A. Qu'est-ce que le PageRank ?Le PageRank ou PR est un algorithme développé par le moteur de recherche Google qui détermine l'importance d'une page Web. Son principe de fonctionnement est simple : « Un lien émis par une page A vers une page B est assimilé à un "vote" de A pour B. Au plus une page reçoit de "votes", au plus cette page est considérée comme importante par Google. »
Chaque page n'a évidemment pas la même importance sinon une véritable disproportion se ferait ressentir : un lien émis depuis le site de Microsoft ne peut pas avoir moins d'importance que celui d'un site personnel. Ainsi, on pourrait dire que plus une page a de liens pointant vers elle, et plus ces liens proviennent de sites ayant un fort indice de popularité, plus le PageRank de celle-ci sera élevé. B. Comment se calcule le PageRank ?Sur certains sites, ou grâce à la barre d'outils Google, le PageRank d'une page Web peut être connu :
 La page se fait donc attribuer une note comprise entre 0 et 10/10. Mais comment celle-ci est-elle calculée?
Les deux fondateurs de Google, Sergey Brin et Larry Page, ont livré la formule magique de cet indice : PR(A) = (1-d) + d (PR(T1)/C(T1) + ... + PR(Tn)/C(Tn))
Cette formule peut paraître très compliquée, mais elle l'est beaucoup moins qu'il n'y paraît. Voici l'explication de la notation donnée par le site webmaster-hub.com : | PR(A) | Le PageRank de la page A | | PR(Tn) | Le PageRank de la page Tn | | C(Tn) | Le nombre de liens émis sur la page Tn | | d | Tous les "votes" sont additionnés, mais pour en limiter l’importance, le total est multiplié par ce coefficient d’amortissement (0.85) | | 1 - d | Un petit peu de "magie mathématique" qui permet de garantir que la moyenne des PageRank de l’ensemble des pages du Web sera de 1. | On pourrait se demander comment Google arrive toujours à obtenir une note comprise entre 0 et 10. Il faut savoir que le PageRank affiché n'est pas le véritable. Sans entrer dans des détails mathématiques trop ardus, l'échelle du PageRank est logarithmique. Ce qui signifie objectivement, que si cette échelle est de base 10, il faudra 10 fois plus d'effort pour passer du PR3 au PR4, que de passer du PR2 au PR3. A titre informatif, on estime que cette échelle a une base entre 5 et 8 chez Google et que celle-ci évolue dans le temps. Pour clôturer ce point, on peut noter que d'autres moteurs de recherche, comme Yahoo, ont également développé leurs propres systèmes de PageRank.
Le TrustRank ou l'indice de confianceElément phare depuis la création des moteurs de recherche, l'indice de popularité n'est désormais plus le seul élément déterminant l'importance d'une page Web. Une technique, que l'on a nommé "Google Bombing" ou bombardement Google en français aurait fait sa première apparition en 2001. Adam Mathes, un animateur de blog a propulsé le site d'un de ses amis dans les premiers résultats de Google sur un terme peu flatteur. La méthode qu'il a utilisée est très facile à comprendre : comme nous venons de l'expliquer dans le point ci-dessus, Google utilise le système de PageRank, qui a pour but d'attribuer une importance aux pages Web en fonction du nombre de liens pointant vers celle-ci. L'auteur de cette plaisanterie de mauvais goût a tout simplement multiplié les liens vers le site de son ami en utilisant toujours le même intitulé de lien (ou anchor text), ce qui a influencé artificiellement le positionnement des résultats dans le moteur de recherche. Georges W. Bush a également fait les frais de cette manipulation : lorsqu'un internaute introduisait "miserable failure" dans le formulaire de recherche, Google proposait comme premier résultat la biographie officielle du président américain sur le site de la Maison Blanche. La technique employée était encore similaire : des liens pointant vers la page de l'homme d'Etat et ayant "miserable failure" comme anchor text" avaient été placés sur de nombreux sites. Afin de faire face à cette situation, les moteurs de recherche ne tiennent plus uniquement compte de la popularité d'un site, mais aussi de sa qualité. On parle alors de TrustRank.
Pour mieux comprendre ce terme, voici deux définitions provenant du Web :
JournalDuNet.com : « Elément mis en place dans l'algorithme des moteurs de recherche Web, permettant de prendre en compte le degré de confiance accordé à un site. Il entend réduire le nombre de réponses non sollicitées (spam) ; il s’appuie sur une liste de sites bien déterminés et part du principe que les liens réalisés depuis les pages de ces sites le sont le plus souvent vers des contenus dignes de confiance. Cet indicateur a été développé par deux chercheurs universitaires et un chercheur de Yahoo. La marque TrustRank a été déposée par Google en mars 2005. La majorité des autres moteurs possède un algorithme équivalent. »
Dicodunet.com : « TrustRank est à la fois le nom d'un algorithme cherchant à réduire le Spam dans les moteurs de recherche et une marque déposée par Google en Mars 2005. »
La notion de confiance s'est donc ajoutée à la composition de l'algorithme des moteurs. On pourra ainsi dire qu'il vaudra mieux avoir dix liens en destination de notre site depuis des sites de qualité que cent provenant des profondeurs du Web. Il reste bien entendu possible d'influencer le TrustRank en mettant en place une campagne de netlinking bien menée. Nous y reviendrons au chapitre 4. Terminons en remarquant que Google a déposé la marque TrustRank alors que son principe avait été imaginé par un chercheur de Yahoo. La guerre entre Google et Yahoo n'en finit pas !
|