Google Penguin : guide des bonnes pratiques SEO

tuto-seo-sea-google-penguin

Pour Google, les stratégies de référencement n’ont de sens que si vous respectez ses règles. Des règles pourtant simples à mettre en oeuvre puisqu’elles cautionnent en partie les pratiques visant à améliorer l’expérience utilisateur. Mais le passé témoigne de pénalités redoutables à l’encontre de sites marchands et non marchands. Soyez conscient qu’une pénalité peut réduire votre activité en miette. Et nul besoin de préciser que les sites frauduleux ou « borderline » n’ont pas leur place dans l’index de Google. Certains web-entrepreneurs en arrivent même à considérer que leurs pratiques équivalent à faire de la concurrence déloyale. C’est dans cette optique que Google a déployé une série de filtres algorithmiques, chacun spécialisé dans un domaine. Ce guide SEO est dédié à l’un d’entre eux, réputé pour faire régulièrement l’actualité : Google Penguin.

Explication et fonctionnement de Google Penguin

Qu’est-ce que Google Penguin ?

Si vous débutez dans le référencement naturel, vous devez a minima connaître les spécificités des filtres Google.

Lancé le 24 avril 2012, Google Penguin (ou Pingouin en français) est un nom de code algorithmique puissant qui fait beaucoup parler de lui. Annoncé comme étant le filtre le plus bouleversant de son histoire, Penguin a pour mission d’identifier, interpréter et sanctionner les sites ayant recours à des méthodes de référencement dixit frauduleuses, non naturelles. Mais qu’entendons-nous par « technique frauduleuse » ? Il s’agit tout simplement des actions de référencement visant à manipuler et influencer le classement d’une page web dans les SERP (résultats de recherche Google). Et qui cherchera à manipuler Google perdra le référencement d’une page voire d’une vie pour certains. Si Google Penguin a vocation à dégrader le positionnement des pages victimes de spamdexing, son algorithme cible essentiellement les liens externes obtenus artificiellement, non naturels, anormaux et de surcroît, sur-optimisés.

De quelle manière fonctionne Penguin ?

C’est relativement simple, bien que complexe techniquement parlant. Au même titre qu’un programme informatique, Google met à jour le noyau algorithmique dont il est à l’origine. Depuis son lancement, en 2012, Google Penguin a subit 7 mises à jour, mises à jour que je détaille dans le tableau à la fin de ce billet. Découle de ces mises à jour, un outil de plus en plus puissant, capable d’analyser avec plus de précision/de finesse le page ranking d’une page, mais aussi de repérer et pénaliser automatiquement les pages ne respectant pas les guidelines de Google.

Contrairement à son copain Google Panda, Google Penguin va sanctionner une ou plusieurs pages d’un site et non le site dans sa globalité. La pénalisation va engendrer des conséquences plus ou moins importantes en fonction du niveau de médiocrité de la page. A noter qu’une pénalité n’est pas une mise en liste noire. Autrement dit, votre page ne va pas disparaître de l’index mais être déclassée. Vous allez donc perdre des positions, de la visibilité et donc indirectement, du CA et/ou des lead… C’est dire l’impact néfaste que peut avoir une pénalité.

Anticipation et détection d’une pénalité Google Pingouin

Comment immuniser mon site contre une éventuelle pénalité ?

Pour rendre étanche votre site contre le filtre Google Penguin, vous allez devoir passer au peigne fin les pages montrant des signes de sur-optimisation. Ce travail consiste à identifier d’éventuelles techniques de bourrage de mots clés au sein même d’un contenu, dans les balises Title, hn et dans les zones éventuellement cachées. Les sites qui ont un historique de plusieurs années sont plus exposés à des pénalités Pingouin pour la simple et bonne raison que le Keyword stuffing contribuait à l’époque, à l’amélioration du positionnement d’une page. Cette époque étant révolue, vous allez devoir retravailler (par sécurité) l’intégralité de vos pages en commençant par nettoyer les pages stratégiques (bien positionnées, bon CA…).

Exit également les différentes publicités insérées au sein même d’un contenu. Peu importe la forme que prend votre publicité, vous allez devoir nettoyer tout ça. Si pour x raisons, vous ne pouvez pas vous passer de ces publicités, essayez a minima de les dé-dupliquer. Les lecteurs sont régulièrement exposés à des pubs sans intérêt, très loin de la thématique du site et répétées dans l’article. Il n’y a rien de plus agaçant et artificiel qu’une mitrailleuse de publicité. Pensez-y.

Si l’épuration de contenu et la suppression de publicité intrusive constituent un exercice logique, celui qui consiste à nettoyer les liens entrants artificiels est quant à lui plus touchy. Vous allez dans un premier temps devoir détecter la nature des liens entrants, les sites sur lesquels ils sont posés, les ancres de lien et le trustflow des sites en question. Vous allez devoir vous aider de la Google Search Console, notamment pour le désaveu de liens mais également faire appel à des outils plus avancés comme SEMRush. Ce dernier vous dressera un panorama des différents liens entrants ainsi que leur trustflow (score de confiance), le texte d’ancrage, la typologie du lien et la date à laquelle votre lien est apparu sur le site en question.

Voici les différents éléments à prendre en compte pour détecter les liens toxiques pour votre référencement :

  • L’ancre de vos liens : veillez à ce que les textes d’ancrage soient variés et en lien avec votre site. On privilégiera les textes brandés, contenant votre marque, l’url de votre site ou un mot clé en rapport avec votre activité. Si vous constatez que vous avez une majorité d’ancres présentant des mots clés à caractère commercial type : acheter sur ce site, 10% de réduction ou pas cher et que vous constatez par la même occasion que le côté commercial se retrouve dans 60% de vos textes d’ancrage, vous allez devoir faire des choix et en modifier/désavouer une partie. La diversité des ancres est la chose la plus importante et naturelle pour Google
  • La source de vos liens : comme pour les ancres de lien, la diversité est également valable pour les sources (site cible). Si vous repérez un nombre important de liens en provenance d’un seul et même site (annuaire, bookmarking, blog, forum…), vous augmentez vos chances d’être pénalisé. Pour constater par vous-même la qualité d’un backlink, le plus simple est de se rendre directement sur le site en question. Vous pourrez nettement apprécier à l’œil nu la thématique du site responsable du backlink et juger l’intérêt de ce dernier. Tentez de repérer également l’endroit auquel est situé votre lien de retour. Un lien situé dans un widget ou dans le footer est un signal négatif pour Google Pingouin. N’oubliez pas qu’il vaut mieux 1 backlink par nom de domaine que 1000 backlinks en provenance du même nom de domaine.

Une fois les sources repérées, vous avez la possibilité de vous faire pardonner auprès de Google. Contactez les sites concernés afin de leur demander la suppression des liens en question. Pour mettre toutes les chances de votre côté et essuyer le moins de refus possible, fournissez-leur une liste exhaustive des liens à supprimer. Sans réponse ou action de leur part (ou s’ils tentent de vous facturer la demande), il ne vous restera plus qu’une solution. La Google Search Console met à votre disposition un outil dédié au désaveu. Désavouer un lien revient à déclarer à Google une liste de liens à ignorer – pénalisants – pour votre référencement. Pour découvrir la procédure à suivre, rendez-vous sur le support de Google. Pourquoi ne pas passer directement par la case « désaveu » me direz-vous ? Pour une raison simple : tant que le lien n’est pas supprimé, il apparaîtra dans la Google Search Console et dans tous les outils que vous utiliserez à des fins SEO. Il sera donc difficile de faire la différence entre les liens désavoués et ceux que vous souhaitez conserver… Pensez pratique 🙂

Une bonne stratégie sur les réseaux sociaux permet également de renvoyer une image positive de votre marque auprès de Google. Et n’hésitez pas à lire les bonnes pratiques de Google vis à vis des liens entrants.

Comment savoir si mon site a été pénalisé par Google Pingouin ?

Certaines métriques en disent long sur votre stratégie de positionnement. Un outil comme Google Analytics est capable de vous dresser un graphique montrant l’évolution du trafic en provenance de la source de votre choix. Dans notre cas et pour s’assurer que certaines pages de votre site n’aient pas subit une pénalité, vous devrez vous focaliser sur le trafic en provenance des résultats de recherche de Google.

Pour venir compléter votre outil d’analyse d’audience, mettez en place un générateur de rapport de positionnement. Un outil comme SEOSoft fera l’affaire et dressera pour vous, un rapport régulier sur l’évolution des positions de X mots clés dans les SERP. Grâce à ces deux outils, vous allez pouvoir identifier en un coup d’oeil, le nombre de places que vous avez perdu sur Google, et par mot clé. Si de surcroît, vous remarquez une chute notable, non justifiée et non naturelle sur une ou plusieurs requêtes, il peut s’agir d’une pénalité. Encore faut-il savoir reconnaître deux choses : ce qu’est une page SEO Friendly et ce qu’est Google Pingouin. En effet, rien ne dit que cette perte de positionnement est la conséquence des filtres algorithmiques de Google. Peut-être est-ce de votre faute, après tout ? Et rien ne dit non plus qu’il s’agit de Google Pingouin ! Vous allez donc devoir pousser votre analyse.

A ce stade, vous avez encore des doutes car vous avez constaté une chute de positionnement sur des mots clés. A présent, je vous recommande d’analyser le trafic hors branding sur une période de +/- 10 jours (vs N-1) et en fonction des dates de mises à jour de Penguin (en excluant tous les mots clés contenant le nom de votre site/marque). Constatez-vous une baisse de trafic sur les requêtes non brandées ? Si oui, notre doute commence peu à peu à se transformer en certitude mais là encore, rien est sûr qu’il s’agisse de l’oeuvre de Pingouin. Il est fortement recommandé de reproduire ces analyses sur un moteur de recherche autre que Google : Bing par exemple. Cela permet de conforter notre analyse.

Une vérification ultime consiste également à vérifier l’état d’indexation des pages. En utilisant la commande site:votrenomdedomaine, directement dans la recherche Google, vous allez pouvoir apprécier le nombre de pages présentes dans l’index principal de Google. Si votre site n’apparaît plus, c’est qu’il a probablement été blacklisté. A partir de ce moment là et étant donné la rareté de la chose, il s’agit d’une pénalité octroyée manuellement ou automatiquement par Google à l’encontre de votre site.

J’aimerai néanmoins attirer votre attention sur la version 4.0 de Penguin, sortie le 23 septembre 2016. Cette version remettrait en question une partie des recommandations ci-dessus. Il apparaît que cette version n’ait pas le même fonctionnement que ses prédécesseurs. La distinction se ferait au niveau de la gestion des liens toxiques. Si les précédentes versions de Pingouin pénalisaient le classement des pages ayant des backlinks toxiques, il s’avère que la version 4.0 préfère les ignorer, ne pas en tenir compte. Ceci étant dit, même si la nouvelle version du filtre n’octroiera pas de pénalité automatique, le célèbre Googler Gary Illyes conseille aux webmasters d’utiliser l’outil de désaveu de Google, cette démarche permettant d’éviter les pénalités manuelles, maintenues par le géant.

Est-ce que mon site survivra ? Quand est-ce que la pénalité Google Penguin sera levée ?

C’est difficile d’affirmer que votre site internet survivra. Cela dépend en partie :

  • De votre bonne foi: Google apprécie particulièrement le lancement des mises à jour le vendredi (histoire de pourrir le week-end des webmasters). Si vous mobilisez tous vos efforts le week-end qui suit et commencez à désavouer des liens, il y a de grande chance que Google tienne compte de votre rapidité d’exécution
  • De votre réactivité: plus vite vous irez, plus vite vous serez dépénalisé. Il faut un certain temps à Google pour recrawler les pages défectueuses et apprécier le fruit de votre travail. Cela peut aller de quelques semaines à plusieurs mois, même si la version 4.0 améliore la rapidité d’exécution !
  • De la qualité: mettez toute votre énergie dans le nettoyage des liens et de vos pages. L’outil de désaveu a été lancé par Google dans l’objectif de vous faire gagner du temps. Ce temps économisé, vous devez le passer dans l’optimisation de vos contenus et de votre netlinking
  • De votre stratégie: pour que votre site survive, vous devrez repenser votre stratégie d’acquisition. Pour compenser la perte de trafic SEO sur les requêtes les plus importantes, vous pouvez cibler ces mots clés en référencement payant par exemple. Vous pouvez également envisager de créer un mini site dédié à une catégorie de produit
  • De l’après: la démarche qui consiste à désavouer des liens via la Google Search Console est simple. Profitez de ce temps gagné pour obtenir de bons backlinks

Dire que votre site survivra est prétentieux. Néanmoins, en suivant les recommandations ci-dessus, vous pouvez espérer avoir un retour positif de Google.

Les pratiques SEO appréciées par Google Penguin

Optimisation du contenu d’un site internet

Il en va de soi que les contenus publiés sur votre site doivent être de qualité. Chaque contenu doit apporter une réponse à un besoin, c’est ainsi que Google & Cie voient les choses. Ecrivez donc un contenu sain, unique et bien organisé en :

  • utilisant des balises Hn avec des titres accrocheurs, uniques et non répétés entre les différentes parties
  • structurant votre contenu de manière logique
  • évitant le bourrage de mots clés (keyword stuffing)
  • variant le champ lexical: définir les mots clés à travailler, c’est aussi penser aux synonymes, à la longue traîne
  • évitant la duplication de contenu. Un article présent dans la rubrique « Agence SEO » ne doit pas également figurer dans la rubrique « SEO, les meilleures agences ». Si vous souhaitez qu’un article soit présent à plusieurs endroits sur votre site, il faudra utiliser une balise canonique, prévue à cet effet

Mettre en place une stratégie de netlinking efficace

Google a annoncé à plusieurs reprises que le netlinking figurait parmi les 3 facteurs les plus importants pour le ranking d’un site. Cette stratégie définit en effet le niveau de popularité d’un site internet. Pour faire simple, plus on parle de vous, plus Google considérera votre site comme étant « important ». Il fût un temps où la quantité de backlink était plus importante que la qualité. Mais ça, c’était avant le déploiement du filtre Pingouin, apparût pour inverser la tendance. Désormais, plus vous obtenez des liens de qualité (naturels), plus vous serez récompensé par Google. Il vaut donc mieux 10 backlinks provenant de 10 sites différents, proches de votre thématique que 100 backlinks provenant du même site. Pour aider les webmarketeurs et webentrepreneurs a prendre les bonnes décisions, Google indique dans sa guideline les pratiques à proscrire dont en voici quelques unes. Evitez donc :

  • D’échanger réciproquement un lien avec un autre site. Cette pratique consiste à demander à un site de poser un lien de votre site sur le sien. En échange de quoi, vous ferez de même pour son site, sur le vôtre. Cette pratique est à bannir. Elle facilite d’ailleurs sa détection auprès de Google
  • D’acheter des liens de retour sur les places de marché prévues à cet effet. Google dénonce clairement cette pratique et prévoit une lourde pénalité à destination des sites qui y ont recours
  • De déposer des liens sur des sites n’ayant aucun rapport avec le vôtre. Le géant insiste le caractère « intelligent » de la stratégie de backlinking. Il faut que vos liens de retour soient non seulement naturels mais aussi et surtout en lien étroit ou proche avec le site cible
  • D’obtenir des liens présents dans des widgets (privilégiez le nofollow pour ces derniers)
  • De disposer des liens n’importe où dans un article au contenu pauvre, de faible qualité et sur-optimisé pour le SEO
  • D’opter pour une stratégie full annuaire et bookmarking. Contrairement à ce que l’on peut lire sur la toile, il existe encore quelques bons annuaires. Ne les oubliez pas et évitez ceux qui vous demandent une contrepartie financière
  • De placer des liens dans le footer d’un site

Je reviendrai plus en détail sur ce qu’est une bonne stratégie de linking dans un dossier SEO dédié au netlinking.

Optimisation intelligente des ancres de lien

Un seul et maître mot pour introduire cette partie : la diversité ! Lorsque les liens sont obtenus naturellement, c’est-à-dire sans intervention de votre part, vous avez de fortes chances que les ancres tournent autour de votre marque. De ce côté là, aucun problème.

A l’inverse, lorsque vous êtes initiateur dans l’obtention du backlink, vous pouvez négocier le choix de l’ancre de lien. C’est dans ces cas là que vous devrez travailler un peu, juste un peu. En fait, vous allez définir l’ancre de lien en fonction du site que vous ciblez, de la thématique qu’il aborde, de la position de votre backlink sur le site et du trustflow de ce dernier. Si vous connaissez l’audience du site cible, c’est encore mieux.

En fonction des éléments que vous aurez à votre disposition, vous allez donc choisir la meilleure ancre possible. Il peut s’agir de l’url de votre site, du nom de votre marque, d’un mot clé fort en rapport avec votre métier ou d’une expression. Or, avant même de définir l’ancre, vous allez devoir faire le bilan des ancres déjà acquis.

En effet, imaginez que vous décidiez de vous positionner sur le texte d’ancrage : agence SEO. Lors de l’export de vos ancres, vous remarquez que ce texte d’ancrage est régulièrement utilisé dans vos backlinks. A ce moment-là, plusieurs scénarios et interprétations sont possibles. Par exemple, vous remarquez que le trusflow d’un site se positionnant sur le texte « agence SEO » est faible comparé au trusflow du site sur lequel vous projetez d’utiliser cet ancre. Vous pourrez soit demander au webmaster du premier site de modifier l’ancre de lien en mettant par exemple : « établissement SEO » au lieu de « agence SEO », soit désavouer ce backlink via l’outil de désaveu de Google.

Voici donc ce qu’il faut retenir des ancres :

  • Diversifiez les textes que vous utilisez dans vos ancres
  • Vérifiez l’existant avant de vous positionner sur un texte d’ancrage. L’idée étant d’éviter la sur-optimisation et la sur-répétition, véritable signal d’alerte pour Google)
  • Ne négligez pas les liens en nofollow (diversifiez les textes comme les nofollow/dofollow)
  • Evitez d’utiliser des scripts pour automatiser la génération des backlinks

Historique des mises à jour Google Penguin

Tableau des mises à jour

Version du filtre Date % de requêtes touchées
Pingouin 1 24 avril 2012 3,1%
Pingouin 2 25 mai 2012 0,1%
Pingouin 3 5 octobre 2012 0,4%
Pingouin 4 (version 2.0) 23 mai 2013 2,3%
Pingouin 5 (version 2.1) 4 octobre 2013 1%
Pingouin 6 (version 3.0) 18 octobre 2014 1%
Pingouin 7 (version 4.0) 23 septembre 2016 Inconnu

Google Penguin 4.0 : un fonctionnement différent ?

Depuis le 23 septembre 2016 – date à laquelle le déploiement de la dernière version du filtre a été remarquée -, on peut lire à droite à gauche différentes conversations, tests et débats en tout genre menés autour du petit dernier de la famille. Quand est-ce que la mise à jour a-t-elle été réellement déployée ? Est-elle vraiment en temps réel ? Est-ce que le déploiement est terminé ?

Il me paraît évident que Google teste son filtre avant le lancement officiel ! Au même titre qu’Apple teste son iPhone avant de le lancer. C’est du bon sens. Spéculer sur les dates de lancement me fait plus rire qu’autre chose. En quoi est-ce important que la mise à jour ait été lancée le 02/09 ou le 10/09 ? Si vous remarquez de fortes chutes de positionnement sur le mois de septembre, c’est certainement l’action de plusieurs filtres. Dans tous les cas, vous allez coûte que coûte optimiser vos pages, revoir votre stratégie, qu’il s’agisse de Google Penguin ou non, d’une pénalité manuelle ou non. Mais alors, qu’est-ce qui différencie la version 4.0 des autres versions ?

Google souligne deux améliorations :

  • La précision : désormais, une ou un groupe de pages pourront être pénalisés sans impacter les autres pages d’un site internet. Si rien n’est sûr pour le moment, cette modification devrait faire du bien aux pages SEO-friendly
  • Le temps réel : le processus de scoring de Google Panda ou Google Penguin ne fonctionnait pas en temps réel. Ces filtres devaient récolter toutes les données, les travailler et retravailler avant d’en déduire un score. Sur une échelle temps, cela signifiait que ces filtres pouvaient, à +x jours obtenir des scores différents pour la même page… Cette partie là aurait donc été améliorée par le géant. Ce dernier souligne également que la version 4 est intégrée au coeur de l’algorithme. On ne peut donc plus parler de filtre aujourd’hui…

Pour l’instant, le déploiement de la dernière mise à jour n’est pas vu d’un bon oeil par certains référenceurs. Parmi les arguments les plus cités : la prise en compte en temps réel du scoring serait une bonne nouvelle pour les Black Hat SEO. Ces derniers pourront tester des optimisations et vérifier plus rapidement le fruit de leur résultat (pénalité ou non).

A l’heure où j’écris ce guide, il est encore trop tôt pour tirer des conclusions positives comme négatives. Gardez donc un oeil sur les cas d’études qui vont prochainement être publiés un peu partout sur la toile. Cela pourrait bien vous servir !

Google Penguin : guide des bonnes pratiques SEO
5 (100%) 15 votes

LAISSER UN COMMENTAIRE

Please enter your comment!
Please enter your name here