Aller au contenu

Article GEO : ce que dit la science

L’article GEO (Generative Engine Optimization) constitue le premier cadre académique pour l’optimisation de la visibilité du contenu dans les moteurs de recherche alimentés par l’IA. Publié à KDD 2024 (ACM SIGKDD), il fournit des preuves empiriques pour les stratégies d’optimisation de contenu sur lesquelles le framework LLMO s’appuie.

ChampValeur
TitreGEO: Generative Engine Optimization
AuteursAggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan, Deshpande
InstitutionPrinceton University, IIT Delhi, Adobe Research
ConférenceKDD 2024 (ACM SIGKDD)
arXiv2311.09735
Publication2024

Les chercheurs ont construit GEO-Bench, un benchmark de 10 000 requêtes de recherche couvrant plusieurs domaines. Ils ont testé 9 stratégies d’optimisation de contenu face à un moteur de recherche génératif afin de mesurer lesquelles amélioraient la visibilité des sources.

  1. Citer les sources
  2. Ajout de citations
  3. Ajout de statistiques
  4. Optimisation de la fluidité
  5. Mots uniques
  6. Termes techniques
  7. Ton d’autorité
  8. Langage accessible
  9. Bourrage de mots-clés
StratégieAmélioration de la visibilitéComposante LLMO
Ajout de statistiques+115,1 %Citation Signals
Citer les sources+77,0 %Citation Signals
Ajout de citations+72,2 %Authority Signals
Ton d’autorité+21,5 %Knowledge Clarity
Optimisation de la fluidité+15,2 %Knowledge Clarity
Termes techniques+5,8 %Knowledge Clarity
Langage accessible+2,4 %Knowledge Clarity
Mots uniques-3,1 %
Bourrage de mots-clés-10,2 %

Les trois stratégies les plus efficaces partagent un trait commun : elles fournissent des preuves vérifiables et externes.

  1. Ajout de statistiques (+115,1 %) : L’ajout de chiffres et de données précises a plus que doublé la visibilité du contenu. Exemple : « Le chiffre d’affaires a augmenté de 34 % en glissement annuel » vs « Le chiffre d’affaires a fortement augmenté. »

  2. Citer les sources (+77,0 %) : Référencer des articles, rapports ou documentations spécifiques a augmenté la visibilité de 77 %. Les systèmes d’IA préfèrent les contenus qu’ils peuvent recouper.

  3. Ajout de citations (+72,2 %) : Inclure des citations directes d’experts ou de sources faisant autorité ajoute une crédibilité que les systèmes d’IA reconnaissent et citent.

  • Bourrage de mots-clés (-10,2 %) : Les tactiques SEO traditionnelles nuisent activement à la visibilité IA. Les systèmes d’IA détectent et pénalisent la densité artificielle de mots-clés.
  • Mots uniques (-3,1 %) : L’utilisation d’un vocabulaire inhabituel n’a pas amélioré la visibilité. La clarté l’emporte sur l’originalité lexicale.

1. Les Citation Signals sont la composante à plus fort effet de levier

Section intitulée « 1. Les Citation Signals sont la composante à plus fort effet de levier »

Les données GEO montrent que les Citation Signals (statistiques, sources, citations) génèrent les plus fortes améliorations de visibilité. C’est pourquoi le framework LLMO positionne les Citation Signals comme composante 5 — la pierre de voûte qui multiplie l’effet de toutes les autres composantes.

2. La clarté du contenu compte, mais moins que les preuves

Section intitulée « 2. La clarté du contenu compte, mais moins que les preuves »

Les stratégies liées à Knowledge Clarity (ton d’autorité, fluidité, langage accessible) montrent toutes des améliorations positives mais modestes (2–22 %). Bien écrire est nécessaire mais pas suffisant. L’effet multiplicateur vient de l’ajout de faits vérifiables.

3. Les tactiques SEO sont contre-productives pour l’IA

Section intitulée « 3. Les tactiques SEO sont contre-productives pour l’IA »

Le bourrage de mots-clés, pierre angulaire du SEO des débuts, a activement réduit la visibilité IA. Cela confirme que le LLMO nécessite une approche fondamentalement différente du SEO traditionnel.

L’article GEO a constaté que l’efficacité des stratégies varie selon le domaine :

  • Requêtes factuelles/scientifiques : L’ajout de statistiques était le plus efficace
  • Requêtes d’opinion/subjectives : L’ajout de citations a obtenu les meilleurs résultats
  • Requêtes techniques : Citer les sources a eu le plus fort impact

Cela suggère que la mise en œuvre du LLMO doit être adaptée au domaine de votre contenu. Un site de recherche bénéficie davantage des statistiques, tandis qu’un blog de thought leadership profite davantage des citations d’experts.

Le framework LLMO étend GEO de trois manières :

  1. Portée élargie : GEO se concentre sur les moteurs de recherche génératifs. Le LLMO couvre toutes les interactions avec les LLM, y compris les requêtes directes, le RAG et les agents IA.
  2. Orientation mise en œuvre : GEO identifie ce qui fonctionne. Le LLMO explique comment l’implémenter avec des formats de fichiers spécifiques (llms.txt), des données structurées (JSON-LD) et des design patterns de contenu.
  3. Couche de récupération : GEO suppose que le contenu est déjà récupéré. Le LLMO ajoute la composante Retrieval Signals pour garantir que le contenu est découvrable en premier lieu.