Aller au contenu

Article GEO : ce que dit la science

L’article GEO (Generative Engine Optimization) constitue le premier cadre académique pour l’optimisation de la visibilité du contenu dans les moteurs de recherche alimentés par l’IA. Publié à KDD 2024 (ACM SIGKDD), il fournit des preuves empiriques pour les stratégies d’optimisation de contenu sur lesquelles le framework LLMO s’appuie.

ChampValeur
TitreGEO: Generative Engine Optimization
AuteursAggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan, Deshpande
InstitutionPrinceton University, IIT Delhi, Adobe Research
ConférenceKDD 2024 (ACM SIGKDD)
arXiv2311.09735
Publication2024

Les chercheurs ont construit GEO-Bench, un benchmark de 10 000 requêtes de recherche couvrant plusieurs domaines. Ils ont testé 9 stratégies d’optimisation de contenu face à un moteur de recherche génératif afin de mesurer lesquelles amélioraient la visibilité des sources.

  1. Citer les sources
  2. Ajout de citations
  3. Ajout de statistiques
  4. Optimisation de la fluidité
  5. Mots uniques
  6. Termes techniques
  7. Ton d’autorité
  8. Langage accessible
  9. Bourrage de mots-clés
StratégieAmélioration de la visibilitéComposante LLMO
Ajout de statistiques+115,1 %Signaux de citation
Citer les sources+77,0 %Signaux de citation
Ajout de citations+72,2 %Signaux d’autorité
Ton d’autorité+21,5 %Clarté des connaissances
Optimisation de la fluidité+15,2 %Clarté des connaissances
Termes techniques+5,8 %Clarté des connaissances
Langage accessible+2,4 %Clarté des connaissances
Mots uniques-3,1 %
Bourrage de mots-clés-10,2 %

Les trois stratégies les plus efficaces partagent un trait commun : elles fournissent des preuves vérifiables et externes.

  1. Ajout de statistiques (+115,1 %) : L’ajout de chiffres et de données précises a plus que doublé la visibilité du contenu. Exemple : « Le chiffre d’affaires a augmenté de 34 % en glissement annuel » vs « Le chiffre d’affaires a fortement augmenté. »

  2. Citer les sources (+77,0 %) : Référencer des articles, rapports ou documentations spécifiques a augmenté la visibilité de 77 %. Les systèmes d’IA préfèrent les contenus qu’ils peuvent recouper.

  3. Ajout de citations (+72,2 %) : Inclure des citations directes d’experts ou de sources faisant autorité ajoute une crédibilité que les systèmes d’IA reconnaissent et citent.

  • Bourrage de mots-clés (-10,2 %) : Les tactiques SEO traditionnelles nuisent activement à la visibilité IA. Les systèmes d’IA détectent et pénalisent la densité artificielle de mots-clés.
  • Mots uniques (-3,1 %) : L’utilisation d’un vocabulaire inhabituel n’a pas amélioré la visibilité. La clarté l’emporte sur l’originalité lexicale.

1. Les Signaux de citation sont la composante à plus fort effet de levier

Section intitulée « 1. Les Signaux de citation sont la composante à plus fort effet de levier »

Les données GEO montrent que les Signaux de citation (statistiques, sources, citations) génèrent les plus fortes améliorations de visibilité. C’est pourquoi le framework LLMO positionne les Signaux de citation comme composante 5 — la pierre de voûte qui multiplie l’effet de toutes les autres composantes.

2. La clarté du contenu compte, mais moins que les preuves

Section intitulée « 2. La clarté du contenu compte, mais moins que les preuves »

Les stratégies liées à Clarté des connaissances (ton d’autorité, fluidité, langage accessible) montrent toutes des améliorations positives mais modestes (2–22 %). Bien écrire est nécessaire mais pas suffisant. L’effet multiplicateur vient de l’ajout de faits vérifiables.

3. Les tactiques SEO sont contre-productives pour l’IA

Section intitulée « 3. Les tactiques SEO sont contre-productives pour l’IA »

Le bourrage de mots-clés, pierre angulaire du SEO des débuts, a activement réduit la visibilité IA. Cela confirme que le LLMO nécessite une approche fondamentalement différente du SEO traditionnel.

L’article GEO a constaté que l’efficacité des stratégies varie selon le domaine :

  • Requêtes factuelles/scientifiques : L’ajout de statistiques était le plus efficace
  • Requêtes d’opinion/subjectives : L’ajout de citations a obtenu les meilleurs résultats
  • Requêtes techniques : Citer les sources a eu le plus fort impact

Cela suggère que la mise en œuvre du LLMO doit être adaptée au domaine de votre contenu. Un site de recherche bénéficie davantage des statistiques, tandis qu’un blog de thought leadership profite davantage des citations d’experts.

Le framework LLMO étend GEO de trois manières :

  1. Portée élargie : GEO se concentre sur les moteurs de recherche génératifs. Le LLMO couvre toutes les interactions avec les LLM, y compris les requêtes directes, le RAG et les agents IA.
  2. Orientation mise en œuvre : GEO identifie ce qui fonctionne. Le LLMO explique comment l’implémenter avec des formats de fichiers spécifiques (llms.txt), des données structurées (JSON-LD) et des design patterns de contenu.
  3. Couche de récupération : GEO suppose que le contenu est déjà récupéré. Le LLMO ajoute la composante Signaux de recherche pour garantir que le contenu est découvrable en premier lieu.