Article GEO : ce que dit la science

L’article GEO (Generative Engine Optimization) constitue le premier cadre académique pour l’optimisation de la visibilité du contenu dans les moteurs de recherche alimentés par l’IA. Publié à KDD 2024 (ACM SIGKDD), il fournit des preuves empiriques pour les stratégies d’optimisation de contenu sur lesquelles le framework LLMO s’appuie.

Détails de l’article

Champ	Valeur
Titre	GEO: Generative Engine Optimization
Auteurs	Aggarwal, Murahari, Rajpurohit, Kalyan, Narasimhan, Deshpande
Institution	Princeton University, IIT Delhi, Adobe Research
Conférence	KDD 2024 (ACM SIGKDD)
arXiv	2311.09735
Publication	2024

Protocole de recherche

Les chercheurs ont construit GEO-Bench, un benchmark de 10 000 requêtes de recherche couvrant plusieurs domaines. Ils ont testé 9 stratégies d’optimisation de contenu face à un moteur de recherche génératif afin de mesurer lesquelles amélioraient la visibilité des sources.

Les 9 stratégies testées

Citer les sources
Ajout de citations
Ajout de statistiques
Optimisation de la fluidité
Mots uniques
Termes techniques
Ton d’autorité
Langage accessible
Bourrage de mots-clés

Résultats clés

Efficacité des stratégies

Stratégie	Amélioration de la visibilité	Composante LLMO
Ajout de statistiques	+115,1 %	Signaux de citation
Citer les sources	+77,0 %	Signaux de citation
Ajout de citations	+72,2 %	Signaux d’autorité
Ton d’autorité	+21,5 %	Clarté des connaissances
Optimisation de la fluidité	+15,2 %	Clarté des connaissances
Termes techniques	+5,8 %	Clarté des connaissances
Langage accessible	+2,4 %	Clarté des connaissances
Mots uniques	-3,1 %	—
Bourrage de mots-clés	-10,2 %	—

Le trio de tête

Les trois stratégies les plus efficaces partagent un trait commun : elles fournissent des preuves vérifiables et externes.

Ajout de statistiques (+115,1 %) : L’ajout de chiffres et de données précises a plus que doublé la visibilité du contenu. Exemple : « Le chiffre d’affaires a augmenté de 34 % en glissement annuel » vs « Le chiffre d’affaires a fortement augmenté. »
Citer les sources (+77,0 %) : Référencer des articles, rapports ou documentations spécifiques a augmenté la visibilité de 77 %. Les systèmes d’IA préfèrent les contenus qu’ils peuvent recouper.
Ajout de citations (+72,2 %) : Inclure des citations directes d’experts ou de sources faisant autorité ajoute une crédibilité que les systèmes d’IA reconnaissent et citent.

Ce qui ne fonctionne pas

Bourrage de mots-clés (-10,2 %) : Les tactiques SEO traditionnelles nuisent activement à la visibilité IA. Les systèmes d’IA détectent et pénalisent la densité artificielle de mots-clés.
Mots uniques (-3,1 %) : L’utilisation d’un vocabulaire inhabituel n’a pas amélioré la visibilité. La clarté l’emporte sur l’originalité lexicale.

Implications pour le LLMO

1. Les Signaux de citation sont la composante à plus fort effet de levier

Les données GEO montrent que les Signaux de citation (statistiques, sources, citations) génèrent les plus fortes améliorations de visibilité. C’est pourquoi le framework LLMO positionne les Signaux de citation comme composante 5 — la pierre de voûte qui multiplie l’effet de toutes les autres composantes.

2. La clarté du contenu compte, mais moins que les preuves

Les stratégies liées à Clarté des connaissances (ton d’autorité, fluidité, langage accessible) montrent toutes des améliorations positives mais modestes (2–22 %). Bien écrire est nécessaire mais pas suffisant. L’effet multiplicateur vient de l’ajout de faits vérifiables.

3. Les tactiques SEO sont contre-productives pour l’IA

Le bourrage de mots-clés, pierre angulaire du SEO des débuts, a activement réduit la visibilité IA. Cela confirme que le LLMO nécessite une approche fondamentalement différente du SEO traditionnel.

Variations selon les domaines

L’article GEO a constaté que l’efficacité des stratégies varie selon le domaine :

Requêtes factuelles/scientifiques : L’ajout de statistiques était le plus efficace
Requêtes d’opinion/subjectives : L’ajout de citations a obtenu les meilleurs résultats
Requêtes techniques : Citer les sources a eu le plus fort impact

Cela suggère que la mise en œuvre du LLMO doit être adaptée au domaine de votre contenu. Un site de recherche bénéficie davantage des statistiques, tandis qu’un blog de thought leadership profite davantage des citations d’experts.

Comment le LLMO s’appuie sur GEO

Le framework LLMO étend GEO de trois manières :

Portée élargie : GEO se concentre sur les moteurs de recherche génératifs. Le LLMO couvre toutes les interactions avec les LLM, y compris les requêtes directes, le RAG et les agents IA.
Orientation mise en œuvre : GEO identifie ce qui fonctionne. Le LLMO explique comment l’implémenter avec des formats de fichiers spécifiques (llms.txt), des données structurées (JSON-LD) et des design patterns de contenu.
Couche de récupération : GEO suppose que le contenu est déjà récupéré. Le LLMO ajoute la composante Signaux de recherche pour garantir que le contenu est découvrable en premier lieu.

Pour aller plus loin

Article complet sur arXiv
Vue d’ensemble du framework LLMO
Signaux de citation — mise en œuvre de la stratégie GEO la plus efficace