Aller au contenu

Le framework LLMO : un standard pour la découvrabilité par l'IA

Le framework LLMO définit six composants fondamentaux qui déterminent si les systèmes d’IA peuvent découvrir, comprendre et citer correctement votre contenu.

Vous partez du concept ? Lisez Qu’est-ce que LLMO ?. Vous voulez implémenter tout de suite ? Passez au Démarrage rapide en 30 min.

Votre contenu est-il suffisamment clair pour que l’IA le comprenne et le résume fidèlement ?

  • Utilisez un langage simple et sans ambiguïté
  • Définissez explicitement les termes clés
  • Fournissez des faits structurés (qui, quoi, quand, où)
  • Évitez le jargon non expliqué

Votre contenu est-il structuré pour être exploité par les machines ?

  • Utilisez du HTML sémantique et du Markdown
  • Implémentez les données structurées JSON-LD, cadrées par page
  • Fournissez un fichier llms.txt pour le contenu destiné à l’IA
  • Vérifiez que le JSON-LD est réellement émis dans le HTML servi

Les systèmes d’IA peuvent-ils trouver votre contenu lorsqu’ils en ont besoin ?

  • Assurez l’accessibilité au crawl (robots.txt, sitemap.xml)
  • Fournissez des points d’accès lisibles par les machines (/ai/, fichiers .md)
  • Implémentez le standard llms.txt
  • Rendez le contenu disponible via des API lorsque c’est possible

Votre contenu démontre-t-il une expertise et une fiabilité ?

  • Attribution d’auteur avec des qualifications vérifiables
  • Présence multiplateforme (GitHub, LinkedIn, publications)
  • Informations cohérentes sur toutes les plateformes
  • Affirmations fondées sur des preuves avec citations

Votre contenu fournit-il des références que l’IA peut vérifier ?

  • Liens vers les sources primaires
  • Dates de publication incluses
  • Informations de version fournies
  • Références à des articles académiques et à la documentation officielle

Le même fait raconte-t-il la même histoire sur toutes les surfaces lues par l’IA ?

  • Source unique de vérité pour chaque affirmation chiffrée ou factuelle
  • Surfaces réservées à l’IA (llms.txt, /ai/*.md) générées à partir des mêmes données que le HTML
  • Hôte canonique et politique de barre oblique finale imposés partout
  • Aucune entité JSON-LD dupliquée pour le même @id

Chaque composant est évalué sur une échelle de 0 à 3 :

ScoreNiveauDescription
0AucunComposant non traité
1BasiqueImplémentation minimale
2BonImplémentation solide avec des axes d’amélioration
3ExcellentImplémentation conforme aux bonnes pratiques

Score maximum : 18 points (6 composants × 3 points chacun)

Évaluez votre propre site sur chaque composant. Tout élément que vous pouvez cocher avec confiance vaut 1 point ; visez 3 cases par composant pour atteindre le score maximum.

  • Chaque page commence par une réponse en une phrase à sa question principale (Answer-first)
  • Les termes spécifiques au domaine sont définis lors de leur première utilisation (pas de jargon inexpliqué)
  • Chaque paragraphe contient une seule idée (pas de paragraphes à affirmations multiples)
  • Les pages utilisent une hiérarchie sémantique H1 → H2 → H3 sans saut de niveau
  • Chaque page significative émet du JSON-LD pertinent pour la page ; le layout commun au site n’émet que Organization / WebSite / Person
  • Le pipeline de build vérifie que le JSON-LD se parse réellement dans le HTML de dist/
  • /llms.txt existe à la racine du site et liste les pages clés
  • Le répertoire /ai/ fournit du Markdown propre pour chaque thème majeur (et par langue si le site est multilingue)
  • robots.txt autorise explicitement GPTBot, ClaudeBot, PerplexityBot, Google-Extended ; sitemap.xml est accessible
  • L’auteur dispose d’une bio vérifiable avec des liens sameAs vers LinkedIn / GitHub / X / profils de publication
  • La même identité (nom, rôle, focus thématique) apparaît de manière cohérente sur au moins 3 plateformes
  • Le site renvoie vers de la recherche originale, des livres ou des articles que l’auteur a réellement publiés
  • Chaque affirmation utilisant un chiffre cite une source par nom et année
  • Chaque page de contenu (article, guide, étude de cas) expose à la fois datePublished et dateModified (dans le JSON-LD ou en méta visible). La racine du site et les pages d’erreur sont exemptées
  • Le contenu comparatif référence les standards de l’industrie (W3C, RFC, ISO, schema.org) par nom et lien
  • Chaque affirmation chiffrée / factuelle a un seul fichier source canonique référencé partout ailleurs
  • Les surfaces IA (llms.txt, /ai/*.md, endpoints URL.md) sont générées à partir des mêmes données que le HTML
  • La CI vérifie la dérive inter-fichiers sur les métriques clés ; aucune entité JSON-LD dupliquée pour le même @id
TotalTranche
16–18Niveau production — activement cité par les systèmes d’IA
11–15Bon — visible par l’IA mais incohérent
6–10Partiel — lacunes importantes en recherche, autorité ou cohérence
0–5Invisible — commencez par /llms.txt, robots.txt et JSON-LD

Vous voulez un score plus élevé ? Chaque page de composant (Clarté des connaissances, Formatage structuré, Signaux de recherche, Signaux d’autorité, Signaux de citation, Signaux de cohérence) liste les implémentations spécifiques qui font passer le score de 1 → 2 → 3.