Zum Inhalt springen

Forschungsbereiche — 5 Domänen

Die Open LLMO Research Initiative gliedert ihre Arbeit in fünf Forschungsbereiche. Jeder Bereich läuft unabhängig, fließt aber letztlich in den Metrik-Satz des LLMOFramework Score ein.

BereichKernfrage
1. AI Citation AnalysisWelche Inhalte zitieren LLMs, und unter welchen Bedingungen?
2. Grounding VisibilityWie machen wir KI-Grounding-Quellen sichtbar?
3. LLM Retrieval OptimizationWie sollten Dokumente für die LLM-Retrieval-Schicht optimiert werden?
4. AI-native DocumentationWelche Dokumentformate verarbeiten LLMs am besten?
5. Agent-oriented Information ArchitectureWelche Informationsstrukturen sind für KI-Agenten am leichtesten zu navigieren?

Analyse, welche Inhalte LLMs (ChatGPT, Claude, Gemini, Perplexity) zu einem bestimmten Thema zitieren. Beobachtungen umfassen Zitationshäufigkeit, strukturelle Merkmale zitierter Dokumente und den Retrieval-Pfad, der zur Zitation führte.

  • Wie stark überschneiden sich zitierte Domains zwischen LLMs für dasselbe Thema?
  • Lassen sich die strukturellen Merkmale (Heading-Hierarchie, Tabellen, statistische Dichte, externe Link-Anzahl) zitierter Dokumente identifizieren?
  • Lässt sich nachträglich eine Checkliste erstellen, damit Inhalte mit höherer Wahrscheinlichkeit zitiert werden?

Datensammlung für KI-Zitationsbeobachtung läuft. Plan für Phase 1: Citation Visibility als Metrik im OSS llmo-checker ausliefern.


Visualisierung des Groundings für KI-Antworten. Umfasst, worauf ein LLM seine Antwort gestützt hat und ob diese Quelle bis zu einer verifizierbaren Primärreferenz zurückverfolgt werden kann.

  • Lässt sich eine standardisierte Reverse-Lookup-Methode von KI-Antwort zu Quelldokument definieren?
  • Korreliert es mit höheren KI-Zitationsraten, wenn Grounding auf einer Website “sichtbar” gemacht wird (explizite Quellen, Datenreferenzen, Zitationsformatierung)?
  • Korreliert Halluzination mit schwachem Grounding?

Bereits teilweise als Citation Signals (die fünfte Komponente des LLMO Framework) adressiert. Plan für Phase 1: als Grounding-Stability-Metrik quantifizieren.


Dokumentseitige Optimierung für die Retrieval-Schicht von LLMs (RAG, Embedding-Retrieval, Web-Search-Plugins usw.). Umfasst Chunking-Strategie, semantische Struktur, Dokumentlänge und Heading-Design.

  • Wie variiert die Beziehung zwischen Chunk-Größe und Retrieval-Genauigkeit über Themen hinweg?
  • Wie groß ist der Retrieval-Effizienz-Unterschied zwischen Markdown, HTML und JSON-LD?
  • Wie trägt interne Link-Dichte zur Kontexterweiterung in KI-Suche bei?

llmoframework.com selbst dient als Implementierungsreferenz. Plan für Phase 1: Chunking-Vergleichsexperiment veröffentlichen.


Forschung zu Dokumentformaten, die LLMs gut lesen und schreiben. Umfasst llms.txt, Markdown-Konventionen und die optimale Form KI-gerichteter Metadaten.

  • Welche LLMs und Crawler konsultieren llms.txt tatsächlich?
  • Wo liegt das optimale Gleichgewicht zwischen Retrieval-Effizienz und Ausdruckskraft bei Markdown gegenüber HTML?
  • Beeinflussen KI-gerichtete strukturierte Metadaten (JSON-LD usw.) Zitationsraten?

Implementierung und Wirkungsmessung von llms.txt laufen. Plan für Phase 1: das OSS-Werkzeug llms.txt-validator veröffentlichen.


Forschung zur Informationsarchitektur für KI-Agenten (Claude Code, Cursor, autonome Agenten usw.). Umfasst MCP-Exposure (Model Context Protocol), API-Dokumentationsdesign und Auffindbarkeit.

  • Haben Websites, die MCP-Server exponieren, einen Vorteil bei der KI-Suche-Sichtbarkeit?
  • Sind agent-readable API-Dokumente (OpenAPI + natürliche Sprache) auffindbarer als reine API-Referenzen?
  • Lassen sich Methoden zur Beobachtung des Erkundungsverhaltens autonomer Agenten etablieren?

Experimente zur Auswirkung von MCP-Exposure auf die Suche-Sichtbarkeit laufen. Plan für Phase 1: vorläufige Agent-Visibility-Metrik vorschlagen.


BereichGeplante Lieferung für Phase 1
AI Citation AnalysisCitation-Visibility-Metrik im llmo-checker
Grounding VisibilityGrounding-Stability-Metrik + Evaluationsdatensatz
LLM Retrieval OptimizationChunking-Vergleichs-Experimentbericht
AI-native DocumentationOSS llms.txt-validator
Agent-oriented IAVorläufige Agent-Visibility-Metrik

Fortschritt zu jedem Bereich wird im Changelog und in den GitHub Issues veröffentlicht.