Forschungsbereiche — 5 Domänen
Die Open LLMO Research Initiative gliedert ihre Arbeit in fünf Forschungsbereiche. Jeder Bereich läuft unabhängig, fließt aber letztlich in den Metrik-Satz des LLMOFramework Score ein.
Überblick
Abschnitt betitelt „Überblick“| Bereich | Kernfrage |
|---|---|
| 1. AI Citation Analysis | Welche Inhalte zitieren LLMs, und unter welchen Bedingungen? |
| 2. Grounding Visibility | Wie machen wir KI-Grounding-Quellen sichtbar? |
| 3. LLM Retrieval Optimization | Wie sollten Dokumente für die LLM-Retrieval-Schicht optimiert werden? |
| 4. AI-native Documentation | Welche Dokumentformate verarbeiten LLMs am besten? |
| 5. Agent-oriented Information Architecture | Welche Informationsstrukturen sind für KI-Agenten am leichtesten zu navigieren? |
1. AI Citation Analysis
Abschnitt betitelt „1. AI Citation Analysis“Analyse, welche Inhalte LLMs (ChatGPT, Claude, Gemini, Perplexity) zu einem bestimmten Thema zitieren. Beobachtungen umfassen Zitationshäufigkeit, strukturelle Merkmale zitierter Dokumente und den Retrieval-Pfad, der zur Zitation führte.
Schlüsselfragen
Abschnitt betitelt „Schlüsselfragen“- Wie stark überschneiden sich zitierte Domains zwischen LLMs für dasselbe Thema?
- Lassen sich die strukturellen Merkmale (Heading-Hierarchie, Tabellen, statistische Dichte, externe Link-Anzahl) zitierter Dokumente identifizieren?
- Lässt sich nachträglich eine Checkliste erstellen, damit Inhalte mit höherer Wahrscheinlichkeit zitiert werden?
Aktuelle Richtung
Abschnitt betitelt „Aktuelle Richtung“Datensammlung für KI-Zitationsbeobachtung läuft. Plan für Phase 1: Citation Visibility als Metrik im OSS llmo-checker ausliefern.
2. Grounding Visibility
Abschnitt betitelt „2. Grounding Visibility“Visualisierung des Groundings für KI-Antworten. Umfasst, worauf ein LLM seine Antwort gestützt hat und ob diese Quelle bis zu einer verifizierbaren Primärreferenz zurückverfolgt werden kann.
Schlüsselfragen
Abschnitt betitelt „Schlüsselfragen“- Lässt sich eine standardisierte Reverse-Lookup-Methode von KI-Antwort zu Quelldokument definieren?
- Korreliert es mit höheren KI-Zitationsraten, wenn Grounding auf einer Website “sichtbar” gemacht wird (explizite Quellen, Datenreferenzen, Zitationsformatierung)?
- Korreliert Halluzination mit schwachem Grounding?
Aktuelle Richtung
Abschnitt betitelt „Aktuelle Richtung“Bereits teilweise als Citation Signals (die fünfte Komponente des LLMO Framework) adressiert. Plan für Phase 1: als Grounding-Stability-Metrik quantifizieren.
3. LLM Retrieval Optimization
Abschnitt betitelt „3. LLM Retrieval Optimization“Dokumentseitige Optimierung für die Retrieval-Schicht von LLMs (RAG, Embedding-Retrieval, Web-Search-Plugins usw.). Umfasst Chunking-Strategie, semantische Struktur, Dokumentlänge und Heading-Design.
Schlüsselfragen
Abschnitt betitelt „Schlüsselfragen“- Wie variiert die Beziehung zwischen Chunk-Größe und Retrieval-Genauigkeit über Themen hinweg?
- Wie groß ist der Retrieval-Effizienz-Unterschied zwischen Markdown, HTML und JSON-LD?
- Wie trägt interne Link-Dichte zur Kontexterweiterung in KI-Suche bei?
Aktuelle Richtung
Abschnitt betitelt „Aktuelle Richtung“llmoframework.com selbst dient als Implementierungsreferenz. Plan für Phase 1: Chunking-Vergleichsexperiment veröffentlichen.
4. AI-native Documentation
Abschnitt betitelt „4. AI-native Documentation“Forschung zu Dokumentformaten, die LLMs gut lesen und schreiben. Umfasst llms.txt, Markdown-Konventionen und die optimale Form KI-gerichteter Metadaten.
Schlüsselfragen
Abschnitt betitelt „Schlüsselfragen“- Welche LLMs und Crawler konsultieren llms.txt tatsächlich?
- Wo liegt das optimale Gleichgewicht zwischen Retrieval-Effizienz und Ausdruckskraft bei Markdown gegenüber HTML?
- Beeinflussen KI-gerichtete strukturierte Metadaten (JSON-LD usw.) Zitationsraten?
Aktuelle Richtung
Abschnitt betitelt „Aktuelle Richtung“Implementierung und Wirkungsmessung von llms.txt laufen. Plan für Phase 1: das OSS-Werkzeug llms.txt-validator veröffentlichen.
5. Agent-oriented Information Architecture
Abschnitt betitelt „5. Agent-oriented Information Architecture“Forschung zur Informationsarchitektur für KI-Agenten (Claude Code, Cursor, autonome Agenten usw.). Umfasst MCP-Exposure (Model Context Protocol), API-Dokumentationsdesign und Auffindbarkeit.
Schlüsselfragen
Abschnitt betitelt „Schlüsselfragen“- Haben Websites, die MCP-Server exponieren, einen Vorteil bei der KI-Suche-Sichtbarkeit?
- Sind agent-readable API-Dokumente (OpenAPI + natürliche Sprache) auffindbarer als reine API-Referenzen?
- Lassen sich Methoden zur Beobachtung des Erkundungsverhaltens autonomer Agenten etablieren?
Aktuelle Richtung
Abschnitt betitelt „Aktuelle Richtung“Experimente zur Auswirkung von MCP-Exposure auf die Suche-Sichtbarkeit laufen. Plan für Phase 1: vorläufige Agent-Visibility-Metrik vorschlagen.
Mapping zu Phasen
Abschnitt betitelt „Mapping zu Phasen“| Bereich | Geplante Lieferung für Phase 1 |
|---|---|
| AI Citation Analysis | Citation-Visibility-Metrik im llmo-checker |
| Grounding Visibility | Grounding-Stability-Metrik + Evaluationsdatensatz |
| LLM Retrieval Optimization | Chunking-Vergleichs-Experimentbericht |
| AI-native Documentation | OSS llms.txt-validator |
| Agent-oriented IA | Vorläufige Agent-Visibility-Metrik |
Fortschritt zu jedem Bereich wird im Changelog und in den GitHub Issues veröffentlicht.