Die Zeit vor WebMCP: Wie Websites schon heute KI-lesbar werden

Das Web steht vor einer neuen Schnittstelle.

Über zwei Jahrzehnte lang war klar, wie Informationen im Internet gefunden werden: Suchmaschinen indexierten Webseiten, berechneten Rankings und präsentierten eine Liste mit Links. Nutzer klickten sich durch diese Ergebnisse, bis sie die gewünschte Information fanden.

Dieses Modell verändert sich gerade grundlegend.

Immer häufiger stellen Menschen ihre Fragen direkt einem KI-System. Statt (wie früher) zehn Suchergebnisse zu vergleichen, formulieren sie eine Anfrage wie „Business-Hotel nahe der Messe Düsseldorf mit schnellem WLAN“ oder „beste Verbindung von Berlin nach Zürich morgen früh“. Die Antwort kommt nicht mehr als Liste von Links, sondern als zusammengefasste Empfehlung.

Für Websites entsteht daraus eine neue Realität. Sie werden nicht mehr nur als Zielseite besucht. Sie werden zunehmend zu Wissensquellen, aus denen KI-Systeme Informationen extrahieren.

Genau an dieser Stelle kommt ein Konzept ins Spiel, über das in Entwicklerkreisen immer häufiger gesprochen wird: WebMCP, das Model Context Protocol für das offene Web. Dieses Protokoll soll künftig ermöglichen, dass KI-Agenten strukturierte Funktionen von Websites direkt nutzen können. Statt HTML zu analysieren, könnten sie APIs oder definierte Tools ansprechen.

Ich habe hier WebMCP-Beispiele für Hotels und Airlines gebaut.

Doch bis ein solcher Standard breit implementiert ist, wird Zeit vergehen. Browser müssen ihn unterstützen, KI-Systeme müssen ihn integrieren und Unternehmen müssen ihre Websites entsprechend anpassen.

In der Zwischenzeit stellt sich eine praktische Frage.

Wie können Inhalte heute schon so aufgebaut werden, dass KI-Suchsysteme sie möglichst gut verstehen?

Die Antwort beginnt mit einem Perspektivwechsel. Websites müssen lernen, nicht nur für Menschen und Suchmaschinen zu schreiben, sondern auch für Systeme, die Informationen automatisiert interpretieren.

KI-Systeme lesen Websites anders als Suchmaschinen

Um zu verstehen, warum sich Inhalte verändern müssen, lohnt ein Blick auf den Unterschied zwischen klassischer Suche und KI-Antwortsystemen.

Suchmaschinen funktionieren im Kern dokumentenbasiert. Sie crawlen Webseiten, analysieren deren Inhalte und berechnen anhand zahlreicher Signale eine Rangfolge. Das Ergebnis ist eine Liste von Dokumenten.

Der Nutzer klickt einen Link an und liest die Seite selbst.

KI-Systeme arbeiten anders. Sie versuchen nicht in erster Linie, Dokumente zu bewerten, sondern Informationen zu extrahieren. Viele moderne Systeme nutzen Retrieval-Augmented Generation. Dabei werden relevante Textpassagen aus verschiedenen Quellen abgerufen, zusammengeführt und anschließend zu einer Antwort formuliert.

Die Einheit der Verarbeitung ist dabei nicht mehr die ganze Seite, sondern ein Textfragment. In der technischen Sprache spricht man häufig von „Chunks“. Webseiten werden in kleinere Segmente zerlegt, die dann semantisch analysiert werden.

Das hat eine wichtige Konsequenz.

KI-Systeme ranken nicht nur Dokumente. Sie extrahieren Wissen.

Eine Website kann deshalb sichtbar bleiben, selbst wenn der Nutzer sie gar nicht direkt besucht. Ihre Inhalte fließen in Antworten ein, werden zitiert oder dienen als Hintergrundwissen.

Für Betreiber von Websites bedeutet das eine neue Herausforderung. Inhalte müssen nicht nur lesbar sein, sondern auch interpretierbar.

Das strukturelle Problem vieler Websites

Die meisten Websites sind historisch für eine andere Welt gebaut worden.

Sie sind optimiert für menschliche Leser und für Suchmaschinen, die hauptsächlich mit Dokumenten arbeiten. Inhalte werden häufig in Fließtext erzählt, Marketingformulierungen dominieren und wichtige Fakten sind nicht immer klar erkennbar.

Für ein KI-System kann das problematisch sein.

Ein typischer Hoteltext könnte etwa so aussehen:

„Unser Haus liegt ideal für Geschäftsreisende und bietet eine hervorragende Anbindung an die wichtigsten Verkehrsknotenpunkte der Stadt.“

Für einen Menschen ist diese Aussage verständlich. Ein KI-System hingegen muss daraus konkrete Informationen ableiten. Wie weit ist das Hotel vom Flughafen entfernt? Wie lange dauert der Weg zur Messe? Welche Verkehrsmittel sind verfügbar?

Oft fehlen diese Fakten im Text oder sie sind nur indirekt formuliert.

Hinzu kommt ein technisches Problem. Viele Websites verstecken Inhalte hinter JavaScript-Interaktionen oder laden sie dynamisch nach. Tabs, Akkordeons oder interaktive Komponenten können dazu führen, dass Informationen im ursprünglichen HTML gar nicht vorhanden sind.

Für Systeme, die Inhalte automatisch analysieren, wird die Extraktion dadurch deutlich schwieriger.

Das Resultat ist eine paradoxe Situation. Obwohl Websites immer mehr Informationen enthalten, sind viele dieser Informationen für Maschinen schlechter zugänglich als nötig.

Prinzip 1: Fakten explizit formulieren

Der wichtigste Schritt in Richtung KI-Lesbarkeit besteht darin, Informationen klar und konkret zu formulieren.

KI-Modelle können implizite Aussagen zwar interpretieren, aber sie arbeiten deutlich zuverlässiger mit expliziten Fakten.

Ein Beispiel aus der Hotellerie zeigt den Unterschied.

Eine typische Marketingformulierung lautet:

„Das Hotel liegt in idealer Lage für Geschäftsreisende.“

Für eine Maschine ist diese Aussage schwer verwertbar. Sie enthält keine messbaren Informationen.

Eine faktenbasierte Version könnte stattdessen so aussehen:

Entfernung zur Messe Düsseldorf: 800 Meter
Entfernung zum Flughafen Düsseldorf: 6 Kilometer
Fußweg zum Hauptbahnhof: 4 Minuten

Solche Aussagen können von KI-Systemen direkt übernommen werden. Sie lassen sich leicht vergleichen, in Antworten integrieren oder als Begründung für Empfehlungen nutzen.

Das bedeutet nicht, dass Marketingtexte verschwinden müssen. Aber wichtige Informationen sollten zusätzlich in einer Form vorliegen, die eindeutig interpretierbar ist.

Prinzip 2: Inhalte chunkbar machen

Da viele KI-Systeme Webseiten in kleinere Textsegmente zerlegen, spielt die Struktur eines Artikels eine wichtige Rolle.

Lange Fließtexte ohne klare Unterteilung erschweren die Verarbeitung. Wenn mehrere Themen in einem einzigen Absatz vermischt werden, ist es für ein System schwierig zu erkennen, welche Information zu welcher Frage gehört.

Hilfreich ist deshalb eine klare thematische Gliederung.

Zwischenüberschriften, kurze Abschnitte und logisch getrennte Themenblöcke erleichtern die Segmentierung.

Ein Abschnitt über Check-in-Zeiten sollte beispielsweise nicht gleichzeitig Informationen über Parkplätze, Frühstück und Zimmerausstattung enthalten. Jeder Themenblock sollte eine klar erkennbare Frage beantworten.

Diese Struktur ist nicht nur für Maschinen hilfreich. Auch menschliche Leser profitieren davon, weil Informationen schneller gefunden werden können.

Prinzip 3: Entitäten klar benennen

Ein zentrales Konzept moderner KI-Systeme ist die Arbeit mit Entitäten. Darunter versteht man eindeutig identifizierbare Dinge wie Personen, Orte, Organisationen oder Produkte.

Viele Texte verwenden jedoch verkürzte Formulierungen oder Pronomen, die für Maschinen schwerer einzuordnen sind.

Ein Satz wie „Unser Haus liegt im Zentrum“ ist aus Sicht eines Lesers unproblematisch. Für ein System, das mehrere Dokumente kombiniert, kann er jedoch unklar sein. Welches Haus ist gemeint? In welcher Stadt befindet es sich?

Eine präzisere Formulierung könnte lauten:

„Das Hotel Motel One Düsseldorf Hauptbahnhof liegt im Stadtzentrum von Düsseldorf.“

Solche Sätze enthalten klare Entitäten und lassen sich leichter in Wissensstrukturen integrieren.

Gerade in Branchen wie Reisen, Luftfahrt oder Tourismus ist diese Präzision besonders wichtig. Flughäfen, Städte und Hotels haben oft ähnliche Namen, die ohne Kontext schwer zu unterscheiden sind.

Prinzip 4: Strukturierte Daten sinnvoll einsetzen

Strukturierte Daten sind seit Jahren ein fester Bestandteil der Suchmaschinenoptimierung. Schema.org-Markups helfen Suchmaschinen, Inhalte besser zu verstehen und können zusätzliche Darstellungen in den Suchergebnissen ermöglichen.

Auch für KI-Systeme bleiben sie relevant.

Schemas für Hotels, Produkte, Organisationen oder Veranstaltungen liefern strukturierte Informationen, die leicht extrahiert werden können. Sie definieren Eigenschaften wie Adresse, Öffnungszeiten oder Preise in einer standardisierten Form.

Allerdings sollte man sich nicht darauf verlassen, dass Markup allein ausreicht.

Viele KI-Systeme analysieren in erster Linie den sichtbaren Text einer Seite. Strukturierte Daten sind eine hilfreiche Ergänzung, ersetzen aber keine klar formulierten Inhalte.

Die beste Strategie besteht deshalb darin, beides zu kombinieren. Wichtige Fakten sollten sowohl im Text als auch im strukturierten Markup vorhanden sein.

Prinzip 5: Inhalte agentenfreundlich gestalten

Mit dem Aufstieg von KI-Agenten entsteht eine neue Perspektive auf Webinhalte. Sie werden nicht nur gelesen, sondern auch verarbeitet.

Formate, die klare Fragen und Antworten enthalten, sind für solche Systeme besonders geeignet.

Dazu gehören beispielsweise FAQ-Abschnitte, definierte Listen oder strukturierte Tabellen.

Eine Frage-Antwort-Struktur kann etwa so aussehen:

Frage: Wie weit ist das Hotel vom Flughafen Düsseldorf entfernt?

Antwort: Das Hotel liegt sechs Kilometer vom Flughafen Düsseldorf entfernt. Die Fahrt mit dem Taxi dauert etwa zehn Minuten.

Solche Formate lassen sich leicht extrahieren und direkt in Antworten integrieren.

Auch Vergleichstabellen oder übersichtliche Listen von Eigenschaften sind hilfreich. Sie bündeln Informationen in einer Form, die sowohl für Menschen als auch für Maschinen leicht interpretierbar ist.

Ein mögliches Übergangsformat: AI-ready Sections

Ein Ansatz, der in Zukunft an Bedeutung gewinnen könnte, ist die Einführung spezieller Informationsbereiche innerhalb von Webseiten.

Diese Abschnitte enthalten kompakte, strukturierte Fakten über ein Produkt, einen Ort oder eine Dienstleistung. Man könnte sie als „AI-ready Sections“ bezeichnen.

Ein Hotel könnte beispielsweise einen Bereich mit folgenden Kategorien enthalten:

Key Facts
Location
Amenities
Check-in und Check-out
Policies

Jeder Abschnitt enthält klare, kurze Aussagen, die wichtige Informationen zusammenfassen.

Für KI-Systeme entsteht dadurch eine Art Mini-Wissensbasis innerhalb der Seite. Statt lange Texte analysieren zu müssen, finden sie die wichtigsten Fakten bereits strukturiert vor.

Die Rolle von WebMCP

Langfristig sollen Standards wie WebMCP genau dieses Problem lösen.

Das Model Context Protocol verfolgt die Idee, dass Websites ihre Funktionen direkt als strukturierte Tools anbieten können. Ein KI-Agent könnte dann beispielsweise eine Flugverfügbarkeit abfragen oder ein Hotel nach freien Zimmern durchsuchen, ohne HTML analysieren zu müssen.

Die Kommunikation würde über definierte Schnittstellen erfolgen, ähnlich wie bei APIs.

Für viele Anwendungsfälle wäre das deutlich zuverlässiger als das heutige Parsing von Webseiten.

Doch selbst wenn solche Standards technisch verfügbar sind, bedeutet das nicht, dass sie sofort überall eingesetzt werden.

Warum der Übergang Zeit braucht

Die Geschichte des Webs zeigt, dass neue Standards selten über Nacht verbreitet werden. Ich habe etwas ausführlicher in diesem Beitrag darüber geschrieben.

Browser müssen neue Technologien integrieren, Entwickler müssen sie implementieren und Unternehmen müssen interne Prozesse anpassen. Gerade größere Organisationen benötigen oft lange Vorlaufzeiten, um neue Systeme zu planen, zu testen und rechtlich abzusichern.

In vielen Branchen kommen zusätzliche Faktoren hinzu. Datenschutz, Sicherheitsanforderungen und komplexe IT-Landschaften können die Einführung neuer Schnittstellen deutlich verlangsamen.

Das bedeutet, dass eine Übergangsphase unvermeidlich ist.

Selbst wenn WebMCP technisch verfügbar wird, wird es Jahre dauern, bis ein großer Teil der Websites entsprechende Funktionen anbietet.

Genau diese Phase ist die Zeit vor WebMCP.

Die Art und Weise, wie Informationen im Web genutzt werden, verändert sich gerade grundlegend.

Während klassische Suchmaschinen hauptsächlich Dokumente ranken, extrahieren KI-Systeme Wissen aus Webseiten. Inhalte werden zunehmend als Bausteine für Antworten verwendet.

Für Websitebetreiber bedeutet das eine neue Aufgabe. Informationen müssen nicht nur gut lesbar sein, sondern auch klar strukturiert und eindeutig formuliert.

Standards wie WebMCP könnten in Zukunft eine direkte Schnittstelle zwischen Websites und KI-Agenten schaffen. Doch bis diese Technologien flächendeckend eingesetzt werden, bleibt HTML die wichtigste Kommunikationsform.

Wer seine Inhalte schon heute faktenbasiert formuliert, logisch strukturiert und semantisch klar aufbaut, schafft die Grundlage für diese neue Form der Sichtbarkeit.

Die Vorbereitung auf WebMCP beginnt deshalb nicht mit einem neuen Protokoll.

Sie beginnt mit besseren Inhalten.