Wie wählen ChatGPT, Gemini und Co. ihre Quellen aus?
Trainingswissen oder Live-Quellen
Ein Sprachmodell sagt zunächst nur das statistisch nächstwahrscheinliche Wort voraus, basierend auf seinen Trainingsdaten. Ohne zusätzliche Quellen kann das zu Halluzinationen führen. Bei vielen Fragen holen sich moderne KI-Systeme deshalb frische Informationen aus dem Web. Dieser Schritt heißt Grounding (technisch: Retrieval-Augmented Generation, kurz RAG).
Was die Auswahl beeinflusst
Bei kommerziell interessanten Fragen (etwa "bestes Tool für X") führt das System fast immer eine Websuche aus. Es bewertet dann, welche Inhalte die Frage am genauesten beantworten, und zieht daraus seine Antwort. Bevorzugt werden faktenbasierte, klar strukturierte und thematisch passende Quellen. Entscheidend ist nicht ein Linkplatz wie bei Google, sondern ob dein Inhalt die direkte Vorlage für die Antwort liefert.
Welche Quelltypen oft auftauchen
In der Praxis zitieren KI-Systeme häufig Drittquellen statt der Marken-Website: Fachportale und News-Seiten, Wikipedia, Bewertungsportale, Foren wie Reddit und vor allem YouTube. Auch persönliche LinkedIn-Profile werden oft herangezogen. Welche Quelle dominiert, hängt stark vom Thema ab.
Was das für dich heißt
Wer in KI-Antworten vorkommen will, muss dort präsent sein, wo das Modell seine Quellen findet. Es reicht nicht, nur die eigene Website zu optimieren. Du musst die Quellen kennen, die für deine Themen zitiert werden, und gezielt dort Inhalte und Erwähnungen aufbauen.
Wichtigste Erkenntnisse
- KI antwortet aus Trainingswissen oder per Live-Websuche (Grounding/RAG).
- Kommerzielle Fragen lösen meist eine Websuche aus, die sich zu beobachten lohnt.
- Zitiert werden oft Drittquellen: YouTube, Reddit, Fachportale, Wikipedia, LinkedIn.
- Sichtbarkeit entsteht dort, wo das Modell seine Quellen zieht, nicht nur auf deiner Seite.
Du willst wissen, welche Quellen die KI für dein Thema zitiert? VISIBILIS misst die Sichtbarkeit deiner Marke in ChatGPT, Gemini und Google AI Overviews, vergleicht dich mit Wettbewerbern und zeigt, aus welchen Quellen die Antworten entstehen. Kostenlose Demo buchen
Häufige Fragen
Antwortet KI immer aus dem Web?
Nein. Manche Antworten kommen rein aus dem Trainingswissen. Vor allem aktuelle und kommerzielle Fragen lösen aber eine Live-Websuche aus.
Warum zitiert die KI oft nicht meine Website?
Bei generischen Fragen bevorzugen KI-Systeme häufig neutrale Drittquellen wie Fachportale, Listenartikel oder Foren statt der Marken-Website.
Wie finde ich heraus, welche Quellen für mein Thema zählen?
Über Prompt-Monitoring: relevante Fragen mehrfach abfragen und auswerten, welche Domains in den Antworten zitiert werden.