# Wenn die KI Dinge erfindet: Halluzinationen am Telefon verhindern

> Halluzinationen bei der Telefon-KI verhindern: Was sie sind, warum sie am Telefon kritisch sind und sechs konkrete Maßnahmen, damit die KI nichts erfindet.

date: 2026-05-29
author: Florestan Peters
source: https://hi-desk.de/de/blog/telefon-ki-halluzinationen-verhindern/

---

# Wenn die KI Dinge erfindet: Halluzinationen am Telefon verhindern

Eine Halluzination ist eine Antwort, die überzeugend klingt, aber falsch oder frei erfunden ist. Bei einer Telefon-KI ist das besonders heikel, weil der Anrufer die gesprochene Auskunft sofort glaubt und danach handelt. Verhindern lässt sich das durch eine gepflegte Wissensdatenbank, klare Grenzen, Rückfragen statt Raten, Quellenbindung an hinterlegte Inhalte und eine Eskalation an einen Menschen, sobald die KI unsicher wird.

## Das Wichtigste auf einen Blick

- **Halluzination heißt: erfunden, nicht gelogen.** Das Sprachmodell füllt eine Wissenslücke mit der statistisch wahrscheinlichsten Formulierung. Es weiß nicht, dass die Antwort falsch ist, und klingt deshalb genauso sicher wie bei einer korrekten Auskunft.
- **Am Telefon fehlt die Korrekturmöglichkeit.** Es gibt keine Quelle zum Nachklicken und kein Zurückscrollen. Das gesprochene Wort wird sofort als Tatsache aufgenommen.
- **Die wirksamste Leitplanke heißt Quellenbindung (RAG).** Antwortet die KI nur aus geprüften, hinterlegten Inhalten statt aus ihrem allgemeinen Trainingswissen, sinkt das Erfinden drastisch.
- **Die richtige Antwort lautet oft: nachfragen oder weiterleiten.** Eine gut eingestellte KI sagt im Zweifel "Das kläre ich für Sie" statt eine plausible Zahl zu raten.
- **Falsche Auskünfte sind ein Haftungsrisiko.** Gerichte rechnen die Aussage der KI dem Unternehmen zu, nicht der Software.

## Was eine Halluzination technisch ist

Ein Sprachmodell erzeugt Sprache nicht, indem es Fakten nachschlägt, sondern indem es das jeweils wahrscheinlichste nächste Wort vorhersagt. Solange die richtige Antwort im Trainingswissen gut belegt ist, funktioniert das zuverlässig. Fehlt die konkrete Information aber, füllt das Modell die Lücke trotzdem, mit der plausibelsten Formulierung statt mit einem Eingeständnis.

Genau das ist eine Halluzination: eine flüssig formulierte, überzeugend klingende, aber inhaltlich erfundene Antwort. Das Modell erkennt den Fehler nicht selbst, weil es keinen internen Faktencheck hat. Es unterscheidet nicht zwischen "weiß ich sicher" und "rate ich gerade".

Hinzu kommt ein Stellschrauben-Effekt: Generative Modelle haben einen Kreativitätsparameter (die sogenannte Temperatur). Bei hohen Werten formuliert die KI freier und erfindet eher, bei niedrigen Werten bleibt sie nüchtern und nah an den Vorgaben. Für eine Telefon-KI, die Auskünfte gibt, gehört dieser Wert niedrig eingestellt, nicht hoch.

Es lohnt sich, drei Typen von Halluzination zu unterscheiden, weil jeder einen anderen Hebel braucht. Erstens die erfundene Faktenangabe: Die KI nennt einen Preis, eine Frist oder eine Zahl, die nirgends hinterlegt ist. Zweitens die plausible Verwechslung: Die KI vermischt zwei korrekte Inhalte, etwa die Öffnungszeiten von zwei Standorten. Drittens die überdehnte Zusage: Die KI sagt etwas verbindlich zu ("Das machen wir kostenlos"), wofür es keine Grundlage gibt. Gegen alle drei hilft dieselbe Grundregel: Antworte nur aus dem, was belegt ist, und sage sonst offen, dass du es nicht weißt.

## Warum Halluzinationen am Telefon kritisch sind

Im Chat kann ein Nutzer eine zweifelhafte Antwort prüfen, eine Quelle anklicken oder noch einmal nachfragen. Am Telefon fällt das weg. Die Antwort kommt als gesprochenes Wort, klingt sicher und wird sofort als Tatsache aufgenommen.

Nennt die KI einen falschen Preis, eine erfundene Öffnungszeit oder einen Termin, den es nicht gibt, entstehen daraus direkt verärgerte Kunden, Fehlfahrten oder falsche Zusagen. Es gibt am Telefon kein "siehe Seite 2" und keine sichtbare Unsicherheit, an der der Anrufer stutzig werden könnte.

Deshalb braucht eine Telefon-KI strengere Leitplanken als ein Chatbot. Wie das Sprachmodell technisch zu seinen Antworten kommt und warum eine gute Datenbasis so wichtig ist, lesen Sie in [Wie funktioniert eine Telefon-KI](/de/blog/wie-funktioniert-eine-telefon-ki).

## Chat gegen Telefon: warum das Risiko anders liegt

Die folgende Gegenüberstellung macht greifbar, warum dasselbe Sprachmodell am Telefon mehr Disziplin braucht als im Webchat. Es ist nicht das Modell, das sich unterscheidet, sondern die Situation, in der es antwortet.

| Aspekt | Im Webchat | Am Telefon |
|---|---|---|
| Quelle prüfbar | Link anklickbar, Text sichtbar | nur gesprochenes Wort, keine Quelle |
| Korrektur möglich | Zurückscrollen, nachlesen | Antwort ist sofort "weg" |
| Unsicherheit erkennbar | vager Wortlaut fällt beim Lesen auf | sichere Stimme verdeckt Unsicherheit |
| Tempo | Anrufer liest in eigenem Takt | Antwort kommt in Echtzeit, kein Zögern |
| Folge eines Fehlers | oft Nachfrage im selben Chat | Fehlfahrt, Fehltermin, falsche Zusage |

Das Telefon nimmt dem Anrufer also genau die Werkzeuge, mit denen er im Chat eine Halluzination entlarven könnte. Eine sichere Stimme klingt am Hörer wie Kompetenz, auch wenn der Inhalt frei erfunden ist. Genau deshalb verschiebt sich die Verantwortung von "der Nutzer wird es schon merken" zu "das System darf gar nicht erst erfinden".

## Was eine falsche Auskunft kosten kann

Dass eine erfundene Auskunft kein theoretisches Problem ist, zeigt der bekannteste Fall: 2024 verurteilte ein Tribunal in British Columbia die Fluggesellschaft Air Canada zu Schadenersatz, weil deren Chatbot einem Kunden eine Rückerstattungsregel zugesagt hatte, die es so nie gab. Das Gericht wies das Argument, der Chatbot sei eine eigenständige Einheit, ausdrücklich zurück: Das Unternehmen hafte für alle Auskünfte auf seiner Website, egal ob statische Seite oder Bot.

Der Streitwert war klein (umgerechnet rund 812 kanadische Dollar, davon etwa 651 Dollar reine Preisdifferenz), die Botschaft aber groß: Eine KI-Auskunft bindet das Unternehmen. Was die KI am Telefon zusagt, gilt im Zweifel als Ihre Zusage.

> Behandeln Sie jede Auskunft Ihrer Telefon-KI so, als hätte ein Mitarbeiter sie persönlich gegeben. Genau so sehen es Gerichte und Kunden auch.

## Sechs Maßnahmen gegen Halluzinationen

| # | Maßnahme | Was sie bewirkt |
|---|---|---|
| 1 | Gepflegte Wissensdatenbank | Die KI antwortet nur aus geprüften, aktuellen Inhalten statt aus allgemeinem Wissen. |
| 2 | Klare thematische Grenzen | Fragen außerhalb des Zuständigkeitsbereichs werden abgelehnt statt frei beantwortet. |
| 3 | Rückfrage statt Raten | Bei Unklarheit fragt die KI nach, statt eine Annahme zu treffen. |
| 4 | Quellenbindung (RAG) | Antworten werden an hinterlegte Inhalte gekoppelt, nicht frei generiert. |
| 5 | Eskalation an einen Menschen | Bei Unsicherheit oder heiklen Themen leitet die KI an einen Mitarbeiter weiter. |
| 6 | Keine verbindlichen Zusagen ohne Datenbasis | Preise, Fristen und Termine kommen nur aus dem System, nie aus Schätzung. |

Die wirksamste dieser Maßnahmen ist Nummer vier. Quellenbindung wird technisch über Retrieval-Augmented Generation (RAG) umgesetzt: Bevor die KI antwortet, sucht das System die passenden Inhalte aus Ihrer Wissensbasis heraus und gibt sie dem Modell als Grundlage mit. Das Modell formuliert dann aus diesen Belegen, statt aus dem Gedächtnis zu raten. Fachlich beschreibt man das als "Open-Book-Prüfung" statt Prüfung aus dem Kopf.

Wichtig ist die Voraussetzung: RAG senkt das Erfinden nur dann zuverlässig, wenn die Wissensbasis selbst sauber, aktuell und kuratiert ist. Steht ein veralteter Preis in der Datenbank, liest die KI ihn brav vor, ganz ohne zu halluzinieren. Garbage in, garbage out gilt auch hier.

Zwei weitere technische Stellschrauben verstärken die Quellenbindung. Erstens die schon erwähnte Temperatur: Wird sie vom kreativen Standardwert nach unten gezogen (in der Praxis nah an null), bleibt das Modell näher an den vorgelegten Belegen und formuliert weniger frei. Zweitens ein klarer Systemauftrag, der dem Modell ausdrücklich vorgibt, nur aus den gelieferten Inhalten zu antworten und bei fehlender Grundlage offen "Das weiß ich hier nicht" zu sagen. Erst das Zusammenspiel aus guten Quellen, niedriger Temperatur und einer klaren Anweisung macht die Antworten verlässlich.

Eine siebte, laufende Maßnahme ist das Mithören im Betrieb: Gesprächszusammenfassungen regelmäßig prüfen und die Wissensdatenbank dort nachschärfen, wo Anrufer Fragen stellen, die noch nicht abgedeckt sind.

## So setzen Sie die Leitplanken auf

1. **Wissensdatenbank befüllen und aktuell halten:** Hinterlegen Sie Öffnungszeiten, Preise, Leistungen und häufige Fragen. Lösungen wie HiDesk lesen dafür Ihre Website ein. Aktualisieren Sie Änderungen sofort, denn die KI ist nur so korrekt wie ihre Quelle.
2. **Themengrenzen definieren:** Legen Sie fest, welche Themen der Assistent beantwortet und bei welchen er ablehnt oder weiterleitet. Alles außerhalb dieser Grenze ist eine potenzielle Halluzinationsquelle.
3. **Rückfrage-Regeln aktivieren:** Stellen Sie ein, dass die KI bei fehlender oder mehrdeutiger Information nachfragt, statt zu raten.
4. **Eskalationspfad festlegen:** Bestimmen Sie eine Rufnummer oder ein Postfach, an das unsichere oder dringende Fälle gehen. Bei Notfällen sollte die Weiterleitung sofort greifen, wie in [Notfall-Anrufe richtig routen](/de/blog/notfall-anrufe-ki-routing) beschrieben.
5. **Im Betrieb nachschärfen:** Werten Sie die Gesprächszusammenfassungen aus und ergänzen Sie fehlende Antworten. So schrumpft die Lückenzone, in der die KI überhaupt erst raten könnte.

Wie eine sauber strukturierte Wissensbasis die Trefferquote anhebt, vertieft der Beitrag zur [Rolle der Wissensdatenbank](/de/blog/ki-telefonassistent-wissensdatenbank).

## Ein konkretes Beispiel

Eine Anruferin fragt eine Zahnarztpraxis: "Übernimmt die Kasse die professionelle Zahnreinigung?" Diese Information steht nicht in der hinterlegten Wissensbasis, weil sie vom individuellen Tarif abhängt.

Eine schlecht eingestellte KI würde aus ihrem Trainingswissen eine plausible Pauschalantwort bilden, etwa "Ja, zweimal im Jahr", und damit halluzinieren. Im schlechtesten Fall kommt die Patientin mit einer falschen Erwartung, es entsteht Streit an der Rezeption.

Eine sauber eingegrenzte KI erkennt dagegen, dass die Frage außerhalb der hinterlegten Inhalte liegt, und antwortet wahrheitsgemäß: "Das hängt von Ihrem Tarif ab und kann ich hier nicht verbindlich sagen. Ich notiere Ihre Rückrufbitte, dann klärt das eine Kollegin für Sie." Keine erfundene Zahl, kein Haftungsrisiko, trotzdem ein nächster Schritt. Genau dieser Unterschied trennt eine verlässliche Telefon-KI von einem riskanten Bot.

Rechnen wir das Risiko grob durch. Eine Praxis nimmt am Tag rund 60 Anrufe entgegen, davon enthalten vielleicht 5 eine Frage außerhalb der hinterlegten Inhalte. Erfindet die KI in nur jedem dritten dieser Fälle eine plausible, aber falsche Antwort, sind das fast 2 Fehlauskünfte pro Tag, in einem Monat also rund 40. Jede davon kann eine Beschwerde, einen Fehltermin oder eine unhaltbare Zusage auslösen. Stellt man dieselbe KI stattdessen so ein, dass sie genau diese 5 Fälle erkennt und sauber weiterleitet, sinkt die Zahl erfundener Auskünfte auf null, ohne dass ein einziger Anruf unbeantwortet bleibt. Das ist der konkrete Wert sauberer Leitplanken.

## Häufige Fehler

- **Temperatur zu hoch einstellen:** Wer das Modell auf "kreativ" laufen lässt, bekommt natürlichere, aber auch erfindungsfreudigere Antworten. Für Auskünfte gehört der Wert niedrig.
- **Wissensbasis einmal füllen und vergessen:** Veraltete Preise und Öffnungszeiten werden von der KI getreu vorgelesen. Das ist keine Halluzination, aber genauso falsch und genauso ärgerlich.
- **Keine Grenzen setzen:** Lässt man die KI jedes Thema beantworten, lädt man Halluzinationen geradezu ein. Klare thematische Grenzen sind kein Funktionsverlust, sondern eine Qualitätszusage.
- **Kein Eskalationspfad:** Ohne definierten Weg zum Menschen muss die KI auch heikle Fälle selbst lösen und rät dann eher.
- **Keine Auswertung:** Wer die Gesprächsprotokolle nicht liest, merkt nie, wo die KI ins Straucheln gerät.

## Verlässlichkeit ist die Eintrittskarte zur Akzeptanz

Halluzinationen sind nicht nur ein Haftungs-, sondern auch ein Akzeptanzthema. Repräsentative Befragungen zum Einsatz von Sprach-KI im deutschen Telefonservice (etwa die MUUUH! Voice-Studie 2025 mit YouGov) zeigen ein klares Muster: Anrufer stehen Voicebots überwiegend offen gegenüber, sobald diese zuverlässig funktionieren, sind aber schnell verprellt, wenn die Auskunft nicht stimmt. Noch nutzt weniger als die Hälfte der Befragten Sprachassistenten regelmäßig, doch rund 40 Prozent trauen ihnen zu, künftig einen großen Teil der Telefonanfragen eigenständig zu lösen.

Der Hebel für dieses Vertrauen ist genau die Disziplin aus diesem Beitrag. Eine KI, die im Zweifel ehrlich nachfragt oder weiterleitet, wirkt kompetenter als eine, die selbstsicher Falsches sagt. Eine einzige erfundene Auskunft kann den Eindruck eines ganzen Systems kippen, während ein sauberes "Das kläre ich für Sie" Vertrauen aufbaut. Wer Halluzinationen eindämmt, optimiert also nicht nur die Rechtssicherheit, sondern auch die Annahme durch die Anrufer.

## Lieber nachfragen als erfinden

Das wichtigste Prinzip ist einfach: Eine gut eingestellte Telefon-KI sagt im Zweifel "Das kläre ich für Sie" und leitet weiter, statt eine Antwort zu erfinden. Damit ist sie verlässlicher als ein starres Menü, das gar nicht erst auf das Anliegen eingeht.

Wie sich der [KI-Assistent von IVR und klassischem Voicebot](/de/blog/ki-telefonassistent-vs-ivr-voicebot) unterscheidet, zeigt dieser Vergleich. Und was ein [KI-Telefonassistent](/de/blog/was-ist-ein-ki-telefonassistent) grundsätzlich ist und kann, lesen Sie in der Übersicht.

Erleben Sie, wie der Assistent bei Unklarheit nachfragt, statt zu raten: [Live-Demo starten](https://hi-desk.de/de/live-demo/).