# Was ist ein KI-Telefonassistent? Einfach erklärt

> KI-Telefonassistent einfach erklärt: Definition, Funktionsweise, Abgrenzung zu Anrufbeantworter, IVR und Voicebot, dazu Kosten und DSGVO-Hinweise für KMU.

date: 2026-05-21
author: Florestan Peters
source: https://hi-desk.de/de/blog/was-ist-ein-ki-telefonassistent/

---

# Was ist ein KI-Telefonassistent? Einfach erklärt

Ein KI-Telefonassistent ist eine Software, die eingehende Anrufe selbstständig annimmt, in natürlicher Sprache mit Anrufern spricht, Fragen beantwortet, Termine bucht und Anrufe bei Bedarf an Mitarbeiter weiterleitet. Er funktioniert per Rufumleitung mit jeder bestehenden Telefonnummer, ohne neue Hardware, und ist rund um die Uhr erreichbar.

## Das Wichtigste auf einen Blick

- **Definition:** Ein KI-Telefonassistent ist ein digitaler Gesprächspartner, der Anrufe in Echtzeit annimmt und frei formulierte Anliegen versteht, nicht nur Tastendrücke wie ein Tonband-Menü.
- **Technik:** Drei Bausteine greifen ineinander: Spracherkennung, ein Sprachmodell (LLM) mit Wissensdatenbank und Sprachausgabe. Moderne Systeme antworten in unter einer Sekunde.
- **Einrichtung:** Keine neue Nummer, keine Hardware. Die Anbindung erfolgt per Rufumleitung und ist je nach Anbieter in wenigen Minuten startklar.
- **Kosten:** Monatliche Pakete mit Inklusivminuten, bei HiDesk ab 59 € pro Monat. Deutlich günstiger als Callcenter oder eine zusätzliche Empfangskraft.
- **Rechtslage:** DSGVO-konform bei EU-Verarbeitung und AV-Vertrag. Die Pflicht zur KI-Kennzeichnung nach EU AI Act gilt ab dem 2. August 2026.

## Wie funktioniert ein KI-Telefonassistent?

Technisch laufen bei jedem Anruf drei Schritte in Echtzeit ab:

1. **Spracherkennung (Speech-to-Text):** Das Gesagte des Anrufers wird laufend in Text umgewandelt, oft schon während die Person noch spricht.
2. **Sprachmodell (LLM):** Eine KI versteht das Anliegen, prüft die hinterlegte Wissensdatenbank (FAQ, Preise, Öffnungszeiten) und formuliert eine Antwort. [Über Schnittstellen kann sie dabei Aktionen ausführen](/de/blog/wie-funktioniert-eine-telefon-ki), etwa einen Termin im Kalender buchen.
3. **Sprachausgabe (Text-to-Speech):** Die Antwort wird mit natürlicher Stimme gesprochen.

Entscheidend für ein flüssiges Gespräch ist die Latenz, also die Zeit zwischen der Frage des Anrufers und der ersten gesprochenen Reaktion. Gute Systeme bleiben unter rund 800 Millisekunden und zielen auf eine Antwort in unter einer Sekunde. Bei diesem Tempo wirkt der Dialog natürlich, und der Assistent kann sogar erkennen, wenn er unterbrochen wird, und auf die neue Aussage reagieren.

Damit die KI keine erfundenen Auskünfte gibt, arbeiten seriöse Lösungen mit Retrieval-Augmented Generation (RAG). Dabei zieht das Sprachmodell vor jeder Antwort geprüfte Unternehmensdaten aus der Wissensdatenbank heran, statt frei zu raten. Das senkt das Risiko falscher Aussagen deutlich.

Die Wissensdatenbank ist das Herzstück. Sie enthält alles, was der Assistent über Ihr Unternehmen wissen muss: Leistungen, Preise, Öffnungszeiten, Anfahrt, Mitarbeiter, Zuständigkeiten und typische Rückfragen. Manche Anbieter, darunter HiDesk, lesen dazu automatisch Ihre Website aus und erzeugen daraus einen ersten Entwurf, den Sie anschließend ergänzen und korrigieren. So entsteht in kurzer Zeit eine belastbare Grundlage, ohne dass Sie alles von Hand eintippen müssen.

Wichtig ist außerdem das Verhalten bei Unklarheiten. Ein guter Assistent gibt nicht einfach irgendeine Antwort, sondern fragt nach, wenn ein Anliegen mehrdeutig ist, oder verweist ehrlich an einen Menschen, wenn er etwas nicht sicher weiß. Genau dieses kontrollierte Verhalten unterscheidet ein verlässliches System von einem reinen Sprachgenerator.

> Tipp: Hinterlegen Sie typische Rückfragen Ihrer Kunden wörtlich in der Wissensdatenbank. Je konkreter die Quellen, desto präziser und schneller antwortet der Assistent, und desto seltener muss er an einen Menschen weiterleiten.

## Wie wird der Assistent ans Telefon angeschlossen?

Die Anbindung an Ihr Telefon geschieht [per Rufumleitung](/de/blog/rufumleitung-einfach-erklaert) und ist je nach Anschluss in wenigen Schritten erledigt:

1. **Zielnummer erhalten:** Vom Anbieter bekommen Sie eine technische Rufnummer, auf die der Assistent hört.
2. **Umleitung einrichten:** In Ihrer Telefonanlage, FRITZ!Box oder beim Mobilfunkanbieter leiten Sie Anrufe dorthin um.
3. **Umleitungsart wählen:** sofort, verzögert (zum Beispiel nach 15 bis 20 Sekunden, wenn niemand abhebt) oder bei besetzt.
4. **Testanruf machen:** Sie rufen Ihre eigene Nummer an und prüfen, ob der Assistent korrekt abnimmt.

Sie behalten Ihre bestehende Rufnummer, Briefköpfe und Visitenkarten bleiben gültig. Bei vielen Festnetzanschlüssen aktivieren Sie eine verzögerte Umleitung mit einer Tastenfolge wie `*61*Zielnummer#`, die genaue Steuercodes hängen aber vom Anbieter ab.

Diese Logik hat einen praktischen Vorteil: Sie entscheiden selbst, wann der Assistent übernimmt. Tagsüber kann Ihr Team weiter selbst abnehmen, und nur die Anrufe, die nach 15 bis 20 Sekunden niemand entgegennimmt, gehen automatisch an die KI. Außerhalb der Öffnungszeiten leiten viele Betriebe dagegen sofort um, damit kein Anruf mehr ins Leere läuft. So entsteht ein gleitender Übergang zwischen Mensch und Maschine, ohne dass Anrufer ein hörbares Umschalten bemerken.

## Was kann ein KI-Telefonassistent übernehmen?

| Aufgabe | Beispiel |
|---|---|
| Anrufannahme rund um die Uhr | Kein Anruf landet mehr auf der Mailbox, auch nachts und am Wochenende |
| Fragen beantworten | Öffnungszeiten, Preise, Leistungen aus der Wissensdatenbank |
| Termine buchen | Direkt in Calendly, Cal.com, Google Kalender oder Outlook |
| Anrufe weiterleiten | Dringende Anliegen sofort an die richtige Person durchstellen |
| Anliegen dokumentieren | Nach jedem Anruf eine Zusammenfassung per E-Mail oder ins CRM |
| Mehrsprachig telefonieren | Erkennt die Sprache automatisch, zum Beispiel Deutsch und Englisch |

Ein KI-Telefonassistent ersetzt also nicht nur die Mailbox, sondern entlastet das Team bei Routinefragen. Komplexe oder sensible Anliegen reicht er gezielt an Menschen weiter. Wie gut Anrufer das annehmen, beleuchten wir in unserem Beitrag zur [Akzeptanz von KI am Telefon](/de/blog/akzeptanz-ki-am-telefon).

Besonders wertvoll ist die Dokumentation. Nach jedem Gespräch erhält Ihr Team eine strukturierte Zusammenfassung: Wer hat angerufen, worum ging es, welche Rückrufnummer wurde hinterlassen und welcher nächste Schritt ist nötig. So gehen keine Informationen verloren, auch wenn niemand persönlich am Telefon war. Viele Betriebe verbinden diese Zusammenfassungen direkt mit ihrem E-Mail-Postfach oder ihrem CRM, sodass jeder Anruf automatisch nachvollziehbar bleibt.

## Abgrenzung: Anrufbeantworter, IVR, Voicebot, KI-Telefonassistent

| | Anrufbeantworter | IVR ("Drücken Sie die 1") | Klassischer Voicebot | KI-Telefonassistent |
|---|---|---|---|---|
| Führt echte Gespräche | nein | nein | teilweise (Skripte) | ja |
| Versteht freie Sprache | nein | nein | eingeschränkt | ja |
| Bucht Termine | nein | nein | selten | ja |
| Leitet intelligent weiter | nein | ja (starr) | ja (starr) | ja (nach Anliegen) |
| Lernt aus Ihren Daten | nein | nein | nein | ja (Wissensdatenbank) |

Der wesentliche Unterschied liegt im Sprachverständnis. Ein IVR-Menü kennt nur die Tasten 1 bis 9, ein klassischer Voicebot nur die Schlüsselwörter aus seinem Skript. Ein KI-Telefonassistent versteht dagegen frei formulierte Sätze und reagiert flexibel.

Ein Beispiel macht den Unterschied greifbar. Sagt ein Anrufer "Ich wollte fragen, ob Sie morgen Nachmittag noch einen Termin frei haben, am liebsten nach drei", scheitert ein IVR-Menü daran komplett, und ein einfacher Voicebot versteht bestenfalls das Wort "Termin". Ein KI-Telefonassistent erfasst dagegen Tag, Uhrzeit und Wunsch, prüft den Kalender und schlägt einen passenden Slot vor. Den ausführlichen Vergleich finden Sie hier: [KI-Telefonassistent vs. IVR vs. Voicebot](/de/blog/ki-telefonassistent-vs-ivr-voicebot).

## Für wen lohnt sich das?

KI-Telefonassistenten sind vor allem für kleine und mittlere Unternehmen gedacht, die viele gleichartige Anrufe bekommen, aber keine eigene Telefonzentrale haben: Praxen, Kanzleien, Handwerksbetriebe, Werkstätten, Hausverwaltungen, Gastronomie oder Freizeitanbieter. Faustregel: Ab etwa 10 bis 15 Anrufen pro Tag [rechnet sich der Einsatz](/de/blog/wann-lohnt-sich-ki-telefonassistent) fast immer.

Der Hintergrund ist ein verbreitetes Problem: Studien zufolge bleiben in vielen kleinen Betrieben rund ein Fünftel bis weit über die Hälfte der eingehenden Anrufe unbeantwortet, je nach Branche und Auslastung. Brisant ist, dass viele dieser Anrufer kein zweites Mal anrufen, sondern direkt zum nächsten Anbieter wechseln. Jeder verpasste Anruf ist damit potenziell ein verlorener Auftrag.

Je nach Branche sieht der Nutzen unterschiedlich aus. In einer Arztpraxis nimmt der Assistent Terminanfragen entgegen, ohne dass die Empfangskraft ständig den Hörer abnehmen muss. In einer Handwerksfirma fängt er Anrufe ab, während die Monteure auf der Baustelle sind. In der Gastronomie nimmt er Reservierungen auch dann auf, wenn im Service gerade Hochbetrieb herrscht. In all diesen Fällen geht es weniger darum, Personal zu ersetzen, als darum, die Spitzen abzufangen, in denen niemand frei ist.

## Worked Example: Was kostet ein verpasster Anruf?

Rechnen wir ein typisches Beispiel durch. Eine kleine Werkstatt erhält pro Tag rund 40 Anrufe. In Stoßzeiten und in der Mittagspause schafft das Team es nicht, alle anzunehmen, etwa 20 Prozent landen auf der Mailbox, also rund 8 Anrufe täglich.

Angenommen, jeder vierte dieser verpassten Anrufer wäre ein neuer Auftrag mit durchschnittlich 250 € Umsatz gewesen. Das sind 2 verlorene Aufträge pro Tag, also 500 € entgangener Umsatz täglich. Bei 20 Arbeitstagen im Monat ergibt das rund 10.000 € pro Monat, die schlicht nicht zurückrufen.

Ein KI-Telefonassistent, der diese Anrufe annimmt, Anliegen aufnimmt und Termine bucht, kostet im Business-Bereich einen Bruchteil davon. Selbst wenn er nur die Hälfte dieser Anrufe rettet, übersteigt der Nutzen die monatlichen Kosten meist um ein Vielfaches.

Natürlich sind die genauen Zahlen je nach Betrieb anders. Eine Werkstatt mit hochpreisigen Reparaturen verliert pro verpasstem Anruf mehr als ein Friseursalon mit vielen kleinen Terminen. Die Logik bleibt aber identisch: Sobald die Summe der geretteten Aufträge die monatliche Pauschale übersteigt, arbeitet der Assistent wirtschaftlich. Genau deshalb lohnt sich vor der Entscheidung ein kurzer Blick auf das eigene Anrufaufkommen und den durchschnittlichen Auftragswert.

## Was kostet ein KI-Telefonassistent?

Üblich sind monatliche Pakete mit Inklusivminuten. Bei HiDesk startet der Einstieg (Freelancer) bei 59 € pro Monat, der Business-Tarif liegt bei 249 € pro Monat mit 60.000 Credits (rund 1.000 Anrufminuten), darüber kostet die Minute 0,25 €. Zum Vergleich: Ein externes Callcenter kostet bei gleichem Volumen oft ein Vielfaches, eine Teilzeitkraft am Empfang deutlich mehr. Alle Preismodelle im Detail: [Was kostet ein KI-Telefonassistent?](/de/blog/was-kostet-ein-ki-telefonassistent)

## Häufige Fehler bei der Einführung

Beim Start mit einem KI-Telefonassistenten gibt es ein paar typische Stolpersteine, die sich leicht vermeiden lassen:

- **Zu dünne Wissensdatenbank:** Wer nur ein paar Stichworte hinterlegt, bekommt vage Antworten. Pflegen Sie Öffnungszeiten, Preise und häufige Fragen vollständig ein.
- **Keine klare Eskalationsregel:** Definieren Sie genau, welche Anliegen sofort an einen Menschen weitergeleitet werden, etwa Notfälle oder Beschwerden.
- **Hinweispflicht vergessen:** Anrufer müssen erfahren, dass sie mit einem digitalen Assistenten sprechen. Das ist nicht nur fair, sondern ab August 2026 auch gesetzlich verlangt.
- **Umleitung nicht getestet:** Ohne Testanruf bleibt unklar, ob die Rufumleitung wirklich greift. Prüfen Sie sofort-, verzögerte und Besetzt-Umleitung einzeln.

## Ist das DSGVO-konform?

Ja, wenn der Anbieter die Daten in Deutschland oder der EU verarbeitet, einen Auftragsverarbeitungsvertrag nach Artikel 28 DSGVO (AVV) bereitstellt und Anrufer transparent informiert werden. Werden Gespräche aufgezeichnet oder transkribiert, braucht es zu Beginn des Anrufs einen klaren Hinweis darauf, und die Daten sollten nach einer angemessenen Frist gelöscht werden. Worauf es im Detail ankommt, lesen Sie hier: DSGVO und Telefon-KI.

Praktisch sollten Sie auf drei Punkte achten. Erstens den Verarbeitungsort: Liegen die Server in Deutschland oder der EU, vereinfacht das die rechtliche Bewertung erheblich. Zweitens die Löschfristen: Aufzeichnungen und Transkripte sollten nicht unbegrenzt gespeichert, sondern nach einer angemessenen Frist automatisch gelöscht werden. Drittens die Rechtsgrundlage: In der Praxis stützt sich die Verarbeitung meist auf eine Einwilligung, teils auf die Vertragsanbahnung oder ein berechtigtes Interesse. Ein vollständiger AV-Vertrag ist dabei keine Formsache, denn ein fehlender Vertrag ist selbst schon ein Verstoß.

Hinzu kommt der EU AI Act: Nach Artikel 50 müssen Anrufer ab dem 2. August 2026 darüber informiert werden, dass sie mit einem KI-System sprechen. Diese Transparenzpflicht gilt unabhängig davon, ob das System als Hochrisiko eingestuft ist. Verstöße können mit Bußgeldern von bis zu 15 Millionen Euro oder 3 Prozent des weltweiten Jahresumsatzes geahndet werden. Mehr dazu in unserem Beitrag zum EU AI Act und Telefon-KI.

## Fazit und nächster Schritt

Ein KI-Telefonassistent nimmt Anrufe rund um die Uhr an, beantwortet wiederkehrende Fragen, bucht Termine und leitet wichtige Anliegen gezielt weiter, alles per einfacher Rufumleitung und ohne neue Hardware. Für KMU mit hohem Anrufaufkommen ist er oft die wirtschaftlichere Alternative zu Mailbox, Callcenter oder einer zusätzlichen Empfangskraft.

Wenn Sie hören möchten, wie sich das anfühlt, testen Sie es direkt: Probieren Sie unsere [kostenlose Live-Demo](https://hi-desk.de/de/live-demo/) und sprechen Sie selbst mit einem KI-Telefonassistenten.

Genannte Marken sind Eigentum ihrer jeweiligen Inhaber.
