
EBITDA kennt jeder der schon mal in einem Finanz-Meeting saß. Earnings Before Interest, Taxes, Depreciation and Amortization. Die Kennzahl die zeigt wie profitabel ein Unternehmen im Kerngeschäft ist, bevor Finanzierungsstruktur und Buchhaltungstricks ins Spiel kommen.
Jetzt gibt es einen neuen Begriff der gerade in Tech- und Finance-Kreisen die Runde macht: EBITTDA. Ein zusätzliches T für Token. Earnings Before Interest, Taxes, Token costs, Depreciation and Amortization.
Klingt nach Scherz. Ist es nicht.
Was sind Tokens überhaupt?
Wenn ein Mitarbeiter ChatGPT, Claude oder Gemini eine Frage stellt, verarbeitet das Modell die Anfrage in sogenannten Tokens. Ein Token entspricht ungefähr vier Zeichen Text. Eine kurze Anfrage kostet ein paar Dutzend Tokens, eine komplexe Analyse mit langem Kontext schnell mehrere Tausend.
Für ein einzelnes Gespräch kaum spürbar. Hochgerechnet auf hunderte Mitarbeiter, tausende Anfragen täglich, über Wochen und Monate, entstehen Beträge die in keiner ursprünglichen Budgetplanung standen.
Wenn das Limit fehlt: 500 Millionen Dollar in einem Monat
Es gibt Unternehmen die KI-Systeme für alle Mitarbeiter freischalten weil sie an die Produktivitätsgewinne glauben. Prinzipiell richtig gedacht. Das Problem entsteht wenn dabei kein Ausgabelimit gesetzt wird.
Das bekannteste Beispiel: Laut einem Axios-Bericht hat ein bis heute nicht namentlich bekanntes Unternehmen in einem einzigen Monat 500 Millionen US-Dollar für Claude AI ausgegeben, weil schlicht keine Nutzungslimits gesetzt wurden. Keine böse Absicht. Keine missbräuchliche Nutzung. Einfach kein Deckel auf dem Topf. Quelle: Android Authority
Anthropic bietet Enterprise-Controls mit Admin-Dashboards, Limits pro Nutzer und Compliance-Tools. Diese müssen aber aktiv konfiguriert werden. In diesem Fall waren sie es nicht.
Weitere echte Fälle
Das ist kein Einzelfall. Die Liste wird länger:
- Peter Steinberger, Gründer von OpenClaw und mittlerweile Mitarbeiter bei OpenAI, hat öffentlich bekanntgegeben dass sein dreiköpfiges Team über 1,3 Millionen US-Dollar in einem einzigen Monat für Token ausgegeben hat, während sie eine Suite von Agentic-AI-Tools betrieben. Quelle: Tom's Hardware
- Uber hat nach Aussagen des neuen COO Andrew Macdonald das gesamte KI-Budget für 2026 in nur vier Monaten aufgebraucht. Die Token-Kosten haben die Produktivitätsgewinne nicht gerechtfertigt.
- Microsoft hat intern Claude-Code-Lizenzen massiv reduziert nachdem die Nutzungskosten explodierten. Einzelne Engineers generierten zwischen 500 und 2.000 US-Dollar monatliche KI-Kosten pro Person. Quelle: Tech Startups
- Meta hat interne Leaderboards eingeführt die Mitarbeiter nach Token-Verbrauch rankten, um KI-Nutzung zu fördern. Das Ergebnis: massenhafter unkontrollierter Einsatz den man inzwischen "Tokenmaxxing" nennt. Quelle: Tom's Hardware
- Und das Gesamtbild: Laut Ramp-Ökonom Ara Khazarian gibt das durchschnittliche Unternehmen heute 13x mehr für KI-Tokens aus als noch im Januar 2025. Quelle: Derek Thompson
Die häufigsten Fettnäpfchen
Token-Kosten ohne Limit sind nur eine von vielen Stellen wo KI-Ausgaben unkontrolliert wachsen. Hier sind die häufigsten Fehler die wir sehen:
- Falsch aufgesetzte Systeme mit offenem Zugang
API-Zugänge die öffentlich erreichbar sind oder intern ohne Authentifizierung laufen. Jeder Aufruf kostet. Wenn niemand kontrolliert wer zugreift und wie oft, läuft die Uhr unkontrolliert. - Schlecht gebaute Agents die unnötig Tokens verbrennen
Ein Agent der bei jeder Anfrage den gesamten Konversationsverlauf mitschickt obwohl nur ein kleiner Teil relevant wäre. Oder der fünf API-Calls macht wo einer gereicht hätte. Schlechtes Prompt-Design multipliziert sich mit jedem Aufruf. - Fehlende Strategie und schlecht geschulte Mitarbeiter
Mitarbeiter die nicht wissen wie man effizient promptet, schreiben lange unstrukturierte Anfragen die das Modell mehrfach neu anlaufen lassen. Das kostet, und bringt oft schlechtere Ergebnisse als eine präzise formulierte Frage. - KI als Flat-Fee-SaaS behandeln
Viele Unternehmen haben KI-Tools 2024 und 2025 wie normale Software-Abonnements eingeplant. Sie haben unterschätzt wie stark nutzungsbasierte Preisgestaltung mit Modellwahl, Kontextlänge und autonomen Agents skaliert. - Sich gar nicht mit KI befassen
Das andere Extrem: Unternehmen die das Thema komplett ignorieren während die Konkurrenz Prozesse automatisiert. Token-Kosten entstehen hier zwar nicht, aber die Opportunitätskosten wachsen jeden Monat. - Warten bis die Technologie fertig ist
Die Technologie wird nie fertig sein. Wer wartet verliert den Lernvorsprung und kauft sich in zwei Jahren unter doppeltem Druck ein.
Was das für die Unternehmenssteuerung bedeutet
EBITTDA ist noch kein offizieller Standard. Aber die Diskussion dahinter ist real: KI-Token-Kosten sind operativ, wiederkehrend und skalieren mit der Nutzung. Sie gehören in jede ernsthafte Budgetplanung, genau wie Cloud-Kosten es vor zehn Jahren getan haben.
Wer heute ein KI-Rollout plant ohne Token-Budgets, Spending-Limits und Monitoring aufzusetzen, plant unvollständig.
Was man konkret tun kann
- Ausgabelimits setzen, auf Plattform-Ebene und pro Team. Die meisten Anbieter bieten das nativ an, es muss nur aktiv konfiguriert werden.
- Nutzung monitoren: wer nutzt wie viel, für welche Aufgaben, mit welchem Ergebnis.
- Prompt-Qualität trainieren: ein gut gebauter Prompt kostet weniger und liefert bessere Ergebnisse als drei schlechte.
- Agents und Automatisierungen regelmäßig auf Token-Effizienz prüfen, besonders wenn sie oft laufen.
- KI-Ausgaben als eigene Kostenkategorie führen, nicht in sonstige IT versenken.
- Günstigere Modelle für Routineaufgaben nutzen. Nicht jede simple Anfrage braucht das leistungsstärkste Modell (es gibt auch grandiose open source Modelle)
EBITTDA ist ein Witz der keiner ist. Token-Kosten sind real, sie skalieren schnell und sie überraschen CFOs die nicht damit gerechnet haben.
Wer KI ernst nimmt, nimmt auch die Kosten ernst. Nicht um weniger zu nutzen, sondern um smart zu nutzen.
— Robert