Nicht jede Aufgabe braucht eigenen Code, und nicht jeder Agent gehört auf eine Plattform. Wer die richtige Ebene wählt, spart Geld, Zeit und Nerven. Wer sich vergreift, baut entweder Schatten-IT oder ein Millionengrab.
Seit ChatGPT in jedem Büro angekommen ist, lautet die Frage in den meisten Mittelständlern nicht mehr ob KI-Agenten eingesetzt werden, sondern wie tief man sie in die eigenen Prozesse einbaut. Genau hier entstehen die teuren Fehler. Ein Vertriebsleiter testet ChatGPT, ist begeistert und lässt eine Agentur für sechsstellige Beträge einen maßgeschneiderten Agenten programmieren, der am Ende dasselbe leistet wie eine Plattformlösung für ein paar hundert Euro im Monat. Umgekehrt baut eine Fachabteilung still und heimlich ein Geflecht aus privaten ChatGPT-Accounts auf, an dem IT und Datenschutz komplett vorbeilaufen.
Beide Fehler haben dieselbe Ursache: Es fehlt ein gemeinsames Bild davon, welche Stufen es überhaupt gibt und wann welche sinnvoll ist. Das folgende Modell sortiert die Optionen entlang zweier Achsen, die in jeder Realisierung gegeneinander stehen.

Je höher die Ebene, desto besser skaliert und kontrolliert der Betrieb – desto aufwendiger wird aber auch die Umsetzung. Die Kunst liegt nicht im Maximum, sondern im passenden Minimum.
E1 — Der Assistant
Der Einstieg. Ein Mensch und ein Chatfenster.
Auf der ersten Ebene arbeitet ein Mitarbeiter direkt mit einem Sprachmodell. Werkzeuge wie ChatGPT, Claude Cowork oder Langdock beantworten Fragen, formulieren E-Mails, fassen Dokumente zusammen und entwerfen Angebote. Es gibt keine feste Verdrahtung mit anderen Systemen, der Mensch bleibt die Steuerzentrale.
Der Reiz liegt in der Geschwindigkeit. Eine Einarbeitung ist kaum nötig, der Nutzen ist am ersten Tag spürbar. Der Preis dafür ist mangelnde Skalierbarkeit: Jeder löst seine Aufgabe etwas anders, Wissen bleibt in einzelnen Chatverläufen hängen und entweicht der Organisation. Sobald Mitarbeiter ohne Freigabe private Accounts nutzen, entsteht Schatten-IT, in der sensible Daten unkontrolliert verarbeitet werden. Diese Ebene ist ideal, um im Alltag Zeit zu sparen – aber keine Grundlage für einen verlässlichen, wiederholbaren Geschäftsprozess.
E2 — Die Plattform
Der eingehegte Agent. Governance ab Werk.
Auf der zweiten Ebene zieht der Agent in ein bestehendes Software-Ökosystem ein. Microsoft Copilot Studio oder Salesforce Agentforce erlauben es, Agenten innerhalb der Suiten zu bauen, die ein Unternehmen ohnehin nutzt. Der Agent kennt die Daten im CRM, hält sich an Rollen und Rechte und protokolliert sauber, was er tut.
Der große Vorteil ist Governance ohne eigenen Aufwand: Datenschutz, Auditierbarkeit und Benutzerverwaltung sind Teil der Plattform. Der Preis ist Abhängigkeit. Man bewegt sich in den Grenzen und Lizenzmodellen des Anbieters, und ein späterer Wechsel ist teuer. Diese Ebene passt überall dort, wo ein Prozess sauber innerhalb eines führenden Systems bleiben soll und Kontrolle wichtiger ist als Flexibilität.
E3 — Der Orchestrierer
Der Verbinder. Wo getrennte Systeme zusammenfinden.
Die dritte Ebene löst das Problem, das im Mittelstand am häufigsten weh tut: Selten liegen alle Daten in einem System. Es gibt ein ERP, ein CRM, ein Ticketsystem, eine Buchhaltung und ein paar Excel-Inseln. Werkzeuge wie Make, n8n oder Lindy verbinden diese Systeme über Schnittstellen und schieben die KI als Intelligenz dazwischen.
Ein Beispiel: Eine Anfrage trifft per E-Mail ein, der Orchestrierer liest sie aus, prüft den Kunden im CRM, erzeugt ein Angebot, legt eine Aufgabe im Projektsystem an und meldet sich zurück. Diese hybride Orchestrierung verbindet Bestandssysteme API-getrieben mit KI und ist in den meisten Fällen der wirtschaftlich klügste Punkt – deutlich mächtiger als eine reine Plattform, ohne die Kosten einer Eigenentwicklung. Sie passt, wann immer System A sauber mit System B sprechen soll.
E4 — Der Code
Die Maßanfertigung. Nur für das eigene Kernprodukt.
Auf der höchsten Ebene wird der Agent von Grund auf programmiert, etwa mit dem Agent SDK oder LangGraph. Hier ist jede Verzweigung, jede Logik und jedes Verhalten frei gestaltbar. Diese Freiheit kostet jedoch viel – in Entwicklung, Wartung und Betrieb.
Eigener Code lohnt sich nur dann, wenn der Agent selbst zum Differenzierungs-Asset wird, also zum geistigen Eigentum, das ein Unternehmen vom Wettbewerb abhebt. Für RITA, unsere sprachbasierte Pflegeassistenz, ist das genau der Fall: Dort ist die Agentenlogik Teil des Produkts. Für die meisten internen Prozesse eines Mittelständlers ist diese Ebene überdimensioniert. Sie ist perfekt, wenn die Antwort auf die Frage „Warum bauen wir das selbst?" lautet: „Weil das unser Geschäftsmodell ist."
Die teuersten Projekte sind selten die mit zu wenig Technik. Es sind die mit zu viel davon.
Die vier Ebenen auf einen Blick
| Ebene | Charakter | Stärke | Risiko | Passt für |
|---|---|---|---|---|
| E1 Assistant | Mensch + Chat | Sofort nutzbar | Silos, Schatten-IT | Zeit im Alltag sparen |
| E2 Plattform | Agent im Ökosystem | Governance ab Werk | Anbieter-Lock-in | Prozess bleibt im System |
| E3 Orchestrierer | Verbinder mit KI | Bestes Preis-Leistungs-Verhältnis | Wartung der Schnittstellen | System A spricht mit System B |
| E4 Code | Maßanfertigung | Volle Freiheit | Hohe Kosten | Eigenes Geschäftsmodell |
Die Faustregel ist einfach: die niedrigste Ebene wählen, die den Prozess noch trägt – unter Berücksichtigung der bestehenden IT-Architektur. Wer mehr über die Mechanik dahinter wissen will, findet die Grundlagen im kostenlosen Kurs KI-Agenten & MCP verstehen.
Wo steht Ihr Unternehmen?
Die richtige Ebene finden – nicht die höchste
In einem kurzen Gespräch ordnen wir Ihre konkreten Anwendungsfälle in dieses Modell ein und zeigen den nächsten sinnvollen Schritt – oft eine Ebene tiefer als zunächst gedacht.
Kostenloses Erstgespräch anfragen →