In Gesprächen mit Geschäftsführern im B2B-Mittelstand höre ich immer wieder dasselbe Muster. Ein KI-Pilot wurde gestartet, oft aus dem Vertrieb oder dem Marketing heraus. Eine motivierte Person hat etwas aufgesetzt: automatisierte Angebotserstellung, Lead-Scoring, Recherche-Assistenz. Etwas mit klarem Hebel.
Der Pilot funktioniert. Die Person, die ihn aufgesetzt hat, ist begeistert. Sie ist schneller, präziser, freier im Kopf.
Monate später nutzt niemand sonst dieses Tool. Der Pilot lebt als Solo-Lösung einer einzelnen Person. Die anderen im Team wissen davon. Sie nutzen es nicht. Wenn ich frage warum, kommt: "Wir haben es nie offiziell ausgerollt." Dieses Muster sehe ich nicht einmal, sondern in fast jedem Mittelstand-Projekt, in das ich als Sparringspartner reinkomme.
"Pilots scheitern nicht an Technologie. Sie scheitern daran, dass niemand entschieden hat, was nach dem Piloten passiert."
Warum 95 % der KI-Pilotprojekte nicht skalieren
Die MIT-Studie "The GenAI Divide: State of AI in Business 2025" hat eine Zahl produziert, die seitdem in jeder zweiten KI-Präsentation auftaucht: 95 % der GenAI-Pilotprojekte erreichen keinen messbaren ROI im Regelbetrieb. Die Forscher nennen das den "Pilot-to-Production Chasm" — die Kluft zwischen Test und produktivem Einsatz.
Was in den Studien klar wird: Die Kluft ist kein Technologieproblem. Sie ist ein Organisations- und Führungsproblem. Was ich in den Mittelstandsprojekten sehe, deckt sich exakt damit.
95 %
der GenAI-Pilotprojekte erreichen keinen Produktivbetrieb
MIT GenAI Divide 2025
68 %
der KMU haben keine ausgearbeitete KI-Roadmap
KMU-Studie 2024
19 %
haben einen dedizierten KI-Verantwortlichen oder ein KI-Team
KMU-Studie 2024
Was die Studien als Ursachen nennen — und was ich in der Praxis sehe
Die wiederkehrenden Befunde aus MIT, Deloitte und der IW-Analyse sind erstaunlich nüchtern: fehlende Integration in bestehende Systeme, kein klarer Business Case, schwache Datenbasis, fehlende Ownership, kein Change Management. Meine Überzeugung dazu, aus über 20 Jahren Arbeit an Schnittstellen zwischen Marketing, Vertrieb und Geschäftsführung: "Ein Pilot ohne Führungsentscheidung dahinter ist eine Demo, kein Projekt."
In meiner Praxis im Mittelstand sehe ich immer dieselben drei Engpässe:
- Der Pilot hat keinen Owner mit Mandat. Eine motivierte Mitarbeiterin baut etwas, das funktioniert. Aber niemand auf Führungsebene hat entschieden, dass dieses Etwas ausgerollt wird.
- Die Erfolgskriterien wurden erst hinterher definiert. Nach dem Piloten wird diskutiert, ob "es etwas gebracht hat". Das ist keine Validierung — das ist eine Geschmacksfrage.
- Es gibt kein Budget für die Phase nach dem Piloten. Die Skalierung wird behandelt, als wäre sie automatisch in den IT-Etat eingepreist. Sie ist es nicht.
Was Führung VOR dem Piloten veranlassen muss
Wenn KI-Pilotprojekte im Mittelstand wirklich skalieren sollen, beginnt das nicht beim Tool. Es beginnt bei vier Entscheidungen, die die Geschäftsführung trifft, bevor der Pilot startet. Werden diese vier Entscheidungen nicht getroffen, ist das Ergebnis vorhersehbar — der Pilot bleibt als Solo-Lösung im Team einer einzelnen Person hängen.
Pilot ohne Führungsentscheidung
Owner: "Die motivierte Person aus dem Team"
KPI: "Schauen wir mal, ob es was bringt"
Daten: "Was halt verfügbar ist"
Skalierungsbudget: "Klären wir nach dem Piloten"
Validierung: "Nebenbei, neben dem Tagesgeschäft"
Pilot mit Führungsentscheidung
Owner: Eine Person mit Mandat und Befugnis
KPI: Vor Start definiert, messbar, an Geschäftszahl gekoppelt
Daten: Echte Produktionsdaten, vor Start freigegeben
Skalierungsbudget: Vor Pilotstart reserviert
Validierung: Geschützte Zeit im Kalender
Pilot bedeutet im Mittelstand etwas anderes als im Konzern
Im Konzern ist ein KI-Pilot ein Projekt mit Steering Committee, Programm-Manager und einem Skalierungsplan, der die Pilot-Phase überlebt. Im Mittelstand ist ein KI-Pilot oft etwas anderes: eine motivierte Person, die "mal etwas ausprobiert". Beides hat Berechtigung — aber im Mittelstand muss die Geschäftsführung die Lücke zwischen "ausprobieren" und "ausrollen" aktiv schliessen. Sonst tut es niemand.
Der Begriff KI-Pilotprojekt skalieren Mittelstand beschreibt im Kern genau diese Lücke: vom funktionierenden Test eines Einzelnen zur akzeptierten Routine in der Organisation.
Die fünf Hebel, die Führung in der Hand hat
Aus den Mittelstandsprojekten, die ich begleite, kristallisieren sich fünf konkrete Hebel heraus. Diese fünf liegen ausschliesslich bei der Führung. Sie können nicht delegiert, nicht outgesourced und nicht durch ein besseres Tool ersetzt werden.
1
Ein Pilot, ein benannter Owner
Vor Pilotstart wird eine Person benannt — namentlich, schriftlich, mit Befugnis. Diese Person verantwortet nicht nur den Test, sondern den Rollout. Wenn diese Person nicht benannt wird, gibt es keinen Rollout.
2
Erfolgskriterien VOR dem Start
Was muss am Ende des Piloten messbar besser sein, damit der Pilot erfolgreich ist? Zeit pro Angebot? Lead-Konversion? Bearbeitete Tickets pro Tag? Die Zahl wird vorher festgelegt, nicht hinterher diskutiert.
3
Echte Daten, echte Prozesse
Pilots, die auf Demo-Daten laufen, validieren nichts. Die Mitarbeitenden brauchen Zugang zu produktiven Daten und einen produktiven Prozessausschnitt. Diesen Zugang gibt nur die Führung frei — Compliance, Datenschutz, Systemzugänge sind Führungsthemen.
4
Skalierungsbudget vor Pilotstart
Bevor der Pilot startet, ist das Budget für die Phase nach dem Piloten reserviert — Lizenzen, Schulung, Prozessanpassung. Wer das Skalierungsbudget erst beantragt, wenn der Pilot vorbei ist, hat in 80 % der Fälle keine Skalierung.
5
Geschützte Zeit für Validierung
"Macht das nebenbei" ist die häufigste Variante, einen Piloten zu beerdigen. Die Mitarbeitenden, die validieren, brauchen Stunden im Kalender, die nicht von Tagesgeschäft überschrieben werden. Diese Zeit setzt die Führung — niemand sonst kann es.
"Wer die Skalierung erst nach dem Piloten plant, hat in 80 Prozent der Fälle keine Skalierung."
Was Mitarbeiter brauchen, um wirklich validieren zu können
Die fünf Führungshebel haben einen gemeinsamen Adressaten: die Mitarbeitenden, die den Piloten in der Praxis testen. Wenn diese Personen die folgenden vier Dinge nicht von der Führung bekommen, wird die Validierung weich und der Pilot bleibt im Labor.
?
Zeit, die nicht überschrieben wird
Validierung neben dem Tagesgeschäft führt zu Validierung in Bruchstücken. Was im Kalender als Pilot-Zeit blockiert ist, muss von der Führung geschützt werden — gegen das eigene Tagesgeschäft des Teams.
?
Zugang zu echten Daten
Ohne produktive Daten validiert der Pilot nichts. Die Mitarbeitenden brauchen schreibenden oder lesenden Zugriff auf das, was im Tagesgeschäft passiert — sonst testen sie eine Simulation, nicht den Use Case.
?
Echte Entscheidungsbefugnis
Wenn die Pilotergebnisse erst durch drei Eskalationsstufen müssen, bevor jemand entscheidet, ob ausgerollt wird, ist die Energie weg. Der Owner muss am Ende des Piloten eine Empfehlung aussprechen, die Gewicht hat.
?
Sichtbarkeit als Karriere-Chance
Wer einen Piloten verantwortet, übernimmt Risiko. Das muss sich auszahlen — durch Sichtbarkeit gegenüber der Geschäftsführung, durch explizite Anerkennung, durch das Signal: Wer hier liefert, wird gesehen. Sonst nimmt es beim nächsten Mal niemand mehr in die Hand.
Wie das MASAKI-Framework die Skalierung strukturiert
Mein MASAKI-Framework setzt genau hier an: Marketing · Alignment · Sales · Automation/KI · KPIs · Investment. Die Skalierung eines KI-Piloten ist nie isoliert ein Automation-Thema. Sie ist immer auch ein KPI-Thema (was messen wir?), ein Investment-Thema (ist das Skalierungsbudget reserviert?) und ein Alignment-Thema (wissen Marketing und Vertrieb, wer was bekommt?).
Ein Pilot, der nur über die Achse "Automation" gedacht wird, wird zum Tool-Pilot. Ein Pilot, der über alle sechs Achsen gedacht wird, wird zum skalierbaren Use Case. Das ist der Unterschied zwischen Tool-Auswahl und KI-Einführung.
Wie der Sparringstag die fünf Hebel sortiert
Im Sparringstag arbeite ich genau diese fünf Hebel mit der Geschäftsführung durch. Reihenfolge spielt eine Rolle: Erst der namentliche Owner, dann die messbare Erfolgsdefinition, dann die Klärung der Datenfrage, dann das reservierte Skalierungsbudget, dann die geschützte Validierungszeit im Kalender. Wer einen dieser Schritte überspringt, baut Risiko in den Piloten ein, das später schwer zu reparieren ist.
Was die meisten Geschäftsführer überrascht: Diese fünf Entscheidungen kosten in der Vorbereitung wenig Zeit. Ein halber Tag konzentriertes Arbeiten genügt meistens, um sie sauber zu treffen. Die Konsequenzen, wenn sie fehlen, kosten dagegen Monate.
Was den Unterschied macht, ist nicht das Tool. Das Tool ist in den meisten Fällen in Ordnung. Was den Unterschied macht, sind die Bedingungen, unter denen das Team es nutzen soll — und diese Bedingungen setzt die Geschäftsführung, nicht das Team selbst.
Häufige Fragen
Was Entscheider am häufigsten fragen
Warum scheitern so viele KI-Pilotprojekte im Mittelstand bei der Skalierung?
Die MIT-Studie "GenAI Divide 2025" zeigt: 95 Prozent der GenAI-Pilotprojekte schaffen den Sprung in den Regelbetrieb nicht. Die Ursachen sind in den seltensten Fällen technisch. Sie liegen bei fehlender Ownership, undefinierten Erfolgskriterien, kein reserviertem Skalierungsbudget und schwacher Einbindung der Mitarbeitenden. Wenn diese vier Punkte vor Pilotstart nicht geklärt sind, ist die Wahrscheinlichkeit hoch, dass der Pilot als Solo-Lösung einer einzelnen Person hängen bleibt.
Was muss die Geschäftsführung VOR dem Start eines KI-Piloten entscheiden?
Vier Dinge: Wer ist der namentliche Owner mit Mandat? Welche messbaren Erfolgskriterien gelten am Ende des Piloten? Welches Budget ist für die Skalierung nach dem Piloten bereits reserviert? Welche geschützte Zeit bekommen die Mitarbeitenden für die Validierung? Werden diese vier Entscheidungen vorher getroffen, ist die Skalierung wahrscheinlich. Werden sie erst hinterher diskutiert, bleibt der Pilot stecken.
Wie lange sollte ein KI-Pilotprojekt im Mittelstand dauern?
In den Mittelstandsprojekten, die ich begleite, hat sich ein Zeitfenster von acht bis zwölf Wochen bewährt. Kürzer als sechs Wochen reicht selten für saubere Validierung. Länger als drei Monate ohne klare Skalierungsentscheidung führt dazu, dass die Energie aus dem Projekt geht und der Pilot zur Dauerbaustelle wird. Wichtig ist nicht die Dauer, sondern dass am Ende eine Entscheidung steht — Skalierung, Anpassung oder bewusste Beerdigung.
Wie wird ein KI-Pilot richtig validiert?
Validierung heisst im Kontext von KI-Pilotprojekten: messbarer Vergleich gegen eine vor dem Start festgelegte Baseline. Zeit pro Vorgang, Konversion, Fehlerquote, Bearbeitungsvolumen — was auch immer der KPI ist, er muss vor Pilotstart festgelegt und während des Piloten erhoben werden. Validierung ohne Baseline ist Geschmacksfrage, nicht Entscheidungsgrundlage.
Welche Rolle spielen Mitarbeiter:innen bei der Skalierung von KI-Pilotprojekten?
Eine zentrale, aber sie ist nur so gut, wie die Führung sie ermöglicht. Mitarbeitende, die einen Piloten validieren, brauchen geschützte Zeit, Zugang zu echten Daten, echte Entscheidungsbefugnis und Sichtbarkeit gegenüber der Geschäftsführung. Wer Mitarbeitende einen Piloten "nebenbei" laufen lässt, bekommt eine Validierung nebenbei — und damit keine belastbare Entscheidungsgrundlage für die Skalierung.
Was kostet die Skalierung eines KI-Pilotprojekts im Mittelstand?
Die direkten Kosten sind oft die kleineren — Lizenzen, eventuelle Anpassungen, Schulung. Die grösseren Posten sind Prozessanpassung, Change Management und die Zeit der Mitarbeitenden in der Übergangsphase. Als Faustregel: Wer für den Piloten X investiert, sollte für die Skalierung das Zwei- bis Dreifache einplanen. Wer das Skalierungsbudget nicht reserviert hat, bevor der Pilot startet, riskiert dass die Skalierung an der Budgetfrage scheitert — auch wenn der Pilot inhaltlich überzeugt.