KI-Pilotprojekte skalieren Mittelstand: 95 % bleiben stecken

Q: Warum scheitern so viele KI-Pilotprojekte im Mittelstand bei der Skalierung?

Die MIT-Studie GenAI Divide 2025 zeigt: 95 Prozent der GenAI-Pilotprojekte schaffen den Sprung in den Regelbetrieb nicht. Die Ursachen sind in den seltensten Fällen technisch. Sie liegen bei fehlender Ownership, undefinierten Erfolgskriterien, kein reserviertem Skalierungsbudget und schwacher Einbindung der Mitarbeitenden.

Q: Wie wird ein KI-Pilot richtig validiert?

Validierung heisst: messbarer Vergleich gegen eine vor dem Start festgelegte Baseline. Zeit pro Vorgang, Konversion, Fehlerquote, Bearbeitungsvolumen — was auch immer der KPI ist, er muss vor Pilotstart festgelegt und während des Piloten erhoben werden.

Q: Was kostet die Skalierung eines KI-Pilotprojekts im Mittelstand?

Die direkten Kosten sind oft die kleineren — Lizenzen, Anpassungen, Schulung. Als Faustregel: Wer für den Piloten X investiert, sollte für die Skalierung das Zwei- bis Dreifache einplanen.

In Gesprächen mit Geschäftsführern im B2B-Mittelstand höre ich immer wieder dasselbe Muster. Ein KI-Pilot wurde gestartet, oft aus dem Vertrieb oder dem Marketing heraus. Eine motivierte Person hat etwas aufgesetzt: automatisierte Angebotserstellung, Lead-Scoring, Recherche-Assistenz. Etwas mit klarem Hebel.

Der Pilot funktioniert. Die Person, die ihn aufgesetzt hat, ist begeistert. Sie ist schneller, präziser, freier im Kopf.

Monate später nutzt niemand sonst dieses Tool. Der Pilot lebt als Solo-Lösung einer einzelnen Person. Die anderen im Team wissen davon. Sie nutzen es nicht. Wenn ich frage warum, kommt: "Wir haben es nie offiziell ausgerollt." Dieses Muster sehe ich nicht einmal, sondern in fast jedem Mittelstand-Projekt, in das ich als Sparringspartner reinkomme.

"Pilots scheitern nicht an Technologie. Sie scheitern daran, dass niemand entschieden hat, was nach dem Piloten passiert."

Warum 95 % der KI-Pilotprojekte nicht skalieren

Die MIT-Studie "The GenAI Divide: State of AI in Business 2025" hat eine Zahl produziert, die seitdem in jeder zweiten KI-Präsentation auftaucht: 95 % der GenAI-Pilotprojekte erreichen keinen messbaren ROI im Regelbetrieb. Die Forscher nennen das den "Pilot-to-Production Chasm" — die Kluft zwischen Test und produktivem Einsatz.

Was in den Studien klar wird: Die Kluft ist kein Technologieproblem. Sie ist ein Organisations- und Führungsproblem. Was ich in den Mittelstandsprojekten sehe, deckt sich exakt damit.

95 %

der GenAI-Pilotprojekte erreichen keinen Produktivbetrieb

MIT GenAI Divide 2025

68 %

der KMU haben keine ausgearbeitete KI-Roadmap

KMU-Studie 2024

19 %

haben einen dedizierten KI-Verantwortlichen oder ein KI-Team

KMU-Studie 2024

Was die Studien als Ursachen nennen — und was ich in der Praxis sehe

Die wiederkehrenden Befunde aus MIT, Deloitte und der IW-Analyse sind erstaunlich nüchtern: fehlende Integration in bestehende Systeme, kein klarer Business Case, schwache Datenbasis, fehlende Ownership, kein Change Management. Meine Überzeugung dazu, aus über 20 Jahren Arbeit an Schnittstellen zwischen Marketing, Vertrieb und Geschäftsführung: "Ein Pilot ohne Führungsentscheidung dahinter ist eine Demo, kein Projekt."

In meiner Praxis im Mittelstand sehe ich immer dieselben drei Engpässe:

Der Pilot hat keinen Owner mit Mandat. Eine motivierte Mitarbeiterin baut etwas, das funktioniert. Aber niemand auf Führungsebene hat entschieden, dass dieses Etwas ausgerollt wird.
Die Erfolgskriterien wurden erst hinterher definiert. Nach dem Piloten wird diskutiert, ob "es etwas gebracht hat". Das ist keine Validierung — das ist eine Geschmacksfrage.
Es gibt kein Budget für die Phase nach dem Piloten. Die Skalierung wird behandelt, als wäre sie automatisch in den IT-Etat eingepreist. Sie ist es nicht.

Was Führung VOR dem Piloten veranlassen muss

Wenn KI-Pilotprojekte im Mittelstand wirklich skalieren sollen, beginnt das nicht beim Tool. Es beginnt bei vier Entscheidungen, die die Geschäftsführung trifft, bevor der Pilot startet. Werden diese vier Entscheidungen nicht getroffen, ist das Ergebnis vorhersehbar — der Pilot bleibt als Solo-Lösung im Team einer einzelnen Person hängen.

Pilot ohne Führungsentscheidung

Owner: "Die motivierte Person aus dem Team"

KPI: "Schauen wir mal, ob es was bringt"

Daten: "Was halt verfügbar ist"

Skalierungsbudget: "Klären wir nach dem Piloten"

Validierung: "Nebenbei, neben dem Tagesgeschäft"

Pilot mit Führungsentscheidung

Owner: Eine Person mit Mandat und Befugnis

KPI: Vor Start definiert, messbar, an Geschäftszahl gekoppelt

Daten: Echte Produktionsdaten, vor Start freigegeben

Skalierungsbudget: Vor Pilotstart reserviert

Validierung: Geschützte Zeit im Kalender

Pilot bedeutet im Mittelstand etwas anderes als im Konzern

Im Konzern ist ein KI-Pilot ein Projekt mit Steering Committee, Programm-Manager und einem Skalierungsplan, der die Pilot-Phase überlebt. Im Mittelstand ist ein KI-Pilot oft etwas anderes: eine motivierte Person, die "mal etwas ausprobiert". Beides hat Berechtigung — aber im Mittelstand muss die Geschäftsführung die Lücke zwischen "ausprobieren" und "ausrollen" aktiv schliessen. Sonst tut es niemand.

Der Begriff KI-Pilotprojekt skalieren Mittelstand beschreibt im Kern genau diese Lücke: vom funktionierenden Test eines Einzelnen zur akzeptierten Routine in der Organisation.

Die fünf Hebel, die Führung in der Hand hat

Aus den Mittelstandsprojekten, die ich begleite, kristallisieren sich fünf konkrete Hebel heraus. Diese fünf liegen ausschliesslich bei der Führung. Sie können nicht delegiert, nicht outgesourced und nicht durch ein besseres Tool ersetzt werden.

Ein Pilot, ein benannter Owner

Vor Pilotstart wird eine Person benannt — namentlich, schriftlich, mit Befugnis. Diese Person verantwortet nicht nur den Test, sondern den Rollout. Wenn diese Person nicht benannt wird, gibt es keinen Rollout.

Erfolgskriterien VOR dem Start

Was muss am Ende des Piloten messbar besser sein, damit der Pilot erfolgreich ist? Zeit pro Angebot? Lead-Konversion? Bearbeitete Tickets pro Tag? Die Zahl wird vorher festgelegt, nicht hinterher diskutiert.

Echte Daten, echte Prozesse

Pilots, die auf Demo-Daten laufen, validieren nichts. Die Mitarbeitenden brauchen Zugang zu produktiven Daten und einen produktiven Prozessausschnitt. Diesen Zugang gibt nur die Führung frei — Compliance, Datenschutz, Systemzugänge sind Führungsthemen.

Skalierungsbudget vor Pilotstart

Bevor der Pilot startet, ist das Budget für die Phase nach dem Piloten reserviert — Lizenzen, Schulung, Prozessanpassung. Wer das Skalierungsbudget erst beantragt, wenn der Pilot vorbei ist, hat in 80 % der Fälle keine Skalierung.

Geschützte Zeit für Validierung

"Macht das nebenbei" ist die häufigste Variante, einen Piloten zu beerdigen. Die Mitarbeitenden, die validieren, brauchen Stunden im Kalender, die nicht von Tagesgeschäft überschrieben werden. Diese Zeit setzt die Führung — niemand sonst kann es.

"Wer die Skalierung erst nach dem Piloten plant, hat in 80 Prozent der Fälle keine Skalierung."

Was Mitarbeiter brauchen, um wirklich validieren zu können

Die fünf Führungshebel haben einen gemeinsamen Adressaten: die Mitarbeitenden, die den Piloten in der Praxis testen. Wenn diese Personen die folgenden vier Dinge nicht von der Führung bekommen, wird die Validierung weich und der Pilot bleibt im Labor.

Zeit, die nicht überschrieben wird

Validierung neben dem Tagesgeschäft führt zu Validierung in Bruchstücken. Was im Kalender als Pilot-Zeit blockiert ist, muss von der Führung geschützt werden — gegen das eigene Tagesgeschäft des Teams.

Zugang zu echten Daten

Ohne produktive Daten validiert der Pilot nichts. Die Mitarbeitenden brauchen schreibenden oder lesenden Zugriff auf das, was im Tagesgeschäft passiert — sonst testen sie eine Simulation, nicht den Use Case.

Echte Entscheidungsbefugnis

Wenn die Pilotergebnisse erst durch drei Eskalationsstufen müssen, bevor jemand entscheidet, ob ausgerollt wird, ist die Energie weg. Der Owner muss am Ende des Piloten eine Empfehlung aussprechen, die Gewicht hat.

Sichtbarkeit als Karriere-Chance

Wer einen Piloten verantwortet, übernimmt Risiko. Das muss sich auszahlen — durch Sichtbarkeit gegenüber der Geschäftsführung, durch explizite Anerkennung, durch das Signal: Wer hier liefert, wird gesehen. Sonst nimmt es beim nächsten Mal niemand mehr in die Hand.

Wie das MASAKI-Framework die Skalierung strukturiert

Mein MASAKI-Framework setzt genau hier an: Marketing · Alignment · Sales · Automation/KI · KPIs · Investment. Die Skalierung eines KI-Piloten ist nie isoliert ein Automation-Thema. Sie ist immer auch ein KPI-Thema (was messen wir?), ein Investment-Thema (ist das Skalierungsbudget reserviert?) und ein Alignment-Thema (wissen Marketing und Vertrieb, wer was bekommt?).

Ein Pilot, der nur über die Achse "Automation" gedacht wird, wird zum Tool-Pilot. Ein Pilot, der über alle sechs Achsen gedacht wird, wird zum skalierbaren Use Case. Das ist der Unterschied zwischen Tool-Auswahl und KI-Einführung.

Wie der Sparringstag die fünf Hebel sortiert

Im Sparringstag arbeite ich genau diese fünf Hebel mit der Geschäftsführung durch. Reihenfolge spielt eine Rolle: Erst der namentliche Owner, dann die messbare Erfolgsdefinition, dann die Klärung der Datenfrage, dann das reservierte Skalierungsbudget, dann die geschützte Validierungszeit im Kalender. Wer einen dieser Schritte überspringt, baut Risiko in den Piloten ein, das später schwer zu reparieren ist.

Was die meisten Geschäftsführer überrascht: Diese fünf Entscheidungen kosten in der Vorbereitung wenig Zeit. Ein halber Tag konzentriertes Arbeiten genügt meistens, um sie sauber zu treffen. Die Konsequenzen, wenn sie fehlen, kosten dagegen Monate.

Was den Unterschied macht, ist nicht das Tool. Das Tool ist in den meisten Fällen in Ordnung. Was den Unterschied macht, sind die Bedingungen, unter denen das Team es nutzen soll — und diese Bedingungen setzt die Geschäftsführung, nicht das Team selbst.

Häufige Fragen

Was Entscheider am häufigsten fragen

Warum scheitern so viele KI-Pilotprojekte im Mittelstand bei der Skalierung?

Die MIT-Studie "GenAI Divide 2025" zeigt: 95 Prozent der GenAI-Pilotprojekte schaffen den Sprung in den Regelbetrieb nicht. Die Ursachen sind in den seltensten Fällen technisch. Sie liegen bei fehlender Ownership, undefinierten Erfolgskriterien, kein reserviertem Skalierungsbudget und schwacher Einbindung der Mitarbeitenden. Wenn diese vier Punkte vor Pilotstart nicht geklärt sind, ist die Wahrscheinlichkeit hoch, dass der Pilot als Solo-Lösung einer einzelnen Person hängen bleibt.

Was muss die Geschäftsführung VOR dem Start eines KI-Piloten entscheiden?

Vier Dinge: Wer ist der namentliche Owner mit Mandat? Welche messbaren Erfolgskriterien gelten am Ende des Piloten? Welches Budget ist für die Skalierung nach dem Piloten bereits reserviert? Welche geschützte Zeit bekommen die Mitarbeitenden für die Validierung? Werden diese vier Entscheidungen vorher getroffen, ist die Skalierung wahrscheinlich. Werden sie erst hinterher diskutiert, bleibt der Pilot stecken.

Wie lange sollte ein KI-Pilotprojekt im Mittelstand dauern?

In den Mittelstandsprojekten, die ich begleite, hat sich ein Zeitfenster von acht bis zwölf Wochen bewährt. Kürzer als sechs Wochen reicht selten für saubere Validierung. Länger als drei Monate ohne klare Skalierungsentscheidung führt dazu, dass die Energie aus dem Projekt geht und der Pilot zur Dauerbaustelle wird. Wichtig ist nicht die Dauer, sondern dass am Ende eine Entscheidung steht — Skalierung, Anpassung oder bewusste Beerdigung.

Wie wird ein KI-Pilot richtig validiert?

Validierung heisst im Kontext von KI-Pilotprojekten: messbarer Vergleich gegen eine vor dem Start festgelegte Baseline. Zeit pro Vorgang, Konversion, Fehlerquote, Bearbeitungsvolumen — was auch immer der KPI ist, er muss vor Pilotstart festgelegt und während des Piloten erhoben werden. Validierung ohne Baseline ist Geschmacksfrage, nicht Entscheidungsgrundlage.

Welche Rolle spielen Mitarbeiter:innen bei der Skalierung von KI-Pilotprojekten?

Eine zentrale, aber sie ist nur so gut, wie die Führung sie ermöglicht. Mitarbeitende, die einen Piloten validieren, brauchen geschützte Zeit, Zugang zu echten Daten, echte Entscheidungsbefugnis und Sichtbarkeit gegenüber der Geschäftsführung. Wer Mitarbeitende einen Piloten "nebenbei" laufen lässt, bekommt eine Validierung nebenbei — und damit keine belastbare Entscheidungsgrundlage für die Skalierung.

Was kostet die Skalierung eines KI-Pilotprojekts im Mittelstand?

Die direkten Kosten sind oft die kleineren — Lizenzen, eventuelle Anpassungen, Schulung. Die grösseren Posten sind Prozessanpassung, Change Management und die Zeit der Mitarbeitenden in der Übergangsphase. Als Faustregel: Wer für den Piloten X investiert, sollte für die Skalierung das Zwei- bis Dreifache einplanen. Wer das Skalierungsbudget nicht reserviert hat, bevor der Pilot startet, riskiert dass die Skalierung an der Budgetfrage scheitert — auch wenn der Pilot inhaltlich überzeugt.

KI-Pilotprojekte im Mittelstand skalieren Was Führung veranlassen muss, damit Mitarbeiter wirklich validieren können