Dlaczego 87% projektów AI kończy się porażką – i co robią ci którym się udaje

Ponad 80% projektów AI nie dowozi wyniku biznesowego, a według MIT aż 95% pilotaży generatywnej AI nie wpływa na P&L firmy. Powody są zaskakująco mało techniczne: słabe dane, brak właściciela po stronie biznesu, rozwiązanie, które szuka problemu, zerowe KPI i governance doklejane po fakcie. W tym artykule pokazuję, skąd naprawdę biorą się te statystyki, dlaczego cztery głośne porażki (IBM Watson, Amazon, Zillow, sektor publiczny w Polsce) uczą nas tego samego, i co konkretnie robi inaczej te mniej niż 20% projektów, które wygrywają.

Skąd biorą się liczby: 87%, 80%, 95%, co naprawdę mówią badania

Co jakiś czas widzę, jak ktoś rzuca w prezentacji statystykę „87% projektów AI kończy się porażką” i traktuje ją jak fakt. Szczerze mówiąc, ta liczba od lat żyje własnym życiem. Pierwotnie pochodziła z raportu Gartnera o projektach data science jeszcze sprzed ery generatywnej AI. Dzisiaj rzetelniej jest mówić „ponad 80%”, bo taki poziom porażek pokazuje badanie RAND Corporation z 2024 roku, które przeanalizowało setki inicjatyw w firmach różnej wielkości.

Druga liczba, która robi furorę w 2025 roku, to 95%. Raport MIT Sloan „The State of AI in Business 2025” pokazał, że 95% pilotaży generatywnej AI w dużych firmach nie przekłada się na mierzalny wpływ na przychody lub koszty. To nie to samo co porażka techniczna. To raczej dowód, że pilotaż skończył się prezentacją, brawami i slajdem w deck’u zarządowym, ale do systemu produkcyjnego nigdy nie dotarł.

Pilot purgatory: Stan, w którym organizacja uruchamia kolejne pilotaże AI, każdy działa w laboratorium, żaden nie wchodzi do produkcji. Zespoły odtrąbiają sukces po demo, ale nic nie zmienia się w procesach, KPI ani P&L. Według MIT Sloan tak kończy się 95% pilotaży generatywnej AI.

Zamieszanie statystyczne nie jest tu problemem samym w sobie. Problemem jest to, że liderzy czytają te liczby i wyciągają niewłaściwy wniosek. Myślą „AI jest trudne technicznie”. A prawda jest taka, że w większości nieudanych projektów model działał poprawnie. To wokół niego wszystko się sypało.

Pięć powodów, dla których projekty AI się wywalają

Najczęstsze przyczyny porażek mają twarze bardzo niewzbudzające emocji. Nie są to halucynacje LLM-ów, awarie GPU ani zdrada dostawcy chmury. To pięć powtarzalnych pułapek, które wyglądają podobnie w banku, firmie produkcyjnej i urzędzie.

Dane, których nie ma albo są do kosza

Firmy zaczynają projekt AI z przekonaniem, że mają „dużo danych”. Po czterech tygodniach inventory okazuje się, że dane są rozproszone w dziesięciu systemach, formaty się nie zgadzają, połowa kolumn to puste stringi, a historia sięga dwóch lat wstecz, podczas gdy model potrzebuje pięciu. To jest punkt, w którym większość projektów cicho umiera, nie z hukiem, tylko z protokołu zerowego.

Raport RAND wprost wskazuje słabą jakość i dostępność danych jako pierwszy powód porażek. Zgadza się to z moją obserwacją z polskich firm: chętnie kupujemy licencje, niechętnie płacimy za porządek w hurtowni danych.

Data readiness: Gotowość danych do trenowania i serwowania modelu AI. Obejmuje pięć warstw: dostępność (czy dane w ogóle są), jakość (czy są kompletne i spójne), metadata (czy wiadomo, co znaczą), governance (kto odpowiada) i prawo (czy można ich użyć zgodnie z RODO i AI Act). Bez tego projekt AI startuje na kruchym fundamencie.

Brak właściciela po stronie biznesu

Klasyczny obrazek: projekt AI prowadzony przez CIO lub szefa IT, a biznes jest „informowany”. Po kilku miesiącach przychodzi moment, w którym trzeba zmienić proces w dziale sprzedaży albo operacjach. Szef tego działu dowiaduje się wtedy, że to „jego projekt” i że powinien był być zaangażowany od dnia pierwszego. Zwykle nie był, więc projekt wchodzi w konflikt o priorytety i traci tempo.

Rozwiązanie szuka problemu

Czasem pierwszym krokiem w firmie nie jest pytanie „co nas boli?”, tylko „co umie Copilot?”. Dostawca zostawia obietnicę, że AI „zautomatyzuje procesy”. Sześć miesięcy później zespół wdrożeniowy desperacko szuka use case’u, który uzasadni poniesioną licencję. Efekt: wdrożenie narzędzia bez jasnego problemu biznesowego, które stoi w kącie jak kupiony na wyrost kombajn rolniczy.

Zerowe KPI biznesowe

Jeżeli jedyną metryką projektu jest accuracy modelu albo liczba użytkowników pilotażu, to nie masz projektu biznesowego, tylko eksperyment. Projekty, które wygrywają, mają od dnia zero metrykę wyrażoną w złotówkach, godzinach pracy albo punktach NPS. Projekty, które przegrywają, kończą się slajdem „accuracy 92%” i ciszą ze strony CFO.

Governance jako afterthought

W 2026 roku governance AI nie jest już opcjonalne. AI Act wymaga klasyfikacji ryzyka systemu, dokumentacji danych treningowych, monitorowania dryfu i mechanizmów odwoławczych dla użytkowników, których dotyczą decyzje algorytmu. Firmy, które traktują governance jako „coś, co dodamy w fazie produkcyjnej”, zderzają się ze ścianą na ostatniej prostej. Inspektor ochrony danych mówi „stop”, zarząd przekłada uruchomienie o kwartał, a potem o kolejny.

Cztery głośne porażki, z których warto wyciągnąć wnioski

Zebrałem cztery przypadki, które publicznie zostały dobrze opisane. Ich wspólny mianownik nie ma nic wspólnego z technologią. Ma wszystko wspólnego z ludźmi i procesem.

Przypadek	Co poszło nie tak	Czego to uczy
IBM Watson Health / MD Anderson (2013–2017)	Projekt Oncology Expert Advisor rozrósł się z budżetu poniżej 20 mln PLN do ok. 250 mln PLN. System miał problemy z interpretacją dokumentacji medycznej i integracją z nowym EHR. Lekarze przestali mu ufać.	Budżet i marka nie zastąpią rozumienia danych i workflow użytkownika końcowego.
Amazon Recruiting Tool (2014–2018)	Model uczył się na historycznych CV, w większości pochodzących od mężczyzn. Nauczył się obniżać ocenę aplikacji zawierających słowo „women’s” albo nazwę żeńskiej uczelni. Amazon projekt skasował.	Model wiernie odtwarza błędy przeszłości wpisane w dane treningowe. Bez ludzkiego nadzoru nad zbiorem treningowym dostajesz wzmacniacz uprzedzeń.
Zillow Offers (2018–2021)	Zillow kupował domy na podstawie predykcji Zestimate i remontował je na sprzedaż. Model nie nadążał za zmianami rynku w 2021 roku. Firma odnotowała ok. 2 mld PLN strat, zwolniła 25% załogi i zamknęła segment iBuying.	Model predykcyjny może świetnie działać w arkuszu i zawieść w realnym świecie, gdy skala i zmienność rynku przekraczają założenia treningowe.
Polska, sektor publiczny (2020–2024)	Publicznych opisów jest mało, ale w obiegu są relacje o nietrafionych pilotażach OCR do przetwarzania wniosków i chatbotach urzędowych, które zostały wycofane po kilku miesiącach z powodu braku adopcji i sporadycznych halucynacji w odpowiedziach prawnych.	Polski problem to nie technologia, tylko słaba dokumentacja efektów, niska integracja z systemami i brak kompetencji po stronie zamawiającego. Uczymy się na cudzych błędach, bo swoich nie opisujemy.

Cytowane statystyki Zillow z Reutersa i raportów kwartalnych, przeliczenia USD na PLN przyjąłem po kursie ok. 4,0 PLN za dolara z 2026 roku. Poziom strat jest orientacyjny, ale rząd wielkości oddaje skalę problemu.

Co robi inaczej te 5–20% projektów, które dowoziły wynik

Firmy, którym się udaje, nie są mądrzejsze. Nie mają też lepszego modelu. Mają za to pięć rzeczy, które robią konsekwentnie i których nie da się kupić w pakiecie wraz z licencją SaaS.

Zaczynają od procesu, nie od modelu

McKinsey w raporcie „State of AI 2025” pokazał, że liderzy wartości (firmy, które realnie zarabiają na AI) łączą wdrożenia z celami wzrostu i innowacji, a nie tylko cięciem kosztów. I co ważniejsze: przebudowują workflow. Nie nakładają AI na dotychczasową procedurę, tylko projektują nową.

Mają sponsora zarządowego

Nie opiekuna z IT, tylko członka zarządu, który ma skórę w grze. Kiedy projekt trafia na konflikt priorytetów z innym działem, sponsor rozstrzyga w dwa dni, a nie w dwa kwartały.

Budują governance od dnia pierwszego

Inspektor danych osobowych, Compliance, a czasem prawnik specjalizujący się w AI Act siedzą w komitecie sterującym od kickoffu. Wynik? Na dwie niedziele przed uruchomieniem produkcyjnym nikt nie mówi „zatrzymajcie wszystko, to jest system wysokiego ryzyka”.

Mierzą P&L, nie accuracy

Metryka techniczna modelu jest konieczna, ale nie wystarczająca. Projekty, które wygrywają, od startu mają pytanie: „o ile to ma zmniejszyć koszty albo zwiększyć przychody w ciągu 12 miesięcy?”. I odpowiadają na nie liczbą w złotówkach.

Inwestują w kompetencje liderów

Stanford HAI w AI Index 2025 zwraca uwagę, że rozjazd między firmami korzystającymi z AI a tymi, które zostały w tyle, w większym stopniu wynika z jakości ludzi niż z jakości narzędzi. Kompetencje managerów są wąskim gardłem wdrożenia, nie GPU.

Business case AI: Dokument biznesowy, który odpowiada na trzy pytania: jaki problem rozwiązujemy, ile ten problem nas obecnie kosztuje (baseline), i jaki mierzalny zwrot ma przynieść projekt w horyzoncie 12–24 miesięcy. Jeśli nie potrafisz tego napisać na kartce A4 bez żargonu technicznego, nie jesteś gotowy na projekt AI.

Krótka wersja: przebudowany workflow z KPI wyrażonym w złotówkach bije najlepszy model bez sponsora w zarządzie.

Checklist lidera: pięć pytań przed startem projektu AI

Zanim podpiszesz zamówienie na narzędzie AI albo podasz rękę dostawcy, zadaj sobie te pięć pytań. Jeśli nie znasz odpowiedzi na którekolwiek, cofnij się o krok. Taniej będzie stracić tydzień teraz niż pół roku później.

Jaki konkretny proces zamierzam zmienić i ile mnie ten proces dzisiaj kosztuje? Bez baseline’u w złotówkach albo godzinach nie da się później policzyć ROI.
Kto po stronie biznesu ma skórę w grze? Imię i nazwisko. Członek zarządu albo dyrektor linii biznesowej, nie CIO.
Czy moje dane są gotowe? Jakość, kompletność, metadata, zgodność z RODO. Jeśli odpowiedź to „nie wiem”, zacznij od audytu danych, nie od wdrożenia AI.
Jakie trzy metryki biznesowe zmierzę po sześciu i dwunastu miesiącach? Bez tego projekt staje się eksperymentem, a eksperymenty nie mają budżetu na produkcję.
Kto odpowie na pytania AI Act i inspektora danych? Jeśli to zostanie na później, „później” nie nadejdzie, albo nadejdzie w najgorszym momencie.

Te pięć pytań nie gwarantuje sukcesu. Ale jeśli nie umiesz odpowiedzieć na nie w ciągu dwudziestu minut, znajdujesz się dokładnie w tym miejscu, w którym startowały te 80–95% projektów, które nie dowiozły wyniku.

Podsumowanie

Porażki projektów AI mają twarze menedżerskie, nie inżynierskie. Złe dane, brak właściciela biznesowego, rozwiązanie bez problemu, zerowe KPI i governance po fakcie. To jest prawdziwa lista przyczyn, za którą stoi ponad 80% nieudanych wdrożeń. Firmy, które wygrywają, zaczynają od procesu, liczą w złotówkach i traktują kompetencje liderów jako inwestycję, nie koszt. Jeśli zarządzasz firmą, zespołem albo jednostką biznesową, to nie narzędzie AI rozstrzygnie o twoim wyniku. Rozstrzygnie go sposób, w jaki postawisz pięć pytań z checklisty powyżej.

Jeśli chcesz przeprowadzić swój zespół przez te pięć pytań i wyjść z konkretnym planem wdrożenia, sprawdź Future Leaders: AI dla Liderów, kurs zaprojektowany dla menedżerów, którzy chcą wdrażać AI z wynikiem, a nie tylko z prezentacją.

Najczęściej zadawane pytania (FAQ)

Czy naprawdę 87% projektów AI kończy się porażką?

Liczba 87% krąży od lat, ale rzetelniejsze dane pokazują „ponad 80%” (RAND Corporation, 2024) i „95% pilotaży generatywnej AI” (MIT Sloan, 2025). Różnica jest metodologiczna: 80% obejmuje wszystkie projekty AI, a 95% dotyczy tylko pilotaży GenAI w dużych firmach, które nie przekładają się na P&L.

Co jest najczęstszą przyczyną porażek wdrożeń AI?

Jakość i gotowość danych oraz brak właściciela po stronie biznesu. Raport RAND z 2024 roku wskazuje te dwa powody na czele listy. Dopiero po nich pojawia się niedopasowanie rozwiązania do problemu i brak KPI biznesowych.

Jak uniknąć pilot purgatory w projekcie AI?

Od dnia zero projektuj ścieżkę wyjścia z pilotażu do produkcji, wraz z kryteriami przejścia. Zdefiniuj, jakie metryki biznesowe muszą osiągnąć wartość progową, żeby projekt dostał budżet produkcyjny. Powołaj sponsora zarządowego, który ma mandat do decyzji „idziemy dalej” albo „kończymy”.

Czy w Polsce są publicznie opisane porażki wdrożeń AI?

Dobrze opisanych, polskich case studies jest mało. W obiegu są relacje o nietrafionych pilotażach OCR do przetwarzania wniosków i chatbotach urzędowych wycofanych po kilku miesiącach z powodu niskiej adopcji i halucynacji w odpowiedziach prawnych. Problemem jest brak kultury publikowania post-mortemów, co utrudnia uczenie się na cudzych błędach.

🏷️ artykuł ekspercki porażki wdrożeń ai ryzyka projektu ai spektakularne porażki ai

Dlaczego 87% projektów AI kończy się porażką – i co robią ci którym się udaje

Skąd biorą się liczby: 87%, 80%, 95%, co naprawdę mówią badania