Skąd biorą się liczby: 87%, 80%, 95%, co naprawdę mówią badania
Co jakiś czas widzę, jak ktoś rzuca w prezentacji statystykę „87% projektów AI kończy się porażką” i traktuje ją jak fakt. Szczerze mówiąc, ta liczba od lat żyje własnym życiem. Pierwotnie pochodziła z raportu Gartnera o projektach data science jeszcze sprzed ery generatywnej AI. Dzisiaj rzetelniej jest mówić „ponad 80%”, bo taki poziom porażek pokazuje badanie RAND Corporation z 2024 roku, które przeanalizowało setki inicjatyw w firmach różnej wielkości.
Druga liczba, która robi furorę w 2025 roku, to 95%. Raport MIT Sloan „The State of AI in Business 2025” pokazał, że 95% pilotaży generatywnej AI w dużych firmach nie przekłada się na mierzalny wpływ na przychody lub koszty. To nie to samo co porażka techniczna. To raczej dowód, że pilotaż skończył się prezentacją, brawami i slajdem w deck’u zarządowym, ale do systemu produkcyjnego nigdy nie dotarł.
Zamieszanie statystyczne nie jest tu problemem samym w sobie. Problemem jest to, że liderzy czytają te liczby i wyciągają niewłaściwy wniosek. Myślą „AI jest trudne technicznie”. A prawda jest taka, że w większości nieudanych projektów model działał poprawnie. To wokół niego wszystko się sypało.
Pięć powodów, dla których projekty AI się wywalają
Najczęstsze przyczyny porażek mają twarze bardzo niewzbudzające emocji. Nie są to halucynacje LLM-ów, awarie GPU ani zdrada dostawcy chmury. To pięć powtarzalnych pułapek, które wyglądają podobnie w banku, firmie produkcyjnej i urzędzie.
Dane, których nie ma albo są do kosza
Firmy zaczynają projekt AI z przekonaniem, że mają „dużo danych”. Po czterech tygodniach inventory okazuje się, że dane są rozproszone w dziesięciu systemach, formaty się nie zgadzają, połowa kolumn to puste stringi, a historia sięga dwóch lat wstecz, podczas gdy model potrzebuje pięciu. To jest punkt, w którym większość projektów cicho umiera, nie z hukiem, tylko z protokołu zerowego.
Raport RAND wprost wskazuje słabą jakość i dostępność danych jako pierwszy powód porażek. Zgadza się to z moją obserwacją z polskich firm: chętnie kupujemy licencje, niechętnie płacimy za porządek w hurtowni danych.
Brak właściciela po stronie biznesu
Klasyczny obrazek: projekt AI prowadzony przez CIO lub szefa IT, a biznes jest „informowany”. Po kilku miesiącach przychodzi moment, w którym trzeba zmienić proces w dziale sprzedaży albo operacjach. Szef tego działu dowiaduje się wtedy, że to „jego projekt” i że powinien był być zaangażowany od dnia pierwszego. Zwykle nie był, więc projekt wchodzi w konflikt o priorytety i traci tempo.
Rozwiązanie szuka problemu
Czasem pierwszym krokiem w firmie nie jest pytanie „co nas boli?”, tylko „co umie Copilot?”. Dostawca zostawia obietnicę, że AI „zautomatyzuje procesy”. Sześć miesięcy później zespół wdrożeniowy desperacko szuka use case’u, który uzasadni poniesioną licencję. Efekt: wdrożenie narzędzia bez jasnego problemu biznesowego, które stoi w kącie jak kupiony na wyrost kombajn rolniczy.
Zerowe KPI biznesowe
Jeżeli jedyną metryką projektu jest accuracy modelu albo liczba użytkowników pilotażu, to nie masz projektu biznesowego, tylko eksperyment. Projekty, które wygrywają, mają od dnia zero metrykę wyrażoną w złotówkach, godzinach pracy albo punktach NPS. Projekty, które przegrywają, kończą się slajdem „accuracy 92%” i ciszą ze strony CFO.
Governance jako afterthought
W 2026 roku governance AI nie jest już opcjonalne. AI Act wymaga klasyfikacji ryzyka systemu, dokumentacji danych treningowych, monitorowania dryfu i mechanizmów odwoławczych dla użytkowników, których dotyczą decyzje algorytmu. Firmy, które traktują governance jako „coś, co dodamy w fazie produkcyjnej”, zderzają się ze ścianą na ostatniej prostej. Inspektor ochrony danych mówi „stop”, zarząd przekłada uruchomienie o kwartał, a potem o kolejny.
Cztery głośne porażki, z których warto wyciągnąć wnioski
Zebrałem cztery przypadki, które publicznie zostały dobrze opisane. Ich wspólny mianownik nie ma nic wspólnego z technologią. Ma wszystko wspólnego z ludźmi i procesem.
| Przypadek | Co poszło nie tak | Czego to uczy |
|---|---|---|
| IBM Watson Health / MD Anderson (2013–2017) | Projekt Oncology Expert Advisor rozrósł się z budżetu poniżej 20 mln PLN do ok. 250 mln PLN. System miał problemy z interpretacją dokumentacji medycznej i integracją z nowym EHR. Lekarze przestali mu ufać. | Budżet i marka nie zastąpią rozumienia danych i workflow użytkownika końcowego. |
| Amazon Recruiting Tool (2014–2018) | Model uczył się na historycznych CV, w większości pochodzących od mężczyzn. Nauczył się obniżać ocenę aplikacji zawierających słowo „women’s” albo nazwę żeńskiej uczelni. Amazon projekt skasował. | Model wiernie odtwarza błędy przeszłości wpisane w dane treningowe. Bez ludzkiego nadzoru nad zbiorem treningowym dostajesz wzmacniacz uprzedzeń. |
| Zillow Offers (2018–2021) | Zillow kupował domy na podstawie predykcji Zestimate i remontował je na sprzedaż. Model nie nadążał za zmianami rynku w 2021 roku. Firma odnotowała ok. 2 mld PLN strat, zwolniła 25% załogi i zamknęła segment iBuying. | Model predykcyjny może świetnie działać w arkuszu i zawieść w realnym świecie, gdy skala i zmienność rynku przekraczają założenia treningowe. |
| Polska, sektor publiczny (2020–2024) | Publicznych opisów jest mało, ale w obiegu są relacje o nietrafionych pilotażach OCR do przetwarzania wniosków i chatbotach urzędowych, które zostały wycofane po kilku miesiącach z powodu braku adopcji i sporadycznych halucynacji w odpowiedziach prawnych. | Polski problem to nie technologia, tylko słaba dokumentacja efektów, niska integracja z systemami i brak kompetencji po stronie zamawiającego. Uczymy się na cudzych błędach, bo swoich nie opisujemy. |
Cytowane statystyki Zillow z Reutersa i raportów kwartalnych, przeliczenia USD na PLN przyjąłem po kursie ok. 4,0 PLN za dolara z 2026 roku. Poziom strat jest orientacyjny, ale rząd wielkości oddaje skalę problemu.
Co robi inaczej te 5–20% projektów, które dowoziły wynik
Firmy, którym się udaje, nie są mądrzejsze. Nie mają też lepszego modelu. Mają za to pięć rzeczy, które robią konsekwentnie i których nie da się kupić w pakiecie wraz z licencją SaaS.
Zaczynają od procesu, nie od modelu
McKinsey w raporcie „State of AI 2025” pokazał, że liderzy wartości (firmy, które realnie zarabiają na AI) łączą wdrożenia z celami wzrostu i innowacji, a nie tylko cięciem kosztów. I co ważniejsze: przebudowują workflow. Nie nakładają AI na dotychczasową procedurę, tylko projektują nową.
Mają sponsora zarządowego
Nie opiekuna z IT, tylko członka zarządu, który ma skórę w grze. Kiedy projekt trafia na konflikt priorytetów z innym działem, sponsor rozstrzyga w dwa dni, a nie w dwa kwartały.
Budują governance od dnia pierwszego
Inspektor danych osobowych, Compliance, a czasem prawnik specjalizujący się w AI Act siedzą w komitecie sterującym od kickoffu. Wynik? Na dwie niedziele przed uruchomieniem produkcyjnym nikt nie mówi „zatrzymajcie wszystko, to jest system wysokiego ryzyka”.
Mierzą P&L, nie accuracy
Metryka techniczna modelu jest konieczna, ale nie wystarczająca. Projekty, które wygrywają, od startu mają pytanie: „o ile to ma zmniejszyć koszty albo zwiększyć przychody w ciągu 12 miesięcy?”. I odpowiadają na nie liczbą w złotówkach.
Inwestują w kompetencje liderów
Stanford HAI w AI Index 2025 zwraca uwagę, że rozjazd między firmami korzystającymi z AI a tymi, które zostały w tyle, w większym stopniu wynika z jakości ludzi niż z jakości narzędzi. Kompetencje managerów są wąskim gardłem wdrożenia, nie GPU.
Krótka wersja: przebudowany workflow z KPI wyrażonym w złotówkach bije najlepszy model bez sponsora w zarządzie.
Checklist lidera: pięć pytań przed startem projektu AI
Zanim podpiszesz zamówienie na narzędzie AI albo podasz rękę dostawcy, zadaj sobie te pięć pytań. Jeśli nie znasz odpowiedzi na którekolwiek, cofnij się o krok. Taniej będzie stracić tydzień teraz niż pół roku później.
- Jaki konkretny proces zamierzam zmienić i ile mnie ten proces dzisiaj kosztuje? Bez baseline’u w złotówkach albo godzinach nie da się później policzyć ROI.
- Kto po stronie biznesu ma skórę w grze? Imię i nazwisko. Członek zarządu albo dyrektor linii biznesowej, nie CIO.
- Czy moje dane są gotowe? Jakość, kompletność, metadata, zgodność z RODO. Jeśli odpowiedź to „nie wiem”, zacznij od audytu danych, nie od wdrożenia AI.
- Jakie trzy metryki biznesowe zmierzę po sześciu i dwunastu miesiącach? Bez tego projekt staje się eksperymentem, a eksperymenty nie mają budżetu na produkcję.
- Kto odpowie na pytania AI Act i inspektora danych? Jeśli to zostanie na później, „później” nie nadejdzie, albo nadejdzie w najgorszym momencie.
Te pięć pytań nie gwarantuje sukcesu. Ale jeśli nie umiesz odpowiedzieć na nie w ciągu dwudziestu minut, znajdujesz się dokładnie w tym miejscu, w którym startowały te 80–95% projektów, które nie dowiozły wyniku.
Podsumowanie
Porażki projektów AI mają twarze menedżerskie, nie inżynierskie. Złe dane, brak właściciela biznesowego, rozwiązanie bez problemu, zerowe KPI i governance po fakcie. To jest prawdziwa lista przyczyn, za którą stoi ponad 80% nieudanych wdrożeń. Firmy, które wygrywają, zaczynają od procesu, liczą w złotówkach i traktują kompetencje liderów jako inwestycję, nie koszt. Jeśli zarządzasz firmą, zespołem albo jednostką biznesową, to nie narzędzie AI rozstrzygnie o twoim wyniku. Rozstrzygnie go sposób, w jaki postawisz pięć pytań z checklisty powyżej.
Jeśli chcesz przeprowadzić swój zespół przez te pięć pytań i wyjść z konkretnym planem wdrożenia, sprawdź Future Leaders: AI dla Liderów, kurs zaprojektowany dla menedżerów, którzy chcą wdrażać AI z wynikiem, a nie tylko z prezentacją.



