Gdy sztuczna inteligencja spotyka retro gaming
Robert Caruso, inżynier architektury infrastruktury w Citrix, przeprowadził ten eksperyment w weekend, stawiając potężnego chatbota OpenAI przeciwko wirtualnej konsoli Atari 2600 emulowanej przez program Stella. Co ciekawe, to sam ChatGPT zaproponował tę konfrontację podczas rozmowy o historii sztucznej inteligencji w szachach.
“ChatGPT został kompletnie zmiażdżony na poziomie dla początkujących” – napisał Caruso w swoim poście na LinkedIn. To tym bardziej zaskakujące, gdy zdamy sobie sprawę z różnicy technologicznej między obiema stronami konfliktu.
Atari 2600 vs ChatGPT – porównanie mocy obliczeniowej
Zestawienie jest naprawdę fascynujące. Atari 2600 posiada 8-bitowy procesor działający z częstotliwością zaledwie 1,19 MHz i dysponuje jedynie 128 bajtami pamięci RAM. Video Chess, czyli jedyna gra szachowa wydana dla tej konsoli w 1979 roku, może analizować maksymalnie jeden lub dwa ruchy do przodu.
Z drugiej strony mamy ChatGPT 4o – model trenowany na około bilionie tokenów przez kilka tygodni z wykorzystaniem milionów TFLOPS mocy obliczeniowej współczesnych GPU. Wydawałoby się, że to będzie spacer po parku dla sztucznej inteligencji.
Seria błędów i kapitulacja
Rzeczywistość okazała się jednak brutalna. ChatGPT mylił wieże z gońcami, nie zauważał ataków pionów i wielokrotnie tracił orientację, gdzie znajdują się jego figury.
Początkowo chatbot tłumaczył swoje porażki tym, że ikony Atari Chess są “zbyt abstrakcyjne do rozpoznania”. Caruso postanowił więc zmienić interfejs na standardową notację szachową. Niestety, to nie pomogło – ChatGPT “popełnił wystarczająco dużo błędów, żeby zostać wyśmianym z trzecioklasowego klubu szachowego”.
“Przez 90 minut musiałem powstrzymywać go przed wykonywaniem okropnych ruchów i poprawiać jego świadomość planszy wielokrotnie w każdej turze” – relacjonuje Caruso. Chatbot “obiecywał, że się poprawi, ‘jeśli tylko zaczniemy od nowa'”, ale bezskutecznie.
Historia szachów komputerowych w perspektywie
Warto przypomnieć, że szachy to tradycyjny benchmark dla systemów komputerowych. Supercomputer IBM Deep Blue przeszedł do historii w 1997 roku, pokonując Garry’ego Kasparova, ówczesnego mistrza świata. Video Chess dla Atari 2600 powstało jednak jeszcze wcześniej – w czasach, gdy programiści musieli zmieścić całą grę w niewyobrażalnie małej pamięci.
Gra korzystała z sprytnej techniki zwanej “venetian blinds”, rysując figury w przeplatających się liniach, co pozwalało na zmieszczenie wszystkich elementów na ekranie mimo ograniczeń sprzętowych.
Czym są modele językowe tak naprawdę?
Ten eksperyment doskonale ilustruje fundamentalną prawdę o obecnych systemach AI. Duże modele językowe – nawet te “rozumujące” – to w gruncie rzeczy modele przewidywania języka. Nie “wiedzą” niczego, nie mają zdolności rozumowania czy dedukcji i z pewnością nie posiadają własnej inteligencji.
ChatGPT świetnie radzi sobie z generowaniem tekstu, odpowiadaniem na pytania czy pomocą w codziennych zadaniach. Ale gdy spotyka się z zadaniem wymagającym przestrzennej orientacji, długoterminowego planowania i precyzyjnej logiki – jak szachy – jego ograniczenia stają się bolesnie widoczne.
Lekcja pokory dla branży tech
To jasny dowód na to, że dedykowane narzędzia stworzone lub zaprogramowane do konkretnego celu, jak program szachowy z Atari 2600, wciąż przewyższają asystentów AI, które mają robić “wszystko”.
Może to powinna być ważna lekcja dla firm technologicznych jak OpenAI i użytkowników polegających na narzędziach AI. Mimo wszystkich swoich możliwości, ChatGPT wciąż wydaje się mniej inteligentny w niektórych zadaniach niż symulator Atari na poziomie dla początkujących.
Czytaj też: Sam Altman: ChatGPT już teraz jest potężniejszy od każdego człowieka w historii
Czy oznacza to, że powinniśmy przestać używać AI? Absolutnie nie. Ale warto pamiętać o jego ograniczeniach i nie oczekiwać cudów w każdej dziedzinie. Czasami prosty, 48-letni algorytm z 128 bajtami pamięci okazuje się skuteczniejszy od najnowocześniejszej sztucznej inteligencji.