Przejdź do zawartości

Sztuczna inteligencja

Z Wikipedii, wolnej encyklopedii
Hierarchia: (z ang.) AI zawiera ML, ML zawiera DL
Humanoidalny robot Sophia podczas szczytu „AI for Good” (2018)

Sztuczna inteligencja, SI[1][2] (ang. artificial intelligence, AI) – inteligencja wykazywana przez urządzenia obliczeniowe (w przeciwieństwie do inteligencji naturalnej). W potocznym rozumieniu jest ona często używana w kontekście ogólnej sztucznej inteligencji. W informatyce i kognitywistyce oznacza także tworzenie modeli i programów symulujących choć częściowo zachowania inteligentne[3]. Sztuczna inteligencja, jako narzędzie matematyczne, nie jest bytem ani świadomą osobą[4]. Jest także przedmiotem rozważań filozofii (filozofia sztucznej inteligencji) oraz przedmiotem zainteresowania nauk społecznych.

Termin „sztuczna inteligencja” wymyślił John McCarthy w 1956[5] na konferencji w Dartmouth. Andreas Kaplan i Michael Haenlein definiują sztuczną inteligencję jako „zdolność systemu do prawidłowego interpretowania danych pochodzących z zewnętrznych źródeł, nauki na ich podstawie oraz wykorzystywania tej wiedzy, aby wykonywać określone zadania i osiągać cele poprzez elastyczne dostosowanie”[6]. Sztuczną inteligencją zajmowali się m.in. Marvin Minsky, John McCarthy, Alan Turing, Edward Feigenbaum, Raj Reddy, Judea Pearl, Allen Newell, Herbert A. Simon.

Sztuczna inteligencja ma dwa podstawowe znaczenia:

Głównym zadaniem badań nad sztuczną inteligencją w drugim znaczeniu jest konstruowanie maszyn i programów komputerowych zdolnych do realizacji wybranych funkcji umysłu i ludzkich zmysłów, niepoddających się numerycznej algorytmizacji[7]. Problemy takie bywają nazywane AI-trudnymi i zalicza się do nich między innymi:

Sztuczna inteligencja jest powiązana z obszarami uczenia maszynowego, logiki rozmytej, widzenia komputerowego, obliczeń ewolucyjnych, sieci neuronowych, robotyki i sztucznego życia.

Algorytmy sztucznej inteligencji często określane są mianem czarnej skrzynki, z powodu trudności w zrozumieniu ich działania, gdy liczba danych i parametrów jest duża. W przypadku małych modeli zrozumienie zasady działania nie sprawia problemu, jednak wraz ze wzrostem liczby danych i parametrów ustalenie, w jaki sposób algorytm podejmuje decyzje, staje się praktycznie niemożliwe[8]. Podejmowano jednak próby opracowania matematycznej teorii działania tych algorytmów (sieci neuronowych), z uwzględnieniem modelu GPT[9].

Techniki

[edytuj | edytuj kod]

Wyszukiwanie i optymalizacja

[edytuj | edytuj kod]
Metoda gradientu prostego w poszukiwaniu minimum funkcji. W każdym kroku parametry przesuwane są w kierunku najszybszego spadku wartości funkcji.

Wiele problemów sztucznej inteligencji można rozwiązywać przez systematyczne przeszukiwanie przestrzeni możliwych rozwiązań. Proste algorytmy, takie jak przeszukiwanie wszerz, okazują się niewystarczające dla większości rzeczywistych problemów ze względu na szybki wzrost liczby możliwych stanów. Z tego powodu stosuje się heurystyki, które ukierunkowują poszukiwanie na bardziej obiecujące rozwiązania, czego przykładem jest algorytm A*[10]. W grach dwuosobowych stosuje się algorytm minimax, który analizuje drzewo możliwych ruchów obu graczy[10]. Odrębną grupę stanowią metody optymalizacji matematycznej. Metoda gradientu prostego pozwala stopniowo poprawiać parametry rozwiązania i stanowi podstawę treningu sieci neuronowych, natomiast obliczenia ewolucyjne, w tym algorytmy genetyczne, udoskonalają populację kandydujących rozwiązań w drodze mutacji i selekcji, a symulowane wyżarzanie dopuszcza okresowe pogorszenie rozwiązania, dzięki czemu unika utknięcia w optimach lokalnych[10].

Logika i reprezentacja wiedzy

[edytuj | edytuj kod]

Podejście symboliczne wykorzystuje logikę formalną do zapisu wiedzy i wnioskowania. Rachunek zdań i logika pierwszego rzędu pozwalają zapisywać fakty oraz relacje między obiektami, a automatyczne dowodzenie twierdzeń umożliwia wyprowadzanie z nich nowych wniosków[10]. Reprezentacja wiedzy obejmuje budowę ontologii i baz wiedzy, z których korzystają systemy ekspertowe[10]. Logika rozmyta dopuszcza stopniowanie prawdziwości zdań, co pozwala modelować pojęcia nieostre, a logiki niemonotoniczne(inne języki) umożliwiają wycofywanie wniosków w świetle nowych informacji[10].

Metody probabilistyczne

[edytuj | edytuj kod]
Robot lokalizujący się na mapie za pomocą filtru cząsteczkowego. Wraz z napływem obserwacji rozkład prawdopodobieństwa położenia (czerwone punkty) skupia się wokół rzeczywistej pozycji robota.

Wiele problemów wymaga podejmowania decyzji na podstawie niepełnych lub niepewnych informacji. Narzędzi do tego dostarczają rachunek prawdopodobieństwa i teoria decyzji[10]. Sieci bayesowskie umożliwiają zwięzły zapis zależności między zmiennymi losowymi oraz wnioskowanie o prawdopodobieństwie zdarzeń, a ukryte modele Markowa opisują procesy zmieniające się w czasie i stanowiły podstawę m.in. wczesnych systemów rozpoznawania mowy[10]. Do śledzenia stanu zmieniających się układów stosuje się także filtr Kalmana i filtry cząsteczkowe, wykorzystywane m.in. w lokalizacji robotów[10].

Uczenie maszynowe

[edytuj | edytuj kod]

Uczenie maszynowe polega na budowie programów, które poprawiają swoje działanie na podstawie danych. W uczeniu nadzorowanym program uczy się na przykładach opatrzonych poprawnymi odpowiedziami, w uczeniu nienadzorowanym samodzielnie wyszukuje wzorce w danych, a w uczeniu przez wzmacnianie doskonali zachowanie na podstawie nagród i kar[10]. Do klasycznych technik uczenia maszynowego należą drzewa decyzyjne, naiwne klasyfikatory bayesowskie, regresja logistyczna i maszyny wektorów nośnych[10].

Sieci neuronowe

[edytuj | edytuj kod]
Uproszczony schemat jednokierunkowej sieci neuronowej. Poszczególne „kółka” oznaczają sztuczne neurony, z wyjątkiem zielonych i żółtych, które oznaczają odpowiednio wejście i wyjście.

Sieć neuronowa opiera się na zbiorze połączeń, znanych również jako sztuczne neurony, które stanowią analogię neuronów w biologicznym mózgu. Jest ona trenowana do rozpoznawania wzorców, a po przeszkoleniu może rozpoznawać te wzorce w świeżych danych. W najprostszej postaci posiada wejście, co najmniej jedną ukrytą warstwę połączeń i wyjście. Każde połączenie posiada funkcję aktywacji, która pozwala na przesyłane informacji do następnej warstwy. Sieć jest zazwyczaj nazywana głęboką siecią neuronową, jeśli ma co najmniej 2 ukryte warstwy[10].

Jednokierunkowe sieci neuronowe pozwalają na przesył informacji tylko w jednym kierunku[10]. Rekurencyjne sieci neuronowe łączy z sobą wyjście z wejściem, co pozwala na tworzenie pamięci krótkotrwałej, a najbardziej popularnym rodzajem tych sieci jest długa pamięć krótkotrwała[10]. Konwolucyjne sieci neuronowe skupiają się na połączeniach pomiędzy neuronami, które są blisko siebie, co jest krytyczne w przetwarzaniu obrazów[10].

Uczenie głębokie

[edytuj | edytuj kod]

Uczenie głębokie[11] używa wielu warstw sieci neuronowej, dzięki czemu możliwe jest operowanie na cechach wysokiego poziomu. Dla przykładu, w przetwarzaniu obrazu, niższe warstwy (bliżej wejścia) mogą wykrywać krawędzie natomiast wyższe warstwy (bliżej wyjścia) mogą przetwarzać koncepcje bliższe ludziom jak liczby, litery czy twarze[12].

Transformery

[edytuj | edytuj kod]

Architektura transformera, zaproponowana przez zespół Google w 2017 roku[13], opiera się na mechanizmie uwagi (ang. attention mechanism), który pozwala modelowi na jednoczesne przetwarzanie wszystkich elementów sekwencji wejściowej i dynamiczne ważenie ich wzajemnych relacji. W odróżnieniu od rekurencyjnych sieci neuronowych transformery przetwarzają dane równolegle, co umożliwia szkolenie na znacznie większych zbiorach danych. Architektura ta stała się podstawą zarówno dużych modeli językowych (GPT, Claude, Gemini), jak i modeli generujących obrazy (DALL-E, Stable Diffusion).

Duże modele językowe

[edytuj | edytuj kod]

Duże modele językowe (LLM) jak wstępnie przeszkolony transformer generatywny (GPT) generują tekst oparty na związkach semantycznych pomiędzy słowami i zdaniami. Tekstowe duże modele językowe bazują na dużym korpusie pobranym z różnych stron w Internecie. Wstępny trening polega na nauczeniu predykcji następnego tokena, po czym następuje docelowy trening mający na celu poprawę użyteczności, wiarygodności i bezpieczeństwa. Do tego celu stosowana jest technika RLHF. Według stanu na 2025 rok LLM-y są podatne na generowanie fałszywych informacji nazywanych halucynacjami, a sam problem potrafi się pogarszać w miarę używania tych modeli do rozumowania[14].

Modele dyfuzyjne

[edytuj | edytuj kod]
Architektura modelu Stable Diffusion. Obraz jest kompresowany do reprezentacji ukrytej, w której zachodzi sterowany tekstem proces dyfuzji, a dekoder odtwarza wynik w pełnej rozdzielczości.

Do początku lat 20. XXI wieku generowanie obrazów opierało się głównie na generatywnych sieciach przeciwstawnych (GAN), w których jeden model tworzy obraz, a drugi ocenia, czy jest on prawdziwy. Sieci te cechowały się jednak niestabilnością treningu i skłonnością do powtarzania tych samych obrazów. Modele dyfuzyjne zastąpiły bezpośrednie generowanie procesem stopniowej rekonstrukcji i pozwoliły uzyskać wyniki lepszej jakości[15]. Nazwa metody nawiązuje do zjawiska dyfuzji w termodynamice. W procesie treningu do obrazu stopniowo dodaje się szum o rozkładzie normalnym, aż obraz staje się czystym szumem, a model uczy się procesu odwrotnego, czyli usuwania szumu krok po kroku[16]. Generowanie nowego obrazu zaczyna się od losowego szumu, z którego model iteracyjnie wydobywa pożądaną strukturę. Praca na pełnej rozdzielczości obrazu wymaga dużej mocy obliczeniowej, dlatego modele dyfuzji ukrytej (LDM), takie jak Stable Diffusion, wykonują ten proces na skompresowanej reprezentacji obrazu utworzonej przez autoenkoder[17]. Zgodność obrazu z opisem tekstowym zapewniają modele łączące tekst i obraz we wspólnej przestrzeni reprezentacji, takie jak CLIP(inne języki) firmy OpenAI, wytrenowany na 400 milionach par obrazów i ich podpisów[18].

Historia badań

[edytuj | edytuj kod]

W 1950 roku Alan Mathison Turing zaproponował, by możliwość udawania człowieka w zdalnej rozmowie uznać za test inteligencji maszyn (test Turinga)[19]. W latach 50. XX wieku zorganizowano pierwsze seminarium poświęcone SI (tzw. Warsztaty w Dartmouth(inne języki)), a także powstało pierwsze laboratorium AI na Carnegie Mellon University, założone przez Allena Newella i Herberta Simona i kilka lat później analogiczne laboratorium w Massachusetts Institute of Technology, założone przez Johna McCarthy’ego.

Termin „sztuczna inteligencja” został po raz pierwszy zaproponowany prawdopodobnie przez Johna McCarthy’ego, który w 1955 r. zdefiniował go w następujący sposób:

„konstruowanie maszyn, o których działaniu dałoby się powiedzieć, że są podobne do ludzkich przejawów inteligencji”.

Istnieją dwa podstawowe podejścia do pracy nad SI:

  • Pierwsze to tworzenie modeli matematyczno-logicznych analizowanych problemów i implementowanie ich w formie programów komputerowych, mających realizować konkretne funkcje uważane powszechnie za składowe inteligencji. W tej grupie, tzw. podejścia symbolicznego, są np. algorytmy genetyczne, metody logiki rozmytej i wnioskowania bazującego na doświadczeniu.
  • Drugie to podejście subsymboliczne, polegające na tworzeniu struktur i programów „samouczących się”, bazujących na modelach sieci neuronowej i sieci asocjacyjnych, oraz opracowywanie procedur „uczenia” takich programów, rozwiązywania postawionych im zadań i szukania odpowiedzi na wybrane klasy „pytań”.

W trakcie wieloletniej pracy laboratoriów i zespołów SI stosujących oba podejścia do problemu postęp okazywał się nierównomierny, z okresami szybkiego rozwoju i tzw. zimami AI(inne języki). Często mimo niepowodzeń w osiąganiu pierwotnych celów, laboratoria te wypracowywały nowe techniki informatyczne, które okazywały się użyteczne do zupełnie innych celów. Przykładami takich technik są np. języki programowania LISP i Prolog. Laboratoria SI stały się też „rozsadnikiem” kultury hakerskiej.

W latach 80. XX wieku popularność zyskały systemy eksperckie, które wykorzystywały ręcznie kodowane reguły do rozwiązywania problemów w wąskich dziedzinach. Po okresie rozczarowania ich ograniczeniami (tzw. druga zima AI(inne języki) na przełomie lat 80. i 90.) badania przesunęły się w kierunku metod statystycznych i uczenia maszynowego[10].

Przełom nastąpił w 2012 roku, gdy sieć neuronowa AlexNet wygrała konkurs ImageNet Large Scale Visual Recognition Challenge z przewagą ponad 10 punktów procentowych nad metodami tradycyjnymi, co zapoczątkowało erę dominacji uczenia głębokiego[20]. Za wkład w rozwój uczenia głębokiego Geoffrey Hinton, Yann LeCun i Yoshua Bengio otrzymali Nagrodę Turinga w 2018 roku. Kolejnymi kamieniami milowymi były: pokonanie mistrza świata w Go przez program AlphaGo (2016), opublikowanie architektury transformera (2017) oraz rozwój coraz większych dużych modeli językowych, takich jak GPT-3(inne języki) (2020) i GPT-4(inne języki) (2023).

Sztuczna inteligencja zyskała szeroką rozpoznawalność publiczną po uruchomieniu ChatGPT w listopadzie 2022 roku. W ciągu dwóch miesięcy serwis osiągnął 100 milionów użytkowników[21].

Według badania z 2023 roku 94% polskich specjalistów IT o różnych poziomach doświadczenia wykorzystuje narzędzia SI w codziennej pracy, a 28,7% obawia się, że w ciągu najbliższych kilku lat sztuczna inteligencja zastąpi ich w pracy[22].

Od czasów powstania ChatGPT trwa intensywna rywalizacja między firmami technologicznymi o dominację na rynku dużych modeli językowych[23]. Najnowsze rozwiązania związane z tymi modelami to agenty AI, które dają możliwość wykonywania czynności, zazwyczaj poprzez komunikację z aplikacjami internetowymi[24] oraz protokół MCP stworzony przez firmę Anthropic, który ułatwia komunikację modeli językowych z zewnętrznymi systemami lub usługami[25].

Zastosowania

[edytuj | edytuj kod]

Sztuczna inteligencja jest stosowana od dekad w różnych dziedzinach gospodarki. W 1980 rynek AI miał rozmiar liczony w setkach milionów dolarów, a w roku 1988 był szacowany na miliardy dolarów[10] i głównie skupiał się na zastosowaniach systemów eksperckich. W latach 90. XX wieku znajdowano coraz więcej zastosowań dla AI w technologiach informacyjnych[26] takich jak robotyka przemysłowa, aplikacje bankowe[27], diagnostyka medyczna[27], rozpoznawanie mowy[28] czy wyszukiwarka Google[29]. Kolejne dekady przyniosły dalsze zastosowania sztucznej inteligencji wraz z rosnącą mocą obliczeniową komputerów i wypracowaniem bardziej zaawansowanych technik[10]. Lata dwudzieste XXI wieku przyniosły ekspansję AI(inne języki)[30].

W 2024 roku szacowano, że sztuczna inteligencja będzie miała wpływ na wzrost PKB w wysokości od 1,1 do 1,6% w ciągu 10 lat[31]. W 2024 roku w Polsce 5,9% przedsiębiorstw wykorzystywało AI, wskaźnik ten był niższy niż średnia UE (13,48%). W 2023 roku wskaźnik ten wynosił odpowiednio 3,67% i 8,00%[32]. W Stanach Zjednoczonych w 2023 roku 3,8% przedsiębiorstw korzystało z AI do produkcji dóbr i usług[33]. W roku 2024 83% firm w Chinach i 48% firm w Polsce testowało lub wdrożyło generatywną sztuczną inteligencję w co najmniej jednym procesie biznesowym[34].

Łączna wartość nakładów publicznych na AI w latach 2013–2023 w USA wyniosła 5,233 mld USD, w Niemczech 278 mln USD i Polsce 55,92 mln USD[23]. Łączna wysokość prywatnych inwestycji na AI w 2024 roku w Stanach wyniosła 109,8 mld USD, w Europie 19,42 mld USD (w tym w Niemczech 1,97 mld USD), w Chinach 9,29 mld USD[23]. W 2024 roku udział Polski w globalnych prywatnych inwestycjach w sztuczną inteligencję wyniósł 0,05%[35].

Generatywna sztuczna inteligencja

[edytuj | edytuj kod]
Obraz wygenerowany przez model Stable Diffusion na podstawie opisu tekstowego „astronauta jadący na koniu”

Generatywna sztuczna inteligencja (GenAI) jest ogółem narzędzi, które korzystają z modeli generatywnych do tworzenia tekstu, obrazów, wideo czy innych formatów danych[36][37]. Do generowania zawartości korzysta się z inżynierii podpowiedzi. W szczególności, duże modele językowe mogą być używane przez programistów do pisania kodu programów[38]. Praktyka tworzenia programów komputerowych za pomocą sztucznej inteligencji (bez zrozumienia kodu źródłowego) określana jest jako „vibe coding[39]. Możliwości tej techniki są ograniczone, jako że sztuczna inteligencja nie radzi sobie w bardziej złożonych zastosowaniach[40]. Duże modele językowe mogą być również wykorzystywane do rozwiązywania problemów matematycznych[41][42].

Ekonomia

[edytuj | edytuj kod]

W ekonomii powszechnie stosuje się systemy automatycznie oceniające m.in. zdolność kredytową, profil najlepszych klientów czy planujące kampanie reklamowe. Systemy te poddawane są wcześniej automatycznemu uczeniu na podstawie posiadanych danych (np. klientów banku, którzy regularnie spłacali kredyt i klientów, którzy mieli z tym problemy).

Rozwiązania z zakresu AI są też używane w prognozowaniu i wykrywaniu oszustw. Przy użyciu m.in. regresji logistycznej systemy analizują zbiory danych w celu wychwytywania np. podejrzanych transakcji finansowych[43].

Wojskowość

[edytuj | edytuj kod]

Sztuczna inteligencja znajduje zastosowanie w takich aspektach wojskowości jak autonomiczne systemy bojowe, wsparcie podejmowania decyzji i optymalizacja logistyki[44][45].

Wojskowe zastosowanie sztucznej inteligencji jest przyczyną wyścigu zbrojeń sztucznej inteligencji.

Medycyna

[edytuj | edytuj kod]
Ramię robota chirurgicznego da Vinci

Sztuczna inteligencja ma potencjał do transformacji medycyny. SI już teraz pomaga w wykonywaniu różnorodnych zadań, takich jak diagnostyka obrazowa, przewidywanie chorób, prowadzenie badań i zarządzanie danymi pacjentów. Algorytmy SI mogą analizować duże ilości danych szybciej i dokładniej niż ludzie, co może przynieść korzyści dla pacjentów i lekarzy[46].

Zapis pierwszej partii meczu programu AlphaGo z Lee Sedolem (2016), wygranej przez program

Sieci neuronowe znajdują zastosowanie m.in. w programowaniu „inteligentnych przeciwników” w grach komputerowych, a także potrafią samodzielnie przechodzić całe gry[47][48].

Istnieją programy grające w szachy na poziomie wyższym niż arcymistrzowski, a poziom arcymistrzowski osiągają obecnie programy działające na mobilnych urządzeniach[49]. Stworzono również program grający w go, który pokonał światową czołówkę[50]. Wcześniej podobne zwycięstwa odnosiły programy grające w warcaby, w tym warcaby polskie[51]. W 2022 roku program NooK, opracowany przez francuską firmę NukkAI, pokonał ośmioro mistrzów świata w uproszczonej wersji brydża sportowego[52].

Inne zastosowania sztucznej inteligencji

[edytuj | edytuj kod]

Nieudane próby zastosowań

[edytuj | edytuj kod]

W 2020 roku portal The Verge opisał przypadek programu Edgenuity, który wykorzystywał sztuczną inteligencję do automatycznego oceniania prac domowych uczniów. Próba okazała się nieudana, ponieważ uczniowie oszukiwali algorytm oceniający, umieszczając w odpowiedziach odpowiednie słowa kluczowe[56].

 Główny artykuł: Etyka sztucznej inteligencji.

Sztuczna inteligencja a uprzedzenia

[edytuj | edytuj kod]

Systemy sztucznej inteligencji mogą przejawiać różnego rodzaju uprzedzenia np. rasowe lub seksistowskie, ze względu na stronniczość danych testowych[57] i zjawisko nieświadomych uprzedzeń (unconscious bias). Może to rodzić poważne konsekwencje w zależności od miejsca, w którym sztuczna inteligencja ma zastosowanie.

Przykłady:

Problem uprzedzeń sztucznej inteligencji został przedstawiony w filmie dokumentalnym Zakodowane uprzedzenie(inne języki) z 2020 roku. Film dostępny jest w serwisie Netflix[61].

Dezinformacja

[edytuj | edytuj kod]

Sztuczna inteligencja mimo zalet może być także wykorzystywana do szerzenia dezinformacji. Można jej używać do tworzenia tzw. deepfakeów[62], czy tworzenie treści przez duże modele językowe. W przypadku modeli językowych może to być niezamierzone, gdy model halucynuje[63], lub celowe np. tworzenie fake news, gdzie modele językowe mogą ułatwić pracę trollom internetowym[64]. Modele językowe mogą także pomagać w walce z dezinformacją[65].

Regulacja

[edytuj | edytuj kod]

Regulacja i polityka dotycząca sztucznej inteligencji jest nowym problemem w jurysdykcjach na całym świecie[66]. Według stanu na 2022 rok większość krajów UE opublikowała swoją strategię AI, podobnie jak Kanada, Chiny, Japonia, Rosja i Stany Zjednoczone[67]. W 2024 roku weszło w życie rozporządzenie Unii Europejskiej AI Act (akt o sztucznej inteligencji), które wprowadza klasyfikację systemów AI według poziomu ryzyka i zakazuje określonych zastosowań, takich jak masowa punktacja społeczna i nieukierunkowane zbieranie danych biometrycznych[68]. Jest to pierwszy na świecie kompleksowy akt prawny regulujący sztuczną inteligencję.

Równolegle w 2024 roku Rada Europy przyjęła pierwszą międzynarodową Konwencję ramową Rady Europy o sztucznej inteligencji[69], którą podpisały Unia Europejska, Stany Zjednoczone, Wielka Brytania i inne kraje[70].

Filozofia

[edytuj | edytuj kod]
 Główny artykuł: Filozofia sztucznej inteligencji.

Debaty filozoficzne od dawna dotyczą natury inteligencji i możliwości tworzenia inteligentnych maszyn[71]. Kolejnym ważnym zagadnieniem było to, czy maszyny mogą być świadome, oraz związane z tym implikacje etyczne[72]. Wiele innych zagadnień filozoficznych jest istotnych dla sztucznej inteligencji, takich jak epistemologia i wolna wola[73]. Szybki postęp zintensyfikował publiczne dyskusje na temat filozofii i etyki sztucznej inteligencji.

Świadomość, wrażliwość i umysł maszyn

[edytuj | edytuj kod]
 Główny artykuł: Sztuczna świadomość.

Odpowiedź na pytanie, czy maszyna może mieć umysł, świadomość i stany mentalne w tym samym sensie co ludzie, jest tematem debaty wśród filozofów umysłu. Ta kwestia rozważa wewnętrzne doświadczenia maszyny, a nie jej zewnętrzne zachowanie. Główny nurt badań nad sztuczną inteligencją uważa tę kwestię za nieistotną, ponieważ nie wpływa ona na cele tej dziedziny: budowania maszyn, które mogą rozwiązywać problemy za pomocą inteligencji. Stuart Russell i Peter Norvig(inne języki) dodają, że projekt uczynienia maszyny świadomą dokładnie w taki sposób, w jaki świadomi są ludzie, wykracza poza obecne możliwości badaczy[10].

Badania opublikowane w 2026 roku wskazują, że modele AI mogą wytwarzać tzw. „emocje funkcjonalne”, czyli wzorce aktywności wpływające na sposób generowania odpowiedzi i podejmowania decyzji. Struktury te pełnią rolę podobną do emocji w sensie funkcjonalnym, jednak nie wiążą się z przeżyciami ani świadomością[74][75]. Zjawisko to sprzyja antropomorfizacji sztucznej inteligencji, czyli przypisywaniu jej ludzkich cech psychicznych, mimo braku dowodów na istnienie świadomości w obecnych systemach AI[76].

Komputacjonizm i funkcjonalizm

[edytuj | edytuj kod]
 Główne artykuły: KomputacjonizmFunkcjonalizm.

Komputacjonizm to stanowisko w filozofii umysłu, zgodnie z którym umysł ludzki jest systemem przetwarzania informacji, a myślenie jest formą obliczeń. Komputacjonizm twierdzi, że relacja między umysłem a ciałem jest podobna lub identyczna do relacji między oprogramowaniem a sprzętem, a zatem może być rozwiązaniem dylematu psychofizycznego. To stanowisko filozoficzne zostało zainspirowane pracą badaczy AI i naukowców zajmujących się kognitywistyką w latach 60. XX wieku i zostało pierwotnie zaproponowane przez filozofów Jerry'ego Fodora i Hilary'ego Putnama[77].

Filozof John Searle scharakteryzował to stanowisko jako tzw. silną AI: odpowiednio zaprogramowany komputer z właściwymi danymi wejściowymi i wyjściowymi miałby umysł w dokładnie takim samym sensie, w jakim mają umysły ludzie[78]. Searle kwestionuje to twierdzenie swoim argumentem chińskiego pokoju, który próbuje wykazać, że nawet komputer zdolny do idealnego symulowania ludzkiego zachowania nie miałby umysłu[79].

Sztuczna inteligencja na ludzkim poziomie

[edytuj | edytuj kod]

Do początku lat 20. XXI wieku w literaturze dominował podział dwudzielny. Systemy dzielono na wąską sztuczną inteligencję(inne języki) (ANI), wyspecjalizowaną w pojedynczym zadaniu, oraz ogólną sztuczną inteligencję (AGI), rozumianą jako odległy cel w postaci systemu dorównującego człowiekowi we wszystkich aspektach poznawczych. Pojawienie się dużych modeli językowych stworzyło kategorię pośrednią, która wymusiła rewizję tego podziału. Modele takie jak GPT-3 wykazały umiejętności obejmujące wiele dziedzin, w tym pisanie kodu i analizę tekstów prawnych, mimo że nie były do nich specjalnie trenowane. W 2021 roku badacze z Uniwersytetu Stanforda wprowadzili termin modele podstawowe (ang. foundation models) na określenie zmiany paradygmatu treningu. Zamiast budować osobny model dla każdego zadania, trenuje się jeden model na ogromnych zbiorach danych, a następnie dostosowuje go do wielu zastosowań[80].

W 2023 roku badacze Google DeepMind zaproponowali ramy pomiaru postępu w drodze do AGI, oceniające systemy na dwóch niezależnych osiach: szerokości (systemy wąskie lub ogólne) oraz poziomu kompetencji (od nowicjusza, przez eksperta, po poziom nadludzki)[81]. W tej taksonomii program AlphaZero(inne języki) jest klasyfikowany jako system wąski o poziomie wirtuozerskim, ponieważ przewyższa wszystkich ludzi w szachach i go, ale nie potrafi wykonać żadnego innego zadania. Modele takie jak GPT-4 czy Gemini zaliczono do „wyłaniającej się AGI”, to jest systemów ogólnych, których kompetencje nie osiągają jeszcze poziomu wykwalifikowanego człowieka we wszystkich dziedzinach. Najwyższym poziomem tej skali jest superinteligencja (ASI), czyli system przewyższający całą ludzkość w każdym zadaniu poznawczym[81].

Prognozy dotyczące osiągnięcia przez SI ludzkiego poziomu zmieniały się z biegiem lat. W ankiecie z 2014 roku połowa ekspertów szacowała 50% prawdopodobieństwo osiągnięcia tego poziomu przed 2040 rokiem[82]. W badaniu AI Impacts z 2023 roku, obejmującym ponad 2700 badaczy, mediana prognoz przesunęła się na 2047 rok (50% prawdopodobieństwo osiągnięcia poziomu ludzkiego we wszystkich zadaniach), przy czym 10% respondentów uznało, że nastąpi to przed 2027 rokiem[83].

Systemy AI w latach 2023–2025 zdały wiele testów wcześniej zarezerwowanych dla ludzi: GPT-4 uzyskał wynik w górnych 10% na amerykańskim egzaminie adwokackim (Uniform Bar Exam)[84], a kolejne modele zdały egzaminy z medycyny (USMLE), matematyki olimpijskiej i programowania. Wyniki te nie oznaczają jednak osiągnięcia AGI, ponieważ obecne systemy mają trudności z zadaniami wymagającymi rozumowania w nowych kontekstach, planowania długoterminowego i uczenia się z niewielkiej liczby przykładów[23].

Zobacz też

[edytuj | edytuj kod]

Przypisy

[edytuj | edytuj kod]
  1. Sztuczna inteligencja (SI) [online], www.infor.pl [dostęp 2025-07-21].
  2. sztuczna inteligencja, [w:] Encyklopedia PWN [online], Wydawnictwo Naukowe PWN [dostęp 2025-07-21].
  3. David Poole, Alan Mackworth, Randy Goebel, Computational Intelligence: A Logical Approach, Oxford University Press, 1998, ISBN 978-0-19-510270-3 (ang.).
  4. Natalia Pochroń, Wybitny ekspert zachwyca się Polską. "Jest druga na świecie". I obala kłamstwo o AI [online], wiadomosci.onet.pl, 19 maja 2026 [dostęp 2026-05-19] (pol.).
  5. Boden 2020 ↓, s. 30.
  6. Andreas Kaplan, Michael Haenlein, Siri, Siri, in my Hand: Who’s the Fairest in the Land? On the Interpretations, Illustrations, and Implications of Artificial Intelligence, „Business Horizons”, 62 (1), 2019, s. 15–25, DOI10.1016/j.bushor.2018.08.004 (ang.).
  7. Annette Flanagin, Kirsten Bibbins-Domingo, Michael Berkwits, Stacy L. Christiansen, Nonhuman “Authors” and Implications for the Integrity of Scientific Publication and Medical Knowledge, „Journal of the American Medical Association”, 329 (8), 2023, s. 637, DOI10.1001/jama.2023.1344 [dostęp 2024-04-12] (ang.).
  8. „Czarna skrzynka” AI. Czy to jest niebezpieczne? Tak odpowiedział ChatGPT... [online], Dziennik.pl, 3 czerwca 2023 [dostęp 2024-04-11].
  9. How do neural networks learn? A mathematical formula explains how they detect relevant patterns [online], phys.org, 12 marca 2024 [dostęp 2024-04-11].
  10. a b c d e f g h i j k l m n o p q r s Stuart Russell, Peter Norvig, Artificial Intelligence: A Modern Approach, wyd. 3rd, USA: Prentice Hall Press, listopad 2009, DOI10.5555/1671238, ISBN 978-0-13-604259-4 [dostęp 2025-05-31].
  11. Deep Learning [online], www.deeplearningbook.org [dostęp 2025-05-31] [zarchiwizowane z adresu 2016-04-16].
  12. Li Deng, Dong Yu, Deep Learning: Methods and Applications, „Foundations and Trends® in Signal Processing”, 7 (3–4), 2014, s. 197–387, DOI10.1561/2000000039, ISSN 1932-8346 [dostęp 2025-05-31] (ang.).
  13. Ashish Vaswani i inni, Attention Is All You Need, „arXiv”, 2017, DOI10.48550/arXiv.1706.03762, arXiv:1706.03762 (ang.).
  14. Cade Metz, Karen Weise, A.I. Is Getting More Powerful, but Its Hallucinations Are Getting Worse, „The New York Times”, 5 maja 2025, ISSN 0362-4331 [dostęp 2025-05-31] (ang.).
  15. Prafulla Dhariwal, Alex Nichol, Diffusion Models Beat GANs on Image Synthesis, „arXiv”, 2021, DOI10.48550/arXiv.2105.05233, arXiv:2105.05233 (ang.).
  16. Jonathan Ho, Ajay Jain, Pieter Abbeel, Denoising Diffusion Probabilistic Models, „arXiv”, 2020, DOI10.48550/arXiv.2006.11239, arXiv:2006.11239 (ang.).
  17. Robin Rombach, Andreas Blattmann, Dominik Lorenz, Patrick Esser, Björn Ommer, High-Resolution Image Synthesis with Latent Diffusion Models, „arXiv”, 2022, DOI10.48550/arXiv.2112.10752, arXiv:2112.10752 (ang.).
  18. Alec Radford i inni, Learning Transferable Visual Models From Natural Language Supervision, „arXiv”, 2021, DOI10.48550/arXiv.2103.00020, arXiv:2103.00020 (ang.).
  19. Christof Koch, Giulio Tononi, Test na świadomość, „Świat Nauki” (7 (239)), Prószyński Media, lipiec 2011, s. 32–35, ISSN 0867-6380.
  20. Alex Krizhevsky, Ilya Sutskever, Geoffrey E. Hinton, ImageNet Classification with Deep Convolutional Neural Networks, „Communications of the ACM”, 60 (6), 2017, s. 84–90, DOI10.1145/3065386 (ang.).
  21. Krystal Hu, ChatGPT sets record for fastest-growing user base, „Reuters”, 2 lutego 2023 (ang.).
  22. ChatGPT w pracy. Kto i jak korzysta z tego narzędzia i jaki mamy do niego stosunek? [online], interaktywnie.com [dostęp 2023-07-30] (pol.).
  23. a b c d The 2025 AI Index Report | Stanford HAI [online], hai.stanford.edu [dostęp 2025-06-01] (ang.).
  24. Agenci AI już teraz pracują obok ludzi w wielu firmach. Oto jak zwiększają przychody lub generują oszczędności [online], Business Insider Polska, 12 stycznia 2025 [dostęp 2025-03-13].
  25. Introducing the Model Context Protocol [online], www.anthropic.com [dostęp 2025-03-13] (ang.).
  26. National Research Council (U.S.). Committee on Innovations in Computing and Communications: Lessons from History, Funding a revolution : government support for computing research, Washington, D.C. : National Academy Press, 1999, ISBN 978-0-309-06278-7 [dostęp 2025-06-01].
  27. a b CNN.com - AI set to exceed human brain power - Jul 25, 2006 [online], edition.cnn.com [dostęp 2025-06-01].
  28. Are you talking to me?, „The Economist, ISSN 0013-0613 [dostęp 2025-06-01].
  29. Google's man behind the curtain - CNET News [online], news.cnet.com [dostęp 2025-06-01] [zarchiwizowane z adresu 2008-10-06].
  30. Bernard Marr, Beyond The Hype: What You Really Need To Know About AI In 2023 [online], Forbes [dostęp 2025-06-01] (ang.).
  31. What do we know about the economics of AI? [online], MIT News | Massachusetts Institute of Technology, 6 grudnia 2024 [dostęp 2025-06-01] (ang.).
  32. Use of artificial intelligence in enterprises [online], ec.europa.eu [dostęp 2025-08-30] (ang.).
  33. US Census Bureau, Only 3.8% of Businesses Use AI to Produce Goods and Services, Highest Use in Information Sector [online], Census.gov [dostęp 2025-06-01] (ang.).
  34. Chiny liderem w wykorzystaniu GenAI w biznesie [online], managerplus.pl, 6 września 2024 [dostęp 2025-06-01].
  35. Ekonomiści: na AI wydajemy mniej od toczącej wojnę Ukrainy [online], rp.pl [dostęp 2025-06-14] (pol.).
  36. What is Generative AI? | IBM [online], web.archive.org, 13 grudnia 2024 [dostęp 2025-04-28] [zarchiwizowane z adresu 2024-12-13].
  37. What is ChatGPT, DALL-E, and generative AI? | McKinsey [online], web.archive.org, 23 kwietnia 2023 [dostęp 2025-04-28] [zarchiwizowane z adresu 2023-04-23].
  38. Helion SA, Jak sztuczna inteligencja może pomóc programistom w codziennej pracy? [online], videopoint.pl [dostęp 2025-03-13].
  39. Benj Edwards, Will the future of software development run on vibes? [online], Ars Technica, 5 marca 2025 [dostęp 2025-03-13] (ang.).
  40. Dong Liang, The Reality of Vibe Coding, why AI Still Fails at Complex Projects [online], 4 marca 2025 [dostęp 2025-03-13].
  41. Improving mathematical reasoning with process supervision [online], openai.com, 19 października 2023 [dostęp 2025-04-28] (ang.).
  42. Zhihong Shao i inni, DeepSeekMath: Pushing the Limits of Mathematical Reasoning in Open Language Models, arXiv, 27 kwietnia 2024, DOI10.48550/arXiv.2402.03300 [dostęp 2025-08-02] (ang.).
  43. Dmitry Babenko, Haralambos Marmanis, Inteligentna sieć. Algorytmy przyszłości, Tomasz Walczak (tłum.), Gliwice: Wydawnictwo Helion, 2017, ISBN 978-83-283-3250-8, OCLC 995439215 [dostęp 2020-08-29].
  44. Leszek Cwojdziński (ilustr.), Wpływ sztucznej inteligencji na rozwój nowoczesnych systemów bezzałogowych [online], kwartalnikbellona.com [dostęp 2025-04-19].
  45. W Wojsku Polskim powstaje Centrum Implementacji Sztucznej Inteligencji - Ministerstwo Obrony Narodowej - Portal Gov.pl [online], Ministerstwo Obrony Narodowej [dostęp 2025-04-14].
  46. Czy sztuczna inteligencja może zastąpić lekarzy? [online], Medica, 12 czerwca 2023 [dostęp 2023-06-21] (pol.).
  47. Neural Networks in Gaming: AI That Learns from Players | Gamixlabs [online], www.gamixlabs.com, 28 marca 2025 [dostęp 2025-04-14] (ang.).
  48. Piotr Waszczuk, Polski zespół stworzył sieć neuronową, która uczy się grać w gry znane z platformy Atari [online], ITwiz, 20 listopada 2017 [dostęp 2025-04-14].
  49. Pocket Fritz 4 osiągnął poziom 2898 punktów [online], The Week in Chess [dostęp 2025-04-06].
  50. Program AlphaGo wygrał pierwszy mecz w Go z najlepszym graczem na świecie [online], Komputer Świat [dostęp 2016-03-28].
  51. The draughts program Buggy [online], buggy-online.com [dostęp 2017-11-26].
  52. Sheena Goodyear, An artificial intelligence just beat 8 world champions at bridge [online], CBC Radio, 30 marca 2022 [dostęp 2026-06-05] (ang.).
  53. Nirali Bhaliya, Jay Gandhi, Dheeraj Kumar Singh, NLP based Extraction of Relevant Resume using Machine Learning [online], maj 2020.
  54. Real-time video analysis for surveillance and monitoring [online], NeuroSYS [dostęp 2021-05-21] [zarchiwizowane z adresu 2021-04-28] (ang.).
  55. The Nobel Prize in Chemistry 2024 [online], nobelprize.org [dostęp 2026-04-06] (ang.).
  56. Monica Chin, These students figured out their tests were graded by AI – and the easy way to cheat [online], The Verge, 2 września 2020 [dostęp 2020-09-06] (ang.).
  57. Thompson 2019 ↓, s. 317–360.
  58. Thompson 2019 ↓, s. 340–341.
  59. Thompson 2019 ↓, s. 343.
  60. Thompson 2019 ↓, s. 344–345.
  61. Zakodowane uprzedzenie (2020) [online], naEKRANIE.pl [dostęp 2024-11-22].
  62. Techniki manipulacji w świecie deepfake'ów - jak sztuczna inteligencja zmienia oblicze dezinformacji - Portal sztucznej inteligencji - Portal Gov.pl [online], Portal sztucznej inteligencji [dostęp 2025-11-25].
  63. Odpowiedzialność za wadliwe działanie AI - IT w Administracji - Centrum Szkoleniowe [online] [dostęp 2025-11-25].
  64. FakeGPT: Fake News Generation, Explanation and Detection of Large Language Models [online], arxiv.org [dostęp 2025-11-25].
  65. Weronika Szlachta, Wykorzystanie Sztucznej Inteligencji w walce z dezinformacją na przykładzie ChatGPT [online], 28 czerwca 2024 [dostęp 2025-11-25].
  66. Regulation of Artificial Intelligence in Selected Jurisdictions [online], 2019.
  67. The race against time for smarter development [online], unesdoc.unesco.org [dostęp 2025-05-31].
  68. Akt w sprawie sztucznej inteligencji [online], digital-strategy.ec.europa.eu [dostęp 2026-04-06].
  69. Komisja podpisała Konwencję ramową Rady Europy o sztucznej inteligencji i prawach człowieka, demokracji i praworządności | Kształtowanie cyfrowej przyszłości Europy [online], digital-strategy.ec.europa.eu [dostęp 2025-05-31].
  70. Council of Europe opens first ever global treaty on AI for signature - Portal [online], www.coe.int [dostęp 2025-05-31] [zarchiwizowane z adresu 2024-09-17] (ang.).
  71. Anthony Grayling, Philosophy is crucial in the age of AI, „The Conversation” [dostęp 2025-05-31] [zarchiwizowane z adresu 2024-10-05] (ang.).
  72. Oshan Jarow, Will AI ever become conscious? It depends on how you think about biology., „Vox”, 15 czerwca 2024 [dostęp 2025-05-31] [zarchiwizowane z adresu 2024-09-21] (ang.).
  73. John McCarthy, The Philosophy of AI and the AI of Philosophy [online], jmc.stanford.edu [dostęp 2025-05-31] [zarchiwizowane z adresu 2018-10-23].
  74. AI udaje emocje. "Próby obchodzenia poleceń" [online], Spider's Web, 3 kwietnia 2026 [dostęp 2026-04-06].
  75. Will Knight, Anthropic Says That Claude Contains Its Own Kind of Emotions [online], WIRED Middle East, 6 kwietnia 2026 [dostęp 2026-04-06] (ang.).
  76. Janet Harrison, Anthropic Says Treating AI Like It Has Feelings Might Actually Be Useful [online], Startup Fortune, 4 kwietnia 2026 [dostęp 2026-04-06] (ang.).
  77. Michael Rescorla, The Computational Theory of Mind, Edward N. Zalta, Uri Nodelman (red.), wyd. Winter 2024, Metaphysics Research Lab, Stanford University, 2024 [dostęp 2025-05-31].
  78. John R. Searle, Mind, Language, and Society, Basic Books, 2000, ISBN 978-0-465-04521-1 [dostęp 2025-05-31].
  79. John R. Searle, Minds, brains, and programs, „Behavioral and Brain Sciences”, 3 (3), 1980, s. 417–424, DOI10.1017/S0140525X00005756, ISSN 1469-1825 [dostęp 2025-05-31] (ang.).
  80. Center for Research on Foundation Models, On the Opportunities and Risks of Foundation Models, „arXiv”, 2021, DOI10.48550/arXiv.2108.07258, arXiv:2108.07258 (ang.).
  81. a b Meredith Ringel Morris i inni, Levels of AGI for Operationalizing Progress on the Path to AGI, „arXiv”, 2023, DOI10.48550/arXiv.2311.02462, arXiv:2311.02462 (ang.).
  82. Vincent C. Müller, Nick Bostrom, Future Progress in Artificial Intelligence: A Survey of Expert Opinion [online], 2014, s. 10.
  83. Katja Grace i inni, Thousands of AI Authors on the Future of AI, „arXiv”, 2024, DOI10.48550/arXiv.2401.02843, arXiv:2401.02843 (ang.).
  84. OpenAI, GPT-4 Technical Report, „arXiv”, 2023, DOI10.48550/arXiv.2303.08774, arXiv:2303.08774 (ang.).

Bibliografia

[edytuj | edytuj kod]
  • Clive Thompson, Koderzy, Znak Litera Nowa, 2019, s. 317–360, ISBN 83-240-7009-5 (pol.).
  • Margaret Ann Boden, Sztuczna inteligencja, Wydawnictwo Uniwersytetu Łódzkiego, 2020, ISBN 83-8142-639-1 (pol.).

Linki zewnętrzne

[edytuj | edytuj kod]
Polskojęzyczne
  • PSSI – Oficjalna strona Polskiego Stowarzyszenia Sztucznej Inteligencji
  • Sztuczna inteligencja (materiały dydaktyczne MIMUW na studia informatyczne I stopnia)

publikacja w otwartym dostępie – możesz ją przeczytać Nagrania na YouTube [dostęp 2023-11-30]:

Anglojęzyczne