• Nie Znaleziono Wyników

TT jest za mało restrykcyjny

W dokumencie Test Turinga. Perspektywa sędziego (Stron 40-43)

Rozdział 2. Spory i dyskusje wokół testu Turinga

2.3. Pragmatyczna teza testu Turinga

2.3.2. TT jest za mało restrykcyjny

Opinia, zgodnie z którą TT jest za trudny, występuje w literaturze przed-miotu znacznie rzadziej, niż pogląd przeciwny — że TT jest za łatwy.

2.3.2.1. Całościowy test Turinga

W artykule „Mind, Machines and Turing: the Indistinguishability of In-distinguishables” Steven Harnad zaproponował pewną skalę testów Turinga (por.Harnad[2000]). Skala ta jest pięciostopniowa i ma obrazować poziomy trudności gry w naśladownictwo. Poziomy te to kolejno: t1, T2, T3, T4 oraz T5 — ich zestawienie oraz charakterystyki zawiera tabela 2.1.

Poziomem, który — zdaniem Harnada — ma największe znaczenie dla przyszłości testu Turinga jest poziom T3, określany częściej jako całościowy test Turinga (Total Turing Test — TTT). Poziomy t1 oraz T2 są za słabe dla modelowania rzeczywiście ludzkiej inteligencji, ponieważ to, co badają, to jedynie (mniej lub bardziej arbitralnie) wybrane aspekty ludzkich zdolności

2.3. Pragmatyczna teza testu Turinga 43

Tablica 2.1. Skala TT wg Harnada (na podstawie: [Harnad 2000], [Saygin et al. 2001]

oraz [French 2000]) Poziom Opis

t1 Modele, które oddają jedynie część naszych zdolności poznawczych (poziom reprezentowany obecnie przez SI).

T2 Gra w naśladownictwo taka, jak ją opisał Turing.

T3 Zupełna nieodróżnialność w funkcjach behawioralnych — wygląd fizyczny sys-temu sztucznego nabiera tutaj znaczenia.

T4 Nieodróżnialność na poziomie mikrofunkcji (nieodróżnialność na poziomie każdego neuronu czy neurotransmitera — przy czym mogą być one wyko-nane z dowolnego materiału).

T5 Nieodróżnialność na poziomie elektronów (empiryczna), jedyne różnice mogą wystąpić na poziomie użytej do konstruowania różnych systemów GUTE.

poznawczych. Co więcej, poziom T2 napotyka na problem ugruntowania sym-boli (symbol grounding problem). Zdaniem Harnada znaczenia symsym-boli są — przynajmniej częściowo — wyprowadzane z interakcji ze światem zewnętrz-nym. Dlatego właśnie Harnad postuluje, aby całościowemu testowi Turinga poddawane były roboty, które posiadają możliwość pełnej interakcji ze śro-dowiskiem, w którym funkcjonują. Dzięki temu możliwe będzie całościowe testowanie ich funkcji behawioralnych. Aby pozytywnie przejść TTT, zacho-wania i wygląd robota poddawanego testowi musiałyby być nieodróżnialne od takich samych zachowań i wyglądu ludzi. Niestety, Harnad nie precyzuje, co dokładnie należy do „całości funkcji behawioralnych”. Tak ogólnie zaryso-wane kryterium, ze względu na które mielibyśmy porównywać ludzi i roboty, wydaje się zupełnie bezużyteczne.

Warto nadmienić, że Harnad nie odrzuca poziomu T2 (czyli oryginalnej propozycji Turinga) jako nieadekwatnego, ale wskazuje na fakt, że każdy robot, który zda test poziomu T3, zda również test poziomu T2. Jeśli chodzi o poziomy T4 i T5, Harnad uważa ich osiągnięcie za w zasadzie utopijne. Jego zdaniem to właśnie poziom T3 (całościowy test Turinga) udostępnia nam odpowiednie środki, aby rozstrzygnąć, czy dana maszyna posiada inteligencję.

[...] to właśnie T3, nie zaś T4 czy T5, pozostanie ostatecznym arbitrem. Powód ku temu jest prosty (i znowu jest on już zawarty w kryterium nierozróżnialności funkcjonalniej autorstwa Turinga): nie tylko zwyczajni ludzie nie potrafią czytać w umysłach, nie potrafią tego również inżynierowie. Wszyscy są ograniczeni barierą problemu innych umysłów. Funkcja jest jedynym empirycznym kryterium [Harnad 2000, s. 441-442].

2.3.2.2. Rzeczywiście całościowy test Turinga

Wydawałoby się, że już nie można bardziej „utrudnić” TT, ale zdaniem P. Schweizera nawet na poziomie całościowego testu Turinga nadal nie dyspo-nujemy pełną możliwością orzekania o inteligencji porównywalnej do ludzkiej.

Aby taką możliwość otrzymać, powinniśmy skorzystać z zaproponowanego

przez niego rzeczywiście całościowego testu Turinga (Truly Total Turing Test

— TTTT).

Schweizer zgadza się z Harnadem, że przypisujemy posiadanie inteligen-cji innym ludziom, obserwując ich zachowania (a więc na poziomie analizy funkcjonalnej), ale zauważa, że jest to możliwe tylko dzięki temu, że mamy pewną ogólną wiedzę na temat typu podmiotu, o którym chcemy orzekać. Po-siadamy coś, co Schweizer nazywa historycznym rejestrem (historical record) zdolności kognitywnych podmiotu tego rodzaju, jakim jest człowiek (człowiek stworzył język, narzędzia, gry itp.). P. Schweizer proponuje więc długotermi-nowe, ewolucyjne kryterium badania inteligencji, podkreślając, że:

[...] TTTT nie stanowi testu dla indywidualnych systemów poznawczych. Jest on raczej pomyślany jako test możliwości pewnych architektur poznawczych, których przedsta-wicielami są poszczególne systemy poznawcze. TTTT nie implikuje więc tego, że każda osoba (lub robot) aby zostać uznaną za inteligentną musiałaby [...] dokonać wszystkich przełomowych odkryć w historii ludzkości [Schweizer 1998, s. 267–268].

W tym świetle propozycję Harnada należałoby raczej zakwalifikować do poziomu t1 (w jego własnej hierarchii). Zdaniem Schweizera, naczelną wadą całościowego testu Turinga jest to, że nakazuje badanie pojedynczych egzem-plarzy podmiotów poznawczych operujących na modelach świata zadanych im a priori. Zamiast tego należałoby się raczej skupić na badaniu typów pod-miotów poznawczych działających w realnym świecie na przestrzeni określo-nego czasu (por. [Schweizer 1998, s. 267]). Dopiero kiedy podmioty poznawcze (rozpatrywane jako pewien typ architektury poznawczej) przejdą tak rozu-miany rzeczywiście całościowy test Turinga, będziemy mogli z powodzeniem stosować tradycyjny test Turinga oraz całościowy test Turinga w odniesieniu do poszczególnych egzemplarzy podmiotów poznawczych8.

Celem S. Harnada oraz P. Schweizera było ulepszenie testu Turinga. Ulep-szenie to dotyczy nie tyle samej konstrukcji TT, ile raczej kryterium posiada-nia inteligencji, na którym się on opiera. Zdaniem Harnada i Schweizera, kry-terium to jest zbyt wąskie, aby rzeczywiście nadawało się do badania sztucz-nych systemów poznawczych. S. Harnad proponuje więc, aby testować całość funkcji behawioralnych takiego systemu, zaś R. Schweizer posuwa się jesz-cze dalej, proponując długoterminowe, ewolucyjnie zorientowane kryterium badania typów architektur poznawczych (a nie pojedynczych ich przedstawi-cieli). Niewątpliwie obie te propozycje są bardzo interesujące pod względem teoretycznym. Atrakcyjność zarysowanych w nich kryteriów oceny sztucz-nych systemów poznawczych kryje się w tym, że mają maksymalnie zbliżyć się do kryteriów, z których korzystamy na co dzień, przypisując innym lu-dziom stany mentalne. Jest to jednocześnie poważna wada całkowitego testu

8Modyfikacje testu Turinga w podobnym duchu odnajdziemy np. w artykule „Intel-ligence is not Enough: On the Socialization of Talking Machines” [Ronald, Sipper 2001], w którym autorzy starają się zidentyfikować te aspekty inteligencji, które nie mogą zostać zanalizowane w oryginalnym teście Turinga. Ciekawa jest również propozycja „długotermi-nowego testu Turinga” przedstawiona przez B. Edmondsa w tekście „The Constructiblity of artificial intelligence (as defined by Turing test)”, [Edmonds 2000]. Z kolei Eugeniusz Szumakowicz używa argumentacji zbliżonej do tej zastosowanej przez P. Schweizera, aby wykazać zupełną nieadekwatność kryterium posiadania inteligencji oferowanego przez test Turinga (por. [Szumakowicz 2000], por. też [Łupkowski 2005a]).

2.4. Twierdzenie Harraha w kontekście TT 45

W dokumencie Test Turinga. Perspektywa sędziego (Stron 40-43)

Powiązane dokumenty