45,00 zł z VAT ISBN 97883-242-1356-6 universitas www.universitas.com.pl 9 788 324 21 356 6 www.universitas.com.pl Jak reprezentujemy i kategoryzujemy świat Jak reprezentujemy i kategoryzujemy świat universitas poleca: P O J ĘC I A P O J ĘC I A universitas poleca: www.universitas.com.pl Często słyszymy, że to my ludzie tworzymy pojęcia, choć zarazem to one przecież tworzą nas – umożliwiając nam chociażby operowanie na reprezentacjach przedmiotów zamiast na samych przedmiotach, formułowanie ocen i wniosków oraz tworzenie uporządkowanych struktur umysłowych. Pojawiają się jednak istotne pytania: Czy pojęcia są subiektywnymi tworami umysłu czy też wiernym odbiciem prawidłowości obecnych w środowisku? Jaki jest związek systemu pojęciowego z językiem? Jak nabywamy pojęcia? Jak pojęcia wyłaniają się z aktywności mózgu? Czy komputery mogą operować pojęciami równie skutecznie jak czynią to ludzie? Prezentowana monografia zawiera osiemnaście rozdziałów dotyczących pojęciowej reprezentacji i kategoryzacji świata, które ujmują to zagadnienie z różnorakich perspektyw badawczych. Omawiane teorie i badania pochodzą m.in. z takich dyscyplin jak filozofia, lingwistyka, psychologia poznawcza i rozwojowa, neuronauki oraz nauka o sztucznej inteligencji. Prezentowany przegląd wiedzy na temat pojęć cechuje duże zróżnicowanie metodologiczne i terminologiczne, ale dokonywane jest ono ze wspólnej perspektywy opartej na kognitywistyce – ogólnej nauce o poznawaniu, która próbuje zintegrować różne nurty badania tego, jak inteligentne systemy (umysły, mózgi, komputery) spostrzegają i reprezentują świat. Niniejsza monografia ma na celu dopomóc w budowaniu interdyscyplinarnej wiedzy o pojęciach. P O J ĘC I A P O J ĘC I A Jak reprezentujemy i kategoryzujemy świat redakcja Józef Bremer Adam Chuderski Kraków Publikacja finansowana przez Unię Europejską w ramach Europejskiego Funduszu Społecznego - www.efs.gov.pl Projekt 1/POKL.04.01.01-00-171/2009 oraz ze środków Instytutu Filozofii UJ © Copyright by Towarzystwo Autorów i Wydawców Prac Naukowych UNIVERSITAS, Kraków 2011 ISBN 97883–242–1569–0 TAiWPN UNIVERSITAS Projekt okładki i stron tytułowych Sepielak Zdjęcie na okładce Ewa Gray www.universitas.com.pl SPIS TREŚCI Adam Chuderski, Józef Bremer, Pojęcia jako przedmiot badań interdyscyplinarnych. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117 Robert Piłat, Realizm pojęć . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147 Marek Hetmański, Zawartość informacyjna pojęć umysłowych . . . . . . . . . 175 Arkadiusz Gut, O treści i nabywaniu pojęcia przekonania (od testów fałszywego przekonania do testów na intensjonalność)��� 111 Maciej Witek, Koncepcja pojęć ad hoc jako wytworów interpretacji aktów komunikacyjnych. Analiza krytyczna . . . . . . . . . 139 Józef Bremer, Rola reguł językowych w tworzeniu pojęć opisowych ��� 173 Elżbieta Tabakowska, W co przechodzi ludzkie pojęcie?. . . . . . . . . . . . . . . . . 199 Aleksander Szwedek, Rola metafor w kształtowaniu „pojęć abstrakcyjnych”. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215 Piotr Francuz, Wyobrażeniowa natura pojęć. . . . . . . . . . . . . . . . . . . . . . . . . . . 231 Tomasz Smoleń, Bayesowska teoria oceny podobieństwa i kategoryzacji. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 247 Maciej Haman, Dlaczego pojęcia muszą być badane w ujęciu rozwojowym. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271 Edward Nęcka, Twórczość jako zmiana pojęciowa .. . . . . . . . . . . . . . . . . . . . . 319 Marcin Bukowski, Reprezentacje pojęciowe z perspektywy psychologii poznania społecznego . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 331 Mariusz Flasiński, Zagadnienie reprezentacji pojęć w sztucznej inteligencji . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 359 Grzegorz J. Nalepa, Pojęcia w inżynierii wiedzy. . . . . . . . . . . . . . . . . . . . . . . . 379 Ryszard Tadeusiewicz, Awangarda sztucznej inteligencji – maszyny które potrafią same tworzyć nowe pojęcia .. . . . . . . . . . . . . . . . . . 395 Filip Gęsiarz, Neurobiologia pojęć konkretnych i abstrakcyjnych . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429 Włodzisław Duch, Jak reprezentowane są pojęcia w mózgu i co z tego wynika .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 459 Indeks nazwisk .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 495 Noty biograficzne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 505 Adam Chuderski, Józef Bremer POJĘCIA JAKO PRZEDMIOT BADAŃ INTERDYSCYPLINARNYCH Wprowadzenie do zagadnienia pojęć Pojęcia to „[...] jeden z podstawowych składników procesu myślenia; myślowe odzwierciedlenie i całościowe ujęcie istotnych cech przedmiotów czy zjawisk, myślowy odpowiednik nazwy” (Doroszewski, 1964, t. 6, s. 818). Przytoczona definicja trafnie oddaje nasze intuicyjne rozumienie pojęć, czyli to, że są one uogólnionymi ideami o klasie przedmiotów, atrybutów, zdarzeń lub procesów, które mogą otrzymać jakąś nazwę. Wskazuje także na fundamentalne funkcje pojęć: reprezentowanie wiedzy i doświadczenia człowieka w sposób zapewniający odpowiednią ekonomię poznawczą (ujęcie istotnych – zamiast wszystkich – cech), udział w procesach myślowych i działaniu oraz, poprzez odpowiadającą im nazwę, podstawowe narzędzie komunikacji językowej. Pojęcia organizują nasze jednostkowe, codzienne doświadczenia, wypełniają kulturę (z której jednostka je często zapożycza), a także stanowią fundament nauk przyrodniczych (idee wyrażane przede wszystkim w postaci symboli) oraz społecznych i humanistycznych (idee – słowa). Natura, geneza i funkcje pojęć oraz ich relacje do innych zjawisk umysłowych (percepcji, myślenia, mowy) oraz społecznych i kulturowych (języka, zwyczajów, wartości, tożsamości grupowej, sztuki) są przedmiotem badań prowadzonych w ramach wielu dziedzin nauki: tradycyjnie – w filozofii i językoznawstwie, począwszy od XIX wie- 8 Adam Chuderski, Józef Bremer ku – w antropologii, socjologii, psychologii i pedagogice, a ostatnio – w neuronauce. Celem tego wprowadzającego rozdziału jest zarysowanie owej wielości perspektyw i ujęć problematyki pojęć, które znajdują swoje odzwierciedlenie w następnych rozdziałach monografii Pojęcia. U podstaw oddawanego w ręce Czytelnika tomu legło nasze głębokie przekonanie o tym, że do pełnego zrozumienia, czym są i jak funkcjonują pojęcia, konieczne jest interdyscyplinarne podejście do ich badania. Oczywiście, żadna z wymienionych dyscyplin nauki sama nie może dostarczyć całościowego ujęcia zagadnienia pojęć, nawet gdyby każda z nich niezwykle rozwinęła swój własny aparat badawczy, bowiem każda bada inny wycinek czy poziom rzeczywistości (biologicznej, umysłowej, społecznej, wytworów człowieka). Ale chodzi nam tu o coś więcej niż o tzw. podejście multidyscyplinarne, czyli sumowanie wyjaśnień dostarczanych przez dyscypliny szczegółowe. Uważamy, że dopiero wyjaśnienie dokonane w wyniku twórczej interakcji prac badawczych prowadzonych w ramach różnych dyscyplin, przenikania się teorii pomiędzy dyscyplinami oraz projektowania zupełnie nowych badań na ich granicach, może doprowadzić do pełnego wyjaśnienia natury pojęć. Wyjaśnienie natury pojęć wykracza bowiem poza jeden poziom opisu rzeczywistości, a one same wiążą odmienne poziomy opisu ze sobą. Nietrudno jest przyznać rację neuronaukowcom w tym, że ostatecznie pojęcia reprezentowane są w mózgu, ale jednocześnie funkcją mózgu nie jest reprezentowanie przypadkowych informacji, ale adaptacja do abstrakcyjnych regularności obecnych w świecie, a te stanowią już przedmiot zainteresowania filozofów. Ci drudzy, analizując problem znaczenia pojęć, pytają o coś więcej niż tylko o zawartość informacyjną pojęć (ich treść oraz strukturę, w którą treść ta jest ujęta), analizowaną przez psychologów i badaczy sztucznej inteligencji (SI). Jednakże filozofowie względnie niewiele powiedzą nam o tym, jak pojęcia przekładają się na zachowania jednostki, podczas gdy psychologowie i badacze SI wyjaśniają nie tylko to zjawisko, ale także zwrotny wpływ podejmowanych działań (odpowiednio, przez ludzi i maszyny) na treść i strukturę pojęć. Jako że zachowania zwykle mają miejsce w jakimś kontekście społecznym czy kulturowym, niezbędne jest także uwzględnienie obserwacji antropologów, socjologów i pedagogów. Przykłady uzupełniania się odmiennych perspektyw rozważania pojęć można dalej mnożyć i mnożyć. Oprócz wielopoziomowej natury pojęć, tezę o konieczności interdyscyplinarnego ich ujęcia wspierają także odmienne metodologie badań przyjmowane w każdej ze wspomnianych dyscyplin. Każda metodologia pozwala na uzyskiwanie ważnych rezultatów, ale jednocześnie każda ma swoje ograniczenia. Prowadzenie badań interdyscy- Pojęcia jako przedmiot badań interdyscyplinarnych plinarnych pozwala tak dobrać metody badawcze, aby nawzajem kompensowały te ograniczenia. W szczególności, wydaje się, że największy wgląd w problematykę pojęć daje łączenie metod teoretycznych (takich jak analiza pojęciowa, analiza zachowania, modele formalne i symulacje) z najnowszymi technikami eksperymentalnymi (np. pomiarem ruchów gałek ocznych, eksperymentami behawioralnymi czy różnymi metodami neuroobrazowania). W dalszej części niniejszej pracy najpierw prześledzimy analizy i badania pojęć prowadzone w ramach każdego z pięciu podstawowych nurtów badawczych składających się na interdyscyplinarny projekt badań nad umysłem zwany kognitywistyką. Nurty te to: filozofia, językoznawstwo, sztuczna inteligencja, psychologia oraz neuronauka. Każdemu z tych nurtów poświęconych jest po kilka rozdziałów monografii, które krótko zapowiemy. Niemal wszystkie rozdziały dostarczają przykładów udanych badań interdyscyplinarnych nad pojęciami. Na końcu pracy spróbujemy podsumować najważniejsze pytania badawcze dotyczące pojęć, z którymi muszą się jeszcze zmierzyć nauka i filozofia. Pojęcia – krótki przewodnik po teoriach i badaniach Przez długi okres rozwoju wiedzy człowieka, pytanie o naturę pojęć było jednym z najważniejszych pytań dotyczących świata otaczającego człowieka. Średniowieczny i nowożytny spór o uniwersalia (pojęcia ogólne) nie tylko zdominował filozofię, ale wykraczał poza nią, mając istotne konsekwencje dla teologii, pośrednio – dla życia społecznego (państwo poddane wieczystym prawom), a także dla nauki (przede wszystkim: matematyki i logiki, ale także psychologii – w postaci fenomenologii). W ubiegłym wieku znaczenie zagadnienia pojęć w rozważaniach człowieka o świecie znacznie jednak zmalało. Albo kwestionowano status pojęć jako wiarygodnego wyjaśnienia obserwowanych prawidłowości (fizjologia, behawioryzm), albo w takich wyjaśnieniach zastępowano pojęcia innymi, bardziej specyficznymi i lepiej zdefiniowanymi terminami, takimi jak sądy, obrazy umysłowe, naoczności, zachowania werbalne, reprezentacje umysłowe itp. Po części, zniechęcenie wobec konstruktu „pojęcia” wynikało z poważnych ograniczeń klasycznej (filozoficznej) teorii pojęć, przyrównującej pojęcia do definicji kategorii istniejących w świecie lub w umyśle. Wydaje się jednak, że od pewnego czasu następuje niezwykły renesans tego 9 10 Adam Chuderski, Józef Bremer konstruktu w nauce i filozofii, mający swoje źródło w rewolucyjnych teoriach i odkryciach. Choć nie brakuje także głosów (np. Machery, 2009), że pojęciem „pojęcia” obejmujemy tak różnorodne i wewnętrznie niepowiązane instrumentarium ludzkiego umysłu, iż w języku nauki należy z owego pojęcia zrezygnować, to i takie głosy wnoszą wiele do zrozumienia tego, w jaki sposób człowiek (a także inteligentna maszyna) reprezentuje i kategoryzuje świat. FILOZOFIA Filozoficzne używanie terminów ekwiwalentnych do terminu „pojęcie” ma swoje źródło w myśli sokratejsko-platońskiej, przy czym należy dodać, że aspekty logiczne, psychologiczne i ontologiczne są tutaj często ze sobą wymieszane. Wychodząc od faktu, że w mówieniu określone wyrażenia odnoszą się do wielu lub wszystkich przedmiotów (zdarzeń) tego samego rodzaju, pojawiło się pytanie, na ile tego rodzaju wyrażenia oznaczają przedmioty – idee, wyobrażenia, obiekty – niezależne od subiektywnego myślenia i mówienia (Haller, 1971). Podstawowe osiągnięcie filozofii platońskiej leżało w metodycznym zadaniu pytania o to, co później nazwano „pojęciem”, a które sprowadzało się do pytania o wspólne cechy rzeczy, zdarzeń1. Zajmowanie się pojęciami doprowadziło Platona, zdaniem Arystotelesa, do jego nauki o ideach. Arystoteles przyjmuje, że pojęciami naukowymi są tylko te określone przez definicję. Definicja (ορος) wyraża istotę danej rzeczy (przedmiotu), która musi być określona przez pojęcie (ορισμος). Definicja jest istotną cechą pojęcia2. Jeśli pojęcia są pojęciami ogólnymi, to są tworzone – na drodze swoistej indukcji – ze spostrzeżeń rzeczy pojedynczych. Stoicy utożsamiają pojęcie ze znaczeniem wyrażenia językowego. W filozofii średniowiecznej pojęcia były traktowane jako naturalne znaki rzeczy w świadomości, oznaczane przez słowa. Istotny wpływ na rozwój nauki o pojęciach wywarł R. Descartes z jego nawiązaniem do platońsko-augustyńskiej nauki o niektórych pojęciach i myślach jako „ideach wrodzonych” (np. idee Boga, substancji myślącej i substancji rozciągłej)3. Idee wrodzone nie pochodzą od przed1 Haller wskazuje w tym miejscu na dialogi Platona: Laches, 193e-194d; Eutyfron, 5d.6d; Menon, 72b. 2 Por. Arystoteles, Metafizyka, Warszawa, PWN, 1983, 987b, por. Arystoteles, Topiki, Warszawa, PWN, 1990, 101b-102a. 3 Por. R. Descartes, Medytacje o filozofii pierwszej, tłum. M. i K. Ajdukiewiczowie, S. Swieżawski, I. Dąmbska, Kęty, Antyk, 2001, III, 7.13. Pojęcia jako przedmiot badań interdyscyplinarnych miotów zewnętrznych i ich oddziaływania na umysł, lecz przynależą do umysłu, są stałe, jasne i wyraźne oraz niezależne od woli. Idee wrodzone oznaczają – mówiąc ogólnie – dyspozycje do utworzenia takich, a nie innych pojęć, oraz do żywienia takich, a nie innych przekonań. Ujęcie kartezjańskie było ostro krytykowane przez J. Locke’a, według którego wszelka wiedza pochodzi z doświadczenia (w umyśle ludzkim nie ma niczego, co nie pochodzi z doświadczenia). „Cokolwiek umysł postrzega w sobie, czyli co stanowi bezpośredni przedmiot postrzegania, myślenia lub rozumienia, nazywam ideą”4. Idee – pojęcia, jako przedmioty myślenia, dzielą się na proste (pojawiają się na bazie bezpośrednich wrażeń zmysłowych) i złożone. Zarówno u Descartesa, jak i u Locke’a idea (pojęcie) jest rozumiane w subiektywnym znaczeniu. Locke ze swoją „tabula rasa” jest zaliczany do zwiastunów behawioryzmu, z jego rozumieniem nabywania pojęć (Weiner i Craighead, 2010). I. Kant odróżnia pojęcia od danych naocznych (zmysłowo receptywne dane poznania). Bez tych ostatnich nasze pojęcia są puste, są one pozbawionymi przedmiotu, czysto formalnymi myślami. Naoczności bez pojęć są ślepe5. Naoczność dostarcza nam różnorodności nieustrukturowanych wrażeń, rozmieszczonych w czasie i przestrzeni. Pojęcie łączy wrażenia w jedną całość, formuje strukturę przedmiotu. Pojęcia są wytworami intelektu, funkcjami jego spontaniczności. Określają one reguły łączenia naoczności (wyobrażeń) w określoną jedność. Są one elementami sądów, w których zachodzi poznanie. Poznanie jest możliwe dzięki syntezie pojęć i danych naocznych. Współcześnie do Kantowskiego rozumienia pojęcia odwołują się: W. Sellars (dla którego doświadczenie zawiera niepojęciowy element) i J. McDowell (u którego zmysłowość już jest określona pojęciowo; Heidemann, 2003). Reasumując: termin „pojęcie” – zdaniem W. Stegmüllera – nie jest w najmniejszym stopniu jaśniejszy aniżeli wyrażenia „idea” czy „eidos”6. Rozumie się bowiem pod pojęciem to, co w logice tradycyjnej nazywano zakresem pojęcia (ekstensję, klasę) – Platon ma zupełną rację, gdy te idealne obiekty odróżnia od rzeczy pojedynczych. Rozumie się pod nim to, co zwykle nazywamy treścią pojęcia (intensję), to Platon także ma rację, gdyż również tutaj mamy do czynienia z przedmiotami idealnymi, które nie wchodzą w to, co konkretne. Zakładamy przy tym, że 4 J. Locke, Rozważania dotyczące rozumu ludzkiego, tłum. B.J. Gawęcki, Warszawa, PWN, 1955, II.8.8. [s. 164]. Por. tamże, II.1.1; II.1.8. 5 Por. I. Kant, Krytyka czystego rozumu, A51/B75. Por. J. Bremer, Kant jako filozof umysłu, Zagadnienia naukoznawstwa, 3–4, 2009, s. 351–371 [s. 354–356]. 6 Por. W. Stegmüller, Geschichtliches zum Universalienstreit, w: W. Stegmüller, Glauben, Wissen und Erkennen, Darmstadt, WBG, 1967, s. 48–118. 11 12 Adam Chuderski, Józef Bremer uznajemy takie przedmioty i nie negujemy ich istnienia jak to czynią nominaliści. G. Frege w „Funkcja i pojęcie” (1891/1977) objaśnia najpierw rozróżnienie między pojęciem a przedmiotem, a następnie definiuje to ostatnie jako „[...] funkcję, której wartością jest zawsze wartość logiczna”7. Zakresem pojęcia jest przebieg funkcji, której wartością jest dla każdego argumentu wartość logiczna. Pojęcia są składnikami treści, która może być prawdziwa lub fałszywa, tzn. wartość semantyczna pojęcia jest określana w kontekście całości treści. W tym sensie pojęcia nie są ani samodzielne, ani nie są także „przedstawieniami”, czyli czymś przez kogoś pomyślanym. Są one przedmiotami istniejącymi obiektywnie na sposób Platońskich idei. Frege używa terminu „pojęcie” w sensie logicznym, a nie psychologicznym. Pojęcia uzyskujemy poprzez rozbiór myśli, które są sensem zdania oznajmującego i posiadają wartość logiczną, będącą znaczeniem zdania. Nawiązanie do koncepcji pojęć Locke’a można zauważyć w psychofunkcjonalizmie J. Fodora, przedstawionym w jego nieempirycznej Reprezentacyjnej Teorii Umysłu. W mózgu człowieka mamy genetycznie zakodowane mechanizmy obliczeniowe, stanowiące wrodzony potencjał nabywania nowych pojęć wraz z odpowiadającymi im słowami. Pojęcia są zawarte w reprezentacjach umysłowych, będących symbolami „języka mentaleskiego” – niewerbalnego języka wewnętrznego. Język mentaleski zawiera wrodzony słownik predykatów, który wystarcza do tworzenia konstrukcji logicznych dla każdego języka naturalnego. Bez języka mentaleskiego nie moglibyśmy nauczyć się żadnego języka naturalnego. Jego struktura jest analogiczna do struktury kodu maszynowego, tzn. wewnętrznego, obliczeniowego języka komputera. Na wejściu i wyjściu komputer operuje językiem symbolicznym, a celem dokonywania obliczeń posługuje się językiem wewnętrznym. Analogicznie postępuje człowiek; z innymi ludźmi porozumiewa się za pomocą języka naturalnego, ale myśli w języku „mentaleskim”. Zgodnie z Fodora tezą o atomizmie pojęciowym (jako części składowej tzw. semantyki informacyjnej): „aby posiadać pojęcie ktoś nie musi posiadać innych pojęć, aby dokonać niezawodnych wnioskowań...” (Mölder 1999, s. 53). Podczas gdy Fodor traktuje pojęcia jako coś indywidualnego dla podmiotu, L. Wittgenstein (1953/2000) widzi je jako obiekty społeczne, tak iż z zasady nie jest możliwe dla jednostki, aby sama jedna posiadała pojęcia. Co więcej, nie możemy powiedzieć, jaki świat rzeczywiG. Frege, Funkcja i pojęcie, w: tenże, Pisma semantyczne, tłum. B. Wolniewicz, Warszawa: PWN 1977, s. 18–44 [s. 30]. 7 Pojęcia jako przedmiot badań interdyscyplinarnych ście jest, gdyż odniesienie do świata jest możliwe tylko wewnątrz gier językowych, które już zakładają określone normy społeczne jako coś konstytutywnego. Oznacza to, iż także w naszych opisowych grach językowych mówimy o świecie tylko pod jakimś aspektem. „Nie mówię (w sensie hipotezy): Gdyby te a te fakty przyrody wyglądały inaczej, to ludzie mieliby inne pojęcia. Lecz: jeśli ktoś sądzi, iż pewne pojęcia są po prostu prawidłowe – a kto miałby inne, ten nie rozumiałby czegoś, co my rozumiemy – ten niech wyobrazi sobie inaczej niż zwykle pewne bardzo ogólne fakty przyrody. Powstawanie pojęć innych niż zwykłe stanie się dlań wtedy zrozumiałe” (tamże, s. 321). Można by powiedzieć, że używane przez nas pojęcia pokazują, o co nam chodzi, a o co nie. Nie można natomiast powiedzieć, jakoby wyjaśniało to szczególne pojęcia, jakie posiadamy. Wittgenstein zamierza jedynie wykluczyć ujęcie, jakobyśmy my mieli właściwe, a inni ludzie fałszywe pojęcia8. Współcześnie, filozofowie niezwykle często analizują pojęcia dotyczące natury i użycia pojęć w ścisłym związku z wynikami badań prowadzonych w innych dyscyplinach nauki (np. Machery, 2009; Prinz, 2002). R. Piłat w „Realizm pojęć” wychodzi od pytania: czy przynajmniej część systemu pojęciowego związana jest nieinferencyjnie z własnościami świata, czy też wszystkie pojęcia odnoszą się przede wszystkim do innych pojęć i jedynie pośrednio do świata, na mocy udziału w kształtowaniu różnego typu zachowań? Odpowiadając uważa, że w żadnej koncepcji pojęcia nie odnoszą się bezpośrednio do przedmiotów w świecie, co jest naturalną konsekwencją przewrotu semantycznego Fregego, dla którego pojęcia są funkcjami, a nie reprezentacjami, jak było to przyjęte w dawniejszej filozofii. M. Hetmański w „Zawartość informacyjna pojęć umysłowych” przeprowadza analizę pojęć od strony ich zawartości informacyjnej, wynikającej z semantycznej relacji między wchodzącymi w skład pojęć znaczeniami wyrażeń językowych a ich zakresem przedmiotowym. Szczególną wartość poznawczą mają, jego zdaniem, pojęcia nie uwzględniające stanu faktycznego, lecz możliwość i prawdopodobieństwo stanu rzeczy, zdarzenia, relacji czy sytuacji ontycznej. W „O treści i nabywaniu pojęcia przekonania (od testów fałszywego przekonania do testów na intensjonalność)” A. Gut zestawia ze 8 Wittgenstein powie: „Jeden będzie się mógł nauczyć gry językowej, której drugi nie może się nauczyć. ... Gdyby bowiem ‚ślepy na kolory’ mógł się nauczyć gier językowych człowieka normalnego, to dlaczego miałoby się go wykluczać z wykonywania pewnych zawodów?” L. Wittgenstein, Uwagi o kolorach, tłum. R. Reszke, Spacja, Warszawa 1998, § 112. 13 14 Adam Chuderski, Józef Bremer sobą wyniki badań pojęcia przekonania uzyskanych w testach fałszywego przekonania z wynikami uzyskiwanymi w testach określających dostrzeganie ograniczonej wymienialności terminów współdesygnujących w kontekstach intensjonalnych. W konkluzji stwierdza między innymi, że po zaliczeniu testu fałszywego przekonania mamy do czynienia z ciągłym rozwojem umysłu (czyli zdolności do odczytywania cudzych i własnych stanów mentalnych) oraz, że testy fałszywego przekonania i testy intencjonalne badają dwie różne zdolności w ramach teorii umysłu posiadanych przez dzieci. M. Witek w „Koncepcja pojęć ad hoc jako wytworów interpretacji aktów komunikacyjnych. Analiza krytyczna” omawia najpierw zjawisko niedookreślenia językowego, a następnie prezentuje zmodyfikowaną koncepcję pojęć ad hoc jako odmianę pragmatyki warunków prawdziwości. Okazuje się, że uwzględnienie pojęć ad hoc prowadzi do przyjęcia stanowisk eliminacjonizmu znaczeniowego i nominalizmu pojęciowego, które to stanowiska znajdujemy już w pismach G. Berkeleya. J. Bremer w „Rola reguł językowych w tworzeniu pojęć opisowych” omawia behawiorystyczno-naturalistyczną teorię pojęć opisowych zbudowaną przez W. Sellarsa. W tworzeniu wspomnianych pojęć podstawową rolę odgrywają behawiorystyczne reguły oceny i działania oraz trzy rodzaje behawiorystycznych zachowań kierowanych wzorcem (schematem postępowania): przejścia do języka, przejścia wewnątrzjęzykowe i wyjścia z języka. Wszystkie trzy są elementami gry językowej i stanowią istotną część, zbudowanej przez Sellarsa, funkcjonalistycznej semantyki. JĘZYKOZNAWSTWO Dyscypliną niewiele młodszą od filozofii (biorąc pod uwagę Platona dialog Kratylos9 czy dzieła Apoloniosa Dyskolosa10 z II w. n.e.), której jednym z celów jest analiza pojęć, jest językoznawstwo. Mniejszy związek z badaniami nad pojęciami ma jeden z dwóch głównych nurtów językoznawstwa, czyli językoznawstwo formalne (Chomsky, 1966). W jego ramach postuluje się względnie obiektywne, słownikowe znaczenie pojęć związanych ze słowami – znaczenia pojęć wyrażanych językiem przez jego użytkowników możemy ustalić, badając teksty 9 10 Platon, Kratylos. tłum. Z. Brzostowska, Lublin 1990. Por. Michał Bednarski, Apollonios Dyskolos i jego gramatyka, Kraków 2000. Pojęcia jako przedmiot badań interdyscyplinarnych i wypowiedzi, jakie owi użytkownicy konstruują (np. poprzez analizę dystrybucyjną; por. Bobrowski, 1993). Ten nurt językoznawstwa zakłada istnienie wyspecjalizowanych, umysłowych modułów językowych dedykowanych poszczególnym aspektom przetwarzania języka (morfologii, syntaksie, semantyce itd.), na przykład odpowiadających za nabywanie i przetwarzanie gramatyki generatywnej – systemu rekursywnych reguł służących do generowania i odbioru (tzw. parsowania) poprawnych wyrażeń językowych. Zagadnienia semantyczne zajmują mniej miejsca w formalnym podejściu do języka, choć wyraźnie zaznacza się obecność badaczy (w szczególności R. Jackendorfa, 2002) łączących podejście formalne z drugim głównym nurtem – językoznawstwem kognitywnym. Językoznawstwo kognitywne przyjmuje, że istnieją ogólne zasady odnoszące się do wszystkich aspektów języka (tj. bez podziału na odrębne moduły czy warstwy językowe) oraz że zasady te powinny odzwierciedlać (ogólniejszą od lingwistycznej) wiedzę o funkcjonowaniu umysłu i mózgu (Lakoff, 1990). Z tego powodu, językoznawstwo jest z natury przedsięwzięciem interdyscyplinarnym. Po pierwsze, wykorzystuje ono teorie i wyniki badań z innych dziedzin nauki o umyśle (z którymi wnioski językoznawców kognitywnych powinny być zgodne), a po drugie weryfikuje trafność owych teorii i badań w odniesieniu do języka (i ew. je podważa). O ile podejście formalne do badania języka stanowi odpowiednik racjonalizmu w filozofii, to nurt kognitywny przyjmuje w tej materii stanowisko zdecydowanie empiryczne. Język ma stanowić niejako narzędzie (okno, obiektyw) umożliwiające wgląd w poznawcze procesy związane z reprezentowaniem, przetwarzaniem i komunikowaniem reprezentacji pojęciowych. W ich badaniu szczególnie pomocna jest subdyscyplina językoznawstwa kognitywnego zwana semantyką kognitywną (por. Evans, Bergen i Zinken, 2007). Semantycy kognitywni postrzegają znaczenie słów jako zjawisko zlokalizowane w „głowie” użytkownika języka, odrzucając ich obiektywne, słownikowe znaczenia. Badają relację pomiędzy systemem pojęciowym, strukturą semantyczną kodowaną przez język (znaczeniami przypisywanymi słowom i innym składnikom języka) oraz doświadczeniem człowieka wynikającym z jego działania w świecie. Ten ostatni element jest bardzo istotny i wskazuje, że system pojęciowy jest konsekwencją naszego ucieleśnienia – możemy powiedzieć tylko to, co możemy spostrzegać i pomyśleć, a to jest ograniczone przez naturę naszego ucieleśnienia. Wynikowa struktura semantyczna bywa zrównana z podzbiorem struktury pojęciowej („meaning is conceptualization”) – wszystkim słowom odpowiadają jakieś pojęcia w systemie wiedzy określonego człowieka, ale z pewnością ma on pojęcia, dla których nie 15 16 Adam Chuderski, Józef Bremer posiada odpowiadających im słów. Jednakże, słowa nie prowadzą bezpośrednio do jednoznacznych reprezentacji pojęć w umyśle, ale stanowią tylko wskaźniki do różnych partii wiedzy pojęciowej. Aby określić znaczenie określonego słowa w danym kontekście, musimy je skonstruować, wybierając i/lub łącząc elementy naszej wiedzy odpowiednie dla tego kontekstu. Struktura semantyczna jest mniej podobna do słownika, a bardziej – do encyklopedii, w której dla ustalenia znaczenia musimy sprawdzać wiele powiązanych ze sobą haseł należących do jednej domeny (Langacker, 1987). Kilka teorii w ramach semantyki kognitywnej próbuje wyjaśnić, jak ów proces konstrukcji znaczenia przebiega. Na przykład, teoria metafor i metonimii pojęciowych G. Lakoffa i M. Johnsona (1980, 1999) zakłada, że wielorakie złożone domeny pojęciowe konceptualizujemy i organizujemy poprzez metafory pozwalające na ich strukturalne odniesienie (mapowanie) do prostszych pojęć z bardziej podstawowych dziedzin, najczęściej zakorzenionych w ucieleśnionych doświadczeniach czasu, przestrzeni, działania itp. Na przykład, pozytywne odczucia mapujemy na pojęcie „góry” („podniesiony na duchu”), a negatywne – „dołu” („zdołowany”). Innym narzędziem umysłu jest metonimia – zdolność zastępowania złożonych pojęć prostymi obiektami w ramach tej samej dziedziny (np. „sportowcy wygrali złoto”), zależnie od kontekstu i celu komunikacji. G. Fauconnier i M. Turner (2002) w ramach swojej teorii pojęciowego łączenia (conceptual blending), stanowiącej nowszą i bardziej ogólną wersję teorii przestrzeni umysłowych Fauconniera (1985), postulują, że proces tworzenia znaczeń zawsze pojęciowo niedospecyfikowanych słów polega na tworzeniu emergentnych struktur pojęciowych, które łączą wiele odmiennych przestrzeni mentalnych – pakietów wiedzy z określonej dziedziny, utworzonych dynamicznie na potrzeby bieżącej komunikacji. Tak powstająca struktura pojęciowa jest niepowtarzalna (zależy od kontekstu, indywidualnego doświadczenia, zwyczajów językowych, kultury) i zawiera jakościowo nowe elementy w stosunku do przestrzeni mentalnych, które zostały połączone. Według Fauconniera i Turnera, pojęciowe łączenie służy nie tylko potrzebom komunikacji językowej, ale jest także podstawową operacją myślową. W szczególności, operacja to polega na wyobraźni, czyli zdolności poznawczej człowieka na pierwszy rzut oka bardzo odległej od procesów językowych. W monografii Czytelnik znajdzie dwa rozdziały opracowane przez wybitnych polskich językoznawców kognitywnych. E. Tabakowska w rozdziale „W co przechodzi ludzkie pojęcie?” przedstawia relację pojęć tworzonych przez umysł do wyrażeń języka naturalnego, w które ostatecznie pojęcia przechodzą, czyli relację pomiędzy tzw. cepcją Pojęcia jako przedmiot badań interdyscyplinarnych (percepcją plus koncepcją [konceptualizacją]) treści a jej ekspresją językową. Językoznawcę interesują przy tym te elementy reprezentacji, które uzyskały status postulowanych przez językoznawców kognitywnych rutyn poznawczych. A. Szwedek w „Rola metafor w kształtowaniu «pojęć abstrakcyjnych»” proponuje nową koncepcję metaforyzacji, w której podstawową domeną źródłową jest domena przedmiotu materialnego, zdefiniowanego jako ograniczony przestrzenią obiekt pierwotnie poznawany przez dotyk, która to domena (lub jej podkategorie) służy następnie do konceptualizacji wszystkich pojęć abstrakcyjnych, ale sama nie podlega metaforyzacji. Szwedek zaznacza, że metafory w tradycji przedkognitywnej były traktowane jako ozdobniki literackie, dotyczące jedynie warstwy językowej. Za Lakoffem i Johnsonem przyjmujemy dzisiaj, zdaniem Szwedka, że mają one charakter pojęciowy i są integralną częścią języka codziennego, a procesy metaforyczne przebiegają normalnie od konkretu do abstraktu, a nie odwrotnie. Domena „przedmiotu materialnego” jest przy tym pierwotną domeną źródłową, w kategoriach której konceptualizowane są wszystkie „pojęcia abstrakcyjne”. Tezy semantyki kognitywnej są coraz częściej weryfikowane empirycznie (por. Evans i in., 2007), przez co rozmywa się granica dzieląca językoznawstwo kognitywne i inną dyscyplinę zajmującą się językiem przy pomocy metod psychologii, czyli psycholingwistykę. Najbardziej intensywnie rozwijane badania w ramach tej dziedziny dotyczą dwujęzyczności (bilingualizmu). Między innymi, pyta, czy osoby mówiące biegle w dwóch językach posiadają jedno czy dwa pojęcia dla odpowiadających sobie słów w obu językach. To pytanie jest szczególnie interesujące dla przypadków, w których oba języki pochodzą z bardzo odmiennych kultur (np. zachodniej i wschodniej). Stwierdzono bowiem (por. Nisbett, 2003) istotne różnice w kategoryzacji pomiędzy osobami o pochodzeniu anglosaskim a mieszkańcami Dalekiego Wschodu (Chin, Korei, Japonii). Podczas gdy pierwsi kategoryzują obiekty ze względu na podobne cechy lub funkcje, drudzy tworzą kategorie przede wszystkim na podstawie wspólnego kontekstu lub relacji zachodzącej między obiektami. Przykładowo, proszone o podział zbioru trzech obiektów [małpa, panda, banan] na dwie grupy, osoby o pochodzeniu anglosaskim utworzą intuicyjną dla nas kategorię zwierząt [małpa, panda], ale Chińczycy zgrupują obiekty w kategorię [banan, małpa] ze względu na relację zachodzącą pomiędzy nimi („pokarm dla”), stwierdzając natomiast, że małpy i pandy nie wiąże żadna intuicyjna relacja. Badania (Ji, Zhang i Nisbett, 2004) dowiodły, że osoby pochodzenia chińskiego o tzw. dwujęzyczności współrzędnej, czyli takie, które nauczyły się drugiego języka (w tym wypadku angielskiego) stosunkowo 17 18 Adam Chuderski, Józef Bremer późno i który jest używany w innych kontekstach (np. zawodowym) niż ich język ojczysty (np. używany w domu), w każdym z tych języków dokonują odmiennej kategoryzacji, odpowiednio według cech versus relacji. Może to świadczyć na rzecz tezy o różnych systemach pojęciowych dla każdego z języków. Jednak Chińczycy o tzw. dwujęzyczności złożonej (np. mieszkańcy Hongkongu), przy której oba języki są uczone równocześnie i używane naprzemiennie w podobnych kontekstach, wydają się rozwijać jeden system pojęciowy – język, w którym następuje kategoryzacja obiektów, nie ma wpływu na rezultat kategoryzacji (stanowiący mieszankę kategoryzacji wg cech i wg relacji). To jeden z wielu wyników badań, które sugerują, że powszechnie odrzucona przez językoznawców i psychologów hipoteza B. Whorfa o językowej determinacji myślenia ma w sobie jednak ziarnko prawdy: język i system pojęciowy wchodzą w nieustanne, złożone interakcje, kształtując się wzajemnie. W szczególności, obecność lub nieobecność pewnych struktur językowych, takich jak oznaczenia płci, liczby, czy zakresu obiektów w różnych językach, może wpływać na myślenie poprzez kierowanie uwagi ich użytkowników na różne aspekty rzeczywistości i wymaganie stałego pamiętania o nich. Innym kierunkiem badań w ramach językoznawstwa jest statystyczna analiza zależności między słowami, występującymi w korpusie tekstowym, i tworzenie na jej podstawie map znaczenia poszczególnych słów (zwanych modelami pamięci semantycznej, tj. model HAL – Hyperspace Analogue to Language; Lund i Burgess, 1996). Uważa się, że występujące obiektywnie związki pomiędzy słowami obecne w istniejących tekstach muszą choć w części kształtować związki między pojęciami w umysłach użytkowników tych tekstów. Mapy (atlasy) znaczenia używane są następnie do konstruowania sztucznych systemów tłumaczących teksty lub przewidujących wystąpienie określonych słów. Systemy te są tak skuteczne, że potrafią m.in. zgadywać prawidłowe odpowiedzi w testach znajomości języka (Landauer i Dumais, 1997). Badania w ramach lingwistyki stosowanej korzystają więc zarówno z osiągnięć językoznawstwa jak i metod informatycznych (Lubaszewski, 2009). Można przewidywać intensywny rozwój takich systemów. PSYCHOLOGIA Najważniejsze zagadnienia związane z pojęciami, podejmowane przez psychologów, dotyczą składników, z jakich zbudowane są umysłowe reprezentacje pojęć (sądów/twierdzeń, obrazów czy reprezenta- Pojęcia jako przedmiot badań interdyscyplinarnych cji hybrydowych), oraz teorii, które najlepiej opisują system pojęć i zasady kategoryzacji. Próba odpowiedzi na pierwsze pytanie znana jest pod nazwą debaty o wyobraźni (imagery debate), która począwszy od lat 70. XX wieku toczyła się między zwolennikami (np. Pylyshyn, 1973) poglądu głoszącego, że pojęcia składają się wyłącznie ze zbioru sądów, a introspekcyjnie dostępne wyobrażenia (obrazy umysłowe) są epifenomenami wynikającymi z przetwarzania informacji semantycznej opisującej cechy wizualne obiektów, a proponentami (np. Kosslyn, 1980) poglądu traktującego wyobrażenia jak realne składniki reprezentacji umysłowych, w tym pojęć. Na rzecz tego drugiego poglądu świadczyły wyniki badań nad skanowaniem i rotowaniem w wyobraźni, a także dane neuropsychologiczne (dla przeglądu zob. Francuz, 2007). Debata nie została jednoznacznie rozstrzygnięta. Zaproponowano także ujęcia hybrydowe (teorię podwójnego kodowania; Paivio, 1986) uznające realność zarówno sądów, jak i obrazów. Konsekwencją debaty było jednak przeniesienie uwagi na percepcyjne ugruntowanie treści pojęć oraz na ich dynamikę, wynikającą z możliwości łatwej zmiany (symulacji, rekonstrukcji) perspektywy, układu i kontekstu pojęć posiadających (po części) charakter wizualny, które ma swój wyraz w teorii systemów symboli percepcyjnych (perceptual symbol systems) L. Barsalou (1999). W niniejszym tomie zagadnienie relacji pojęć do percepcji podejmuje w swoim tekście „Wyobrażeniowa natura pojęć” P. Francuz, który przedstawia szereg argumentów na rzecz doniosłej roli procesów percepcyjnych w kształtowaniu treści pojęć. Według Francuza, pojęcia mają przede wszystkim naturę wyobrażeniową. Pogląd ten autor wspiera omawiając liczne wyniki badań behawioralnych (w tym analizy ruchów gałek ocznych) i badań wykorzystujących obrazowanie aktywności mózgu. Psychologiczne badania nad strukturą i funkcjami systemu pojęć, począwszy od F. Bartletta (1932) i jego analiz schematów organizujących pamięć długotrwałą, bardzo szybko obaliły klasyczną teorię pojęć, rozumianych jako definicyjny zbiór warunków koniecznych i wystarczających. Teoria ta nie potrafi bowiem wyjaśnić dwóch podstawowych obserwacji (por. Murphy, 2002). Po pierwsze, niemal wszystkie pojęcia mają naturę rozmytą – nawet definicje niektórych terminów naukowych (planeta, metal) są sporne, a już dla większości pojęć z życia codziennego nie jesteśmy w stanie podać definicji, a jedynie listę przypadków podpadających pod pojęcie. Po drugie, teoria klasyczna nie wyjaśnia niezwykle silnego efektu typowości: ludzie szybciej uczą się i kategoryzują typowych przedstawicieli kategorii (tj. wróbel) niż przedstawicieli nietypowych (tj. pingwin), a zapytani o przykłady danego pojęcia, spontanicznie podają najpierw egzemplarze typowe. 19 20 Adam Chuderski, Józef Bremer Ludzie wzajemnie podzielają przekonania o typowości: w badaniu E. Rosch (1973) ponad sto uczestniczących w nim osób całkowicie zgodziło się co do najbardziej typowych reprezentantów kilku kategorii (np. pojazdy – samochód, zbrodnia – morderstwo). Choć niektórzy teoretycy (głównie filozofowie, np. Peacocke, 1992; Rey, 1994) wciąż odnajdują w klasycznej teorii pojęć inspirację, to teoretyczne wyjaśnienia nabywania i reprezentowania pojęć oraz kategoryzacji za ich pomocą zostały zdominowane przez trzy teorie psychologiczne stojące w opozycji wobec podejścia klasycznego: teorię prototypów (Rosch i Mervis, 1975), teorię egzemplarzy (Medin i Shaffer, 1978) oraz tzw. teorię teorii (Murphy i Medin, 1985), nazywaną także – jak się wydaje zręczniej – podejściem opartym na wiedzy (knowledge approach; Murphy, 2002). Pierwsze dwie teorie próbują wyjaśnić proces nabywania i reprezentowania pojęć w umyśle w terminach wykrywania i ujmowania zewnętrznego (powierzchownego) podobieństwa pomiędzy elementami jednej kategorii. Wraz ze wzrostem stopnia podobieństwa rośnie prawdopodobieństwo zaliczenia obiektu w zakres tej kategorii. Teorie te różnią się jednak założeniami na temat tego, jaka reprezentacja umysłowa jest rezultatem doświadczania poszczególnych elementów kategorii. Teoria prototypów przewiduje, że takim rezultatem jest pewna reprezentacja sumaryczna, która zawiera syntetyczne informacje o cechach posiadanych przez obiekty należące do kategorii. Wersje teorii prototypów różnią się tym, czym miałby być prototyp: reprezentacją najbardziej typowego przedstawiciela kategorii, albo uśrednioną reprezentacją przedstawiciela idealnego (nieistniejącego w rzeczywistości), w tym jego obrazem, albo wreszcie listą najważniejszych cech i ich najbardziej typowych wartości dla danej kategorii (Murphy, 2002). Ten ostatni pogląd przyjmuje się najczęściej, ponieważ pozwala on uniknąć problemu z reprezentowaniem skrajnie nietypowych obiektów kategorii. Reprezentowanie pojęcia w postaci przedstawiciela najbardziej typowego lub idealnego powodowałoby bowiem, że zawężeniu ulegałaby wariancja obiektów zaliczanych do odpowiadającej mu kategorii, a także czyniło niemożliwym reprezentowanie cech rozłącznych (np. jeśli połowa populacji słoni występuje w Azji, a druga połowa – w Afryce, to skąd miałby pochodzić prototyp słonia?). W przypadku listy cech, można łatwo reprezentować możliwe wartości cechy i prawdopodobieństwo ich wystąpienia, w tym wartości nietypowe, oraz reprezentować wagę danej cechy dla zaliczenia obiektu do kategorii. Elementami typowymi dla kategorii będą obiekty posiadające bardzo prawdopodobne wartości cech o wysokich wagach. Jednakże prototyp rozumiany jako lista cech przynosi inny poważny problem teoretyczny: cechy (np. występowanie) i ich wartości (Azja, Pojęcia jako przedmiot badań interdyscyplinarnych Afryka) same w sobie stanowią pojęcia nie mniej skomplikowane niż pojęcie, które opisują (słoń). Prototypowa natura pojęć nie pomaga zatem w rozwiązaniu problemu redukcji pojęć do prostszych od nich treści umysłowych. Z powyższym problemem mierzą się proponenci teorii egzemplarzy (Medin i Shaffer, 1978). Według nich, sednem problemu dotyczącego pojęć nie jest tworzenie reprezentacji pojęcia, ale poprawna kategoryzacja jego przedstawicieli. Najłatwiejszą do tego drogą jest po prostu reprezentowanie wszystkich spotkanych przypadków kategorii (posiadanie w pamięci ich tzw. egzemplarzy), bez korzystania z jakiejkolwiek reprezentacji sumarycznej. Ogromne możliwości pamięci epizodycznej umożliwiają bowiem zapamiętanie wielu egzemplarzy pojęcia. Egzemplarze stanowią prostsze treści umysłowe niż pojęcia (np. obrazy, bodźce słuchowe – nazwy, epizody opisujące kontekst towarzyszący napotkaniu przypadku) i w takim sensie możemy mówić o redukcji pojęć w teorii egzemplarzy. Spostrzegane (w tym nowe) obiekty będą kategoryzowane poprzez określenie liczby egzemplarzy, do których są bardzo podobne. Typowe obiekty będą kategoryzowane szybko, gdyż więcej egzemplarzy będzie do nich podobnych. Przeciwnie, proces wyszukiwania egzemplarzy podobnych do obiektów nietypowych będzie wymagał odrzucenia wielu niezgodnych egzemplarzy i przez to będzie trwał długo. Teoria egzemplarzy w sposób naturalny wyjaśnia, dlaczego proces kategoryzacji zależy od wcześniejszych doświadczeń z przedstawicielami określonej kategorii: dziecko, które spotkało dotąd cztery jamniki i dwa pudle, ma z pewnością inne pojęcie „psa” niż dziecko mieszkające przy hodowli dobermanów. Teoria egzemplarzy wydaje się więc niezwykle intuicyjna w odniesieniu do wczesnych etapów nabywania pojęć, wtedy gdy napotkanych dotąd obiektów jest niewiele i są one zbyt różne od siebie, aby można utworzyć ich zgeneralizowaną reprezentację prototypową. Najpoważniejszy problem teoretyczny związany z teorią egzemplarzową dotyczy tego, na jakiej podstawie człowiek przypisuje nowotworzony egzemplarz do określonych kategorii w hierarchii kategorii (Murphy, 2002). Jeśli widzimy dobermana, to na jakiej zasadzie przypisujemy go do coraz ogólniejszych kategorii: „doberman”, „pies”, „zwierzę”, „istota żywa”, „składnik wszechświata”, oraz do kategorii częściowo pokrywających się z poprzednimi tj. „obiekty zagrażające”. Czy kategoryzując nowopoznany gatunek ryby jako zwierzę, porównamy ją także do egzemplarza dobermana, czy wyłącznie do egzemplarzy zwierząt-ryb? Teoria egzemplarzy nie daje dobrych odpowiedzi na te pytania i niesatysfakcjonująco wyjaśnia hierarchiczną organizację wiedzy człowieka. 21 22 Adam Chuderski, Józef Bremer W ramach obu teorii, prototypów i egzemplarzy, zaproponowano formalne modele kategoryzacji. Podstawowa różnica pomiędzy nimi polega na tym, że modele oparte na teoriach prototypowych zakładają addytywny wpływ podobieństwa cech, a modele egzemplarzowe przewidują wpływ multiplikatywny. We wczesnych modelach prototypowych (np. Tversky, 1977) podobieństwo, na podstawie którego ocenia się przynależność obiektu do kategorii, wylicza się jako sumę cech podobnych minus sumę cech odróżniających kategoryzowany obiektu od prototypu. Ponieważ prototyp jest konstruowany na podstawie cech wspólnych dla większości przedstawicieli kategorii, modele te przewidują największe prawdopodobieństwo zaliczenia obiekt do kategorii w przypadku umiarkowanego podobieństwa do wielu jej przedstawicieli. Z kolei, w modelach egzemplarzowych (Medin i Shaffer, 1978) podobieństwo obiektu jest wyliczane jako iloczyn jego podobieństwa do wszystkich egzemplarzy branych pod uwagę. Oznacza to, że jeśli nawet obiekt jest tożsamy z wieloma egzemplarzami kategorii (podobieństwo równe jedności), ale bardzo różny od jednego czy dwóch egzemplarzy (podobieństwo bliskie zeru), to ocena podobieństwa (odpowiedni iloczyn) drastycznie spadnie w takim wypadku. Teoria egzemplarzowa przewiduje więc, że wysokie prawdopodobieństwo pozytywnej kategoryzacji wystąpi wtedy, gdy kategorię opisuje niewiele, ale bardzo podobnych do siebie egzemplarzy (tak, aby mnożyć przez siebie jedynie liczby bliskie jedności). Nowsze modele egzemplarzowe (Ashby i Maddox, 1993; Nosofsky, 1992) wskazują jednak, że jeden model formalny może służyć replikacji efektów przewidywanych zarówno przez teorie egzemplarzowe, jak i teorie prototypów, zależnie od przyjętych parametrów modelu. Przewidywania obu tych teorii są więc specyficznymi przypadkami bardziej ogólnego prawa oceny podobieństwa między obiektami. Bayesowskie teorie kategoryzacji (Tennenbaum, 1999), które szczegółowo prezentuje T. Smoleń w rozdziale „Bayesowska teoria oceny podobieństwa i kategoryzacji”, są bardzo dobrym kandydatem na taką właśnie, ogólną teorię. Trzecia wpływowa psychologiczna teoria pojęć, czyli podejście oparte na wiedzy, choć uznaje reprezentowanie prototypów/egzemplarzy przez umysł za możliwe w wielu przypadkach, to przyjmuje jednocześnie, że ocena podobieństwa jest jedynie wstępnym etapem tworzenia reprezentacji pojęciowej – kluczowe dla posiadania pojęcia jest zrozumienie (naiwnej) teorii tego, czym to pojęcie jest, w kontekście szerokiej wiedzy o świecie11. Pojęcia to rezultat wnioskowania na W tym sensie podejście to łączy wiele ze wspomnianą powyżej teorią pojęciowego łączenia Fauconniera i Turnera oraz teorią wyidealizowanych modeli po11 Pojęcia jako przedmiot badań interdyscyplinarnych podstawie wiedzy, w oparciu o zasady dotyczące pewnej dziedziny. Nasze dojrzałe pojęcie psa nie wynika jedynie ze spostrzegania różnych psów, ale jest ufundowane na wiedzy o zoologii, genetyce, potocznej psychologii itp. Wiemy, że istnieje pewna wewnętrzna własność każdej kategorii zwierząt (np. charakterystyczny materiał genetyczny, budowa wewnętrzna) powodująca, że zwierzę to nie przechodzi do innej kategorii nawet jeśli zostałoby doń powierzchownie upodobnione (Keil, 1989). Z drugiej strony, wiedza ta pozwala nam kategoryzować obiekty razem, mimo ich niewielkiego podobieństwa zewnętrznego (np. wiemy, że gąsienice i motyle stanowią jeden gatunek). Do utworzenia reprezentacji kategorii używamy relacji przyczynowych i wyjaśniających: u przedstawicieli kategorii ptaków skrzydła nie są cechą po prostu wysoce skorelowaną z lataniem – one powodują, że ptaki (choć nie wszystkie) w ogóle potrafią latać (Prinz, 2002). Typowi przedstawiciele pojęcia to obiekty dobrze przewidywane przez odpowiadającą mu (naiwną) teorię, podczas gdy obiekty nietypowe naruszają niektóre zasady tej teorii. Kategoryzacja obiektów w dużej mierze zależy od oczekiwań i przekonań kategoryzującego, a powierzchowne cechy służą jedynie do weryfikacji tych przekonań. Największym problemem związanym z podejściem opartym na wiedzy jest złożoność postulowanych pojęć-teorii: każda teoria zawiera lub odnosi się do innych teorii, z których każda zawiera kolejne pojęcia. Zakres i treść każdego pojęcia są zależne holistycznie od systemu pojęciowego poszczególnych osób (człowiek nieposiadający pojęcia „DNA” będzie miał inne pojęcie „psa” niż człowiek posiadający to pojęcie), co powoduje poważną trudność w określeniu ogólnych i mechanistycznych zasad opisujących kategoryzację (co z kolei jest łatwe w ramach teorii prototypów i egzemplarzy). Pewnym rozwiązaniem tego problemu są dynamicznie rozwijane badania nad rozumowaniem przez analogię, które modeluje się obliczeniowo (Hummel i Holyoak, 2003) jako proces strukturalnego (tj. zachowującego formalne relacje pomiędzy dwiema domenami) dopasowania źródłowych schematów do zrozumienia nowej sytuacji (nowego obiektu). Modelując treść schematów, można przewidywać rezultaty procesu kategoryzacji. Wszystkie trzy teorie: prototypów, egzemplarzy i podejście oparte na wiedzy, podlegały szeroko zakrojonym testom empirycznym. Przedstawienie tych badań przekracza zakres niniejszego wprowadzenia (dla obszernego przeglądu zob. Machery, 2009; Murphy, 2002; Prinz, 2002), ale warto wspomnieć o dwóch najważniejszych efektach empirycznych, jakie zaobserwowano. znawczych (idealized cognitive models) Lakoffa (1987), zaproponowanych w ramach językoznawstwa kognitywnego. 23 24 Adam Chuderski, Józef Bremer Pierwsze zagadnienie to badania źródeł efektu typowości. Rosch i Mervis (1975) wykazały, że obiekt jest tym bardziej typowy, im więcej ma wspólnych cech z innymi obiektami uznanymi za typowe i im mniej ma wspólnych cech z typowymi obiektami z innych kategorii. Wynik ten silnie wspierał teorię prototypów. Badania prowadzone przez Barsalou (1985) skomplikowały jednak ten obraz. Barsalou zidentyfikował dwa kolejne czynniki wpływające na ocenę typowości obiektów. Pierwszym czynnikiem była częstość pojawiania się obiektu w kontekście docelowej kategorii (częstość pojawiania się obiektu w innych kontekstach nie była związana z jego typowością). Jeśli wielokrotnie usłyszymy, że łabędzie przelatują na zimę do ciepłych krajów, podniesie to naszą ocenę typowości łabędzia jako ptaka, ale wielokrotna ekspozycja na kury w kontekście sklepu mięsnego nie da podobnego efektu. Wynik ten ściśle przewiduje teoria egzemplarzy: każda ekspozycja dodaje jeden egzemplarz do pamięci, ale tylko egzemplarze indeksowane właściwą nazwą-pojęciem biorą udział w kategoryzacji i wnioskowaniu. Drugim istotnym czynnikiem okazał się stopień do jakiego dany obiekt spełnia cel, któremu służy dana kategoria (np. pojazdy – do przemieszczania się, owoce – do bycia smacznymi). Efekt ten był szczególnie wyraźny dla pojęć sztucznych: często jako bardzo typowe oceniano pojazdy mające niewiele wspólnych cech z innymi pojazdami (np. samolot), ale umożliwiające skuteczne przemieszczanie się, a jako nietypowe oceniano pojazdy powolne (np. traktor), mimo że miały one wiele wspólnych cech z innymi reprezentantami kategorii pojazdów (w większości składającej się z pojazdów kołowych). W innych swoich badaniach Barsalou (1983) pokazał, że ludzie są w stanie bardzo szybko i trafnie podawać typowych przedstawicieli wymyślonych kategorii (np. rzeczy, które należy zabrać z płonącego domu), odpowiadających tzw. pojęciom ad hoc, z którymi nigdy wcześniej nie mieli do czynienia. Te wyniki z kolei świadczą zdecydowanie na rzecz podejścia opartego na wiedzy. Druga ważna obserwacja to tzw. efekt poziomu podstawowego (Rosch, Mervis, Gray, Johnson i Boyes-Braem, 1976). Ludzie szybciej identyfikują obiekt jako pojęcie na pośrednim poziomie ogólności (np. jako krzesło) niż jako pojęcie ogólniejsze (mebel) albo bardziej szczegółowe (krzesło biurowe). Efekt ten sprawia pewne problemy teorii prototypów, bo wydaje się, że obiekty kategorii na poziomie podrzędnym mogłyby prowadzić do powstania lepszego prototypu niż w przypadku poziomu podstawowego (tzn. krzesła biurowe mniej różnią się między sobą niż różnią się nawzajem wszystkie krzesła). Biorąc jednak pod uwagę to, że z kolei krzesła biurowe mniej się różnią od innych kategorii krzeseł, niż krzesła różnią się od innych mebli (stołów, szaf), Pojęcia jako przedmiot badań interdyscyplinarnych oraz to, że kategoria mebli zawiera podkategorie, które mają nawzajem niewiele wspólnego, prototypy na poziomie podstawowym mogą być dobrym kompromisem w przetargu między interkategorialną dystynktywnością (niską dla pojęć podrzędnych) a intrakategorialnym podobieństwem (niskim dla pojęć nadrzędnych). Wyjaśnienie tego efektu w ramach podejścia opartego na wiedzy jest analogiczne do argumentacji teorii prototypów: poziom podstawowy niesie po prostu największą ilość informacji o obiekcie. Na poziomie nadrzędnym określonych jest niewiele bardzo ogólnych cech, a choć na poziomie podrzędnym występuje wiele cech, to są one nietrafnymi predyktorami całej kategorii (np. niewiele psów posiada ciapki dalmatyńczyków). Największe kłopoty z wyjaśnieniem efektu poziomu podstawowego ma teoria egzemplarzy, ponieważ przewiduje ona, że największe podobieństwo egzemplarzy dotyczyć będzie poziomów podrzędnych, a wraz z podnoszeniem poziomu kategoryzacji rosnąć będzie dywersyfikacja przywoływanych egzemplarzy, zatem będzie spadać ocena podobieństwa (patrz reguła multiplikatywna). Kłopoty teorii egzemplarzy są pochodną jej słabości w wyjaśnianiu hierarchicznej organizacji pojęć. Bez dodatkowych (dość sztucznych) założeń, teoria ta nie radzi sobie z wyjaśnieniem efektu poziomu podstawowego (Murphy, 2002). Występuje także wiele bardziej specyficznych efektów, które często wspierają tylko jedną z teorii pojęć. Na przykład, po pewnym czasie prototypy są pamiętane lepiej niż poszczególne egzemplarze (Posner i Keele, 1970), a co więcej, mimo iż pacjenci z amnezją proaktywną nie są w stanie zapamiętywać prezentowanych im egzemplarzy (nie obserwuje się poprawy kategoryzacji w funkcji liczby prezentacji egzemplarza), to wraz z uczeniem coraz lepiej rozpoznają prototyp stanowiący uśrednienie prezentowanych egzemplarzy (Knowlton, 1997). Z drugiej strony, odkryto wiele tzw. efektów egzemplarza, polegających między innymi na tym, że historia wcześniej prezentowanych obiektów wpływa na proces późniejszej kategoryzacji kolejnych obiektów z kategorii (Murphy, 2002). Odkryto także tzw. efekty wiedzy, polegające na szybszym uczeniu się sztucznie zdefiniowanych pojęć, jeśli tylko niektóre ich cechy są zgodne z uprzednią wiedzą (Kaplan i Murphy, 2000). Debata między zwolennikami trzech podejść do wyjaśnienia natury pojęć jest więc daleka od rozstrzygnięcia. Trzeba jednak pamiętać, że w kategoriach ekonomii i elegancji teorii naukowych, teoria prototypów zakłada najprostszą reprezentację pojęciową (jeden ogólny prototyp), teoria egzemplarzy – reprezentację bardziej złożoną (względnie szczegółową pamięć o wszystkich napotkanych egzemplarzach), a teorie oparte na wiedzy czynią najsilniejsze założenia na temat tej reprezentacji. Aby zaakceptować te ostatnie teorie kosztem pierwszych, na- 25 26 Adam Chuderski, Józef Bremer leży zatem wymagać silnych argumentów empirycznych, dających się wyjaśnić wyłącznie w ramach podejścia opartego na wiedzy. Być może jednak nie potrzeba odrzucać żadnej z omawianych teorii. Badania nad różnicami inter- i intraindywidualnymi w reprezentowaniu pojęć wskazują, że prawdopodobnie wszystkie trzy sposoby ich reprezentowania (prototypy, egzemplarze i naiwne teorie) są obecne w ludzkim umyśle (pytanie – w jakiej relacji pozostają do siebie). Przeprowadzono sporo badań, które wskazywały na to, że za podobne efekty kategoryzacji w przypadku części pojęć odpowiadają reprezentacje prototypowe, a innej części – egzemplarzowe (np. Malt, 1989). Wydaje się, że ludzie potrafią przełączać się pomiędzy tworzeniem obu rodzajów reprezentacji zależnie od kategorii, z jakimi mają do czynienia, i wymagań wobec rezultatów kategoryzacji (Smith i Minda, 1998). Na przykład, pojęcia obiektów konkretnych mogą być lepiej ujmowane przez egzemplarze, a pojęcia abstraktów – przez prototypy lub naiwne teorie. Świadczą o tym między innymi dane neurobiologiczne (zob. poniżej – podrozdział o neuronauce). Z kolei badania nad formalnymi modelami kategoryzacji pokazały, że do wyników części osób najlepiej pasują predykcje modelu prototypowego, a do wyników pozostałej części – modelu egzemplarzowego (Smith, Murray i Minda, 1997). Prawdopodobnie, ludzie różnią się między sobą w tendencji do używania jednego albo drugiego rodzaju reprezentacji pojęciowych. Niezwykle ważnym zagadnieniem jest problem nabywania pojęć podczas rozwoju poznawczego człowieka. Tradycyjne poglądy piagetowskie głoszące, iż tworzenie pojęć jest rezultatem akomodacji reprezentacji umysłowych do nowych informacji, niemożliwych do asymilacji w ramach dotychczasowych pojęć, a kolejne stadia dostępnych dziecku akomodacji (od reprezentacji percepcyjno-motorycznych, przez pojęcia obiektów konkretnych, do abstraktów) pojawiają się stosunkowo późno w ontogenezie, zostały w znacznym stopniu odrzucone w świetle najnowszych badań (Carey, 2009). Dzięki wykorzystaniu metod wywoływania dyshabituacji uwagi albo pobudzenia (zdziwienia) u dzieci (tj. naruszania ich oczekiwań kategoryzacyjnych) wiemy, że już w pierwszych miesiącach życia proces nabywania pojęć jest wysublimowany i zawiera istotną komponentę wnioskowania. Wydaje się, że dzieci są wyposażone we wbudowaną „maszynerię” służącą zaawansowanemu kategoryzowaniu. W tekście „Dlaczego pojęcia muszą być badane w ujęciu rozwojowym” M. Haman przedstawia wiele przykładów „dojrzałej” kategoryzacji dziecięcej i argumentuje na rzecz tezy, że ograniczenia w nabywaniu „naiwnych teorii” przez dzieci przejawiają się następnie w strukturze wiedzy pojęciowej osób doro- Pojęcia jako przedmiot badań interdyscyplinarnych słych. Stanowią niejako jej szkielet, wyznaczający i ograniczający organizację systemu pojęciowego. Dwa rozdziały niniejszej monografii traktują o kolejnym istotnym zagadnieniu, czyli o roli pojęć w myśleniu. E. Nęcka w „Twórczość jako zmiana pojęciowa” analizuje to, w jaki sposób zmiana pojęciowa umożliwia twórcze myślenie, ale jednocześnie, jak przebieg i rezultaty takiego myślenia wpływają na strukturę i treść systemu pojęć. Nęcka wyróżnia możliwe rodzaje zmian pojęciowych w procesie twórczym oraz podaje ich liczne przykłady. M. Bukowski w rozdziale „Reprezentacje pojęciowe z perspektywy poznania społecznego” rozważa rolę pojęć w poznaniu społecznym oraz analizuje specyfikę tzw. pojęć społecznych. Autor wskazuje, że badania nad nabywaniem i używaniem pojęć w kontekście społecznym mogą rzucić nowe światło na funkcjonowanie systemu pojęciowego, a szczególnie na jego motywacyjno-emocjonalne uwikłanie. SZTUCZNA INTELIGENCJA Druga połowa XX w. to okres dynamicznego rozwoju systemów informatycznych oraz robotów rozwiązujących problemy dotąd zarezerwowane wyłącznie dla ludzi. Dwa podstawowe podejścia do konstrukcji systemów sztucznej inteligencji (SI) to podejście symboliczne, oparte na wiedzy (knowledge-based intelligence), w ramach którego koduje się wiedzę za pomocą reprezentacji zawierających symbole, odpowiadające mniej lub bardziej wyrażeniom języka, i operacji (np. reguł) dokonywanych na tych symbolach, oraz podejście niesymboliczne (inaczej: subsymboliczne, ilościowe, numeryczne; computational intelligence), w którym podstawowymi jednostkami reprezentacji są elementy zdefiniowane na niższym poziomie niż symbole (np. jako wagi połączeń między sztucznymi neuronami i ich aktywacje). O ile podejście symboliczne charakteryzuje duży stopień produktywności (zdolności do dowolnego kombinowania ze sobą symboli), łatwości interpretacji rezultatów działania oraz ekonomii przetwarzania informacji (skondensowanie reprezentacji, szybkość operacji), to nie radzi sobie ono z takimi problemami takimi jak zdolność do uczenia się na przykładach i generalizacji oraz łatwość oceny podobieństwa. Te problemy z kolei zadowalająco rozwiązują systemy niesymboliczne. Z tego powodu coraz popularniejsze stają się systemy hybrydowe, łączące zalety (i unikające wad) obu podejść (Cloete i Zurada, 2003; Sun i Alexandre, 1997). Klasyczne reprezentacje wiedzy pojęciowej w ramach symbolicznej SI wykorzystują rachunek predykatów, stanowiący podstawę języka programowania w logice – PROLOG-u. Pozwala on na użycie przej- 27 28 Adam Chuderski, Józef Bremer rzystej składni i dobrze zdefiniowanej semantyki. Tam jednak, gdzie wiedza nie może być dobrze zdefiniowana (czyli w większości przypadków) i jest ona bardzo obszerna (a wnioskowanie w PROLOG-u jest względnie mało efektywne), konieczne są bardziej efektywne obliczeniowo symboliczne reprezentacje pojęć, stanowiące zestaw obiektów oraz ich atrybutów (własności) i wartości tych atrybutów (tzw. slot-and-filler representations). Choć reprezentacje te zawsze można przetłumaczyć na zdania rachunku predykatów, to tylko za cenę utraty efektywności wnioskowania za ich pomocą (Nilsson, 1980). Wyróżnia się słabe reprezentacje typu slot-and-filler, które nie narzucają ograniczeń na możliwe atrybuty (ale na ich dozwolone wartości – już tak), oraz mocne reprezentacje tego typu, które jednoznacznie definiują, jakie atrybuty może mieć obiekt (Knight i Rich, 1991). Do pierwszej klasy reprezentacji należą sieci semantyczne oraz systemy ram (inaczej: schematów), a do drugiego rodzaju – skrypty. W sieci semantycznej obiekty i atrybuty są reprezentowane za pomocą zbioru węzłów połączonych ze sobą oznaczonymi łukami, które reprezentują relacje między węzłami. Na przykład łuk ogon (Azor, krótki) informuje o długości ogona Azora. Dwie wyróżnione, ogólne relacje (czyli niezależne od dziedziny, z której pochodzi pojęcie) to relacja „należy-do” (isa) oraz relacja „jest-egzemplarzem” (instance), np. należy-do (psy, ssaki) oraz jest-egzemplarzem (Azor, psy). W ramie (Minsky, 1975), obiekt jest zwykle bogatszym i bardziej ustrukturyzowanym zestawem atrybutów i ich wartości. W szczególności, wartością atrybutu mogą być inne ramy. W istocie granica między sieciami semantycznymi i systemami ram jest nieostra. Siłą obu sposobów reprezentacji jest efektywne wnioskowanie o atrybutach pojęć i relacjach między nimi oraz jasne zdefiniowanie, które atrybuty pojęć na wyższych poziomach (np. ssaki) są dziedziczone przez pojęcia na poziomach niższych (psy) i ich egzemplarze (Azor). Z kolei skrypty stanowią reprezentację pojęć odnoszących się do sekwencji czynności (Schank i Abelson, 1977). Wykorzystują one inną teorię reprezentacji – teorię zależności pojęciowych Schanka (1975), która określa podstawowe relacje, jakie są możliwe między pojęciami i ich egzemplarzami (np. transfer informacji, zmiana lokalizacji obiektu, przeniesienie ciała), i za ich pomocą wyraża relacje złożone. Skrypty narzucają istotne ograniczenia na dopuszczalne sekwencje czynności (np. w popularnym przykładzie z wizytą w restauracji, nie można zjeść posiłku bez złożenia zamówienia i nie można wyjść bez zapłacenia za zamówiony posiłek), ale dzięki temu system SI jednoznacznie wie jak wykonać czynność zapisaną w skrypcie. W rozdziale „Zagadnienie reprezentacji pojęć w sztucznej inteligencji”, M. Flasiński przedstawia zagadnienie pojęciowania w systemach SI, prezentując za- Pojęcia jako przedmiot badań interdyscyplinarnych równo problemy, które zostały już zadowalająco rozwiązane, jak i te w trakcie rozwiązywania oraz te, które wciąż stanowią istotne wyzwania dla badaczy sztucznej inteligencji. Za pomocą metody zwanej inżynierią wiedzy, której metody przybliża tekst G.J. Nalepy pt. „Pojęcia w inżynierii wiedzy”, tworzy się tzw. sztuczne ontologie, czyli reprezentacje pojęciowe obejmujące określoną (ale czasem – bardzo szeroką) dziedzinę wiedzy. Ontologie takie umożliwiają konstrukcję systemów ekspertowych, rozwiązujących problemy i dokonujących diagnoz w ramach dobrze zdefiniowanych dziedzin (np. medycyny, biznesu). Najbardziej ambitnym przedsięwzięciem związanym z przeniesieniem systemu pojęciowego do maszyny jest projekt Cyc (Lenat, 1995). Jego celem jest zakodowanie całej zdroworozsądkowej wiedzy człowieka. Dotychczas (rok 2011) zakodowano ontologię ok. pół miliona obiektów i zjawisk naturalnych, powszechnie używanych narzędzi oraz dziedzin aktywności i twórczości człowieka, a także ponad pięć milionów dotyczących ich faktów. Co najważniejsze, dzięki przekroczeniu masy krytycznej zakodowanej wiedzy, Cyc potrafi dodawać sam do siebie nowe pojęcia lub ich własności, wnioskując o nich z posiadanej wiedzy oraz z odpowiedzi swoich użytkowników. Jednakże, mimo rozwoju procedur uczenia się systemów opartych na wiedzy, wciąż istnieją poważne ograniczenia w zdolności do indukcji w takich systemach. Zupełnie odmienne zasady reprezentacji pojęć przyjęto w podejściu niesymbolicznym, w szczególności w najczęściej wykorzystywanych systemach neuropodobnych (sztucznych sieciach neuronowych). W takich sieciach (np. Rogers i McClelland, 2004), jednostki (tzw. sztuczne neurony) wejściowe i wyjściowe reprezentują elementarne cechy obecne w świecie – wymiary, na których pojęcia mogą być podobne lub się różnić – oraz nazwy obiektów, które posiadają podzbiór dostępnych cech. Uczenie się pojęć przez sieć może polegać na przykład na jednoczesnej aktywacji jednostek-cech posiadanych przez określony obiekt oraz aktywacji jednostki odpowiadającej jego nazwie. W istocie, tak właśnie uczymy się świata jako dzieci, łącząc percepcję obiektów z wypowiadanymi przez dorosłych nazwami. Następnie aktywacja propagowana jest do warstw ukrytych, które odpowiadają za pamięć skojarzeń między informacjami wejściowymi i wyjściowymi – czyli za reprezentację świata sieci neuronowej. Propagacja jest zależna od układu wag połączeń między jednostkami sieci, ustalanego w wyniku długotrwałego procesu uczenia. Pewne jednostki ukryte mogą być bardzo silnie aktywowane przez jedne cechy, a bardzo słabo – przez inne. Po określonej (zwykle znacznej) liczbie prób uczenia powiązań między cechami a obiektami, sieć potrafi zgadywać, który obiekt charakteryzują zadane cechy lub 29 30 Adam Chuderski, Józef Bremer które cechy powinny być przypisane zadanemu obiektowi. To samo w sobie jest już niezwykle interesujące. Najciekawsze wyniki daje jednakże analiza wag i aktywacji w warstwach ukrytych, rozumianych jako wielowymiarowa przestrzeń. Okazuje się, że obiekty z tej samej kategorii można zlokalizować bardzo blisko siebie w tej przestrzeni. Poszczególne kategorie tworzą osobne grupy – klastry, które jednak mogą się częściowo pokrywać w przypadku pojęć nieostrych. Klastry dla kategorii należących do tej samej kategorii wyższego rzędu leżą bliżej siebie niż klastry odpowiadające innej kategorii wyższego rzędu. Klastry dla kategorii rozłącznych (np. zwierzęta-rośliny) zajmują rozłączne (i zwykle odległe) podprzestrzenie przestrzeni wag. Zwolennicy powyższego podejścia twierdzą więc, że wraz z uczeniem się rozkładu wag pomiędzy warstwami wejściowymi i wyjściowymi a warstwami ukrytymi podczas prezentacji egzemplarzy, sieć emergentnie nabywa reprezentacje pojęć im odpowiadających (Rogers i McClelland, 2004). R. Tadeusiewicz w tekście „Awangarda sztucznej inteligencji – maszyny które potrafią same tworzyć nowe pojęcia” przedstawia metody uczenia sieci neuronowych oraz przykłady tworzenia przez te sieci reprezentacji nieznanych im dotąd pojęć. O ile podejście symboliczne ma na celu efektywną reprezentację pojęć, to podejście niesymboliczne jest skupione na efektywnej kategoryzacji (ew. predykcji) obiektów. Często więc, mimo że sieć doskonale przypisuje obiekty do kategorii, rozkład wag w warstwach ukrytych trudno jest przełożyć na zrozumiały dla człowieka opis pojęć i relacji, jakich sieć się nauczyła. Aby rozwiązać ten problem, prowadzi się badania nad ekstrakcją wiedzy symbolicznej z sieci neuropodobnych. Badania te są jednak o tyle trudne, że struktura zakodowana w warstwach ukrytych może być nieidentyfikowalna, tzn. więcej niż jeden opis struktury pasuje do rozkładu wyuczonych wag. Drugim problemem jest ograniczona moc obliczeniowa sieci neuronowych, która zwykle nie przekracza mocy automatu stanu skończonego (Omlin i Giles, 2003), któremu daleko jest do mocy równoważnej Maszynie Turinga, dostępnej systemom symbolicznym12. Powoduje to ograniczenia w nabywaniu wiedzy pojęciowej i wnioskowaniu na jej podstawie, które w szczególności dotyczą abstrakcyjnych pojęć relacyjnych (Doumas i Hummel, 2005). Znany przykład (Markus, 2001) wskazuje na niemożność nauczenia się przez sieć pojęcia identyczności: jeśli wielokrotnie Rekurencyjna sieć neuronowa co do zasady jest w stanie osiągnąć moc równoważną mocy Maszyny Turinga, ale ze względu na wymagania dotyczące architektury oraz precyzji obliczeń, które taka sieć musiałaby spełnić, osiągnięcie takiej mocy przez sieci neuronowe jest faktycznie niemożliwe (por. Omlin i Giles, 2003). 12 Pojęcia jako przedmiot badań interdyscyplinarnych zaprezentujemy sieci określone liczby i jako poprawną odpowiedź wskażemy sieci te same liczby (tzn. „1” – „1”, „2” – „2” itd.), sieć nauczy się odpowiadać identyczną liczbą tylko dla zbioru uczącego (powiedzmy, od „1” do „7”), ale już dla nowej liczby przekraczającej ten zbiór (np. „9”) sieć odpowie nie tą samą liczbą, ale najbliższą jej liczbą spośród liczb wyuczonych („7”). Inne sieci neuronowe, zaprojektowane do wnioskowania o relacjach (np. St John, 1992), nie były w stanie nauczyć się ogólnego pojęcia relacyjnego mimo miliona prób uczących. Większości ludzi zauważenie takich abstrakcyjnych relacji przychodzi bez trudu nawet po dwu, trzech próbach (w istocie, zadania tego typu są składnikami popularnych testów inteligencji). Aby wyjaśnić i zreplikować nabywanie abstrakcyjnych pojęć przez ludzi, konstruuje się więc hybrydowe systemy neurosymboliczne (np. Doumas, Hummel i Sandhofer, 2008), łączące relacyjność i abstrakcyjność reprezentacji symbolicznych z bogactwem semantycznym i łatwością reprezentowania podobieństwa, cechującymi sieci neuronowe. NEURONAUKA Kiedy fizjolog i psycholog Hebb pisał o pojęciach, to zajmowało go przede wszystkim ustalenie neuronalnych struktur, na bazie których psychologowie odnoszą się do pojęć. Gdy zidentyfikował owe struktury, próbował użyć ich jako punktu wyjścia dla czysto neurologicznego przedstawienia myśli. Hebb przyjmuje, że zbiorowiska (assemblies) komórek utworzone z grup połączonych neuronów tworzą podstawowy element procesów poznawczych (Andreassi, 2009). Dla Hebba pojęcia „są w mózgu”, o czym mają świadczyć empiryczne oczywistości jak np. to, że silnie połączone neurony będą działały razem jako funkcjonalne jednostki. Mózgową podstawą zdolności człowieka do posiadania pojęć jest oczywiście system pamięci semantycznej, obejmujący pamięć deklaratywną i epizodyczną. Strukturą mózgu odpowiedzialną przede wszystkim za formowanie neuronalnych śladów pamięciowych, szczególnie w pamięci epizodycznej, jest hipokamp i otaczające go obszary płata skroniowego (Jaśkowski, 2009). Najpierw w procesie konsolidacji synaptycznej formowane są połączenia synaptyczne od hipokampa do różnych obszarów kory biorących udział w reprezentowaniu danego wspomnienia (w różnych modalnościach percepcyjnych), a następnie (w okresie od kilku dni do kilku lat) następuje konsolidacja systemowa – odpowiednie obszary kory zostają połączone ze sobą z pominię- 31 32 Adam Chuderski, Józef Bremer ciem pośrednictwa hipokampa (Moskovitch, Nadel, Winocur, Gilboa i Rosenbaum, 2006). Najwcześniej do badania tego, jak mózg przetwarza znaczenie pojęć (słów) wykorzystano metody elektroencefalograficzne. Analiza potencjałów elektrycznych na powierzchni czaszki skorelowanych ze zdarzeniami (tzw. potencjałów wywołanych) jest niezwykle popularna np. w neurolingwistyce (Szewczyk, 2009). Metoda ta ma doskonałą rozdzielczość czasową. Na przykład, odkryto, że około 400 ms po prezentacji słowa niezgodnego ze znaczeniem zdania, którego jest ono częścią (np. „włączył radio i je zjadł”), w pewnych rejonach kory pojawia się potencjał negatywny (zwany N400). Niestety, słabością metody jest niska rozdzielczość przestrzenna. Wiele danych na temat mózgowych procesów odpowiedzialnych za przetwarzanie znaczenia przyniosły badania z zakresu neuropsychologii, dokonywane na osobach z określonymi uszkodzeniami mózgu. Interesującym przykładem zaburzenia jest rodzaj afazji zwany anomią, w którym osoba ma dostęp do pojęcia (np. koloru – potrafi to pojęcie opisać lub odpowiednio kategoryzować kolorowe obiekty; Mattocks i Hynd, 1986), ale nie do jego nazwy. Z kolei w przypadkach agnozji semantycznej pacjenci tracą dostęp do pojęć za pomocą percepcji wzrokowej, nie będąc w stanie podać znaczenia widzianego obiektu, ale zachowują ów dostęp, jeśli tylko pozwoli im się go dotknąć lub powąchać (Magnié, Ferreira, Giusiano i Poncet, 1999). W badaniach neuronaukowych nad pojęciami stosuje się także analizę funkcjonowania pojedynczych neuronów, dokonywaną przy pomocy elektrod wprowadzonych bezpośrednio do odpowiednich struktur mózgu, na przykład do obszaru hipokampa. Niezwykle dużą popularność zyskała hipoteza o istnieniu tzw. neuronów babci (zwanych także neuronami: Naomi Campbell, Britney Spears, Billa Clintona itd.) – pojedynczych neuronów, które aktywują się podczas percepcji nazwy, zdjęcia lub dźwięku jednego konkretnego obiektu (właśnie naszej babci albo jakiejś znanej osoby), i to niezależnie od kontekstu czy perspektywy, w/z której ten obiekt jest prezentowany. Neurony te nie aktywują się jednak w rezultacie prezentacji innego obiektu o podobnej relacji do osoby badanej (np. innej sławnej osoby; Koch, 2008). Mamy więc do czynienia w mózgu z lokalnym reprezentowaniem obiektów-egzemplarzy przez grupy nielicznych neuronów. Pojawia się pytanie o to, czy podobne kodowanie może dotyczyć także reprezentacji pojęć. Badania D. Coxa i R. Savoya (2003) oraz T. Mitchella i współpracowników (2008; Shinkareva i in., 2008), prowadzone z wykorzystaniem innej metody badania mózgu – neuroobrazowania funkcjonalnym rezonansem magnetycznym (fMRI), wskazują na to, że – przeciwnie – repre- Pojęcia jako przedmiot badań interdyscyplinarnych zentacja pojęć w mózgu jest rozproszona i obejmuje wiele różnorakich obszarów korowych i podkorowych. Oba badania polegały na tym, że osobom badanym prezentowano obrazki (badania Coxa i Savoya) lub rzeczowniki (badania Mitchella) oznaczające dobrze znane pojęcia z poziomu podstawowego (np. seler, samolot itp.). Podczas prezentacji, za pomocą fMRI rejestrowano wzorce aktywności mózgu. Wzorce dla różnych pojęć były zwykle odmienne. Funkcje przypisywane aktywnym obszarom mózgu były często powiązane semantycznie z pojęciami, których dotyczyły. Na przykład, we wzorcu odpowiadającym pojęciu „biegnięcia” bardzo aktywny okazał się obszar, któremu przypisuje się funkcję percepcji ruchów istot żywych. Z kolei obiekty miękkie, smaczne czy pachnące aktywowały odpowiednie obszary kory czuciowej (Mitchell i in., 2008). Następnie, uczono model komputerowy klasyfikacji uzyskanych wzorców jako odpowiadających prezentowanemu obrazkowi/słowu. Kluczowym etapem każdego z badań było przewidywanie tego, jakiemu pojęciu będzie odpowiadał nowy wzorzec aktywności, wcześniej nieprezentowany modelowi. Model Coxa i Savoya potrafił poprawnie klasyfikować wzorce aktywności mózgu odpowiadające pojęciom podobnym do pojęć, których wzorce aktywności, uzyskane od tej samej osoby, były użyte podczas uczenia modelu. Model Mitchella i in. potrafił więcej: poprawnie klasyfikował wzorce dla pojęć z zupełnie nowych (dla modelu) kategorii poziomu nadrzędnego (np. wzorzec dla samolotu, mimo że model nie był uprzednio uczony wzorca odpowiadającego jakiemukolwiek pojazdowi) oraz – w kolejnym badaniu (Shinkareva i in., 2008) – przewidywał jakiemu pojęciu odpowiada wzorzec aktywności uzyskany od osoby, której wzorce w ogóle nie były użyte do uczenia modelu. Przynajmniej dla pojęć z poziomu podstawowego, odpowiadających konkretnym przedmiotom, wzorce aktywności mózgu wydają się kodować zestaw cech tych przedmiotów i są bardzo powtarzalne intra- (Cox i Savoy, 2003) oraz interindywidualnie (Mitchell i in., 2008). Badania nad lokalizacją znaczenia pojęć w mózgu przybliżają nas do odpowiedzi na pytanie: o czym myśli (obrazowany) mózg. Niewątpliwie, badania te dopiero rozpoczynają się na dobre i wkrótce można oczekiwać znaczących rezultatów na tym polu. Wiele danych z badań neurofizjologicznych wskazuje jednak, że mózg dysponuje nie jednym, a różnorodnymi mechanizmami kodowania pojęć. Między innymi, badania Ch. Marsoleka (1995; 1999) pokazały, że lewa półkula skuteczniej niż prawa rozpoznaje wzorce prototypowe, a prawa rozpoznaje skuteczniej niż lewa widziane uprzednio egzemplarze. Jest to niewątpliwie związane z tym, że lewej półkuli przypisuje się większą specjalizację w przetwarzaniu języka, a prawej – w myśleniu wyobrażeniowym. W rozdziale „Neurobiologia pojęć kon- 33 34 Adam Chuderski, Józef Bremer kretnych i abstrakcyjnych”, F. Gęsiarz uzasadnia tezę, że przetwarzanie przez mózg pojęć odpowiadających obiektom konkretnym angażuje odmienne struktury neuronalne niż przetwarzanie pojęć odpowiadających obiektom abstrakcyjnym, oraz szczegółowo opisuje oba rodzaje struktur i ich funkcje. Autor wskazuje, że przetwarzanie pojęć aktywuje rozległe obszary mózgu, a nasze spójne i całościowe doświadczanie znaczenia pojęć prawdopodobnie wynika z synchronizacji aktywności wszystkich tych obszarów za pomocą pasma gamma (ok. 40 Hz). Niektóre z tych obszarów okazują się jednak być wyspecjalizowane w przetwarzaniu specyficznych procesów pojęciowych, na przykład tzw. zakręt wrzecionowaty wydaje się odpowiadać za niezwykle szybką i poprawną kategoryzację obiektów na podstawie drobnych różnic w ich charakterystyce sensorycznej (np. twarzy). Oczywiście to, gdzie w mózgu zachodzą określone rodzaje i etapy procesów przetwarzania pojęć i kategoryzacji jest kwestią niezwykle interesującą, ale najciekawsze jest chyba zagadnienie, w jaki sposób mózg przetwarza informacje pojęciowe. Próbę odpowiedzi na to pytanie stanowią wysiłki dyscypliny lokującej się pomiędzy neurofizjologią a informatyką, czyli neuronauki obliczeniowej (computational neuroscience), poświęconej konstruowaniu i weryfikacji modeli mózgu. Neuronauka obliczeniowa obejmuje szerokie spektrum modeli, od modeli precyzyjnie symulujących budowę i biologiczne działanie neuronów i ich kolumn (np. Blue Brain Project poświęcony wiernemu odwzorowaniu mózgu; Markram, 2006), poprzez modele specyficznych, dobrze określonych funkcji mózgu (np. jego funkcji kontrolnych; Brown i Braver, 2007), po ogólne modele architektury mózgu – wielu jego modułów i interakcji pomiędzy nimi (np. modele ludzkiego konektomu; Sporns, 2009). W końcowym rozdziale niniejszego tomu, zatytułowanym „Jak reprezentowane są pojęcia w mózgu i co z tego wynika” W. Duch dokonuje przeglądu wpływowych formalnych modeli ludzkiego mózgu i próbuje przewidzieć to, czego będziemy mogli się wkrótce dowiedzieć o pojęciach (i myśleniu w ogóle) dzięki badaniu i modelowaniu funkcjonowania mózgu. Podsumowanie – niektóre pytania stojące przed interdyscyplinarnymi badaniami pojęć Od 50 lat perspektywa kognitywna przekracza tradycyjne granice dyscyplin naukowych, aby z różnych punktów widzenia i korzysta- Pojęcia jako przedmiot badań interdyscyplinarnych jąc z metodologicznie różnych sposobów postępowania zbudować to, co nazywamy interdyscyplinarnym, „kognitywnym” paradygmatem. Celem tego postępowania nie jest tylko zbieranie samej wiedzy, lecz także porządkowanie wiedzy o wiedzy, która następnie jest poddawana krytycznej dyskusji. Właściwie każde z klasycznych i współczesnych pytań o pojęcia, które wymieniliśmy powyżej, może i powinno być rozpatrywane z perspektywy kognitywistycznej. Poniżej podajemy jedynie wybór takich pytań, na które, naszym zdaniem, trzeba szukać odpowiedzi. 1. JAKIMI OBIEKTAMI SĄ POJĘCIA (GDZIE SĄ ZLOKALIZOWANE: W GŁOWIE CZY W ŚWIECIE)? Pierwsze pytanie związane jest z filozoficzną debatą eksternalizm-internalizm, która powinna jednak znaleźć także swoje miejsce w badaniach empirycznych. Czy rację mają internaliści, którzy utożsamiają pojęcia z treścią reprezentacji umysłowych obecnych „w głowie” człowieka, czy mają ją eksternaliści, którzy twierdzą, że nawet znajomość całościowego stanu mózgu nie wystarczy, aby znaleźć korelat stanów świadomych, do których należą pojęcia. Według tych ostatnich, treść pojęcia zależy bowiem od otoczenia, w którym osoba się znajduje. Jeśli eksternalizm jest prawdziwy, to całościowy stan umysłu nie pozwala na określenie, co jest treścią myśli danej osoby. Z jednej strony, cytowane badania nad neuroobrazowaniem aktywności mózgu pokazują znaczy stopień izomorfizmu pomiędzy jego funkcjonalnymi własnościami a cechami pojęć, do których owa aktywność się odnosi. Zapewne, obserwując wzorzec aktywności mózgu, będziemy wkrótce w stanie określić, o czym myśli jego posiadacz/ka. Wyniki te dotyczą jednakże tylko pojęć konkretnych. Z drugiej strony, rezultaty uzyskane w ramach lingwistyki stosowanej pokazują, że maszyny potrafią trafnie używać pojęć „wydobywając” ich znaczenie ze statystycznych zależności i regularności obecnych w – zewnętrznym wobec umysłu – korpusie tekstów. Znaczenie może być więc zlokalizowane „w świecie”, a pojęcia można rozważać jako rodzaj obiektów abstrakcyjnych (por. Piłat, niniejszy tom). Jako argument na rzecz poglądu eksternalistycznego wysuwa się także fakt istnienia pojęć, które najprawdopodobniej istnieją i będą kiedyś pomyślane, ale które obecnie nie są reprezentowane w umyśle żadnego człowieka (np. pojęcie kwantowej teorii grawitacji). 35 36 Adam Chuderski, Józef Bremer 2. CZYM JEST TREŚĆ POJĘĆ? Odpowiedź na pytanie o treść pojęć zależy oczywiście od poglądu: eksternalistycznego versus internalistycznego, na naturę pojęć. Eksternaliści powinni powiedzieć, jakie elementy czy własności otaczającego umysł świata lub jego relacji do umysłu przynależą do treści pojęć. Przed internalistami stoi pytanie o to, w jaki sposób własności świata odzwierciedlane są w treści reprezentacji umysłowych. Jakie informacje są zakodowane w umysłowej reprezentacji pojęć i co one umożliwiają (por. Hetmański, niniejszy tom)? 3. CO JEST MEDIUM (NOŚNIKIEM, REPREZENTACJĄ) POJĘĆ W UMYŚLE? Kluczowym pojęciem nauk kognitywnych – gdy chodzi o myślenie, pamięć i poznanie – jest pojęcie reprezentacji (Clapin, 2004). Badania nad reprezentacjami mogą pomóc w zamknięciu wielokrotnie wspominanej przerwy (explanatory gap) między tym, co fizyczne, a przeżyciem psychicznym. Czym jest jednak owo medium, nośnik pojęć w umyśle? Czy trafne jest opisywanie struktur reprezentacyjnych jako odzwierciedlających obiekty umysłowe znane nam z introspekcji, takich jak nazwy, sądy (twierdzenia), obrazy umysłowe (por. Francuz, niniejszy tom) oraz wyobrażenia dźwięków, zapachów itp.? Czy może reprezentacje pojęć należy raczej opisywać za pomocą języków formalnych: na przykład modeli matematycznych czy obliczeniowych. W takich modelach pojęcia zredukowane są do niższego poziomu opisu, na przykład do struktur takich jak grafy, wektory, tensory, wzorce oscylacji, trajektorie w przestrzeni fazowej itp. (por. Duch; Flasiński; Smoleń, niniejszy tom). W jakiej postaci zakodowane są pojęcia? Jakie są ich składniki? 4. JAKA JEST STRUKTURA SYSTEMU POJĘĆ? Kolejne pytanie dotyczy tego, co wiemy o systemie pojęciowym. W jakim zakresie zaproponowane dotąd teorie pojęć: teoria prototypowa, egzemplarzowa, podejście oparte na wiedzy oraz inne (np. J. Fodora koncepcja atomizmu pojęciowego) stanowią trafne opisy systemu pojęciowego oraz wynikających z niego zasad kategoryzacji? Czy nasz system pojęciowy jest amalgamatem odmiennych struktur pojęciowych (prototypów, egzemplarzy, naiwnych teorii itd.), czy są Pojęcia jako przedmiot badań interdyscyplinarnych to raczej nietrafne, fragmentaryczne opisy systemu, dla którego pełniejszego zrozumienia potrzebujemy nowej, rewolucyjnej teorii pojęć? W jakim zakresie struktura naszych pojęć optymalnie odzwierciedla strukturę świata (por. Smoleń, niniejszy tom), a w jakim – jest wynikiem naszej nieskrępowanej otoczeniem konstrukcji znaczeń i kategorii, obejmującej m.in. metaforyzację oraz wnioskowanie przy pomocy analogii (por. Nęcka; Tabakowska, niniejszy tom)? 5. JAKA RELACJA WYSTĘPUJE POMIĘDZY POJĘCIAMI I JĘZYKIEM? Słowa są rozumiane jako korelaty pojęć, a nie jako naiwny, przyczynowy związek odwzorowania czy tożsamości z jakąś jednostką myślową. Należy jednak dodać, że owa jednostka myślowa (= pojęcie) jakiegoś słowa musi utrzymywać jakiś związek z jednostką językową (por. Bremer, niniejszy tom). Empirycznie określony rodzaj i typ tego związku wymaga dalszych badań. Na ile bowiem pojęcia są – lub nie są – związane z poszczególnymi językami? Dzisiaj lepiej aniżeli w przeszłości wiemy, że są one jednak pod wpływem każdorazowego społecznego i kulturowego tła jakiejś wspólnoty językowej. Jeśli hipoteza Whorfa w jej umiarkowanej postaci, mówiąca o wzajemnej interakcji języka i myślenia, powinna zostać utrzymana, to jaka jest natura tej interakcji? Kiedy język determinuje nasze pojęcia, a kiedy posiadane pojęcia określają sposoby komunikacji? 6. JAKA RELACJA WYSTĘPUJE POMIĘDZY POJĘCIAMI I PERCEPCJĄ? Spostrzeganie i przypominanie może być ujęte jako aktywność cielesna, która w zmianach i stabilizacji pewnych cielesnych struktur tworzy „reprezentacyjną” pamięć, umożliwiającą powtarzalne „reprezentacyjne” połączenia. Mózg, centralny i obwodowy układ nerwowy, narządy zmysłów, całe ciało tworzy i spełnia rolę „funkcji zachowania” kompleksowej sieci, w której trwałe powiązania są powtarzalnie utrzymywane. Dalszych badań wymaga to, w jaki sposób owe powiązania są neuronalnie ukonstytuowane (por. Gęsiarz, niniejszy tom). Obecnie, przekonania o percepcyjnym ugruntowaniu wiedzy pojęciowej są powszechnie przyjmowane w świetle dostępnego nam obszernego materiału empirycznego (por. Francuz, niniejszy tom). Przyjmując 37 38 Adam Chuderski, Józef Bremer takie ugruntowanie, musimy jednak odpowiedzieć na pytania dotyczące wyższych, abstrakcyjnych czynności umysłowych, które intuicyjnie wydają się wykraczać poza domenę spostrzeżeniową. W jaki sposób tworzymy pojęcia rzeczy, których nie spostrzegamy bezpośrednio w otaczającym nas świecie: np. pojęcia abstrakcyjne (por. Szwedek, niniejszy tom) czy pojęcia społeczne (por. Bukowski, niniejszy tom)? Czy możemy poznawać cokolwiek środkami wyłącznie percepcyjnymi, poza domeną umysłową podlegającą konceptualizacji? Jaki udział biorą elementy percepcyjne w przetwarzaniu abstrakcyjnych struktur i relacji, przetwarzaniu symboli, czy konstrukcji teorii naukowych? 7. JAKA RELACJA WYSTĘPUJE POMIĘDZY POJĘCIAMI I OTOCZENIEM, SPOŁECZEŃSTWEM ORAZ KULTURĄ? Otwartość pojęć należy odróżnić od ich nieokreśloności. Pojęcia nie są tak niezmienne, jak to często przyjmujemy. Np. pojęcie „matka” zmienia się wraz z metodą sztucznego zapłodnienia, gdy jedna kobieta może nosić zapłodnione jajo innej kobiety. Tym samym dziecko może mieć dwie matki: biologiczną i zastępczą, co oznacza wyraźną modyfikację pierwotnego pojęcia „matka”. Warunki konieczne do bycia matką zostały naruszone, gdyż pojęcie matki wcale nie ustala jednoznacznie, jakie cechy „bycia matką” muszą się ze sobą łączyć. Ciąża i macierzyństwo nie są już w sposób konieczny powiązane, co zdaje się być nie tylko problemem społecznym. Wiele – jeśli nie wszystkie – naszych pojęć można opisać jako „otwarte”, a ustalone w nich powiązania jako kontekstualistyczne i koherencyjne, podlegające jednocześnie nieustannym zmianom, jak i mogące oddziaływać na całą sieć innych pojęć. Na jakiej podstawie rozumiemy i komunikujemy się w obrębie grup społecznych oraz odmiennych kultur, mimo że nasze pojęcia są tak zmienne i otwarte? 8. JAK LUDZKIE UMYSŁY I MASZYNY NABYWAJĄ POJĘCIA? Najnowsze badania prowadzone w ramach psychologii rozwojowej wywróciły nasze wyobrażenia o wiedzy pojęciowej posiadanej przez małe dzieci – okazuje się ona imponująca, a dziecięce mechanizmy nabywania pojęć – bardzo sprawne (por. Haman, niniejszy tom). Wiele pytań, między innymi dotyczących precyzyjnych mechanizmów i zasad odkrywania regularności i struktur w świecie, wymaga nadal Pojęcia jako przedmiot badań interdyscyplinarnych odpowiedzi, ale badania rozwojowe i inne (np. epigenetyka) niewątpliwie rzucają nowe światło na problem wrodzonych versus nabywanych składników wiedzy. W badaniu sztucznej inteligencji na szczególne podkreślenie zasługują osiągnięcia, jakie sieci neuronowe odnotowują w klasyfikacji i rozpoznawaniu wzorców (por. Tadeusiewicz, niniejszy tom). Do interdyscyplinarnie naukowego ustalenia pozostaje, na ile zdolności te zbliżają je do zdolności biologicznych sieci neuronowych obecnych w organizmach żywych. Problemem pozostaje, ze względu na złożoność systemów samouczących, opis dynamiki procesów uczenia maszyn pojęć. Debata dotyczy także tego, czy do zrozumienia zasad nabywania pojęć i kategoryzacji niezbędna jest wiedza o tym, jak robi to mózg (por. Duch, niniejszy tom), czy raczej powinniśmy abstrahować od niezwykle złożonej i nieprzejrzystej materii mechanizmów neurobiologicznych i próbować odpowiadać na pytanie o to, na czym w ogólności polega postawione przed organizmami zadanie tworzenia i używania pojęć i jakie są skuteczne metody rozwiązania tego zadania (por. Smoleń, niniejszy tom). Ważnym pytaniem jest także to, jak nauczenie pojęć konkretnych, niewątpliwie wymagające uwzględnienia ucieleśnienia i enaktywizmu systemu uczącego się, przechodzi w nabywanie pojęć abstrakcyjnych, w pewnej mierze oderwanych od bezpośredniego doświadczenia i dotyczących relacji wyższego rzędu. Prace nad modelami, które potrafiłyby wysoce abstrahować, dopiero się rozpoczynają. 9. JAK MÓZG TWORZY I REPREZENTUJE POJĘCIA? Odpowiedzi na pytanie o czasowo-przestrzenne miejsce pojęć – językowej lub myślowej natury – należy szukać w badaniu tego, co klasycznie nazywamy pamięcią. Wielu neuropsychologów zaznacza, że pamięć jest najważniejszym organem zmysłów (Pauen, 2001, Roth, 1992). Niemniej jednak porozdzielane, oscylujące, stale się zmieniające sieci neuronów utrudniają identyfikację jednego określonego miejsca i czasu dla pojęć. Mechanizm pojęciowej pamięci nadal czeka na wyjaśnienie. Ustalenia wymaga w jaki sposób wszystko to, co najczęściej spostrzegamy, pochodzi z pamięci. Spostrzegamy ciągle przez „okulary” naszej pamięci, gdyż to co aktualnie spostrzegamy, jest silnie określone przez wcześniejsze spostrzeganie. W neuronaukowym spojrzeniu na język i pojęcia dużą rolę powinna odgrywać eksperymentalna neurolingwistyka (Müller 2003), gdzie aktywność neuronów może być opisana jako empiryczny odpowiednik procesów kategoryzacji. 39 40 Adam Chuderski, Józef Bremer Badania nad neuronalnymi mechanizmami nabywania i reprezentacji pojęć oraz kategoryzacji, nad mózgową lokalizacją poszczególnych funkcji pojęciowych, a przede wszystkim nad interakcją i koordynacją tych wszystkich funkcji w adekwatne do otoczenia, celowe, twórcze i abstrakcyjne posługiwanie się wiedzą pojęciową, stanowić będą zapewne jeden z najważniejszych kierunków badań nad pojęciami. Literatura cytowana Andreassi, J.L. (2009). Psychophysiology. Human behavior and physiological response. Mahwah, NJ: Taylor & Francis. Ashby, F.G., Maddox, W.T. (1993). Relations between exemplar, prototype, and decision bound models of categorization. Journal of Mathematical Psychology, 37, 372–400. Barsalou, L.W. (1983). Ad hoc categories. Memory and Cognition, 11, 211–227. Barsalou, L.W. (1985). Ideals, central tendency, and frequency of instantiation as determinants of graded structure in categories. Journal of Experimental Psychology: Learning, Memory, and Cognition, 11, 629–654. Barsalou, L.W. (1999). Perceptual symbol systems. Behavioral and Brain Sciences, 22, 577–660. Bartlett, F.C. (1932). Remembering. Cambridge: Cambridge University Press. Bobrowski, I. (1993). Językoznawstwo racjonalne: z zagadnień teorii językoznawczej i metodologii opisów gramatycznych. Kraków: Instytut Języka Polskiego PAN. Brown, H.I. (2007). Conceptual systems. London: Routledge. Brown, J.W., Braver, T.S. (2007). Risk prediction and aversion by anterior cingulate cortex. Cognitive, Affective, & Behavioral Neuroscience, 7, 266–277. Carey, S. (2009). The origin of concepts. New York: Oxford Univesity Press. Chomsky, N. (1966). Cartesian linguistics: a chapter in the history of rationalist thought. New York: Harper & Row. Chomsky, N. (2006). Linguistic contribution to the study of mind: Future. W: N. Chomsky (red.), Language and mind. Cambridge, MA: MIT Press. Clapin, H., Staines, P., Slezak, P. (red.) (2004). Representation in mind. New approaches to mental representation. Oxford: Elsevier. Cloete, I., Zurada, J.M. (red.) (2003). Knowledge-based neurocomputing. Cambridge, MA: MIT Press. Cox, D.D., Savoy, R. (2003). fMRI Brain Reading: detecting and classifying distributed patterns of fMRI activity in human visual cortex. NeuroImage, 19, 261–270. Doroszewski, W. (red.) (1964). Słownik języka polskiego. Warszawa: PWN. Pojęcia jako przedmiot badań interdyscyplinarnych Doumas, L.A.A., Hummel, J.E. (2005). Approaches to modeling human mental representations: What works, what doesn’t and why. W: K.J. Holyoak, R. Morrison (red.), The Cambridge handbook of thinking and reasoning (s. 73–91). Cambridge, England: Cambridge University Press. Doumas, L.A.A., Hummel, J.E., Sandhofer, C.M. (2008). A theory of the discovery and predication of relational concepts. Psychological Review, 115, 1–43. Evans, V., Bergen, B.K., Zinken, J. (2007). The cognitive linguistics enter­ prise: An overview. W: V. Evans, B. K. Bergen i J. Zinken (red.), The cognitive linguistics reader. Equinox Publishing Co. Fauconnier, G. (1985). Mental spaces: Aspects of meaning construction in natural language. Cambridge, MA: MIT Press. Fauconnier, G., Turner, M. (2002). The way we think: Conceptual blending and the mind’s hidden complexities. New York: Basic Books. Fodor, J.A. (2003). Hume variations. Oxford: Oxford University Press. Francuz, P. (2007). Teoria wyboraźni Stephena Kosslyna. Próba reinterpretacji. W: P. Francuz (red.), Obrazy w umyśle. Studia nad percepcją i wyobraźnią (s. 149–189). Warszawa: WN Scholar. Frege, G. (1977). Funkcja i pojęcie. W: G. Frege, Pisma semantyczne. tłum. B. Wolniewicz, Warszawa: PWN. Haller, R. (1971). Begriff. W J. Ritter (red.), Historisches Wörterbuch der Philosophie. Basel/Stuttgart: Schwabe & Co Verlag. Heidemann, D.H. (2003). Vom Empfinden zum Begreiffen. Kant im Kon­text der gegenwärtigen Erkenntnistheorie. W: D.H. Heidemann, K. Engel­ hard (red.), Warum Kant heute? Berlin: Walter de Gruyter. Hummel, J.E., Holyoak, K.J. (2003). A symbolic-connectionist theory of re­ lational inference and generalization. Psychological Review, 110, 220–264. Jackendorf, R. (2002). Foundations of language: Brain, meaning, grammar, evolution. Oxford: Oxford University Press. Jaśkowski, P. (2006). Neuronauka poznawcza. Jak mózg tworzy umysł. Warsza­ wa: VizjaPress. Ji, L-J., Zhang, Z., Nisbett, R.E. (2004). Is it culture or is it language? Examination of language effects in cross-cultural research on categori­ zation. Journal of Personality and Social Psychology, 87, 57–65. Kaplan, A.S., Murphy, G.L. (2000). Category learning with minimal prior knowledge. Journal of Experimental Psychology: Learning, Memory, and Cognition, 26, 829–846. Keil, F.C. (1989). Concepts, kinds, and cognitive development. Cambridge, MA: MIT Press. Koch, C. (2008). Neurobiologia na tropie świadomości. Warszawa: Wydaw­ nictwa UW. 41 42 Adam Chuderski, Józef Bremer Kosslyn, S.M. (1980). Image and mind. Cambridge, MA: Harvard University Press. Knowlton, B.J. (1997). Declarative and nondeclarative knowledge: Insights from cognitive neuroscience. W: K. Lamberts, D.R. Shanks (red.), Knowledge, concepts, and categories. Cambridge, MA: MIT Press. Lakoff, G. (1987). Women, fire and dangerous things: What categories reveal about the mind. Chicago: University of Chicago Press. Lakoff, G. (1990). The invariance hypothesis: Is abstract reason based on image-schemas? Cognitive Linguistics, 1, 39–74. Lakoff, G., Johnson, M. (1980). Metaphors we live by. Chicago: University of Chicago Press. Lakoff, G., Johnson, M. (1999). Philosophy in the flesh: The embodied mind and its challenge for western thought. New York: Basic Books. Landauer, T.K., Dumais, S.T. (1997). A solution to Plato’s problem: The latent semantic analysis theory of acquisition, induction, and representation of knowledge. Psychological Review, 104, 211–240. Langacker, R. (1987). Foundations of cognitive grammar. Volume I. Stanford: Stanford Univeristy Press. Lenat, D.B. (1995). Cyc: A large-scale investment in knowledge infrastructure. Communications of the ACM 38, 33–38. Lennon, T.M. (2007). Locke on ideas and representation. W: L. Newman (red.), The Cambrigde Companion to Locke’s „Essay Concerning Human Understanding” (s. 231–257). Cambridge, Cambridge University Press. Lubaszewski, W. (red.) (2009). Słowniki komputerowe i automatyczna ekstrakcja informacji z tekstu. Kraków: Akademia Górniczo-Hutnicza. Machery, E. (2009). Doing without concepts. Oxford: Oxford University Press. Magnié, M.N., Ferreira, C.T., Giusiano, B., Poncet, M. (1999). Category specificity in object agnosia: preservation of sensorimotor experiences related to objects. Neuropsychologia, 37, 67–74. Malt, B.C. (1989). An on-line investigation of prototype and exemplar strategies in classification. Journal of Experimental Psychology: Learning, Memory, and Cognition, 26, 539–555. Markram, H. (2006). The Blue Brain Project. Nature Reviews Neuroscience, 7 (luty 2006), 153–160. Marcus, G.F. (2001). The algebraic mind: Integrating connectionism and cognitive science. Cambridge, MA: MIT Press. Marsolek, C.J. (1995). Abstract visual-form representations in the left cerebral hemisphere. Journal of Experimental Psychology: Human Perception and Performance, 21, 375–386. Marsolek, C.J. (1999). Dissociable neural subsystems underlie abstract and specific object recognition. Psychological Science, 10, 111–118. Pojęcia jako przedmiot badań interdyscyplinarnych Mattocks, L., Hynd, G.W. (1986). Color anomia: Clinical, developmental, and neuropathological issues. Developmental Neuropsychology, 2, 101–112. Medin, D.L., Schaffer, M.M. (1978). Context theory of classification learning. Psychological Review, 85, 207–238. Miller, G.A. (2003). The cognitive revolution: A historical perspective. Trends in Cognitive Sciences, 7, 141–144. Minsky, M. (1975). A framework for representing knowledge. W: P. Winston (red.), The psychology of computer vision. New York: McGraw-Hill. Mitchell, T.M., Shinkareva, S.V., Carlson, A., Chang, K.M., Malave, V.L., Mason, R.A., Just, M.A. (2008). Predicting human brain activity associated with the meanings of nouns. Science, 320, 1191. Mölder, B. (1999). Formational atomism versus inferential role semantics in Jerry Fodor’s „Concepts: Where Cognitive Science Went Wrong”. Journal of the Humanities and Social Sciences, 3, 39–57. Moscovitch, M., Nadel, L., Winocur, G., Gilboa, A., Rosenbaum, R.S. (2006). The cognitive neuroscience of remote memory: A focus on functional neuroimaging. Current Opinion in Neurobiology, 16, 179–190. Murphy, G.L. (2002). The big book of concepts. Cambridge, MA: MIT Press. Murphy, G.L., Medin, D.L. (1985). The role of theories in conceptual coherence. Psychological Review, 92, 289–316. Nilsson, N. J. (1980). Principles of artificial intelligence. Palo Alto, CA: Morgan Kaufman. Nisbett, R.E. (2003). The geography of thought. How Asians and Westerners think differently …and why. New York: The Free Press. Nosofsky, R.M. (1992). Exemplars, prototypes and similarity rules. W: A. Healy, S. Kosslyn, R. Schiffrin (red.), From learning theory to connectionist theory: Essays in honor of W. K. Estes (s. 149–168). Hillsdale, NJ: Erlbaum. Omlin, C.W., Giles, C.L. (2003). Symbolic knowledge representation in recurrent neural networks: Insights from theoretical models of computation. W: I. Cloete, J.M. Zurada (red.), Knowledge-based neurocomputing (s. 63–115). Cambridge, MA: MIT Press. Paivio, A. (1986). Mental representations. A dual coding approach. New York: Oxford University Press. Pauen, M. (2001). Grundprobleme der Philosophie des Geistes. W: M. Pauen, G. Roth (red.), Neurowissenschaften und Philosophie (s. 83–122). München: Wilhelm Fink Verlag. Peacocke, C. (1992). A study of concepts. Cambridge, MA: MIT Press. Posner, M.I., Keele, S.W. (1970). Retention of abstract ideas. Journal of Experimental Psychology, 83, 304–308. Prinz, J.J. (2002). Furnishing the mind. Concepts and their perceptual basis. Cambridge, MA: MIT Press. 43 44 Adam Chuderski, Józef Bremer Pylyshyn, Z.W. (1973). What the mind’s eye tells the mind’s brain: A critique of mental imagery. Psychollogical Bulletin, 80, 1–24. Rey, G. (1994). Concepts. W: S. Guttenplan (red.), A companion to the philoso­ phy of mind. Oxford: Blackwell. Rich, E., Knight, K. (1991). Artificial intelligence. Second Edition. New York: McGraw-Hill. Rogers, T.T., McClelland, J.L. (2004). Semantic cognition: A parallel distributed processing approach. Cambridge, MA: MIT Press. Rosch, E. (1973). Natural categories. Cognitive Psychology, 4, 328–350. Rosch, E., Mervis, C.B. (1975). Family resemblance: Studies in the internal structure of categories. Cognitive Psychology, 7, 573–605. Rosch, E., Mervis, C.B., Gray, W. Johnson, D., Boyes-Braem, P. (1976). Basic objects in natural categories. Cognitive Psychology, 8, 382–439. Roth, G. (1992). Das konstruktive Gehirn: Neurobiologische Grundlagen von Wahrnehmung und Erkenntnis. W: S. Schmidt (red.), Kognition und Gesellschaft. Der Diskurs des Radikalen Konstruktivismus (s. 277–336). Frankfurt am Main: Suhrkamp. Schank, R.C. (1975). Conceptual information processing. Amsterdam: NorthHolland. Schank, R.C., Abelson, R.P. (1977). Scripts, plans, goals, and understanding. Hillsdale, NJ: Erlbaum. Scheerer, E. (1992). Repräsentation. W: J. Ritter, K. Gründer (red.), Histo­ risches Wörterbuch der Philosophie. Basel/Stuttgart: Schwabe & Co Verlag. Shinkareva, S.V., Mason, R.A., Malave, V.L., Wang, W., Mitchell, T.M., i in. (2008). Using fMRI brain activation to identify cognitive states associated with perception of tools and dwellings. PLoS ONE, 3, e1394. Smith, J.D., Minda, J.P. (1998). Prototypes in the mist: The early epochs of category learning. Journal of Experimental Psychology: Learning, Memory, and Cognition, 24, 1411–1436. Smith, J.D., Murray, M.J. Jr, Minda, J.P. (1997). Straight talk about linear separatibility. Journal of Experimental Psychology: Learning, Memory, and Cognition, 23, 659–680. Sporns, O. (2009). The human connectome: Linking structure and function in the human brain. W: H. Johansen-Berg, T.E.J. Behrens (red.), Diffusion MRI. From quantitative measurement to in vivo neuroanatomy (s. 309–332). London: Academic Press. St. John, M.F. (1992). The story Gestalt: A model of knowledge-intensive processes in text comprehension. Cognitive Science, 16, 271–302. Szewczyk, J. (2009). Metoda potencjałów wywołanych EEG w psycholin­ gwistycz­nych badaniach nad przetwarzaniem zdań. Studia Psychologicz­ ne, 47, 23–37. Pojęcia jako przedmiot badań interdyscyplinarnych Steels, J. (2006). The Symbol Grounding Problem has been solved. So what’s next? <www.ecagents.org/dllink.php?id=267&type=Document>, [30.06.2011] Sturm, T. (2008). Why did Kant reject physiological explanations in his anthropology? Studies in Philosophy and History of Science, 39, 495–505. Sun, R., Alexandre, F. (eds.) (1997). Connectionist-symbolic integration. Mah­ wah, NJ: Erlbaum. Tenenbaum, J.B. (1999). Bayesian modeling of human concept learning. Advances in Neural Information Processing Systems, 11, 59–65. Tversky, A. (1977). Features of similarity. Psychological Review, 84, 327–352. Weiner, I.B., Craighead, W.E. (red.) (2010). The Corsini encyclopedia of psycho­ logy. Volume 3. Hoboken, NJ: John Wiley & Sons. Wexler, K. (2001). Innateness of language. W: R.A. Wilson, F.C. Keil (red.), The MIT encyclopedia of cognitive sciences. Cambridge, MA: MIT Press. Wittgenstein, L. (2000). Dociekania filozoficzne, II, tłum. B. Wolniewicz, Warszawa: PWN. Wittgenstein, L. (1998). Uwagi o kolorach, tłum. R. Reszke, Warszawa: Spacja. 45 Niedostępne w wersji demonstracyjnej. Zapraszamy do zakupu pełnej wersji książki w serwisie