Studia z Kognitywistyki i Filozofii Umysłu Tom 3 Poznań 2009 Studia z Kognitywistyki i Filozofii Umysłu Tom 3 Poznań 2009 REDAKCJA Redaktor naczelny: Andrzej Klawiter Redaktorzy: Wioletta Dziarnowska Piotr Przybysz Mariusz Urbański Sekretarz redakcji: Paweł Łupkowski ADRES Instytut Psychologii UAM ul. Szamarzewskiego 89a 60-568 Poznań pok. 97 http://www.skfu.amu.edu.pl [email protected] Skład w systemie LATEX P. Łupkowski i M. Urbański Spis treści Reprezentacje umysłowe (red. działu Urszula M. Żegleń) WŁODZISŁAW DUCH Reprezentacje umysłowe jako aproksymacje stanów mózgu 5 MARCIN MIŁKOWSKI Reprezentacje w systemach klasycznych i koneksjonistycznych 29 PIOTR MARKIEWICZ Procesy wyobrażeniowe on-line 43 ADRIANA SCHETZ Widzieć krawędzie, dotykać głębi, czyli współczesne rozważania dotyczące pytania Molyneux 55 Umysł a środowisko MACIEJ BŁASZAK Ekotypy poznawcze człowieka 81 Reprezentacje umysłowe jako aproksymacje stanów mózgu Włodzisław Duch Uniwersytet Mikołaja Kopernika w Toruniu Katedra Informatyki Stosowanej Streszczenie. Neuronauki dokonały znacznego postępu w rozumieniu wyższych czynności poznawczych, w tym procesów decyzyjnych. Brakuje jednak zarówno prostych modeli, które pozwolą wyobrazić sobie te procesy, jak i głębszej refleksji nad wpływem tych wyników na zrozumienie natury umysłu, rozproszenia obaw, że nie jesteśmy tylko automatami. Płodny punkt widzenia na kwestię reprezentacji mentalnych daje próba zrozumienia, w jaki sposób informacja reprezentowana jest przez mózgi, jak w przybliżony sposób opisać stany mózgu tak, by można je było zinterpretować jako reprezentacje mentalne odnoszące się do umysłu. Czym jest w nas to, co podejmuje decyzje? Jest to kluczowa kwestia dla zrozumienia wielu zagadnień klasycznej filozofii, od wolnej woli i problemu ciała i umysłu poczynając. Chociaż iluzja homunkulusa jest silna można się od niej uwolnić. Analiza procesów podejmowania decyzji wymaga zrozumienia w jaki sposób zakodowane są w mózgu najprostsze pojęcia. Jedynie przez aproksymację fizycznych stanów mózgu, zawierających znacznie więcej informacji niż stany mentalne, możemy dokonać istotnego postępu w rozumieniu i opisie reprezentacji mentalnych, przydatnych nie tylko filozofom, ale też mających zastosowania w analizie języka naturalnego, kategoryzacji pojęć w psychologii i architekturach kognitywnych w sztucznej inteligencji. Ucieleśnienie jak i enaktywizm są dla rozwoju reprezentacji pojęć bardzo istotne ale nie wystarczające. Po analizie współczesnej wiedzy o reprezentacji pojęć w mózgu zaprezentowano podejście oparte o język układów dynamicznych, które oferuje dość prosty opis, pozwalający zrozumieć zaskakujące, często nieracjonalne decyzje podejmowane przez ludzi. Dzięki symulacjom komputerowym można się spodziewać znacznego postępu w rozumieniu reprezentacji mentalnych i wyższych czynności poznawczych, w szczególności procesów podejmowania decyzji. Studia z Kognitywistyki i Filozofii Umysłu, 3: 5–28, 2009 c 2009 Włodzisław Duch Copyright 6 Włodzisław Duch 1. Wstęp Proste organizmy działają w sposób reaktywny, w oparciu o genetycznie uwarunkowane mikroprogramy zachowań. Mucha zamknięta w pokoju lata tak długo, aż zużyje całą dostępną jej energię. Latanie z gwałtowną zmianą kierunku jest zapewne dobrą strategią unikania drapieżników (ptaków, nietoperzy), przy jednoczesnej eksploracji dużego obszaru w sposób częściowo chaotyczny, a częściowo ukierunkowany przez stężenia zapachów. Latanie w zamkniętym pomieszczeniu nie jest jednak dobrą strategią, ale mucha nie potrafi jej zmienić. Na przykładzie insektów widać najlepiej związek pomiędzy wyuczonym a instynktownym zachowaniem, oraz ograniczenia z tego wynikające (De Marco i Menzel 2008). Zdolności komunikacyjne i nawigacyjne pszczół i innych insektów są zaskakująco duże, pomimo stosunkowo prostego układu nerwowego. Bodźce zmysłowe wyzwalają sekwencje mikroprogramów sterujących zachowaniem w ewolucyjnie korzystny sposób, jednakże procesy rozwojowe mogą zmodyfikować te zachowania. Niewiele wiadomo o szczegółach oddziaływania pomiędzy wrodzonymi a wyuczonymi formami zachowań. U insektów dominują wrodzone formy zachowań, u zwierząt posiadających bardziej złożone mózgi instynktowne zachowania są w coraz większym stopniu modyfikowane, a u ludzi zwykle są dość głęboko ukryte. Jednak nawet u mrówek obserwujemy duże zdolności adaptacyjne wynikające z zależnych od kontekstu i unikalnych dla każdej kolonii bodźców zapachowych, pozwalających na sprawne działanie uwzględniające czas i miejsce pojawienia się określonych bodźców. Oprócz zapachu owady wykorzystują wzrok, smak, dotyk i odczuwanie mechanicznych wibracji. Mrówki porywające larwy innych gatunków w celu pozyskania robotników wykorzystują zjawisko wdrukowania (imprintingu). Rodney Brooks wprowadził artykułem „Słonie nie grają w szachy” (Brooks 1986) nowe tendencje rozwojowe w robotyce, odrzucając pomysły budowania symbolicznych modeli umysłu opartych na wewnętrznych reprezentacjach stanów świata. Inteligentne zachowania prostych organizmów nie wymagają od nich przechowywania wewnętrznych reprezentacji, chyba że za takie uznać zbiór zależnych od kontekstu reakcji. Brooks próbował pokazać, że można stworzyć inteligentnego robota formując jego mózg, modelowany za pomocą sieci neuronowych, w naturalny sposób przez oddziaływanie otoczenia, podobnie jak rozwija się mózg dziecka. Był to zasadniczy odwrót od wcześniejszych prób budowy sztucznej inteligencji na czysto logicznych podstawach, przy całkowitym ignorowaniu biologii. Głównym projektem, mającym udowodnić słuszność takiego podejścia, miała być budowa robota o nazwie Cog Reprezentacje umysłowe jako aproksymacje stanów mózgu 7 (Brooks i Stein 1994). Próba ta nie zakończyła się jednak powstaniem umysłu na wzór ludzki, a jedynie zbiorem odruchów pozwalających na proste reakcje. Pomimo tego robotyka rozwojowa stała się obecnie bardzo ważną dziedziną, powiązaną w psychologią rozwojową, a nadzieje na rozwój bardziej złożonych form poznania i działania są nadal silne. Jest to ciekawy eksperyment pomagający wyznaczyć granice pomiędzy wrodzonymi a wyuczonymi umiejętnościami. Jakiejś formy reprezentacji nie da się jednak uniknąć. W tym artykule spróbuję pokazać, że płodny punkt widzenia na kwestię reprezentacji mentalnych daje próba zrozumienia, jak informacja reprezentowana jest przez mózgi, jak w przybliżony sposób opisać stany mózgu tak, by można je było zinterpretować jako reprezentacje mentalne odnoszące się do umysłu. Zacznę jednak od paru uwag na temat natury umysłu i iluzji homunkulusa. 2. Homunkulus Większość badań psychologicznych i rozważań filozoficznych krytycznie podchodziła do neurobiologicznych podstaw procesów podejmowania decyzji i myślenia. Jedną z przyczyn tej niechęci mogła być silna, chociaż rzadko w pełni uświadamiana, wiara w homunkulusa, nadrzędne „ ja”, które pociąga za sznurki i wydaje decyzje realizowane przez mózg. W historii ludzkiej myśli jedynie tradycje, wywodzące się z kontemplacyjnych szkół religijno-filozoficznych Indii, rozwinięte na Dalekim Wschodzie (Chiny, Korea, Japonia), zdołały uwolnić się od iluzji homunkulusa. W jednym z najczęściej recytowanych w buddyjskich klasztorach całej Azji Południowo-Wschodniej i Dalekiego Wschodu tekstów, Maha Pradżnia Paramita Hridaja Sutra (w swobodnym tłumaczeniu oznacza to „Sutra Serca Wielkiej Mądrości Osiągającego Drugi Brzeg”), podkreślane jest to bardzo mocno (Austin 1988). W tym krótkim tekście Budda wyjaśnia swojemu uczniowi Sariputrze, czym jest wyzwolenie od cierpienia związane z odrzuceniem wszelkich złudzeń. W filozofii indyjskiej (Radhakrishnan 1958) ludzka osobowość uważana była za wytwór pięciu złożonych elementów, czyli skandh (dosłownie „skupisk”, co wskazuje na przybliżony sposób opisu). Te elementy to forma, uczucia, postrzeganie, wola i świadomość. Mędrzec postrzega, że każda z nich istnieje tylko jako zmienna konfiguracja relacji elementów, pozbawiona rzeczywistej substancji – w tekście Sutry czytamy: „w głębi mądrości ujrzał pustkę wszystkich pięciu skandh”. Wszystkie sfery zmysłowe i akty odczuwania mają iluzoryczną naturę. Formy przeżywanych wrażeń nie mają trwałej tożsamości, są chwilową konfiguracją pobudzeń mózgu, co w „Sutrze Serca” lapidarnie określa 8 Włodzisław Duch się jako „forma jest tylko pustką, pustka jest tylko formą”. Podobnie pozostałe elementy: „Uczucia, myśli, wola i świadomość sama są również takie”. Sutra ta przetłumaczona została na język chiński około 172 roku. W znacznie późniejszym tekście Hsin hsin ming („Wersety Wiary w Umysł”), napisanym przez Seng-tsana, trzeciego patriarchę Zen (zmarłego w 606 roku), czytamy (Kapleau 1992, s. 173): Rzeczy się jawią za sprawą umysłu, za sprawą rzeczy umysł się pojawia. To umysł pozwala nam odróżnić od siebie rzeczy w świecie, a świat pozwala mu się utworzyć — przyczyna nie da się odróżnić od skutku, gdyż nie ma tu prostej liniowej przyczynowości. W pieśni Zazen Wasan Hakuina czytamy (Kapleau 1992, str. 169): „Wtedy brama do jedności przyczyny i skutku zostanie otwarta na oścież”. Dzięki głębokiej introspekcji starożytni myśliciele uwolnili się od idei homunkulusa, owego „ ja” sterującego ciałem i podejmującego decyzje. Odrzucenie homunkulusa i uznanie, że człowiek jest jednością psychofizyczną, jest jednak rzeczą bardzo trudną i niektóre tradycje buddyjskie zrobiły tu krok wstecz, głosząc mgliste idee zachowania „strumienia świadomości” (Duch 2006). Powstaje bowiem głęboko zakorzeniona obawa, że jeśli jestem tylko swoim mózgiem i ciałem, to „mnie” tak naprawdę nie ma. Ta obawa jest (nie zawsze uświadomioną) motywacją do poszukiwania alternatywnych rozwiązań problemu podejmowania decyzji. Eccles i Popper w książce Mózg i jaźń (1999) głoszą potrzebę dualistycznego rozumienia człowieka twierdząc, że bez niej nie można uzasadnić ludzkiej godności. Echa takiego myślenia widać w wierszu „Zdania” Stefana Mellera (2008): „Trzecie najgłupsze zdanie / Jakie znam to: / — jestem niewierzący — / Bo znaczy tyle co / Wiem, że mnie nie ma”. Czym jest w nas to, co podejmuje decyzje? Jest to kluczowa kwestia dla zrozumienia wielu zagadnień klasycznej filozofii, od wolnej woli i problemu ciała i umysłu poczynając, ma też ważne implikacje teologiczne, leży u podstaw dualistycznych wizji człowieka. Chociaż filozofowie, fizycy i neurobiolodzy włożyli dużo wysiłku w opracowanie modeli dualistycznych, żaden z nich nie pogłębia rozumienia procesów umysłowych i nie widać w tym kierunku żadnego postępu. W ostatnich latach dzięki neuronaukom dokonał się znaczny postęp w rozumieniu wyższych czynności poznawczych, w tym procesów decyzyjnych. Brakuje jednak zarówno prostych modeli, które pozwolą wyobrazić sobie te procesy, jak i głębszej refleksji nad wpływem tych wyników na zrozumienie natury umysłu, rozproszenia obaw, że nie jesteśmy tylko automatami. Badania nad mózgiem nie są zagrożeniem dla godności ludzkiej, a stwierdzenie „mnie nie ma” jest po prostu fałszywe. Reprezentacje umysłowe jako aproksymacje stanów mózgu 9 Sprowadza się to do ustalenia, czy „ ja” i jego decyzje to jeden z wielu zachodzących w mózgu procesów, czy też jest to autonomiczny, nadrzędny, niematerialny czynnik kontrolujący mózg i ciało. Z naukowego punktu widzenia nie ma wątpliwości, że „ ja” jest jednym z wielu procesów zachodzących w mózgu. Neurobiologia jaźni rozwija się bardzo szybko (Northoff i Panksepp 2008). Komputerowe modele chorób psychicznych i syndromów neuropsychologicznych (Duch 2007) pozwalają przynajmniej w jakościowy sposób zrozumieć przyczyny patologii i normalnego funkcjonowania mózgu, Nie ma wątpliwości, że dokładniejsze modele procesów nagrody i procesów decyzyjnych pozwolą na odtworzenie rezultatów eksperymentów w tej dziedzinie. Rozumienie autonomiczności jaźni jako jednego z procesów realizowanych przez mózg pozostawia nadal wiele do życzenia. Dlatego pozwolę sobie na kilka uwag na ten temat, chociaż głównym celem tego artykułu jest przedstawienie prostego modelu pozwalającego na zrozumienie relacji pomiędzy neurodynamiką opisującą zachodzące w mózgu procesy, a symboliczną interpretacją procesów decyzyjnych. Procesy zachodzące w tkankach neuronowych mózgu są warunkiem koniecznym istnienia umysłu i powstania jaźni, podobnie jak warunkiem powstania jakiejkolwiek struktury biologicznej jest jej realizacja w oparciu o związki chemiczne zbudowane z atomów węgla i innych pierwiastków. Jednakże struktura organizmów biologicznych, przyczyna istnienia licznych organów spełniających specyficzne funkcje, jest wynikiem milionów lat rozwoju, adaptacji ewolucyjnych umożliwiających sprawne działanie pozwalające na przetrwanie gatunku w zmiennych, niekorzystnych warunkach. Nie można jej zrozumieć badając samą budowę organizmu, strukturę genomów i białek. Koncepcja autopoesis nie oddaje tu istoty rzeczy, gdyż dotyczy tylko systemowej organizacji reprodukujących się układów, podczas gdy nacisk trzeba położyć na ewolucyjny sens emergentnych własności. Analogicznie, badanie procesów neuronowych nie pozwoli w pełni zrozumieć indywidualnego umysłu, którego istotą jest specyficzna struktura relacyjna przyjmowanych przez mózgi stanów. Sensu tych relacji nie da się zrozumieć w oparciu o procesy neurofizjologiczne, bo procesy, które odpowiadają za stany mentalne, mają rację bytu tylko ze względu na istnienie umysłu wynikającego z niepowtarzalnej historii jednostki. Obserwacja przejścia pomiędzy stanami Ψα i Ψβ mózgu jest tylko zewnętrznym opisem zmian w nim zachodzących; by zrozumieć perspektywę wewnętrzną trzeba odwołać się do historii organizmu, skojarzyć w intencjonalny sposób stany Ψα i Ψβ z kontekstem środowiskowym, w którym podobne stany występowały wcześniej. Np. stan Ψ1 może wiązać się z wspomnieniem dawnej melodii, wywołując szereg skojarzeń 10 Włodzisław Duch Ψ2 , Ψ3 , . . . , Ψν , a więc stanów mentalnych realizowanych przez kolejne pobudzenia mózgu. Zależą one od kultury, w której wychowała się dana osoba, co można zweryfikować za pomocą metod neuroobrazowania (Northoff i Panksepp 2008). Dotyczy to również podstawowych mechanizmów poznawczych: Europejczycy zwracają większą uwagę na obiekty pierwszoplanowe, zapamiętując dotyczące ich szczegóły, Japończycy bardziej na relacje pomiędzy obiektami i całym środowiskiem. Różnice te widoczne są nawet w prostych eksperymentach, w których Europejczycy zapamiętują lepiej położenie pręta w ramce, nie zwracając uwagi na położenie ramki, które wpływa na percepcję Japończyków. Znajduje to odbicie w różnicach aktywności pomiędzy obszarami mózgu odpowiedzialnymi za przetwarzanie informacji o widzianych obiektach (boczna kora potyliczna) oraz o tle, w jakim się pojawiają (zakręt przyhipokampowy). Wspomnienia Chińczyków związane są bardziej z sytuacją społeczną niż ich indywidualną rolą, jak to się dzieje w przypadku ludzi Zachodu. Poznawcze neuronauki społeczne (ang. social cognitive neurosciences) odkrywają wiele takich zależności na różnych poziomach. Szczególnie interesujące są badania wpływu kultury na pojęcia związane z „ ja”, stanowiące podstawę do autorefleksji i samoświadomości. Ocena, czy dana cecha, wyświetlana na monitorze, pasuje do badanej osoby prowadzi u niej do zwiększonej aktywności brzuszno-przyśrodkowej części kory przedczołowej (VMPFC) oraz przylegającej do niej przykolankowej przedniej części zakrętu obręczy (pACC). Pojęcia odnoszące się w różny sposób do „ ja”: pamięci autobiograficznej, reakcji emocjonalnych, relacji społecznych, rozpoznawania twarzy, odczuć, że jest się sprawcą działania i innych aspektów „siebie”, prowadzą do aktywacji różnych części przyśrodkowych obszarów kory (Northoff i in. 2006). Silniejsza aktywacja VMPFC u ludzi z Zachodu nie obejmuje bliskiej rodziny, podczas gdy u Chińczyków odnosi się zarówno do siebie jak i własnej matki. Nawet przekonania religijne znajdują swoje odzwierciedlenie w różnym rozkładzie pobudzeń pomiędzy brzuszną (VM) i grzbietowo-przyśrodkową (DM) częścią kory przedczołowej (PFC). Aktywność DMPFC wiąże się z teorią umysłu (Frith i Frith 2005), czyli zdolnością do przypisywania stanów mentalnych innym ludziom i widzenia świata z ich perspektywy. Przekonania religijne wydają się więc wpływać na zmniejszenie egocentrycznej perspektywy na rzecz oceny siebie z perspektywy zewnętrznej. Techniki eksperymentalne używane w badaniach transkulturowych pokazują wpływ środowiska na mechanizmy poznawcze i reprezentacje mentalne determinujące postrzeganie siebie i innych. Ten wpływ może wykraczać poza modulację ustalonych wzorców działania mózgu, może Reprezentacje umysłowe jako aproksymacje stanów mózgu 11 to być wpływ decydujący o powstaniu pewnych dynamicznych struktur w oparciu o neuronalny substrat. Pod względem ogólnej budowy zdrowe mózgi są do siebie podobne, ich struktura neuroanatomiczna powstała w wyniku długotrwałych procesów ewolucyjnych. Potrzeby organizmu i jego możliwości poznawcze, znajdujące odbicie w strukturze mózgu, stwarzają ramy dla powstania subiektywnego obrazu świata. Jednak struktura połączeń w mózgu, decydująca o możliwych do powstania stanach mentalnych, jest wynikiem indywidualnej historii. Zrozumienie relacji pomiędzy następującymi po sobie stanami mentalnymi możliwe jest tylko przy uwzględnieniu tej indywidualnej historii, włącznie z intencjonalnymi odniesieniami stanów umysłu do stanów świata. Dlatego algorytmiczne wyjaśnianie stanów umysłu nie jest możliwe bez symulacji indywidualnej historii, a więc symulacji stanów całego świata, który się na nią składa. Jeśli nawet uznamy umysł za realizację pewnego algorytmicznego procesu wykonywanego przez mózg, to autonomię decyzji zapewnia jego indywidualna historia, częściowo zapisana w śladach pamięci epizodycznej, semantycznej i proceduralnej, a częściowo wyryta w całej strukturze mózgu, określającej jego potencjalnie dostępne stany dynamiczne, określającej indywidualne cechy osobowości. W każdym konkretnym przypadku za decyzje podejmowane przez człowieka odpowiedzialna jest neurodynamika jego mózgu. Wpływają na nią wszystkie wymienione wyżej czynniki, jak też i stan biochemiczny mózgu, związany z ogólnym stanem organizmu, zdrowiem, pożywieniem, wysiłkiem, snem i wieloma innymi czynnikami. Większość podejmowanych decyzji interpretowana jest jako decyzje „ ja”, chociaż czasami „ ja” zaskakiwane jest przez „swoje” działania, których potem żałuje lub uznaje za nieprzemyślane. Do rozbieżności dochodzi w kilku sytuacjach. Jeśli mam zbyt mało czasu by skorygować plany działania podsuwane przez mózg zgodnie ze swoimi celami i wartościami mogę powiedzieć lub zrobić coś nieodpowiedniego. Jeśli czas pozwala na refleksję może się okazać, że nie znam sam siebie, zrobię coś, z czego będę niezadowolony, gdyż moje przewidywania własnych reakcji jest niezgodne z rzeczywistością, a więc „ ja” ma błędny model przewidywań neurodynamiki mózgu. Może się też pojawić silny przymus wewnętrzny, który pomimo prawidłowej oceny szkodliwości decyzji nie pozwoli na jej zablokowanie, jak to się dzieje w przypadku silnych uzależnień. Można mieć całkiem fałszywe wyobrażenie o sobie i swoich intencjach. Szczególnie zaskakujące są przypadki zaburzeń postrzegania przestrzeni. Heterotopagnosia jest niezdolnością do wskazywania innych osób w przestrzeni pozapersonalnej; pacjenci odnoszą wszystko do siebie, niektórzy nie są zdolni do określenia granic swojego „ ja”. Poznanie „samego siebie”, do którego wzywali starożyt- 12 Włodzisław Duch ni mędrcy, nie jest łatwym zadaniem, a odwarunkowanie, pozbycie się złudzenia istnienia homunkulusa, jest rzeczą nadzwyczaj trudną (Austin 1998, 2006). Dokładna symulacja umysłu jest nieprawdopodobna, można jedynie myśleć o pewnych aproksymacjach, pozwalających zrozumieć procesy podejmowania decyzji. Taki obraz człowieka jest równie odległy od starożytnych wyobrażeń co świat geocentryczny od współczesnej astronomii. Z jednej strony mamy materialny substrat, ale z drugiej strony niezliczone potencjalne stany relacyjne tego substratu, stany które mają odmienny status ontologiczny. Z perspektywy wewnętrznej mamy świat wirtualny, świat intencjonalnych odniesień do rzeczy, sytuacji czy ludzi, którzy mogą już nie istnieć. Nie jest to świat materialny, chociaż do jego istnienia konieczne są materialne stany mózgu. Człowiek jest nie tylko psychofizyczną całością, jest czymś więcej niż tylko swoim „ ja”, mózgiem czy organizmem, jest też zogniskowanym odbiciem wielu zdarzeń, które wpłynęły na uformowanie jego umysłu, od relacji rodzinnych, ogólnego wychowania i wykształcenia, po indywidualne i niepowtarzalne przeżycia, które go uformowały. Podmiotowość, autonomia i odpowiedzialność nie odnoszą się do „ ja”, jednego z wielu procesów realizowanych przez mózg, ale do całego człowieka. 3. Wiedza koncepcyjna w mózgu Analiza procesów podejmowania decyzji wymaga zrozumienia w jaki sposób zakodowane są w mózgu najprostsze pojęcia. Badania nad reprezentacją symboli są bardzo trudne: badania na zwierzętach niewiele mówią o języku, a bezinwazyjne metody neuroobrazowania nie są dostatecznie precyzyjne by ujawnić dokładne konfiguracje pobudzeń neuronów powstające w czasie używania jakiegoś pojęcia. Mamy jednak dość spójny model, oparty na synchronicznej aktywności grup neuronów (NCA, neural cell assemblies), opisujący wyniki badań neurolingwistycznych (Damasio i in. 1996;Pulvermuller 2003; Dehaene i in. 2005), zgodny z ogólnymi mechanizmami pamięci (Lin, Osan, Tsien 2006). Słowa, lub bardziej ogólnie symbole, mają swoją formę (nazwę, wygląd) i swoje znaczenie. Forma symboli reprezentowana jest w mózgu przez silnie ze sobą połączone lokalne podsieci mikroobwodów neuronalnych, które wiążą ze sobą akustyczne (lub wizualne) i artykulacyjne wzorce pobudzeń, pozwalając na ich identyfikację i wymowę. Znaczenie słów reprezentowane jest przez pobudzenia mózgu, skojarzone z ich formą fonologiczną i ortograficzną, łączące ze sobą percepcję i działanie, aktywujące korę zmysłową, ruchową, przedruchową i obszary podkorowe, tworząc rozszerzone reprezentacje pojęć (Pulvermuller 2003). Reprezentacje umysłowe jako aproksymacje stanów mózgu 13 Rozszerzona część reprezentacji pojęcia jest rozkładem pobudzeń obszarów kory zmysłowej i ruchowej, co można utożsamiać z qualiami (interpretacja aktywności kory zmysłowej o różnej intensywności i rozkładzie) i predyspozycjami do działania. Z wewnętrznego punktu widzenia, w przestrzeni aktywacji systemu neuronów zakodowana jest w ten sposób nie tylko sieć pojęciowych relacji, ale również Hebbowskie korelacje pomiędzy postrzeganymi elementami na wielu poziomach, dające pewien model świata postrzeganego przez pryzmat qualiów. Eksperymenty psycholingwistyczne dowodzą, że analogowy sygnał akustyczny, docierający do ucha, zamieniany jest w pierwotnej korze słuchowej na reprezentację fonologiczną, składającą się z dyskretnych elementów. Niewielki zbiór fonemów łączy się ze sobą w czasowo uporządkowany sposób tworząc utrzymujący się przez ułamki sekundy stan rezonansowy, reprezentujący formę słowa. Z badań nad potencjałami wywołanymi wynika, że już po 90 milisekundach następuje aktywacja rozszerzonych podsieci kory zmysłowej a po 200 ms widać aktywność kory ruchowej, która odnosi sens danego słowa do możliwości działania w świecie (Pulvermuller 2003). Rozpoznawanie mówionego słowa lub postrzeganego symbolu jest skomplikowanym procesem, w którym istotną rolę pełni torowanie (zmniejszanie progu pobudliwości grup neuronów) na poziomie morfologicznym, gdy rozpoznane fragmenty (fonemy, grafemy) aktywują wiele rzeczywistych słów jak i słowopodobnych kombinacji. Słowa polisemiczne mają jednakową reprezentację fonologiczną, ale kontekst prowadzi do automatycznej aktywacji odmiennych podsieci, tworząc odpowiednie rozszerzenia semantyczne. Okada i Hickok (2006) kontrastując słowa należące do obszarów o dużej gęstości fonologicznej (podobne ze względu na brzmienie do wielu słów) i słowa o małej gęstości (unikalne brzmienie) pokazali, że łączenie pobudzeń fonologicznych w reprezentacje leksykalne zachodzi w tylnej części bruzdy skroniowej górnej (STS). Kilku autorów, w tym Dehaene i współpracownicy (2005), twierdzili, że w lewej bruździe skroniowopotylicznej mieści się obszar wzrokowej formy słów (Visual Word Form Area, VWFA), który reaguje u ludzi potrafiących czytać i pisać tylko przy prezentacji słów w formie pisanej. Jest to nadal twierdzenie kontrowersyjne, krytykowane np. w pracy Price i Devlin (2003). Leżący w pobliżu boczny dolnoskroniowy obszar wielomodalny (Lateral Inferotemporal Multimodal Area, LIMA) reaguje zarówno na bodźce słuchowe jak i wzrokowe, i ma projekcje do obszarów fonologicznych jak i rozszerzonych (Gaillard i in. 2006). Jest dość prawdopodobne, że w strumieniu przetwarzającym informacje słuchowe istnieje obszar homologiczny do VWFA, położony w przedniej części lewej bruzdy skroniowej, chociaż dane na ten temat są nadal kontrowersyjne (Dehaene i Naccache 14 Włodzisław Duch 2001; Dehaene i in. 2005). W każdym razie przetwarzanie mowy zmierza (Hickok, Poeppel 2007) od sygnału akustycznego (grzbietowe części STS, bruzdy skroniowej górnej, w obu półkulach) przez dyskretne, elementarne segmenty (fonemy, środkowa i tylna część STS), do nieco bardziej złożonych struktur sylabicznych, a następnie morfemów (tylna część MTG i ITS, środkowego zakrętu skroniowego i dolnej bruzdy skroniowej) stanowiących elementarne jednostki leksykalne. Są one połączone z wieloma obszarami kory i ośrodkami podkorowymi. Wreszcie informacja o znaczeniu słowa analizowana jest w przedniej części lewego płata skroniowego (ATL, Anterior Temporal Lobe), który ma dostęp zarówno do leksykalnych jak i rozszerzonych reprezentacji. Lateralizacja mowy dotyczy głownie tego obszaru, oraz obszaru Broca związanego z artykulacją mowy. RYS. 1. Organizacja przetwarzania informacji fonologiczno-leksykalnej w modelu, który zaproponował Hickok, Poeppel (2007). Objaśnienia skrótów w tekście. W anomii wzrokowo-przedmiotowej pacjenci mają trudności z prawidłowym nazywaniem oglądanych przedmiotów, ale dotykając ich lub wskazując, do czego mają służyć, nie robią wielu błędów. Caramazza i jego koledzy (2006) zaproponowali do wyjaśnienia rezultatów eksperymentów z takimi pacjentami hipotezę unitarnej organizacji wiedzy koncepcyjnej (Organized Unitary Content Hypothesis, OUCH), opartą na preferencjach pomiędzy specyficznymi modalnościami i różnymi typami informacji semantycznej. Hipoteza uprzywilejowanego dostępu może również wyjaśnić przypadki anomii specyficznych kategorii semantycznych, w których np. trudności w nazywaniu dotyczą tylko kategorii zwierząt, ale nie roślin. Caramazza i Mahon (2006) proponują hierarchiczną organizację wiedzy, w której istnieje kilka domen o specyficznej organizacji (ludzie, zwierzęta, rośliny, narzędzia), różniących się rodzajem (również modalnością) informacji na temat obiektów danego typu. Organizacja wiedzy pojęciowej w mózgu powinna być różna w zależności od obiektu, z którym mamy do czynienia. Np. rozpoznawanie twarzy jest specyficzną funkcją, która ma zastosowanie tylko w stosunku do ludzi (lub ogólniej, osobników tego samego gatunku). Reprezentacje umysłowe jako aproksymacje stanów mózgu 15 Tego rodzaju reprezentacja pojęć umożliwia myślenie symboliczne. Kontekst powoduje pobudzenie rozszerzonych podsieci, które definiują (poprzez relacje z innymi pojęciami) znaczenie słów. Wzajemne hamowanie konkurencyjnych procesów w mózgu zapewnia ograniczenie sensownych odpowiedzi i działań do tych, które są łatwo osiągalne w tak pobudzonej sieci. Podobieństwo fonologiczne i semantyczne pomiędzy słowami może prowadzić do podobnych aktywacji mózgu, ale w większości przypadków torowanie całkowicie ujednoznacznia interpretacje sensu słów — procesy neuronowe typu „zwycięzca bierze wszystko” (O’Reilly, Munakata 2000) powodują, że nic innego „nie przychodzi do głowy”. 4. Stany mózgu i ich aproksymacje Jeśli wyobrażam sobie jakiś konkretny obiekt, np. taki jak „klawiatura”, której właśnie używam, w moim mózgu powstaje wyobrażenie składające się z pobudzeń uwzględniających w różnym stopniu wkład ze strony: . układu wzrokowego: ogólny kształtu obiektu, kształty wyodrębnionych, licznych klawiszy; znaki na tych klawiszach; . kory czuciowej, ruchowej i przedruchowej: dotyk plastiku i metalu, ruch palców używanych do naciskania klawiszy, układ dłoni na klawiaturze; . kory skojarzeniowej: związek klawiatura i urządzeń, do których jest podłączona (komputera, programu, ekranu); . kory słuchowej, obszar Broca: reprezentacji dźwięku, wymowy słów „klawiatura” i „keyboard”. Każde z tych pobudzeń, będące wynikiem rozchodzenia się aktywacji w sieci neuronów, można reprezentować przez zmienny w czasie rozkład prawdopodobieństwa aktywacji określonych grup neuronów. Gdybyśmy znali zbiór grup neuronów i mieli informację o ich aktywacji w różnych warunkach, to pobudzenia te można by opisać za pomocą odpowiednich funkcji bazowych ψi (s, Kont), gdzie i jest numerem grupy neuronów (oraz odpowiedniej funkcji bazowej), s jest danym symbolem (pojęciem) a Kont jest kontekstem, w którym ten symbol się pojawia. Całkowita aktywacja mózgu, pojawiająca się w wyniku prezentacji symbolu s w kontekście Kont będzie wówczas aproksymowana za pomocą kombinacji liniowej: 16 Włodzisław Duch Ψ(s, Kont) = X ci ψi (si , Kont) i Funkcje bazowe opisują prymitywy percepcyjne, ruchowe, emocjonalne czy abstrakcyjne, coś, co można otrzymać za pomocą neurobrazowania po uśrednieniu aktywacji dla wielu osób by zobaczyć, jakie obszary mózgu (korowe i podkorowe) się aktywizują przy pojawieniu się danego pojęcia. Z formalnego punktu każda grupa neuronów, której aktywność reprezentuje funkcja bazowa, działa jak filtr, wydobywający pewne cechy z pierwotnych perceptów dotyczących pojęcia odpowiadającego symbolowi s. Percepty niekoniecznie muszą się odnosić do danych zmysłowych, mogą to być skojarzenia czysto wewnętrzne, wynikłe z pobudzeń kory związanych ze śladami pamięci i skojarzeń pomiędzy nimi, lub dalece przetworzonych informacji przez wcześniejsze obszary korowe i podkorowe, z którymi dane pole φi (si , Kont) jest połączone. Dlatego argumentem tej funkcji bazowej nie jest bezpośrednio s, ale si , zbiór zmiennych, które wpływają na stan danego pola. Każde pojęcie ma nieco inny sens w zależności od kontekstu, czyli wcześniejszych aktywacji mózgu (torowania), zmieniając się w różnych skalach czasowych. Widać stąd, że statyczne pojęcia reprezentacji mentalnych lub próby określenia sensu pojęć za pomocą ontologii czy tezaurusów, mogą być jedynie grubym przybliżeniem do rzeczywistego, dynamicznego charakteru stanów mózgu. Pobudzenia kory zmysłowej interpretowane są w jako własności postrzeganych obiektów a ich pierwotnym odnośnikiem jest świat zewnętrzny. Na poziomie reprezentacji mentalnych powinniśmy operować cechami spostrzeżeń, które możemy zidentyfikować w treści naszych przeżyć. Oznacza to, że zamiast opisywać stan mózgu jako liczne pobudzenia grup neuronów powinniśmy wprowadzić nowe zmienne, które określają intensywność lub rodzaj jakiegoś postrzeżenia, np. barwy dźwięku, koloru, kształtu czy szybkości ruchu. Stan mózgu można przetransformować do tej nowej przestrzeni, którą można nazwać przestrzenią umysłu. Z matematycznego punktu widzenia relacje między stanami mózgu Ψ(s, Kont) a stanami umysłu Φ(s, Kont) sprowadzają się więc do transformacji pomiędzy przestrzenią aktywacji grup neuronów opisywaną przez bazę ψi (si , Kont) a przestrzenią zdarzeń mentalnych, której wymiarami są zmienne skorelowane z własnościami dającymi się wyodrębnić w doświadczeniu wewnętrznym, opisywane przez bazę φi (si , Kont), której elementy można powiązać z bazą aktywacji ψi (si , Kont). Dotyczy to nie tylko percepcji, np. postrzegania kolo- Reprezentacje umysłowe jako aproksymacje stanów mózgu 17 ru, gdzie rozkład pobudzeń w obszarze V4 kory wzrokowej da się skorelować z postrzeganą barwą, lecz również wszystkich innych stanów mentalnych, łącznie ze stanami emocjonalnymi. Jedną z możliwości opisu powstawania reprezentacji mentalnych jest aproksymacja za pomocą modeli neuronowych i koneksjonistycznych (O’Reilly i Munakata 2000). Wymaga to utworzenia sieci neuronowej, której węzły niczego bezpośrednio nie reprezentują (można je uznać za nieuświadamialne reprezentacje mikrocech), a dopiero konfiguracje ich pobudzeń można zinterpretować jako cechy, które odpowiadają perceptom odnoszącym się do analizowanych obiektów. Podejście koneksjonistyczne reprezentuje bezpośrednio te konfiguracje pobudzeń jako węzły w sieciach na wyższym stopniu abstrakcji niż sieci neuronowe, ukrywa więc mikrocechy. Rozkład pobudzeń wartości tych cech (pobudzeń węzłów sieci koneksjonistycznej) reprezentuje dany obiekt. W sieciach neuronowych mamy do czynienia z konfiguracjami pobudzeń oscylującymi wokół średnich wartości rozkładów. W takiej rozproszonej reprezentacji automatycznie pobudzają się skojarzone fragmenty reprezentacji dla odpowiednich modalności, jest ona więc skoncentrowana na jakiejś domenie wiedzy koncepcyjnej. Udało się nam (Dobosz i Duch 2009) dokonać wizualizacji trajektorii pokazujących, jak zmienia się z upływem aktywność wszystkich użytych w symulacji neuronów. Każdy punkt na rysunku poniżej (por. rys. 2) odpowiada określonej wartości średniej aktywności 140 neuronów w danej chwili czasu. Zagęszczenia trajektorii reprezentujące atraktory neurodynamiki pokazują, że system fluktuuje wokół danego pojęcia przez jakiś czas, a następnie przechodzi do pojęć skojarzonych, nie powraca jednak do tego samego miejsca, bo historia jego ewolucji zmienia sytuację. Nawet taki obraz jest wielkim uproszczeniem, gdyż zmiany ogólnego pobudzenia (efekty związane z emocjami, uwagą, zmęczeniem) może w znacznym stopniu zmienić ten krajobraz. Reprezentacja mentalna jest tu atraktorem neurodynamiki, chwilowym spowolnieniem zmian aktywacji prowadzącym do kolejnych reprezentacji w procesie, który nazywamy skojarzeniowym. W zależności od stanu mózgu i historii ewolucji tego stanu krajobraz atraktorów zmienia się drastycznie, umożliwiając całkiem odmienne skojarzenia. Funkcje bazowe, które opisują cechy (w tym również qualia) odnoszące się do obiektów mogą być kombinacją pobudzeń wielu neuronów, które przez odległe projekcje przenoszą informacje o konfiguracjach pobudzeń kory wzrokowej czy czuciowej do innych obszarów mózgu. Pojęcia abstrakcyjne mają wyraźnie uboższe reprezentacje, gdyż nie pobudzają kory zmysłowej ani kory ruchowej. Prawdopodobieństwo pojawienia się skojarzenia pomiędzy dwoma stanami mentalnymi obliczyć można jako prawdopodobieństwo przejścia pomiędzy stanem początkowym Ψ(s, Kont) a stanem końcowym 18 Włodzisław Duch Ψ(s′ , Kont′ ) pobudzenia obszarów mózgu. Te prawdopodobieństwa powinny dać się przybliżyć jako iloczyny skalarne: < Ψ(s, Kont)|Ψ(s′ , Kont′ ) > w odpowiedniej metryce. Kontekst jest tu bardzo skomplikowany, gdyż powinien uwzględnić nie tylko bieżącą sytuację, ale również skupianie uwagi, zmieniające pobudzenia i powodujące, że mamy różne skojarzenia, zależnie od tego, czy zwracamy uwagę na nazwę (fonologię), czy formę wizualną, funkcję, czy też wywołane przez dany obiekt emocje. Podobieństwa pomiędzy stanami umysłu są podstawą do tworzenia kategorii naturalnych. Skupienie różnych stanów mentalnych, silnie ze sobą skojarzonych (a więc o dużych prawdopodobieństwach przejść pomiędzy nimi), tworzy taką rozmytą kategorię i wszystko co jest z nią skojarzone – pod względem wyglądu, albo funkcji (czyli możliwości działania, ruchu) – jest kategoryzowane w podobny sposób. Nie ma zbioru definiujących cech dla pojęcia „krzesło”, ale różnorakie skojarzenia pozwalają nam rozpoznać dany obiekt jako krzesło. Pobudzenia neuronów odpowiedzialnych za semantykę kategorii naturalnych nie tworzą zbiorów wypukłych lecz mogą się składać z wielu rozłącznych reprezentacji (atraktorów), które należą do tej samej kategorii (mają wspólne reprezentacje fonologiczne). Rozwinięcia na różne funkcje bazowe stwarzają możliwości różnego opisu stanów mózgu. Może to być zapis wektorowy uśrednionych wartości współczynników rozkładu na funkcje bazowe φi (si , Kont) dla danego pojęcia s. Stan mentalny Φ(s) reprezentujący to pojęcie jest wówczas reprezentowany przez wektor, określający jakie cechy przypisać można danemu pojęciu. Taka reprezentacja stosowana jest często w analizie języka naturalnego (Manning i Schütze 1999). Brakuje w tej reprezentacji części związanej z fonetyką słowa, co utrudnia symulacje kreatywności na poziomie tworzenia słów i rozumienie skojarzeń na poziomie fonologicznym. W typowych zastosowaniach nie jest to konieczne i można takie reprezentacje stosunkowo łatwo rozszerzyć dodając część związaną z fonologią. Współczynniki wektorowe można interpretować jako prawdopodobieństwa rozkładu pobudzeń różnych obszarów mózgu, co nadaje pojęciu pewną strukturę, można np. skupić się na podobszarach ruchowych, w którym jest informacja o tym, co z danym przedmiotem możemy zrobić, jakie prymitywy ruchowe (reprezentowane za pomocą funkcji bazowych) składają się na takie działanie. Podobieństwa pomiędzy pojęciami są tu więc wynikiem tylko strukturalnych relacji a pojęcie jest opisane przez mikrocechy, które odnoszą się do jego Reprezentacje umysłowe jako aproksymacje stanów mózgu RYS. 19 2. percepcji, ogólnej wiedzy o nim, jak i możliwych sposobów interakcji z danym obiektem. W praktyce w reprezentacjach wektorowych brakuje odnośników do percepcji kształtu i innych własności przestrzennych. Jeszcze częściej stosowanym przybliżeniem wektorowym jest próba oceny korelacji statystycznych pomiędzy pobudzeniami poszczególnych funkcji bazowych dla różnych pojęć. W praktyce ocenia się to na podstawie kookurencji różnych pojęć tekstach (Manning i Schütze 1999). Do tego przybliżenia można również dojść badając transformacje pomiędzy funkcjami bazowymi reprezentującymi pobudzenia grup neuronów. Tego typu rozważań w analizie języka naturalnego dotychczas nie robiono, wyprowadzając z rozważań statystycznych reprezentacje wektorowe, które mają za zadanie uchwycić kontekst na podstawie kookurencji wyrazów. W efekcie takie reprezentacje dają bardzo prymitywne przybliżenie do użytecznych reprezentacji mentalnych, pomijające istotne własności strukturalne obiektów, jak i powiązania pomiędzy percepcją i działaniem. Podobnie drastycznym uproszczeniem są sieci semantyczne (Sowa 1991). Wydaje się, że systematyczna analiza przybliżenia do dynamicznych procesów rozchodzenia się aktywności neuronalnej w mózgu i transfor- 20 Włodzisław Duch macja tych stanów do przestrzeni, w której można zdefiniować stany mentalne jest dobrą drogą do lepszego opisu reprezentacji mentalnych i reprezentacji pojęć. Można w tym celu zastosować abstrakcyjną teorię reprezentacji, rozwiniętą dla potrzeb mechaniki kwantowej. Wektor stanu (funkcja falowa) może w niej zostać poddana dowolnej transformacji obrotów, ale nie zmienia to relacji pomiędzy różnymi wektorami stanu. 5. Zastosowania Przedstawione powyżej rozważania oparte są na przekonaniu, że jedynie przez aproksymację fizycznych stanów mózgu, zawierających znacznie więcej informacji niż stany mentalne, możemy dokonać istotnego postępu w rozumieniu i opisie reprezentacji mentalnych, przydatnych nie tylko filozofom, ale też mających zastosowania w analizie języka naturalnego (Duch, Matykiewicz, Pestian 2008), kategoryzacji pojęć w psychologii (Duch 1997) i architekturach kognitywnych w sztucznej inteligencji (Duch 2010). Informatyka neurokognitywna (Duch 2009) usiłuje tworzyć praktyczne algorytmy czerpiąc inspiracje ze zrozumienia procesów zachodzących w mózgu. Jest już szereg przykładów, pokazujących użyteczność takich metod. Ucieleśnienie jak i enaktywizm są dla rozwoju reprezentacji pojęć bardzo istotne (Barsalou 2008), podkreślają konieczność wielomodalnych reprezentacji, ale to jeszcze nie wystarcza. Proces tworzenia się abstrakcyjnych reprezentacji w oparciu o reprezentacje percepcyjno-ruchowe stwarza niełatwe problemy (Mahon i Caramazza 2008), ale z punktu widzenia transformacji pomiędzy stanami mózgu i umysłu nie jest trudny do wyobrażenia. Transformacje pomiędzy stanami mózgu a stanami umysłu stosuje się w różnego rodzaju detektorach kłamstwa wykorzystujących pomiary elektrofizjologiczne (głównie EEG). Podejście oparte na transformacjach jest też podstawą do tworzenia interfejsów mózg-maszyna (Brain-Computer Interfaces, BCI), do sterowania urządzeniami za pomocą myśli, a raczej intencji. Pojawiają się pierwsze gry komputerowe, wykorzystujące taki interfejsy, są też liczne zastosowania medyczne (Coyle i in. 2003), w tym urządzenia typu neurofeedback, przydatne w terapii licznych problemów psychicznych. W przypadku interfejsów mózg-komputer intencje ruchu, które należą do świata umysłu, zmieniają stany mózgu w sposób możliwy do odczytania za pomocą elektrod aparatury elektroencefalograficznej. Chociaż nie jest to precyzyjna informacja o stanie mózgu, aktywność każdej elektrody EEG reprezentuje uśrednienie aktywności wielu milionów neuronów, wystarcza to jednak do tego, aby dokonać transformacji informacji o aktywności mózgu na Reprezentacje umysłowe jako aproksymacje stanów mózgu 21 informację pozwalającą rozróżnić kilka stanów mentalnych. W eksperymentach wykorzystujących fMRI (Hayens i in. 2007) udało się odróżnić stany umysłu związane z intencjami dodawania bądź odejmowania dwóch liczb od siebie. W pracy Mitchella i wsp. (2008) stworzono sieć neuronową przewidującą rozkład pobudzeń mózgu mierzonych w eksperymentach z fMRI przy prezentacji różnych rzeczowników. Model ten, nauczony przy wykorzystaniu reprezentacji wektorowej słów zawartych w dużym korpusie językowym, oraz na kilkudziesięciu wynikach rzeczywistych pomiarów fMRI, potrafi odróżnić od siebie stany mózgu spodziewane w eksperymentach z innymi rzeczownikami. W tym przypadku jako funkcje bazowe używa się aktywności pojedynczych wokseli w fMRI. Odczytywanie stanów mentalnych na podstawie aktywności mózgu jest dużym problemem technicznym, ale już dzisiaj dyskutowane są problemy etyczne związane z możliwością podglądania prywatnych stanów mentalnych (Haynes i Rees 2005, 2006). Postęp w tym kierunku nie będzie jednak łatwy. Z jednej strony nie mamy dobrych technik eksperymentalnych by podejrzeć niewielkie grupy neuronów i stworzyć odpowiednią bazę funkcji do opisu stanów mózgu. Żadna z obecnie rozwijanych technik nie ma odpowiedniej rozdzielczości czasowej i przestrzennej by na to pozwolić. Analiza sygnałów EEG jest bardzo trudna i nie umiemy jeszcze znaleźć w nich precyzyjnej informacji o cechach stanów mentalnych, nie wiemy nawet, czy taka informacja jest w EEG. Z drugiej strony nie mamy też dobrej neurofenomenologii pozwalającej na precyzyjny opis stanów mentalnych i powiązanie ich ze stanami mózgu. Próba opisu doświadczenia wewnętrznego przedstawiona przez Hurlburta i Schwitzgebela (2007) nie jest wystarczająca by określić, jakiego rodzaju transformacji powinniśmy szukać dla opisu stanów mentalnych. Jedynie w prostych sytuacjach eksperymentalnych możemy ustalić, jakie zmienne odnoszące się do stanów mentalnych potrzebne są do dokonania wymaganych przez eksperyment rozróżnień. Prezentowane tu podejście oferuje dość prosty język, pozwalający zrozumieć zaskakujące, często nieracjonalne decyzje podejmowane przez ludzi. Psychologia oferuje pewne racjonalizacje, ale są one arbitrarne i nie mają mocy wyjaśniającej (Duch 1997). Logiczne argumenty okazują się często błędne tam, gdzie dobrze się sprawdzają argumenty oparte na intuicji (Gigerenzer 2009). Wybór intuicyjny nie buduje konstrukcji logicznej w oparciu o obecność lub rbak pewnych cech, ale opiera się na doświadczeniu, podobieństwie do wcześniej spotkanych sytuacji, przyciągającym trajektorię aktywności neuronów do jakiegoś atraktora. Proces ten może nie dać się opisać za pomocą reguł logicznych. Eksploracja labiryntu, w którego lewej odnodze jest kęs jedzenia w 80% przypadków a w prawej tylko w 20% pokazuje, że szczur w 80% razy 22 Włodzisław Duch idzie w lewo a w 20% idzie w prawo, chociaż gdyby zawsze przechodził do lewej odnogi znalazłby jedzenie częściej. W modelach pamięci można zobaczyć, że obszary atrakcji, które się tworzą dla decyzji „iść w lewo czy w prawo” są odbiciem statystyki częstości znajdowania pożywienia. Na poziomie interpretacji psychologicznej możemy powiedzieć, że szczur, który ma zwykle dużą konkurencję, nie zapominając o innych możliwościach czasami unika tłumów i zdobywa dodatkowe pożywienie. Na poziomie neurodynamiki widzimy trajektorie aktywności, które w 80% przypadków kończą się w atraktorze „iść w lewo”, a w pozostałych „iść w prawo”. Decyzje ludzi oparte są często na takim samym mechanizmie, a racjonalne wyjaśnienia, jakie do nich dodajemy są konfabulacjami. Reklamy często powtarzane pozostawiają głębokie ślady w pamięci, wpływając na decyzje zakupów. Początkowa sugestia, chociaż pozornie całkiem nie związana z decyzją, którą trzeba podjąć, ma na nią silny wpływ. Dan Ariely i George Loewenstein pokazali (Ariely 2008), że zapisanie dwóch ostatnich cyfr numerów ubezpiecznia (social security) przez studentów miało duży wpływ na deklarowane sumy podczas aukcji przedmiotów o cenach do 100$. Osoby, które zapisywały większe liczby skłonne są zapłacić więcej. Nawet taka nieświadoma i całkiem nie związana z późniejszym działaniem sugestia wpływa na podejmowane decyzję. Sugestie związane z zadaniami wyboru wpływają na nią jeszcze silniej. Dodanie okrojonej oferty tego samego produktu znacząco wpływa na podwyższenie oceny produktu, który chcemy wypromować. Jeśli rozważamy trzy możliwości, A, B i B ′ , przy czym B ′ jest podobne do B ale gorsze pod jakimś istotnym względem, atraktory dla B i B ′ mają większą siłę przyciągania i pozostaje dość oczywisty wybór pomiędzy B i B ′ . Np. jeśli mamy do wyboru subskrypcję w sieci za 50$ lub wersję drukowaną za 125$ to niewiele osób wybiera wersję drukowaną, ale jeśli oferowana jest dodatkowo wersja „druk i wersja sieciowa” za tę samą cenę co druk to proporcje się odwracają. Jak pokazał Dan Ariely (2008) dotyczy to dowolnych ofert, łącznie z partnerem życiowym: jeśli jest trzech potencjalnych partnerów, z których A uznawany był wcześniej za bardziej atrakcyjnego, ale B ma kolegę podobnego do siebie, ale nieco mniej atrakcyjnego, preferencje przesuwają się w stronę B. Bardziej skomplikowane sytuacje związane są z konkluzjami wymagającymi logicznego myślenia. Najprostsze są bezpośrednie skojarzenia, A ⇒ B ⇒ C, tworząc uporządkowany ciąg atraktorów następujących po sobie. Rozważmy jednak takie 3 zdania: . Wszyscy członkowie gabinetu to złodzieje. . Żaden muzyk nie jest członkiem gabinetu. Reprezentacje umysłowe jako aproksymacje stanów mózgu 23 . Co można powiedzieć o relacji miedzy muzykami i złodziejami? Nieco prostsza wersja, gdyż bliska znanemu schematowi myślenia „nie każdy uczony jest mędrcem”, to: . Wszyscy akademicy to uczeni. . Żaden mędrzec nie jest akademikiem. . Co można powiedzieć o relacji między uczonymi i mędrcami? Po paru tygodniach bezowocnych zmagań podałem studentom prawidłową odpowiedź na pierwszą z tych wersji, jednak na egzaminie dla drugiej wersji podali kilkanaście błędnych lub niejednoznacznych odpowiedzi (tylko dwie ostatnie są poprawne): 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. Nie ma relacji pomiędzy tymi trzema zbiorami. Bycie mędrcem świadczy o tym, że nie jest się uczonym. Niektórzy mędrcy to uczeni. Wszyscy uczeni nie będący akademikami są mędrcami. Wszyscy uczeni to mędrcy. Żaden mędrzec nie jest uczonym. Nie wszyscy mędrcy to uczeni. Istnieje taki mędrzec, który może być uczonym. Mogą istnieć mędrcy, którzy są uczonymi. Nie trzeba być mędrcem aby być uczonym. Mędrzec uczonemu nie równy. Nie wszyscy uczeni to mędrcy. Nie każdy uczony jest mędrcem. Istnieją tacy uczeni, którzy nie są mędrcami. Istnieje uczony, który nie jest mędrcem. 6. Dyskusja Rozważania na temat reprezentacji mentalnych i ich związek ze stanami mózgu można rozszerzyć na zagadnienia dotyczące kreatywności (Duch i Pilichowski 2007; Duch 2007), roli prawej półkuli mózgu w doświadczeniach wglądu (Duch 2007a) jak i praktycznych algorytmów analizy tekstu, pozwalających na tworzenie rozszerzonych reprezentacji (Duch i in. 2008, Duch 2009). Zbudowanie modelu umysłu uwzględniające perspektywę wewnętrzną jest nadal wielkim wyzwaniem. Idee dotyczące geometrycznego opisu stanów mentalnych (Duch 1997, 2001, 2002, 2002a) można połączyć z opisanym tutaj podejściem transformacyjnym do relacji mózg-umysł. Droga do stworzenia dokładnego modelu 24 Włodzisław Duch takich relacji jest nadal daleka. Nie znamy szczegółów procesów zachodzących w mózgu, są trudności związane z badaniami eksperymentalnymi, brak jest dobrych metod matematycznych do analizy sygnałów i procesów rozchodzenia się aktywacji w rzeczywistych sieciach neuronowych, procesów przetwarzania informacji w oparciu o takie sieci. Jednakże nawet proste mózgo-podobne przetwarzanie informacji daje rezultaty, które ma cechy jakościowe porównywalne do obserwowanych funkcji; złożoność mózgu nie jest więc głównym problemem stojącym przed budową sztucznych umysłów (Duch 2005; Duch, Oentaryo, Pasquier 2008)! Metody komputerowe dopiero od niedawna zaczęto stosować do modelowania syndromów neuropsychologicznych i chorób psychicznych (Parks i in. 1998). Na razie objęto nimi jedynie część zagadnień, które można w ten sposób badać. Nie brakuje problemów fundamentalnych, do których nie bardzo wiadomo, jak podejść. Należą do nich urazy psychogenne, zaburzenia osobowości i inne problemy wymagające pełnego modelu umysłu. Jednakże za pomocą modeli komputerowych udało się już teraz osiągnąć więcej, niż można było oczekiwać zdając sobie sprawę ze stopnia komplikacji takiego modelowania. Niewielka liczba założeń i stosunkowo proste sieci neuronowe pozwalają na zrozumienie zjawisk zachodzących przy uszkodzeniach i rehabilitacji mózgu. Często jest to rozumienie jakościowe, metaforyczne, posługujące się luźnymi analogiami. Należy jednak przyznać, że dokonany został duży postęp, pojawił się nowy styl rozumowania ze specyficznymi problemami i pytaniami, język opisu nieredukowalny do języka używanego dotychczas w psychiatrii czy w psychofarmakologii (Duch 2007b). Dzięki symulacjom komputerowym można się spodziewać podobnego postępu w rozumieniu reprezentacji mentalnych i wyższych czynności poznawczych, w szczególności procesów podejmowania decyzji. Podziękowania: Krzysztof Dobosz opracował program do wizualizacji atraktorów i przygotował rysunek ze strony 19. Literatura Austin, J. H. (1988). Zen and the Brain: Toward an Understanding of Meditation and Consciousness. Cambridge, MA: MIT Press. Austin, J. H. (2006). Zen-Brain Reflections: Reviewing Recent Development in Meditation and States of Consciousness. Cambridge, MA: MIT Press. Ariely, D. (2008). Predictably Irrational. The Hidden Forces That Shape Our Decisions. Harper-Collins. Barsalou, L. W. (2008). Grounded Cognition. Annual Reviews of Psychology 59, s. 617–645. Reprezentacje umysłowe jako aproksymacje stanów mózgu 25 Bowden, E. M., Jung-Beeman, M., Fleck, J. & Kounios, J. (2005). New approaches to demystifying insight. Trends in Cognitive Science 9, 322–328. Brooks, R. (1986). Elephants don’t play chess. Robotics and Autonomous Systems 6, s. 3–15. Brooks, R, Stein, L. A. (1994). Building Brains for Bodies. Autonomous Robotics 1, s.7–25. Caramazza, A., & Mahon, B. Z. (2006). The organization of conceptual knowledge in the brain: the future’s past and some future directions. Cognitive Neuropsychology 23, 13–38. Coyle, S, Ward, T., Markham, C. (2003). Brain-computer interfaces: A review. Interdisciplinary Science Reviews 28(2), s. 112–118. Damasio, H., Grabowski, T. J., Tranel, D., Frnak, R. J, Hichiwa, R. D, Damasio, A. R. (1996). A neural basis for lexical retrieval. Nature 380, s. 499– 505. Dehaene, S., Cohen, L., Sigman, M. & Vinckier, F. (2005). The neural code for written words: a proposal. Trends in Cognitive Science 9, s. 335–341. Dehaene, S., & Naccache, L. (2001). Towards a cognitive neuroscience of consciousness: Basic evidence and a workspace framework. Cognition 79, 1–37. De Marco, R. J., Menzel, R. (2008). Learning and memory in communication and navigation in insects. W: Menzel R, (red.) Learning Theory and Behavior, Vol. 1 of Learning and Memory: A Comprehensive Reference (4 vols). Oxford: Elsevier, s. 477–98. Dobosz, K., Duch, W. (2009). Fuzzy Symbolic Dynamics for Neurodynamical Systems. Neural Networks, http://dx.doi.org/10.1016/j.neunet. 2009.12.005 Duch, W. (1997). Platonic model of mind as an approximation to neurodynamics. W: S. Amari, N. Kasabov (red.) Brain-like computing and intelligent information systems. Springer, Singapore, rozdz. 20, s. 491–512 Duch, W. (2001). Neurokognitywna teoria świadomości. Kognitywistyka i Media w Edukacji 5(2), s. 47–67. Duch, W. (2002). Geometryczny model umysłu. Kognitywistyka i Media w Edukacji 6, s. 199–230. Duch, W. (2002a). Fizyka umysłu. Postępy Fizyki 53D, s. 92–103. Duch, W. (2005). Brain-inspired conscious computing architecture. Journal of Mind and Behavior 26(1–2), s. 1–22. Duch, W. (2006). Madhyamika, nauka i natura rzeczywistości. Uwagi na marginesie książki: Matthieu Ricard i Trinh Xuan Thuan, Nieskończoność w Jednej Dłoni: Od Wielkiego Wybuchu do Oświecenia. Kognitywistyka i Media w Edukacji 1–2, s. 293–316. Duch, W. (2007). Intuition, Insight, Imagination and Creativity. IEEE Computational Intelligence Magazine 2(3), s. 40–52. Duch, W. (2007a) Creativity and the Brain. In: Ai-Girl Tan (red.)A Handbook of Creativity for Teachers. Singapore: World Scientific Publishing, s. 507– 530. 26 Włodzisław Duch Duch, W. (2007b). Computational Models of Dementia and Neurological Problems. W: Neuroinformatics, C.J. Crasto (red.) Methods in Molecular Biology series (J. Walker, series ed.). Totowa, NJ: Humana Press, rozdz. 17, s. 307–336. Duch, W. (2009). Neurocognitive Informatics Manifesto. W: Series of Information and Management Sciences, California Polytechnic State University, s. 264–282. Duch, W. (2010). Architektury kognitywne. W: R. Tadeusiewicz (red.) Neurocybernetyka teoretyczna. Wyd. Uniwersytetu Warszawskiego. Duch, W., Pilichowski, M. (2007). Experiments with computational creativity. Neural Information Processing — Letters and Reviews 11, s. 123–133. Duch, W., Matykiewicz, P., Pestian, J. (2008). Neurolinguistic Approach to Natural Language Processing with Applications to Medical Text Analysis. Neural Networks 21(10), s. 1500–1510. Durham, W.H. (1983). Testing the malaria hypothesis in West Africa. W: Distribution and Evolution of Hemoglobin and Globin Loci. New York: Elsevier Science Publishing Co., Inc. Frith, C., Frith, U. (2005). Theory of mind. Current Biology 15, R644– R646. Gaillard, R., Naccache, L., Pinel, P., Clémenceau, S., Volle, E., Hasboun, D., Dupont, S., Baulac, M., Dehaene, S., Adam, C., & Cohen, L. (2006). Direct intracranial, FMRI, and lesion evidence for the causal role of left inferotemporal cortex in reading. Neuron 50, s. 19–204. Gigerenzer, G. (2009). Intuicja. Inteligencja nieświadomości. Warszawa: Prószyński i S-ka. Gruszka, A., & Nęcka, E. (2002). Priming and acceptance of close and remote associations by creative and less creative people. Creativity Research Journal 14, s. 193–205. Haynes, J.D. & Rees, G. (2005). Predicting the stream of consciousness from activity in early visual cortex. Current Biology 15, s. 1301–1307. Haynes, J.-D. & Rees, G. (2006). Decoding mental states from brain activity in humans. Nature Reviews Neuroscience 7, s. 523–534. Haynes, J.-D., Sakai, K., Rees, G., Gilbert, S., Frith, C. & Passingham, D. (2007). Reading hidden intentions in the human brain.Current Biology 17, s. 323–328. Hickok, G. & Poeppel, D. (2007). The cortical organization of speech processing. Nature Reviews Neuroscience 8, s. 393–402. Hurlburt, R.T., Schwitzgebel, E. (2007). Describing Inner Experience? Proponent Meets Skeptic. Cambridge, MA: MIT Press. Itert, L. Duch, W. & Pestian, J. (2007). Influence of a priori Knowledge on Medical Document Categorization, IEEE Symposium on Computational Intelligence in Data Mining. IEEE Press, s. 163–170. Jung-Beeman, M., Bowden, E. M., Haberman, J., Frymiare, J. L., Arambel-Liu, S., Greenblatt, R., Reber, P. J., &. Kounios, J. (2004). Neural activity when people solve verbal problems with insight. PLoS Biology 2, s. 500– 510. Reprezentacje umysłowe jako aproksymacje stanów mózgu 27 Lehmann, F. (red.), (1992). Semantic Networks in Artificial Intelligence. Oxford: Pergamon. Lin, L., Osan, R., & Tsien, J. Z. (2006). Organizing principles of realtime memory encoding: neural clique assemblies and universal neural codes. Trends in Neuroscience 29(1), s. 48–57. Kapleau, P. (1992). Zen, Świt na Zachodzie. Warszawa: ZBZ „Bodhidarma”. MacLean, P. (1990). The Triune Brain in Evolution. New York: Plenum Press. Mahon, B.Z, Caramazza, A. (2008). A Critical Look at the Embodied Cognition Hypothesis and a New Proposal for Grounding Conceptual Content. Journal of Physiology — Paris 102, s. 59–70. Manning, C.D. & Schütze, H. (1999). Foundations of Statistical Natural Language Processing. Cambridge, MA: MIT Press. Matykiewicz, P., Duch, W., & Pestian, J. (2006). Nonambiguous Concept Mapping in Medical Domain, Lecture Notes in Artificial Intelligence 4029, s. 941–950. Mednick, S.A. (1962). The associative basis of the creative process. Psychological Review 69, s. 220–232. Meller, S. (2008). Świat według Mellera. Życie i polityka: ku przyszłości. Warszawa: Rosner i wspólnicy. Mitchell, T. M., Shinkareva S. V., Carlson A., Chang, K. M., Malave, V. L., Mason, R. A., Just, M. A. (2008). Predicting human brain activity associated with the meanings of nouns. Science 30, 320(5880) s. 1191–95. Northoff, G., Heinzel, A., de Greck, M., Bermpohl, F., Dobrowolny, H., Panksepp, J. (2006). Self-referential processing in our brain — a meta-analysis of imaging studies on the self. Neuroimage 15, 31(1), s. 440–457. Northoff, G., Panksepp, J. (2008). The trans-species concept of self and the subcortical-cortical midline system. Trends in Cognitive Science 12(7), s. 259–64. Okada, K., Hickok, G. (2006). Identification of lexical-phonological networks in the superior temporal sulcus using fMRI. Neuroreport 17, s. 1293– 1296. O’Reilly, R.C., Munakata, Y. (2000). Computational Explorations in Cognitive Neuroscience Understanding the Mind by Simulating the Brain. Cambridge, MA: MIT Press. Parks, R. W., Levine, D. S., Long, D., (red.) (1998). Fundamentals of Neural Network Modeling. Cambridge, MA: MIT Press. Popper, K., Eccles, J.C. (1999). Mózg i jaźń, Tom 1–3, Poznań: Wyd. Protext. Price, C. J., Devlin, J. T. (2003). The myth of the visual word form area. NeuroImage 19, s. 473–481. Pulvermuller, F. (2003). The Neuroscience of Language. On Brain Circuits of Words and Serial Order. Cambridge, UK: Cambridge University Press. Radhakrishnan, S. (1958). Filozofia indyjska, tłum. Z. Wrzeszcz, t. 1–2, Warszawa: PAX. 28 Włodzisław Duch Sowa, J. F. (red.), (1991). Principles of Semantic Networks: Explorations in the Representation of Knowledge. San Mateo, CA: Morgan Kaufmann Publishers. Reprezentacje w systemach klasycznych i koneksjonistycznych Marcin Miłkowski Instytut Filozofii i Socjologii PAN Zakład Logiki i Kognitywistyki Streszczenie. Autor artykułu broni tezy, że niektóre systemy obliczeniowe mogą mieć własności semantyczne. Wskazana została klasa systemów obliczeniowych, w których reprezentacje mogą mieć przynajmniej dwie własności: własność odnoszenia się do obiektów (desygnowanie) i własność wspomagania rozpoznawania obiektów oznaczanych przez daną reprezentację (konotowanie). Autor argumentuje także, że własności semantyczne reprezentacji nie zależą wyłącznie od architektury systemów obliczeniowych, w których te reprezentacje występują. Konkretna architektura obliczeniowa nie jest czynnikiem kluczowym, a bodaj najmniej istotne są same rodzaje struktur danych, które mają mieć własności desygnowania czy konotowania. Własność desygnowania czy konotowania nie musi być zlokalizowana w samych reprezentacjach, może być własnością wyższego rzędu, powstającą w mechanizmie wyższego poziomu. Własności semantyczne reprezentacji mogą być wielorako realizowane. Systemy klasyczne, koneksjonistyczne czy też hybrydowe mogą równie dobrze mieć własności semantyczne, jak ich nie mieć. 1. Wstęp Czy reprezentacje w systemach obliczeniowych mogą mieć własności semantyczne? I czy tzw. klasyczne podejście do sztucznej inteligencji (GOFAI, Good-Old Fashioned AI ) różni się pod tym względem od koneksjonizmu? W tym artykule bronić będę tezy, że niektóre systemy obliczeniowe mogą mieć własności semantyczne1 . Wbrew wielu głosom sceptycznym 1 Abstrakcyjna struktura systemu obliczeniowego, np. w postaci zapisu programu komputerowego, o ile nie odpowiada prawidłowościom przyczynowym (czyli jest realizowana przez komputer), nie może mieć żadnych własności semantycznych. Wątpliwe jest też, aby sam taki zapis mógł uchodzić Studia z Kognitywistyki i Filozofii Umysłu, 3: 29–42, 2009 c 2009 Marcin Miłkowski Copyright 30 Marcin Miłkowski (Searle 1995, Searle 1999, Harnad 1990) wskażę klasę systemów obliczeniowych, w których reprezentacje mogą mieć przynajmniej dwie własności: własność odnoszenia się do obiektów (desygnowanie) i własność wspomagania rozpoznawania obiektów oznaczanych przez daną reprezentację (konotowanie2). Mówiąc inaczej, reprezentacje w tych systemach obliczeniowych mają zarówno ekstensję, jak i intensję. Odpowiadam więc pozytywnie na pierwsze pytanie. Na drugie pytanie odpowiedź będzie negatywna. Własności semantyczne reprezentacji nie zależą wyłącznie od architektury systemów obliczeniowych. Konkretna architektura obliczeniowa nie jest czynnikiem kluczowym, a bodaj najmniej istotne są same rodzaje struktur danych, które mają mieć własności desygnowania czy konotowania. W istocie bowiem własność desygnowania czy konotowania nie musi być zlokalizowana w samych reprezentacjach, może być własnością wyższego rzędu, powstającą w mechanizmie wyższego poziomu. Sprowadzanie własności semantycznych do wewnętrznych własności indywidualnych struktur danych jest błędem lokalizacji funkcjonalnej (por. Wimsatt 2007; Bechtel i Richardson 1993). Będę więc twierdził, że własności semantyczne reprezentacji mogą być wielorako realizowane. Systemy klasyczne, koneksjonistyczne czy też hybrydowe mogą równie dobrze mieć własności semantyczne, jak ich nie mieć. W dyskusjach nad zdolnościami semiotycznymi sztucznych systemów poznawczych – a w szczególności systemów obliczeniowych – często porusza się kwestię internalizmu i eksternalizmu semantycznego. Zagadnienia te dotyczą głównie konotacji (treści) wyrażeń, nie zaś ich odniesienia. „Odniesienie” natomiast jest analizowane stosunkowo jednomyślnie w ramach przyczynowej teorii odniesienia. Ze względu na brak miejsca będę abstrahować od obszernych dyskusji między internalistami a eksternalistami. Przedstawię jednak analizę mechanizmów semantycznych, która bierze pod uwagę zarówno środowisko wewnętrzne mechanizmu (endostrukturę), jak i jego otoczenie zewnętrzne (egzostrukturę). Jeśli internalizm ma więc pociągać za sobą metodologiczny solipsyzm, to moja analiza będzie z nim niezgodna: z solipsystyczną za system obliczeniowy. Niżej mam na myśli wyłącznie fizycznie zrealizowane systemy obliczeniowe, kiedy mówię po prostu o systemach obliczeniowych. 2 Przez „konotację” rozumie się zazwyczaj albo (1) zbiór konstytutywnych cech desygnatów; (2) charakter aspektowy czy też tryb prezentacji desygnatów; (3) warunki umożliwiające wyróżnianie desygnatów (np. w postaci listy cech konstytutywnych). W tym tekście termin ten jest używany w znaczeniu (3). Nie zajmuję się też trybem prezentacji, jeśli nie jest on wykorzystywany do identyfikacji desygnatów. Reprezentacje w systemach... 31 analizą niezgodne jest bowiem uwzględnianie egzostruktury systemu. Argumenty za tego rodzaju skrajnym internalizmem są jednak wątłe (por. McClamrock 1995, rozdział 2). 2. Przetwarzanie informacji a ekstensja reprezentacji Teza, że systemy sztuczne mogą zawierać reprezentacje, które odnoszą się do obiektów, jest stosunkowo mało kontrowersyjna – spór dotyczy przede wszystkim tego, czy te reprezentacje mogą mieć intensję, nie zaś tylko ekstensję (Chalmers 1992). Do innych przedmiotów mogą odnosić się chociażby oznaki — po prostu powiązane przyczynowo z tym, na co wskazują. Oznakę, np. dym oznaczający ogień, można wytworzyć sztucznie i celowo, więc system obliczeniowy nie byłby niczym nadzwyczajnym. System zawierający oznaki i z nich korzystający będzie miał reprezentacje, które ewidentnie się do czegoś odnoszą. Oba warunki — zawieranie znaków o charakterze oznak i korzystanie z nich — spełniają wszystkie systemy uzyskujące i przetwarzające informacje, w których istnieją mechanizmy reprezentacyjne3 . Systemy obliczeniowe rozumiem jako pewnego rodzaju systemy przetwarzania informacji (nie rozstrzygając w tym miejscu kontrowersyjnej kwestii, czy jest możliwe istnienie przetwarzania informacji na drodze nieobliczeniowej; jeśli nie jest, są to klasy równoważne). Nie wszystkie te systemy muszą przetwarzać informacje z otoczenia; jeśli informacje te docierają do systemu w postaci innych reprezentacji, to ekstensja reprezentacji systemu zależy od tego, czy przed dotarciem do systemu odnosiły się one do czegokolwiek. Krótko mówiąc, systemy korzystające z informacji już przetworzonych niekoniecznie mają reprezentacje niepuste; ich semantyczne własności zależą bezpośrednio od własności informacji wejściowych. Jeśli reprezentacje są wprowadzane przez człowieka, który np. opisuje za ich pomocą fikcyjny świat wirtualny, to nie będą one miały ekstensji w postaci obiektów empirycznych. Jednak ważniejsze jest pytanie, w jaki sposób powstają reprezentacje obliczeniowe odnoszące się do rzeczywistych obiektów — i to bez oczywistej interwencji człowieka. Aby na to pytanie odpowiedzieć, należy zanalizować samo pojęcie przetwarzania informacji. Pojęcie „informacja” jest stosowane często i w bardzo różnych kontekstach (Poczobut 2005). Dlatego też nie sposób mówić o „informacji jako takiej”, trzeba wybrać jakąś określoną koncepcję. Postaram się jednak nakreślić ogólną ideę, z którą zgodna będzie większość dzisiej3 W poniższych rozważaniach nad przetwarzaniem informacji wykorzystuję analizy z Miłkowski (2008). 32 Marcin Miłkowski szych ujęć kwantytatywnych. Będzie to analiza w stylu mechanistycznym4 . Skupiam się na przetwarzaniu informacji z otoczenia — uzyskane wnioski można potem uogólnić także na mechanizmy, które operują na istniejących już nośnikach informacji, nie przetwarzając uzyskanych samodzielnie informacji o otoczeniu. Przetwarzanie informacji o otoczeniu wymaga jego właściwej reprezentacji w systemie poznawczym. W przeciwieństwie do wielu teoretyków (Harnad 1990) nie uważam jednak, aby interakcje sensomotoryczne z otoczeniem były warunkiem koniecznym referencyjności reprezentacji w systemie — są one warunkiem wystarczającym, lecz system może także zawierać reprezentacje dotyczące własnych stanów wewnętrznych lub generować nowe informacje na podstawie dostarczonych już informacji w postaci innej niż percepcyjna (zawartych w odpowiednim nośniku). Przetwarzanie informacji jest procesem, który zachodzi (przynajmniej) w systemach wykorzystujących informacje do sterowania własnym zachowaniem. Nie zachodzi ono tam, gdzie mamy do czynienia jedynie z zakodowaną informacją, np. wydrukowana w podręczniku tabliczka mnożenia ani wzór nie przetwarzają informacji. Podobnie słoje w drewnie, choć stanowią oznaki i są wywoływane przez środowisko zewnętrzne, a więc informują o nim, nie przetwarzają informacji jako takie. Tabliczki mnożenia, wzory i słoje drewna to jedynie nośniki informacji. Przetwarzanie bowiem — w przeciwieństwie do samego zawierania lub przechowywania informacji — polega na tym, iż istnieje niezawodny mechanizm dokonujący przekształcenia informacji, czyli mechanizm działający stosunkowo stabilnie w danym środowisku. Informacje te muszą do tego mechanizmu dotrzeć, a następnie zostać przesłane dalej, czyli po przetworzeniu muszą być dostępne dla samego systemu, a zatem docierać do innych jego składników. Wspomniany mechanizm musi przetwarzać informacje pochodzące z danej sytuacji — czyli informacje już w niej zawarte5. Każda sytuacja (rozumiana abstrakcyjnie, niekoniecznie jako fizyczny stan rzeczy) może zostać opisana przy użyciu ciągu informacji. Mówiąc poglądowo, można zadać pewien ciąg pytań rozstrzygnięcia na temat danej sytuacji, a ciąg odpowiedzi — „tak” lub „nie” — to ciąg informacji w niej zawartych (w ilościowych teoriach informacji taka minimalna odpowiedź zwana 4 Wyjaśnienie mechanistyczne rozumiem podobnie jak Bechtel i Richardson (1993) lub Craver (2006). Wyjaśnienia mechanistyczne do obliczeniowości odnosi m.in. G. Piccinini (2007). 5 Analiza pojęcia informacji jest szczególnie płodna w kategoriach semantyki sytuacyjnej. Por. Israel i Perry (1990). Tezę, że informacja jest zawarta w sytuacjach, uzasadnia Collier (1990). Reprezentacje w systemach... 33 jest niekiedy „logonem”; nie idzie tu o bit w sensie informatycznym). Uznaję więc, że struktura sytuacji sama w sobie zawiera informacje, które zostają ujawnione w jej opisie. Pewne sytuacje można wskazać w sposób jednoznaczny przy użyciu ciągów skończonych o małej długości; inne są znacznie bogatsze informacyjnie. Długość i złożoność tych ciągów charakteryzuje się matematycznie. Przykładem może być algorytmiczna teoria informacji, rozwijana przez Kołmogorowa, a następnie przez Chaitina; pozwala ona rozróżnić stochastyczne ciągi informacji od niestochastycznych (algorytmicznych)6. Opisy, w których widać maksima regularności, a które jednocześnie pozwalają jednoznacznie identyfikować egzemplarze lub typy obiektów, to opisy, których poszukuje nauka. One bowiem chwytają rzeczywiście zachodzące zjawiska. Optymalnie skompresowane, a więc algorytmiczne informacje o sytuacji opisywanej jako typ lub jako konfiguracja typów są informacjami na temat rodzajów naturalnych. Proste oznaki — takie jak kreski na podziałce termometru spirytusowego za oknem — mogą służyć do tworzenia opisu sytuacji (w tym wypadku opisu w kategoriach analogowych, w ciągłych wartościach oznaczających temperaturę). Istnieje wówczas pewien mechanizm opisujący sytuacje czy też generujący informacje, czyli mechanizm semiotyczny. O przetwarzaniu w całym znaczeniu tego słowa nie ma mowy, gdyż uzyskane informacje nie są poddawane dalszej obróbce, nie są w żaden sposób gromadzone, selekcjonowane i nie służą do modyfikacji zachowania. Nie są dostępne dla innych komponentów systemu, jakim jest termometr. Dostęp do wskazań temperatury ma tylko użytkownik termometru. Termometr pozostaje jedynie nośnikiem informacji, a nie systemem, który je przetwarza. Można by co najwyżej powiedzieć, z przymrużeniem oka, że to człowiek plus termometr okienny stanowią mechanizm przetwarzający informacje o temperaturze powietrza za oknem. Przetwarzanie informacji wymaga istnienia mechanizmu, który nie tylko generuje odpowiednie opisy sytuacji (wydobywa informacje zawarte w sytuacjach), ale także z nich korzysta. Praktycznym kryterium pozwalającym odróżnić mechanizmy informacyjne — wydobywające informacje, semiotyczne — od przetwarzających informacje jest to, czy istnieje zysk predykcyjny z opisu w kategoriach informacyjnych w stosunku do opisu czysto mechanicznego. Jeśli opis można wyciąć brzytwą Ockhama, nie tracąc żadnych istotnych przewidywań zachowania syste6 Najbardziej przystępne wprowadzenie do algorytmicznej teorii informacji daje Chaitin (1975). 34 Marcin Miłkowski mu, to znaczy, że mamy do czynienia wyłącznie z mechanizmem informacyjnym, nie zaś przetwarzającym informacje. To kryterium określam jako praktyczne, gdyż jest zawodne i ma naturę epistemiczną. Możemy przecież nie dostrzec jakiegoś aspektu złożonego systemu, dzięki któremu jest on nie tylko systemem semiotycznym czy informacyjnym, ale także systemem przetwarzającym informacje7 . Druga praktyczna reguła dotyczy magazynowania informacji — tylko mechanizmy, które nie reagują bezpośrednio na bodźce, lecz wykorzystują informacje o nieobecnych już sytuacjach, mogą uchodzić za mechanizmy reprezentacyjne. Mechanizmy reprezentacyjne są najbardziej interesującą klasą mechanizmów przetwarzających informacje z otoczenia. Istniejące w przyrodzie systemy poznawcze, jak się zdaje, wszystkie korzystają z różnego rodzaju mechanizmów reprezentacyjnych8 . Ponieważ reprezentacje są generowane z informacji wydobytych z sytuacji, mają one ekstensję — jest nią mianowicie ten stan rzeczy, który te informacje opisują. Nie przesądzam w tym miejscu, jaką strukturę będą miały desygnaty reprezentacji: informacje, choć sprowadzalne do pytań rozstrzygnięcia na temat sytuacji, mogą mimo to mieć różny charakter. Zależy on od tego, jakie stawiane jest pytanie, czyli jaki aspekt sytuacji wchodzi w grę. Jedyne niezawodne kryterium przetwarzania informacji to istnienie odpowiedniej budowy — architektury — wewnętrznej powiązanej z odpowiednim kontekstem działania mechanizmu przetwarzającego informacje. Dopiero zbadanie funkcjonowania systemu, możliwie wyczerpujące, daje odpowiedź, czy system przetwarza informacje — uzyskuje 7 W wypadku formalnych systemów przetwarzających informacje, tj. systemów nie korzystających z informacji zawartych w rzeczywistych sytuacjach, pominąć można etap semiotyczny, czyli opisywania sytuacji za pomocą nośnika informacji — w tym sensie, że nie korzysta się tu z oznak niosących informacje o środowisku, tylko z innych nośników informacji (w takim formalnym systemie informacje zawarte na nośniku informacji nie muszą być rozumiane, w przeciwieństwie do pozostałych wypadków, jako z konieczności prawdziwe: nośniki nie są w tym wypadku z konieczności oznakami, mogą być też znakami konwencjonalnymi). Kryterium odróżniania takiego systemu (zrealizowanego fizycznie) od wszelkich innych systemów mechanicznych pozostaje analogiczne: jeśli działanie maszyny można opisać mechanicznie w prostszy sposób (tj. uzyskać większą kompresję informacji na temat działania maszyny, ujmując rzecz w kategoriach Chaitina), to znaczy, że nie należy jej zaliczać do klasy urządzeń przetwarzających informacje. 8 Pojęcie reprezentacji należy tu rozumieć szeroko; nie idzie tu o reprezentację symboliczną czy językową (tzw. reprezentacje subsymboliczne w sieciach neuronalnych też zaliczam do reprezentacji). Reprezentacje w systemach... 35 je, następnie przenosi do kolejnych komponentów, a wreszcie selekcjonuje itd. — czy też nie. Skoro wszelkie obliczanie jest przetwarzaniem informacji, to każda architektura obliczeniowa spełnia warunek przetwarzania informacji. Nie każda jednak przetwarza informacje wydobyte z sytuacji — ekstensja reprezentacji zależy więc od powiązania przyczynowego ich ze światem, nie zaś od tego, czy system jest koneksjonistyczny, czy klasyczny. Kluczowe jest oddziaływanie z otoczeniem, z którego wydobywane są informacje, lub ekstensjonalność informacji już zakodowanych (w wypadku systemów nieprzetwarzających informacji ze świata bezpośrednio). Kryterium budowy systemu jednak jest nieoperacyjne — nie istnieje żaden ogólny algorytm wykrywania dowolnego rodzaju informacji, gdyż taki algorytm mógłby posłużyć do rozstrzygnięcia problemu, czy dany ciąg informacji jest algorytmiczny (niestochastyczny), czy też nie (algorytmiczne ciągi informacji są pewnym rodzajem informacji). Ponieważ ten problem jest nierozstrzygalny (Chaitin 1987), to nie możemy z góry zawsze wiedzieć, co jest relewantną informacją, a co nie — nie możemy więc ocenić działania każdego systemu. Oprócz szczegółowych wskaźników istnienia procesów przetwarzania informacji istnieje szereg kryteriów ogólnych stosowanych w metodologii naukowej, takich jak prostota opisu, wartość eksplanacyjna i predykcyjna; spójność opisu i realistyczne ujęcie interakcji przyczynowych, nie zaś ich ignorowanie. Mechanizm przetwarzający musi być względnie izolowany, aby można było go wyróżnić z otoczenia; jeśli system ma cechy umożliwiające mu przetwarzanie informacji ze środowiska, to interakcje wewnątrzsystemowe muszą być częstsze niż interakcje na jego granicach9. Bezpośredni styk z otoczeniem mają tylko wejścia i wyjścia systemu. Co więcej, realizator mechanizmu musi być opisywalny mechanistycznie, w kategoriach strukturalno-funkcjonalnych10. Mechanizm przetwarzania jest „zadany” przez strukturę mechanizmu i poddaje się też wyjaśnianiu adaptacjonistycznemu, gdy w grę wchodzą systemy biologiczne. 9 Mówiąc nieco precyzyjniej, strukturę systemu można odkryć, badając istotne statystycznie regularności w jego funkcjonowaniu. Granice składników najłatwiej wyznaczać przez różnice względnych częstości interakcji, lecz odkrycie relacji między składnikami wymaga zastosowania bardziej skomplikowanych miar statystycznych. Jeśli system podlega prawidłowościom nie tylko statystycznym, lecz znanym skądinąd prawom ścisłym, przy jego indywiduacji i wyznaczaniu jego struktury wewnętrznej można je oczywiście także wykorzystać. 10 Analogiczne kryteria postulowałem w odniesieniu do procesów algorytmicznych (obliczeniowych). Por. Miłkowski (2007) i Miłkowski (2009). 36 Marcin Miłkowski Przedstawiona wyżej, uproszczona wersja semantyki informacyjnej wypływająca z analizy mechanizmów reprezentacyjnych wystarcza, aby pokazać, że systemy obliczeniowe — zawierające mechanizmy reprezentacyjne — mogą mieć stany wewnętrzne, które mają ekstensję. Sposób realizacji tych zdolności, czyli architektura sprzętowa czy też programowa, nie jest w tym wypadku kluczowy, o ile tylko system spełnia ogólne warunki opisane powyżej. Ponieważ w szczególności zarówno systemy klasyczne, o ile tylko wyposażone są w odpowiednie detektory lub korzystają z już zakodowanych informacji (o niepustej ekstensji), jak i systemy koneksjonistyczne czy też rozwiązania hybrydowe mogą przetwarzać informacje we wspomnianym sensie, uzasadnione jest powiedzenie, że mamy do czynienia z wieloraką realizacją własności odnoszenia się. W różny bowiem sposób można i przetwarzać informacje, i je reprezentować (kodować w systemie). Systemy samodzielnie wydobywające informacje zawarte w sytuacjach i je przetwarzające można uznać za autonomiczne pod względem semantycznym, w odróżnieniu od większości systemów obliczeniowych, które są nieautonomiczne i do których dane wprowadzane są przez ludzi. W takim wypadku własności semantyczne tych informacji nie zależą od systemu (są wtórne wobec istniejących uprzednio własności semantycznych). Powyższe ujęcie uwzględnia możliwość błędnej reprezentacji: błędna reprezentacja może pojawić się na dowolnym etapie działania mechanizmu i polega po prostu na dysfunkcji odpowiednich mechanizmów cząstkowych. Ponieważ większość systemów przetwarzających informacje korzysta z szeroko rozumianych procedur heurystycznych (Wimsatt 2007), istnieją sytuacje, w których będą ujawniać się systematyczne błędy i dysfunkcje w przetwarzaniu informacji z sytuacji. 3. Konotacje reprezentacji obliczeniowych Zdecydowanie bardziej kontrowersyjna jest kwestia istnienia konotacji dla reprezentacji obliczeniowych. Z jednej strony można w ogóle kwestionować istnienie konotacji — zwłaszcza w sensie zbioru wystarczających i koniecznych warunków stosowania danej reprezentacji. Jest to typowe zwłaszcza dla eksternalizmu (por. np. McClamrock, rozdział 8). Z drugiej strony jest ewidentne, że Searle przede wszystkim konotację czy też treść reprezentacji ma na myśli, kiedy neguje istnienie zdolności semantycznych w systemach obliczeniowych. Dwa różne zagadnienia dotyczą konotacji. Pierwsze dotyczy tego, w jaki sposób w ogóle może pojawić się konotacja reprezentacji — jeśli Reprezentacje w systemach... 37 system nie ma żadnego zewnętrznego „wspomagania” (np. w postaci kultury i języka naturalnego). Innymi słowy, jest to pytanie o redukowalność treści reprezentacji do innych niesemantycznych własności11 . Drugie pytanie jest następujące: czy systemy obliczeniowe mogą mieć zdolności rozpoznawania desygnatów swoich reprezentacji? Treść reprezentacji ma bowiem umożliwić im prawidłową kategoryzację, a następnie zastosowanie reprezentacji określonego rodzaju. Na to drugie pytanie najczęściej odpowiada się, że konieczne będą własności sensomotoryczne, typowe raczej dla robotów, nie zaś dla systemów obliczeniowych. Zajmę się przede wszystkim drugim zagadnieniem, gdyż pierwsze wymagałoby dokładniejszego omówienia problemu ugruntowania symboli, na co nie mam tutaj po prostu miejsca. Zresztą znane nam biologiczne systemy korzystające z reprezentacji wyposażonych w treść nie generują tej treści wyłącznie same z siebie, tylko w ramach społecznego podziału pracy językowej. Dlatego też redukcja treści semantycznych do własności niesemantycznych, choćby była ciekawym teoretycznie problemem, pozostaje kwestią stosunkowo akademicką, gdy mowa o systemach biologicznych czy wzorowanych na biologicznych. Postulowanie zdolności sensomotorycznych jako warunku koniecznego rozpoznawania desygnatów dlatego wydaje się tak oczywiste, że kategoryzacja otoczenia wymaga aktywnej eksploracji (zdolności motoryczne) i detekcji obiektów (zdolności sensoryczne). Jednak zakłada się wówczas de facto empirystyczną koncepcję treści umysłowej: pochodzić mają one wszystkie z wrażeń zmysłowych, bezpośrednio lub przez kombinację. Nie odbiega to więc daleko od Hume’owskiej koncepcji idei, które albo wywodzą się bezpośrednio z doświadczenia, albo są konstruowane z innych wrażeń zmysłowych. Nie trzeba długo szukać, aby przekonać się, że nie wszystkie treści reprezentacji w ogóle mają jakikolwiek aspekt sensoryczny czy też motoryczny. Wystarczy wskazać na reprezentacje matematyczne czy normatywne. Trudno twierdzić, że treść pojęcia „dobro” da się wyrazić w skończonym zbiorze koniecznych i wystarczających cech sensorycznych i motorycznych. Choć odnosimy pojęcie dobra do różnych empirycznie dostępnych przedmiotów, to nie jest ono po prostu redukowalne do poziomu detekcji sensoryczno-motorycznej. Być może skomplikowany robot byłby 11 Przegląd odpowiedzi na to pytanie w odniesieniu do tzw. problemu ugruntowania symboli przedstawiają Floridi i Taddeo 2005. Ich własne rozwiązanie tego problemu stanowi pozytywną odpowiedź na pytanie o możliwość redukcji własności semantycznych do niesemantycznych, por. Floridi i Taddeo 2007. 38 Marcin Miłkowski w stanie znaleźć statystyczny wzorzec we wszystkich dobrych jabłkach, samochodach i uczynkach, ale naprawdę jałowe wydaje się poszukiwanie sensorycznych aspektów treści pojęcia liczby 2 czy zbioru. Treść tych pojęć bowiem nie sprowadza się całkowicie do aspektów sensomotorycznych. Aby móc utrzymać tezę, że treść reprezentacji to tyle, co warunki rozpoznawania ich desygnatów sformułowane w kategoriach sensomotorycznych, trzeba poczynić założenia klasycznego empiryzmu genetycznego. Łącznie z rozróżnieniem pojęć analitycznych (np. matematycznych) i syntetycznych, co po krytyce Quine’a jest dosyć trudne12 . W wypadku systemów, które posługują się wyłącznie reprezentacjami typu sensorycznego, takie empirystyczne rozwiązanie będzie zapewne wystarczające (jako pewna heurystyka). Jednak system obliczeniowy korzystający z pojęć matematycznych lub wspomagający ferowanie sądów normatywnych (np. wspomagający decyzje bioetyczne) nie zmieści się na prokrustowym łożu semantyki empiryzmu logicznego. Zresztą nawet przedstawiciele empiryzmu logicznego nie przyjmowali tak skrajnych założeń. Wystarczy odwołać się do klasycznego artykułu Carnapa (1955), który pisał o „pojęciu intensji dla robota”. Otóż zdaniem Carnapa, intensję pojęcia można wyrazić w kategoriach stanów organów sensorycznych lub opisu podawanego na wejścia językowe danego robota. Odpowiednie pobudzenia organów lub analiza opisu mają prowadzić do tego, że robot, napotkawszy określony predykat, określa, czy predykat oznacza obiekt wykryty przez organ sensoryczny lub opisany językowo — wydaje wówczas werdykt pozytywny, negatywny lub wstrzymuje się od głosu. Carnap, w przeciwieństwie do wielu innych autorów, nie przesądza, jaką strukturę ma sama treść konotacyjna — nie musi być ona ujęta np. w kategoriach cech konstytutywnych i konsekutywnych. Mówiąc krótko, Carnap dopuszcza też możliwość określania intensji predykatu wyłącznie w kategoriach opisu językowego, bez jakichkolwiek wejść sensorycznych. Zdaje się jednak, że sądzi, że brak wejść sensorycznych świadczyć może o pustości reprezentacji (np. w wypadku pojęcia „ jednorożec”). We współczesnej filozofii języka w rozmaity sposób próbuje się przezwyciężać koncepcje empiryzmu. Są podejścia holistyczne, gdzie treść jest definiowana przez sieć relacji między reprezentacjami (konotacja jest rozumiana np. jako tzw. rola pojęciowa). Są też próby eliminacji 12 Pojęcia normatywne można by próbować sprowadzać, jak emotywizm, do emocji, pozbawiając je treści. Wydaje mi się oczywiste, że to pomysł chybiony: emotywizm nie potrafi po prostu zdać sprawy z sensu terminów etycznych. Reprezentacje w systemach... 39 tego pojęcia i zastąpienia go np. użyciem wyrażeń. Aby nie rozstrzygać na rzecz któregokolwiek z tych podejść, będę proponował inną strategię. Wrócę do systemów przetwarzających informacje wydobyte z sytuacji i przeprowadzę eksperyment myślowy podobny do proponowanego przez Carnapa. Pojęcie konotacji lub intensji historycznie wprowadzono po to, aby móc pokazać, że równozakresowe nazwy nie mogą być podstawiane w rozumowaniach salva veritate. Załóżmy więc, że system generuje dwie złożone reprezentacje — struktury danych — i używa ich w jakiejś szerszej reprezentacji opisowej (np. w zdaniu oznajmującym lub jako część diagramu; nie rozstrzygam o postaci reprezentacji). Problemem, który system musi być w stanie rozwiązać, np. na drodze rozumowania, jest określenie, że te dwie reprezentacje, choć mają różną treść, są jednak równozakresowe. Treść w tym wypadku będzie rozumiana jako zespół warunków (w skrajnym, ale rzadkim wypadku: koniecznych i wystarczających), które spełnia kategoria desygnatów reprezentacji. Te warunki służą do rozpoznawania desygnatów, ale niekoniecznie na drodze detekcji sensomotorycznej. Jeśli desygnat nie jest przedmiotem podlegającym detekcji sensorycznej, bo jest np. wewnętrznym stanem obliczeniowym (liczba dwa) lub abstraktem (zbiór), system będzie traktował reprezentację nie jako wydobytą z otoczenia fizycznego — gdyż nie jest w stanie odnieść jej do wejść systemu — lecz jako element sytuacji wewnętrznej systemu, o ile system posługuje się takimi konstrukcjami, jak zbiór czy liczby. Jeśli zaś desygnat nie istnieje ani jako sytuacja w otoczeniu systemu, ani jako jego sytuacja wewnętrzna, będzie traktowany formalnie, jako reprezentacja o nieznanej ekstensji. Operacje obliczeniowe, przekształcające formalną strukturę warunków mogą doprowadzić do wskazania, czy to na drodze faktycznego próbkowania sytuacji, czy też przez zastosowanie bazy wiedzy, że intensje, choć różne, wyznaczają ten sam zakres. Odnieśmy to do systemów klasycznych i koneksjonistycznych. Jak zauważył Chalmers (1992), klasyczne systemy sztucznej inteligencji operują raczej na atomowych reprezentacjach bez żadnej struktury wewnętrznej. Te reprezentacje są powiązane różnymi relacjami, lecz to nie wystarcza, jak twierdzi Chalmers, aby można było mówić o intensjonalności tych reprezentacji. To pojedyncza bowiem reprezentacja musi mieć na tyle złożoną strukturę, aby można było mówić, że zawiera także cechy konotacyjne. Zdaniem Chalmersa, taką strukturę — strukturę subsymboliczną — mają systemy koneksjonistyczne, gdzie reprezentacje mają postać węzłów sieci neuronowych, w których istnieją warstwy ukryte. To jedyna nadzieja, jego zdaniem, na prawdziwą realizację konotacji w systemach obliczeniowych, lecz — co podkreśla — 40 Marcin Miłkowski na razie trudno powiedzieć, jak by to mogło w szczegółach wyglądać. Ujęcie Chalmersa obarczone jest grzechem, o którym wspomniałem na początku artykułu: autor ten sądzi, że intensja reprezentacji musi być cechą wewnętrzną samej struktury danych, która w określonym systemie obliczeniowym realizuje taką reprezentację. Wydaje się, że nieistotna jest sama struktura wewnętrzna samej reprezentacji. Idzie o to, czy jest ona stosowana w systemie, w którym może mieć treść w sensie posiadania warunków wskazywania desygnatów. Na przykład pojedynczy zapalony bit w systemie komputerowym może reprezentować liczbę naturalną 1, a to na mocy struktur relacyjnych w procesach, które będą operować na tym bicie. Z kolei skomplikowany ciąg liter wytworzony przez 300-krotne powtarzanie struktury „abcabc...” będzie pozbawiony intensji w systemie rozpoznającym zdania napisane w języku polskim. Innymi słowy, tam, gdzie reprezentacje mogą służyć do kategoryzacji, tam mają też treść. Co ciekawe, również systemy korzystające wyłącznie z informacji już przetworzonych mogą mieć tego rodzaju reprezentacje, choćby te przetworzone informacje same nie odnosiły się do żadnych desygnatów. Wydaje się, że to wynik dosyć intuicyjny (wbrew sugestiom Searle’a i Harnada): puste pojęcia mogą mieć rozbudowane intensje. Choćby wujowie centaurów byli zakresowo identyczni ze stopami centaurów, to jednak treściowo się różnią. Takie różnice w treści są w stanie wychwycić nawet proste mechanizmy obliczeniowe, korzystające ze skomputeryzowanych sieci semantycznych. Nie muszą być robotami: detekcja sensomotoryczna dotyczy tylko niektórych reprezentacji, których warunki odnoszenia są do wyrażenia w takich kategoriach. Przypisanie istnienia treści reprezentacji podlega przy tym analogicznym warunkom, jak w wypadku przetwarzania informacji: musi być potrzebne z punktu widzenia predykcji, wyjaśniania i opisu itd. 4. Podsumowanie Twierdzę, że systemy obliczeniowe mogą zawierać reprezentacje odnoszące się do przedmiotów i że mogą dysponować strukturami danych wskazującymi warunki prawidłowego odnoszenia się do przedmiotów (choćby owe przedmioty były czysto intencjonalne). Tylko w wypadku odniesienia konieczne jest powiązane mechanizmów obliczeniowych — w ramach systemów przetwarzania informacji — ze światem zewnętrznym (lub wewnętrznym, jeśli system przetwarza informacje na swój własny temat). Intensje mogą istnieć bardziej niezależnie od niego, choć mogą być też określone w kategoriach wymagających przyczynowego kontaktu ze światem. Na przykład intensja nazwy własnej musi Reprezentacje w systemach... 41 określać indywiduum, którego dotyczyła określona procedura nazywania w przeszłości: określenie to jednak polega po prostu na prześledzeniu historii indywiduum od momentu nazwania, a nie znalezieniu go choćby przez najbardziej jednoznaczny opis. W ramach tego ogólnego ujęcia widać, że pod tym przynajmniej względem nie ma żadnej interesującej różnicy między systemami typu klasycznego (GOFAI), koneksjonistycznego, hybrydowego czy np. populacjami algorytmów ewolucyjnych. Wszystkie te architektury mogą mieć zdolności semantyczne, o ile tylko będą przetwarzać informacje z sytuacji oraz operować na warunkach odnoszenia się reprezentacji. Własności semantyczne, mówiąc krótko, są wielorako realizowalne. Literatura Bechtel, W., Richardson, R. C. (1993). Discovering complexity: Decomposition and localization as strategies in scientific research. Princeton: Princeton University Press. Carnap, R. (1955). Meaning and Synonymy in Natural Languages. Philosophical Studies, VI, 3, s. 33–47. Chaitin, G. J. (1975). Randomness and Mathematical Proof. Scientific American, 232, 5, s. 47–52. Chaitin, G. J. (1987). Algorithmic Information Theory. Cambridge: Cambridge University Press. Chalmers, D. (1992). Subsymbolic computation and the Chinese Room. W: Dinsmore, J. (red.) The Symbolic and Connectionist Paradigms: Closing the Gap. Lawrence Erlbaum. Collier, J. (1990). Intrinsic Information. W: Hanson, P. (red.) Information, Language, and Cognition. University of British Columbia Press, s. 390–409. Craver, C. F. (2006). When Mechanistic Models Explain. Synthese 153, 3, s. 355–376. Feynman, R. (1982). Simulating Physics with Computers. International Journal of Theoretical Physics 11, 21. Floridi, L., Taddeo, M. (2005). The Symbol Grounding Problem: a Critical Review of Fifteen Years of Research. Journal of Experimental and Theoretical Artificial Intelligence 17, 4, s. 419–445. Floridi, L., Taddeo, M. (2007). A Praxical Solution of the Symbol Grounding Problem. Minds and Machines 17, 4, s. 369–389. Harnad, S. (1990). The Symbol Grounding Problem. Physica D 42, s. 335346. Israel, D. J., Perry J. (1990). What Is Information? W: P. Hanson (red.) Information, Language, and Cognition. University of British Columbia Press, s. 1-19. McClamrock, R. (1995). Existential Cognition. Computational Minds in the World. Chicago, London: University of Chicago Press. Miłkowski, M. (2007). Is computationalism trivial? W: Dodig Crnkovic, 42 Marcin Miłkowski G., Stuart S. (red.) Computation, Information, Cognition — The Nexus and the Liminal. Cambridge Scholars Publishing, s. 236–246. Miłkowski, M. (2008). Postulowanie utajonych funkcji umysłu: realizm kontra antyrealizm. W: Wróbel, Sz. (red.) Utajone funkcje umysłu. PoznańKalisz: Wydział Pedagogiczno-Artystyczny UAM w Kaliszu, s. 15–37. Miłkowski, M. (2009). O tzw. metaforze komputerowej. Analiza i Egzystencja 9, s. 163-185. Piccinini, G. (2007). Computational Explanation and Mechanistic Explanation of Mind. W: de Caro, M., Ferretti, F., Marraffa, M. (red.) Cartographies of the Mind: The Interface between Philosophy and Cognitive Science. Dordrecht: Springer, s. 23–36. Poczobut, R. (2005). Od informacji fizycznej do informacji fenomenalnej. W: Heller, M., Mączka, J. (red.) Informacja a rozumienie. Kraków: PAUOBI, s. 177–193. Searle, J. R. (1995). Umysły, mózgi i programy, przeł. B. Chwedeńczuk. W: Chwedeńczuk, B. (red.) Fragmenty filozofii analitycznej, tom II. Filozofia umysłu. Warszawa: Fundacja Aletheia, s. 301–324. Searle, J. R. (1999). Umysł na nowo odkryty, przeł. T. Baszniak. Warszawa: PIW. Wimsatt, W. C. (2007). Re-Engineering Philosophy for Limited Beings. Cambridge, Mass.: Harvard University Press. Procesy wyobrażeniowe on-line Piotr Markiewicz Instytut Filozofii UWM Wojewódzki Szpital Specjalistyczny w Olsztynie Streszczenie. Typowe stanowisko w kontekście procesów wyobrażeniowych zakłada, że takie procesy realizują się bez obecności bodźca percepcyjnego. Celem artykułu jest wykazanie, że istnieją specyficzne procesy wyobrażeniowe transformujące bodziec percepcyjny w jego obecności. Inaczej mówiąc, niektóre wyobrażenia mają status on-line w procesie przetwarzania informacji wizualnej. Można się o tym przekonać analizując przykłady prostych iluzji wzrokowych. Podczas doznawania iluzji włączają się prawdopodobnie dodatkowe operacje wyobrażeniowe, które pozwalają na wizualizację osobliwych własności w bodźcach iluzorycznych. W konsekwencji proces rejestracji iluzji ma charakter dwutorowy, tj. percepcyjny i wyobrażeniowy. W procesie percepcji system wizualny przetwarza informacje o dostępnych danych i formułuje hipotezę o specyficzności obiektu. Natomiast weryfikację hipotezy przeprowadza system wyobrażeniowy, który rekonstruuje wizualnie niekompletne informacje w bodźcach. Zarysowany pogląd opieram na wynikach współczesnych badań neurokognitywnych w zakresie przetwarzania informacji wizualnej. 1. Problematyka Kryterium obecności bodźca zewnętrznego podczas realizacji procesu poznawczego pozwala różnicować reprezentacje na dwa główne typy. Pierwszy typ reprezentacji wymaga istnienia takiego bodźca. Są to tzw. reprezentacje w obecności. Przykładem takiej reprezentacji jest reprezentacja percepcyjna (percept). Drugi typ reprezentacji nie wymaga istnienia bodźca zewnętrznego i jest to tzw. reprezentacja pod nieobecność, np. reprezentacja pamięciowa (Najder 1993). W innej terminologii reprezentacja w obecności to reprezentacja on-line, a reprezentacja pod nieobecność to reprezentacja off-line. Taka typologia jest czytelna, gdy próbujemy np. odróżnić stany percepcyjne od stanów halucynacji. Wówczas te ostatnie są przykładem procesów off-line, związanych Studia z Kognitywistyki i Filozofii Umysłu, 3: 43–53, 2009 c 2009 Piotr Markiewicz Copyright 44 Piotr Markiewicz z patologiczną aktywnością ośrodkowego układu nerwowego (Ffytche, Howard 1999). Problemy z typologią on-line/off-line dotyczą procesów wyobrażeniowych. Standardowy pogląd przypisuje wyobraźni status off-line, tzn. wyobrażenia powstają bez obecności fizycznego bodźca (np. Mesulam 1998; Thomas 1999; Andrewes 2001; Kaski 2002). Odpowiada temu operacjonalizacja procesów wyobrażeniowych, w których osoby badane po obserwacji bodźca percepcyjnego A otrzymują jego zrotowaną wersję A1 i dokonują decyzji o stanie rotacji A1 w stosunku do A. W momencie podejmowania decyzji bodziec A jest niewidoczny i nawet wykluczana jest obecność obrazu następczego A (eksperyment 1, w: Francuz, Oleś, Chumak 2008). Podobnie procedura ustalania rozmiaru wyobrażeń w zadaniu oceny odległości osoby badanej od wyobrażonego obiektu, gdy ten przekracza wyobrażone pole widzenia, również nie wymaga obecności sensorycznej takiego obiektu (Farah, Soso, Dasheiff 1992). W obu opisanych zadaniach zakłada się, że wyobrażenia powstają w niedostępnej ekstrapersonalnie przestrzeni (stąd metafora mind’s eye jako procesu wewnętrznej wizualizacji, por. Kosslyn, Sukel, Bly 1999; Kosslyn, Shephard, Thompson 2007), w której następują różne procesy transformacji obiektu poprzednio widzianego lub przechowywanego w pamięci. O takich transformacjach świadczą efekty m.in. istotnie dłuższego czasu umysłowej operacji rotowania obiektów prezentowanych w perspektywie kanonicznej (czyli najbardziej typowej dla obserwatora) niż w perspektywie niekanonicznej (eksperyment 2, w: Francuz, Oleś, Chumak 2008) oraz deficyty generowania adekwatnych wyobrażeń u osób z prawą potyliczną lobektomią w postaci znacznie mniejszych rozmiarów wyobrażanych obiektów w stosunku do rzeczywistych odpowiedników (Farah, Soso, Dasheiff 1992). Czy jednak każdy proces wyobrażeniowy ma charakter off-line? Wydaje się, że brak obecności bodźca percepcyjnego nie jest warunkiem koniecznym realizacji procesu wyobrażeniowego. Przykładowo, podczas rejestracji percepcyjnej np. szafy można jednocześnie dopasować kolejne wyobrażone szafy w pokoju i w efekcie ustalić ich maksymalną liczbę. Procedura wyobrażeniowego dopasowania nie likwidowała obecności bodźca percepcyjnego (szafy) i co więcej, taki bodziec umożliwił całą operację. W artykule postaram się wykazać, że istnieją specyficzne procesy wyobrażeniowe transformujące bodziec percepcyjny w jego obecności. Inaczej mówiąc, wbrew tradycyjnie przyjmowanemu poglądowi niektóre wyobrażenia mają status on-line. Procesy wyobrażeniowe on-line (a) (b) 45 (c) RYS. 1. (a) przedstawia tzw. kratę Hermanna. Podczas percepcji takiego obiektu obserwator może dostrzec iluzoryczne ciemne plamki na przecięciach białych linii. Z kolei rys. (b) to tzw. iluzja Pettera, gdzie obserwator ma doznanie przedłużenia poziomych linii w postaci jasnej iluzorycznej linii na pionowym prostokącie. Natomiast rys. (c) przedstawia tzw. trójkąt Kanizsy, a więc przypadek dostrzegania iluzorycznego trójkąta nałożonego na trzy czarne koła. 2. Przykłady bodźców percepcyjno-wyobrażeniowych Pewne osobliwe przypadki iluzorycznych bodźców percepcyjnych sugerują dodatkową obecność niepercepcyjnych procesów. Tak jest w przypadku obiektów na rys. 1. Standardowe wyjaśnienia iluzorycznych zjawisk na rys. 1 nie wykraczają poza możliwości percepcji. W tej mierze przyjmuje się, że konstrukcyjna natura procesów percepcji jest w stanie dołączyć do obiektów 1-3 dodatkowe interpretacje wykorzystujące dane wizualne w obiektach. Proporcje czarnych i białych powierzchni na rys. 1(a) pozwalają ustalić iluzoryczne przedłużenia czarnej linii na białej powierzchni, proporcja prostokątów oraz udział białego tła na rys. 1(b) umożliwia wprowadzenie interpretacji przedłużenia mniejszego prostokąta, a kąty w czarnych kołach na rys. 1(c) dopuszczają interpretację domykającą figurę trójkąta (przegląd i dyskusja badań: Markiewicz 2008). Główne uzasadnienie interpretacji percepcyjnej w kontekście 1-3 wynika z założenia, że procesy widzenia nie są izomorficzną odpowiedzią na sygnały sensoryczne, czego przykładem mogą być prawa psychologii Gestalt oraz komputacyjny model percepcji Marra (Kellman 2003). Wyjaśnienia percepcyjne zjawisk iluzji 1-3 napotkają jednak na pewne trudności. Podstawowe problemy wyznaczają pytania: (A) czy można zobaczyć coś, czego nie ma fizykalnie w bodźcu?, (B) jaki status kognitywny mają wprowadzone przez system wzrokowy iluzoryczne interpretacje wizualne? Odpowiedź na pytanie (A) wydaje się trywialna przy posłużeniu się dowolnym przykładem z psychologii Gestalt (obserwator widząc np. kropki widzi także ich zbiór w postaci kolumn). Poza tym doznający iluzji na rys. 1 mogą konkretnie wskazać to, co widzą, a więc zarówno elementy bodźców 1-3 oraz zjawiska iluzoryczne. Jednak 46 Piotr Markiewicz Informacja receptorowa - RYS. 2. Automatyczne kodowanie podstawowych cech obiektu Analiza cech lokalnych i globalnych Detekcja formy obiektu Zaawansowane przetwarzanie percepcyjne - Etapy przetwarzania wizualnego nawet przyjmując, że można zobaczyć faktycznie nieistniejące efekty iluzoryczne na rys. 1 nadal nie wiemy, czy to, co dostrzegają obserwatorzy jest perceptem. Stąd pytanie (B), które jest trafne w tym sensie, że doznawane efekty iluzoryczne są mniej stabilne (np. plamki w kracie Hermanna zmieniają się w zależności od ruchów gałek ocznych) i mniej wyraziste niż pozostałe dane wizualne na rys. 1 (np. czarne kwadraty, czarne prostokąty i czarne koła z wcięciami). Czy to oznacza, że w konsekwencji musielibyśmy uznać dwa typy reprezentacji percepcyjnych –– jedną odniesioną do stymulacji sensorycznej i drugą wytworzoną przez system percepcyjny poza taką stymulacją? Jeśli nawet zgodzimy się z taką interpretacją, to w ten sposób drugi typ reprezentacji percepcyjnej staje się praktycznie nieodróżnialny od stanu halucynacji. Badacze iluzji zdają się dostrzegać wskazany problem, ale dotychczasowe propozycje wskazują raczej na brak adekwatnego jego rozwiązania. Jedna z opcji uznaje, że doznanie iluzji np. na rys. 1(c) jest efektem fałszywego alarmu, gdyż obserwator bodźca iluzyjnego daje się oszukać jego własnościom naśladującym realne obiekty i następnie podejmuje błędną decyzję wizualną (Kim, Blake 2005). W innej opcji zjawiska iluzyjne zawiera takie niepercepcyjne kategorie, jak fantazmatyczne smugi lub fantomy systemu wzrokowego (May, Brown, Roberts 1999; Fineman 1996; Schiller, Carvey 2005), a nawet włącza kategorie synestezji (Kim, Blake 2005). Decyzyjna, fantomowa czy synestetyczna kategoryzacja efektów iluzorycznych sugeruje raczej, że w procesie formowania iluzji uczestniczą inne niż tylko percepcyjne procesy. Przykładowo, w przypadku synestezji opis tego zjawiska angażuje m.in. zdolności pamięciowe, przeżycia emocjonalne, aury epileptyczne i halucynacje (Herzyk 2005). Możliwe rozwiązanie problemu statusu kognitywnego efektów iluzorycznych z rys. 1 polega uznaniu, że podczas doznawania iluzji włączają się dodatkowe operacje wyobrażeniowe, które pozwalają na wizualizację osobliwych własności w bodźcach 1-3. Wówczas proces rejestracji iluzji Procesy wyobrażeniowe on-line 47 ma charakter dwutorowy, tj. percepcyjny i wyobrażeniowy. W procesie percepcji system wizualny przetwarza informacje o dostępnych danych i formułuje hipotezę o specyficzności obiektu. Natomiast weryfikację hipotezy przeprowadza system wyobrażeniowy, który rekonstruuje wizualnie niekompletne informacje w bodźcach 1-3. Taka wizualizacja jest na tyle intensywna, że obserwator może mieć wrażenie percepcji jej efektów. W jaki sposób i dlaczego system wyobrażeniowy wytwarza tak silne wizualizacje? 3. Mechanizm wyobrażeń on-line Poznawcza analiza obiektów na rys. 1 nie jest skomplikowana z dwóch powodów. Po pierwsze, każdy z nich jest zbiorem prostych dwuwymiarowych figur. Po drugie, obiekty 1-3 są pozbawione zróżnicowanego tła i kontekstu. Dlatego tak wypreparowane obiekty nadają się doskonale do ujawniania możliwości systemu wizualnego. Ze względu na niski stopień złożoności obiektów 1-3 ich poznawcza analiza ogranicza się do detekcji krawędzi, barwy, kontrastów, rozmiaru, kierunków, figur. Tego typu funkcjami w systemie wzrokowym zajmują się obszary V1 i V2 kory wzrokowej (Fahle 2003; Halligan i In. 2003; Palmer 2003; Tong 2003). System wczesnych funkcji wzrokowych jest też kategoryzowany jako bufor wzrokowy (Kosslyn 2005; Francuz 2007). Bufor wizualny z poziomu V1 specjalizuje się początkowo w odrębnym kodowaniu informacji na temat m.in. barwy, kontrastów, rozmiaru, kierunku linii (rys. 2). Efektem tych procesów może być rozpoznanie konturów obiektu. Kolejny etap wyznaczają dwa procesy sterowane uwagowo. Pierwszy dotyczy ogólnego kształtu obiektu, a drugi zajmuje się jego cechami lokalnymi. W tej fazie uwaga ma charakter mimowolny, tzn. jest sterowana cechami bodźca. Przy zwiększeniu zakresu bufora wizualnego o V2 można mówić o dodatkowych jego funkcjach polegających na rozpoznaniu formy obiektu (integracja konturów, segmentacja) (Bradley 2001; Heydt 2003). Dalsze etapy przetwarzania wizualnego sprowadzają się do kategoryzacji w oparciu o wizualne dane pamięciowe (rys. 2, strzałka prawa). Z uwagi na temat artykułu najważniejsza kwestia dotyczy tego, że bufor wizualny jest traktowany jako podstawa procesów wyobrażeniowych (Kosslyn 2005). To tu właśnie powstaje szkic widzianego obiektu i tu także pojawiają się wstępne hipotezy percepcyjne. Przy typowych wyobrażeniach bufor wizualny jest wspomagany przez dodatkowe odgórne procedury wykonawcze. Inicjatorem takiego procesu jest moduł przerzucania informacji, który może jednocześnie włączyć dodatkowe skanowanie bufora wizualnego przy pomocy modułu przesunięcia uwagi 48 Piotr Markiewicz oraz wykorzystać wsteczną aktywację informacji w buforze wizualnym dzięki informacjom o własnościach obiektów zmagazynowanych w pamięci długotrwałej. Dodatkowo, informacje z pamięci długotrwałej mogą jednocześnie wyznaczyć szczegóły przeszukiwania zgodnie z rozkładem przechowywanych danych. Tego typu odgórne operacje są według Kosslyna stałym komponentem procesów wyobrażeniowych. Co się jednak dzieje w przypadku obiektów 1-3. Ze względu na ich prostotę nie są wymagane zaawansowane hipotezy percepcyjne wykorzystujące dane pamięci długotrwałej. Bufor wizualny wykonuje zadane operacje percepcyjne (rys. 2), ale ze względu na efekty iluzoryczne prawdopodobnie angażowane są dodatkowe operacje kognitywne. Wróćmy do obiektu 1. Klasyczne wyjaśnienie iluzorycznych plamek w kracie Hermanna (rys. 1(a)) odwołuje się do specyficznej aktywności komórek zwojowych siatkówki. Jednak współczesne wyjaśnienie sięga dalej w hierarchii przetwarzania wzrokowego. Występowanie iluzji jest prawdopodobnie możliwe dzięki komórkom specjalizującym się w rozpoznawaniu linii poziomych i pionowych. Komórki wrażliwe na kierunek orientacji przestrzennej, z których większość specjalizuje się w orientacji poziomej i pionowej, znajdują się w obszarze V1. Wcześniejsze etapy drogi wzrokowej, w tym siatkówka i ciała kolankowate boczne, nie specjalizują się w detekcji tego rodzaju (Schiller, Carvey 2005). W jaki jednak sposób komórki V1 wywołują iluzoryczne elementy w kracie Hermanna? Prawdopodobnie odpowiadają za to dwa mechanizmy (Schiller, Carvey 2005). Pierwszy z nich zawiera neurony specjalizujące się w rozpoznawaniu kierunku linii. Te neurony (nazywane S1) reagują silniej na dłuższe, niż krótsze linie. Dlatego krawędzie sąsiadujących ze sobą kwadratów w kracie są interpretowane jako nietypowa przerwa w linii i stąd S1 mogą być wzbudzane w niewielkim zakresie, ale na tyle silnym, żeby wywołać proces rzutowania brakującej linii – zarówno pionowej i poziomej. Natomiast drugi mechanizm tworzący iluzoryczne plamki posiada neurony wrażliwe na zmiany natężenia światła i odpowiada za percepcję stopnia jasności obiektu. Podobnie jak w komórkach siatkówki, także i tutaj zmiany świetlne mogą być rejestrowane przez system ON (wzbudzenie przy wzroście natężenia) i OFF (wzbudzenie przy spadku natężenia). Właśnie system OFF może być aktywowany przez czarne elementy kraty Hermanna, czego efektem są doznania ciemnych plam na skrzyżowaniach linii. Przedstawiona interpretacja ujawnia podwójny proces przetwarzania wizualnego w kracie Hermanna. Z jednej strony, zgodnie z pierwotnymi funkcjami bufora wizualnego (rys. 2) system wzrokowy rozpoznaje linie i barwy obiektu. Z drugiej strony system ten wprowadza dodat- Procesy wyobrażeniowe on-line RYS. 3. 49 Operacje iluzyjne w trójkącie Kanizsy (A-C opis w tekście) kowe operacje uzupełniające luki w liniach i nanoszące efekty świetlne. Takie dołączone funkcje stanowią przypuszczalnie pierwsze przejawy procesów wyobrażeniowych w obecności bodźca percepcyjnego. Na tym etapie działanie wyobraźni jest bardzo ograniczone i właściwie stanowi uzupełnienie wskazówek bodźcowych. Kolejny obiekt wyzwalający iluzję (rys. 1(b)) nie dostarcza nowych wskazówek dla innych typów operacji wyobrażeniowych. Doznanie iluzorycznej linii Pettera odwołuje się do tych samych mechanizmów, które warunkowały iluzoryczne plamki w kracie Hermanna. Natomiast trójkąt Kanizsy wprowadza nowe możliwości dla systemu wyobrażeniowego. Ilość uzupełnień wizualnych wykonywana przez system wzrokowy na rys. 1(c) to cztery operacje. Przede wszystkim możemy dostrzec dopełnienie wcięć w kołach w postaci lekko przyciemnionych obszarów. Bardziej jednak widoczna jest interpretacja jasnego trójkąta nałożonego na trzy czarne koła (rys. 3). Zawiera ona w sobie trzy procedury: rozjaśnienia iluzorycznego trójkąta względem tła (rys. 3A), domknięcie iluzorycznego trójkąta (rys. 3B) i podniesienie trójkąta względem płaszczyzny z kółkami (rys. 3C). Tak, jak w przypadku poprzednich obiektów (rys. 1(b) i 1(c)) procesy wyobrażeniowe w trójkącie Kanizsy również rozpoczynają się od dołączanych efektów liniowych i świetlnych. W kolejnej fazie oba procesy mogą być jednak integrowane celem utworzenia reprezentacji figury (rys. 2 –– analiza cech globalnych) oraz segmentacji przestrzennej (rys. 2 –– detekcja formy obiektu) (por. Spillmann, Dresp 1995). Zarówno reprezentacja figury i segmentacja są operacjami dołączonymi do jednocześnie realizowanych procesów percepcji w związku z bodźcem Kanizsy (analiza dostępnych linii, kształtów, kontrastów, dostępnych figur). Przetwarzanie obiektów iluzorycznych wykracza jednak poza funkcje bufora wizualnego (rys. 2), realizującego wczesne funkcje wizual- 50 Piotr Markiewicz Informacja receptorowa - RYS. 4. Kodowanie podstawowych cech obiektu Analiza cech lokalnych i globalnych Detekcja formy obiektu Uzupełnienie luk w liniach, efekty świetlne Kontury, reprezentacja figury Interpretacja położenia Zaawansowane przetwarzanie - Funkcje wyobrażeniowe ne. Jednym z powodów takiego stwierdzenia jest aktywność czołowa (zwłaszcza kory oczodołowej) podczas poznawania konturów iluzorycznych (Stanley, Rubin 2003; Halgren i in. 2003). W ten sposób analizy procesów wyobrażeniowych podczas doznawania iluzji stają się bardziej skomplikowane, ale zarazem pojawia się wsparcie z modelu procesów wyobrażeniowych Kosslyna, w którym struktury czołowe (funkcje wykonawcze) decydują o realizacji wyobrażeń. Aktywność czołowa przy doznaniu obiektów iluzorycznych sugeruje silne związki analizy konturów iluzorycznych z systemami pamięci (Wallach, Slaughter 1988). Podobna aktywność pojawia się w przypadku rozpoznawania realnych obiektów, ale percepcyjnie zdegradowanych lub parcjalnych (Bar 2003). Jaki jest dokładnie mechanizm udziału struktur czołowych podczas doznawania obiektów iluzorycznych, nie wiadomo. Przypuszczalnie mózgowie traktuje obiekty iluzoryczne jako obiekty nietypowe, które wymagają dodatkowych analiz celem ich poznawczego opanowania, np. skonstruowania syntezy wyobrażeń automatycznie wywołanych na niższych poziomach przetwarzania informacji wizualnej. Niezależnie od dalszych ustaleń przyjęcie interpretacji wyobrażeniowej iluzji dostępnych na rys. 1 pozwala poszerzyć dotychczasowe funkcje sensoryczne/percepcyjne bufora wizualnego (rys. 2) o trzy dodatkowe funkcje wyobrażeniowe (rys. 4, prostokąty z przerywaną linią): uzupełnianie luk w liniach i uzupełnianie świetlne, tworzenie reprezentacji konturów i figury oraz interpretację położenia (interpretacja przestrzenna). Każda z wymienionych funkcji wyobrażeniowych jest konsekwencją towarzyszącej jej funkcji sensoryczno-percepcyjnej. Przykładowo, zapis podstawowych cech obiektu pozwala na wyobrażeniowe funkcje uzupełniające w zakresie linii i jasności. Jeśli zgodzimy się na taki scenariusz, to procesy wyobrażeniowe pojawiają się na bardzo wczesnym etapie analizy wizualnej. W przypad- Procesy wyobrażeniowe on-line Bodziec iluzyjny ⇒ Analiza sensoryczna Analiza percepcyjna Automatyczne wyobrażenia wizualne RYS. 5. 51 ⇒ Doznanie iluzji Analiza wizualna podczas doznawania iluzji ku obiektów 1-3 takie wyobrażenia powodują doznanie iluzji wizualnych podczas jednoczesnej rejestracji sensorycznej i percepcyjnej cech takich obiektów (rys. 5). Wówczas doświadczenie iluzji wizualnej jest skutkiem dołączonych operacji wyobrażeniowych do standardowych analiz sensoryczno-percepcyjnych ze względu na specyficzne (niekompletne) cechy bodźców. 4. Ekologiczna trafność wyobrażeń on-line Dlaczego system wizualny wprowadza procedury wyobrażeniowe do analiz sensorycznych i percepcyjnych? Aby odpowiedzieć na to pytanie warto najpierw zastanowić się nad znaczeniem zjawiska iluzji wizualnych. Wydaje się, że iluzje wizualne są modelem obiektów powszechnie dostępnych na co dzień, które przykrywa inny obiekt. W efekcie widzimy przedmioty tylko częściowo, w postaci widocznego elementu (np. przód samochodu wystający zza budynku) lub widocznych fragmentów (np. twarz widziana pomiędzy liśćmi krzewu). Prawdopodobnie wyobrażenia wizualne umożliwiają przede wszystkim szybkie uzupełnianie danych sensorycznych. Być może również jest to główny powód stosowania przewidywań (rekonstrukcji) wizualnych w przypadku niewidocznych części obiektów. Procesy automatycznego uzupełniania zmniejszają zakres możliwych interpretacji, gdyż system poznawczy reaguje bez przeprowadzania czasochłonnej analizy alternatywnych rozwiązań. Taka interpretacja wskazuje na silny wpływ warunków środowiskowych na wykształcenie zdolności wizualizacji niewidocznych własności widzianych obiektów, czego potwierdzeniem może powszechna zdolność rekonstrukcji iluzorycznych linii i prostych iluzorycznych figur w świecie zwierząt (Nieder 2002). A zatem stan iluzji jaki doznajemy patrząc 52 Piotr Markiewicz na rys. 1 jest śladem niezwykle silnej presji ewolucyjnej z jaką musieli zmierzyć się właściciele pierwotnych systemów wzrokowych. Być może wynikiem takiej presji jest realistyczne doznanie zjawiska iluzji wizualnej. Z uwagi na temat artykułu oznacza to, że iluzja wizualna lub wizualizacja niedostępnych percepcyjnie części percypowanego obiektu jest przykładem dysponowania zewnętrznymi atrybutami przez zasadniczo internalny mechanizm zwany wyobraźnią. Literatura Andrews, D. G. (2001). Neuropsychology: From Theory to Practice. New York: Hove. Bar, M. (2003). A Cortical Mechanism for Triggering Top-Down Facilitation in Visual Object Recognition Journal of Cognitive Neuroscience 15, s. 600–609. Bradley, D. (2001). Early Visual Cortex: Smarter than You Think, Current Biology 11, s. 95–98. Fahle, M. (2003). Failures of Visual Analysis: Scotoma, Agnosia, and Neglect. W: Fahle, M., Greenlee, M. (red.) The Neuropsychology of Vision. Oxford: Oxford University Press, s. 179–258. Farah, M. J., Soso, M. J., Dasheiff, R. M. (1992). The Visual Angle of the Mind’s Eye before and after Unilateral Occipital Lobectomy. Journal of Experimental Psychology: Human Perception and Performance 18, s. 241– 246. Ffytche, D. H., Howard, R. J. (1999). The Perceptual Consequences of Visual Loss: ’Positive’ Pathologies of Vision. Brain 122, s. 1247–1260 Fineman, M. (1996). The Nature of Visual Illusion. New York: Mineola. Francuz, P. (2007). Teoria wyobraźni Stephena Kosslyna. Próba reinterpretacji. W: Francuz, P. (red.) Obrazy w umyśle. Studia nad percepcją i wyobraźnią. Warszawa: Wydawnictwo Naukowe Scholar, s. 149–189. Francuz, P., Oleś, M. A., Chumak, M. (2008). Umysłowa rotacja obiektów semantycznych i asemantycznych umieszczonych w naturalnym kontekście. Przegląd Psychologiczny 51, s. 235–260. Halgren, E., Mendola, J., Chong, C. D. R, Dale, A. M. (2003). Cortical Activation to Illusory Shapes as Measured with Magnetoencephalography. NeuroImage 18, s. 1001–1009. Halligan, P. W., Fink, G. R., Marshall, J. C., Vallar, G. (2003). Spatial Cognition: Evidence from Visual Neglect. Trends in Cognitive Sciences 7, s. 125–133. Heydt, von der, R. (2003). Image Parsing Mechanisms of the Visual Cortex. W: Chalupa, L.M., Werner, J.S. (red.) The visual neurosciences. Cambridge, MA: The MIT Press, s. 1139–1150. Herzyk, A. (2005). Osobliwości w działaniu mózgu. W: Jodzio, K. (red.) Neuronalny świat umysłu. Kraków: Wydawnictwo Impuls, s. 63–89. Kaski, D. (2002). Revision: Is Visual Perception a Requisite for Visual Imagery? Perception 31, 717–731. Procesy wyobrażeniowe on-line 53 Kellman, P. J. (2003). Visual Perception of Objects and Boundaries: A Four-Dimensional Approach. W: Kimchi, R., Behrmann, M., Olson, C.R. (red.). Perceptual Organization in Vision: Behavioral and Neural Perspectives. Mahwah, NJ: Lawrence Erlbaum Associates, s. 155–201. Kim, C. Y., Blake, R. (2005). Psychophysical Magic: Rendering the Visible ‘Invisible’. Trends in Cognitive Sciences 9, s. 381–388. Kosslyn, S. M. (2005). Mental Images and the Brain. Cognitive Neuropsychology 22, s. 333–347. Kosslyn, S. M., Shephard, J. M., and Thompson, W. L. (2007). The Neurofunctional Organization of Late Visual Processing: Imagery as ”Inner Perception”. W: Mast, F., Jancke, L. (red.) Advances in Studies of Mental Imagery. New York: Springer, s. 1–16. Kosslyn, S. M., Sukel, K. E. and Bly, B. M. (1999). Squinting with the Mind’s Eye: Effects of Stimulus Resolution on Imaginal and Perceptual comparisons. Memory and Cognition 27, s. 276–287. Markiewicz, P. (2008). Iluzje wzrokowe i automatyczne procesy wyobrażeniowe. W: Wróbel, S. (red.) Utajone funkcje umysłu. Poznań – Kalisz: WPA UAM, s. 179–218. May, J. G., Brown, J. M., Roberts, S. (1999). Afterimages, Grating Induction and Illusory Phantoms. Vision Research 39, s. 3025–3031. Mesulam, M. M. (1998). From Sensation to Cognition. Brain 121, s. 1013– 1052. Najder, K. (1993). Reprezentacja poznawcza we współczesnej psychologii. W: Kurcz, I. (red.) Psychologia a semiotyka. Pojęcia i zagadnienia. Warszawa: Polskie Towarzystwo Semiotyczne, s. 142–150. Nieder, A. (2002). Seeing More than Meets the Eye: Processing of Illusory Contours in Animals, Journal of Comparative Physiology A: Neuroethology, Sensory, Neural, and Behavioral Physiology 188, s. 249–260. Palmer, S. E. (2003). Visual Perception of Objects. W: Healy, A.F., Proctor, R.W. (red.) Handbook of Psychology, t. 4, Experimental Psychology. New Jersey Hoboken, 2003, s. 179–221. Schiller, P. H., Carvey, C. E. (2005). The Hermann Grid Illusion Revisited. Perception 34, s. 1375–1397. Spillmann, L. Dresp, B. (1995). Phenomena of Illusory Form: Can We Bridge the Gap between Levels of Explanation? Perception 24, s. 1333–1364. Stanley, D., Rubin, N. (2003). fMRI Activation in Response to Illusory Contours and Salient Regions in the Human Lateral Occipital Complex. Neuron 37, s. 323–331. Thomas, N. J. T. (1999). Are Theories of Imagery Theories of Imagination? An Active Perception Approach to Conscious Mental Content. Cognitive Science 23, s. 207–245. Tong, F. (2003). Primary Visual Cortex and Visual Awareness. Nature Reviews Neuroscience 4, s. 219–229 Wallach, H., Slaughter, V. (1988). The Role of Memory in Perceiving Subjective Contours. Perception & Psychophysics 43, s. 101–106. Widzieć krawędzie, dotykać głębi, czyli współczesne rozważania dotyczące pytania Molyneux Adriana Schetz Uniwersytet Szczeciński Instytut Filozofii Streszczenie. William Molyneux w liście kierowanym do Johna Locke’a zapytał, czy osoba, która była niewidoma od urodzenia, jest w stanie po odzyskaniu wzroku odróżnić sześcian od kuli, tzn. bryły, które były jej znane wcześniej wyłącznie dotykowo? Przegląd współczesnych rozważań dotyczących pytania Molyneux prowadzi do spostrzeżenia, że nie bez znaczenia dla omawianej kwestii pozostają empiryczne badania nad percepcją, niemniej wielu autorów podkreśla, iż pomimo niewątpliwej pomocy ze strony nauki, problem Molyneux jest z zasady nieempiryczny i ostatecznie jego rozwiązanie wynika z czysto teoretycznego namysłu. Celem niniejszego artykułu jest wykazanie, że świadectwa empiryczne są niezastąpione przy próbie rozwiązania problemu Molyneux. Odwołuję się do danych na temat percepcji u osób niewidomych od urodzenia. Analizując argumentację G. Evansa przeciwko pozytywnej odpowiedzi na pytanie Molyneux oraz posiłkując się analizą S. Gallaghera na rzecz stanowiska przeciwnego, staram się wykazać, że informacje o kształcie przedmiotów są kodowane w odmienny sposób w zależności od kanału sensorycznego, którym docierają do mózgu. Mówiąc krótko, informacja o kształcie widzianym i odczuwanym dotykowo ma charakter modalny. 7 lipca 1688 roku prawnik z Dublina William Molyneux w liście kierowanym do Johna Locke’a zapytał, czy osoba, która była niewidoma od urodzenia, jest w stanie po odzyskaniu wzroku odróżnić sześcian od kuli, tzn. bryły, które były jej znane wcześniej wyłącznie dotykowo? Zagadnienie to znane obecnie pod nazwą pytania lub problemu Molyneux doczekało się wielu rozwiązań, z których tylko bardzo nieliczne wskazywały na taką umiejętność. W czasach nowożytnych niemal wszyscy filozofowie poza Leibnizem uporczywie dowodzili, że kształt widziany jest czymś odmiennym od kształtu danego za pomocą zmysłu dotyku. W oparciu o to spostrzeżenie wysuwali oni przekonanie, które posłuStudia z Kognitywistyki i Filozofii Umysłu, 3: 55–79, 2009 c 2009 Adriana Schetz Copyright 56 Adriana Schetz gując się współczesną terminologią można wyrazić w twierdzeniu, iż informacje o kształcie przedmiotów są kodowane w odmienny sposób w zależności od kanału sensorycznego, którym docierają do mózgu. Mówiąc krótko, informacja o kształcie widzianym i odczuwanym dotykowo ma charakter modalny. Współcześnie za najbardziej znanego obrońcę tezy przeciwnej uważa się Garetha Evansa, który w głośnym artykule przedstawia swoją strategię pozytywnej odpowiedzi na pytanie Molyneux (por. Evans 1985). Przegląd współczesnych rozważań dotyczących pytania Molyneux prowadzi do bardziej ogólnego spostrzeżenia. Mianowicie, nie bez znaczenia dla omawianej kwestii pozostają empiryczne badania nad percepcją, niemniej wielu autorów podkreśla, iż pomimo niewątpliwej pomocy ze strony nauki, problem Molyneux jest z zasady nieempiryczny i ostatecznie jego rozwiązanie wynika z czysto teoretycznego namysłu (por. Baumann 2004). W związku z powyższym zacznę od ustalenia, o co dokładnie Molyneux pytał Locke’a. Analizę samego sformułowania problemu Molyneux podejmę w pierwszej części tekstu. Następnie w oparciu o dane empiryczne uzyskane w psychologicznych badaniach nad percepcją, postaram się uzasadnić tezę, że dane dotyczące eksperymentów z percepcją u osób niewidomych od urodzenia stanowią cenne oraz niezastąpione źródło odpowiedzi na pytanie Molyneux. W trzeciej części niniejszego opracowania krótko omówię stanowisko Evansa, jako konkurencyjne względem rozwiązania przeze mnie zaproponowanego. Na koniec podsumuję efekt swoich analiz. Proponowane przeze mnie rozwiązanie problemu Molyneux podtrzymuje przekonanie nowożytnych filozofów o modalnym charakterze percepcji kształtu i jednocześnie przemawia za doniosłością dla filozofii empirycznych badań nad modalnością zmysłową. Swoją argumentację wesprę analizą prezentowaną przez Shauna Gallaghera. 1. Ile jest problemów Molyneux? Molyneux następująco przedstawia swój problem Locke’owi: Przypuśćmy, że istnieje człowiek od urodzenia niewidomy a obecnie dorosły i wyuczony dotykiem rozróżniania między sześcianem a kulą wykonanymi z tego samego metalu oraz posiadającymi niemal identyczną wielkość [...]. Załóżmy następnie, że sześcian i kulę położono na stole a osoba ta odzyskuje wzrok. Ciekawe, czy w oparciu o to, co widzi, zanim ich dotknie, mogłaby teraz odróżnić i powiedzieć, która jest kulą, a która sześcianem (Locke 1975, s. 146). Widzieć krawędzie, dotykać głębi 57 Powstaje pytanie, czy mowa tu o jednym problemie, czy też może o wielu powiązanych ze sobą zagadnieniach, z których każde wymaga osobnego namysłu. W każdym razie należy ustalić, o co dokładnie pyta Molyneux. Obecnie problem Molyneux podejmuje kilku autorów należących do tradycji filozofii analitycznej i są to głównie: Peter Baumann (2004), John Campbell (2005), S. Gallagher (2005), Robert Hopkins (2005) oraz J. Riskin (2002) i M. Degenaar (1996). Peter Baumann wskazuje na cztery możliwe interpretacje pytania prawnika z Dublina: 1. Jakiego rodzaju są doświadczenia wzrokowe osoby opisanej przez Molyneux? 2. Czy osoba opisywana przez Molyneux potrafiłaby na mocy samego doświadczenia wzrokowego odróżnić i powiedzieć, która bryła jest sześcianem, a która jest kulą? 3. Czy osoba opisywana przez Molyneux potrafi stosować pojęcia sześcianu i kuli, (które nabyła za pomocą zmysłu dotyku), polegając wyłącznie na swoim nowym doświadczeniu, tj. doświadczeniu wzrokowym? 4. Czy osoba opisywana przez Molyneux potrafi stosować pojęcia sześcianu i kuli, (które nabyła za pomocą zmysłu dotyku), polegając na swoim nowym doświadczeniu (tj. doświadczeniu wzrokowym) oraz rozumowaniu apriorycznym? Pierwsze pytanie nazwijmy pytaniem o naturę doświadczenia percepcyjnego, drugie pytaniem o odróżnialność na mocy doświadczenia percepcyjnego, trzecie pytaniem o stosowanie na mocy doświadczenia percepcyjnego pojęć percepcyjnych, zaś czwarte pytaniem o stosowanie na mocy doświadczenia oraz rozumowania apriorycznego pojęć percepcyjnych. Zaczynając od pierwszej interpretacji, odnotujmy jedynie, że Baumann przechodzi szybko obok niej stwierdzając, że nie o to pytał Locke’a prawnik z Dublina. Jednakże pytanie o naturę doświadczenia percepcyjnego charakterystycznego dla poszczególnych modalności zmysłowych uważam za nieuniknione. W stosownym momencie odwołam się do badań nad osobami niewidomymi, gdyż jak postaram się to pokazać, studium tego przypadku jest niezmiernie istotne dla prowadzonych tu rozważań. W chwili obecnej, choć zgadzam się z Baumannem, że interpretacja 1-sza nie oddaje sedna pytania Molyneux, to uważam, że stanowi ona eksplicytne wyrażenie najbardziej podstawowej warstwy problemu Molyneux, stanowi bowiem pytanie o treść nowego doświadczenia percepcyjnego. W odniesieniu do drugiej interpretacji w rzeczywistości mamy do czynienia z dwiema kwestiami. Po pierwsze, czy osoba opisywana przez Molyneux potrafiłaby odróżnić od siebie wskazane bryły, zaś po drugie, 58 Adriana Schetz czy potrafiłaby wskazać, która z brył jest sześcianem, a która kulą. Nie są to pokrywające się zagadnienia, na co także zwraca uwagę Baumann. Wydaje się bowiem, że można posiadać umiejętność odróżniania od siebie pewnych cech bez jednoczesnej ich konceptualizacji. Jako przykład może posłużyć eksperyment z paletą barw. Bardzo podobne do siebie odcienie są często bez większych problemów odróżniane przez badanych pomimo, iż nie potrafią oni wskazać z jakiego rodzaju odcieniami mają do czynienia. Co więcej, umiejętność rozpoznawania obiektów jako identycznych czy choćby podobnych jest wysoce bardziej skomplikowana aniżeli umiejętność stwierdzania różnicy między nimi. Interpretacja 2-ga nie wspomina jednak nic na temat dyspozycji pojęciowych, bez analizy których nie sposób podjąć wymienione kwestie. W związku z powyższym spostrzeżeniem powinniśmy spróbować zinterpretować pytanie Molyneux w duchu 3-ciej możliwości. W świetle tej interpretacji punktem ciężkości problemu prawnika z Dublina jest zagadnienie stosowania pojęć na mocy doświadczenia percepcyjnego. Zakłada się, że osoba opisywana przez Molyneux dysponuje pojęciem sześcianu i kuli nabytym wyłącznie w oparciu o doświadczenie dotykowe, a następnie dywaguje się, czy potrafi ona tak urobione pojęcie zastosować do informacji napływających wzrokowym kanałem sensorycznym. Kwestia dopiero teraz zaczyna robić się naprawdę ciekawa. Zgadzam się z Baumannem, że taka interpretacja nie przesądza, iż Molyneux zakładał modalny charakter percepcji, zresztą jego list do Locke’a dowodzi, że raczej starał się to dopiero ustalić. Pytanie o to, czy mamy do czynienia z tymi samymi pojęciami sześcianu i kuli w przypadku nabywania ich dotykowym kanałem sensorycznym oraz wzrokowym kanałem sensorycznym jest otwarte. Proponuję nieco skomplikować interpretację 3-cią tak, by uniknąć oskarżenia o uproszczenie problemu, którego złożoność dostrzegali już nowożytni filozofowie. Dodatkowe dane pochodzą od jednego z nich, mianowicie George’a Berkeley’a. Berkeley zaproponował „odwrócony problem Molyneux”: Przypuśćmy, że jest człowiek urodzony bez zmysłu dotyku, a obecnie dorosły i wyuczony za pomocą wzroku rozróżniać sześciany i kule [...]. Załóżmy teraz, że zamieniamy na stole sześcian z kulą a człowiek ten ich dotyka [...]. Ciekawe czy za pomocą dotyku, zanim je zobaczy mógłby odróżnić i powiedzieć, które jest kulą, a które sześcianem (za: Baumann 2004, s. 171). Berkeley, który na oryginalne pytanie Molyneux udzielał negatywnej odpowiedzi w przypadku problemu odwróconego decyduje się na pozytywną odpowiedź. Rzecz w tym, że jeśli dana osoba ma percep- Widzieć krawędzie, dotykać głębi 59 cyjną reprezentację bardziej złożonych cech, a takie jest założenie odwróconego problemu Molyneux, to wydaje się, iż nie powinno dla niej stanowić poważnej trudności wywnioskowanie cech „skromniejszych” z tych bardziej złożonych lecz jakościowo współmiernych własności tego samego obiektu. Obiekt dany zmysłowi wzroku jest, w założeniu wielu autorów, reprezentowany jako bardziej złożony, niż obiekt reprezentowany w doświadczeniu dotykowym. Część własności pokrywa się jednak, zatem te „skromniejsze” można wywnioskować z tych „bardziej złożonych”. Takie spostrzeżenie nie mogło jednak być udziałem samego Berkeleya, który w ogóle odmawiał doświadczeniu wzrokowemu treści reprezentującej własności obiektów w świecie (por. Hopkins 2005, s. 447). Berkeley odmawiał wzrokowi roli determinanta treści, jego funkcję widział jednak w konstytuowaniu tego, co w filozofii nazywane jest charakterem fenomenalnym lub aspektem fenomenalnym (od łac. phenomenon — zjawisko). Chodzi o to, że kiedy podmiot doświadcza zmysłowo świata, można przypisać mu stan jak to jest dla niego świadomie doświadczać świata. Kiedy osoba x wącha kwiat magnolii, to jej doświadczenie zmysłowe ma istotnie subiektywny aspekt: kwiat magnolii jawi się jej świadomości jako pachnący w określony sposób. Filozofowie uważają, że ów subiektywny aspekt nazywany charakterem czy aspektem fenomenalnym stanowi istotę doświadczenia percepcyjnego. Zmianie modalności zmysłowej towarzyszy, zdaniem Berkeley’a, zmiana charakteru fenomenalnego doświadczenia percepcyjnego. Istnieje jakościowa różnica fenomenalna dla podmiotu percepcji między spostrzeganiem zapachu kwiatu magnolii a wzrokowym spostrzeżeniem kwiatu magnolii oraz dotykowym doświadczaniem jego kształtu i faktury. Zdanie to nie jest obecnie zbyt powszechne wśród filozofów zajmujących się problemami percepcji. Zazwyczaj uznaje się, że charakter fenomenalny jest czymś obok treści doświadczenia percepcyjnego lub, że stanowi jej nierozerwalny aspekt. Istnieją również próby redukcji charakteru fenomenalnego do treści doświadczenia percepcyjnego, które można uznać za w pełni udane. Przez treść doświadczenia percepcyjnego rozumie się to, o czym jest doświadczenie percepcyjne. Jeśli spostrzegam wzrokowo kwiat magnolii, to moje doświadczenie jest o kwiecie określonej barwy i kształtu rosnącym na drzewie, a nie wyrastającym bezpośrednio z ziemi, itp. Wszystko to widzę i wszystko to stanowi treść mojego doświadczenia. Treść doświadczenia percepcyjnego bywa często utożsamiana z własnościami samego przedmiotu danego w percepcji. Wracając do „odwróconego problemu Molyneux”, jego przywołanie pozwala na sformułowanie następującej refleksji: problem Molyneux staje się intrygujący i przyjemnie kłopotliwy dopiero wówczas, gdy wy- Adriana Schetz 60 znacza się dla niego nieco szerszą bazę kontekstową, aniżeli odwołania do samego charakteru fenomenalnego doznań wzrokowych i dotykowych. Istotne znaczenie dla problematyczności pytania Molyneux ma treść spostrzeżenia wzrokowego oraz treść spostrzeżenia dotykowego, a nie podnoszenie niemal wyłącznie tego, jak to jest doznawać wzrokowo i dotykowo (czyli charakter fenomenalny doświadczenia). Tak jak Baumann uważam zatem, że ostatecznie należy przyjąć 4-tą interpretację problemu Molyneux. Interpretacja ta prawidłowo sytuuje rozważania nad modalnością zmysłową w obrębie z jednej strony sensorycznej treści doświadczenia percepcyjnego, z drugiej zaś strony w obrębie pojęciowej czy „apriorycznej” treści doświadczenia percepcyjnego. Pytając o to, czy osoba opisywana przez prawnika z Dublina mogłaby na drodze rozumowej, czyli apriorycznie ustalić, z jakimi bryłami ma do czynienia, wyraźnie kierujemy uwagę na powyższe dwa aspekty treści percepcyjnej. 2. Treść sensoryczna, treść aprioryczna, dane kliniczne i próba odpowiedzi na pytanie Molyneux Pojęcie treści sensorycznej funkcjonuje zarówno w literaturze psychologicznej, jak i filozoficznej. Na treść sensoryczną składają się wszystkie informacje, które docierają do świadomości kanałami sensorycznymi1 . Treść sensoryczna zmienia się w zależności od kanału sensorycznego. Aby nie rozstrzygać czysto definicyjnie, czy treść sensoryczna ma charakter modalny czy też jest amodalna, z jej zależnością od kanału sensorycznego wiążę jedynie fakt, że informacje o cechach obiektu są kodowane na rożne sposoby już na poziomie fizjologicznym. Dopiero w toku niniejszego opracowania zostanie ustalone, czy różnice w fizycznym kodowaniu informacji sensorycznych przekładają się na różnice w treści mentalnej czy umysłowej, a zatem ściśle percepcyjnej. Przykładem treści sensorycznej jest to, czego podmiot doznaje, gdy patrzy na kwiat magnolii, to czego podmiot doznaje, gdy wącha kwiat magnolii, itd. Doznanie nie jest utożsamiane ze spostrzeganiem. Spostrzeganie wymaga udziału treści apriorycznej w percepcyjnym kontakcie z otoczeniem. 1 Wyjaśnienia wymaga powiązanie treści sensorycznej ze świadomością, gdyż w świetle najnowszych badań nie ma już wątpliwości, że wiele „składników” treści sensorycznej ma charakter nieświadomy. Nie przeczę, że zagadnienie nieświadomej treści percepcyjnej może mieć ciekawe implikacje dla problemu Molyneux, niemniej ze względu na brak miejsca nie będę podejmować tych kwestii w tym artykule. Widzieć krawędzie, dotykać głębi 61 Nieco bardziej kontrowersyjna w porównaniu z pojęciem treści sensorycznej może wydawać się kategoria treści apriorycznej. Dobrze znane procesy aprioryczne takie jak rozumowania czy wnioskowania, a zatem procesy wiedzotwórcze nie oparte na doświadczeniu, z całą pewnością prowadzą do powstania innej, niż sensoryczna reprezentacji cech danego obiektu. Kiedy widzę ścianę i jej zwartą, szorstką strukturę, wnioskuję, iż nie uda mi się przez nią przejść. Przekonanie, iż ściana jest obiektem stawiającym bardzo silny opór ciału człowieka jest treściowo innym przekonaniem niż przekonanie, którego treść jest czysto sensoryczna, np. że ściana jest wykonana z mocnego, trwałego, twardego materiału. Przekonanie pierwszego rodzaju jest przykładem przekonania, które nazywam apriorycznym. Pomimo, że w procesie nabywania przekonań apriorycznych uczestniczą informacje sensoryczne (wiem, że nie przejdę przez mocną, trwałą i twardą strukturę, gdyż miałam doświadczenie takiej próby) lub/i wiedza (jestem przekonana w oparciu o rozmaite racje, że przedmiot taki jak ściana nie ulegnie pod naporem przedmiotu takiego jak ludzkie ciało), to mimo wszytko przekonania te stanowią oddzielny rodzaj w stosunku do przekonań sensorycznych. Różnica polega na tym, że przy danym zestawie informacji sensorycznych, pewne przekonania aprioryczne są niepodważalne pomimo, że nie wynikają logicznie z treści sensorycznych. Innymi słowy, treść doświadczeń sensorycznych wyznacza zbiór odpowiadających im treści apriorycznych, chociaż nie konstytuuje ich na drodze wynikania logicznego. Treści aprioryczne doświadczenia percepcyjnego wynikają logicznie ze zbioru koniecznych warunków przypisywanych doświadczeniu percepcyjnemu. Do elementów zbioru takich warunków należą np. przekonania o tym, że każdy przedmiot posiadający kształt, ma zarazem swoją wielkość; że dwa przedmioty, z których jeden jest większy od drugiego są różnej wielkości, że jeżeli a jest podobne do b i b jest podobne do c, to a nie musi być podobne do c, itd. Zatem, przekonanie aprioryczne, że znajdująca się na wprost mnie ściana nie zawali się pod wpływem naporu mojego ciała nie wynika logicznie z doświadczeń sensorycznych chłodnego, twardego i gładkiego kontinuum, którym dla mojego zmysłu dotyku i wzroku jest płaszczyzna tej ściany. Wynika natomiast z pewnych warunków, które musi spełniać treść doświadczenia by można było ją określić mianem treści percepcyjnej. Mogą to być nawet pewne prawa fizyki (tutaj np. prawo dynamiki), które funkcjonują jako zasady aprioryczne. Informacje sensoryczne w jakiś pozalogiczny sposób (może przyczynowy, albo skojarzeniowy, itp.) determinują zbiór przekonań apriorycznych. Różnica w treści doświadczenia sensorycznego i treści przekonania apriorycznego jest jednak na tyle istotna, że nie mogą zachodzić miedzy nimi relacje logiczne. Relacje logiczne mogą za- 62 Adriana Schetz chodzić jedynie miedzy przekonaniami. Doświadczenia sensoryczne nie są przekonaniami. Przejdźmy teraz do przybliżenia danych dotyczących przypadków klinicznych istotnych dla rozwiązania problemu Molyneux. Najwcześniejsze dane dotyczą osoby, której udało się w wyniku interwencji chirurgicznej przywrócić wzrok. Pochodzą z 1728 roku i zostały opublikowane przez Williama Cheseldena, specjalistę od anatomii, chirurga i zarazem osobistego lekarza angielskiej królowej Karoliny Wilhelminy Brandenburg-Ansbach. Cheselden w artykule o barokowym tytule, którego przekład na język polski brzmi: Ocena pewnych obserwacji poczynionych przez młodego dżentelmena, który urodził się niewidomy lub który stracił swój wzrok na tyle wcześnie, że nie pamięta aby kiedykolwiek widział i który został przebadany między 13 a 14 rokiem życia, opisuje przypadek chłopca, któremu po operacji katarakty udało się w dużym stopniu przywrócić wzrok (por. Cheselden 1728, s. 44750). Cheselden pisze, że chłopiec kiedy pierwszy raz przejrzał na oczy nie był w stanie sformułować żadnego przekonania na temat odległości względem przedmiotów. Choć nie przedstawiono mu kuli i sześcianu, wykonano podobny eksperyment z udziałem kota i psa. Oba zwierzęta chłopiec bez kłopotu odróżniał za pomocą dotyku jeszcze przed operacją. Po odzyskaniu wzroku nie potrafił wskazać, które zwierzę jest psem, a które kotem. Dziś doniesienia Cheseldena można potraktować jedynie jako ciekawostkę z zakresu historii medycyny. Nie sposób przypisać im wartości poznawczej, gdyż nie są znane istotne szczegóły, np. wiadomo, że okres pooperacyjny w wypadku korekty katarakty jest bardzo istotny w nabywaniu wiedzy o widzianych przedmiotach. Nie wiemy, kiedy dokładnie przeprowadzono operację i czy chłopiec uczył się wiązania danych wzrokowych z dotykowymi. Nieznanym pozostaje także szczegół dotyczący stopnia, w jakim udało się przywrócić wzrok. Fakt, że chłopiec nie potrafił wskazać różnicy między pasem a kotem mógł np. wynikać z tego, że nie widział wystarczająco wyraźnie. Warto odwołać się zatem do przypadków stosunkowo dobrze znanych i współcześnie dostępnych. Niemniej warto zaznaczyć, że są one raczej nieliczne2 . Najdokładniejsze dane pochodzą z zabiegów usunięcia katarakty, przeszczepu rogówki oraz wszczepienia osteo-odonto-kerato-protezy. Nieistotne dla omawianego zagadnienia pozostają szczegóły samych zabiegów, zatem je pominę. Ważne są następujące informacje związane z powrotem pacjentów do zdrowia: (1) odzyskiwanie wzroku ma postać 2 Jak wskazują Jacomuzzi, Kobau i Bruno wskazuje się na zaledwie około 10 dobrze udokumentowanych przypadków przywrócenia wzroku (por. Jacomuzzi, Kobau i Bruno 2003, s. 260). Widzieć krawędzie, dotykać głębi 63 procesu stopniowego, (2) wiąże się z bólem fizycznym oraz stresem, (3) pobudzenie komórek receptorowych siatkówki jest zmienne w zależności od etapu przebiegu procesu powrotu do zdrowia, (4) uogólniając można powiedzieć, że pacjenci zaczynają z pewnym powodzeniem postrzegać figury dwuwymiarowe po upływie co najmniej jednego miesiąca od operacji. Specjaliści w zakresie operacyjnego przywracania wzroku są raczej zgodni, że okres co najmniej jednego miesiąca pokrywa się z czasem niezbędnym na wygojenie ran pooperacyjnych oraz psychicznym dojściem do siebie pacjenta. Zaznaczają, że w okresie tym nie istnieje możliwość stwierdzenia, jaki wpływ na sposób wzrokowego postrzegania ma trauma pooperacyjna, a co stanowi wynik uczenia się wiązania ze sobą rozmaitych bodźców: wzrokowych, ruchowych, dotykowych oraz wiedzy (por. Jacomuzzi, Kobau i Bruno 2003, s. 262). Pomimo tej pesymistycznej prognozy są pewne dane, które wydają się pomocne przy próbie odpowiedzi na pytanie Molyneux. Mam na myśli obserwacje dostarczane przez specjalistów nauczających rysunku oraz rzeźby osoby niewidome. W Polsce istnieje wielu znawców tego tematu. Informacje, które znajdują się w przygotowanych przez nich opracowaniach stanowią podstawę empiryczną rozwiązania problemu Molyneux, które zamierzam zaproponować. Zacznijmy od prezentacji podstawy empirycznej. Proponowanej przeze mnie negatywnej odpowiedzi na pytanie Molyneux towarzyszy kilka założeń, które wyartykułuję, by uniknąć zarzutu niejasności oraz entymematyczności argumentacji. Nie będę omawiać i rozwijać tych założeń, gdyż opierają się one na ideach znanych dość powszechnie w literaturze przedmiotu i raczej intuicyjnie inteligibilnych. Pierwsza przesłanka głosi, że wyobraźnia percepcyjna, tzn. wyobrażeniowe przedstawienie sobie stanu percepcyjnego danego rodzaju jest możliwe dzięki uprzedniemu doświadczeniu egzemplarza tego stanu w rzeczywistej percepcji. Chodzi więc o to, że mogę wyobrazić sobie, że widzę powiedzmy błękitny sześcian i amarantową kulę, jeżeli kiedykolwiek wcześniej rzeczywiście widziałam coś sześciennego, coś kulistego, coś błękitnego oraz coś amarantowego. Jest to założenie empiryzmu genetycznego. Drugie założenie opiera się na percepcyjnym modelu wyobraźni percepcyjnej (por. Francuz 2007, ss. 149-89). W ramach tego modelu w oparciu o ustalenia dokonane w wyniku eksperymentów z tzw. skaningiem umysłowym oraz rotacjami umysłowymi głosi się ścisłą zależność między mechanizmami i wiedzą percepcyjną a mechanizmami i wiedzą związaną z wyobrażaniem sobie doświadczenia percepcyjnego. Skaning umysłowy polegający na wyobrażaniu sobie np. przenoszenia określonego ciężaru zapamiętaną uprzednio trasą, dość wyraźnie wskazuje na zależność między rzeczywistym postrzeganiem 64 Adriana Schetz w czasie wykonywania takiego zadania, a wyobrażonym wykonywaniem takiego zadania. Co do rotacji umysłowych istnieje wiele danych podważających zasadność wniosku, że model percepcyjny ma tu zastosowanie do wyobrażonej rotacji figur geometrycznych. Nie mam tu miejsca na rozwinięcie tego wątku. Uważam jednak, że dane ze skaningu umysłowego wystarczają na potwierdzenie przynajmniej słabej wersji modelu percepcyjnego wyobraźni percepcyjnej, tj. teorii, zgodnie z którą przynajmniej część mechanizmów oraz jakaś istotna część wiedzy percepcyjnej jest wykorzystywana podczas wyobrażania sobie doświadczenia percepcyjnego. Trzecia przesłanka opiera się na spostrzeżeniu, że zależność wyobraźni od percepcji nie jest jednostronna, gdyż doświadczenie percepcyjne jest niejako nasycone wyobraźnią percepcyjną. Jest to szczególnie widoczne w enaktywnym czy sensomotorycznym modelu percepcji wywodzącym się z prac Jamesa J. Gibsona (por. Gibson 1979). Stawianie hipotez co do własności widzianych przedmiotów, np. niezmienność i jednolitość barw (tzw. stałość koloru) są świetnym potwierdzeniem słuszności tego założenia. Enaktywizm jest teorią, której zwolennicy przypisują decydującą rolę wiedzy proceduralnej w konstytuowaniu procesu percepcji. Zależności między informacjami z otoczenia organizmu w połączeniu z równie istotnymi informacjami z proprioreceptorów tworzą wiedzę na temat tego, jak pobudzenia zmysłowe zależą od ruchu. W związku z tym, że owa wiedza ma charakter proceduralny, a nie deklaratywny — czyli, że jest to wiedza jak, a nie wiedza, że — proces percepcji nie wymaga nabywania reprezentacji umysłowych sceny percepcyjnej. Enaktywizm jest teorią, która w przełożeniu na nomenklaturę filozoficzną jest rodzajem realizmu bezpośredniego w kwestii percepcji. Przechodzę teraz do argumentu na rzecz negatywnej odpowiedzi na pytanie Molyneux. Zarówno osoby przeszkolone do pracy artystycznej z osobami niewidomymi, jak i te, które obcują z niewidomymi na co dzień obserwując ich zmagania z życiem w przeważającej liczbie zgadzają się ze sobą, że: Poznawanie rzeczywistości w przypadku osób niewidomych jest utrudnione i zubożone o wrażenia wizualne. U osób niewidomych poznawanie rzeczywistości i zjawisk odbywa się dzięki zjawisku kompensacji, czyli zastępowania uszkodzonych zmysłów innymi sprawnie działającymi, głównie słuchem i dotykiem. [...] Dotyk zaczyna od eksploracji punktowej, aby następnie dojść do całości. Ponieważ percepcja dotykowa jest fragmentaryczna, to wymaga ona syntezy końcowej do odtwarzania przedmiotu jako całości. Na całość zaś komponują się różne, sukcesywnie poznawane elementy. Należy podkreślić, że dotykowe poznawanie przedmiotu (od szczegółu do ogółu) jest procesem trudnym i dającym wiele niejasnych informacji (Paplińska 2008, s. 16-17). Widzieć krawędzie, dotykać głębi 65 W świetle teorii enaktywnej właściwie nie istnieje istotna jakościowa różnica sugerowana w powyższym cytacie pomiędzy reprezentacjami własności obiektów przez odmienne kanały sensoryczne. Tak, jak aby uzyskać reprezentację dotykową danego obiektu trzeba się zmierzyć z „procesem trudnym i dającym wiele niejasnych informacji”, tak też sytuacja ta powtarza się w przypadku pozostałych zmysłów, także zmysłu wzroku. Machowska idea percepcji porównywanej do aparatu fotograficznego dostarczającego „oku umysłu” gotowych zdjęćreprezentacji sceny percepcyjnej jest nieporozumieniem już dawno obalonym przez Gibsona. Gibson wykazał, że pomiędzy poszczególnymi zmysłami zachodzi bardzo istotna wymian informacji. Koncentrował się na zmyśle wzroku i podał szereg argumentów na rzecz tezy, że widzenie przestrzenne, tj. wzrokowe spostrzeganie głębi, trójwymiarowości przestrzeni oraz figur przestrzennych i płaskich jest co najmniej w równej mierze konstytuowane przez zmysł wzroku, co przez zmysł dotyku oraz informacje pochodzące z proprioreceptorów. Nie ma miejsca, aby przytaczać te argumenty, zatem nie będę dowodzić słuszności teorii enaktywnej. Warto jednak wspomnieć, że oczywiście teoria ta, jak każda inna ma swoich przeciwników, do których należą m.in. Jerry A. Fodor i Zenon W. Pylyshin (por. Fodor i Pylyshyn 2004). Autorzy ci krytykują jednak przede wszystkim ten wątek teorii enaktywnej, w którym zaprzecza się istnieniu reprezentacji percepcyjnych. Ponieważ jednak teoria enaktywna może funkcjonować bez większego szwanku bez tej idei, krytykę Fodora i Pylyshyna można uznać za mało dla niej krzywdzącą. Wracając do wątku wymiany informacji między zmysłami, w przytoczonej wypowiedzi jest mowa o kompensacji. Pojecie kompensacji sugeruje, że istnieje możliwość odbioru informacji specyficznych dla danego kanału sensorycznego kanałem niespecyficznym. Np. informacja o odległości x-a od ściany zamiast być kodowana przez zmysł wzroku, może być kodowana przez zmysł słuchu, tj. poprzez kodowanie dźwięku laski uderzającej o grunt. Zjawisko kompensacji nie jest jednak interesujące z filozoficznego punktu widzenia dla problemu Molyneux. Rzecz w tym, że skoro zmysł słuchu, albo zmysł dotyku może kompensować zmysł wzroku, to fakt ten oznacza jedynie, że informacja odbierana tymi zmysłami jest podobna; a to nic nowego. W każdym podręczniku do psychologii poznawczej znajdziemy wzmianki na temat informacji, które mogą i tych, które nie mogą być kodowane przez poszczególne kanały sensoryczne (np. fal radiowych nie można zobaczyć). Nie oznacza to jednak, że własności obiektów w świecie sprowadzają się wyłącznie do tych, które w postaci takiej wspólnej informacji są dostępne rożnym kanałom sensorycznym. Konkluzja ta jest podstawą do negatywnej od- 66 Adriana Schetz powiedzi na pytanie Molyneux. W związku z tym, że stanowi ona sedno mojej argumentacji wyartykułuje ją jeszcze raz: z faktu, że pewne informacje o własnościach obiektów są kodowane przez różne kanały sensoryczne nie wynika jeszcze, że obiekty te mają wyłącznie te wspólnie kodowane własności. Innymi słowy, amodalność informacji sensorycznej nie oznacza jeszcze amodalności apriorycznej czy pojęciowej. O słuszności powyższego wniosku świadczy m. in. uwaga zawarta w cytowanym powyżej tekście. Mianowicie, że dotyk rejestruje punktowe informacje sensoryczne, które następnie w określony sposób umysł „zbiera w całość”. Oczywiście można twierdzić, że informacje dostarczane przez zmysł wzroku, również w pewnym analogicznym sensie są punktowe. Wydaje mi się jednak, że zachodzi pewna bardzo istotna różnica między punktowym charakterem dotyku u osoby niewidomej a punktowym charakterem wzroku u osoby widzącej. Aby to wyjaśnić przeanalizujmy następujące wypowiedzi: Z trudnościami w poznawaniu przedmiotów i zjawisk przez osoby niewidome związane są problemy w rozumieniu pojęć, zwłaszcza przestrzennych. Przestrzeń jest nieodłącznym elementem życia każdego człowieka. W niej umieszczamy siebie, inne osoby i przedmioty, w niej się poruszamy. Nasze wyobrażenie przestrzeni zależy od umiejętności równoczesnego lokalizowania przedmiotów znajdujących się w niej z zachowaniem istniejących między nimi stosunków. W ten sposób rozwijamy w sobie strukturę przestrzeni, w której umieszczamy każdy z tych przedmiotów [...]. Przemieszczając się dziecko napotyka najpierw obiekt A, potem obiekt B, później C, itd. Napotykane przedmioty pozostają w umyśle dziecka w relacji czasowej, a nie przestrzennej względem niego i innych obiektów. Wynikają z tego problemy z rozumieniem pojęć odnoszących się do relacji czaso-przestrzennych (Paplińska 2008, s. 17-18). Brak zmysłu wzroku ogranicza poznanie przestrzeni, uniemożliwia percepcję barw i światła oraz docieranie do kształtów przedmiotów znajdujących się poza zasięgiem ręki (Niestorowicz 2007, s. 25). Pomimo, że drugi z przytoczonych fragmentów jest znacznie bardziej zwięzły od pierwszego, zawarte w nim sformułowanie „kształt przedmiotów znajdujących się poza zasięgiem ręki” jest najważniejszym wspornikiem mojej argumentacji za negatywną odpowiedzią na pytanie Molyneux. Zacznę jednak od cytatu pierwszego. Osoba niewidoma posługując się zmysłem dotyku kompensując brak wzroku słuchem nabywa pojęcia przestrzenne w oparciu o zasadniczo odmienne mechanizmy. Jak podkreśla autorka pierwszego z przytoczonych cytatów, relacja następstwa przestrzennego między przedmiotami jest reprezentowana u osób niewidomych w oparciu o mechanizm czaso- Widzieć krawędzie, dotykać głębi 67 wy. Przedmiot A nie jest przed przedmiotem B, ale jest wcześniejszy od przedmiotu B. Specjaliści od rysunku wypukłego dla niewidomych opierając się na swoich doświadczeniach z uczeniem niewidomych rysunku opracowali szereg zasad, których należy przestrzegać tworząc rysunki dla niewidomych, jeśli mają być one dla nich czytelne. Oto niektóre z tych zasad. Pierwsza to zasada sformułowana we Wnioskach i zaleceniach Międzynarodowej Konferencji n. t. Rysunku Wypukłego dla Niewidomych z 1984 roku w Berlinie: Wiedza i doświadczenie wykazują jak przedstawiać rzeczywistość na rysunku wypukłym. Należy brać pod uwagę, że reprezentacja dotykowa nie powinna być prostą reprodukcją fotografii lub rysunku, który ma sens dla człowieka widzącego, lecz powinna być specjalnie przygotowana dla niewidomego. Pozostałe zasady doskonale są omówione w literaturze dotyczącej badań nad rysunkiem dla niewidomych. Najważniejsze z nich instruują, że wypukła linia rysunku powinna być kropkowana, czyli przerywana, gdyż osoba niewidoma dzięki temu łatwiej kontroluje długość, czyli w przypadku niewidomych czas, pokonywanego odcinka. Zadanie to jest utrudnione, gdy linia jest po prostu gładka i ciągła, gdyż „łatwiej się ją pokonuje” dotykiem. Ponadto przedmioty na złożonym rysunku nie powinny się wzajemnie przesłaniać, powinny być pozbawione nieistotnych cech (np. ozdobników, które niekiedy uniemożliwiają prawidłowe odczytanie informacji), zaś cechy istotne winny być akcentowane fakturą i wielkością (np. pies powinien mieć duży łebek, łapy i ogon). Dodaje się również, że: Nie jest celowe przekazywanie niewidomemu informacji rysunkiem perspektywicznym, rysunkiem w rzucie ukośnym (aksonometrycznym), gdyż konwencje te są zbyt trudne w odbiorze dotykowym (Więckowska 2003, s. 82). Konwencje przestrzenne są, jak pouczają specjaliści od rysunku dla niewidomych, niezrozumiałe dla osoby, która nie może zobaczyć bryły w perspektywie wzrokowej. Uważam, że podstawowy problem polega na tym, że punktowość zmysłu dotyku jest całkowicie a-perspektywiczna. Śledzenie dotykiem kształtu sześcianu czy kuli nie oddaje nawet perspektywy dwuwymiarowej. Osobom niewidomym trzeba tłumaczyć, dlaczego dotykany prostokąt ma powiedzmy kształt a, a nie kształt b (por. rys. 1). Rzecz staje się naprawdę kłopotliwa, gdy próbuje się wyjaśnić osobie niewidomej kształt przedmiotów znajdujących się poza zasięgiem jej dotyku. Przejdę obecnie do wyjaśnienia tego zjawiska. Adriana Schetz 68 RYS. 1. Reprezentacja kształtu na kanwie informacji dotykowej nie stanowi zbioru informacji punktowych w tym samym rozumieniu, co reprezentacja kształtu na kanwie informacji wzrokowych. Wzrok dostarcza informacji punktowych tylko w takim sensie, w jakim wyodrębnia się jednostki składowe pola widzenia, coś pokrewnego geonom. Jednak każdy geon lub inne analogiczne jednostki są już pewnego rodzaju całością. Z pomocą zmysłu dotyku oraz informacji z proprioreceptorów osoba sprawnie posługująca się zmysłem wzroku może dysponować całościową reprezentacją sceny. Jednakże przestaje to już być scena wyłącznie wzrokowa. Skoro informacje o kształcie obiektów są uzyskiwane w wyniku analizy danych sensomotorycznych, to percypowana scena jest sceną wzrokowo-ruchowo-dotykową. Punktowość informacji oznacza tu kolaż pewnych całości ustrukturowanych poprzez informacje charakterystyczne dla danego kanału sensorycznego i obrobionych na poziomie apriorycznym. Innymi słowy, treść sensoryczna jest tu już zinterpretowana przez procesy odgórne i stanowi rodzaj treści apriorycznej. Zauważmy, że osoba niewidoma nie ma w ogóle dostępu do pewnych własności obiektów. Są to własności składające się na kształt przedmiotu poza zasięgiem dotyku, tzn. kształt dany w perspektywie wizualnej. Porównajmy ze sobą dwa kształty figur płaskich przedstawionych na rys. 2. RYS. 2. Jak wytłumaczyć osobie niewidomej, że stół przy którym siedzi w zależności od perspektywy, z której się na niego patrzy jest raz prostokątny, a raz jest trapezem? Zauważmy, że trapezowość blatu stołu nigdy nie jest dana zmysłowi dotyku. Dotykany blat stołu zawsze jest prosto- Widzieć krawędzie, dotykać głębi 69 kątem (choć i tego trzeba osobę niewidomą nauczyć). Ponadto w przypadku osób widzących kojarzenie trapezowego kształtu stołu z jego „zwyczajnym” prostokątnym kształtem dokonuje się prawdopodobnie na innych zasadach, niż w przypadku osoby niewidomej. Osoba niewidoma uczy się na zasadzie asocjacji, że zawsze, gdy ma do czynienia z prostokątnym stołem, to stół ten może być także przedstawiony jako trapez. Osoba widząca natomiast rozumie jak pewne własności przedmiotów zmieniają się w zależności od zajmowanej perspektywy. Osoba niewidoma rozumie jak natężenie dźwięku zmienia się w zależności od zajmowanej przez nią perspektywy w stosunku do źródła dźwięku. Nie jest natomiast w stanie zrozumieć jak prostokątne ściany sześcianu zmieniają się w trapezy i równoległoboki w zależności od perspektywy (por. rys. 3.). RYS. 3. Powyższe uwagi potwierdzają tezę, że amodalność niektórych informacji sensorycznych nie generuje amodalności percepcyjnej. Percepcja jest procesem złożonym, w którym udział biorą tak treści sensoryczne, jak i pojęcia, a zatem treści aprioryczne. W przypadku osób niewidomych pojęcia przestrzenne brył nie są tymi samymi pojęciami, co pojęcia pozyskane z udziałem zmysłu wzroku. Pojęcia brył u osób niewidomych nie zawierają bowiem informacji na temat własności przestrzennych poza zasięgiem zmysłu dotyku. W następnej części niniejszego opracowania proponuję rozwiązanie oparte na podobnych danych empirycznych niemniej formułujące odmienny wniosek i co za tym idzie udzielające pozytywnej odpowiedzi na pytanie Molyneux. Na koniec uzasadnię wniosek, że konkurencyjne stanowisko jest nie do utrzymania. 70 Adriana Schetz 3. Treść sensoryczna i treść aprioryczna – odpowiedź konkurencyjna Filozofem, któremu nie sposób odmówić najbardziej błyskotliwej próby rozwiązania problemu Molyneux był G. Evans. W głośnym artykule opublikowanym po raz pierwszy w 1985 roku pt. Molyneux Question proponuje uzasadnienie dla tezy, że osoba, która odzyskałaby natychmiast wzrok byłaby w stanie odróżnić kulę od sześcianu oraz potrafiłaby poprawnie zastosować pojęcia kuli i sześcianu do widzianych przedmiotów (por. Evans 2003). Przyjrzyjmy się temu uzasadnieniu. Evans posługuje się trzema kluczowymi dla swojego argumentu pojęciami: (1) przestrzeni egocentrycznej (Egocentric Space), (2) wiedzy sensomotorycznej oraz (3) wymogu uogólnienia (Generality Constraint ). Zacznijmy od pierwszego pojęcia, które wymaga najobszerniejszego wyjaśnienia. Przez przestrzeń egocentryczną Evans rozumie obszar pokrywający się z przestrzenią zachowań ruchowych podmiotu. Podmiot wykonuje ruchy, które świadczą o tym, że posługuje się on pojęciami przestrzennymi. Np. fakt, że dziecko wkłada sześcienny klocek do kwadratowego otworu odpowiedniej wielkości świadczy o tym, że rozumie ono co to jest sześcian i co to jest kwadrat. Z tego zaś, że ktoś, kto na wołanie na zewnątrz za oknem reaguje podejściem do okna wynika, iż posługuje się pojęciem „na zewnątrz”. Przestrzeń egocentryczna jest utożsamiona z przestrzenią zachowań ruchowych, gdyż podmiot stanowi centrum i jedynego aktora, czyli sprawcę działania od którego zależy ostateczna ocena perspektywy. Dobrym przykładem potwierdzającym spostrzeżenie Evansa jest sytuacja, w której podmiot stoi twarzą do powiedzmy jakiegoś budynku a następnie odwraca głowę w lewą stronę. Przed odwróceniem głowy budynek zajmował miejsce „na wprost” w przestrzeni egocentrycznej tej osoby, zaś po odwróceniu głowy w lewo budynek zajął miejsce „na prawo” w jej przestrzeni egocentrycznej. Jest to prosty i zarazem przekonujący przykład obrazujący pojęcie perspektywy egocentrycznej, niemniej samo to pojęcie jest o wiele bardziej skomplikowane w rozumieniu Evansa, niż to zazwyczaj się przedstawia3 . Evans pisze: Musimy najpierw zrozumieć, na czym polega identyfikacja miejsc. Miejsca, o których myślimy są różnicowane przez ich relacje przestrzenne do przedmiotów, które konstytuują nasz szkielet referencji [frame of reference]. [...] Zatem podstawowe rozpoznanie jakiegoś miejsca identyfikowałoby je poprzez równoczesną referencję do jego relacji do każ3 Np. Campbell w swojej krytyce przestrzeni egocentrycznej w rozumieniu Evansa w swojej charakterystyce poprzestaje wyłącznie na jej cechach wymienionych powyżej. Por. (Campbell 2005, s. 199-203). Widzieć krawędzie, dotykać głębi 71 dego z obiektów konstytuujących szkielet referencji. O miejscu można by myśleć w ten sposób, gdyby zostało zidentyfikowane na mapie reprezentującej jednocześnie relacje przestrzenne przedmiotów konstytuujących szkielet referencji. Ta identyfikacja ma holistyczny charakter: miejsce nie jest identyfikowane poprzez referencję do jednego czy dwóch obiektów i w związku z tym identyfikacja może być efektywna nawet, jeśli kilka obiektów przemieszcza się lub zostaje zniszczonych. Nasza identyfikacja miejsc ma taki holistyczny charakter zawsze, gdy polegamy, w myśleniu o miejscach, na tym, co nazywa się „mapą kognitywną” — reprezentacją, w której relacje przestrzenne wielu różnych rzeczy są jednocześnie reprezentowane (Evans 2003, s. 48). Evans mówiąc o szkielecie referencji ma na myśli coś innego aniżeli wyłącznie repertuar zachowań ruchowych podmiotu. Wskazuje bowiem na mapę kognitywną utożsamioną nie tylko z obszarem możliwych ruchów podmiotu, ale także z semantycznymi cechami reprezentacji miejsca. Czyli ostatecznie przestrzeń egocentryczna jest rozumiana u Evansa jako rodzaj wiedzy jak działać w przestrzeni, jednak do niej się nie redukuje. Wiedza jak działać stanowi bowiem konsekwencję umiejętności posługiwania się schematyczną reprezentacją przestrzeni trójwymiarowej. Reprezentacja ta jest konstytuowana nie poprzez relacje referencjalne zachodzące między poszczególnymi reprezentacjami przedmiotów indywidualnych, ale poprzez relacje referencjalne pomiędzy węzłowymi czy szkieletowymi dla rozpoznawalności danego miejsca przedmiotami. I tak dany podmiot jest w stanie zidentyfikować miejsce m nie dzięki umiejętności rozpoznania każdego obiektu wypełniającego przestrzeń tego miejsca, ani również nie dzięki umiejętności rozpoznania większości takich obiektów. Powiemy, że potrafi on rozpoznać miejsce m wówczas, gdy wskaże je nawet pomimo zmian, które mogły w tym miejscu zajść bez jego wiedzy. Zatem musi on dysponować umysłową reprezentacją tego miejsca4 . Czy taka konstatacja nie pozostaje jednak w sprzeczności z zaproponowanym przez Evansa utożsamieniem przestrzeni egocentrycznej z przestrzenią zachowań ruchowych? Teoria Evansa w wielu miejscach przypomina podejście sensomotoryczne czyli enaktywne zapoczątkowane przez Gibsona. Warunek sensomotoryczny stanowi drugą spośród wymienionych na wstępie tej części artykułu przesłanek stanowiska Evansa. Tak rozumiana idea percepcji nie zawiera wyżej suCzy jest to reprezentacja sensu stricto, tj. czy wskazywanie miejsca odbywa się via deskrypcja lub na mocy wyodrębnienia cech typowych, itp., czy może wystarczy samo podobieństwo nie ujmowalne żadną regułą, (postulowane np. w niektórych wyjaśnieniach percepcji twarzy) omawiam w innym opracowaniu zagadnienia Molyneux stanowiącym kontynuację podjętych tu problemów (zob. Schetz, w przygotowaniu). 4 72 Adriana Schetz gerowanej sprzeczności. Zgodnie bowiem z podejściem enaktywnym podmiot percepcji nie dysponuje reprezentacją w sensie, jaki był temu pojęciu przypisywany tradycyjnie przez brytyjskich filozofów nowożytnych czy nawet analityków z pierwszej połowy XX wieku. Zasadniczo enaktywnizm zaprzecza, jakoby w procesie percepcji powstawała jakakolwiek umysłowa reprezentacja (Noë 2004, s. 75-122). W myśl teorii enaktywnej percypować, to posiadać wiedzę jak działać, czyli posiadać wiedzę proceduralną. Jednocześnie wszelkie przypadkowe albo ściśle nawykowe działania nie stanowią rodzaju wiedzy, a zatem posiadanie reprezentacji umysłowych nie redukuje się do jakichkolwiek zachowań. Powstaje jednak pytanie, czy Evans akceptował ten wątek teorii Gibsona? Odpowiedź na to pytanie zawarta jest w np. następujących fragmentach: Egocentryczne terminy przestrzenne są terminami, w których mogłoby być sformułowane pojęcie treści naszych doświadczeń przestrzennych oraz takimi, w których mogłyby być wyrażone nasze bezpośrednie zamiary behawioralne. Ten dualizm jest nieprzypadkowy, gdyż przestrzeń egocentryczna może istnieć tylko dla zwierzęcia, dla którego istnieje złożona sieć powiązań pomiędzy percepcyjną daną na wejściu a behawioralną daną na wyjściu (Evans 2003, s. 49). Preferuję wyjaśnienie tego, że myśli są ustrukturowane, nie w terminach złożenia z wielu różnych elementów, ale w terminach złożenia zastosowań wielu różnych zdolności pojęciowych [conceptual abilities — podkreślenia Evansa], (Evans 2003, s. 67). Pierwszy z przytoczonych fragmentów explicite mówi o skomplikowanej sieci powiązań pomiędzy percepcją a działaniem, choć jest zbyt ogólny by odpowiadać na pytanie, jakiego dokładnie rodzaju są to powiązania. Wiadomo jednak, że Evans nie był zwolennikiem zwykłego behawioryzmu, w innych zaś miejscach odwoływał się chętnie do ustaleń bliskich Gibsonowi. Kiedy porównuje sposób, w jaki osoba niewidoma reprezentuje przestrzeń dystalną ze sposobem, w jaki robi to osoba widząca, to odwołuje się do reprezentacji ruchu, który powinien zostać wykonany, aby móc manipulować oddalonym od podmiotu obiektem. Reprezentacja odległości jest zatem kodowana w postaci informacji o ruchu. W drugim cytacie jest natomiast mowa o innego rodzaju umiejętności, tj. nie o ruchu fizycznym wykonywanym w oparciu o schematyczną mapę położenia przedmiotów, ale rzec by można o „ruchu mentalnym czy umysłowym” dokonującym się w oparciu o mapę logiczną. Idea ta wyrażona jest u Evansa w postaci warunku uogólnienia, trzeciego warunku spośród wymienionych na początku bieżącej części artykułu. Choć zatem Evans posługuje się pojęciem reprezentacji umysłowej, to sposób, w jaki je rozumie wydaje się bardzo bliski idei wiedzy Widzieć krawędzie, dotykać głębi 73 proceduralnej. Wymóg ogólności, tak ważny u Evansa w interpretacji zjawiska percepcji, sprowadza się do tezy o holizmie semantycznym. Podmiot odnoszący się do obiektu w świecie, myślący „a jest F ” lub formułujący takie przekonanie, nie żywi swojej myśli w izolacji od innych myśli czy przekonań dotyczących tego obiektu. Jak wskazuje Evans także sama myśli czy przekonanie, że „a jest F ” ma złożoną strukturę nie tylko ze względu na fakt, że występują w niej odrębne elementy takie jak myśl o a, myśl o a jako czymś istniejącym, myśl o F -ie, myśl o F -ie jako własności a, ale przede wszystkim myśl, że „a jest F ” tworzy złożoną całość, w której te poszczególne elementy są ze sobą powiązane w sposób istotny, a nie jedynie przypadkowy. Następujące fragmenty potwierdzają to spostrzeżenie: Każda ze zdolności implikowanych przez myśl, że a jest F , pomimo, że są one odrębne, może być zastosowana tylko w (całej) myśli i stąd zawsze razem z pewnymi innymi zdolnościami pojęciowymi (Evans 2003, s. 68). Stąd wynika, że: Jeśli podmiot uznaje myśl, że a jest F , wówczas musi mieć pojęciowe zasoby, aby żywić myśl, że a jest G, dla każdej własności bycia G, której ma on pojęcie. (Evans 2003, s. 68). Wydaje się, że warunek ogólności jest zrozumiały i nie ma potrzeby tej kwestii dalej rozwijać. Po przedstawieniu krótkiej charakterystyki trzech głównych założeń koncepcji percepcji u Evansa, tj. założenia o przestrzeni egocentrycznej, założenia o enaktywnym charakterze percepcji oraz założenia o holizmie semantycznym, przyjrzyjmy się argumentowi przedstawionemu przez Evansa na rzecz pozytywnej odpowiedzi na pytanie Molyneux. Evans zauważa, że osoba mająca pojęcie sześcianu i kuli nabyte w oparciu o spostrzeżenia dotykowe w chwili, w której odzyskuje wzrok staje wobec nowych spostrzeżeń, tym razem wzrokowych, które musi jakoś pojęciowo okiełznać. Sugestia Berkeleya była taka, że efektem ujęcia spostrzeżeń wzrokowych w pojęcia jest powstanie nowych pojęć sześcianu i kuli. Ostatecznie więc Berkeley mówi o „dotykowym pojęciu” oraz „wzrokowym pojęciu” sześcianu i kuli. Evans nie zgadza się z konstatacją Berkeleya. Ze względu na fakt obowiązywania wymogu ogólności, tj. zasady semantycznego holizmu, osoba, która odzyskała wzrok nie byłaby w stanie zaakceptować dwóch odrębnych pojęć sześcianu i kuli. Jeśli byłyby to faktycznie, jak chciał Berkeley, odrębne pojęcia, to nie ma sensu twierdzić, że zarówno jedne, jak i drugie są pojęciami sześcianu Adriana Schetz 74 i kuli, skoro nie ma między nimi żadnych istotnych podobieństw. To, że nie są to pojęcia odrębne wynika natomiast u Evansa z założenia o enaktywnym charakterze percepcji. Osoba niewidoma posługuje się pojęciami w sposób z zasady identyczny z tym, jak pojęć używa osoba widząca. Jeśli ma pojecie sześcianu, to wie np. że nie może włożyć go w okrągły otwór o tej samej powierzchni, co jedna ze ścian sześcianu, że sześcian ma ostre krawędzie, a kula jest gładka, że kula się toczy a sześcian nie, itp. Innymi słowy, podmiot rozumie jakie miejsce oraz jakie zachowania powinien przypisywać sześcianowi, a jakie kuli w swojej przestrzeni egocentrycznej. Z chwilą, w której odzyskuje wzrok nic się zasadniczo nie zamienia. Nadal własności przypisane tym bryłom w oparciu o spostrzeżenia dotykowe pozostają składowymi pojęć tych brył: nadal kula się toczy, zaś sześcian ma ostre krawędzie itd. Podmiot nie powinien mieć zatem większych trudności z zastosowaniem pojęć obu brył do nowo nabytych wrażeń wzrokowych. Zarysowaną tu konkluzję Evansa dobrze oddaje następujący fragment jego wypowiedzi: [Moje] stanowisko nie jest takie, że dotykowe reprezentacje percepcyjne kwadratu przypominają wzrokowe reprezentacje percepcyjne kwadratu. [Moje] stanowisko jest takie, że jeżeli obie są jednoczesnymi reprezentacjami, to jedyne pojecie, które [podmiot — A. S.] może zrozumieć stosuje się (lub wydaje się stosować)5 w obu przypadkach (Evans 2004, s. 132-30). Dochodzimy zatem do punktu, w którym stajemy wobec dwóch wykluczających się odpowiedzi na pytanie Molyneux: zaproponowaną przeze mnie negatywną odpowiedzią bazującą na analizie przypadków osób niewidomych oraz zaproponowaną przez Evansa pozytywną odpowiedzią opartą na analizie natury pojęć oraz zasad rządzących ich nabywaniem i stosowaniem. Postaram się wykazać, że argument Evansa nie prowadzi do preferowanej przez niego konkluzji. Głównym zarzutem, jaki Evansowi na ogół się stawia jest to, że z faktu, że dyspozycji pojęciowej towarzyszy dyspozycja do zachowania nie wynika, iż zachowanie czy ściśle rzecz biorąc wiedza sensomotoryczna konstytuuje treść pojęć. Ponieważ zagadnienie słuszności podejścia enaktywnego w teorii percepcji mogłoby stanowić przedmiot osobnej rozprawy nie poświeciłam mu tutaj miejsca. Zaznaczę jedynie, iż zarzut ten sformułowany chyba najjaśniej przez Campbella (por. Campbell 2005) uważam za całkowicie chybiony nie tylko ze względu na uprosz5 Zastrzeżenie „wydaje się stosować” odnosi się do przypadków iluzji lub halucynacji. Widzieć krawędzie, dotykać głębi 75 czony sposób, w jaki przedstawia stanowisko Evansa, ale przede wszystkim ze względu na obecny stan wiedzy o sposobie nabywania pojęć oraz ich stosowania, który zdaje się w wystarczającym stopniu potwierdzać teorię enaktywną. Argumentacja Evansa ma jednak pewien bardzo słaby punkt. Znajduje się on pomiędzy przesłanką o tym, że dana osoba nie może spójnie żywić dwóch odrębnych pojęć tego samego obiektu, a wnioskiem, że aby można było przypisać jej pojęcie danego obiektu musi ona posiadać określone zdolności tego samego rodzaju niezależnie od sposobu ich nabycia. Słabość argumentacji Evansa wypływa z faktu braku przejścia między tą przesłanką a tym wnioskiem. Powróćmy na chwilę do uwag G. Fregego na temat sensu i znaczenia wyrażeń językowych. Przykład gwiazdy porannej i gwiazdy wieczornej rozumianej jako sensu przypisywanego reprezentacjom tego samego obiektu, tj. planety Wenus, jest bardzo instruktywny jeśli chodzi o argument Evansa. Ktoś może nie wiedzieć, że gwiazda poranna i gwiazda wieczorna są de facto tym samym obiektem, a nawet więcej, ktoś może posiadać reprezentację gwiazdy porannej nie posiadając w ogóle reprezentacji gwiazdy wieczornej. Podobnie ktoś może wiedzieć wiele na temat Josepha Conrada nie wiedząc jednak, iż był on Józefem Konradem Korzeniowskim. Czy mimo wszystko przypiszemy tej osobie zdolność posługiwania się pojęciem planety Wenus oraz Józefa Konrada Korzeniowskiego tyle, że pod różnymi sposobami prezentacji tych przedmiotów: jako gwiazdy porannej oraz jako Josepha Conrada? Wydaje się, że Evans po prostu należy do grona filozofów, którzy niechętnie utożsamiają pojęcia z reprezentacjami umysłowymi, czyli z treścią aprioryczną. Tymczasem wydaje się zupełnie niekontrowersyjne to, że Joseph Conrad może być mi dany wyłącznie jako autor Złotej strzały, podczas gdy komuś innemu jest on dany jako autor Korsarza. Co więcej mogę nawet sądzić, że autor Złotej strzały Joseph Conrad jest inną osobą niż autor Smugi cienia Józef Konrad Korzeniowski. Innymi słowy, wydaje się, że u Evansa jest miejsce na sposób prezentacji pojęcia. Pojęcie sześcianu czy kuli może być dane dzięki zestawowi różnych dyspozycji ruchowych. Można np. wiedzieć, że kula toczy się po pochyłej powierzchni, ale nie wiedzieć, że jej ruch wahadłowy wprawia w ruch inną kulę znajdującą się w pobliżu, ale nie stykającą się z nią bezpośrednio. Niezależnie jednak od tego, jakie zajmie się w tej kwestii stanowisko niektórzy autorzy rzeczywiście twierdzą, że te rozmaite sposoby prezentacji nie przeczą istnieniu jednego jednorodnego pojęcia danego obiektu. Takie stanowisko głoszone przez np. Ch. Peacocke’a (Peacocke 1992, s.3) wydaje mi się nieporozumieniem. Oznacza bowiem, że osoby niewidome tak naprawdę mają dokładnie takie samo 76 Adriana Schetz pojecie sześcianu jak osoby widzące. Podsumowując, stanowisko Evansa, zgodnie z którym mamy prawo przypisywać danej osobie posiadanie pojęcia kuli i sześcianu wówczas, gdy jest ona w stanie spełnić warunek ogólności można uzupełnić o pogląd Peacocke’a, że odmienne sposoby nabywania reprezentacji cech obiektu prowadzą do utworzenia jednorodnego pojęcia tych cech. Czyli osoba, która nabywa reprezentację kształtu kuli w oparciu o dotykowy kanał sensoryczny oraz w oparciu o wzrokowy kanał sensoryczny dysponuje jednorodnym pojęciem kształtu kuli. Zarówno Evans, jak i Peacocke mają poniekąd rację. W przypadkach standardowych, tj. u osób, u których wszystkie zmysły funkcjonują sprawnie rzeczywiście dochodzi do integracji percepcyjnej bodźców. Zaprzeczanie temu zjawisku oznaczałoby co najmniej dyletanctwo naukowe. Niemniej nie można zapominać, że mówimy o przypadkach niestandardowych. Z kolei strategia Peacocke’a nie pozostawia wątpliwości co do swojego przesadzonego optymizmu. Nieuchronne bowiem pytanie o to, jak odbywa się wiązanie danych konstytuujące pojęcia percepcyjne dopuszcza, a nawet zakłada możliwość, że w przypadku wadliwego działania układu percepcyjnego nie wszystkie dane ulegają wiązaniu. Takie właśnie zjawisko ma miejsce, jak starałam się to wykazać, w przypadku osób, o które pytał Molyneux. Evans zaproponował jednak pewien eksperyment, w którym odpowiednio pobudzana kora wzrokowa niewidomej osoby miała produkować efekt zwany fotyzmem. Zjawisko to miało potwierdzać przekonanie Evansa, że zmysły są amodalne, gdyż efektem fotyzmu miało być doświadczenie wzrokowe kwadratu lub koła, wcześniej znanych badanemu wyłącznie dotykowo. Nie jestem przekonana co do powodzenia takiego eksperymentu m. in. z przyczyn wskazanych przez Shauna Gallaghera (Gallagher 2005, ss. 153-172). Poniżej przedstawię wątki stanowiska Gallaghera, które przemawiają na rzecz mojego stanowiska. 4. Rozwój neuronalny zależy od doświadczenia Gallagher proponuje, aby rozważania dotyczące problemu Molyneux podsumować za pomocą trzech zasad stanowiących założenia, bądź wnioski klasycznych teorii empirystycznych. Pierwsza z tych zasad głosi, że rozwój koherentnej percepcji zależy od umiejętności wprowadzania porządku do chaotycznego zestawu wrażeń. Umiejętność ta wynika z powtarzalności widzianych przedmiotów i de facto prowadzi do powstania nawyków percepcyjnych. Koherentną treść uzyskaną dzięki funkcjonowaniu takich nawyków Gallagher nazywa treścią Locke’owską (Gallagher 2005, s. 155 oraz s. 156), gdyż to Locke wskazywał na rze- Widzieć krawędzie, dotykać głębi 77 komo kluczową dla percepcji zależność miedzy powtarzalnością wrażeń a nawykiem. Druga zasada zakłada, że modalności zmysłowe są wzajemnie autonomiczne, tj. nie zachodzi wymiana informacji na poziomie zmysłowym. Dopiero treść Locke’owska umożliwia wiązanie informacji z poszczególnych modalności zmysłowych. Jest to jednak umiejętność, której się trzeba nauczyć angażując pojęcia. Zgodnie z trzecią zasadą żadna z informacji modalnych nie jest wystarczająca do uzupełniania, poprawiania, itp. informacji z innej modalności zmysłowej (Gallagher 2005, s. 155-56). Wymienione wyżej zasady prowadzą do negatywnej odpowiedzi na pytanie Molyneux. Gallagher proponuje, aby zrewidować je w oparciu o badania empiryczne. Ostatecznie dochodzi do przekonania, że drugą i trzecią należy odrzucić, zaś pierwsza powinna zostać przeformułowana. Do wprowadzonego w poprzednich paragrafach artykułu pojęć treści sensorycznej oraz treści apriorycznej można teraz dodać charakterystykę proponowaną przez Gallaghera, tj. kontekst rozwojowy (developmental context ). Psychologia rozwojowa posługuje się pojęciem kontekstu rozwojowego zakładając, że treść sensoryczna nowonarodzonego dziecka jest chaotyczna i niekoherentna. W wyniku procesu integracji bodźców percepcyjnych i tworzenia pojęć, po pewnym czasie dochodzi do uformowania się treści apriorycznej. Gallagher powołując się na wyniki najnowszych badań z udziałem bardzo wczesnych noworodków (ok. godziny po porodzie oraz ok. miesiąca po porodzie) Gallagher dowodzi, że powyższe założenie mija się z prawdą6 . Zakładając, że już bardzo młode dzieci rejestrują tę samą informację na temat kształtu przedmiotu dotykanego i widzialnego oraz, że potrafią posługiwać się w sposób koherentny informacjami z proprioreceptorów proponuje, aby następująco przeformułować zasady koncepcji empirystycznych (Gallagher 2005, s. 160-61). Po pierwsze, względnie koherentna percepcja jest możliwa od urodzenia i nie wymaga treści Locke’owskiej. Po drugie, modalności zmysłowe komunikują się ze sobą, co oznacza, że percepcja ma charakter amodalny. Po trzecie, informacje z jednej modalności zmysłowej mogą wpływać na informacje z innej modalności zmysłowej. Pomimo tych konstatacji Gallagher argumentuje na rzecz negatywnej odpowiedzi na pytanie Molyneux. Przyjrzyjmy się temu bliżej. Pomimo, że badania nad noworodkami dowodzą, że ich układ percepcyjny doskonale radzi obie z integracją informacji z rozmaitych ka6 Aby nie poszerzać objętości niniejszego opracowania nie dyskutuję przytaczanych przez Gallaghera badań. Zainteresowanych odsyłam do następujących opracowań: (Meltzoff i Moore 1977, 1994) oraz (Meltzoff i Borton 1979). 78 Adriana Schetz nałów sensorycznych, to kluczową kwestią dla zrozumienia problemu Molyneux jest percepcja niestandardowa. Innymi słowy, należy poddać analizie wyniki badań nad deprywacją wzrokową, a nie prawidłowo funkcjonującą percepcją wzrokową. Badania przeprowadzone na noworodkach oraz na zwierzętach dowodzą, jak zauważa Gallagher, że jeśli między trzecim a trzynastym tygodniem życia nie ma miejsca prawidłowa stymulacja wzrokowa, dochodzi do nieodwracalnych ubytków w percepcji wzrokowej do końca życia (Gallagher 2005, ss. 165-70). Ubytki te powodowane są przez niewłaściwy rozwój komórek nerwowych odpowiedzialnych za percepcję wzrokową. Podsumowując, zdaniem Gallaghera rozwój neuronalny odpowiedzialny za percepcję zależy od doświadczenia. Jeśli stymulacja bodźców percepcyjnych jest zbyt uboga, prowadzi do wyhamowania lub anomalii w rozwoju odpowiednich struktur neuronalnych umożliwiających poprawną percepcję. W przypadku wyhamowania ich rozwoju między trzecim a dwunastym tygodniem życia ma miejsce zatrzymanie rozwoju percepcji na poziomie bardzo ubogim w porównaniu z percepcją u dorosłego człowieka rozwijającego się prawidłowo. Jeśli dziecko lub zwierzę jest niewidome od urodzenia deprywacja neuronalna jest jeszcze bardziej zaawansowana i jest nieodwracalna. Powyższe dane skłaniają Gallaghera do odrzucenia drugiej i trzeciej tezy klasycznych teorii empirystycznych oraz do przeformułowania pierwszej z nich: Pomimo, że relatywnie zorganizowana eksteroreceptorowa percepcja jest możliwa od urodzenia, zachowanie kontynuacji i rozwój percepcji zależy od doświadczenia rozumianego jako stosowanie mechanizmów percepcji (Gallagher 2005, s. 170). Przychodzimy na świat z amodalnym lub zdolnym do integracji zmysłowej aparatem percepcyjnym. Nie wystarczy to jednak do zachowania tej zdolności danej nam przez naturę. Molyneux powinien był wiedzieć, że nie ma percepcji bez odpowiedniej stymulacji bodźcowej. Innymi słowy, nie ma percepcji bez doświadczenia. Argumentacja Gallaghera potwierdza zatem to, co starałam się wcześniej wykazać, mianowicie, że deprywacja neuronalna obszarów mózgu odpowiedzialnych za widzenie przekłada się na niezdolność do prawidłowych analiz na poziomie kognitywnym, tj. na poziomie treści apriorycznej. Widzieć krawędzie, dotykać głębi 79 Literatura Baumann, P. (2004). Molyneux’s Questions. W: Schumacher, R., (red.) Perception and Reality. From Descartes to Present. Paderborn: Mentis, s. 168– 187. Campbell, J. (2005). Information Processing, Phenomenal Consciousness, and Molyneux’s Question. W: J.L. Bermùdez (red.) Thought, Reference, and Experience. Oxford: Clarendon Press. Degenaar M. (1996). Molyneux’s Problem. Three Centuries of Discussion on the Perception of Forms. Dordrecht/London: Kulwer Academic Publishers. Evans, G., (2003). Demonstrative Identification. W: Gunther, Y. H., (red.) Essays on Nonconceptual Content. Cambridge, MA: MIT Press. Evans, G., (2004). Molyneux Question. W: Schwartz, R. (red.) Perception. Oxford: Blackwell, s. 130–149. Fodor, J., A., Pylyshin, Z. (2004). How Direct is Visual Perception? W: Schwartz, R. (red.) Perception. Oxford: Blackwell, s. 175–199. Francuz, P. (2007). Teoria wyobraźni Stephena Kosslyna. Próba reinterpretacji. W: Francuz, P. (red.) Obrazy w umyśle. Studia nad percepcją i wyobraźnią. Warszawa: Wydawnictwo Naukowe Scholar. Gallagher S. (2005). How the Body Shapes the Mind. Oxford: Clarendon Press. Gibson, J. J. (1979). The Ecological Approach to Visual Perception. Boston: Houghton Mifflin. Hopkins, R. (2005). Molyneux’s Question. Canadian Journal of Philosophy 3, s. 441–464. Jacomuzzi, A., Kobau, P., Bruno, N. (2003). Molyneux’s Question Redux. Phenomenology and the Cognitive Sciences 2, s. 255–280. Meltzoff A., R. W. Borton (1979). Intermodal Matching by Human Neonates. Nature, 282, s. 403–404. Meltzoff A., M. K. Moore (1994). Imitation, Memory, and the Representation of Persons. Infant Behavior and Development 17, s. 83–99. Meltzoff A., M. K. Moore (1977). Imitation of Facial and Manual Gestures by Human Neonates. Science 198, s. 75–78. Niestorowicz, E. (2007). Świat w umyśle i rzeźbie osób głuchoniewidomych. Lublin: Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej. Noë A. (2004). Action in Perception. Cambridge, MA: MIT Press. Paplińska, M. (2008). Konsekwencje wynikające z braku wzroku. W: Paplińska, M. (red) Edukacja równych szans. Uczeń i student z dysfunkcją wzroku — nowe podejście, nowe możliwości. Warszawa: Wydawnictwo Uniwersytetu Warszawskiego. Peacocke, Ch. (1992). A Study of Concepts. Cambridge, MA: MIT Press. Schetz, A. (w przygotowaniu). Dwa problemy Molyneux. Więckowska, E. (2003). Projekt zasad redagowania rysunku i ilustracji dla niewidomego. W: Nowoczesne techniki kształcenia niewidomych i słabowidzących. Poznań: Wydawnictwo Oficyna Edukacyjna Wydawnictwa EMPI, s. 80–88. Ekotypy poznawcze człowieka Maciej Błaszak Uniwersytet im. Adama Mickiewicza w Poznaniu Instytut Filozofii Natura moja nosi, widać, ślady Mego zajęcia, jak ręka farbiarza. — William Szekspir, Sonet CXI (przekład Jana Kasprowicza) Streszczenie. Artykuł oferuje nowe rozwiązanie problemu usytuowania umysłu ( situated cognition), polegające na wykazaniu, jak i dlaczego ludzki umysł wydobywa z otoczenia nie informację, lecz wiedzę. Wiedza jest definiowana jako informacja posiadająca dla organizmu określoną wartość. Zaprezentowany został mechanizm, za pomocą którego owa wartość zostaje do bodźca informacyjnego wprowadzona. Usytuowanie — według tej interpretacji — polega na tym, że część procesów poznawczych człowieka wykonują za niego inni ludzie, mianowicie ci, którzy wytworzyli jego otoczenie poznawcze. Otoczenie poznawcze jest definiowane jako suma wartościowych bodźców informacyjnych. Wiedza wydobyta z otoczenia definiuje różne style poznawcze człowieka, które — z uwagi na zewnętrzne źródło klasyfikacji — nazywane są ekotypami poznawczymi. Wyróżnione zostają cztery ekotypy poznawcze człowieka, na podstawie kształtu ich otoczenia poznawczego (rodzaje ofert ucieleśniających wartościową informację) oraz kompetencji poznawczych niezbędnych do wydobycia wiedzy z otoczenia. 1. Wartość gibsonowskich ofert Ekonomia poznania stawia człowieka przed problem wyboru i konstrukcji ofert do działania (affordances) (Gibson 1979)1 , pozwalających mu uniknąć nadmiarowości informacji wypełniającej naturalne 1 Oferty — w rozumieniu Jamesa Gibsona — są sposobnościami do działania, czyli własnościami środowiska zrelatywizowanymi do określonego zwierzęcego organizmu, który potrafi je postrzec i wykorzystać; postrzeganie ofert i wydobywanie z nich informacji jest — zdaniem Gibsona — bezpośrednie, Studia z Kognitywistyki i Filozofii Umysłu, 3: 81–96, 2009 c 2009 Maciej Błaszak Copyright 82 Maciej Błaszak środowisko jego życia. Oferty mogą być przedmiotami lub zdarzeniami reprezentującymi wycinek środowiska w którym zachodzą procesy poznawcze Homo sapiens. Bez takiej ekologicznej standaryzacji bodźców wywołujących określone działanie, człowiek nie poradziłby sobie z partykularnością informacji z jednej strony, oraz z jej obfitością i różnorodnością z drugiej. Pierwszy problem uniemożliwiłby generalizację właściwą percepcji ekologicznej, drugi pochłonąłby kolosalne ilości energii swobodnej, potrzebnej do pozbycia się nadmiaru informacji docierającej do powierzchni naszego ciała.2 Kompilacja ofert do działania tworzy otoczenie (Von Uexkull 1985) poznawcze człowieka (Umwelt), kształtujące systemy percepcyjne (Gibson 1966) niemowlaków i dzieci. Rozwój osobniczy to z jednej strony nabywanie ekspertyzy percepcyjnej w obrębie istniejącego otoczenia, z drugiej — uczenie się postrzegania tych samych przedmiotów i zdarzeń „na nowo”. Ten ostatni proces jest następstwem wzrostu dziecka, dojrzewania jego systemu nerwowego i rozwoju jego motoryki, umożliwiających mu korzystanie z nowych ofert znanych już przedmiotów i zdarzeń, i co za tym idzie, wzbogacanie własnego Umwelt-u. Otoczenie poznawcze ma zatem charakter dynamiczny: zmieniające się oferty definiują przedział sposobności do działania dla rozwijającego się dziecka. Mówiąc metaforycznie, otoczenie jest przewodnikiem z którym człowiek się konsultuje po to, by w trakcie własnej ontogenezy odkryć co można postrzegać, jak to coś funkcjonuje, i — przede wszystkim — do czego może zostać wykorzystane. W tym sensie Umwelt jest poznawczo autorytatywny: ustanawia standardy według których człowiek postrzega przedmioty i zdarzenia, a także działa pod ich wpływem. Odkrywanie, tworzenie i używanie otoczenia jest z istoty przedsięwzięciem zbiorowym, rozciągającym się na wiele pokoleń ludzkich istnień. Jeśli populacja ludzka jest stabilna, standard poznawczy wyzna„niezapośredniczone obrazami siatkówkowymi, obrazami neuronalnymi lub obrazami mentalnymi” (Gibson 1979, s. 147). 2 Odrzucanie nadmiaru informacji jest — jak wykazał Rolf Landauer (Landauer 1961) — procesem entropijnym, przekształcającym energię swobodną w pracę. Pracą, w obszarze odrzucania informacji przez ludzki mózg, jest stan poznawczy o niewielkiej zawartości informacyjnej, która jednak posiada wysoką wartość dla organizmu (na przykład, świadomość: przepustowość rzędu 40 bitów na sekundę [niewielka ilość], będących hipotezą na temat sytuacji w której organizm się znajduje [wysoka wartość]). Ową wartość definiuje podane niżej w tekście kryterium głębi logicznej. Entropia, czyli energia cieplna wydzielana podczas odrzucania informacji — układy obliczeniowe nagrzewają się — jest ceną, jaką nasz organizm musi zapłacić za uaktualnianie własnej wiedzy o wewnętrznym i zewnętrznym środowisku swojego życia. Ekotypy poznawcze człowieka 83 czony przez oferty otoczenia powinien przez długi okres czasu być niezmienny. To, co nas otacza ucieleśnia testy doboru naturalnego w ciągu milionów lat ewolucji oraz mądrość wielu pokoleń innowatorów — słowem jest dobrze sprawdzone (użyteczne). Użyteczność otoczenia można zmierzyć liczbą przeżyć, doświadczeń, prób i błędów, tworzących jego długą historię, czyli ilością pracy wykonanej przez dobór (skala filogenetyczna) i innych ludzi (skala ontogenetyczna) podczas jego konstrukcji. Praca ta zostaje zaoszczędzona umysłowi reagującemu na określone oferty, który nie musi samemu wykonywać mozolnej roboty standaryzacji i generalizacji bodźców poznawczych. Oznacza to, iż lwią część poznania przez nas otoczenia wykonują za nas inni, mianowicie ci którzy to otoczenie wytworzyli. Ilość pracy wykonanej podczas tworzenia ofert, czyli miara użyteczności otoczenia, pokrywa się z pojęciem „głębi logicznej” jako miary wartości komunikatu lub złożoności obiektu. Kryterium głębi logicznej zaproponował Charles Bennett (Bennett 2003), który wykazał, iż dla opisania złożoności układu nie jest istotna informacja w nim zawarta, lecz informacja odrzucona w trakcie tworzenia tego układu. Złożoność jest zatem wskaźnikiem procesu produkcji, a nie samego produktu, czasu pracy, a nie rezultatu tej pracy, informacji odrzuconej, a nie informacji pozostawionej w układzie. Aby rzeczy wyglądały na proste należy się napracować. Przejrzystość wymaga głębi. Oferty są rodzajem zmaterializowanego komunikatu, charakteryzującego się logiczną głębią. Im większych trudności doświadczał nadawca — dobór naturalny oraz inni ludzie — konstruując taki ewolucyjny przekaz, tym większa wartość wytworzonych ofert. Czas potrzebny do odbioru ofert nie jest tak ważny — wskazuje na ilość informacji zawartej w ofercie. Tym co się liczy jest czas potrzebny do skonstruowania oferty — wskazuje na jej wartość dla odbiorcy. Szum informacyjny nie ma głębi, nie może być opisany zwięźlej.3 Standaryzacja ofert wymaga czasu, czasu w którym powstaje porządek, w którym informacja jest odrzucana, aby odbiorca mógł zarządzać jej mniejszą ilością. Odbiorcę interesuje tylko ta informacja, która ma znaczenie w danym kontekście, dzięki której będzie mógł on uruchomić przystosowawczy rodzaj działań. Konstruowanie ofert jest zatem metodą pozbywania się informacji, którą organizm nie jest zainteresowany, która dla niego jest tym, co nieistotne. Ujmując problem obrazowo: skoro otoczenie jest kompilacją ofert, a oferty są zmaterializowanymi komunikatami, liczy się nie to by móRelacjami między losowością i porządkiem zajmuje się teoria algorytmicznej złożoności Kołmogorowa, Solomonoffa, Chaitina (por. Calude 2007). 3 84 Maciej Błaszak wić maksymalnie dużo, lecz by myśleć zanim się coś powie. Mówienie to długość komunikatu, czyli informacja w nim zawarta. Myślenie to praca wykonana przez nadawcę (dobór naturalny, inni ludzie), zanim komunikat powstał, to informacja odrzucona podczas konstruowania komunikatu. Wartościowe oferty mają zatem bardzo bogatą historię: ich opis nie wymaga tak wielu wyjaśnień, za to ich konstrukcja wymaga wielu przeżyć, doświadczeń, prób i błędów. 2. Wiedza zmaterializowana w ofertach Klasyczna już metafora jaką Donald Schön zaproponował dla projektowania („rozmowa z materiałami w danej sytuacji”) (Schön 1983, s. 78), dobrze oddaje charakter ofert jako wytworzonej zmaterializowanej wiedzy.4 Jeśli przyglądamy się jedynie informacji zawartej w ofercie, nie ma możliwości zmierzyć jak wiele informacji odrzuconej oferta implikuje. Jedynie kontekst w którym oferta się pojawia może nas o tym poinformować. Informacja jest widoczna, informacja odrzucona jest widoczna dopiero w kontekście. To sprawia, że trudno jest zmierzyć wartość oferty, czyli wiedzę w niej zmaterializowaną. Można to zilustrować za pomocą przykładu: kształt główki młotka dostarcza człowiekowi użytecznej informacji — kiedyś wbijanie gwoździ generowało takie to a takie problemy. My jednak nie jesteśmy zainteresowani tymi szczegółami: zakładamy, że główka młotka odnosi się do ogromu informacji, której w niej nie ma. Kształt główki jest mapą rozwiązań problemów z wbijaniem gwoździ, mapą wysoce stylizowaną. Wszystko co pozostało po trudnościach napotykanych przez rzemieślników przeszłości, to forma narzędzia. Ale to w zupełności wystarcza w kontekście wbijania gwoździ: kształt główki młotka, którym się posługujemy ‘komunikuje’ nam wyraźnie, iż osoba która młotek projektowała wie o wbijaniu gwoździ znacznie więcej niż my. Istnienie tej wiedzy widać po tym, że młotek jest autoryzowany (producent): powstał w drodze przekształcania informacji, której w nim już nie ma. Abstrahując od analiz z niniejszego artykułu (oferty charakteryzują się głębią logiczną), człowiekiem, który jako pierwszy postawił tezę, iż wiedza to praca, pomiar to akt materialny, a postrzeganie to metabolizm był Leo Szilard. W słynnym artykule z 1929 roku Szilard opisał hipotetyczny silnik, którego reguły działania miały dowodzić niemożliwości istnienia demona Maxwella. Propozycja węgierskiego fizyka okazała się chybiona (demon nie jest możliwy, ale z innego powodu), niemniej artykuł stał się kamieniem milowym informatyki: po raz pierwszy przyjęto w nim, choć nie udowodniono, że pomiar kosztuje. Dowód tego dostarczył dopiero w latach 60. XX wieku Rolf Landauer (por. Bennett 1987). 4 Ekotypy poznawcze człowieka 85 Egzemplarz młotka, którym się posługuję, jest jedną z wielu tysięcy kopii. Producent powiela prototyp, aby wygenerować zysk ze sprzedaży. Istota pracy wytwórcy użytecznego młotka nie polega jednak na powielaniu narzędzia określonego kształtu. Istotne są jedynie te wszystkie prototypy młotka, które zostały przez producenta przetestowane i odrzucone podczas tworzenia ostatecznego wariantu. Jedna kopia każdego przetestowanego prototypu została skondensowana do wielu kopii jednego prototypu, tego który wszedł do produkcji. Na tym polega wytwarzanie użytecznego narzędzia, którego oferty mają określoną wartość dla użytkownika. O tym, że wartością ofert nie jest ich ostateczny kształt — jak sugerowałby James Gibson — lecz proces ich wytwarzania świadczyć może następująca sytuacja: czasami producent jest leniwy i skąpy, i nie testuje prototypów młotka. Domyśla się jak młotkiem określonego kształtu będzie się wbijać gwoździe, ponieważ skopiował jego kształt na targach narzędzi i na podstawie sporządzonej kopii sam zamierza produkować taki model. Łatwo jest dostrzec ile informacji narzędzie zawiera: widać jego kształt, ocenić można jego wagę i materiały z których został wykonany. Trudno jest dostrzec ile informacji odrzuconej prezentuje. Jeśli jednak testujemy ten młotek przez dłuższy czas i śledzimy linię produktową producenta, jesteśmy w stanie zorientować się, czy jakiekolwiek prototypy młotka zostały przetestowane i odrzucone zanim powstał ostateczny produkt. Historia narzędzia stanowi klucz do uchwycenia jego użyteczności. Skąd się bierze ludzka zdolność uchwytywania użyteczności, czyli rekonstruowania informacji odrzuconej z informacji postrzeganej? Jak posługując się narzędziem, mogę odtworzyć jego historię? Już jako dzieci lubimy posługiwać się narzędziami, na przykład drewnianym młotkiem. Potrafimy stukać nim o różne przedmioty i porównywać go z innymi ‘poręcznymi’ obiektami. Do ulubionych zabawek każdego dziecka należą przybory kuchenne — kuchnia to prawdziwy poligon testowania rozwijających się kompetencji manipulacyjnych dziecka. Posługując się wielokrotnie danym narzędziem w różnych konfiguracjach, dzieci ćwiczą się w rozumieniu, uczą się sztuki kojarzenia: jakie są możliwości tego narzędzia?; jakie usterki zostały wyeliminowane zanim powstał egzemplarz, którym się posługuję? Oczywiście tych pytań dziecko nie stawia sobie świadomie i nie werbalizuje problemów, o których mowa. To raczej matka widząc jak dziecko ‘katuje’ określoną zabawkę sarkastycznie zauważa: „Próbuj dalej, może wreszcie złamiesz”. Wiedza zmaterializowana w ofertach jest wiedzą w działaniu. Postrzeganie ofert owocuje podejmowaniem działań, które zmieniają stan umysłu perceptora: wykonując działanie pod wpływem oferty, jedno- 86 Maciej Błaszak cześnie wydobywa on określony rodzaj wiedzy w niej zawarty. Wiedza ta jest informacją odrzuconą w trakcie wytwarzania oferty i może zostać wydobyta przez perceptora wówczas, gdy oferta jest postrzegana w określonym kontekście. Widać to na przykładzie narzędzi materialnych, ale jeszcze lepiej na przykładzie narzędzi językowych. Młotek, łopatka i wiaderko nie wytrzymują konkurencji z czytaniem bajek. Dzieci kochają słuchać bajki, nawet jedną i tę samą czytaną na okrągło. Ćwiczenie się w rozumieniu polega w tym przypadku na domyślaniu się stanów umysłu autora, umysłu niewątpliwie wypełnionego ideami obiektów, których nazwy umieścił w tekście. Utalentowany bajkopisarz to autor, który przelewając swoje idee na papier myśli przede wszystkim o tym, co jego odbiorca ma w głowie: komunikat musi bowiem wywoływać skojarzenia u odbiorcy. Najmniej interesującym aspektem czytania bajek jest to, co zostaje w bajce wypowiedziane. Dużo ciekawszym aspektem są te wszystkie deliberacje i emocje, które rozgrywają się w głowach i ciałach autora i odbiorcy, kiedyś podczas pisania i teraz podczas słuchania. Słowa, czyli oferty językowe, odnoszą się do czegoś nieobecnego — nieobecnego w tekście, ale obecnego w głowach i ciałach twórcy i odbiorcy ofert. Efektem postrzegania ofert jest — poza realizacją określonych działań — wyzwolenie podobnych stanów mentalnych w umysłach ich twórcy i odbiorcy.5 Badania nad funkcjonowaniem materialnego podłoża umysłu — ludzkiego mózgu — potwierdzają istnienie epistemicznego wymiaru gibsonowskich ofert. Spójrzmy najpierw na problem od strony twórcy ofert — człowieka, który produkuje zestandaryzowany komunikat. Louis Sokoloff wykazał, w pionierskich badaniach nad metabolizmem neuronów (Sokoloff 1999, s. 321-329), iż kosztowny jest powrót do fizjologicznej normy, czyli uwolnienie się komórki od konsekwencji własnego metabolizmu. Neuron musi zapłacić za pozbycie się informacji, którą dysponował — zastrzyk energii do komórki następuje nie podczas przebiegu potencjału czynnościowego, lecz wówczas gdy następuje resetowanie układu, czyli przygotowanie komórki do kolejnego cyklu fizjologicznego. Przepływ krwi do mózgu, bogatej w tlen i glukozę, jest miarą informacji odrzuconej przez neurony podczas konstruowania wartościowej oferty — jest metabolizmem wymaganym do tego, by komórka nerwowa mogła zapomnieć to, co właśnie zrobiła. Argument powyższy obowiązuje również wówczas, gdy twórcą ofert jest dobór naturalny. Narzędziem działania doboru są przede wszystkim inni ludzie, ich poznanie ma charakter rozproszony (distributed cognition), a jego produkt podlega procesowi selekcji w skali wielu pokoleń (na przykład memy). 5 Ekotypy poznawcze człowieka 87 Z perspektywy odbiorcy ofert istotne okazały się pomiary — dokonane technikami neuroobrazowania — różnic w przepływie krwi w mózgu, gdy ludzie słuchali wypowiedzi w języku, który rozumieli i w języku, którego nie rozumieli. Lars Friberg — uczeń Nielsa Lassena, współtwórcy technik neuroobrazowania — pokazał, iż kiedy tekst jest rozumiany, aktywowane są ośrodki słuchania i językowe, kiedy natomiast tekst nie jest rozumiany, aktywowany jest cały mózg (Friberg 1991). Odbiorca rozumiejący komunikat doświadcza jedynie bitów, dla których język jest kodem — to znacznie mniej bitów niż ich całkowita liczba obecna w widmie akustycznym. Więcej pracy mózgu jest wymagane dla ‘przetrawienia’ informacji nie generującej znaczenia niż informacji znaczącej, bałaganu niż porządku. I nie jest tak dlatego, że ‘bałaganiarskie’ bity nie są obecne w zrozumiałym komunikacie, tylko dlatego, że mózg ‘wie’, że nie musi się odnosić do tych wszystkich pozostałych bitów gdy słyszy znaną sobie mowę. Codzienne pojęcie informacji („przekazał mi naprawdę cenną wiadomość”) jest zatem o informacji odrzuconej. Postrzegamy oferty jako znaczące, ponieważ nie musimy odnotowywać wszystkich szczegółów, całej tej fizycznej informacji wypełniającej w nadmiarze środowisko naszego życia. Zadowalamy się niewielką liczbą różnic, zmaterializowanych w formie ofert. Wydaje się, że owe różnice przebiegają według czterech współrzędnych: konstrukcyjnej, instrumentalnej, reprezentacyjnej i interakcyjnej. Współrzędne pozwalają na wyróżnienie czterech typów ofert i czterech ekotypów poznawczych człowieka, definiowanych wiedzą w ofertach zawartą. Choć ekotypy są typami idealnymi i realny człowiek stanowi po trosze mix ich wszystkich, można odnaleźć i opisać ludzi których ofertowe otoczenie bardzo przypomina każdą ze współrzędnych w wersji czystej. Dla ilustracji zobaczmy jak wygląda najbardziej pierwotna forma otoczenia, swoisty Ur-Umwelt, w którym perceptor wydobywa z ofert wiedzę kinestetyczną, angażującą równomiernie jego mózg i ciało, i konstruującą jego umysł — umysł eksperta. Poznajmy Williego, prawdziwego dwudziestowiecznego bricoleura i bohatera książki Douglasa Harpera (Harper 1992). 3. Mój warsztat jest moim światem, czyli kim jest Willie Willie przynależy do świata — wartości, umiejętności i stosunków pracy — którego już nie ma. Jeśli jednak gdzieś przetrwał, jego zasięg jest niszowy. Willie to człowiek, którego cechuje „myśl nieoswojona”, to bricoleur, którego — z uwagi na skojarzenia w języku polskim — nie będziemy nazywać „majsterklepką”, lecz „ekspertem”. Claude Levi- 88 Maciej Błaszak Strauss nadał ‘wiedzy konkretu’ bricoleura odpowiednią rangę w antropologii kulturowej: „Świat narzędzi bricoleura jest zamknięty, a regułą gry jest zawsze posługiwanie się środkami będącymi pod ręką, tzn. w każdej chwili skończonym zasobem przedmiotów i materiałów, niejednorodnym z tego względu, że skład jego nie wiąże się z aktualnie realizowanym planem ani zresztą z żadnym planem szczególnym, lecz jest przypadkowym rezultatem wszystkich nadarzających się okazji odnowienia czy wzbogacenia posiadanego zasobu, . . . .”( Levi-Strauss 1969, s. 32). „. . . bricoleur nie ogranicza się do działań i dokonań; „rozmawia” on nie tylko z rzeczami (. . . ), lecz i przy pomocy rzeczy: mówi o swym charakterze i życiu poprzez wybór wśród ograniczonych możliwości.” (Levi-Strauss 1969, s. 37). Willie jest właścicielem warsztatu na amerykańskiej prowincji lat 70. XX wieku. Okolica w której mieszka jest ekonomicznie zacofana, słabo zaludniona, o surowym klimacie. Mogą w niej przetrwać ludzie w miarę samowystarczalni, zdolni do funkcjonowania w małych kolektywach o silnych wzajemnych zależnościach, zobowiązaniach i świadczeniu przysług. Pieniądz ma tutaj drugorzędne znaczenie, liczą się przede wszystkim manualne umiejętności, pomysłowość i sprawdzony charakter. Warsztat Willego, w którym można naprawić kilkuletni samochód (nowe w tej okolicy to rzadkość), maszynę rolniczą, czy element wyposażenia domu stanowi miejsce spotkań, wymiany informacji, towarów i usług. Właściciel warsztatu, dzięki swoim umiejętnościom, realizuje zadania kluczowe dla przetrwania tej małej społeczności, a jego status wynika z rangi oferowanych usług. Fundamentem działań Williego podejmowanych w obrębie warsztatu jest gruntowna znajomość materiałów z którymi pracuje. Willie dokładnie wie jak zachowa się dany materiał poddany określonej obróbce, co pozwala mu wykorzystać elementy starych urządzeń, części zużytych maszyn, fragmenty większych całości przez innych spisane na straty. Willie dostrzega wartość ‘rupieci’ (junk), a każda naprawa jakiej się podejmuje jest rodzajem budowania urządzenia od nowa. Wnikliwa znajomość przedmiotów codziennego użytku pozwala mu zrozumieć dlaczego urządzenie się zepsuło i jak naprawić usterkę, a nie po prostu wymienić zepsutą część. Wiedza o materiałach i prawach, którym podlegają ma w przypadku Williego adaptacyjny charakter: służy temu by rozwiązać określony problem. Zbierana jest podczas działań nakierowanych na określone oferty i ma pragmatyczny charakter — dotyczy tego jak drewno się pali, jak krąży powietrze, jak metal mięknie pod wpływem uderzeń młotka. Ekotypy poznawcze człowieka 89 Praca Williego to jednak coś więcej niż tylko rozwiązywanie materialnych problemów lokalnej społeczności. Natura tej pracy opiera się na organicznym związku z celem, jakim jest sposób bycia Williego w świecie własnego warsztatu. Przejawia się to w każdym działaniu, które podejmuje, działaniu charakteryzującym się kinestetyczną poprawnością: oceną materiału poprzez dotyk, diagnozą usterki silnika na słuch, wytrzymałości konstrukcji poprzez siłę, jaką musi przyłożyć do jej skręcenia. Naprawa maszyny jest częścią osobistej historii Williego i buduje jego biografię — poprzedzona została latami nieformalnego, pozaszkolnego treningu, który do mistrzostwa doprowadził oko, rękę i umysł bricoleura. Rezultat przerasta sumę poszczególnych składowych, stanowi zagadkę dla tych, którzy nie legitymują się ekspertyzą na takim poziomie. Wiedza, którą wydobywa Willie z ofert własnego otoczenia ma kinestetyczny charakter — nie poddaje się łatwo pojęciowej analizie i werbalnemu opisowi. Konceptualizacja zakłada dystynkcje, które w przypadku bricoleura nie istnieją, na przykład między podmiotem i przedmiotem poznania czy obiektywnym czasem dokonywania napraw. Kluczowa w warsztacie jest sama aktywność — to ona buduje tożsamość Williego i szacuje wartość wykonanej przez niego pracy. Aktywność definiuje również role społeczne Williego — majstra, ojca, wychowawcy, społecznego rozjemcy — i konstruuje jego umysł, którego dominującym stanem jest przepływ (flow) (Csikszentmihalyi 2005). Przepływ jest doświadczaniem teraźniejszości, które jest możliwe dzięki zawieszeniu świadomego „Ja”. Zawieszenie świadomego „Ja” pozwala nieświadomości żyć na pełnych obrotach — uruchamia znacznie szersze pasmo przenoszenia informacji przez ludzki mózg. Stan przepływu przychodzi wraz z praktyką — trening, ćwiczenia, przygotowania, i jeszcze raz trening. To jest droga do stanu w którym świadome „Ja” nabiera zaufania do nieświadomości i przestaje ją kontrolować, co owocuje płynnością podejmowanych działań. Trening tworzy automatyczne umiejętności, które mogą zostać zaaplikowane bez świadomości, że są w ten sposób wykorzystywane. Oko świadomości jest obecne podczas treningu, ale nie podczas samego kinestetycznego działania. Eksperci pokroju Williego stają wobec swoistego paradoksu: lekkiego zawstydzenia z powodu osiągniętego sukcesu. Jest to dziwne, choć jak najbardziej realne zjawisko. Dlaczego tak się dzieje? Cała praca kryjąca się za manualnymi umiejętnościami Williego jest rezultatem treningu, prób i dyscypliny. Świadome „Ja” zdecydowało się na ten trening i z czasem nabrało zaufania do nieświadomości, że poradzi sobie z zadaniami, które są stawiane przed ekspertem. Zada- 90 Maciej Błaszak nia te są realizowane przez nieświadomość eksperta, mimo że zlecenie przyjęło jego świadome „Ja”. Kiedy zadanie jest na ukończeniu, zleceniodawca wyraża swoje uznanie i podziw, a świadome „Ja” Willego powraca z dalekiej podróży. Zawstydzenie pojawia się, ponieważ to nie świadome „Ja” wykonało pracę, a mimo to pochwały są adresowane do niego. Praca Williego sprawia mu przyjemność i satysfakcję, ponieważ najbardziej lubimy robić to, czego nie musimy świadomie kontrolować przez cały czas. W stanie przepływu Willie jest tym, co robi. Praca, którą wykonuje wymaga udziału pojedynczego eksperta, angażującego równomiernie własną głowę i ręce. Wiedza, którą wydobywa z ofert podczas pracy jest całością — dotyczy w tym samym stopniu materiału nad którym pracuje, co samego bricoleura. Williego stworzyła świadomie narzucona dyscyplina, która pozwoliła mu — w warunkach warsztatu — nieświadomie generować wiedzę kinestetyczną tworzącą jego unikalny ekotyp poznawczy. 4. Ekotypy poznawcze człowieka — próba typologii Tworzenie i postrzeganie ofert — odpowiednio — ucieleśnia i wydobywa wiedzę. Tak długo jak wiedza zakłada istnienie poznającego, podmiotowość poznającego będzie epistemologicznym problemem. Modyfikowanie sposobów poznawania rzeczywistości — drogą konstruowania i wydobywania ofert otoczenia — było, jest i będzie powiązane z modyfikowaniem podmiotu poznania. Innymi słowy, historia poznania jest historią kształtowania pewnych typów ludzkiej podmiotowości. Tam gdzie podmiot pojawia się zarówno w obszarze tworzenia, jak i postrzegania ofert, tam siłą rzeczy pojawia się kwestia wartości. Nie zawsze mamy do czynienia z tym samym rodzajem wartości i z tym samym rodzajem podmiotowości: ludzkie wartości i ludzka podmiotowość mają swoje historie. Epistemiczne wartości zmieniają się, a podmiot poznania ewoluuje. Podmiot poznania może jednak podlegać tylko takim zmianom, jakie są uzasadnione wartościami epistemicznymi (Daston & Galison 2007).6 Epistemiczne wartości kształtują podmiot poznania i sposób w jaki to robią pokrywa się ze sposobami na które postrzeganie ofert przekształcane jest w wiedzę o otoczeniu. Praktyki zdobywania wiedzy o otoczeniu poznawczym uznawane za poprawne według pewnych war6 Rodzaje wartości epistemicznych, które przyjmuję w niniejszym tekście oraz konsekwencje poznawcze i ontologiczne ich wyróżnienia są zaadoptowanym podziałem zaproponowanym przez Daston & Galiston 2007. Ekotypy poznawcze człowieka 91 tości epistemicznych, mogą zostać odrzucone na gruncie wartości odmiennych. Typy podmiotów poznania zdefiniowane przez wartości epistemiczne wydobywane z gibsonowskich ofert nazywać będę ekotypami poznawczymi człowieka. Jakie zatem wartości epistemiczne oferuje otoczenie człowieka, czyli jego Umwelt? Przyjrzyjmy się raz jeszcze otoczeniu bricoleura. Wiedza kinestetyczna wydobyta z ofert warsztatu wymagała zrównoważonego udziału umysłu i ciała Williego. Gdy warsztat, jako forma otoczenia poznawczego przestał istnieć, nastąpiła separacja działań, które u bricoleura stanowiły poznawczą jedność: projektowania i produkcji. Działanie produkcyjne zaczęło angażować wyłącznie ciało wyrobnika, a działanie projektowe — wyłącznie umysł inżyniera. Złożoność wiedzy potrzebnej do wytworzenia produktu wzrosła, ale rola konkretnej jednostki ludzkiej w tym całościowym procesie zmalała. Obfitość wariantów przedmiotów w środowisku Williego — owo oportunistyczne wykorzystywanie przez niego zbędnych ‘rupieci’ — wykluczało możliwość reprezentowania ich za pomocą pojedynczych, typowych ofert (co, jak zobaczymy ma miejsce w otoczeniu inżyniera) lub instrumentalizacji ich za pomocą pojedynczych, charakterystycznych ofert (co ma miejsce w otoczeniu wyrobnika). Zamiast reprezentować typ idealny (w otoczeniu inżyniera) lub instrumentalizować konkretne indywiduum (w otoczeniu wyrobnika), oferty w otoczeniu eksperta konstruują przedział normy, czyli poznawczy prototyp. Oferty prototypowe z warsztatu bricoleura funkcjonują jak kierunkowskaz, oznajmujący ludziom pokroju Williego, że te i tamte parametry indywidualnego obiektu, nad którym przyszło im pracować plasują się w przedziale normy, czyli poznawczego prototypu. Ocena, które parametry są normą, a które poza nią wykraczają, wymaga ze strony bricoleura — którego nazwijmy ekotypem heideggerowskim — ekspertyzy w obszarze postrzegania tych właśnie ofert. Jak pamiętamy, ekspertyza Williego musiała zostać poprzedzona długoletnim, nieformalnym (pozaszkolnym) treningiem. Podstawową zdolnością poznawczą, którą Willie rozwinął w sobie na skutek tego treningu była umiejętność rozpoznawania wzorców. Separacja pracy na elementy mentalne i manualne, jaka dokonała się wraz ze zmianą organizacji pracy (punkt serwisowy, zakład produkcyjny, biuro projektowe) oznaczała modyfikację ekotypów wraz z poprzedzającą ją ewolucją ofert poznawczego otoczenia. Związana z tym była zmiana samego sposobu uczenia się, który z nieformalnego treningu stał się formalnym systemem edukacyjnym. Eksperci pokroju Williego musieli zniknąć, ponieważ formalny system szkolenia podkreślał obiektywny charakter pracy, na przykład napraw. Wiedza potrzebna do ich 92 Maciej Błaszak przeprowadzenia zaczęła być lokalizowana w głowie pracowników punktu serwisowego, a nie w harmonijnym połączeniu ciała i umysłu. Naprawa w coraz większym stopniu przypominała masową produkcję przedmiotu na taśmie montażowej — polegała na usunięciu części wadliwej i zastąpieniu jej częścią nową. Jest to prosta, mechaniczna czynność, precyzyjnie zdefiniowana przez pisemne procedury. Racjonalizacja pracy oznaczała intelektualizację działań pewnych ludzi i mechanizację działań innych. Pracownik serwisu kieruje się — całkowicie mechanicznie — wskazówkami, które zostały zapisane — w trybie całkowicie intelektualnym — wówczas, gdy naprawa została racjonalnie zdefiniowana przez inżyniera. Na innowacyjne działania autorstwa samego bricoleura w tym świecie nie ma miejsca. W jakim otoczeniu poznawczym funkcjonuje zatem inżynier i jakie wartości epistemiczne ucieleśniają oferty pod wpływem których działa? Oferty otoczenia inżyniera — nazwiemy je archetypowymi — wyzwalają działania nakierowane na typ obiektu, bardziej reprezentatywny dla środowiska, czyli bardziej realny niż jakikolwiek konkretny egzemplarz tego obiektu. Działania realizowane przez inżyniera, czyli ekotyp platoński, koncentrują się na taksonomizacji obiektów w środowisku. Jego poznawczym modus operandi jest selekcja, rozumowanie i synteza: oferty na które postrzeżeniowo reaguje aspirują do ogólności przekraczającej gatunek czy rodzaj obiektu. Oferty te reprezentują nigdy nie widziany, niemniej realny archetyp rzeczywistego obiektu. Dobór naturalny i ludzie, którzy stworzyli oferty archetypowe zadbali o to, by wyzwalały one działania ekotypu platońskiego na „to, co naprawdę jest” w środowisku. Otoczenie poznawcze inżyniera standaryzuje zarówno podmiot, jak i przedmiot poznania, eliminując wszelkie specyficzne cechy i osobliwości obiektów w środowisku: one nigdy nie są reprezentowane przez oferty archetypowe. Osobliwości eliminowane przez oferty archetypowe dotyczą nie tylko obiektów, lecz również obserwatorów: inżynierowie pozbawieni są poznawczych odchyleń, emocjonalnych dziwactw czy nawet osobowych profili, tak charakterystycznych dla ekspertów. Mocną stroną ekotypu platońskiego jest umiejętność podjęcia działania w stosunku do indywidualnego obiektu, które będzie działaniem reprezentatywnym dla całej klasy obiektów, a nie dla jednostkowego elementu tej klasy. Pozwala to realizować ideał ekonomii poznania, czyli skrajnie standaryzować bodźce poznawcze, nie dopuszczając do zaatakowania systemów percepcyjnych zbyt dużą ilością informacji. Piętą achillesową ekotypu platońskiego jest natura samego środowiska: przyroda rzadko się powtarza, zmienność obiektów i zdarzeń jest regułą, a nie wyjątkiem. Ekotypy poznawcze człowieka 93 Cechą ambiwalentną w ocenie jest — od strony podmiotu poznania — marginalizacja zmienności międzyosobniczej, czyli minimalizacja roli ‘teorii umysłu’: subiektywnie konstruowane stany mentalne, fenomenalne aspekty przeżyć nie pojawiają się w odpowiedzi na oferty archetypowe. W zachowaniu ekotypu platońskiego dominują behawioralne automatyzmy. Patologicznymi wariantami tego ekotypu jest zespół Aspergera i autyzm. Wartość epistemiczna prawdy, ucieleśniona podczas wytwarzania ofert archetypowych, wymaga idealizacji tych ofert: ekotyp platoński ma nawyk upraszczania rzeczywistości ponad miarę, reprezentowania środowiska po to, by wydobyć jego esencję na poziomie otoczenia poznawczego. Inżynier posługuje się — w dominującym zakresie — własną głową. Z kolei w świecie wyrobnika, w pracy którego dominuje rola rąk, który odczytuje tylko zracjonalizowane procedury autorstwa inżyniera, oferty ucieleśniają wartość epistemiczną neutralności. Wartość ta pozwala środowisku „mówić za siebie” i eliminuje mentalne projekcje podmiotu w fazie tworzenia i odbierania ofert. Ideałem stała się instrumentalizacja ofert, czyli działanie pod ich wpływem w sposób mechaniczny, nie zapośredniczony udziałem umysłu człowieka. Oferty wydobywające wartość neutralności możemy określić mianem ofert monotypowych, czyli identycznych z własnościami przedmiotów w środowisku. O ile oferty archetypowe nakierowywały działania podmiotu na typy obiektów, oferty monotypowe nakierowują działania na indywidualne obiekty. Działania realizowane przez wyrobnika — sportretowanego przez Charliego Chaplina w „Dzisiejszych czasach” — koncentrują się na instrumentalizacji metod zbierania danych o obiektach w środowisku. Metody te tworzą z podmiotu poznania ekotyp kartezjański, którego modus operandi jest przede wszystkim definiowany negatywnie: powstrzymywanie osobistych celów, ambicji i zapatrywań, oraz genialna samokontrola na etapie tworzenia ofert, i brak jakiejkolwiek interpretacji na etapie odbierania ofert. Ekotyp kartezjański ma także swoją mocną stronę: w jego otoczeniu spekulacje o typach obiektów zostają zastąpione szczegółową obserwacją indywidualnych obiektów. Ideałem zdolności poznawczych wyrobnika byłaby fotograficzna pamięć. Wszystkie trzy ekotypy — heideggerowski, platoński i kartezjański — mimo wielu różnic, łączy jedna cecha: obojętnie jak mocno zmieniała się ofertowa struktura otoczenia (prototypowe, archetypowe i monotypowe) i według jakiej reguły oferty wydobywały wiedzę o środowisku — konstrukcji, reprezentacji czy instrumentalizacji — oferty, kształtujące 94 Maciej Błaszak ekotypy, były już ukształtowane w momencie postrzegania ich i podejmowania działań. Otoczenie wszystkich trzech ekotypów jest względnie stabilne, wytworzone w trakcie wcześniejszych działań tego samego podmiotu (ekspert) lub innych podmiotów (inżynier, wyrobnik). Działania człowieka zmieniały jego środowisko tak, by wytworzyć typy otoczenia pasujące do możliwości poznawczych podmiotu, niemniej gdy do aktu poznawczego eksperta, inżyniera i wyrobnika dochodziło, oferty na które reagowali w swoim otoczeniu już tam były — podmiot je zastawał. W ciągu ostatnich dwudziestu lat pojawił się nowy typ otoczenia, w którym akt poznawczy podmiotu nie tyle polega na podejmowaniu działań na istniejące już typy ofert, co na tworzeniu ofert podczas samego działania. Oferty tego typu — nazwiemy je quasitypowymi — nie mają informować podmiotu o środowisku w którym funkcjonuje, o jego typowych obiektach (archetypowe), indywidualnych obiektach (monotypowe), czy podobieństwach rodzinnych między obiektami (prototypowe), co raczej za ich pomocą podmiot poznania ma dopiero stworzyć obiekty środowiska. Oferty quasitypowe muszą być zatem narzędziami służącymi do tworzenia i modyfikacji obiektów poznania. Współrzędna według której oferty quasitypowe tworzą — a nie wydobywają — wiedzę o środowisku może być nazwana interaktywną: modus operandi podmiotu tworzącego takie oferty — nazwijmy go ekotypem normanowskim7 — jest manipulacja, przybierająca w świetle badań kognitywistycznych wiele postaci (na przykład widzenia dla działania z teorii Milnera-Goodale’a). Oferty quasitypowe mogą mieć postać wirtualną i umożliwiać nawigację pomiędzy zbiorami danych (klasyczny layout komputerowy), lub postać haptyczną pozwalającą modyfikować fizyczne obiekty w czasie rzeczywistym (badania w zakresie ubiquitous computing). Manipulowanie ofertami — wirtualnymi i haptycznymi — pozwala podmiotowi stworzyć kolekcję ‘roboczych obiektów’ środowiska, czyli tych, które są stwarzane, a nie odkrywane. Rola obserwacji w rozumieniu adaptacyjnej roli tych obiektów schodzi na plan dalszy — jej miejsce zajmuje interwencja w świat, ustalająca co tak naprawdę w świecie istnieje i do czego może zostać użyte. W otoczeniu ofert już istniejących (pierwsze trzy ekotypy) za realne było uważane to, co możliwie dobrze wyjaśnia strukturę środowiska, jego typy, indywidua i podobieństwa rodzinne. W otoczeniu ofert tworzonych podczas działania, za realne uważa się to, co jest skuteczne w tym środowisku, co może być użyte Donald Norman jest pionierem badań nad procesami poznawczymi człowieka w kontekście użycia interaktywnych narzędzi. 7 Ekotypy poznawcze człowieka TABELA 1. Typologia ekotypów poznawczych człowieka wartość ekspertyza prawda neutralność epistemiczna oferty prototypowe archetypowe monotypowe współrzędna konstrukcyjna reprezentacyjna instrumentalna wydobywania/ tworzenia wiedzy o środowisku ekotyp heideggerowski platoński kartezjański poznawczy kompetencje rozpoznawanie selekcja, rofotograficzna poznawcze wzorców zumowanie, pamięć synteza obiekt rodzina typ obiektu indywidualny poznania obiektów obiekt 95 kreatywność quasitypowe interakcyjna normanowski manipulacja roboczy obiekt do realizacji określonego poznawczego celu. Ekotyp normanowski jest hybrydową istotą, tworzącą w trakcie podejmowanych działań epistemiczną wartość kreatywności. Realizuje własne cele poznawcze, ale zapożycza wiele od eksperta — intensyfikuje jego kompetencje projektanta, wytrwałość wyrobnika, ambicje artysty. Typologię proponowanych ekotypów poznawczych człowieka, wraz z ich charakterystyką ujmijmy w formie tabeli (por. tabela 1). Literatura Bennett, Ch. (2003). How to define complexity in physics, and why. W: N. H. Gregersen (red.) From complexity to life. Oxford: Oxford University Press, s. 34–43. Bennett, Ch. (1987). Demons, engines and the second law. Scientific American, November, s. 108–116. Calude, C. S. (2007). Randomness and complexity: from Leibniz to Chaitin. New Jersey: World Scientific Publishing Company. Csikszentmihalyi, M. (2005). Przepływ. Psychologia optymalnego doświadczenia. Taszów: Biblioteka Moderatora, przekład Magdaleny Wajdy-Kacmajor. Daston, L., P. Galison (2007). Objectivity. New York: Zone Books. Friberg, L. (1991). Auditory and language processing. W: Lassen, N., Ingvar, D., Raichle, M., Friberg, L. (red.) Brain Work and Mental Activity. Alfred Benzon Symposium 31, Copenhagen: Munksgaard, s. 44. Gibson, J.J. (1966). The Senses Considered as Perceptual Systems. Boston, MA: Houghton Mifflin. Gibson, J.J. (1979). The Ecological Approach to Visual Perception. Boston, MA: Houghton Mifflin. Harper, D. (1992). Working knowledge. Skill and community in a small shop. Berkeley: University of California Press Hayes, B. (2006). Reverse Engineering. American Scientist 94, s. 107–111. 96 Maciej Błaszak Landauer, R. (1961). Irreversibility and Heat Generation In Computing Process. IBM Journal of Research and Development 3, s. 183–191. Levi-Strauss, C. (1969). Myśl nieoswojona. Warszawa: PWN. Schön D. A. (1983). The reflective practitioner: how professionals think in action. New York: Basic Books. Sokoloff, L. (1999). Energetics of functional activation in neural tissues. Neurochemical Research 24, No. 2, s. 321–329. Von Uexkull, J. (1985). Environment (Umwelt) and the inner world of animals. W: G. M. Burghardt (red.) Foundations of comparative ethology. New York: Van Nostrand Reinhold, s. 222–245. Poznań 2009