Studia z Kognitywistyki i Filozofii Umysłu

advertisement
Studia z Kognitywistyki
i Filozofii Umysłu
Tom 3
Poznań 2009
Studia z Kognitywistyki
i Filozofii Umysłu
Tom 3
Poznań 2009
REDAKCJA
Redaktor naczelny:
Andrzej Klawiter
Redaktorzy:
Wioletta Dziarnowska
Piotr Przybysz
Mariusz Urbański
Sekretarz redakcji:
Paweł Łupkowski
ADRES
Instytut Psychologii UAM
ul. Szamarzewskiego 89a
60-568 Poznań
pok. 97
http://www.skfu.amu.edu.pl
[email protected]
Skład w systemie LATEX
P. Łupkowski i M. Urbański
Spis treści
Reprezentacje umysłowe (red. działu Urszula M. Żegleń)
WŁODZISŁAW DUCH
Reprezentacje umysłowe jako aproksymacje stanów mózgu 5
MARCIN MIŁKOWSKI
Reprezentacje w systemach klasycznych i koneksjonistycznych 29
PIOTR MARKIEWICZ
Procesy wyobrażeniowe on-line 43
ADRIANA SCHETZ
Widzieć krawędzie, dotykać głębi, czyli współczesne rozważania
dotyczące pytania Molyneux 55
Umysł a środowisko
MACIEJ BŁASZAK
Ekotypy poznawcze człowieka 81
Reprezentacje umysłowe jako
aproksymacje stanów mózgu
Włodzisław Duch
Uniwersytet Mikołaja Kopernika w Toruniu
Katedra Informatyki Stosowanej
Streszczenie. Neuronauki dokonały znacznego postępu w rozumieniu
wyższych czynności poznawczych, w tym procesów decyzyjnych. Brakuje
jednak zarówno prostych modeli, które pozwolą wyobrazić sobie te procesy, jak i głębszej refleksji nad wpływem tych wyników na zrozumienie
natury umysłu, rozproszenia obaw, że nie jesteśmy tylko automatami.
Płodny punkt widzenia na kwestię reprezentacji mentalnych daje próba
zrozumienia, w jaki sposób informacja reprezentowana jest przez mózgi, jak w przybliżony sposób opisać stany mózgu tak, by można je było
zinterpretować jako reprezentacje mentalne odnoszące się do umysłu.
Czym jest w nas to, co podejmuje decyzje? Jest to kluczowa kwestia dla
zrozumienia wielu zagadnień klasycznej filozofii, od wolnej woli i problemu ciała i umysłu poczynając. Chociaż iluzja homunkulusa jest silna
można się od niej uwolnić. Analiza procesów podejmowania decyzji wymaga zrozumienia w jaki sposób zakodowane są w mózgu najprostsze
pojęcia. Jedynie przez aproksymację fizycznych stanów mózgu, zawierających znacznie więcej informacji niż stany mentalne, możemy dokonać
istotnego postępu w rozumieniu i opisie reprezentacji mentalnych, przydatnych nie tylko filozofom, ale też mających zastosowania w analizie
języka naturalnego, kategoryzacji pojęć w psychologii i architekturach
kognitywnych w sztucznej inteligencji. Ucieleśnienie jak i enaktywizm
są dla rozwoju reprezentacji pojęć bardzo istotne ale nie wystarczające.
Po analizie współczesnej wiedzy o reprezentacji pojęć w mózgu zaprezentowano podejście oparte o język układów dynamicznych, które oferuje
dość prosty opis, pozwalający zrozumieć zaskakujące, często nieracjonalne decyzje podejmowane przez ludzi. Dzięki symulacjom komputerowym można się spodziewać znacznego postępu w rozumieniu reprezentacji mentalnych i wyższych czynności poznawczych, w szczególności
procesów podejmowania decyzji.
Studia z Kognitywistyki i Filozofii Umysłu, 3: 5–28, 2009
c 2009 Włodzisław Duch
Copyright 6
Włodzisław Duch
1. Wstęp
Proste organizmy działają w sposób reaktywny, w oparciu o genetycznie uwarunkowane mikroprogramy zachowań. Mucha zamknięta
w pokoju lata tak długo, aż zużyje całą dostępną jej energię. Latanie
z gwałtowną zmianą kierunku jest zapewne dobrą strategią unikania
drapieżników (ptaków, nietoperzy), przy jednoczesnej eksploracji dużego obszaru w sposób częściowo chaotyczny, a częściowo ukierunkowany
przez stężenia zapachów. Latanie w zamkniętym pomieszczeniu nie jest
jednak dobrą strategią, ale mucha nie potrafi jej zmienić. Na przykładzie insektów widać najlepiej związek pomiędzy wyuczonym a instynktownym zachowaniem, oraz ograniczenia z tego wynikające (De Marco
i Menzel 2008). Zdolności komunikacyjne i nawigacyjne pszczół i innych
insektów są zaskakująco duże, pomimo stosunkowo prostego układu
nerwowego. Bodźce zmysłowe wyzwalają sekwencje mikroprogramów
sterujących zachowaniem w ewolucyjnie korzystny sposób, jednakże
procesy rozwojowe mogą zmodyfikować te zachowania.
Niewiele wiadomo o szczegółach oddziaływania pomiędzy wrodzonymi a wyuczonymi formami zachowań. U insektów dominują wrodzone
formy zachowań, u zwierząt posiadających bardziej złożone mózgi instynktowne zachowania są w coraz większym stopniu modyfikowane,
a u ludzi zwykle są dość głęboko ukryte. Jednak nawet u mrówek obserwujemy duże zdolności adaptacyjne wynikające z zależnych od kontekstu i unikalnych dla każdej kolonii bodźców zapachowych, pozwalających na sprawne działanie uwzględniające czas i miejsce pojawienia
się określonych bodźców. Oprócz zapachu owady wykorzystują wzrok,
smak, dotyk i odczuwanie mechanicznych wibracji. Mrówki porywające larwy innych gatunków w celu pozyskania robotników wykorzystują
zjawisko wdrukowania (imprintingu).
Rodney Brooks wprowadził artykułem „Słonie nie grają w szachy”
(Brooks 1986) nowe tendencje rozwojowe w robotyce, odrzucając pomysły budowania symbolicznych modeli umysłu opartych na wewnętrznych reprezentacjach stanów świata. Inteligentne zachowania prostych
organizmów nie wymagają od nich przechowywania wewnętrznych reprezentacji, chyba że za takie uznać zbiór zależnych od kontekstu reakcji. Brooks próbował pokazać, że można stworzyć inteligentnego robota
formując jego mózg, modelowany za pomocą sieci neuronowych, w naturalny sposób przez oddziaływanie otoczenia, podobnie jak rozwija się
mózg dziecka. Był to zasadniczy odwrót od wcześniejszych prób budowy
sztucznej inteligencji na czysto logicznych podstawach, przy całkowitym ignorowaniu biologii. Głównym projektem, mającym udowodnić
słuszność takiego podejścia, miała być budowa robota o nazwie Cog
Reprezentacje umysłowe jako aproksymacje stanów mózgu
7
(Brooks i Stein 1994). Próba ta nie zakończyła się jednak powstaniem
umysłu na wzór ludzki, a jedynie zbiorem odruchów pozwalających na
proste reakcje. Pomimo tego robotyka rozwojowa stała się obecnie bardzo ważną dziedziną, powiązaną w psychologią rozwojową, a nadzieje
na rozwój bardziej złożonych form poznania i działania są nadal silne.
Jest to ciekawy eksperyment pomagający wyznaczyć granice pomiędzy
wrodzonymi a wyuczonymi umiejętnościami. Jakiejś formy reprezentacji nie da się jednak uniknąć.
W tym artykule spróbuję pokazać, że płodny punkt widzenia na kwestię reprezentacji mentalnych daje próba zrozumienia, jak informacja
reprezentowana jest przez mózgi, jak w przybliżony sposób opisać stany
mózgu tak, by można je było zinterpretować jako reprezentacje mentalne odnoszące się do umysłu. Zacznę jednak od paru uwag na temat
natury umysłu i iluzji homunkulusa.
2. Homunkulus
Większość badań psychologicznych i rozważań filozoficznych krytycznie podchodziła do neurobiologicznych podstaw procesów podejmowania decyzji i myślenia. Jedną z przyczyn tej niechęci mogła być
silna, chociaż rzadko w pełni uświadamiana, wiara w homunkulusa,
nadrzędne „ ja”, które pociąga za sznurki i wydaje decyzje realizowane przez mózg. W historii ludzkiej myśli jedynie tradycje, wywodzące
się z kontemplacyjnych szkół religijno-filozoficznych Indii, rozwinięte
na Dalekim Wschodzie (Chiny, Korea, Japonia), zdołały uwolnić się od
iluzji homunkulusa. W jednym z najczęściej recytowanych w buddyjskich klasztorach całej Azji Południowo-Wschodniej i Dalekiego Wschodu tekstów, Maha Pradżnia Paramita Hridaja Sutra (w swobodnym
tłumaczeniu oznacza to „Sutra Serca Wielkiej Mądrości Osiągającego Drugi Brzeg”), podkreślane jest to bardzo mocno (Austin 1988).
W tym krótkim tekście Budda wyjaśnia swojemu uczniowi Sariputrze,
czym jest wyzwolenie od cierpienia związane z odrzuceniem wszelkich
złudzeń. W filozofii indyjskiej (Radhakrishnan 1958) ludzka osobowość
uważana była za wytwór pięciu złożonych elementów, czyli skandh (dosłownie „skupisk”, co wskazuje na przybliżony sposób opisu). Te elementy to forma, uczucia, postrzeganie, wola i świadomość. Mędrzec
postrzega, że każda z nich istnieje tylko jako zmienna konfiguracja relacji elementów, pozbawiona rzeczywistej substancji – w tekście Sutry
czytamy: „w głębi mądrości ujrzał pustkę wszystkich pięciu skandh”.
Wszystkie sfery zmysłowe i akty odczuwania mają iluzoryczną naturę.
Formy przeżywanych wrażeń nie mają trwałej tożsamości, są chwilową
konfiguracją pobudzeń mózgu, co w „Sutrze Serca” lapidarnie określa
8
Włodzisław Duch
się jako „forma jest tylko pustką, pustka jest tylko formą”. Podobnie
pozostałe elementy: „Uczucia, myśli, wola i świadomość sama są również takie”. Sutra ta przetłumaczona została na język chiński około 172
roku. W znacznie późniejszym tekście Hsin hsin ming („Wersety Wiary w Umysł”), napisanym przez Seng-tsana, trzeciego patriarchę Zen
(zmarłego w 606 roku), czytamy (Kapleau 1992, s. 173):
Rzeczy się jawią za sprawą umysłu,
za sprawą rzeczy umysł się pojawia.
To umysł pozwala nam odróżnić od siebie rzeczy w świecie, a świat
pozwala mu się utworzyć — przyczyna nie da się odróżnić od skutku, gdyż nie ma tu prostej liniowej przyczynowości. W pieśni Zazen
Wasan Hakuina czytamy (Kapleau 1992, str. 169): „Wtedy brama do
jedności przyczyny i skutku zostanie otwarta na oścież”. Dzięki głębokiej introspekcji starożytni myśliciele uwolnili się od idei homunkulusa,
owego „ ja” sterującego ciałem i podejmującego decyzje. Odrzucenie
homunkulusa i uznanie, że człowiek jest jednością psychofizyczną, jest
jednak rzeczą bardzo trudną i niektóre tradycje buddyjskie zrobiły tu
krok wstecz, głosząc mgliste idee zachowania „strumienia świadomości”
(Duch 2006). Powstaje bowiem głęboko zakorzeniona obawa, że jeśli jestem tylko swoim mózgiem i ciałem, to „mnie” tak naprawdę nie ma.
Ta obawa jest (nie zawsze uświadomioną) motywacją do poszukiwania alternatywnych rozwiązań problemu podejmowania decyzji. Eccles
i Popper w książce Mózg i jaźń (1999) głoszą potrzebę dualistycznego
rozumienia człowieka twierdząc, że bez niej nie można uzasadnić ludzkiej godności. Echa takiego myślenia widać w wierszu „Zdania” Stefana
Mellera (2008): „Trzecie najgłupsze zdanie / Jakie znam to: / — jestem
niewierzący — / Bo znaczy tyle co / Wiem, że mnie nie ma”. Czym
jest w nas to, co podejmuje decyzje? Jest to kluczowa kwestia dla zrozumienia wielu zagadnień klasycznej filozofii, od wolnej woli i problemu
ciała i umysłu poczynając, ma też ważne implikacje teologiczne, leży
u podstaw dualistycznych wizji człowieka. Chociaż filozofowie, fizycy
i neurobiolodzy włożyli dużo wysiłku w opracowanie modeli dualistycznych, żaden z nich nie pogłębia rozumienia procesów umysłowych i nie
widać w tym kierunku żadnego postępu.
W ostatnich latach dzięki neuronaukom dokonał się znaczny postęp
w rozumieniu wyższych czynności poznawczych, w tym procesów decyzyjnych. Brakuje jednak zarówno prostych modeli, które pozwolą wyobrazić sobie te procesy, jak i głębszej refleksji nad wpływem tych wyników na zrozumienie natury umysłu, rozproszenia obaw, że nie jesteśmy
tylko automatami. Badania nad mózgiem nie są zagrożeniem dla godności ludzkiej, a stwierdzenie „mnie nie ma” jest po prostu fałszywe.
Reprezentacje umysłowe jako aproksymacje stanów mózgu
9
Sprowadza się to do ustalenia, czy „ ja” i jego decyzje to jeden z wielu
zachodzących w mózgu procesów, czy też jest to autonomiczny, nadrzędny, niematerialny czynnik kontrolujący mózg i ciało. Z naukowego
punktu widzenia nie ma wątpliwości, że „ ja” jest jednym z wielu procesów zachodzących w mózgu. Neurobiologia jaźni rozwija się bardzo
szybko (Northoff i Panksepp 2008). Komputerowe modele chorób psychicznych i syndromów neuropsychologicznych (Duch 2007) pozwalają
przynajmniej w jakościowy sposób zrozumieć przyczyny patologii i normalnego funkcjonowania mózgu, Nie ma wątpliwości, że dokładniejsze
modele procesów nagrody i procesów decyzyjnych pozwolą na odtworzenie rezultatów eksperymentów w tej dziedzinie. Rozumienie autonomiczności jaźni jako jednego z procesów realizowanych przez mózg pozostawia nadal wiele do życzenia. Dlatego pozwolę sobie na kilka uwag
na ten temat, chociaż głównym celem tego artykułu jest przedstawienie prostego modelu pozwalającego na zrozumienie relacji pomiędzy
neurodynamiką opisującą zachodzące w mózgu procesy, a symboliczną
interpretacją procesów decyzyjnych.
Procesy zachodzące w tkankach neuronowych mózgu są warunkiem
koniecznym istnienia umysłu i powstania jaźni, podobnie jak warunkiem powstania jakiejkolwiek struktury biologicznej jest jej realizacja
w oparciu o związki chemiczne zbudowane z atomów węgla i innych pierwiastków. Jednakże struktura organizmów biologicznych, przyczyna
istnienia licznych organów spełniających specyficzne funkcje, jest wynikiem milionów lat rozwoju, adaptacji ewolucyjnych umożliwiających
sprawne działanie pozwalające na przetrwanie gatunku w zmiennych,
niekorzystnych warunkach. Nie można jej zrozumieć badając samą budowę organizmu, strukturę genomów i białek. Koncepcja autopoesis
nie oddaje tu istoty rzeczy, gdyż dotyczy tylko systemowej organizacji
reprodukujących się układów, podczas gdy nacisk trzeba położyć na
ewolucyjny sens emergentnych własności. Analogicznie, badanie procesów neuronowych nie pozwoli w pełni zrozumieć indywidualnego umysłu, którego istotą jest specyficzna struktura relacyjna przyjmowanych
przez mózgi stanów. Sensu tych relacji nie da się zrozumieć w oparciu
o procesy neurofizjologiczne, bo procesy, które odpowiadają za stany
mentalne, mają rację bytu tylko ze względu na istnienie umysłu wynikającego z niepowtarzalnej historii jednostki.
Obserwacja przejścia pomiędzy stanami Ψα i Ψβ mózgu jest tylko zewnętrznym opisem zmian w nim zachodzących; by zrozumieć perspektywę wewnętrzną trzeba odwołać się do historii organizmu, skojarzyć
w intencjonalny sposób stany Ψα i Ψβ z kontekstem środowiskowym,
w którym podobne stany występowały wcześniej. Np. stan Ψ1 może
wiązać się z wspomnieniem dawnej melodii, wywołując szereg skojarzeń
10
Włodzisław Duch
Ψ2 , Ψ3 , . . . , Ψν , a więc stanów mentalnych realizowanych przez kolejne
pobudzenia mózgu. Zależą one od kultury, w której wychowała się dana osoba, co można zweryfikować za pomocą metod neuroobrazowania
(Northoff i Panksepp 2008). Dotyczy to również podstawowych mechanizmów poznawczych: Europejczycy zwracają większą uwagę na obiekty pierwszoplanowe, zapamiętując dotyczące ich szczegóły, Japończycy
bardziej na relacje pomiędzy obiektami i całym środowiskiem. Różnice
te widoczne są nawet w prostych eksperymentach, w których Europejczycy zapamiętują lepiej położenie pręta w ramce, nie zwracając uwagi
na położenie ramki, które wpływa na percepcję Japończyków. Znajduje
to odbicie w różnicach aktywności pomiędzy obszarami mózgu odpowiedzialnymi za przetwarzanie informacji o widzianych obiektach (boczna
kora potyliczna) oraz o tle, w jakim się pojawiają (zakręt przyhipokampowy). Wspomnienia Chińczyków związane są bardziej z sytuacją
społeczną niż ich indywidualną rolą, jak to się dzieje w przypadku ludzi
Zachodu.
Poznawcze neuronauki społeczne (ang. social cognitive neurosciences) odkrywają wiele takich zależności na różnych poziomach. Szczególnie interesujące są badania wpływu kultury na pojęcia związane
z „ ja”, stanowiące podstawę do autorefleksji i samoświadomości. Ocena, czy dana cecha, wyświetlana na monitorze, pasuje do badanej osoby prowadzi u niej do zwiększonej aktywności brzuszno-przyśrodkowej
części kory przedczołowej (VMPFC) oraz przylegającej do niej przykolankowej przedniej części zakrętu obręczy (pACC). Pojęcia odnoszące się w różny sposób do „ ja”: pamięci autobiograficznej, reakcji
emocjonalnych, relacji społecznych, rozpoznawania twarzy, odczuć, że
jest się sprawcą działania i innych aspektów „siebie”, prowadzą do aktywacji różnych części przyśrodkowych obszarów kory (Northoff i in.
2006). Silniejsza aktywacja VMPFC u ludzi z Zachodu nie obejmuje bliskiej rodziny, podczas gdy u Chińczyków odnosi się zarówno do
siebie jak i własnej matki. Nawet przekonania religijne znajdują swoje odzwierciedlenie w różnym rozkładzie pobudzeń pomiędzy brzuszną (VM) i grzbietowo-przyśrodkową (DM) częścią kory przedczołowej
(PFC). Aktywność DMPFC wiąże się z teorią umysłu (Frith i Frith
2005), czyli zdolnością do przypisywania stanów mentalnych innym ludziom i widzenia świata z ich perspektywy. Przekonania religijne wydają się więc wpływać na zmniejszenie egocentrycznej perspektywy na
rzecz oceny siebie z perspektywy zewnętrznej.
Techniki eksperymentalne używane w badaniach transkulturowych
pokazują wpływ środowiska na mechanizmy poznawcze i reprezentacje
mentalne determinujące postrzeganie siebie i innych. Ten wpływ może
wykraczać poza modulację ustalonych wzorców działania mózgu, może
Reprezentacje umysłowe jako aproksymacje stanów mózgu
11
to być wpływ decydujący o powstaniu pewnych dynamicznych struktur
w oparciu o neuronalny substrat. Pod względem ogólnej budowy zdrowe
mózgi są do siebie podobne, ich struktura neuroanatomiczna powstała
w wyniku długotrwałych procesów ewolucyjnych. Potrzeby organizmu
i jego możliwości poznawcze, znajdujące odbicie w strukturze mózgu,
stwarzają ramy dla powstania subiektywnego obrazu świata. Jednak
struktura połączeń w mózgu, decydująca o możliwych do powstania
stanach mentalnych, jest wynikiem indywidualnej historii. Zrozumienie
relacji pomiędzy następującymi po sobie stanami mentalnymi możliwe
jest tylko przy uwzględnieniu tej indywidualnej historii, włącznie z intencjonalnymi odniesieniami stanów umysłu do stanów świata. Dlatego
algorytmiczne wyjaśnianie stanów umysłu nie jest możliwe bez symulacji indywidualnej historii, a więc symulacji stanów całego świata, który
się na nią składa. Jeśli nawet uznamy umysł za realizację pewnego algorytmicznego procesu wykonywanego przez mózg, to autonomię decyzji
zapewnia jego indywidualna historia, częściowo zapisana w śladach pamięci epizodycznej, semantycznej i proceduralnej, a częściowo wyryta w
całej strukturze mózgu, określającej jego potencjalnie dostępne stany
dynamiczne, określającej indywidualne cechy osobowości. W każdym
konkretnym przypadku za decyzje podejmowane przez człowieka odpowiedzialna jest neurodynamika jego mózgu. Wpływają na nią wszystkie
wymienione wyżej czynniki, jak też i stan biochemiczny mózgu, związany z ogólnym stanem organizmu, zdrowiem, pożywieniem, wysiłkiem,
snem i wieloma innymi czynnikami. Większość podejmowanych decyzji
interpretowana jest jako decyzje „ ja”, chociaż czasami „ ja” zaskakiwane jest przez „swoje” działania, których potem żałuje lub uznaje za
nieprzemyślane.
Do rozbieżności dochodzi w kilku sytuacjach. Jeśli mam zbyt mało
czasu by skorygować plany działania podsuwane przez mózg zgodnie ze
swoimi celami i wartościami mogę powiedzieć lub zrobić coś nieodpowiedniego. Jeśli czas pozwala na refleksję może się okazać, że nie znam
sam siebie, zrobię coś, z czego będę niezadowolony, gdyż moje przewidywania własnych reakcji jest niezgodne z rzeczywistością, a więc „ ja”
ma błędny model przewidywań neurodynamiki mózgu. Może się też
pojawić silny przymus wewnętrzny, który pomimo prawidłowej oceny
szkodliwości decyzji nie pozwoli na jej zablokowanie, jak to się dzieje
w przypadku silnych uzależnień. Można mieć całkiem fałszywe wyobrażenie o sobie i swoich intencjach. Szczególnie zaskakujące są przypadki
zaburzeń postrzegania przestrzeni. Heterotopagnosia jest niezdolnością
do wskazywania innych osób w przestrzeni pozapersonalnej; pacjenci
odnoszą wszystko do siebie, niektórzy nie są zdolni do określenia granic
swojego „ ja”. Poznanie „samego siebie”, do którego wzywali starożyt-
12
Włodzisław Duch
ni mędrcy, nie jest łatwym zadaniem, a odwarunkowanie, pozbycie się
złudzenia istnienia homunkulusa, jest rzeczą nadzwyczaj trudną (Austin 1998, 2006). Dokładna symulacja umysłu jest nieprawdopodobna,
można jedynie myśleć o pewnych aproksymacjach, pozwalających zrozumieć procesy podejmowania decyzji.
Taki obraz człowieka jest równie odległy od starożytnych wyobrażeń
co świat geocentryczny od współczesnej astronomii. Z jednej strony
mamy materialny substrat, ale z drugiej strony niezliczone potencjalne stany relacyjne tego substratu, stany które mają odmienny status
ontologiczny. Z perspektywy wewnętrznej mamy świat wirtualny, świat
intencjonalnych odniesień do rzeczy, sytuacji czy ludzi, którzy mogą
już nie istnieć. Nie jest to świat materialny, chociaż do jego istnienia konieczne są materialne stany mózgu. Człowiek jest nie tylko psychofizyczną całością, jest czymś więcej niż tylko swoim „ ja”, mózgiem
czy organizmem, jest też zogniskowanym odbiciem wielu zdarzeń, które
wpłynęły na uformowanie jego umysłu, od relacji rodzinnych, ogólnego
wychowania i wykształcenia, po indywidualne i niepowtarzalne przeżycia, które go uformowały. Podmiotowość, autonomia i odpowiedzialność
nie odnoszą się do „ ja”, jednego z wielu procesów realizowanych przez
mózg, ale do całego człowieka.
3. Wiedza koncepcyjna w mózgu
Analiza procesów podejmowania decyzji wymaga zrozumienia w jaki sposób zakodowane są w mózgu najprostsze pojęcia. Badania nad
reprezentacją symboli są bardzo trudne: badania na zwierzętach niewiele mówią o języku, a bezinwazyjne metody neuroobrazowania nie
są dostatecznie precyzyjne by ujawnić dokładne konfiguracje pobudzeń
neuronów powstające w czasie używania jakiegoś pojęcia. Mamy jednak dość spójny model, oparty na synchronicznej aktywności grup neuronów (NCA, neural cell assemblies), opisujący wyniki badań neurolingwistycznych (Damasio i in. 1996;Pulvermuller 2003; Dehaene i in.
2005), zgodny z ogólnymi mechanizmami pamięci (Lin, Osan, Tsien
2006). Słowa, lub bardziej ogólnie symbole, mają swoją formę (nazwę,
wygląd) i swoje znaczenie. Forma symboli reprezentowana jest w mózgu
przez silnie ze sobą połączone lokalne podsieci mikroobwodów neuronalnych, które wiążą ze sobą akustyczne (lub wizualne) i artykulacyjne
wzorce pobudzeń, pozwalając na ich identyfikację i wymowę. Znaczenie słów reprezentowane jest przez pobudzenia mózgu, skojarzone z ich
formą fonologiczną i ortograficzną, łączące ze sobą percepcję i działanie, aktywujące korę zmysłową, ruchową, przedruchową i obszary podkorowe, tworząc rozszerzone reprezentacje pojęć (Pulvermuller 2003).
Reprezentacje umysłowe jako aproksymacje stanów mózgu
13
Rozszerzona część reprezentacji pojęcia jest rozkładem pobudzeń obszarów kory zmysłowej i ruchowej, co można utożsamiać z qualiami
(interpretacja aktywności kory zmysłowej o różnej intensywności i rozkładzie) i predyspozycjami do działania. Z wewnętrznego punktu widzenia, w przestrzeni aktywacji systemu neuronów zakodowana jest w ten
sposób nie tylko sieć pojęciowych relacji, ale również Hebbowskie korelacje pomiędzy postrzeganymi elementami na wielu poziomach, dające
pewien model świata postrzeganego przez pryzmat qualiów.
Eksperymenty psycholingwistyczne dowodzą, że analogowy sygnał
akustyczny, docierający do ucha, zamieniany jest w pierwotnej korze
słuchowej na reprezentację fonologiczną, składającą się z dyskretnych
elementów. Niewielki zbiór fonemów łączy się ze sobą w czasowo uporządkowany sposób tworząc utrzymujący się przez ułamki sekundy stan
rezonansowy, reprezentujący formę słowa. Z badań nad potencjałami
wywołanymi wynika, że już po 90 milisekundach następuje aktywacja
rozszerzonych podsieci kory zmysłowej a po 200 ms widać aktywność
kory ruchowej, która odnosi sens danego słowa do możliwości działania w świecie (Pulvermuller 2003). Rozpoznawanie mówionego słowa
lub postrzeganego symbolu jest skomplikowanym procesem, w którym
istotną rolę pełni torowanie (zmniejszanie progu pobudliwości grup neuronów) na poziomie morfologicznym, gdy rozpoznane fragmenty (fonemy, grafemy) aktywują wiele rzeczywistych słów jak i słowopodobnych
kombinacji. Słowa polisemiczne mają jednakową reprezentację fonologiczną, ale kontekst prowadzi do automatycznej aktywacji odmiennych
podsieci, tworząc odpowiednie rozszerzenia semantyczne. Okada i Hickok (2006) kontrastując słowa należące do obszarów o dużej gęstości
fonologicznej (podobne ze względu na brzmienie do wielu słów) i słowa o małej gęstości (unikalne brzmienie) pokazali, że łączenie pobudzeń fonologicznych w reprezentacje leksykalne zachodzi w tylnej części bruzdy skroniowej górnej (STS). Kilku autorów, w tym Dehaene
i współpracownicy (2005), twierdzili, że w lewej bruździe skroniowopotylicznej mieści się obszar wzrokowej formy słów (Visual Word Form
Area, VWFA), który reaguje u ludzi potrafiących czytać i pisać tylko
przy prezentacji słów w formie pisanej. Jest to nadal twierdzenie kontrowersyjne, krytykowane np. w pracy Price i Devlin (2003). Leżący
w pobliżu boczny dolnoskroniowy obszar wielomodalny (Lateral Inferotemporal Multimodal Area, LIMA) reaguje zarówno na bodźce słuchowe
jak i wzrokowe, i ma projekcje do obszarów fonologicznych jak i rozszerzonych (Gaillard i in. 2006). Jest dość prawdopodobne, że w strumieniu przetwarzającym informacje słuchowe istnieje obszar homologiczny
do VWFA, położony w przedniej części lewej bruzdy skroniowej, chociaż dane na ten temat są nadal kontrowersyjne (Dehaene i Naccache
14
Włodzisław Duch
2001; Dehaene i in. 2005). W każdym razie przetwarzanie mowy zmierza (Hickok, Poeppel 2007) od sygnału akustycznego (grzbietowe części
STS, bruzdy skroniowej górnej, w obu półkulach) przez dyskretne, elementarne segmenty (fonemy, środkowa i tylna część STS), do nieco
bardziej złożonych struktur sylabicznych, a następnie morfemów (tylna część MTG i ITS, środkowego zakrętu skroniowego i dolnej bruzdy
skroniowej) stanowiących elementarne jednostki leksykalne. Są one połączone z wieloma obszarami kory i ośrodkami podkorowymi. Wreszcie
informacja o znaczeniu słowa analizowana jest w przedniej części lewego płata skroniowego (ATL, Anterior Temporal Lobe), który ma dostęp
zarówno do leksykalnych jak i rozszerzonych reprezentacji. Lateralizacja mowy dotyczy głownie tego obszaru, oraz obszaru Broca związanego
z artykulacją mowy.
RYS. 1. Organizacja przetwarzania informacji fonologiczno-leksykalnej w modelu, który
zaproponował Hickok, Poeppel (2007). Objaśnienia skrótów w tekście.
W anomii wzrokowo-przedmiotowej pacjenci mają trudności z prawidłowym nazywaniem oglądanych przedmiotów, ale dotykając ich lub
wskazując, do czego mają służyć, nie robią wielu błędów. Caramazza
i jego koledzy (2006) zaproponowali do wyjaśnienia rezultatów eksperymentów z takimi pacjentami hipotezę unitarnej organizacji wiedzy
koncepcyjnej (Organized Unitary Content Hypothesis, OUCH), opartą na preferencjach pomiędzy specyficznymi modalnościami i różnymi
typami informacji semantycznej. Hipoteza uprzywilejowanego dostępu
może również wyjaśnić przypadki anomii specyficznych kategorii semantycznych, w których np. trudności w nazywaniu dotyczą tylko kategorii zwierząt, ale nie roślin. Caramazza i Mahon (2006) proponują
hierarchiczną organizację wiedzy, w której istnieje kilka domen o specyficznej organizacji (ludzie, zwierzęta, rośliny, narzędzia), różniących się
rodzajem (również modalnością) informacji na temat obiektów danego
typu. Organizacja wiedzy pojęciowej w mózgu powinna być różna w zależności od obiektu, z którym mamy do czynienia. Np. rozpoznawanie
twarzy jest specyficzną funkcją, która ma zastosowanie tylko w stosunku do ludzi (lub ogólniej, osobników tego samego gatunku).
Reprezentacje umysłowe jako aproksymacje stanów mózgu
15
Tego rodzaju reprezentacja pojęć umożliwia myślenie symboliczne.
Kontekst powoduje pobudzenie rozszerzonych podsieci, które definiują
(poprzez relacje z innymi pojęciami) znaczenie słów. Wzajemne hamowanie konkurencyjnych procesów w mózgu zapewnia ograniczenie sensownych odpowiedzi i działań do tych, które są łatwo osiągalne w tak
pobudzonej sieci. Podobieństwo fonologiczne i semantyczne pomiędzy
słowami może prowadzić do podobnych aktywacji mózgu, ale w większości przypadków torowanie całkowicie ujednoznacznia interpretacje
sensu słów — procesy neuronowe typu „zwycięzca bierze wszystko”
(O’Reilly, Munakata 2000) powodują, że nic innego „nie przychodzi do
głowy”.
4. Stany mózgu i ich aproksymacje
Jeśli wyobrażam sobie jakiś konkretny obiekt, np. taki jak „klawiatura”, której właśnie używam, w moim mózgu powstaje wyobrażenie
składające się z pobudzeń uwzględniających w różnym stopniu wkład
ze strony:
. układu wzrokowego: ogólny kształtu obiektu, kształty wyodrębnionych, licznych klawiszy; znaki na tych klawiszach;
. kory czuciowej, ruchowej i przedruchowej: dotyk plastiku i metalu,
ruch palców używanych do naciskania klawiszy, układ dłoni na klawiaturze;
. kory skojarzeniowej: związek klawiatura i urządzeń, do których jest
podłączona (komputera, programu, ekranu);
. kory słuchowej, obszar Broca: reprezentacji dźwięku, wymowy słów
„klawiatura” i „keyboard”.
Każde z tych pobudzeń, będące wynikiem rozchodzenia się aktywacji
w sieci neuronów, można reprezentować przez zmienny w czasie rozkład
prawdopodobieństwa aktywacji określonych grup neuronów. Gdybyśmy
znali zbiór grup neuronów i mieli informację o ich aktywacji w różnych
warunkach, to pobudzenia te można by opisać za pomocą odpowiednich funkcji bazowych ψi (s, Kont), gdzie i jest numerem grupy neuronów (oraz odpowiedniej funkcji bazowej), s jest danym symbolem
(pojęciem) a Kont jest kontekstem, w którym ten symbol się pojawia.
Całkowita aktywacja mózgu, pojawiająca się w wyniku prezentacji symbolu s w kontekście Kont będzie wówczas aproksymowana za pomocą
kombinacji liniowej:
16
Włodzisław Duch
Ψ(s, Kont) =
X
ci ψi (si , Kont)
i
Funkcje bazowe opisują prymitywy percepcyjne, ruchowe, emocjonalne czy abstrakcyjne, coś, co można otrzymać za pomocą neurobrazowania po uśrednieniu aktywacji dla wielu osób by zobaczyć, jakie
obszary mózgu (korowe i podkorowe) się aktywizują przy pojawieniu
się danego pojęcia. Z formalnego punktu każda grupa neuronów, której
aktywność reprezentuje funkcja bazowa, działa jak filtr, wydobywający
pewne cechy z pierwotnych perceptów dotyczących pojęcia odpowiadającego symbolowi s. Percepty niekoniecznie muszą się odnosić do danych zmysłowych, mogą to być skojarzenia czysto wewnętrzne, wynikłe
z pobudzeń kory związanych ze śladami pamięci i skojarzeń pomiędzy
nimi, lub dalece przetworzonych informacji przez wcześniejsze obszary
korowe i podkorowe, z którymi dane pole φi (si , Kont) jest połączone.
Dlatego argumentem tej funkcji bazowej nie jest bezpośrednio s, ale
si , zbiór zmiennych, które wpływają na stan danego pola. Każde pojęcie ma nieco inny sens w zależności od kontekstu, czyli wcześniejszych
aktywacji mózgu (torowania), zmieniając się w różnych skalach czasowych. Widać stąd, że statyczne pojęcia reprezentacji mentalnych lub
próby określenia sensu pojęć za pomocą ontologii czy tezaurusów, mogą być jedynie grubym przybliżeniem do rzeczywistego, dynamicznego
charakteru stanów mózgu.
Pobudzenia kory zmysłowej interpretowane są w jako własności postrzeganych obiektów a ich pierwotnym odnośnikiem jest świat zewnętrzny. Na poziomie reprezentacji mentalnych powinniśmy operować
cechami spostrzeżeń, które możemy zidentyfikować w treści naszych
przeżyć. Oznacza to, że zamiast opisywać stan mózgu jako liczne pobudzenia grup neuronów powinniśmy wprowadzić nowe zmienne, które określają intensywność lub rodzaj jakiegoś postrzeżenia, np. barwy
dźwięku, koloru, kształtu czy szybkości ruchu. Stan mózgu można przetransformować do tej nowej przestrzeni, którą można nazwać przestrzenią umysłu.
Z matematycznego punktu widzenia relacje między stanami mózgu Ψ(s, Kont) a stanami umysłu Φ(s, Kont) sprowadzają się więc
do transformacji pomiędzy przestrzenią aktywacji grup neuronów opisywaną przez bazę ψi (si , Kont) a przestrzenią zdarzeń mentalnych,
której wymiarami są zmienne skorelowane z własnościami dającymi
się wyodrębnić w doświadczeniu wewnętrznym, opisywane przez bazę φi (si , Kont), której elementy można powiązać z bazą aktywacji
ψi (si , Kont). Dotyczy to nie tylko percepcji, np. postrzegania kolo-
Reprezentacje umysłowe jako aproksymacje stanów mózgu
17
ru, gdzie rozkład pobudzeń w obszarze V4 kory wzrokowej da się skorelować z postrzeganą barwą, lecz również wszystkich innych stanów
mentalnych, łącznie ze stanami emocjonalnymi.
Jedną z możliwości opisu powstawania reprezentacji mentalnych jest
aproksymacja za pomocą modeli neuronowych i koneksjonistycznych
(O’Reilly i Munakata 2000). Wymaga to utworzenia sieci neuronowej,
której węzły niczego bezpośrednio nie reprezentują (można je uznać za
nieuświadamialne reprezentacje mikrocech), a dopiero konfiguracje ich
pobudzeń można zinterpretować jako cechy, które odpowiadają perceptom odnoszącym się do analizowanych obiektów. Podejście koneksjonistyczne reprezentuje bezpośrednio te konfiguracje pobudzeń jako węzły
w sieciach na wyższym stopniu abstrakcji niż sieci neuronowe, ukrywa
więc mikrocechy. Rozkład pobudzeń wartości tych cech (pobudzeń węzłów sieci koneksjonistycznej) reprezentuje dany obiekt. W sieciach neuronowych mamy do czynienia z konfiguracjami pobudzeń oscylującymi
wokół średnich wartości rozkładów. W takiej rozproszonej reprezentacji automatycznie pobudzają się skojarzone fragmenty reprezentacji
dla odpowiednich modalności, jest ona więc skoncentrowana na jakiejś
domenie wiedzy koncepcyjnej. Udało się nam (Dobosz i Duch 2009) dokonać wizualizacji trajektorii pokazujących, jak zmienia się z upływem
aktywność wszystkich użytych w symulacji neuronów. Każdy punkt na
rysunku poniżej (por. rys. 2) odpowiada określonej wartości średniej aktywności 140 neuronów w danej chwili czasu. Zagęszczenia trajektorii
reprezentujące atraktory neurodynamiki pokazują, że system fluktuuje
wokół danego pojęcia przez jakiś czas, a następnie przechodzi do pojęć
skojarzonych, nie powraca jednak do tego samego miejsca, bo historia
jego ewolucji zmienia sytuację. Nawet taki obraz jest wielkim uproszczeniem, gdyż zmiany ogólnego pobudzenia (efekty związane z emocjami,
uwagą, zmęczeniem) może w znacznym stopniu zmienić ten krajobraz.
Reprezentacja mentalna jest tu atraktorem neurodynamiki, chwilowym
spowolnieniem zmian aktywacji prowadzącym do kolejnych reprezentacji w procesie, który nazywamy skojarzeniowym. W zależności od stanu
mózgu i historii ewolucji tego stanu krajobraz atraktorów zmienia się
drastycznie, umożliwiając całkiem odmienne skojarzenia.
Funkcje bazowe, które opisują cechy (w tym również qualia) odnoszące się do obiektów mogą być kombinacją pobudzeń wielu neuronów,
które przez odległe projekcje przenoszą informacje o konfiguracjach pobudzeń kory wzrokowej czy czuciowej do innych obszarów mózgu. Pojęcia abstrakcyjne mają wyraźnie uboższe reprezentacje, gdyż nie pobudzają kory zmysłowej ani kory ruchowej.
Prawdopodobieństwo pojawienia się skojarzenia pomiędzy dwoma
stanami mentalnymi obliczyć można jako prawdopodobieństwo przejścia pomiędzy stanem początkowym Ψ(s, Kont) a stanem końcowym
18
Włodzisław Duch
Ψ(s′ , Kont′ ) pobudzenia obszarów mózgu. Te prawdopodobieństwa powinny dać się przybliżyć jako iloczyny skalarne:
< Ψ(s, Kont)|Ψ(s′ , Kont′ ) >
w odpowiedniej metryce. Kontekst jest tu bardzo skomplikowany, gdyż
powinien uwzględnić nie tylko bieżącą sytuację, ale również skupianie
uwagi, zmieniające pobudzenia i powodujące, że mamy różne skojarzenia, zależnie od tego, czy zwracamy uwagę na nazwę (fonologię),
czy formę wizualną, funkcję, czy też wywołane przez dany obiekt emocje. Podobieństwa pomiędzy stanami umysłu są podstawą do tworzenia
kategorii naturalnych. Skupienie różnych stanów mentalnych, silnie ze
sobą skojarzonych (a więc o dużych prawdopodobieństwach przejść pomiędzy nimi), tworzy taką rozmytą kategorię i wszystko co jest z nią
skojarzone – pod względem wyglądu, albo funkcji (czyli możliwości
działania, ruchu) – jest kategoryzowane w podobny sposób. Nie ma
zbioru definiujących cech dla pojęcia „krzesło”, ale różnorakie skojarzenia pozwalają nam rozpoznać dany obiekt jako krzesło. Pobudzenia neuronów odpowiedzialnych za semantykę kategorii naturalnych nie
tworzą zbiorów wypukłych lecz mogą się składać z wielu rozłącznych
reprezentacji (atraktorów), które należą do tej samej kategorii (mają
wspólne reprezentacje fonologiczne).
Rozwinięcia na różne funkcje bazowe stwarzają możliwości różnego opisu stanów mózgu. Może to być zapis wektorowy uśrednionych
wartości współczynników rozkładu na funkcje bazowe φi (si , Kont) dla
danego pojęcia s. Stan mentalny Φ(s) reprezentujący to pojęcie jest
wówczas reprezentowany przez wektor, określający jakie cechy przypisać można danemu pojęciu. Taka reprezentacja stosowana jest często
w analizie języka naturalnego (Manning i Schütze 1999). Brakuje w tej
reprezentacji części związanej z fonetyką słowa, co utrudnia symulacje
kreatywności na poziomie tworzenia słów i rozumienie skojarzeń na poziomie fonologicznym. W typowych zastosowaniach nie jest to konieczne i można takie reprezentacje stosunkowo łatwo rozszerzyć dodając
część związaną z fonologią. Współczynniki wektorowe można interpretować jako prawdopodobieństwa rozkładu pobudzeń różnych obszarów
mózgu, co nadaje pojęciu pewną strukturę, można np. skupić się na
podobszarach ruchowych, w którym jest informacja o tym, co z danym
przedmiotem możemy zrobić, jakie prymitywy ruchowe (reprezentowane za pomocą funkcji bazowych) składają się na takie działanie. Podobieństwa pomiędzy pojęciami są tu więc wynikiem tylko strukturalnych
relacji a pojęcie jest opisane przez mikrocechy, które odnoszą się do jego
Reprezentacje umysłowe jako aproksymacje stanów mózgu
RYS.
19
2.
percepcji, ogólnej wiedzy o nim, jak i możliwych sposobów interakcji
z danym obiektem. W praktyce w reprezentacjach wektorowych brakuje
odnośników do percepcji kształtu i innych własności przestrzennych.
Jeszcze częściej stosowanym przybliżeniem wektorowym jest próba
oceny korelacji statystycznych pomiędzy pobudzeniami poszczególnych
funkcji bazowych dla różnych pojęć. W praktyce ocenia się to na podstawie kookurencji różnych pojęć tekstach (Manning i Schütze 1999).
Do tego przybliżenia można również dojść badając transformacje pomiędzy funkcjami bazowymi reprezentującymi pobudzenia grup neuronów. Tego typu rozważań w analizie języka naturalnego dotychczas
nie robiono, wyprowadzając z rozważań statystycznych reprezentacje
wektorowe, które mają za zadanie uchwycić kontekst na podstawie kookurencji wyrazów. W efekcie takie reprezentacje dają bardzo prymitywne przybliżenie do użytecznych reprezentacji mentalnych, pomijające istotne własności strukturalne obiektów, jak i powiązania pomiędzy
percepcją i działaniem. Podobnie drastycznym uproszczeniem są sieci
semantyczne (Sowa 1991).
Wydaje się, że systematyczna analiza przybliżenia do dynamicznych
procesów rozchodzenia się aktywności neuronalnej w mózgu i transfor-
20
Włodzisław Duch
macja tych stanów do przestrzeni, w której można zdefiniować stany
mentalne jest dobrą drogą do lepszego opisu reprezentacji mentalnych
i reprezentacji pojęć. Można w tym celu zastosować abstrakcyjną teorię reprezentacji, rozwiniętą dla potrzeb mechaniki kwantowej. Wektor
stanu (funkcja falowa) może w niej zostać poddana dowolnej transformacji obrotów, ale nie zmienia to relacji pomiędzy różnymi wektorami
stanu.
5. Zastosowania
Przedstawione powyżej rozważania oparte są na przekonaniu, że
jedynie przez aproksymację fizycznych stanów mózgu, zawierających
znacznie więcej informacji niż stany mentalne, możemy dokonać istotnego postępu w rozumieniu i opisie reprezentacji mentalnych, przydatnych nie tylko filozofom, ale też mających zastosowania w analizie języka naturalnego (Duch, Matykiewicz, Pestian 2008), kategoryzacji pojęć
w psychologii (Duch 1997) i architekturach kognitywnych w sztucznej
inteligencji (Duch 2010). Informatyka neurokognitywna (Duch 2009)
usiłuje tworzyć praktyczne algorytmy czerpiąc inspiracje ze zrozumienia procesów zachodzących w mózgu. Jest już szereg przykładów, pokazujących użyteczność takich metod. Ucieleśnienie jak i enaktywizm są
dla rozwoju reprezentacji pojęć bardzo istotne (Barsalou 2008), podkreślają konieczność wielomodalnych reprezentacji, ale to jeszcze nie
wystarcza. Proces tworzenia się abstrakcyjnych reprezentacji w oparciu
o reprezentacje percepcyjno-ruchowe stwarza niełatwe problemy (Mahon i Caramazza 2008), ale z punktu widzenia transformacji pomiędzy
stanami mózgu i umysłu nie jest trudny do wyobrażenia.
Transformacje pomiędzy stanami mózgu a stanami umysłu stosuje się w różnego rodzaju detektorach kłamstwa wykorzystujących pomiary elektrofizjologiczne (głównie EEG). Podejście oparte na transformacjach jest też podstawą do tworzenia interfejsów mózg-maszyna
(Brain-Computer Interfaces, BCI), do sterowania urządzeniami za pomocą myśli, a raczej intencji. Pojawiają się pierwsze gry komputerowe, wykorzystujące taki interfejsy, są też liczne zastosowania medyczne
(Coyle i in. 2003), w tym urządzenia typu neurofeedback, przydatne
w terapii licznych problemów psychicznych. W przypadku interfejsów
mózg-komputer intencje ruchu, które należą do świata umysłu, zmieniają stany mózgu w sposób możliwy do odczytania za pomocą elektrod
aparatury elektroencefalograficznej. Chociaż nie jest to precyzyjna informacja o stanie mózgu, aktywność każdej elektrody EEG reprezentuje
uśrednienie aktywności wielu milionów neuronów, wystarcza to jednak
do tego, aby dokonać transformacji informacji o aktywności mózgu na
Reprezentacje umysłowe jako aproksymacje stanów mózgu
21
informację pozwalającą rozróżnić kilka stanów mentalnych. W eksperymentach wykorzystujących fMRI (Hayens i in. 2007) udało się odróżnić stany umysłu związane z intencjami dodawania bądź odejmowania
dwóch liczb od siebie. W pracy Mitchella i wsp. (2008) stworzono sieć
neuronową przewidującą rozkład pobudzeń mózgu mierzonych w eksperymentach z fMRI przy prezentacji różnych rzeczowników. Model ten,
nauczony przy wykorzystaniu reprezentacji wektorowej słów zawartych
w dużym korpusie językowym, oraz na kilkudziesięciu wynikach rzeczywistych pomiarów fMRI, potrafi odróżnić od siebie stany mózgu
spodziewane w eksperymentach z innymi rzeczownikami. W tym przypadku jako funkcje bazowe używa się aktywności pojedynczych wokseli
w fMRI.
Odczytywanie stanów mentalnych na podstawie aktywności mózgu
jest dużym problemem technicznym, ale już dzisiaj dyskutowane są
problemy etyczne związane z możliwością podglądania prywatnych stanów mentalnych (Haynes i Rees 2005, 2006). Postęp w tym kierunku
nie będzie jednak łatwy. Z jednej strony nie mamy dobrych technik
eksperymentalnych by podejrzeć niewielkie grupy neuronów i stworzyć
odpowiednią bazę funkcji do opisu stanów mózgu. Żadna z obecnie rozwijanych technik nie ma odpowiedniej rozdzielczości czasowej i przestrzennej by na to pozwolić. Analiza sygnałów EEG jest bardzo trudna
i nie umiemy jeszcze znaleźć w nich precyzyjnej informacji o cechach
stanów mentalnych, nie wiemy nawet, czy taka informacja jest w EEG.
Z drugiej strony nie mamy też dobrej neurofenomenologii pozwalającej na precyzyjny opis stanów mentalnych i powiązanie ich ze stanami
mózgu. Próba opisu doświadczenia wewnętrznego przedstawiona przez
Hurlburta i Schwitzgebela (2007) nie jest wystarczająca by określić, jakiego rodzaju transformacji powinniśmy szukać dla opisu stanów mentalnych. Jedynie w prostych sytuacjach eksperymentalnych możemy
ustalić, jakie zmienne odnoszące się do stanów mentalnych potrzebne
są do dokonania wymaganych przez eksperyment rozróżnień.
Prezentowane tu podejście oferuje dość prosty język, pozwalający
zrozumieć zaskakujące, często nieracjonalne decyzje podejmowane przez
ludzi. Psychologia oferuje pewne racjonalizacje, ale są one arbitrarne
i nie mają mocy wyjaśniającej (Duch 1997). Logiczne argumenty okazują się często błędne tam, gdzie dobrze się sprawdzają argumenty oparte
na intuicji (Gigerenzer 2009). Wybór intuicyjny nie buduje konstrukcji logicznej w oparciu o obecność lub rbak pewnych cech, ale opiera
się na doświadczeniu, podobieństwie do wcześniej spotkanych sytuacji,
przyciągającym trajektorię aktywności neuronów do jakiegoś atraktora.
Proces ten może nie dać się opisać za pomocą reguł logicznych. Eksploracja labiryntu, w którego lewej odnodze jest kęs jedzenia w 80%
przypadków a w prawej tylko w 20% pokazuje, że szczur w 80% razy
22
Włodzisław Duch
idzie w lewo a w 20% idzie w prawo, chociaż gdyby zawsze przechodził
do lewej odnogi znalazłby jedzenie częściej. W modelach pamięci można
zobaczyć, że obszary atrakcji, które się tworzą dla decyzji „iść w lewo
czy w prawo” są odbiciem statystyki częstości znajdowania pożywienia. Na poziomie interpretacji psychologicznej możemy powiedzieć, że
szczur, który ma zwykle dużą konkurencję, nie zapominając o innych
możliwościach czasami unika tłumów i zdobywa dodatkowe pożywienie. Na poziomie neurodynamiki widzimy trajektorie aktywności, które
w 80% przypadków kończą się w atraktorze „iść w lewo”, a w pozostałych „iść w prawo”.
Decyzje ludzi oparte są często na takim samym mechanizmie, a racjonalne wyjaśnienia, jakie do nich dodajemy są konfabulacjami. Reklamy
często powtarzane pozostawiają głębokie ślady w pamięci, wpływając
na decyzje zakupów. Początkowa sugestia, chociaż pozornie całkiem
nie związana z decyzją, którą trzeba podjąć, ma na nią silny wpływ.
Dan Ariely i George Loewenstein pokazali (Ariely 2008), że zapisanie
dwóch ostatnich cyfr numerów ubezpiecznia (social security) przez studentów miało duży wpływ na deklarowane sumy podczas aukcji przedmiotów o cenach do 100$. Osoby, które zapisywały większe liczby skłonne są zapłacić więcej. Nawet taka nieświadoma i całkiem nie związana
z późniejszym działaniem sugestia wpływa na podejmowane decyzję.
Sugestie związane z zadaniami wyboru wpływają na nią jeszcze silniej.
Dodanie okrojonej oferty tego samego produktu znacząco wpływa na
podwyższenie oceny produktu, który chcemy wypromować. Jeśli rozważamy trzy możliwości, A, B i B ′ , przy czym B ′ jest podobne do B
ale gorsze pod jakimś istotnym względem, atraktory dla B i B ′ mają
większą siłę przyciągania i pozostaje dość oczywisty wybór pomiędzy
B i B ′ . Np. jeśli mamy do wyboru subskrypcję w sieci za 50$ lub wersję drukowaną za 125$ to niewiele osób wybiera wersję drukowaną, ale
jeśli oferowana jest dodatkowo wersja „druk i wersja sieciowa” za tę
samą cenę co druk to proporcje się odwracają. Jak pokazał Dan Ariely
(2008) dotyczy to dowolnych ofert, łącznie z partnerem życiowym: jeśli
jest trzech potencjalnych partnerów, z których A uznawany był wcześniej za bardziej atrakcyjnego, ale B ma kolegę podobnego do siebie,
ale nieco mniej atrakcyjnego, preferencje przesuwają się w stronę B.
Bardziej skomplikowane sytuacje związane są z konkluzjami wymagającymi logicznego myślenia. Najprostsze są bezpośrednie skojarzenia,
A ⇒ B ⇒ C, tworząc uporządkowany ciąg atraktorów następujących
po sobie. Rozważmy jednak takie 3 zdania:
. Wszyscy członkowie gabinetu to złodzieje.
. Żaden muzyk nie jest członkiem gabinetu.
Reprezentacje umysłowe jako aproksymacje stanów mózgu
23
. Co można powiedzieć o relacji miedzy muzykami i złodziejami?
Nieco prostsza wersja, gdyż bliska znanemu schematowi myślenia
„nie każdy uczony jest mędrcem”, to:
. Wszyscy akademicy to uczeni.
. Żaden mędrzec nie jest akademikiem.
. Co można powiedzieć o relacji między uczonymi i mędrcami?
Po paru tygodniach bezowocnych zmagań podałem studentom prawidłową odpowiedź na pierwszą z tych wersji, jednak na egzaminie dla
drugiej wersji podali kilkanaście błędnych lub niejednoznacznych odpowiedzi (tylko dwie ostatnie są poprawne):
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
Nie ma relacji pomiędzy tymi trzema zbiorami.
Bycie mędrcem świadczy o tym, że nie jest się uczonym.
Niektórzy mędrcy to uczeni.
Wszyscy uczeni nie będący akademikami są mędrcami.
Wszyscy uczeni to mędrcy.
Żaden mędrzec nie jest uczonym.
Nie wszyscy mędrcy to uczeni.
Istnieje taki mędrzec, który może być uczonym.
Mogą istnieć mędrcy, którzy są uczonymi.
Nie trzeba być mędrcem aby być uczonym.
Mędrzec uczonemu nie równy.
Nie wszyscy uczeni to mędrcy.
Nie każdy uczony jest mędrcem.
Istnieją tacy uczeni, którzy nie są mędrcami.
Istnieje uczony, który nie jest mędrcem.
6. Dyskusja
Rozważania na temat reprezentacji mentalnych i ich związek ze stanami mózgu można rozszerzyć na zagadnienia dotyczące kreatywności
(Duch i Pilichowski 2007; Duch 2007), roli prawej półkuli mózgu w doświadczeniach wglądu (Duch 2007a) jak i praktycznych algorytmów
analizy tekstu, pozwalających na tworzenie rozszerzonych reprezentacji (Duch i in. 2008, Duch 2009). Zbudowanie modelu umysłu uwzględniające perspektywę wewnętrzną jest nadal wielkim wyzwaniem. Idee
dotyczące geometrycznego opisu stanów mentalnych (Duch 1997, 2001,
2002, 2002a) można połączyć z opisanym tutaj podejściem transformacyjnym do relacji mózg-umysł. Droga do stworzenia dokładnego modelu
24
Włodzisław Duch
takich relacji jest nadal daleka. Nie znamy szczegółów procesów zachodzących w mózgu, są trudności związane z badaniami eksperymentalnymi, brak jest dobrych metod matematycznych do analizy sygnałów
i procesów rozchodzenia się aktywacji w rzeczywistych sieciach neuronowych, procesów przetwarzania informacji w oparciu o takie sieci.
Jednakże nawet proste mózgo-podobne przetwarzanie informacji daje
rezultaty, które ma cechy jakościowe porównywalne do obserwowanych
funkcji; złożoność mózgu nie jest więc głównym problemem stojącym
przed budową sztucznych umysłów (Duch 2005; Duch, Oentaryo, Pasquier 2008)!
Metody komputerowe dopiero od niedawna zaczęto stosować do modelowania syndromów neuropsychologicznych i chorób psychicznych
(Parks i in. 1998). Na razie objęto nimi jedynie część zagadnień, które
można w ten sposób badać. Nie brakuje problemów fundamentalnych,
do których nie bardzo wiadomo, jak podejść. Należą do nich urazy psychogenne, zaburzenia osobowości i inne problemy wymagające pełnego
modelu umysłu. Jednakże za pomocą modeli komputerowych udało się
już teraz osiągnąć więcej, niż można było oczekiwać zdając sobie sprawę
ze stopnia komplikacji takiego modelowania. Niewielka liczba założeń
i stosunkowo proste sieci neuronowe pozwalają na zrozumienie zjawisk
zachodzących przy uszkodzeniach i rehabilitacji mózgu.
Często jest to rozumienie jakościowe, metaforyczne, posługujące się
luźnymi analogiami. Należy jednak przyznać, że dokonany został duży
postęp, pojawił się nowy styl rozumowania ze specyficznymi problemami i pytaniami, język opisu nieredukowalny do języka używanego dotychczas w psychiatrii czy w psychofarmakologii (Duch 2007b). Dzięki
symulacjom komputerowym można się spodziewać podobnego postępu
w rozumieniu reprezentacji mentalnych i wyższych czynności poznawczych, w szczególności procesów podejmowania decyzji.
Podziękowania: Krzysztof Dobosz opracował program do wizualizacji atraktorów i przygotował rysunek ze strony 19.
Literatura
Austin, J. H. (1988). Zen and the Brain: Toward an Understanding of
Meditation and Consciousness. Cambridge, MA: MIT Press.
Austin, J. H. (2006). Zen-Brain Reflections: Reviewing Recent Development in Meditation and States of Consciousness. Cambridge, MA: MIT Press.
Ariely, D. (2008). Predictably Irrational. The Hidden Forces That Shape
Our Decisions. Harper-Collins.
Barsalou, L. W. (2008). Grounded Cognition. Annual Reviews of Psychology 59, s. 617–645.
Reprezentacje umysłowe jako aproksymacje stanów mózgu
25
Bowden, E. M., Jung-Beeman, M., Fleck, J. & Kounios, J. (2005). New
approaches to demystifying insight. Trends in Cognitive Science 9, 322–328.
Brooks, R. (1986). Elephants don’t play chess. Robotics and Autonomous
Systems 6, s. 3–15.
Brooks, R, Stein, L. A. (1994). Building Brains for Bodies. Autonomous
Robotics 1, s.7–25.
Caramazza, A., & Mahon, B. Z. (2006). The organization of conceptual
knowledge in the brain: the future’s past and some future directions. Cognitive Neuropsychology 23, 13–38.
Coyle, S, Ward, T., Markham, C. (2003). Brain-computer interfaces: A review. Interdisciplinary Science Reviews 28(2), s. 112–118.
Damasio, H., Grabowski, T. J., Tranel, D., Frnak, R. J, Hichiwa, R. D,
Damasio, A. R. (1996). A neural basis for lexical retrieval. Nature 380, s. 499–
505.
Dehaene, S., Cohen, L., Sigman, M. & Vinckier, F. (2005). The neural code
for written words: a proposal. Trends in Cognitive Science 9, s. 335–341.
Dehaene, S., & Naccache, L. (2001). Towards a cognitive neuroscience
of consciousness: Basic evidence and a workspace framework. Cognition 79,
1–37.
De Marco, R. J., Menzel, R. (2008). Learning and memory in communication and navigation in insects. W: Menzel R, (red.) Learning Theory
and Behavior, Vol. 1 of Learning and Memory: A Comprehensive Reference
(4 vols). Oxford: Elsevier, s. 477–98.
Dobosz, K., Duch, W. (2009). Fuzzy Symbolic Dynamics for Neurodynamical Systems. Neural Networks, http://dx.doi.org/10.1016/j.neunet.
2009.12.005
Duch, W. (1997). Platonic model of mind as an approximation to neurodynamics. W: S. Amari, N. Kasabov (red.) Brain-like computing and intelligent
information systems. Springer, Singapore, rozdz. 20, s. 491–512
Duch, W. (2001). Neurokognitywna teoria świadomości. Kognitywistyka
i Media w Edukacji 5(2), s. 47–67.
Duch, W. (2002). Geometryczny model umysłu. Kognitywistyka i Media
w Edukacji 6, s. 199–230.
Duch, W. (2002a). Fizyka umysłu. Postępy Fizyki 53D, s. 92–103.
Duch, W. (2005). Brain-inspired conscious computing architecture. Journal of Mind and Behavior 26(1–2), s. 1–22.
Duch, W. (2006). Madhyamika, nauka i natura rzeczywistości. Uwagi na
marginesie książki: Matthieu Ricard i Trinh Xuan Thuan, Nieskończoność
w Jednej Dłoni: Od Wielkiego Wybuchu do Oświecenia. Kognitywistyka i Media w Edukacji 1–2, s. 293–316.
Duch, W. (2007). Intuition, Insight, Imagination and Creativity. IEEE
Computational Intelligence Magazine 2(3), s. 40–52.
Duch, W. (2007a) Creativity and the Brain. In: Ai-Girl Tan (red.)A Handbook of Creativity for Teachers. Singapore: World Scientific Publishing, s. 507–
530.
26
Włodzisław Duch
Duch, W. (2007b). Computational Models of Dementia and Neurological
Problems. W: Neuroinformatics, C.J. Crasto (red.) Methods in Molecular
Biology series (J. Walker, series ed.). Totowa, NJ: Humana Press, rozdz. 17,
s. 307–336.
Duch, W. (2009). Neurocognitive Informatics Manifesto. W: Series of Information and Management Sciences, California Polytechnic State University, s. 264–282.
Duch, W. (2010). Architektury kognitywne. W: R. Tadeusiewicz (red.)
Neurocybernetyka teoretyczna. Wyd. Uniwersytetu Warszawskiego.
Duch, W., Pilichowski, M. (2007). Experiments with computational creativity. Neural Information Processing — Letters and Reviews 11, s. 123–133.
Duch, W., Matykiewicz, P., Pestian, J. (2008). Neurolinguistic Approach
to Natural Language Processing with Applications to Medical Text Analysis.
Neural Networks 21(10), s. 1500–1510.
Durham, W.H. (1983). Testing the malaria hypothesis in West Africa.
W: Distribution and Evolution of Hemoglobin and Globin Loci. New York:
Elsevier Science Publishing Co., Inc.
Frith, C., Frith, U. (2005). Theory of mind. Current Biology 15, R644–
R646.
Gaillard, R., Naccache, L., Pinel, P., Clémenceau, S., Volle, E., Hasboun,
D., Dupont, S., Baulac, M., Dehaene, S., Adam, C., & Cohen, L. (2006).
Direct intracranial, FMRI, and lesion evidence for the causal role of left
inferotemporal cortex in reading. Neuron 50, s. 19–204.
Gigerenzer, G. (2009). Intuicja. Inteligencja nieświadomości. Warszawa:
Prószyński i S-ka.
Gruszka, A., & Nęcka, E. (2002). Priming and acceptance of close and
remote associations by creative and less creative people. Creativity Research
Journal 14, s. 193–205.
Haynes, J.D. & Rees, G. (2005). Predicting the stream of consciousness
from activity in early visual cortex. Current Biology 15, s. 1301–1307.
Haynes, J.-D. & Rees, G. (2006). Decoding mental states from brain activity in humans. Nature Reviews Neuroscience 7, s. 523–534.
Haynes, J.-D., Sakai, K., Rees, G., Gilbert, S., Frith, C. & Passingham, D.
(2007). Reading hidden intentions in the human brain.Current Biology 17,
s. 323–328.
Hickok, G. & Poeppel, D. (2007). The cortical organization of speech
processing. Nature Reviews Neuroscience 8, s. 393–402.
Hurlburt, R.T., Schwitzgebel, E. (2007). Describing Inner Experience?
Proponent Meets Skeptic. Cambridge, MA: MIT Press.
Itert, L. Duch, W. & Pestian, J. (2007). Influence of a priori Knowledge
on Medical Document Categorization, IEEE Symposium on Computational
Intelligence in Data Mining. IEEE Press, s. 163–170.
Jung-Beeman, M., Bowden, E. M., Haberman, J., Frymiare, J. L., Arambel-Liu, S., Greenblatt, R., Reber, P. J., &. Kounios, J. (2004). Neural activity when people solve verbal problems with insight. PLoS Biology 2, s. 500–
510.
Reprezentacje umysłowe jako aproksymacje stanów mózgu
27
Lehmann, F. (red.), (1992). Semantic Networks in Artificial Intelligence.
Oxford: Pergamon.
Lin, L., Osan, R., & Tsien, J. Z. (2006). Organizing principles of realtime memory encoding: neural clique assemblies and universal neural codes.
Trends in Neuroscience 29(1), s. 48–57.
Kapleau, P. (1992). Zen, Świt na Zachodzie. Warszawa: ZBZ „Bodhidarma”.
MacLean, P. (1990). The Triune Brain in Evolution. New York: Plenum
Press.
Mahon, B.Z, Caramazza, A. (2008). A Critical Look at the Embodied Cognition Hypothesis and a New Proposal for Grounding Conceptual Content.
Journal of Physiology — Paris 102, s. 59–70.
Manning, C.D. & Schütze, H. (1999). Foundations of Statistical Natural
Language Processing. Cambridge, MA: MIT Press.
Matykiewicz, P., Duch, W., & Pestian, J. (2006). Nonambiguous Concept
Mapping in Medical Domain, Lecture Notes in Artificial Intelligence 4029,
s. 941–950.
Mednick, S.A. (1962). The associative basis of the creative process. Psychological Review 69, s. 220–232.
Meller, S. (2008). Świat według Mellera. Życie i polityka: ku przyszłości.
Warszawa: Rosner i wspólnicy.
Mitchell, T. M., Shinkareva S. V., Carlson A., Chang, K. M., Malave,
V. L., Mason, R. A., Just, M. A. (2008). Predicting human brain activity
associated with the meanings of nouns. Science 30, 320(5880) s. 1191–95.
Northoff, G., Heinzel, A., de Greck, M., Bermpohl, F., Dobrowolny, H.,
Panksepp, J. (2006). Self-referential processing in our brain — a meta-analysis
of imaging studies on the self. Neuroimage 15, 31(1), s. 440–457.
Northoff, G., Panksepp, J. (2008). The trans-species concept of self and
the subcortical-cortical midline system. Trends in Cognitive Science 12(7),
s. 259–64.
Okada, K., Hickok, G. (2006). Identification of lexical-phonological networks in the superior temporal sulcus using fMRI. Neuroreport 17, s. 1293–
1296.
O’Reilly, R.C., Munakata, Y. (2000). Computational Explorations in Cognitive Neuroscience Understanding the Mind by Simulating the Brain. Cambridge, MA: MIT Press.
Parks, R. W., Levine, D. S., Long, D., (red.) (1998). Fundamentals of
Neural Network Modeling. Cambridge, MA: MIT Press.
Popper, K., Eccles, J.C. (1999). Mózg i jaźń, Tom 1–3, Poznań: Wyd.
Protext.
Price, C. J., Devlin, J. T. (2003). The myth of the visual word form area.
NeuroImage 19, s. 473–481.
Pulvermuller, F. (2003). The Neuroscience of Language. On Brain Circuits
of Words and Serial Order. Cambridge, UK: Cambridge University Press.
Radhakrishnan, S. (1958). Filozofia indyjska, tłum. Z. Wrzeszcz, t. 1–2,
Warszawa: PAX.
28
Włodzisław Duch
Sowa, J. F. (red.), (1991). Principles of Semantic Networks: Explorations
in the Representation of Knowledge. San Mateo, CA: Morgan Kaufmann
Publishers.
Reprezentacje w systemach
klasycznych i koneksjonistycznych
Marcin Miłkowski
Instytut Filozofii i Socjologii PAN
Zakład Logiki i Kognitywistyki
Streszczenie. Autor artykułu broni tezy, że niektóre systemy obliczeniowe mogą mieć własności semantyczne. Wskazana została klasa systemów obliczeniowych, w których reprezentacje mogą mieć przynajmniej
dwie własności: własność odnoszenia się do obiektów (desygnowanie)
i własność wspomagania rozpoznawania obiektów oznaczanych przez
daną reprezentację (konotowanie). Autor argumentuje także, że własności semantyczne reprezentacji nie zależą wyłącznie od architektury
systemów obliczeniowych, w których te reprezentacje występują. Konkretna architektura obliczeniowa nie jest czynnikiem kluczowym, a bodaj
najmniej istotne są same rodzaje struktur danych, które mają mieć własności desygnowania czy konotowania. Własność desygnowania czy konotowania nie musi być zlokalizowana w samych reprezentacjach, może
być własnością wyższego rzędu, powstającą w mechanizmie wyższego poziomu. Własności semantyczne reprezentacji mogą być wielorako realizowane. Systemy klasyczne, koneksjonistyczne czy też hybrydowe mogą
równie dobrze mieć własności semantyczne, jak ich nie mieć.
1. Wstęp
Czy reprezentacje w systemach obliczeniowych mogą mieć własności
semantyczne? I czy tzw. klasyczne podejście do sztucznej inteligencji
(GOFAI, Good-Old Fashioned AI ) różni się pod tym względem od koneksjonizmu?
W tym artykule bronić będę tezy, że niektóre systemy obliczeniowe
mogą mieć własności semantyczne1 . Wbrew wielu głosom sceptycznym
1
Abstrakcyjna struktura systemu obliczeniowego, np. w postaci zapisu
programu komputerowego, o ile nie odpowiada prawidłowościom przyczynowym (czyli jest realizowana przez komputer), nie może mieć żadnych własności semantycznych. Wątpliwe jest też, aby sam taki zapis mógł uchodzić
Studia z Kognitywistyki i Filozofii Umysłu, 3: 29–42, 2009
c 2009 Marcin Miłkowski
Copyright 30
Marcin Miłkowski
(Searle 1995, Searle 1999, Harnad 1990) wskażę klasę systemów obliczeniowych, w których reprezentacje mogą mieć przynajmniej dwie własności: własność odnoszenia się do obiektów (desygnowanie) i własność
wspomagania rozpoznawania obiektów oznaczanych przez daną reprezentację (konotowanie2). Mówiąc inaczej, reprezentacje w tych systemach obliczeniowych mają zarówno ekstensję, jak i intensję. Odpowiadam więc pozytywnie na pierwsze pytanie.
Na drugie pytanie odpowiedź będzie negatywna. Własności semantyczne reprezentacji nie zależą wyłącznie od architektury systemów obliczeniowych. Konkretna architektura obliczeniowa nie jest czynnikiem
kluczowym, a bodaj najmniej istotne są same rodzaje struktur danych,
które mają mieć własności desygnowania czy konotowania. W istocie
bowiem własność desygnowania czy konotowania nie musi być zlokalizowana w samych reprezentacjach, może być własnością wyższego rzędu,
powstającą w mechanizmie wyższego poziomu. Sprowadzanie własności semantycznych do wewnętrznych własności indywidualnych struktur
danych jest błędem lokalizacji funkcjonalnej (por. Wimsatt 2007; Bechtel i Richardson 1993). Będę więc twierdził, że własności semantyczne
reprezentacji mogą być wielorako realizowane. Systemy klasyczne, koneksjonistyczne czy też hybrydowe mogą równie dobrze mieć własności
semantyczne, jak ich nie mieć.
W dyskusjach nad zdolnościami semiotycznymi sztucznych systemów poznawczych – a w szczególności systemów obliczeniowych – często porusza się kwestię internalizmu i eksternalizmu semantycznego.
Zagadnienia te dotyczą głównie konotacji (treści) wyrażeń, nie zaś ich
odniesienia. „Odniesienie” natomiast jest analizowane stosunkowo jednomyślnie w ramach przyczynowej teorii odniesienia. Ze względu na
brak miejsca będę abstrahować od obszernych dyskusji między internalistami a eksternalistami. Przedstawię jednak analizę mechanizmów
semantycznych, która bierze pod uwagę zarówno środowisko wewnętrzne mechanizmu (endostrukturę), jak i jego otoczenie zewnętrzne (egzostrukturę). Jeśli internalizm ma więc pociągać za sobą metodologiczny
solipsyzm, to moja analiza będzie z nim niezgodna: z solipsystyczną
za system obliczeniowy. Niżej mam na myśli wyłącznie fizycznie zrealizowane
systemy obliczeniowe, kiedy mówię po prostu o systemach obliczeniowych.
2
Przez „konotację” rozumie się zazwyczaj albo (1) zbiór konstytutywnych
cech desygnatów; (2) charakter aspektowy czy też tryb prezentacji desygnatów; (3) warunki umożliwiające wyróżnianie desygnatów (np. w postaci listy
cech konstytutywnych). W tym tekście termin ten jest używany w znaczeniu
(3). Nie zajmuję się też trybem prezentacji, jeśli nie jest on wykorzystywany
do identyfikacji desygnatów.
Reprezentacje w systemach...
31
analizą niezgodne jest bowiem uwzględnianie egzostruktury systemu.
Argumenty za tego rodzaju skrajnym internalizmem są jednak wątłe
(por. McClamrock 1995, rozdział 2).
2. Przetwarzanie informacji a ekstensja reprezentacji
Teza, że systemy sztuczne mogą zawierać reprezentacje, które odnoszą się do obiektów, jest stosunkowo mało kontrowersyjna – spór
dotyczy przede wszystkim tego, czy te reprezentacje mogą mieć intensję, nie zaś tylko ekstensję (Chalmers 1992). Do innych przedmiotów
mogą odnosić się chociażby oznaki — po prostu powiązane przyczynowo z tym, na co wskazują. Oznakę, np. dym oznaczający ogień, można
wytworzyć sztucznie i celowo, więc system obliczeniowy nie byłby niczym nadzwyczajnym. System zawierający oznaki i z nich korzystający
będzie miał reprezentacje, które ewidentnie się do czegoś odnoszą. Oba
warunki — zawieranie znaków o charakterze oznak i korzystanie z nich
— spełniają wszystkie systemy uzyskujące i przetwarzające informacje,
w których istnieją mechanizmy reprezentacyjne3 .
Systemy obliczeniowe rozumiem jako pewnego rodzaju systemy przetwarzania informacji (nie rozstrzygając w tym miejscu kontrowersyjnej
kwestii, czy jest możliwe istnienie przetwarzania informacji na drodze
nieobliczeniowej; jeśli nie jest, są to klasy równoważne). Nie wszystkie
te systemy muszą przetwarzać informacje z otoczenia; jeśli informacje
te docierają do systemu w postaci innych reprezentacji, to ekstensja
reprezentacji systemu zależy od tego, czy przed dotarciem do systemu
odnosiły się one do czegokolwiek. Krótko mówiąc, systemy korzystające z informacji już przetworzonych niekoniecznie mają reprezentacje
niepuste; ich semantyczne własności zależą bezpośrednio od własności informacji wejściowych. Jeśli reprezentacje są wprowadzane przez
człowieka, który np. opisuje za ich pomocą fikcyjny świat wirtualny, to
nie będą one miały ekstensji w postaci obiektów empirycznych. Jednak
ważniejsze jest pytanie, w jaki sposób powstają reprezentacje obliczeniowe odnoszące się do rzeczywistych obiektów — i to bez oczywistej
interwencji człowieka. Aby na to pytanie odpowiedzieć, należy zanalizować samo pojęcie przetwarzania informacji.
Pojęcie „informacja” jest stosowane często i w bardzo różnych kontekstach (Poczobut 2005). Dlatego też nie sposób mówić o „informacji
jako takiej”, trzeba wybrać jakąś określoną koncepcję. Postaram się
jednak nakreślić ogólną ideę, z którą zgodna będzie większość dzisiej3
W poniższych rozważaniach nad przetwarzaniem informacji wykorzystuję
analizy z Miłkowski (2008).
32
Marcin Miłkowski
szych ujęć kwantytatywnych. Będzie to analiza w stylu mechanistycznym4 . Skupiam się na przetwarzaniu informacji z otoczenia — uzyskane wnioski można potem uogólnić także na mechanizmy, które operują
na istniejących już nośnikach informacji, nie przetwarzając uzyskanych
samodzielnie informacji o otoczeniu. Przetwarzanie informacji o otoczeniu wymaga jego właściwej reprezentacji w systemie poznawczym.
W przeciwieństwie do wielu teoretyków (Harnad 1990) nie uważam jednak, aby interakcje sensomotoryczne z otoczeniem były warunkiem koniecznym referencyjności reprezentacji w systemie — są one warunkiem
wystarczającym, lecz system może także zawierać reprezentacje dotyczące własnych stanów wewnętrznych lub generować nowe informacje
na podstawie dostarczonych już informacji w postaci innej niż percepcyjna (zawartych w odpowiednim nośniku).
Przetwarzanie informacji jest procesem, który zachodzi (przynajmniej) w systemach wykorzystujących informacje do sterowania własnym zachowaniem. Nie zachodzi ono tam, gdzie mamy do czynienia
jedynie z zakodowaną informacją, np. wydrukowana w podręczniku tabliczka mnożenia ani wzór nie przetwarzają informacji. Podobnie słoje
w drewnie, choć stanowią oznaki i są wywoływane przez środowisko
zewnętrzne, a więc informują o nim, nie przetwarzają informacji jako takie. Tabliczki mnożenia, wzory i słoje drewna to jedynie nośniki informacji. Przetwarzanie bowiem — w przeciwieństwie do samego
zawierania lub przechowywania informacji — polega na tym, iż istnieje niezawodny mechanizm dokonujący przekształcenia informacji, czyli
mechanizm działający stosunkowo stabilnie w danym środowisku. Informacje te muszą do tego mechanizmu dotrzeć, a następnie zostać
przesłane dalej, czyli po przetworzeniu muszą być dostępne dla samego
systemu, a zatem docierać do innych jego składników.
Wspomniany mechanizm musi przetwarzać informacje pochodzące
z danej sytuacji — czyli informacje już w niej zawarte5. Każda sytuacja
(rozumiana abstrakcyjnie, niekoniecznie jako fizyczny stan rzeczy) może
zostać opisana przy użyciu ciągu informacji. Mówiąc poglądowo, można
zadać pewien ciąg pytań rozstrzygnięcia na temat danej sytuacji, a ciąg
odpowiedzi — „tak” lub „nie” — to ciąg informacji w niej zawartych
(w ilościowych teoriach informacji taka minimalna odpowiedź zwana
4
Wyjaśnienie mechanistyczne rozumiem podobnie jak Bechtel i Richardson (1993) lub Craver (2006). Wyjaśnienia mechanistyczne do obliczeniowości
odnosi m.in. G. Piccinini (2007).
5
Analiza pojęcia informacji jest szczególnie płodna w kategoriach semantyki sytuacyjnej. Por. Israel i Perry (1990). Tezę, że informacja jest zawarta
w sytuacjach, uzasadnia Collier (1990).
Reprezentacje w systemach...
33
jest niekiedy „logonem”; nie idzie tu o bit w sensie informatycznym).
Uznaję więc, że struktura sytuacji sama w sobie zawiera informacje,
które zostają ujawnione w jej opisie. Pewne sytuacje można wskazać
w sposób jednoznaczny przy użyciu ciągów skończonych o małej długości; inne są znacznie bogatsze informacyjnie. Długość i złożoność tych
ciągów charakteryzuje się matematycznie. Przykładem może być algorytmiczna teoria informacji, rozwijana przez Kołmogorowa, a następnie przez Chaitina; pozwala ona rozróżnić stochastyczne ciągi informacji od niestochastycznych (algorytmicznych)6. Opisy, w których widać
maksima regularności, a które jednocześnie pozwalają jednoznacznie
identyfikować egzemplarze lub typy obiektów, to opisy, których poszukuje nauka. One bowiem chwytają rzeczywiście zachodzące zjawiska.
Optymalnie skompresowane, a więc algorytmiczne informacje o sytuacji opisywanej jako typ lub jako konfiguracja typów są informacjami
na temat rodzajów naturalnych.
Proste oznaki — takie jak kreski na podziałce termometru spirytusowego za oknem — mogą służyć do tworzenia opisu sytuacji (w tym wypadku opisu w kategoriach analogowych, w ciągłych wartościach oznaczających temperaturę). Istnieje wówczas pewien mechanizm opisujący
sytuacje czy też generujący informacje, czyli mechanizm semiotyczny.
O przetwarzaniu w całym znaczeniu tego słowa nie ma mowy, gdyż
uzyskane informacje nie są poddawane dalszej obróbce, nie są w żaden sposób gromadzone, selekcjonowane i nie służą do modyfikacji zachowania. Nie są dostępne dla innych komponentów systemu, jakim
jest termometr. Dostęp do wskazań temperatury ma tylko użytkownik termometru. Termometr pozostaje jedynie nośnikiem informacji,
a nie systemem, który je przetwarza. Można by co najwyżej powiedzieć, z przymrużeniem oka, że to człowiek plus termometr okienny
stanowią mechanizm przetwarzający informacje o temperaturze powietrza za oknem.
Przetwarzanie informacji wymaga istnienia mechanizmu, który nie
tylko generuje odpowiednie opisy sytuacji (wydobywa informacje zawarte w sytuacjach), ale także z nich korzysta. Praktycznym kryterium
pozwalającym odróżnić mechanizmy informacyjne — wydobywające informacje, semiotyczne — od przetwarzających informacje jest to, czy
istnieje zysk predykcyjny z opisu w kategoriach informacyjnych w stosunku do opisu czysto mechanicznego. Jeśli opis można wyciąć brzytwą
Ockhama, nie tracąc żadnych istotnych przewidywań zachowania syste6
Najbardziej przystępne wprowadzenie do algorytmicznej teorii informacji
daje Chaitin (1975).
34
Marcin Miłkowski
mu, to znaczy, że mamy do czynienia wyłącznie z mechanizmem informacyjnym, nie zaś przetwarzającym informacje. To kryterium określam
jako praktyczne, gdyż jest zawodne i ma naturę epistemiczną. Możemy przecież nie dostrzec jakiegoś aspektu złożonego systemu, dzięki
któremu jest on nie tylko systemem semiotycznym czy informacyjnym,
ale także systemem przetwarzającym informacje7 . Druga praktyczna
reguła dotyczy magazynowania informacji — tylko mechanizmy, które nie reagują bezpośrednio na bodźce, lecz wykorzystują informacje
o nieobecnych już sytuacjach, mogą uchodzić za mechanizmy reprezentacyjne. Mechanizmy reprezentacyjne są najbardziej interesującą klasą mechanizmów przetwarzających informacje z otoczenia. Istniejące
w przyrodzie systemy poznawcze, jak się zdaje, wszystkie korzystają
z różnego rodzaju mechanizmów reprezentacyjnych8 . Ponieważ reprezentacje są generowane z informacji wydobytych z sytuacji, mają one
ekstensję — jest nią mianowicie ten stan rzeczy, który te informacje
opisują. Nie przesądzam w tym miejscu, jaką strukturę będą miały
desygnaty reprezentacji: informacje, choć sprowadzalne do pytań rozstrzygnięcia na temat sytuacji, mogą mimo to mieć różny charakter.
Zależy on od tego, jakie stawiane jest pytanie, czyli jaki aspekt sytuacji wchodzi w grę.
Jedyne niezawodne kryterium przetwarzania informacji to istnienie
odpowiedniej budowy — architektury — wewnętrznej powiązanej z odpowiednim kontekstem działania mechanizmu przetwarzającego informacje. Dopiero zbadanie funkcjonowania systemu, możliwie wyczerpujące, daje odpowiedź, czy system przetwarza informacje — uzyskuje
7
W wypadku formalnych systemów przetwarzających informacje, tj. systemów nie korzystających z informacji zawartych w rzeczywistych sytuacjach,
pominąć można etap semiotyczny, czyli opisywania sytuacji za pomocą nośnika informacji — w tym sensie, że nie korzysta się tu z oznak niosących
informacje o środowisku, tylko z innych nośników informacji (w takim formalnym systemie informacje zawarte na nośniku informacji nie muszą być
rozumiane, w przeciwieństwie do pozostałych wypadków, jako z konieczności
prawdziwe: nośniki nie są w tym wypadku z konieczności oznakami, mogą
być też znakami konwencjonalnymi). Kryterium odróżniania takiego systemu (zrealizowanego fizycznie) od wszelkich innych systemów mechanicznych
pozostaje analogiczne: jeśli działanie maszyny można opisać mechanicznie
w prostszy sposób (tj. uzyskać większą kompresję informacji na temat działania maszyny, ujmując rzecz w kategoriach Chaitina), to znaczy, że nie należy
jej zaliczać do klasy urządzeń przetwarzających informacje.
8
Pojęcie reprezentacji należy tu rozumieć szeroko; nie idzie tu o reprezentację symboliczną czy językową (tzw. reprezentacje subsymboliczne w sieciach neuronalnych też zaliczam do reprezentacji).
Reprezentacje w systemach...
35
je, następnie przenosi do kolejnych komponentów, a wreszcie selekcjonuje itd. — czy też nie. Skoro wszelkie obliczanie jest przetwarzaniem
informacji, to każda architektura obliczeniowa spełnia warunek przetwarzania informacji. Nie każda jednak przetwarza informacje wydobyte z sytuacji — ekstensja reprezentacji zależy więc od powiązania
przyczynowego ich ze światem, nie zaś od tego, czy system jest koneksjonistyczny, czy klasyczny. Kluczowe jest oddziaływanie z otoczeniem,
z którego wydobywane są informacje, lub ekstensjonalność informacji
już zakodowanych (w wypadku systemów nieprzetwarzających informacji ze świata bezpośrednio).
Kryterium budowy systemu jednak jest nieoperacyjne — nie istnieje
żaden ogólny algorytm wykrywania dowolnego rodzaju informacji, gdyż
taki algorytm mógłby posłużyć do rozstrzygnięcia problemu, czy dany
ciąg informacji jest algorytmiczny (niestochastyczny), czy też nie (algorytmiczne ciągi informacji są pewnym rodzajem informacji). Ponieważ
ten problem jest nierozstrzygalny (Chaitin 1987), to nie możemy z góry
zawsze wiedzieć, co jest relewantną informacją, a co nie — nie możemy
więc ocenić działania każdego systemu.
Oprócz szczegółowych wskaźników istnienia procesów przetwarzania informacji istnieje szereg kryteriów ogólnych stosowanych w metodologii naukowej, takich jak prostota opisu, wartość eksplanacyjna
i predykcyjna; spójność opisu i realistyczne ujęcie interakcji przyczynowych, nie zaś ich ignorowanie. Mechanizm przetwarzający musi być
względnie izolowany, aby można było go wyróżnić z otoczenia; jeśli system ma cechy umożliwiające mu przetwarzanie informacji ze środowiska, to interakcje wewnątrzsystemowe muszą być częstsze niż interakcje
na jego granicach9. Bezpośredni styk z otoczeniem mają tylko wejścia
i wyjścia systemu. Co więcej, realizator mechanizmu musi być opisywalny mechanistycznie, w kategoriach strukturalno-funkcjonalnych10.
Mechanizm przetwarzania jest „zadany” przez strukturę mechanizmu
i poddaje się też wyjaśnianiu adaptacjonistycznemu, gdy w grę wchodzą
systemy biologiczne.
9
Mówiąc nieco precyzyjniej, strukturę systemu można odkryć, badając
istotne statystycznie regularności w jego funkcjonowaniu. Granice składników najłatwiej wyznaczać przez różnice względnych częstości interakcji, lecz
odkrycie relacji między składnikami wymaga zastosowania bardziej skomplikowanych miar statystycznych. Jeśli system podlega prawidłowościom nie
tylko statystycznym, lecz znanym skądinąd prawom ścisłym, przy jego indywiduacji i wyznaczaniu jego struktury wewnętrznej można je oczywiście
także wykorzystać.
10
Analogiczne kryteria postulowałem w odniesieniu do procesów algorytmicznych (obliczeniowych). Por. Miłkowski (2007) i Miłkowski (2009).
36
Marcin Miłkowski
Przedstawiona wyżej, uproszczona wersja semantyki informacyjnej
wypływająca z analizy mechanizmów reprezentacyjnych wystarcza, aby
pokazać, że systemy obliczeniowe — zawierające mechanizmy reprezentacyjne — mogą mieć stany wewnętrzne, które mają ekstensję. Sposób
realizacji tych zdolności, czyli architektura sprzętowa czy też programowa, nie jest w tym wypadku kluczowy, o ile tylko system spełnia
ogólne warunki opisane powyżej. Ponieważ w szczególności zarówno
systemy klasyczne, o ile tylko wyposażone są w odpowiednie detektory
lub korzystają z już zakodowanych informacji (o niepustej ekstensji),
jak i systemy koneksjonistyczne czy też rozwiązania hybrydowe mogą
przetwarzać informacje we wspomnianym sensie, uzasadnione jest powiedzenie, że mamy do czynienia z wieloraką realizacją własności odnoszenia się. W różny bowiem sposób można i przetwarzać informacje,
i je reprezentować (kodować w systemie).
Systemy samodzielnie wydobywające informacje zawarte w sytuacjach i je przetwarzające można uznać za autonomiczne pod względem semantycznym, w odróżnieniu od większości systemów obliczeniowych, które są nieautonomiczne i do których dane wprowadzane są
przez ludzi. W takim wypadku własności semantyczne tych informacji
nie zależą od systemu (są wtórne wobec istniejących uprzednio własności semantycznych).
Powyższe ujęcie uwzględnia możliwość błędnej reprezentacji: błędna
reprezentacja może pojawić się na dowolnym etapie działania mechanizmu i polega po prostu na dysfunkcji odpowiednich mechanizmów
cząstkowych. Ponieważ większość systemów przetwarzających informacje korzysta z szeroko rozumianych procedur heurystycznych (Wimsatt
2007), istnieją sytuacje, w których będą ujawniać się systematyczne
błędy i dysfunkcje w przetwarzaniu informacji z sytuacji.
3. Konotacje reprezentacji obliczeniowych
Zdecydowanie bardziej kontrowersyjna jest kwestia istnienia konotacji dla reprezentacji obliczeniowych. Z jednej strony można w ogóle
kwestionować istnienie konotacji — zwłaszcza w sensie zbioru wystarczających i koniecznych warunków stosowania danej reprezentacji. Jest
to typowe zwłaszcza dla eksternalizmu (por. np. McClamrock, rozdział
8). Z drugiej strony jest ewidentne, że Searle przede wszystkim konotację czy też treść reprezentacji ma na myśli, kiedy neguje istnienie
zdolności semantycznych w systemach obliczeniowych.
Dwa różne zagadnienia dotyczą konotacji. Pierwsze dotyczy tego,
w jaki sposób w ogóle może pojawić się konotacja reprezentacji — jeśli
Reprezentacje w systemach...
37
system nie ma żadnego zewnętrznego „wspomagania” (np. w postaci
kultury i języka naturalnego). Innymi słowy, jest to pytanie o redukowalność treści reprezentacji do innych niesemantycznych własności11 .
Drugie pytanie jest następujące: czy systemy obliczeniowe mogą mieć
zdolności rozpoznawania desygnatów swoich reprezentacji? Treść reprezentacji ma bowiem umożliwić im prawidłową kategoryzację, a następnie zastosowanie reprezentacji określonego rodzaju. Na to drugie
pytanie najczęściej odpowiada się, że konieczne będą własności sensomotoryczne, typowe raczej dla robotów, nie zaś dla systemów obliczeniowych.
Zajmę się przede wszystkim drugim zagadnieniem, gdyż pierwsze
wymagałoby dokładniejszego omówienia problemu ugruntowania symboli, na co nie mam tutaj po prostu miejsca. Zresztą znane nam biologiczne systemy korzystające z reprezentacji wyposażonych w treść nie
generują tej treści wyłącznie same z siebie, tylko w ramach społecznego
podziału pracy językowej. Dlatego też redukcja treści semantycznych do
własności niesemantycznych, choćby była ciekawym teoretycznie problemem, pozostaje kwestią stosunkowo akademicką, gdy mowa o systemach biologicznych czy wzorowanych na biologicznych.
Postulowanie zdolności sensomotorycznych jako warunku koniecznego rozpoznawania desygnatów dlatego wydaje się tak oczywiste, że
kategoryzacja otoczenia wymaga aktywnej eksploracji (zdolności motoryczne) i detekcji obiektów (zdolności sensoryczne). Jednak zakłada
się wówczas de facto empirystyczną koncepcję treści umysłowej: pochodzić mają one wszystkie z wrażeń zmysłowych, bezpośrednio lub
przez kombinację. Nie odbiega to więc daleko od Hume’owskiej koncepcji idei, które albo wywodzą się bezpośrednio z doświadczenia, albo są konstruowane z innych wrażeń zmysłowych. Nie trzeba długo
szukać, aby przekonać się, że nie wszystkie treści reprezentacji w ogóle mają jakikolwiek aspekt sensoryczny czy też motoryczny. Wystarczy wskazać na reprezentacje matematyczne czy normatywne. Trudno twierdzić, że treść pojęcia „dobro” da się wyrazić w skończonym
zbiorze koniecznych i wystarczających cech sensorycznych i motorycznych. Choć odnosimy pojęcie dobra do różnych empirycznie dostępnych
przedmiotów, to nie jest ono po prostu redukowalne do poziomu detekcji sensoryczno-motorycznej. Być może skomplikowany robot byłby
11
Przegląd odpowiedzi na to pytanie w odniesieniu do tzw. problemu
ugruntowania symboli przedstawiają Floridi i Taddeo 2005. Ich własne rozwiązanie tego problemu stanowi pozytywną odpowiedź na pytanie o możliwość redukcji własności semantycznych do niesemantycznych, por. Floridi
i Taddeo 2007.
38
Marcin Miłkowski
w stanie znaleźć statystyczny wzorzec we wszystkich dobrych jabłkach,
samochodach i uczynkach, ale naprawdę jałowe wydaje się poszukiwanie sensorycznych aspektów treści pojęcia liczby 2 czy zbioru. Treść
tych pojęć bowiem nie sprowadza się całkowicie do aspektów sensomotorycznych. Aby móc utrzymać tezę, że treść reprezentacji to tyle,
co warunki rozpoznawania ich desygnatów sformułowane w kategoriach
sensomotorycznych, trzeba poczynić założenia klasycznego empiryzmu
genetycznego. Łącznie z rozróżnieniem pojęć analitycznych (np. matematycznych) i syntetycznych, co po krytyce Quine’a jest dosyć trudne12 .
W wypadku systemów, które posługują się wyłącznie reprezentacjami typu sensorycznego, takie empirystyczne rozwiązanie będzie zapewne wystarczające (jako pewna heurystyka). Jednak system obliczeniowy
korzystający z pojęć matematycznych lub wspomagający ferowanie sądów normatywnych (np. wspomagający decyzje bioetyczne) nie zmieści
się na prokrustowym łożu semantyki empiryzmu logicznego.
Zresztą nawet przedstawiciele empiryzmu logicznego nie przyjmowali
tak skrajnych założeń. Wystarczy odwołać się do klasycznego artykułu
Carnapa (1955), który pisał o „pojęciu intensji dla robota”. Otóż zdaniem Carnapa, intensję pojęcia można wyrazić w kategoriach stanów
organów sensorycznych lub opisu podawanego na wejścia językowe danego robota. Odpowiednie pobudzenia organów lub analiza opisu mają
prowadzić do tego, że robot, napotkawszy określony predykat, określa,
czy predykat oznacza obiekt wykryty przez organ sensoryczny lub opisany językowo — wydaje wówczas werdykt pozytywny, negatywny lub
wstrzymuje się od głosu. Carnap, w przeciwieństwie do wielu innych
autorów, nie przesądza, jaką strukturę ma sama treść konotacyjna —
nie musi być ona ujęta np. w kategoriach cech konstytutywnych i konsekutywnych. Mówiąc krótko, Carnap dopuszcza też możliwość określania intensji predykatu wyłącznie w kategoriach opisu językowego,
bez jakichkolwiek wejść sensorycznych. Zdaje się jednak, że sądzi, że
brak wejść sensorycznych świadczyć może o pustości reprezentacji (np.
w wypadku pojęcia „ jednorożec”).
We współczesnej filozofii języka w rozmaity sposób próbuje się przezwyciężać koncepcje empiryzmu. Są podejścia holistyczne, gdzie treść
jest definiowana przez sieć relacji między reprezentacjami (konotacja
jest rozumiana np. jako tzw. rola pojęciowa). Są też próby eliminacji
12
Pojęcia normatywne można by próbować sprowadzać, jak emotywizm,
do emocji, pozbawiając je treści. Wydaje mi się oczywiste, że to pomysł
chybiony: emotywizm nie potrafi po prostu zdać sprawy z sensu terminów
etycznych.
Reprezentacje w systemach...
39
tego pojęcia i zastąpienia go np. użyciem wyrażeń. Aby nie rozstrzygać
na rzecz któregokolwiek z tych podejść, będę proponował inną strategię. Wrócę do systemów przetwarzających informacje wydobyte z sytuacji i przeprowadzę eksperyment myślowy podobny do proponowanego
przez Carnapa.
Pojęcie konotacji lub intensji historycznie wprowadzono po to, aby
móc pokazać, że równozakresowe nazwy nie mogą być podstawiane
w rozumowaniach salva veritate. Załóżmy więc, że system generuje dwie
złożone reprezentacje — struktury danych — i używa ich w jakiejś
szerszej reprezentacji opisowej (np. w zdaniu oznajmującym lub jako
część diagramu; nie rozstrzygam o postaci reprezentacji). Problemem,
który system musi być w stanie rozwiązać, np. na drodze rozumowania, jest określenie, że te dwie reprezentacje, choć mają różną treść, są
jednak równozakresowe. Treść w tym wypadku będzie rozumiana jako zespół warunków (w skrajnym, ale rzadkim wypadku: koniecznych
i wystarczających), które spełnia kategoria desygnatów reprezentacji.
Te warunki służą do rozpoznawania desygnatów, ale niekoniecznie na
drodze detekcji sensomotorycznej. Jeśli desygnat nie jest przedmiotem
podlegającym detekcji sensorycznej, bo jest np. wewnętrznym stanem
obliczeniowym (liczba dwa) lub abstraktem (zbiór), system będzie traktował reprezentację nie jako wydobytą z otoczenia fizycznego — gdyż
nie jest w stanie odnieść jej do wejść systemu — lecz jako element
sytuacji wewnętrznej systemu, o ile system posługuje się takimi konstrukcjami, jak zbiór czy liczby. Jeśli zaś desygnat nie istnieje ani jako sytuacja w otoczeniu systemu, ani jako jego sytuacja wewnętrzna,
będzie traktowany formalnie, jako reprezentacja o nieznanej ekstensji.
Operacje obliczeniowe, przekształcające formalną strukturę warunków
mogą doprowadzić do wskazania, czy to na drodze faktycznego próbkowania sytuacji, czy też przez zastosowanie bazy wiedzy, że intensje,
choć różne, wyznaczają ten sam zakres.
Odnieśmy to do systemów klasycznych i koneksjonistycznych. Jak
zauważył Chalmers (1992), klasyczne systemy sztucznej inteligencji operują raczej na atomowych reprezentacjach bez żadnej struktury wewnętrznej. Te reprezentacje są powiązane różnymi relacjami, lecz to
nie wystarcza, jak twierdzi Chalmers, aby można było mówić o intensjonalności tych reprezentacji. To pojedyncza bowiem reprezentacja
musi mieć na tyle złożoną strukturę, aby można było mówić, że zawiera także cechy konotacyjne. Zdaniem Chalmersa, taką strukturę —
strukturę subsymboliczną — mają systemy koneksjonistyczne, gdzie reprezentacje mają postać węzłów sieci neuronowych, w których istnieją
warstwy ukryte. To jedyna nadzieja, jego zdaniem, na prawdziwą realizację konotacji w systemach obliczeniowych, lecz — co podkreśla —
40
Marcin Miłkowski
na razie trudno powiedzieć, jak by to mogło w szczegółach wyglądać.
Ujęcie Chalmersa obarczone jest grzechem, o którym wspomniałem na
początku artykułu: autor ten sądzi, że intensja reprezentacji musi być
cechą wewnętrzną samej struktury danych, która w określonym systemie obliczeniowym realizuje taką reprezentację. Wydaje się, że nieistotna jest sama struktura wewnętrzna samej reprezentacji. Idzie o to,
czy jest ona stosowana w systemie, w którym może mieć treść w sensie
posiadania warunków wskazywania desygnatów. Na przykład pojedynczy zapalony bit w systemie komputerowym może reprezentować liczbę
naturalną 1, a to na mocy struktur relacyjnych w procesach, które będą
operować na tym bicie. Z kolei skomplikowany ciąg liter wytworzony
przez 300-krotne powtarzanie struktury „abcabc...” będzie pozbawiony
intensji w systemie rozpoznającym zdania napisane w języku polskim.
Innymi słowy, tam, gdzie reprezentacje mogą służyć do kategoryzacji,
tam mają też treść.
Co ciekawe, również systemy korzystające wyłącznie z informacji już
przetworzonych mogą mieć tego rodzaju reprezentacje, choćby te przetworzone informacje same nie odnosiły się do żadnych desygnatów. Wydaje się, że to wynik dosyć intuicyjny (wbrew sugestiom Searle’a i Harnada): puste pojęcia mogą mieć rozbudowane intensje. Choćby wujowie
centaurów byli zakresowo identyczni ze stopami centaurów, to jednak
treściowo się różnią. Takie różnice w treści są w stanie wychwycić nawet
proste mechanizmy obliczeniowe, korzystające ze skomputeryzowanych
sieci semantycznych. Nie muszą być robotami: detekcja sensomotoryczna dotyczy tylko niektórych reprezentacji, których warunki odnoszenia
są do wyrażenia w takich kategoriach. Przypisanie istnienia treści reprezentacji podlega przy tym analogicznym warunkom, jak w wypadku
przetwarzania informacji: musi być potrzebne z punktu widzenia predykcji, wyjaśniania i opisu itd.
4. Podsumowanie
Twierdzę, że systemy obliczeniowe mogą zawierać reprezentacje odnoszące się do przedmiotów i że mogą dysponować strukturami danych
wskazującymi warunki prawidłowego odnoszenia się do przedmiotów
(choćby owe przedmioty były czysto intencjonalne). Tylko w wypadku odniesienia konieczne jest powiązane mechanizmów obliczeniowych
— w ramach systemów przetwarzania informacji — ze światem zewnętrznym (lub wewnętrznym, jeśli system przetwarza informacje na
swój własny temat). Intensje mogą istnieć bardziej niezależnie od niego,
choć mogą być też określone w kategoriach wymagających przyczynowego kontaktu ze światem. Na przykład intensja nazwy własnej musi
Reprezentacje w systemach...
41
określać indywiduum, którego dotyczyła określona procedura nazywania w przeszłości: określenie to jednak polega po prostu na prześledzeniu historii indywiduum od momentu nazwania, a nie znalezieniu go
choćby przez najbardziej jednoznaczny opis.
W ramach tego ogólnego ujęcia widać, że pod tym przynajmniej
względem nie ma żadnej interesującej różnicy między systemami typu
klasycznego (GOFAI), koneksjonistycznego, hybrydowego czy np. populacjami algorytmów ewolucyjnych. Wszystkie te architektury mogą
mieć zdolności semantyczne, o ile tylko będą przetwarzać informacje
z sytuacji oraz operować na warunkach odnoszenia się reprezentacji.
Własności semantyczne, mówiąc krótko, są wielorako realizowalne.
Literatura
Bechtel, W., Richardson, R. C. (1993). Discovering complexity: Decomposition and localization as strategies in scientific research. Princeton: Princeton University Press.
Carnap, R. (1955). Meaning and Synonymy in Natural Languages. Philosophical Studies, VI, 3, s. 33–47.
Chaitin, G. J. (1975). Randomness and Mathematical Proof. Scientific
American, 232, 5, s. 47–52.
Chaitin, G. J. (1987). Algorithmic Information Theory. Cambridge: Cambridge University Press.
Chalmers, D. (1992). Subsymbolic computation and the Chinese Room.
W: Dinsmore, J. (red.) The Symbolic and Connectionist Paradigms: Closing
the Gap. Lawrence Erlbaum.
Collier, J. (1990). Intrinsic Information. W: Hanson, P. (red.) Information,
Language, and Cognition. University of British Columbia Press, s. 390–409.
Craver, C. F. (2006). When Mechanistic Models Explain. Synthese 153,
3, s. 355–376.
Feynman, R. (1982). Simulating Physics with Computers. International
Journal of Theoretical Physics 11, 21.
Floridi, L., Taddeo, M. (2005). The Symbol Grounding Problem: a Critical
Review of Fifteen Years of Research. Journal of Experimental and Theoretical
Artificial Intelligence 17, 4, s. 419–445.
Floridi, L., Taddeo, M. (2007). A Praxical Solution of the Symbol Grounding Problem. Minds and Machines 17, 4, s. 369–389.
Harnad, S. (1990). The Symbol Grounding Problem. Physica D 42, s. 335346.
Israel, D. J., Perry J. (1990). What Is Information? W: P. Hanson (red.)
Information, Language, and Cognition. University of British Columbia Press,
s. 1-19.
McClamrock, R. (1995). Existential Cognition. Computational Minds in
the World. Chicago, London: University of Chicago Press.
Miłkowski, M. (2007). Is computationalism trivial? W: Dodig Crnkovic,
42
Marcin Miłkowski
G., Stuart S. (red.) Computation, Information, Cognition — The Nexus and
the Liminal. Cambridge Scholars Publishing, s. 236–246.
Miłkowski, M. (2008). Postulowanie utajonych funkcji umysłu: realizm
kontra antyrealizm. W: Wróbel, Sz. (red.) Utajone funkcje umysłu. PoznańKalisz: Wydział Pedagogiczno-Artystyczny UAM w Kaliszu, s. 15–37.
Miłkowski, M. (2009). O tzw. metaforze komputerowej. Analiza i Egzystencja 9, s. 163-185.
Piccinini, G. (2007). Computational Explanation and Mechanistic Explanation of Mind. W: de Caro, M., Ferretti, F., Marraffa, M. (red.) Cartographies of the Mind: The Interface between Philosophy and Cognitive Science.
Dordrecht: Springer, s. 23–36.
Poczobut, R. (2005). Od informacji fizycznej do informacji fenomenalnej.
W: Heller, M., Mączka, J. (red.) Informacja a rozumienie. Kraków: PAUOBI, s. 177–193.
Searle, J. R. (1995). Umysły, mózgi i programy, przeł. B. Chwedeńczuk.
W: Chwedeńczuk, B. (red.) Fragmenty filozofii analitycznej, tom II. Filozofia
umysłu. Warszawa: Fundacja Aletheia, s. 301–324.
Searle, J. R. (1999). Umysł na nowo odkryty, przeł. T. Baszniak. Warszawa: PIW.
Wimsatt, W. C. (2007). Re-Engineering Philosophy for Limited Beings.
Cambridge, Mass.: Harvard University Press.
Procesy wyobrażeniowe on-line
Piotr Markiewicz
Instytut Filozofii UWM
Wojewódzki Szpital Specjalistyczny w Olsztynie
Streszczenie. Typowe stanowisko w kontekście procesów wyobrażeniowych zakłada, że takie procesy realizują się bez obecności bodźca percepcyjnego. Celem artykułu jest wykazanie, że istnieją specyficzne procesy wyobrażeniowe transformujące bodziec percepcyjny w jego obecności.
Inaczej mówiąc, niektóre wyobrażenia mają status on-line w procesie
przetwarzania informacji wizualnej. Można się o tym przekonać analizując przykłady prostych iluzji wzrokowych. Podczas doznawania iluzji
włączają się prawdopodobnie dodatkowe operacje wyobrażeniowe, które
pozwalają na wizualizację osobliwych własności w bodźcach iluzorycznych. W konsekwencji proces rejestracji iluzji ma charakter dwutorowy,
tj. percepcyjny i wyobrażeniowy. W procesie percepcji system wizualny przetwarza informacje o dostępnych danych i formułuje hipotezę
o specyficzności obiektu. Natomiast weryfikację hipotezy przeprowadza
system wyobrażeniowy, który rekonstruuje wizualnie niekompletne
informacje w bodźcach. Zarysowany pogląd opieram na wynikach współczesnych badań neurokognitywnych w zakresie przetwarzania informacji
wizualnej.
1. Problematyka
Kryterium obecności bodźca zewnętrznego podczas realizacji procesu poznawczego pozwala różnicować reprezentacje na dwa główne typy.
Pierwszy typ reprezentacji wymaga istnienia takiego bodźca. Są to tzw.
reprezentacje w obecności. Przykładem takiej reprezentacji jest reprezentacja percepcyjna (percept). Drugi typ reprezentacji nie wymaga
istnienia bodźca zewnętrznego i jest to tzw. reprezentacja pod nieobecność, np. reprezentacja pamięciowa (Najder 1993). W innej terminologii reprezentacja w obecności to reprezentacja on-line, a reprezentacja
pod nieobecność to reprezentacja off-line. Taka typologia jest czytelna,
gdy próbujemy np. odróżnić stany percepcyjne od stanów halucynacji. Wówczas te ostatnie są przykładem procesów off-line, związanych
Studia z Kognitywistyki i Filozofii Umysłu, 3: 43–53, 2009
c 2009 Piotr Markiewicz
Copyright 44
Piotr Markiewicz
z patologiczną aktywnością ośrodkowego układu nerwowego (Ffytche,
Howard 1999).
Problemy z typologią on-line/off-line dotyczą procesów wyobrażeniowych. Standardowy pogląd przypisuje wyobraźni status off-line, tzn.
wyobrażenia powstają bez obecności fizycznego bodźca (np. Mesulam
1998; Thomas 1999; Andrewes 2001; Kaski 2002). Odpowiada temu
operacjonalizacja procesów wyobrażeniowych, w których osoby badane po obserwacji bodźca percepcyjnego A otrzymują jego zrotowaną
wersję A1 i dokonują decyzji o stanie rotacji A1 w stosunku do A.
W momencie podejmowania decyzji bodziec A jest niewidoczny i nawet wykluczana jest obecność obrazu następczego A (eksperyment 1, w:
Francuz, Oleś, Chumak 2008). Podobnie procedura ustalania rozmiaru
wyobrażeń w zadaniu oceny odległości osoby badanej od wyobrażonego obiektu, gdy ten przekracza wyobrażone pole widzenia, również
nie wymaga obecności sensorycznej takiego obiektu (Farah, Soso, Dasheiff 1992). W obu opisanych zadaniach zakłada się, że wyobrażenia
powstają w niedostępnej ekstrapersonalnie przestrzeni (stąd metafora
mind’s eye jako procesu wewnętrznej wizualizacji, por. Kosslyn, Sukel, Bly 1999; Kosslyn, Shephard, Thompson 2007), w której następują różne procesy transformacji obiektu poprzednio widzianego lub
przechowywanego w pamięci. O takich transformacjach świadczą efekty
m.in. istotnie dłuższego czasu umysłowej operacji rotowania obiektów
prezentowanych w perspektywie kanonicznej (czyli najbardziej typowej
dla obserwatora) niż w perspektywie niekanonicznej (eksperyment 2,
w: Francuz, Oleś, Chumak 2008) oraz deficyty generowania adekwatnych wyobrażeń u osób z prawą potyliczną lobektomią w postaci znacznie mniejszych rozmiarów wyobrażanych obiektów w stosunku do rzeczywistych odpowiedników (Farah, Soso, Dasheiff 1992).
Czy jednak każdy proces wyobrażeniowy ma charakter off-line? Wydaje się, że brak obecności bodźca percepcyjnego nie jest warunkiem
koniecznym realizacji procesu wyobrażeniowego. Przykładowo, podczas
rejestracji percepcyjnej np. szafy można jednocześnie dopasować kolejne wyobrażone szafy w pokoju i w efekcie ustalić ich maksymalną
liczbę. Procedura wyobrażeniowego dopasowania nie likwidowała obecności bodźca percepcyjnego (szafy) i co więcej, taki bodziec umożliwił
całą operację. W artykule postaram się wykazać, że istnieją specyficzne procesy wyobrażeniowe transformujące bodziec percepcyjny w jego
obecności. Inaczej mówiąc, wbrew tradycyjnie przyjmowanemu poglądowi niektóre wyobrażenia mają status on-line.
Procesy wyobrażeniowe on-line
(a)
(b)
45
(c)
RYS. 1. (a) przedstawia tzw. kratę Hermanna. Podczas percepcji takiego obiektu obserwator może dostrzec iluzoryczne ciemne plamki na przecięciach białych linii. Z kolei
rys. (b) to tzw. iluzja Pettera, gdzie obserwator ma doznanie przedłużenia poziomych linii
w postaci jasnej iluzorycznej linii na pionowym prostokącie. Natomiast rys. (c) przedstawia tzw. trójkąt Kanizsy, a więc przypadek dostrzegania iluzorycznego trójkąta nałożonego na trzy czarne koła.
2. Przykłady bodźców percepcyjno-wyobrażeniowych
Pewne osobliwe przypadki iluzorycznych bodźców percepcyjnych sugerują dodatkową obecność niepercepcyjnych procesów. Tak jest w przypadku obiektów na rys. 1.
Standardowe wyjaśnienia iluzorycznych zjawisk na rys. 1 nie wykraczają poza możliwości percepcji. W tej mierze przyjmuje się, że
konstrukcyjna natura procesów percepcji jest w stanie dołączyć do
obiektów 1-3 dodatkowe interpretacje wykorzystujące dane wizualne
w obiektach. Proporcje czarnych i białych powierzchni na rys. 1(a)
pozwalają ustalić iluzoryczne przedłużenia czarnej linii na białej powierzchni, proporcja prostokątów oraz udział białego tła na rys. 1(b)
umożliwia wprowadzenie interpretacji przedłużenia mniejszego prostokąta, a kąty w czarnych kołach na rys. 1(c) dopuszczają interpretację domykającą figurę trójkąta (przegląd i dyskusja badań: Markiewicz
2008). Główne uzasadnienie interpretacji percepcyjnej w kontekście 1-3
wynika z założenia, że procesy widzenia nie są izomorficzną odpowiedzią
na sygnały sensoryczne, czego przykładem mogą być prawa psychologii
Gestalt oraz komputacyjny model percepcji Marra (Kellman 2003).
Wyjaśnienia percepcyjne zjawisk iluzji 1-3 napotkają jednak na pewne trudności. Podstawowe problemy wyznaczają pytania: (A) czy można zobaczyć coś, czego nie ma fizykalnie w bodźcu?, (B) jaki status
kognitywny mają wprowadzone przez system wzrokowy iluzoryczne interpretacje wizualne? Odpowiedź na pytanie (A) wydaje się trywialna
przy posłużeniu się dowolnym przykładem z psychologii Gestalt (obserwator widząc np. kropki widzi także ich zbiór w postaci kolumn). Poza
tym doznający iluzji na rys. 1 mogą konkretnie wskazać to, co widzą,
a więc zarówno elementy bodźców 1-3 oraz zjawiska iluzoryczne. Jednak
46
Piotr Markiewicz
Informacja
receptorowa
-
RYS.
2.
Automatyczne
kodowanie
podstawowych
cech obiektu
Analiza cech
lokalnych
i globalnych
Detekcja
formy
obiektu
Zaawansowane
przetwarzanie
percepcyjne
-
Etapy przetwarzania wizualnego
nawet przyjmując, że można zobaczyć faktycznie nieistniejące efekty
iluzoryczne na rys. 1 nadal nie wiemy, czy to, co dostrzegają obserwatorzy jest perceptem. Stąd pytanie (B), które jest trafne w tym sensie,
że doznawane efekty iluzoryczne są mniej stabilne (np. plamki w kracie
Hermanna zmieniają się w zależności od ruchów gałek ocznych) i mniej
wyraziste niż pozostałe dane wizualne na rys. 1 (np. czarne kwadraty,
czarne prostokąty i czarne koła z wcięciami). Czy to oznacza, że w konsekwencji musielibyśmy uznać dwa typy reprezentacji percepcyjnych ––
jedną odniesioną do stymulacji sensorycznej i drugą wytworzoną przez
system percepcyjny poza taką stymulacją? Jeśli nawet zgodzimy się
z taką interpretacją, to w ten sposób drugi typ reprezentacji percepcyjnej staje się praktycznie nieodróżnialny od stanu halucynacji.
Badacze iluzji zdają się dostrzegać wskazany problem, ale dotychczasowe propozycje wskazują raczej na brak adekwatnego jego rozwiązania.
Jedna z opcji uznaje, że doznanie iluzji np. na rys. 1(c) jest efektem
fałszywego alarmu, gdyż obserwator bodźca iluzyjnego daje się oszukać
jego własnościom naśladującym realne obiekty i następnie podejmuje
błędną decyzję wizualną (Kim, Blake 2005). W innej opcji zjawiska iluzyjne zawiera takie niepercepcyjne kategorie, jak fantazmatyczne smugi
lub fantomy systemu wzrokowego (May, Brown, Roberts 1999; Fineman
1996; Schiller, Carvey 2005), a nawet włącza kategorie synestezji (Kim,
Blake 2005). Decyzyjna, fantomowa czy synestetyczna kategoryzacja
efektów iluzorycznych sugeruje raczej, że w procesie formowania iluzji
uczestniczą inne niż tylko percepcyjne procesy. Przykładowo, w przypadku synestezji opis tego zjawiska angażuje m.in. zdolności pamięciowe, przeżycia emocjonalne, aury epileptyczne i halucynacje (Herzyk
2005).
Możliwe rozwiązanie problemu statusu kognitywnego efektów iluzorycznych z rys. 1 polega uznaniu, że podczas doznawania iluzji włączają
się dodatkowe operacje wyobrażeniowe, które pozwalają na wizualizację
osobliwych własności w bodźcach 1-3. Wówczas proces rejestracji iluzji
Procesy wyobrażeniowe on-line
47
ma charakter dwutorowy, tj. percepcyjny i wyobrażeniowy. W procesie
percepcji system wizualny przetwarza informacje o dostępnych danych
i formułuje hipotezę o specyficzności obiektu. Natomiast weryfikację hipotezy przeprowadza system wyobrażeniowy, który rekonstruuje wizualnie niekompletne informacje w bodźcach 1-3. Taka wizualizacja jest
na tyle intensywna, że obserwator może mieć wrażenie percepcji jej
efektów. W jaki sposób i dlaczego system wyobrażeniowy wytwarza
tak silne wizualizacje?
3. Mechanizm wyobrażeń on-line
Poznawcza analiza obiektów na rys. 1 nie jest skomplikowana
z dwóch powodów. Po pierwsze, każdy z nich jest zbiorem prostych
dwuwymiarowych figur. Po drugie, obiekty 1-3 są pozbawione zróżnicowanego tła i kontekstu. Dlatego tak wypreparowane obiekty nadają
się doskonale do ujawniania możliwości systemu wizualnego.
Ze względu na niski stopień złożoności obiektów 1-3 ich poznawcza
analiza ogranicza się do detekcji krawędzi, barwy, kontrastów, rozmiaru,
kierunków, figur. Tego typu funkcjami w systemie wzrokowym zajmują
się obszary V1 i V2 kory wzrokowej (Fahle 2003; Halligan i In. 2003;
Palmer 2003; Tong 2003). System wczesnych funkcji wzrokowych jest
też kategoryzowany jako bufor wzrokowy (Kosslyn 2005; Francuz 2007).
Bufor wizualny z poziomu V1 specjalizuje się początkowo w odrębnym
kodowaniu informacji na temat m.in. barwy, kontrastów, rozmiaru, kierunku linii (rys. 2). Efektem tych procesów może być rozpoznanie konturów obiektu. Kolejny etap wyznaczają dwa procesy sterowane uwagowo. Pierwszy dotyczy ogólnego kształtu obiektu, a drugi zajmuje się
jego cechami lokalnymi. W tej fazie uwaga ma charakter mimowolny,
tzn. jest sterowana cechami bodźca. Przy zwiększeniu zakresu bufora
wizualnego o V2 można mówić o dodatkowych jego funkcjach polegających na rozpoznaniu formy obiektu (integracja konturów, segmentacja)
(Bradley 2001; Heydt 2003). Dalsze etapy przetwarzania wizualnego
sprowadzają się do kategoryzacji w oparciu o wizualne dane pamięciowe (rys. 2, strzałka prawa).
Z uwagi na temat artykułu najważniejsza kwestia dotyczy tego, że
bufor wizualny jest traktowany jako podstawa procesów wyobrażeniowych (Kosslyn 2005). To tu właśnie powstaje szkic widzianego obiektu
i tu także pojawiają się wstępne hipotezy percepcyjne. Przy typowych
wyobrażeniach bufor wizualny jest wspomagany przez dodatkowe odgórne procedury wykonawcze. Inicjatorem takiego procesu jest moduł
przerzucania informacji, który może jednocześnie włączyć dodatkowe
skanowanie bufora wizualnego przy pomocy modułu przesunięcia uwagi
48
Piotr Markiewicz
oraz wykorzystać wsteczną aktywację informacji w buforze wizualnym
dzięki informacjom o własnościach obiektów zmagazynowanych w pamięci długotrwałej. Dodatkowo, informacje z pamięci długotrwałej mogą jednocześnie wyznaczyć szczegóły przeszukiwania zgodnie z rozkładem przechowywanych danych. Tego typu odgórne operacje są według
Kosslyna stałym komponentem procesów wyobrażeniowych.
Co się jednak dzieje w przypadku obiektów 1-3. Ze względu na ich
prostotę nie są wymagane zaawansowane hipotezy percepcyjne wykorzystujące dane pamięci długotrwałej. Bufor wizualny wykonuje zadane operacje percepcyjne (rys. 2), ale ze względu na efekty iluzoryczne
prawdopodobnie angażowane są dodatkowe operacje kognitywne. Wróćmy do obiektu 1.
Klasyczne wyjaśnienie iluzorycznych plamek w kracie Hermanna
(rys. 1(a)) odwołuje się do specyficznej aktywności komórek zwojowych siatkówki. Jednak współczesne wyjaśnienie sięga dalej w hierarchii przetwarzania wzrokowego. Występowanie iluzji jest prawdopodobnie możliwe dzięki komórkom specjalizującym się w rozpoznawaniu linii
poziomych i pionowych. Komórki wrażliwe na kierunek orientacji przestrzennej, z których większość specjalizuje się w orientacji poziomej
i pionowej, znajdują się w obszarze V1. Wcześniejsze etapy drogi wzrokowej, w tym siatkówka i ciała kolankowate boczne, nie specjalizują się
w detekcji tego rodzaju (Schiller, Carvey 2005).
W jaki jednak sposób komórki V1 wywołują iluzoryczne elementy
w kracie Hermanna? Prawdopodobnie odpowiadają za to dwa mechanizmy (Schiller, Carvey 2005). Pierwszy z nich zawiera neurony specjalizujące się w rozpoznawaniu kierunku linii. Te neurony (nazywane S1)
reagują silniej na dłuższe, niż krótsze linie. Dlatego krawędzie sąsiadujących ze sobą kwadratów w kracie są interpretowane jako nietypowa
przerwa w linii i stąd S1 mogą być wzbudzane w niewielkim zakresie,
ale na tyle silnym, żeby wywołać proces rzutowania brakującej linii
– zarówno pionowej i poziomej. Natomiast drugi mechanizm tworzący iluzoryczne plamki posiada neurony wrażliwe na zmiany natężenia
światła i odpowiada za percepcję stopnia jasności obiektu. Podobnie jak
w komórkach siatkówki, także i tutaj zmiany świetlne mogą być rejestrowane przez system ON (wzbudzenie przy wzroście natężenia) i OFF
(wzbudzenie przy spadku natężenia). Właśnie system OFF może być
aktywowany przez czarne elementy kraty Hermanna, czego efektem są
doznania ciemnych plam na skrzyżowaniach linii.
Przedstawiona interpretacja ujawnia podwójny proces przetwarzania
wizualnego w kracie Hermanna. Z jednej strony, zgodnie z pierwotnymi funkcjami bufora wizualnego (rys. 2) system wzrokowy rozpoznaje
linie i barwy obiektu. Z drugiej strony system ten wprowadza dodat-
Procesy wyobrażeniowe on-line
RYS.
3.
49
Operacje iluzyjne w trójkącie Kanizsy (A-C opis w tekście)
kowe operacje uzupełniające luki w liniach i nanoszące efekty świetlne.
Takie dołączone funkcje stanowią przypuszczalnie pierwsze przejawy
procesów wyobrażeniowych w obecności bodźca percepcyjnego. Na tym
etapie działanie wyobraźni jest bardzo ograniczone i właściwie stanowi
uzupełnienie wskazówek bodźcowych.
Kolejny obiekt wyzwalający iluzję (rys. 1(b)) nie dostarcza nowych
wskazówek dla innych typów operacji wyobrażeniowych. Doznanie iluzorycznej linii Pettera odwołuje się do tych samych mechanizmów, które
warunkowały iluzoryczne plamki w kracie Hermanna. Natomiast trójkąt Kanizsy wprowadza nowe możliwości dla systemu wyobrażeniowego. Ilość uzupełnień wizualnych wykonywana przez system wzrokowy
na rys. 1(c) to cztery operacje. Przede wszystkim możemy dostrzec dopełnienie wcięć w kołach w postaci lekko przyciemnionych obszarów.
Bardziej jednak widoczna jest interpretacja jasnego trójkąta nałożonego na trzy czarne koła (rys. 3). Zawiera ona w sobie trzy procedury:
rozjaśnienia iluzorycznego trójkąta względem tła (rys. 3A), domknięcie iluzorycznego trójkąta (rys. 3B) i podniesienie trójkąta względem
płaszczyzny z kółkami (rys. 3C).
Tak, jak w przypadku poprzednich obiektów (rys. 1(b) i 1(c)) procesy wyobrażeniowe w trójkącie Kanizsy również rozpoczynają się od
dołączanych efektów liniowych i świetlnych. W kolejnej fazie oba procesy mogą być jednak integrowane celem utworzenia reprezentacji figury
(rys. 2 –– analiza cech globalnych) oraz segmentacji przestrzennej (rys.
2 –– detekcja formy obiektu) (por. Spillmann, Dresp 1995). Zarówno
reprezentacja figury i segmentacja są operacjami dołączonymi do jednocześnie realizowanych procesów percepcji w związku z bodźcem Kanizsy
(analiza dostępnych linii, kształtów, kontrastów, dostępnych figur).
Przetwarzanie obiektów iluzorycznych wykracza jednak poza funkcje bufora wizualnego (rys. 2), realizującego wczesne funkcje wizual-
50
Piotr Markiewicz
Informacja
receptorowa
-
RYS.
4.
Kodowanie
podstawowych
cech obiektu
Analiza cech
lokalnych
i globalnych
Detekcja
formy
obiektu
Uzupełnienie
luk w liniach,
efekty świetlne
Kontury,
reprezentacja
figury
Interpretacja
położenia
Zaawansowane
przetwarzanie
-
Funkcje wyobrażeniowe
ne. Jednym z powodów takiego stwierdzenia jest aktywność czołowa
(zwłaszcza kory oczodołowej) podczas poznawania konturów iluzorycznych (Stanley, Rubin 2003; Halgren i in. 2003). W ten sposób analizy
procesów wyobrażeniowych podczas doznawania iluzji stają się bardziej
skomplikowane, ale zarazem pojawia się wsparcie z modelu procesów
wyobrażeniowych Kosslyna, w którym struktury czołowe (funkcje wykonawcze) decydują o realizacji wyobrażeń. Aktywność czołowa przy
doznaniu obiektów iluzorycznych sugeruje silne związki analizy konturów iluzorycznych z systemami pamięci (Wallach, Slaughter 1988).
Podobna aktywność pojawia się w przypadku rozpoznawania realnych
obiektów, ale percepcyjnie zdegradowanych lub parcjalnych (Bar 2003).
Jaki jest dokładnie mechanizm udziału struktur czołowych podczas doznawania obiektów iluzorycznych, nie wiadomo. Przypuszczalnie mózgowie traktuje obiekty iluzoryczne jako obiekty nietypowe, które wymagają dodatkowych analiz celem ich poznawczego opanowania, np.
skonstruowania syntezy wyobrażeń automatycznie wywołanych na niższych poziomach przetwarzania informacji wizualnej.
Niezależnie od dalszych ustaleń przyjęcie interpretacji wyobrażeniowej iluzji dostępnych na rys. 1 pozwala poszerzyć dotychczasowe funkcje
sensoryczne/percepcyjne bufora wizualnego (rys. 2) o trzy dodatkowe
funkcje wyobrażeniowe (rys. 4, prostokąty z przerywaną linią): uzupełnianie luk w liniach i uzupełnianie świetlne, tworzenie reprezentacji
konturów i figury oraz interpretację położenia (interpretacja przestrzenna).
Każda z wymienionych funkcji wyobrażeniowych jest konsekwencją
towarzyszącej jej funkcji sensoryczno-percepcyjnej. Przykładowo, zapis
podstawowych cech obiektu pozwala na wyobrażeniowe funkcje uzupełniające w zakresie linii i jasności.
Jeśli zgodzimy się na taki scenariusz, to procesy wyobrażeniowe pojawiają się na bardzo wczesnym etapie analizy wizualnej. W przypad-
Procesy wyobrażeniowe on-line
Bodziec
iluzyjny
⇒
Analiza
sensoryczna
Analiza
percepcyjna
Automatyczne
wyobrażenia
wizualne
RYS.
5.
51
⇒
Doznanie
iluzji
Analiza wizualna podczas doznawania iluzji
ku obiektów 1-3 takie wyobrażenia powodują doznanie iluzji wizualnych
podczas jednoczesnej rejestracji sensorycznej i percepcyjnej cech takich
obiektów (rys. 5). Wówczas doświadczenie iluzji wizualnej jest skutkiem dołączonych operacji wyobrażeniowych do standardowych analiz
sensoryczno-percepcyjnych ze względu na specyficzne (niekompletne)
cechy bodźców.
4. Ekologiczna trafność wyobrażeń on-line
Dlaczego system wizualny wprowadza procedury wyobrażeniowe do
analiz sensorycznych i percepcyjnych? Aby odpowiedzieć na to pytanie
warto najpierw zastanowić się nad znaczeniem zjawiska iluzji wizualnych. Wydaje się, że iluzje wizualne są modelem obiektów powszechnie
dostępnych na co dzień, które przykrywa inny obiekt. W efekcie widzimy przedmioty tylko częściowo, w postaci widocznego elementu (np.
przód samochodu wystający zza budynku) lub widocznych fragmentów (np. twarz widziana pomiędzy liśćmi krzewu). Prawdopodobnie wyobrażenia wizualne umożliwiają przede wszystkim szybkie uzupełnianie
danych sensorycznych. Być może również jest to główny powód stosowania przewidywań (rekonstrukcji) wizualnych w przypadku niewidocznych części obiektów. Procesy automatycznego uzupełniania zmniejszają zakres możliwych interpretacji, gdyż system poznawczy reaguje bez
przeprowadzania czasochłonnej analizy alternatywnych rozwiązań. Taka interpretacja wskazuje na silny wpływ warunków środowiskowych
na wykształcenie zdolności wizualizacji niewidocznych własności widzianych obiektów, czego potwierdzeniem może powszechna zdolność
rekonstrukcji iluzorycznych linii i prostych iluzorycznych figur w świecie zwierząt (Nieder 2002). A zatem stan iluzji jaki doznajemy patrząc
52
Piotr Markiewicz
na rys. 1 jest śladem niezwykle silnej presji ewolucyjnej z jaką musieli
zmierzyć się właściciele pierwotnych systemów wzrokowych. Być może
wynikiem takiej presji jest realistyczne doznanie zjawiska iluzji wizualnej. Z uwagi na temat artykułu oznacza to, że iluzja wizualna lub
wizualizacja niedostępnych percepcyjnie części percypowanego obiektu
jest przykładem dysponowania zewnętrznymi atrybutami przez zasadniczo internalny mechanizm zwany wyobraźnią.
Literatura
Andrews, D. G. (2001). Neuropsychology: From Theory to Practice. New
York: Hove.
Bar, M. (2003). A Cortical Mechanism for Triggering Top-Down Facilitation in Visual Object Recognition Journal of Cognitive Neuroscience 15,
s. 600–609.
Bradley, D. (2001). Early Visual Cortex: Smarter than You Think, Current
Biology 11, s. 95–98.
Fahle, M. (2003). Failures of Visual Analysis: Scotoma, Agnosia, and Neglect. W: Fahle, M., Greenlee, M. (red.) The Neuropsychology of Vision.
Oxford: Oxford University Press, s. 179–258.
Farah, M. J., Soso, M. J., Dasheiff, R. M. (1992). The Visual Angle of
the Mind’s Eye before and after Unilateral Occipital Lobectomy. Journal of
Experimental Psychology: Human Perception and Performance 18, s. 241–
246.
Ffytche, D. H., Howard, R. J. (1999). The Perceptual Consequences of
Visual Loss: ’Positive’ Pathologies of Vision. Brain 122, s. 1247–1260
Fineman, M. (1996). The Nature of Visual Illusion. New York: Mineola.
Francuz, P. (2007). Teoria wyobraźni Stephena Kosslyna. Próba reinterpretacji. W: Francuz, P. (red.) Obrazy w umyśle. Studia nad percepcją i wyobraźnią. Warszawa: Wydawnictwo Naukowe Scholar, s. 149–189.
Francuz, P., Oleś, M. A., Chumak, M. (2008). Umysłowa rotacja obiektów
semantycznych i asemantycznych umieszczonych w naturalnym kontekście.
Przegląd Psychologiczny 51, s. 235–260.
Halgren, E., Mendola, J., Chong, C. D. R, Dale, A. M. (2003). Cortical
Activation to Illusory Shapes as Measured with Magnetoencephalography.
NeuroImage 18, s. 1001–1009.
Halligan, P. W., Fink, G. R., Marshall, J. C., Vallar, G. (2003). Spatial
Cognition: Evidence from Visual Neglect. Trends in Cognitive Sciences 7,
s. 125–133.
Heydt, von der, R. (2003). Image Parsing Mechanisms of the Visual Cortex. W: Chalupa, L.M., Werner, J.S. (red.) The visual neurosciences. Cambridge, MA: The MIT Press, s. 1139–1150.
Herzyk, A. (2005). Osobliwości w działaniu mózgu. W: Jodzio, K. (red.)
Neuronalny świat umysłu. Kraków: Wydawnictwo Impuls, s. 63–89.
Kaski, D. (2002). Revision: Is Visual Perception a Requisite for Visual
Imagery? Perception 31, 717–731.
Procesy wyobrażeniowe on-line
53
Kellman, P. J. (2003). Visual Perception of Objects and Boundaries:
A Four-Dimensional Approach. W: Kimchi, R., Behrmann, M., Olson, C.R.
(red.). Perceptual Organization in Vision: Behavioral and Neural Perspectives. Mahwah, NJ: Lawrence Erlbaum Associates, s. 155–201.
Kim, C. Y., Blake, R. (2005). Psychophysical Magic: Rendering the Visible
‘Invisible’. Trends in Cognitive Sciences 9, s. 381–388.
Kosslyn, S. M. (2005). Mental Images and the Brain. Cognitive Neuropsychology 22, s. 333–347.
Kosslyn, S. M., Shephard, J. M., and Thompson, W. L. (2007). The Neurofunctional Organization of Late Visual Processing: Imagery as ”Inner Perception”. W: Mast, F., Jancke, L. (red.) Advances in Studies of Mental Imagery.
New York: Springer, s. 1–16.
Kosslyn, S. M., Sukel, K. E. and Bly, B. M. (1999). Squinting with the
Mind’s Eye: Effects of Stimulus Resolution on Imaginal and Perceptual comparisons. Memory and Cognition 27, s. 276–287.
Markiewicz, P. (2008). Iluzje wzrokowe i automatyczne procesy wyobrażeniowe. W: Wróbel, S. (red.) Utajone funkcje umysłu. Poznań – Kalisz: WPA UAM, s. 179–218.
May, J. G., Brown, J. M., Roberts, S. (1999). Afterimages, Grating Induction and Illusory Phantoms. Vision Research 39, s. 3025–3031.
Mesulam, M. M. (1998). From Sensation to Cognition. Brain 121, s. 1013–
1052.
Najder, K. (1993). Reprezentacja poznawcza we współczesnej psychologii.
W: Kurcz, I. (red.) Psychologia a semiotyka. Pojęcia i zagadnienia. Warszawa: Polskie Towarzystwo Semiotyczne, s. 142–150.
Nieder, A. (2002). Seeing More than Meets the Eye: Processing of Illusory
Contours in Animals, Journal of Comparative Physiology A: Neuroethology,
Sensory, Neural, and Behavioral Physiology 188, s. 249–260.
Palmer, S. E. (2003). Visual Perception of Objects. W: Healy, A.F., Proctor, R.W. (red.) Handbook of Psychology, t. 4, Experimental Psychology. New
Jersey Hoboken, 2003, s. 179–221.
Schiller, P. H., Carvey, C. E. (2005). The Hermann Grid Illusion Revisited.
Perception 34, s. 1375–1397.
Spillmann, L. Dresp, B. (1995). Phenomena of Illusory Form: Can We
Bridge the Gap between Levels of Explanation? Perception 24, s. 1333–1364.
Stanley, D., Rubin, N. (2003). fMRI Activation in Response to Illusory Contours and Salient Regions in the Human Lateral Occipital Complex.
Neuron 37, s. 323–331.
Thomas, N. J. T. (1999). Are Theories of Imagery Theories of Imagination? An Active Perception Approach to Conscious Mental Content. Cognitive Science 23, s. 207–245.
Tong, F. (2003). Primary Visual Cortex and Visual Awareness. Nature
Reviews Neuroscience 4, s. 219–229
Wallach, H., Slaughter, V. (1988). The Role of Memory in Perceiving
Subjective Contours. Perception & Psychophysics 43, s. 101–106.
Widzieć krawędzie, dotykać głębi,
czyli współczesne rozważania
dotyczące pytania Molyneux
Adriana Schetz
Uniwersytet Szczeciński
Instytut Filozofii
Streszczenie. William Molyneux w liście kierowanym do Johna Locke’a zapytał, czy osoba, która była niewidoma od urodzenia, jest w stanie po odzyskaniu wzroku odróżnić sześcian od kuli, tzn. bryły, które były
jej znane wcześniej wyłącznie dotykowo? Przegląd współczesnych rozważań dotyczących pytania Molyneux prowadzi do spostrzeżenia, że nie
bez znaczenia dla omawianej kwestii pozostają empiryczne badania nad
percepcją, niemniej wielu autorów podkreśla, iż pomimo niewątpliwej
pomocy ze strony nauki, problem Molyneux jest z zasady nieempiryczny
i ostatecznie jego rozwiązanie wynika z czysto teoretycznego namysłu.
Celem niniejszego artykułu jest wykazanie, że świadectwa empiryczne
są niezastąpione przy próbie rozwiązania problemu Molyneux. Odwołuję się do danych na temat percepcji u osób niewidomych od urodzenia.
Analizując argumentację G. Evansa przeciwko pozytywnej odpowiedzi
na pytanie Molyneux oraz posiłkując się analizą S. Gallaghera na rzecz
stanowiska przeciwnego, staram się wykazać, że informacje o kształcie
przedmiotów są kodowane w odmienny sposób w zależności od kanału
sensorycznego, którym docierają do mózgu. Mówiąc krótko, informacja
o kształcie widzianym i odczuwanym dotykowo ma charakter modalny.
7 lipca 1688 roku prawnik z Dublina William Molyneux w liście kierowanym do Johna Locke’a zapytał, czy osoba, która była niewidoma
od urodzenia, jest w stanie po odzyskaniu wzroku odróżnić sześcian od
kuli, tzn. bryły, które były jej znane wcześniej wyłącznie dotykowo? Zagadnienie to znane obecnie pod nazwą pytania lub problemu Molyneux
doczekało się wielu rozwiązań, z których tylko bardzo nieliczne wskazywały na taką umiejętność. W czasach nowożytnych niemal wszyscy
filozofowie poza Leibnizem uporczywie dowodzili, że kształt widziany
jest czymś odmiennym od kształtu danego za pomocą zmysłu dotyku.
W oparciu o to spostrzeżenie wysuwali oni przekonanie, które posłuStudia z Kognitywistyki i Filozofii Umysłu, 3: 55–79, 2009
c 2009 Adriana Schetz
Copyright 56
Adriana Schetz
gując się współczesną terminologią można wyrazić w twierdzeniu, iż
informacje o kształcie przedmiotów są kodowane w odmienny sposób
w zależności od kanału sensorycznego, którym docierają do mózgu. Mówiąc krótko, informacja o kształcie widzianym i odczuwanym dotykowo
ma charakter modalny.
Współcześnie za najbardziej znanego obrońcę tezy przeciwnej uważa
się Garetha Evansa, który w głośnym artykule przedstawia swoją strategię pozytywnej odpowiedzi na pytanie Molyneux (por. Evans 1985).
Przegląd współczesnych rozważań dotyczących pytania Molyneux prowadzi do bardziej ogólnego spostrzeżenia. Mianowicie, nie bez znaczenia dla omawianej kwestii pozostają empiryczne badania nad percepcją,
niemniej wielu autorów podkreśla, iż pomimo niewątpliwej pomocy ze
strony nauki, problem Molyneux jest z zasady nieempiryczny i ostatecznie jego rozwiązanie wynika z czysto teoretycznego namysłu (por.
Baumann 2004).
W związku z powyższym zacznę od ustalenia, o co dokładnie Molyneux pytał Locke’a. Analizę samego sformułowania problemu Molyneux
podejmę w pierwszej części tekstu. Następnie w oparciu o dane empiryczne uzyskane w psychologicznych badaniach nad percepcją, postaram się uzasadnić tezę, że dane dotyczące eksperymentów z percepcją
u osób niewidomych od urodzenia stanowią cenne oraz niezastąpione źródło odpowiedzi na pytanie Molyneux. W trzeciej części niniejszego opracowania krótko omówię stanowisko Evansa, jako konkurencyjne względem rozwiązania przeze mnie zaproponowanego. Na koniec
podsumuję efekt swoich analiz. Proponowane przeze mnie rozwiązanie
problemu Molyneux podtrzymuje przekonanie nowożytnych filozofów
o modalnym charakterze percepcji kształtu i jednocześnie przemawia
za doniosłością dla filozofii empirycznych badań nad modalnością zmysłową. Swoją argumentację wesprę analizą prezentowaną przez Shauna
Gallaghera.
1. Ile jest problemów Molyneux?
Molyneux następująco przedstawia swój problem Locke’owi:
Przypuśćmy, że istnieje człowiek od urodzenia niewidomy a obecnie
dorosły i wyuczony dotykiem rozróżniania między sześcianem a kulą
wykonanymi z tego samego metalu oraz posiadającymi niemal identyczną wielkość [...]. Załóżmy następnie, że sześcian i kulę położono
na stole a osoba ta odzyskuje wzrok. Ciekawe, czy w oparciu o to, co
widzi, zanim ich dotknie, mogłaby teraz odróżnić i powiedzieć, która
jest kulą, a która sześcianem (Locke 1975, s. 146).
Widzieć krawędzie, dotykać głębi
57
Powstaje pytanie, czy mowa tu o jednym problemie, czy też może
o wielu powiązanych ze sobą zagadnieniach, z których każde wymaga
osobnego namysłu. W każdym razie należy ustalić, o co dokładnie pyta
Molyneux.
Obecnie problem Molyneux podejmuje kilku autorów należących do
tradycji filozofii analitycznej i są to głównie: Peter Baumann (2004),
John Campbell (2005), S. Gallagher (2005), Robert Hopkins (2005)
oraz J. Riskin (2002) i M. Degenaar (1996).
Peter Baumann wskazuje na cztery możliwe interpretacje pytania
prawnika z Dublina:
1. Jakiego rodzaju są doświadczenia wzrokowe osoby opisanej przez
Molyneux?
2. Czy osoba opisywana przez Molyneux potrafiłaby na mocy samego doświadczenia wzrokowego odróżnić i powiedzieć, która bryła
jest sześcianem, a która jest kulą?
3. Czy osoba opisywana przez Molyneux potrafi stosować pojęcia
sześcianu i kuli, (które nabyła za pomocą zmysłu dotyku), polegając wyłącznie na swoim nowym doświadczeniu, tj. doświadczeniu
wzrokowym?
4. Czy osoba opisywana przez Molyneux potrafi stosować pojęcia
sześcianu i kuli, (które nabyła za pomocą zmysłu dotyku), polegając na swoim nowym doświadczeniu (tj. doświadczeniu wzrokowym) oraz rozumowaniu apriorycznym?
Pierwsze pytanie nazwijmy pytaniem o naturę doświadczenia percepcyjnego, drugie pytaniem o odróżnialność na mocy doświadczenia
percepcyjnego, trzecie pytaniem o stosowanie na mocy doświadczenia
percepcyjnego pojęć percepcyjnych, zaś czwarte pytaniem o stosowanie
na mocy doświadczenia oraz rozumowania apriorycznego pojęć percepcyjnych. Zaczynając od pierwszej interpretacji, odnotujmy jedynie, że
Baumann przechodzi szybko obok niej stwierdzając, że nie o to pytał
Locke’a prawnik z Dublina. Jednakże pytanie o naturę doświadczenia percepcyjnego charakterystycznego dla poszczególnych modalności
zmysłowych uważam za nieuniknione. W stosownym momencie odwołam się do badań nad osobami niewidomymi, gdyż jak postaram się
to pokazać, studium tego przypadku jest niezmiernie istotne dla prowadzonych tu rozważań. W chwili obecnej, choć zgadzam się z Baumannem, że interpretacja 1-sza nie oddaje sedna pytania Molyneux,
to uważam, że stanowi ona eksplicytne wyrażenie najbardziej podstawowej warstwy problemu Molyneux, stanowi bowiem pytanie o treść
nowego doświadczenia percepcyjnego.
W odniesieniu do drugiej interpretacji w rzeczywistości mamy do
czynienia z dwiema kwestiami. Po pierwsze, czy osoba opisywana przez
Molyneux potrafiłaby odróżnić od siebie wskazane bryły, zaś po drugie,
58
Adriana Schetz
czy potrafiłaby wskazać, która z brył jest sześcianem, a która kulą. Nie
są to pokrywające się zagadnienia, na co także zwraca uwagę Baumann.
Wydaje się bowiem, że można posiadać umiejętność odróżniania od siebie pewnych cech bez jednoczesnej ich konceptualizacji. Jako przykład
może posłużyć eksperyment z paletą barw. Bardzo podobne do siebie
odcienie są często bez większych problemów odróżniane przez badanych
pomimo, iż nie potrafią oni wskazać z jakiego rodzaju odcieniami mają do czynienia. Co więcej, umiejętność rozpoznawania obiektów jako
identycznych czy choćby podobnych jest wysoce bardziej skomplikowana aniżeli umiejętność stwierdzania różnicy między nimi. Interpretacja
2-ga nie wspomina jednak nic na temat dyspozycji pojęciowych, bez
analizy których nie sposób podjąć wymienione kwestie.
W związku z powyższym spostrzeżeniem powinniśmy spróbować zinterpretować pytanie Molyneux w duchu 3-ciej możliwości. W świetle tej
interpretacji punktem ciężkości problemu prawnika z Dublina jest zagadnienie stosowania pojęć na mocy doświadczenia percepcyjnego. Zakłada się, że osoba opisywana przez Molyneux dysponuje pojęciem sześcianu i kuli nabytym wyłącznie w oparciu o doświadczenie dotykowe,
a następnie dywaguje się, czy potrafi ona tak urobione pojęcie zastosować do informacji napływających wzrokowym kanałem sensorycznym.
Kwestia dopiero teraz zaczyna robić się naprawdę ciekawa. Zgadzam
się z Baumannem, że taka interpretacja nie przesądza, iż Molyneux
zakładał modalny charakter percepcji, zresztą jego list do Locke’a dowodzi, że raczej starał się to dopiero ustalić. Pytanie o to, czy mamy do
czynienia z tymi samymi pojęciami sześcianu i kuli w przypadku nabywania ich dotykowym kanałem sensorycznym oraz wzrokowym kanałem
sensorycznym jest otwarte.
Proponuję nieco skomplikować interpretację 3-cią tak, by uniknąć
oskarżenia o uproszczenie problemu, którego złożoność dostrzegali już
nowożytni filozofowie. Dodatkowe dane pochodzą od jednego z nich,
mianowicie George’a Berkeley’a. Berkeley zaproponował „odwrócony
problem Molyneux”:
Przypuśćmy, że jest człowiek urodzony bez zmysłu dotyku, a obecnie dorosły i wyuczony za pomocą wzroku rozróżniać sześciany i kule
[...]. Załóżmy teraz, że zamieniamy na stole sześcian z kulą a człowiek
ten ich dotyka [...]. Ciekawe czy za pomocą dotyku, zanim je zobaczy
mógłby odróżnić i powiedzieć, które jest kulą, a które sześcianem (za:
Baumann 2004, s. 171).
Berkeley, który na oryginalne pytanie Molyneux udzielał negatywnej odpowiedzi w przypadku problemu odwróconego decyduje się na
pozytywną odpowiedź. Rzecz w tym, że jeśli dana osoba ma percep-
Widzieć krawędzie, dotykać głębi
59
cyjną reprezentację bardziej złożonych cech, a takie jest założenie odwróconego problemu Molyneux, to wydaje się, iż nie powinno dla niej
stanowić poważnej trudności wywnioskowanie cech „skromniejszych”
z tych bardziej złożonych lecz jakościowo współmiernych własności tego samego obiektu. Obiekt dany zmysłowi wzroku jest, w założeniu
wielu autorów, reprezentowany jako bardziej złożony, niż obiekt reprezentowany w doświadczeniu dotykowym. Część własności pokrywa się
jednak, zatem te „skromniejsze” można wywnioskować z tych „bardziej złożonych”. Takie spostrzeżenie nie mogło jednak być udziałem
samego Berkeleya, który w ogóle odmawiał doświadczeniu wzrokowemu treści reprezentującej własności obiektów w świecie (por. Hopkins
2005, s. 447). Berkeley odmawiał wzrokowi roli determinanta treści,
jego funkcję widział jednak w konstytuowaniu tego, co w filozofii nazywane jest charakterem fenomenalnym lub aspektem fenomenalnym (od
łac. phenomenon — zjawisko). Chodzi o to, że kiedy podmiot doświadcza zmysłowo świata, można przypisać mu stan jak to jest dla niego
świadomie doświadczać świata. Kiedy osoba x wącha kwiat magnolii,
to jej doświadczenie zmysłowe ma istotnie subiektywny aspekt: kwiat
magnolii jawi się jej świadomości jako pachnący w określony sposób.
Filozofowie uważają, że ów subiektywny aspekt nazywany charakterem
czy aspektem fenomenalnym stanowi istotę doświadczenia percepcyjnego. Zmianie modalności zmysłowej towarzyszy, zdaniem Berkeley’a,
zmiana charakteru fenomenalnego doświadczenia percepcyjnego. Istnieje jakościowa różnica fenomenalna dla podmiotu percepcji między
spostrzeganiem zapachu kwiatu magnolii a wzrokowym spostrzeżeniem
kwiatu magnolii oraz dotykowym doświadczaniem jego kształtu i faktury. Zdanie to nie jest obecnie zbyt powszechne wśród filozofów zajmujących się problemami percepcji. Zazwyczaj uznaje się, że charakter fenomenalny jest czymś obok treści doświadczenia percepcyjnego
lub, że stanowi jej nierozerwalny aspekt. Istnieją również próby redukcji charakteru fenomenalnego do treści doświadczenia percepcyjnego,
które można uznać za w pełni udane. Przez treść doświadczenia percepcyjnego rozumie się to, o czym jest doświadczenie percepcyjne. Jeśli spostrzegam wzrokowo kwiat magnolii, to moje doświadczenie jest
o kwiecie określonej barwy i kształtu rosnącym na drzewie, a nie wyrastającym bezpośrednio z ziemi, itp. Wszystko to widzę i wszystko to
stanowi treść mojego doświadczenia. Treść doświadczenia percepcyjnego bywa często utożsamiana z własnościami samego przedmiotu danego
w percepcji.
Wracając do „odwróconego problemu Molyneux”, jego przywołanie
pozwala na sformułowanie następującej refleksji: problem Molyneux
staje się intrygujący i przyjemnie kłopotliwy dopiero wówczas, gdy wy-
Adriana Schetz
60
znacza się dla niego nieco szerszą bazę kontekstową, aniżeli odwołania
do samego charakteru fenomenalnego doznań wzrokowych i dotykowych. Istotne znaczenie dla problematyczności pytania Molyneux ma
treść spostrzeżenia wzrokowego oraz treść spostrzeżenia dotykowego,
a nie podnoszenie niemal wyłącznie tego, jak to jest doznawać wzrokowo i dotykowo (czyli charakter fenomenalny doświadczenia). Tak jak
Baumann uważam zatem, że ostatecznie należy przyjąć 4-tą interpretację problemu Molyneux. Interpretacja ta prawidłowo sytuuje rozważania nad modalnością zmysłową w obrębie z jednej strony sensorycznej treści doświadczenia percepcyjnego, z drugiej zaś strony w obrębie
pojęciowej czy „apriorycznej” treści doświadczenia percepcyjnego. Pytając o to, czy osoba opisywana przez prawnika z Dublina mogłaby na
drodze rozumowej, czyli apriorycznie ustalić, z jakimi bryłami ma do
czynienia, wyraźnie kierujemy uwagę na powyższe dwa aspekty treści
percepcyjnej.
2. Treść sensoryczna, treść aprioryczna, dane kliniczne
i próba odpowiedzi na pytanie Molyneux
Pojęcie treści sensorycznej funkcjonuje zarówno w literaturze
psychologicznej, jak i filozoficznej. Na treść sensoryczną składają się
wszystkie informacje, które docierają do świadomości kanałami sensorycznymi1 . Treść sensoryczna zmienia się w zależności od kanału sensorycznego. Aby nie rozstrzygać czysto definicyjnie, czy treść sensoryczna
ma charakter modalny czy też jest amodalna, z jej zależnością od kanału sensorycznego wiążę jedynie fakt, że informacje o cechach obiektu
są kodowane na rożne sposoby już na poziomie fizjologicznym. Dopiero
w toku niniejszego opracowania zostanie ustalone, czy różnice w fizycznym kodowaniu informacji sensorycznych przekładają się na różnice
w treści mentalnej czy umysłowej, a zatem ściśle percepcyjnej. Przykładem treści sensorycznej jest to, czego podmiot doznaje, gdy patrzy
na kwiat magnolii, to czego podmiot doznaje, gdy wącha kwiat magnolii, itd. Doznanie nie jest utożsamiane ze spostrzeganiem. Spostrzeganie
wymaga udziału treści apriorycznej w percepcyjnym kontakcie z otoczeniem.
1
Wyjaśnienia wymaga powiązanie treści sensorycznej ze świadomością,
gdyż w świetle najnowszych badań nie ma już wątpliwości, że wiele „składników” treści sensorycznej ma charakter nieświadomy. Nie przeczę, że zagadnienie nieświadomej treści percepcyjnej może mieć ciekawe implikacje dla
problemu Molyneux, niemniej ze względu na brak miejsca nie będę podejmować tych kwestii w tym artykule.
Widzieć krawędzie, dotykać głębi
61
Nieco bardziej kontrowersyjna w porównaniu z pojęciem treści sensorycznej może wydawać się kategoria treści apriorycznej. Dobrze znane
procesy aprioryczne takie jak rozumowania czy wnioskowania, a zatem
procesy wiedzotwórcze nie oparte na doświadczeniu, z całą pewnością
prowadzą do powstania innej, niż sensoryczna reprezentacji cech danego obiektu. Kiedy widzę ścianę i jej zwartą, szorstką strukturę, wnioskuję, iż nie uda mi się przez nią przejść. Przekonanie, iż ściana jest
obiektem stawiającym bardzo silny opór ciału człowieka jest treściowo
innym przekonaniem niż przekonanie, którego treść jest czysto sensoryczna, np. że ściana jest wykonana z mocnego, trwałego, twardego
materiału. Przekonanie pierwszego rodzaju jest przykładem przekonania, które nazywam apriorycznym. Pomimo, że w procesie nabywania
przekonań apriorycznych uczestniczą informacje sensoryczne (wiem, że
nie przejdę przez mocną, trwałą i twardą strukturę, gdyż miałam doświadczenie takiej próby) lub/i wiedza (jestem przekonana w oparciu
o rozmaite racje, że przedmiot taki jak ściana nie ulegnie pod naporem przedmiotu takiego jak ludzkie ciało), to mimo wszytko przekonania te stanowią oddzielny rodzaj w stosunku do przekonań sensorycznych. Różnica polega na tym, że przy danym zestawie informacji
sensorycznych, pewne przekonania aprioryczne są niepodważalne pomimo, że nie wynikają logicznie z treści sensorycznych. Innymi słowy,
treść doświadczeń sensorycznych wyznacza zbiór odpowiadających im
treści apriorycznych, chociaż nie konstytuuje ich na drodze wynikania
logicznego. Treści aprioryczne doświadczenia percepcyjnego wynikają
logicznie ze zbioru koniecznych warunków przypisywanych doświadczeniu percepcyjnemu. Do elementów zbioru takich warunków należą np.
przekonania o tym, że każdy przedmiot posiadający kształt, ma zarazem swoją wielkość; że dwa przedmioty, z których jeden jest większy
od drugiego są różnej wielkości, że jeżeli a jest podobne do b i b jest
podobne do c, to a nie musi być podobne do c, itd. Zatem, przekonanie aprioryczne, że znajdująca się na wprost mnie ściana nie zawali się
pod wpływem naporu mojego ciała nie wynika logicznie z doświadczeń
sensorycznych chłodnego, twardego i gładkiego kontinuum, którym dla
mojego zmysłu dotyku i wzroku jest płaszczyzna tej ściany. Wynika natomiast z pewnych warunków, które musi spełniać treść doświadczenia
by można było ją określić mianem treści percepcyjnej. Mogą to być nawet pewne prawa fizyki (tutaj np. prawo dynamiki), które funkcjonują
jako zasady aprioryczne. Informacje sensoryczne w jakiś pozalogiczny
sposób (może przyczynowy, albo skojarzeniowy, itp.) determinują zbiór
przekonań apriorycznych. Różnica w treści doświadczenia sensorycznego i treści przekonania apriorycznego jest jednak na tyle istotna, że nie
mogą zachodzić miedzy nimi relacje logiczne. Relacje logiczne mogą za-
62
Adriana Schetz
chodzić jedynie miedzy przekonaniami. Doświadczenia sensoryczne nie
są przekonaniami.
Przejdźmy teraz do przybliżenia danych dotyczących przypadków
klinicznych istotnych dla rozwiązania problemu Molyneux. Najwcześniejsze dane dotyczą osoby, której udało się w wyniku interwencji chirurgicznej przywrócić wzrok. Pochodzą z 1728 roku i zostały opublikowane przez Williama Cheseldena, specjalistę od anatomii, chirurga
i zarazem osobistego lekarza angielskiej królowej Karoliny Wilhelminy Brandenburg-Ansbach. Cheselden w artykule o barokowym tytule, którego przekład na język polski brzmi: Ocena pewnych obserwacji
poczynionych przez młodego dżentelmena, który urodził się niewidomy
lub który stracił swój wzrok na tyle wcześnie, że nie pamięta aby kiedykolwiek widział i który został przebadany między 13 a 14 rokiem życia, opisuje przypadek chłopca, któremu po operacji katarakty udało
się w dużym stopniu przywrócić wzrok (por. Cheselden 1728, s. 44750). Cheselden pisze, że chłopiec kiedy pierwszy raz przejrzał na oczy
nie był w stanie sformułować żadnego przekonania na temat odległości
względem przedmiotów. Choć nie przedstawiono mu kuli i sześcianu,
wykonano podobny eksperyment z udziałem kota i psa. Oba zwierzęta
chłopiec bez kłopotu odróżniał za pomocą dotyku jeszcze przed operacją. Po odzyskaniu wzroku nie potrafił wskazać, które zwierzę jest psem,
a które kotem. Dziś doniesienia Cheseldena można potraktować jedynie
jako ciekawostkę z zakresu historii medycyny. Nie sposób przypisać im
wartości poznawczej, gdyż nie są znane istotne szczegóły, np. wiadomo,
że okres pooperacyjny w wypadku korekty katarakty jest bardzo istotny w nabywaniu wiedzy o widzianych przedmiotach. Nie wiemy, kiedy
dokładnie przeprowadzono operację i czy chłopiec uczył się wiązania
danych wzrokowych z dotykowymi. Nieznanym pozostaje także szczegół dotyczący stopnia, w jakim udało się przywrócić wzrok. Fakt, że
chłopiec nie potrafił wskazać różnicy między pasem a kotem mógł np.
wynikać z tego, że nie widział wystarczająco wyraźnie. Warto odwołać
się zatem do przypadków stosunkowo dobrze znanych i współcześnie
dostępnych. Niemniej warto zaznaczyć, że są one raczej nieliczne2 .
Najdokładniejsze dane pochodzą z zabiegów usunięcia katarakty,
przeszczepu rogówki oraz wszczepienia osteo-odonto-kerato-protezy.
Nieistotne dla omawianego zagadnienia pozostają szczegóły samych zabiegów, zatem je pominę. Ważne są następujące informacje związane
z powrotem pacjentów do zdrowia: (1) odzyskiwanie wzroku ma postać
2
Jak wskazują Jacomuzzi, Kobau i Bruno wskazuje się na zaledwie około
10 dobrze udokumentowanych przypadków przywrócenia wzroku (por. Jacomuzzi, Kobau i Bruno 2003, s. 260).
Widzieć krawędzie, dotykać głębi
63
procesu stopniowego, (2) wiąże się z bólem fizycznym oraz stresem,
(3) pobudzenie komórek receptorowych siatkówki jest zmienne w zależności od etapu przebiegu procesu powrotu do zdrowia, (4) uogólniając
można powiedzieć, że pacjenci zaczynają z pewnym powodzeniem postrzegać figury dwuwymiarowe po upływie co najmniej jednego miesiąca od operacji. Specjaliści w zakresie operacyjnego przywracania wzroku są raczej zgodni, że okres co najmniej jednego miesiąca pokrywa
się z czasem niezbędnym na wygojenie ran pooperacyjnych oraz psychicznym dojściem do siebie pacjenta. Zaznaczają, że w okresie tym
nie istnieje możliwość stwierdzenia, jaki wpływ na sposób wzrokowego
postrzegania ma trauma pooperacyjna, a co stanowi wynik uczenia się
wiązania ze sobą rozmaitych bodźców: wzrokowych, ruchowych, dotykowych oraz wiedzy (por. Jacomuzzi, Kobau i Bruno 2003, s. 262).
Pomimo tej pesymistycznej prognozy są pewne dane, które wydają
się pomocne przy próbie odpowiedzi na pytanie Molyneux. Mam na
myśli obserwacje dostarczane przez specjalistów nauczających rysunku
oraz rzeźby osoby niewidome. W Polsce istnieje wielu znawców tego
tematu. Informacje, które znajdują się w przygotowanych przez nich
opracowaniach stanowią podstawę empiryczną rozwiązania problemu
Molyneux, które zamierzam zaproponować. Zacznijmy od prezentacji
podstawy empirycznej.
Proponowanej przeze mnie negatywnej odpowiedzi na pytanie Molyneux towarzyszy kilka założeń, które wyartykułuję, by uniknąć zarzutu
niejasności oraz entymematyczności argumentacji. Nie będę omawiać
i rozwijać tych założeń, gdyż opierają się one na ideach znanych dość
powszechnie w literaturze przedmiotu i raczej intuicyjnie inteligibilnych. Pierwsza przesłanka głosi, że wyobraźnia percepcyjna, tzn. wyobrażeniowe przedstawienie sobie stanu percepcyjnego danego rodzaju jest możliwe dzięki uprzedniemu doświadczeniu egzemplarza tego
stanu w rzeczywistej percepcji. Chodzi więc o to, że mogę wyobrazić
sobie, że widzę powiedzmy błękitny sześcian i amarantową kulę, jeżeli kiedykolwiek wcześniej rzeczywiście widziałam coś sześciennego, coś
kulistego, coś błękitnego oraz coś amarantowego. Jest to założenie empiryzmu genetycznego. Drugie założenie opiera się na percepcyjnym
modelu wyobraźni percepcyjnej (por. Francuz 2007, ss. 149-89). W ramach tego modelu w oparciu o ustalenia dokonane w wyniku eksperymentów z tzw. skaningiem umysłowym oraz rotacjami umysłowymi
głosi się ścisłą zależność między mechanizmami i wiedzą percepcyjną
a mechanizmami i wiedzą związaną z wyobrażaniem sobie doświadczenia percepcyjnego. Skaning umysłowy polegający na wyobrażaniu sobie
np. przenoszenia określonego ciężaru zapamiętaną uprzednio trasą, dość
wyraźnie wskazuje na zależność między rzeczywistym postrzeganiem
64
Adriana Schetz
w czasie wykonywania takiego zadania, a wyobrażonym wykonywaniem
takiego zadania. Co do rotacji umysłowych istnieje wiele danych podważających zasadność wniosku, że model percepcyjny ma tu zastosowanie
do wyobrażonej rotacji figur geometrycznych. Nie mam tu miejsca na
rozwinięcie tego wątku. Uważam jednak, że dane ze skaningu umysłowego wystarczają na potwierdzenie przynajmniej słabej wersji modelu
percepcyjnego wyobraźni percepcyjnej, tj. teorii, zgodnie z którą przynajmniej część mechanizmów oraz jakaś istotna część wiedzy percepcyjnej jest wykorzystywana podczas wyobrażania sobie doświadczenia
percepcyjnego. Trzecia przesłanka opiera się na spostrzeżeniu, że zależność wyobraźni od percepcji nie jest jednostronna, gdyż doświadczenie percepcyjne jest niejako nasycone wyobraźnią percepcyjną. Jest
to szczególnie widoczne w enaktywnym czy sensomotorycznym modelu percepcji wywodzącym się z prac Jamesa J. Gibsona (por. Gibson
1979). Stawianie hipotez co do własności widzianych przedmiotów, np.
niezmienność i jednolitość barw (tzw. stałość koloru) są świetnym potwierdzeniem słuszności tego założenia. Enaktywizm jest teorią, której
zwolennicy przypisują decydującą rolę wiedzy proceduralnej w konstytuowaniu procesu percepcji. Zależności między informacjami z otoczenia organizmu w połączeniu z równie istotnymi informacjami z proprioreceptorów tworzą wiedzę na temat tego, jak pobudzenia zmysłowe
zależą od ruchu. W związku z tym, że owa wiedza ma charakter proceduralny, a nie deklaratywny — czyli, że jest to wiedza jak, a nie wiedza,
że — proces percepcji nie wymaga nabywania reprezentacji umysłowych sceny percepcyjnej. Enaktywizm jest teorią, która w przełożeniu
na nomenklaturę filozoficzną jest rodzajem realizmu bezpośredniego
w kwestii percepcji.
Przechodzę teraz do argumentu na rzecz negatywnej odpowiedzi na
pytanie Molyneux. Zarówno osoby przeszkolone do pracy artystycznej
z osobami niewidomymi, jak i te, które obcują z niewidomymi na co
dzień obserwując ich zmagania z życiem w przeważającej liczbie zgadzają się ze sobą, że:
Poznawanie rzeczywistości w przypadku osób niewidomych jest utrudnione i zubożone o wrażenia wizualne. U osób niewidomych poznawanie
rzeczywistości i zjawisk odbywa się dzięki zjawisku kompensacji, czyli zastępowania uszkodzonych zmysłów innymi sprawnie działającymi,
głównie słuchem i dotykiem. [...] Dotyk zaczyna od eksploracji punktowej, aby następnie dojść do całości. Ponieważ percepcja dotykowa jest
fragmentaryczna, to wymaga ona syntezy końcowej do odtwarzania
przedmiotu jako całości. Na całość zaś komponują się różne, sukcesywnie poznawane elementy. Należy podkreślić, że dotykowe poznawanie
przedmiotu (od szczegółu do ogółu) jest procesem trudnym i dającym
wiele niejasnych informacji (Paplińska 2008, s. 16-17).
Widzieć krawędzie, dotykać głębi
65
W świetle teorii enaktywnej właściwie nie istnieje istotna jakościowa różnica sugerowana w powyższym cytacie pomiędzy reprezentacjami własności obiektów przez odmienne kanały sensoryczne. Tak, jak
aby uzyskać reprezentację dotykową danego obiektu trzeba się zmierzyć z „procesem trudnym i dającym wiele niejasnych informacji”,
tak też sytuacja ta powtarza się w przypadku pozostałych zmysłów,
także zmysłu wzroku. Machowska idea percepcji porównywanej do aparatu fotograficznego dostarczającego „oku umysłu” gotowych zdjęćreprezentacji sceny percepcyjnej jest nieporozumieniem już dawno obalonym przez Gibsona. Gibson wykazał, że pomiędzy poszczególnymi
zmysłami zachodzi bardzo istotna wymian informacji. Koncentrował się
na zmyśle wzroku i podał szereg argumentów na rzecz tezy, że widzenie
przestrzenne, tj. wzrokowe spostrzeganie głębi, trójwymiarowości przestrzeni oraz figur przestrzennych i płaskich jest co najmniej w równej
mierze konstytuowane przez zmysł wzroku, co przez zmysł dotyku oraz
informacje pochodzące z proprioreceptorów. Nie ma miejsca, aby przytaczać te argumenty, zatem nie będę dowodzić słuszności teorii enaktywnej. Warto jednak wspomnieć, że oczywiście teoria ta, jak każda
inna ma swoich przeciwników, do których należą m.in. Jerry A. Fodor
i Zenon W. Pylyshin (por. Fodor i Pylyshyn 2004). Autorzy ci krytykują jednak przede wszystkim ten wątek teorii enaktywnej, w którym
zaprzecza się istnieniu reprezentacji percepcyjnych. Ponieważ jednak
teoria enaktywna może funkcjonować bez większego szwanku bez tej
idei, krytykę Fodora i Pylyshyna można uznać za mało dla niej krzywdzącą.
Wracając do wątku wymiany informacji między zmysłami, w przytoczonej wypowiedzi jest mowa o kompensacji. Pojecie kompensacji sugeruje, że istnieje możliwość odbioru informacji specyficznych dla danego kanału sensorycznego kanałem niespecyficznym. Np. informacja
o odległości x-a od ściany zamiast być kodowana przez zmysł wzroku,
może być kodowana przez zmysł słuchu, tj. poprzez kodowanie dźwięku
laski uderzającej o grunt. Zjawisko kompensacji nie jest jednak interesujące z filozoficznego punktu widzenia dla problemu Molyneux. Rzecz
w tym, że skoro zmysł słuchu, albo zmysł dotyku może kompensować
zmysł wzroku, to fakt ten oznacza jedynie, że informacja odbierana tymi zmysłami jest podobna; a to nic nowego. W każdym podręczniku
do psychologii poznawczej znajdziemy wzmianki na temat informacji,
które mogą i tych, które nie mogą być kodowane przez poszczególne kanały sensoryczne (np. fal radiowych nie można zobaczyć). Nie oznacza
to jednak, że własności obiektów w świecie sprowadzają się wyłącznie
do tych, które w postaci takiej wspólnej informacji są dostępne rożnym
kanałom sensorycznym. Konkluzja ta jest podstawą do negatywnej od-
66
Adriana Schetz
powiedzi na pytanie Molyneux. W związku z tym, że stanowi ona sedno
mojej argumentacji wyartykułuje ją jeszcze raz: z faktu, że pewne informacje o własnościach obiektów są kodowane przez różne kanały sensoryczne nie wynika jeszcze, że obiekty te mają wyłącznie te wspólnie
kodowane własności. Innymi słowy, amodalność informacji sensorycznej
nie oznacza jeszcze amodalności apriorycznej czy pojęciowej.
O słuszności powyższego wniosku świadczy m. in. uwaga zawarta
w cytowanym powyżej tekście. Mianowicie, że dotyk rejestruje punktowe informacje sensoryczne, które następnie w określony sposób umysł
„zbiera w całość”. Oczywiście można twierdzić, że informacje dostarczane przez zmysł wzroku, również w pewnym analogicznym sensie są
punktowe. Wydaje mi się jednak, że zachodzi pewna bardzo istotna
różnica między punktowym charakterem dotyku u osoby niewidomej
a punktowym charakterem wzroku u osoby widzącej. Aby to wyjaśnić
przeanalizujmy następujące wypowiedzi:
Z trudnościami w poznawaniu przedmiotów i zjawisk przez osoby niewidome związane są problemy w rozumieniu pojęć, zwłaszcza przestrzennych. Przestrzeń jest nieodłącznym elementem życia każdego
człowieka. W niej umieszczamy siebie, inne osoby i przedmioty, w niej
się poruszamy. Nasze wyobrażenie przestrzeni zależy od umiejętności równoczesnego lokalizowania przedmiotów znajdujących się w niej
z zachowaniem istniejących między nimi stosunków. W ten sposób rozwijamy w sobie strukturę przestrzeni, w której umieszczamy każdy
z tych przedmiotów [...]. Przemieszczając się dziecko napotyka najpierw
obiekt A, potem obiekt B, później C, itd. Napotykane przedmioty pozostają w umyśle dziecka w relacji czasowej, a nie przestrzennej względem niego i innych obiektów. Wynikają z tego problemy z rozumieniem
pojęć odnoszących się do relacji czaso-przestrzennych (Paplińska 2008,
s. 17-18).
Brak zmysłu wzroku ogranicza poznanie przestrzeni, uniemożliwia percepcję barw i światła oraz docieranie do kształtów przedmiotów znajdujących się poza zasięgiem ręki (Niestorowicz 2007, s. 25).
Pomimo, że drugi z przytoczonych fragmentów jest znacznie bardziej zwięzły od pierwszego, zawarte w nim sformułowanie „kształt
przedmiotów znajdujących się poza zasięgiem ręki” jest najważniejszym wspornikiem mojej argumentacji za negatywną odpowiedzią na
pytanie Molyneux. Zacznę jednak od cytatu pierwszego.
Osoba niewidoma posługując się zmysłem dotyku kompensując brak
wzroku słuchem nabywa pojęcia przestrzenne w oparciu o zasadniczo
odmienne mechanizmy. Jak podkreśla autorka pierwszego z przytoczonych cytatów, relacja następstwa przestrzennego między przedmiotami
jest reprezentowana u osób niewidomych w oparciu o mechanizm czaso-
Widzieć krawędzie, dotykać głębi
67
wy. Przedmiot A nie jest przed przedmiotem B, ale jest wcześniejszy od
przedmiotu B. Specjaliści od rysunku wypukłego dla niewidomych opierając się na swoich doświadczeniach z uczeniem niewidomych rysunku
opracowali szereg zasad, których należy przestrzegać tworząc rysunki
dla niewidomych, jeśli mają być one dla nich czytelne. Oto niektóre
z tych zasad. Pierwsza to zasada sformułowana we Wnioskach i zaleceniach Międzynarodowej Konferencji n. t. Rysunku Wypukłego dla
Niewidomych z 1984 roku w Berlinie:
Wiedza i doświadczenie wykazują jak przedstawiać rzeczywistość na
rysunku wypukłym. Należy brać pod uwagę, że reprezentacja dotykowa nie powinna być prostą reprodukcją fotografii lub rysunku, który
ma sens dla człowieka widzącego, lecz powinna być specjalnie przygotowana dla niewidomego.
Pozostałe zasady doskonale są omówione w literaturze dotyczącej badań nad rysunkiem dla niewidomych. Najważniejsze z nich instruują,
że wypukła linia rysunku powinna być kropkowana, czyli przerywana, gdyż osoba niewidoma dzięki temu łatwiej kontroluje długość, czyli
w przypadku niewidomych czas, pokonywanego odcinka. Zadanie to jest
utrudnione, gdy linia jest po prostu gładka i ciągła, gdyż „łatwiej się
ją pokonuje” dotykiem. Ponadto przedmioty na złożonym rysunku nie
powinny się wzajemnie przesłaniać, powinny być pozbawione nieistotnych cech (np. ozdobników, które niekiedy uniemożliwiają prawidłowe
odczytanie informacji), zaś cechy istotne winny być akcentowane fakturą i wielkością (np. pies powinien mieć duży łebek, łapy i ogon). Dodaje
się również, że:
Nie jest celowe przekazywanie niewidomemu informacji rysunkiem perspektywicznym, rysunkiem w rzucie ukośnym (aksonometrycznym),
gdyż konwencje te są zbyt trudne w odbiorze dotykowym (Więckowska
2003, s. 82).
Konwencje przestrzenne są, jak pouczają specjaliści od rysunku dla
niewidomych, niezrozumiałe dla osoby, która nie może zobaczyć bryły
w perspektywie wzrokowej. Uważam, że podstawowy problem polega na
tym, że punktowość zmysłu dotyku jest całkowicie a-perspektywiczna.
Śledzenie dotykiem kształtu sześcianu czy kuli nie oddaje nawet perspektywy dwuwymiarowej. Osobom niewidomym trzeba tłumaczyć,
dlaczego dotykany prostokąt ma powiedzmy kształt a, a nie kształt
b (por. rys. 1).
Rzecz staje się naprawdę kłopotliwa, gdy próbuje się wyjaśnić osobie niewidomej kształt przedmiotów znajdujących się poza zasięgiem jej
dotyku. Przejdę obecnie do wyjaśnienia tego zjawiska.
Adriana Schetz
68
RYS.
1.
Reprezentacja kształtu na kanwie informacji dotykowej nie stanowi
zbioru informacji punktowych w tym samym rozumieniu, co reprezentacja kształtu na kanwie informacji wzrokowych. Wzrok dostarcza informacji punktowych tylko w takim sensie, w jakim wyodrębnia się jednostki składowe pola widzenia, coś pokrewnego geonom. Jednak każdy
geon lub inne analogiczne jednostki są już pewnego rodzaju całością.
Z pomocą zmysłu dotyku oraz informacji z proprioreceptorów osoba
sprawnie posługująca się zmysłem wzroku może dysponować całościową reprezentacją sceny. Jednakże przestaje to już być scena wyłącznie
wzrokowa. Skoro informacje o kształcie obiektów są uzyskiwane w wyniku analizy danych sensomotorycznych, to percypowana scena jest sceną
wzrokowo-ruchowo-dotykową. Punktowość informacji oznacza tu kolaż
pewnych całości ustrukturowanych poprzez informacje charakterystyczne dla danego kanału sensorycznego i obrobionych na poziomie apriorycznym. Innymi słowy, treść sensoryczna jest tu już zinterpretowana
przez procesy odgórne i stanowi rodzaj treści apriorycznej.
Zauważmy, że osoba niewidoma nie ma w ogóle dostępu do pewnych
własności obiektów. Są to własności składające się na kształt przedmiotu poza zasięgiem dotyku, tzn. kształt dany w perspektywie wizualnej.
Porównajmy ze sobą dwa kształty figur płaskich przedstawionych na
rys. 2.
RYS.
2.
Jak wytłumaczyć osobie niewidomej, że stół przy którym siedzi w zależności od perspektywy, z której się na niego patrzy jest raz prostokątny, a raz jest trapezem? Zauważmy, że trapezowość blatu stołu nigdy
nie jest dana zmysłowi dotyku. Dotykany blat stołu zawsze jest prosto-
Widzieć krawędzie, dotykać głębi
69
kątem (choć i tego trzeba osobę niewidomą nauczyć). Ponadto w przypadku osób widzących kojarzenie trapezowego kształtu stołu z jego
„zwyczajnym” prostokątnym kształtem dokonuje się prawdopodobnie
na innych zasadach, niż w przypadku osoby niewidomej. Osoba niewidoma uczy się na zasadzie asocjacji, że zawsze, gdy ma do czynienia
z prostokątnym stołem, to stół ten może być także przedstawiony jako
trapez. Osoba widząca natomiast rozumie jak pewne własności przedmiotów zmieniają się w zależności od zajmowanej perspektywy. Osoba niewidoma rozumie jak natężenie dźwięku zmienia się w zależności
od zajmowanej przez nią perspektywy w stosunku do źródła dźwięku.
Nie jest natomiast w stanie zrozumieć jak prostokątne ściany sześcianu
zmieniają się w trapezy i równoległoboki w zależności od perspektywy
(por. rys. 3.).
RYS.
3.
Powyższe uwagi potwierdzają tezę, że amodalność niektórych informacji sensorycznych nie generuje amodalności percepcyjnej. Percepcja
jest procesem złożonym, w którym udział biorą tak treści sensoryczne,
jak i pojęcia, a zatem treści aprioryczne. W przypadku osób niewidomych pojęcia przestrzenne brył nie są tymi samymi pojęciami, co
pojęcia pozyskane z udziałem zmysłu wzroku. Pojęcia brył u osób niewidomych nie zawierają bowiem informacji na temat własności przestrzennych poza zasięgiem zmysłu dotyku.
W następnej części niniejszego opracowania proponuję rozwiązanie
oparte na podobnych danych empirycznych niemniej formułujące odmienny wniosek i co za tym idzie udzielające pozytywnej odpowiedzi
na pytanie Molyneux. Na koniec uzasadnię wniosek, że konkurencyjne
stanowisko jest nie do utrzymania.
70
Adriana Schetz
3. Treść sensoryczna i treść aprioryczna – odpowiedź
konkurencyjna
Filozofem, któremu nie sposób odmówić najbardziej błyskotliwej
próby rozwiązania problemu Molyneux był G. Evans. W głośnym artykule opublikowanym po raz pierwszy w 1985 roku pt. Molyneux Question proponuje uzasadnienie dla tezy, że osoba, która odzyskałaby
natychmiast wzrok byłaby w stanie odróżnić kulę od sześcianu oraz potrafiłaby poprawnie zastosować pojęcia kuli i sześcianu do widzianych
przedmiotów (por. Evans 2003). Przyjrzyjmy się temu uzasadnieniu.
Evans posługuje się trzema kluczowymi dla swojego argumentu pojęciami: (1) przestrzeni egocentrycznej (Egocentric Space), (2) wiedzy
sensomotorycznej oraz (3) wymogu uogólnienia (Generality Constraint ). Zacznijmy od pierwszego pojęcia, które wymaga najobszerniejszego wyjaśnienia. Przez przestrzeń egocentryczną Evans rozumie obszar pokrywający się z przestrzenią zachowań ruchowych podmiotu.
Podmiot wykonuje ruchy, które świadczą o tym, że posługuje się on
pojęciami przestrzennymi. Np. fakt, że dziecko wkłada sześcienny klocek do kwadratowego otworu odpowiedniej wielkości świadczy o tym,
że rozumie ono co to jest sześcian i co to jest kwadrat. Z tego zaś,
że ktoś, kto na wołanie na zewnątrz za oknem reaguje podejściem do
okna wynika, iż posługuje się pojęciem „na zewnątrz”. Przestrzeń egocentryczna jest utożsamiona z przestrzenią zachowań ruchowych, gdyż
podmiot stanowi centrum i jedynego aktora, czyli sprawcę działania
od którego zależy ostateczna ocena perspektywy. Dobrym przykładem
potwierdzającym spostrzeżenie Evansa jest sytuacja, w której podmiot
stoi twarzą do powiedzmy jakiegoś budynku a następnie odwraca głowę
w lewą stronę. Przed odwróceniem głowy budynek zajmował miejsce
„na wprost” w przestrzeni egocentrycznej tej osoby, zaś po odwróceniu głowy w lewo budynek zajął miejsce „na prawo” w jej przestrzeni
egocentrycznej. Jest to prosty i zarazem przekonujący przykład obrazujący pojęcie perspektywy egocentrycznej, niemniej samo to pojęcie jest
o wiele bardziej skomplikowane w rozumieniu Evansa, niż to zazwyczaj
się przedstawia3 . Evans pisze:
Musimy najpierw zrozumieć, na czym polega identyfikacja miejsc. Miejsca, o których myślimy są różnicowane przez ich relacje przestrzenne
do przedmiotów, które konstytuują nasz szkielet referencji [frame of
reference]. [...] Zatem podstawowe rozpoznanie jakiegoś miejsca identyfikowałoby je poprzez równoczesną referencję do jego relacji do każ3
Np. Campbell w swojej krytyce przestrzeni egocentrycznej w rozumieniu Evansa w swojej charakterystyce poprzestaje wyłącznie na jej cechach
wymienionych powyżej. Por. (Campbell 2005, s. 199-203).
Widzieć krawędzie, dotykać głębi
71
dego z obiektów konstytuujących szkielet referencji. O miejscu można
by myśleć w ten sposób, gdyby zostało zidentyfikowane na mapie reprezentującej jednocześnie relacje przestrzenne przedmiotów konstytuujących szkielet referencji. Ta identyfikacja ma holistyczny charakter:
miejsce nie jest identyfikowane poprzez referencję do jednego czy dwóch
obiektów i w związku z tym identyfikacja może być efektywna nawet,
jeśli kilka obiektów przemieszcza się lub zostaje zniszczonych. Nasza
identyfikacja miejsc ma taki holistyczny charakter zawsze, gdy polegamy, w myśleniu o miejscach, na tym, co nazywa się „mapą kognitywną”
— reprezentacją, w której relacje przestrzenne wielu różnych rzeczy są
jednocześnie reprezentowane (Evans 2003, s. 48).
Evans mówiąc o szkielecie referencji ma na myśli coś innego aniżeli
wyłącznie repertuar zachowań ruchowych podmiotu. Wskazuje
bowiem na mapę kognitywną utożsamioną nie tylko z obszarem możliwych ruchów podmiotu, ale także z semantycznymi cechami reprezentacji miejsca. Czyli ostatecznie przestrzeń egocentryczna jest rozumiana
u Evansa jako rodzaj wiedzy jak działać w przestrzeni, jednak do niej się
nie redukuje. Wiedza jak działać stanowi bowiem konsekwencję umiejętności posługiwania się schematyczną reprezentacją przestrzeni trójwymiarowej. Reprezentacja ta jest konstytuowana nie poprzez relacje
referencjalne zachodzące między poszczególnymi reprezentacjami przedmiotów indywidualnych, ale poprzez relacje referencjalne pomiędzy węzłowymi czy szkieletowymi dla rozpoznawalności danego miejsca przedmiotami. I tak dany podmiot jest w stanie zidentyfikować miejsce m nie
dzięki umiejętności rozpoznania każdego obiektu wypełniającego przestrzeń tego miejsca, ani również nie dzięki umiejętności rozpoznania
większości takich obiektów. Powiemy, że potrafi on rozpoznać miejsce
m wówczas, gdy wskaże je nawet pomimo zmian, które mogły w tym
miejscu zajść bez jego wiedzy. Zatem musi on dysponować umysłową
reprezentacją tego miejsca4 .
Czy taka konstatacja nie pozostaje jednak w sprzeczności z zaproponowanym przez Evansa utożsamieniem przestrzeni egocentrycznej
z przestrzenią zachowań ruchowych? Teoria Evansa w wielu miejscach
przypomina podejście sensomotoryczne czyli enaktywne zapoczątkowane przez Gibsona. Warunek sensomotoryczny stanowi drugą
spośród wymienionych na wstępie tej części artykułu przesłanek stanowiska Evansa. Tak rozumiana idea percepcji nie zawiera wyżej suCzy jest to reprezentacja sensu stricto, tj. czy wskazywanie miejsca odbywa się via deskrypcja lub na mocy wyodrębnienia cech typowych, itp., czy
może wystarczy samo podobieństwo nie ujmowalne żadną regułą, (postulowane np. w niektórych wyjaśnieniach percepcji twarzy) omawiam w innym
opracowaniu zagadnienia Molyneux stanowiącym kontynuację podjętych tu
problemów (zob. Schetz, w przygotowaniu).
4
72
Adriana Schetz
gerowanej sprzeczności. Zgodnie bowiem z podejściem enaktywnym
podmiot percepcji nie dysponuje reprezentacją w sensie, jaki był temu
pojęciu przypisywany tradycyjnie przez brytyjskich filozofów nowożytnych czy nawet analityków z pierwszej połowy XX wieku. Zasadniczo
enaktywnizm zaprzecza, jakoby w procesie percepcji powstawała jakakolwiek umysłowa reprezentacja (Noë 2004, s. 75-122). W myśl teorii
enaktywnej percypować, to posiadać wiedzę jak działać, czyli posiadać
wiedzę proceduralną. Jednocześnie wszelkie przypadkowe albo ściśle
nawykowe działania nie stanowią rodzaju wiedzy, a zatem posiadanie
reprezentacji umysłowych nie redukuje się do jakichkolwiek zachowań.
Powstaje jednak pytanie, czy Evans akceptował ten wątek teorii Gibsona? Odpowiedź na to pytanie zawarta jest w np. następujących fragmentach:
Egocentryczne terminy przestrzenne są terminami, w których mogłoby
być sformułowane pojęcie treści naszych doświadczeń przestrzennych
oraz takimi, w których mogłyby być wyrażone nasze bezpośrednie zamiary behawioralne. Ten dualizm jest nieprzypadkowy, gdyż przestrzeń
egocentryczna może istnieć tylko dla zwierzęcia, dla którego istnieje
złożona sieć powiązań pomiędzy percepcyjną daną na wejściu a behawioralną daną na wyjściu (Evans 2003, s. 49).
Preferuję wyjaśnienie tego, że myśli są ustrukturowane, nie w terminach złożenia z wielu różnych elementów, ale w terminach złożenia
zastosowań wielu różnych zdolności pojęciowych [conceptual abilities
— podkreślenia Evansa], (Evans 2003, s. 67).
Pierwszy z przytoczonych fragmentów explicite mówi o skomplikowanej sieci powiązań pomiędzy percepcją a działaniem, choć jest zbyt
ogólny by odpowiadać na pytanie, jakiego dokładnie rodzaju są to powiązania. Wiadomo jednak, że Evans nie był zwolennikiem zwykłego
behawioryzmu, w innych zaś miejscach odwoływał się chętnie do ustaleń bliskich Gibsonowi. Kiedy porównuje sposób, w jaki osoba niewidoma reprezentuje przestrzeń dystalną ze sposobem, w jaki robi to osoba
widząca, to odwołuje się do reprezentacji ruchu, który powinien zostać wykonany, aby móc manipulować oddalonym od podmiotu obiektem. Reprezentacja odległości jest zatem kodowana w postaci informacji o ruchu. W drugim cytacie jest natomiast mowa o innego rodzaju
umiejętności, tj. nie o ruchu fizycznym wykonywanym w oparciu o schematyczną mapę położenia przedmiotów, ale rzec by można o „ruchu
mentalnym czy umysłowym” dokonującym się w oparciu o mapę logiczną. Idea ta wyrażona jest u Evansa w postaci warunku uogólnienia,
trzeciego warunku spośród wymienionych na początku bieżącej części
artykułu. Choć zatem Evans posługuje się pojęciem reprezentacji umysłowej, to sposób, w jaki je rozumie wydaje się bardzo bliski idei wiedzy
Widzieć krawędzie, dotykać głębi
73
proceduralnej.
Wymóg ogólności, tak ważny u Evansa w interpretacji zjawiska percepcji, sprowadza się do tezy o holizmie semantycznym. Podmiot odnoszący się do obiektu w świecie, myślący „a jest F ” lub formułujący
takie przekonanie, nie żywi swojej myśli w izolacji od innych myśli czy
przekonań dotyczących tego obiektu. Jak wskazuje Evans także sama
myśli czy przekonanie, że „a jest F ” ma złożoną strukturę nie tylko
ze względu na fakt, że występują w niej odrębne elementy takie jak
myśl o a, myśl o a jako czymś istniejącym, myśl o F -ie, myśl o F -ie
jako własności a, ale przede wszystkim myśl, że „a jest F ” tworzy złożoną całość, w której te poszczególne elementy są ze sobą powiązane
w sposób istotny, a nie jedynie przypadkowy. Następujące fragmenty
potwierdzają to spostrzeżenie:
Każda ze zdolności implikowanych przez myśl, że a jest F , pomimo, że
są one odrębne, może być zastosowana tylko w (całej) myśli i stąd zawsze razem z pewnymi innymi zdolnościami pojęciowymi (Evans 2003,
s. 68).
Stąd wynika, że:
Jeśli podmiot uznaje myśl, że a jest F , wówczas musi mieć pojęciowe
zasoby, aby żywić myśl, że a jest G, dla każdej własności bycia G,
której ma on pojęcie. (Evans 2003, s. 68).
Wydaje się, że warunek ogólności jest zrozumiały i nie ma potrzeby
tej kwestii dalej rozwijać.
Po przedstawieniu krótkiej charakterystyki trzech głównych założeń
koncepcji percepcji u Evansa, tj. założenia o przestrzeni egocentrycznej, założenia o enaktywnym charakterze percepcji oraz założenia o holizmie semantycznym, przyjrzyjmy się argumentowi przedstawionemu
przez Evansa na rzecz pozytywnej odpowiedzi na pytanie Molyneux.
Evans zauważa, że osoba mająca pojęcie sześcianu i kuli nabyte w oparciu o spostrzeżenia dotykowe w chwili, w której odzyskuje wzrok staje
wobec nowych spostrzeżeń, tym razem wzrokowych, które musi jakoś
pojęciowo okiełznać. Sugestia Berkeleya była taka, że efektem ujęcia
spostrzeżeń wzrokowych w pojęcia jest powstanie nowych pojęć sześcianu i kuli. Ostatecznie więc Berkeley mówi o „dotykowym pojęciu” oraz
„wzrokowym pojęciu” sześcianu i kuli. Evans nie zgadza się z konstatacją Berkeleya. Ze względu na fakt obowiązywania wymogu ogólności, tj.
zasady semantycznego holizmu, osoba, która odzyskała wzrok nie byłaby w stanie zaakceptować dwóch odrębnych pojęć sześcianu i kuli. Jeśli
byłyby to faktycznie, jak chciał Berkeley, odrębne pojęcia, to nie ma
sensu twierdzić, że zarówno jedne, jak i drugie są pojęciami sześcianu
Adriana Schetz
74
i kuli, skoro nie ma między nimi żadnych istotnych podobieństw. To,
że nie są to pojęcia odrębne wynika natomiast u Evansa z założenia
o enaktywnym charakterze percepcji. Osoba niewidoma posługuje się
pojęciami w sposób z zasady identyczny z tym, jak pojęć używa osoba
widząca. Jeśli ma pojecie sześcianu, to wie np. że nie może włożyć go
w okrągły otwór o tej samej powierzchni, co jedna ze ścian sześcianu,
że sześcian ma ostre krawędzie, a kula jest gładka, że kula się toczy
a sześcian nie, itp. Innymi słowy, podmiot rozumie jakie miejsce oraz
jakie zachowania powinien przypisywać sześcianowi, a jakie kuli w swojej przestrzeni egocentrycznej. Z chwilą, w której odzyskuje wzrok nic
się zasadniczo nie zamienia. Nadal własności przypisane tym bryłom
w oparciu o spostrzeżenia dotykowe pozostają składowymi pojęć tych
brył: nadal kula się toczy, zaś sześcian ma ostre krawędzie itd. Podmiot nie powinien mieć zatem większych trudności z zastosowaniem
pojęć obu brył do nowo nabytych wrażeń wzrokowych. Zarysowaną tu
konkluzję Evansa dobrze oddaje następujący fragment jego wypowiedzi:
[Moje] stanowisko nie jest takie, że dotykowe reprezentacje percepcyjne
kwadratu przypominają wzrokowe reprezentacje percepcyjne kwadratu. [Moje] stanowisko jest takie, że jeżeli obie są jednoczesnymi reprezentacjami, to jedyne pojecie, które [podmiot — A. S.] może zrozumieć
stosuje się (lub wydaje się stosować)5 w obu przypadkach (Evans 2004,
s. 132-30).
Dochodzimy zatem do punktu, w którym stajemy wobec dwóch
wykluczających się odpowiedzi na pytanie Molyneux: zaproponowaną
przeze mnie negatywną odpowiedzią bazującą na analizie przypadków
osób niewidomych oraz zaproponowaną przez Evansa pozytywną odpowiedzią opartą na analizie natury pojęć oraz zasad rządzących ich
nabywaniem i stosowaniem. Postaram się wykazać, że argument Evansa nie prowadzi do preferowanej przez niego konkluzji.
Głównym zarzutem, jaki Evansowi na ogół się stawia jest to, że z faktu, że dyspozycji pojęciowej towarzyszy dyspozycja do zachowania nie
wynika, iż zachowanie czy ściśle rzecz biorąc wiedza sensomotoryczna konstytuuje treść pojęć. Ponieważ zagadnienie słuszności podejścia
enaktywnego w teorii percepcji mogłoby stanowić przedmiot osobnej
rozprawy nie poświeciłam mu tutaj miejsca. Zaznaczę jedynie, iż zarzut
ten sformułowany chyba najjaśniej przez Campbella (por. Campbell
2005) uważam za całkowicie chybiony nie tylko ze względu na uprosz5
Zastrzeżenie „wydaje się stosować” odnosi się do przypadków iluzji lub
halucynacji.
Widzieć krawędzie, dotykać głębi
75
czony sposób, w jaki przedstawia stanowisko Evansa, ale przede wszystkim ze względu na obecny stan wiedzy o sposobie nabywania pojęć oraz
ich stosowania, który zdaje się w wystarczającym stopniu potwierdzać
teorię enaktywną.
Argumentacja Evansa ma jednak pewien bardzo słaby punkt. Znajduje się on pomiędzy przesłanką o tym, że dana osoba nie może spójnie
żywić dwóch odrębnych pojęć tego samego obiektu, a wnioskiem, że
aby można było przypisać jej pojęcie danego obiektu musi ona posiadać określone zdolności tego samego rodzaju niezależnie od sposobu ich
nabycia. Słabość argumentacji Evansa wypływa z faktu braku przejścia
między tą przesłanką a tym wnioskiem.
Powróćmy na chwilę do uwag G. Fregego na temat sensu i znaczenia
wyrażeń językowych. Przykład gwiazdy porannej i gwiazdy wieczornej rozumianej jako sensu przypisywanego reprezentacjom tego samego
obiektu, tj. planety Wenus, jest bardzo instruktywny jeśli chodzi o argument Evansa. Ktoś może nie wiedzieć, że gwiazda poranna i gwiazda wieczorna są de facto tym samym obiektem, a nawet więcej, ktoś
może posiadać reprezentację gwiazdy porannej nie posiadając w ogóle
reprezentacji gwiazdy wieczornej. Podobnie ktoś może wiedzieć wiele na temat Josepha Conrada nie wiedząc jednak, iż był on Józefem
Konradem Korzeniowskim. Czy mimo wszystko przypiszemy tej osobie
zdolność posługiwania się pojęciem planety Wenus oraz Józefa Konrada Korzeniowskiego tyle, że pod różnymi sposobami prezentacji tych
przedmiotów: jako gwiazdy porannej oraz jako Josepha Conrada?
Wydaje się, że Evans po prostu należy do grona filozofów, którzy
niechętnie utożsamiają pojęcia z reprezentacjami umysłowymi, czyli
z treścią aprioryczną. Tymczasem wydaje się zupełnie niekontrowersyjne to, że Joseph Conrad może być mi dany wyłącznie jako autor Złotej
strzały, podczas gdy komuś innemu jest on dany jako autor Korsarza.
Co więcej mogę nawet sądzić, że autor Złotej strzały Joseph Conrad
jest inną osobą niż autor Smugi cienia Józef Konrad Korzeniowski. Innymi słowy, wydaje się, że u Evansa jest miejsce na sposób prezentacji
pojęcia. Pojęcie sześcianu czy kuli może być dane dzięki zestawowi różnych dyspozycji ruchowych. Można np. wiedzieć, że kula toczy się po
pochyłej powierzchni, ale nie wiedzieć, że jej ruch wahadłowy wprawia
w ruch inną kulę znajdującą się w pobliżu, ale nie stykającą się z nią
bezpośrednio. Niezależnie jednak od tego, jakie zajmie się w tej kwestii stanowisko niektórzy autorzy rzeczywiście twierdzą, że te rozmaite
sposoby prezentacji nie przeczą istnieniu jednego jednorodnego pojęcia
danego obiektu. Takie stanowisko głoszone przez np. Ch. Peacocke’a
(Peacocke 1992, s.3) wydaje mi się nieporozumieniem. Oznacza bowiem, że osoby niewidome tak naprawdę mają dokładnie takie samo
76
Adriana Schetz
pojecie sześcianu jak osoby widzące.
Podsumowując, stanowisko Evansa, zgodnie z którym mamy prawo
przypisywać danej osobie posiadanie pojęcia kuli i sześcianu wówczas,
gdy jest ona w stanie spełnić warunek ogólności można uzupełnić o pogląd Peacocke’a, że odmienne sposoby nabywania reprezentacji cech
obiektu prowadzą do utworzenia jednorodnego pojęcia tych cech. Czyli
osoba, która nabywa reprezentację kształtu kuli w oparciu o dotykowy kanał sensoryczny oraz w oparciu o wzrokowy kanał sensoryczny
dysponuje jednorodnym pojęciem kształtu kuli.
Zarówno Evans, jak i Peacocke mają poniekąd rację. W przypadkach standardowych, tj. u osób, u których wszystkie zmysły funkcjonują sprawnie rzeczywiście dochodzi do integracji percepcyjnej bodźców. Zaprzeczanie temu zjawisku oznaczałoby co najmniej dyletanctwo
naukowe. Niemniej nie można zapominać, że mówimy o przypadkach
niestandardowych. Z kolei strategia Peacocke’a nie pozostawia wątpliwości co do swojego przesadzonego optymizmu. Nieuchronne bowiem
pytanie o to, jak odbywa się wiązanie danych konstytuujące pojęcia
percepcyjne dopuszcza, a nawet zakłada możliwość, że w przypadku
wadliwego działania układu percepcyjnego nie wszystkie dane ulegają wiązaniu. Takie właśnie zjawisko ma miejsce, jak starałam się to
wykazać, w przypadku osób, o które pytał Molyneux.
Evans zaproponował jednak pewien eksperyment, w którym odpowiednio pobudzana kora wzrokowa niewidomej osoby miała produkować efekt zwany fotyzmem. Zjawisko to miało potwierdzać przekonanie
Evansa, że zmysły są amodalne, gdyż efektem fotyzmu miało być doświadczenie wzrokowe kwadratu lub koła, wcześniej znanych badanemu
wyłącznie dotykowo. Nie jestem przekonana co do powodzenia takiego
eksperymentu m. in. z przyczyn wskazanych przez Shauna Gallaghera (Gallagher 2005, ss. 153-172). Poniżej przedstawię wątki stanowiska
Gallaghera, które przemawiają na rzecz mojego stanowiska.
4. Rozwój neuronalny zależy od doświadczenia
Gallagher proponuje, aby rozważania dotyczące problemu Molyneux
podsumować za pomocą trzech zasad stanowiących założenia, bądź
wnioski klasycznych teorii empirystycznych. Pierwsza z tych zasad głosi, że rozwój koherentnej percepcji zależy od umiejętności wprowadzania porządku do chaotycznego zestawu wrażeń. Umiejętność ta wynika z powtarzalności widzianych przedmiotów i de facto prowadzi do
powstania nawyków percepcyjnych. Koherentną treść uzyskaną dzięki
funkcjonowaniu takich nawyków Gallagher nazywa treścią Locke’owską
(Gallagher 2005, s. 155 oraz s. 156), gdyż to Locke wskazywał na rze-
Widzieć krawędzie, dotykać głębi
77
komo kluczową dla percepcji zależność miedzy powtarzalnością wrażeń
a nawykiem. Druga zasada zakłada, że modalności zmysłowe są wzajemnie autonomiczne, tj. nie zachodzi wymiana informacji na poziomie
zmysłowym. Dopiero treść Locke’owska umożliwia wiązanie informacji
z poszczególnych modalności zmysłowych. Jest to jednak umiejętność,
której się trzeba nauczyć angażując pojęcia. Zgodnie z trzecią zasadą
żadna z informacji modalnych nie jest wystarczająca do uzupełniania,
poprawiania, itp. informacji z innej modalności zmysłowej (Gallagher
2005, s. 155-56).
Wymienione wyżej zasady prowadzą do negatywnej odpowiedzi na
pytanie Molyneux. Gallagher proponuje, aby zrewidować je w oparciu
o badania empiryczne. Ostatecznie dochodzi do przekonania, że drugą
i trzecią należy odrzucić, zaś pierwsza powinna zostać przeformułowana.
Do wprowadzonego w poprzednich paragrafach artykułu pojęć treści
sensorycznej oraz treści apriorycznej można teraz dodać charakterystykę proponowaną przez Gallaghera, tj. kontekst rozwojowy (developmental context ). Psychologia rozwojowa posługuje się pojęciem kontekstu
rozwojowego zakładając, że treść sensoryczna nowonarodzonego dziecka jest chaotyczna i niekoherentna. W wyniku procesu integracji bodźców percepcyjnych i tworzenia pojęć, po pewnym czasie dochodzi do
uformowania się treści apriorycznej. Gallagher powołując się na wyniki
najnowszych badań z udziałem bardzo wczesnych noworodków (ok. godziny po porodzie oraz ok. miesiąca po porodzie) Gallagher dowodzi, że
powyższe założenie mija się z prawdą6 . Zakładając, że już bardzo młode dzieci rejestrują tę samą informację na temat kształtu przedmiotu
dotykanego i widzialnego oraz, że potrafią posługiwać się w sposób koherentny informacjami z proprioreceptorów proponuje, aby następująco przeformułować zasady koncepcji empirystycznych (Gallagher 2005,
s. 160-61). Po pierwsze, względnie koherentna percepcja jest możliwa
od urodzenia i nie wymaga treści Locke’owskiej. Po drugie, modalności
zmysłowe komunikują się ze sobą, co oznacza, że percepcja ma charakter amodalny. Po trzecie, informacje z jednej modalności zmysłowej
mogą wpływać na informacje z innej modalności zmysłowej. Pomimo
tych konstatacji Gallagher argumentuje na rzecz negatywnej odpowiedzi na pytanie Molyneux. Przyjrzyjmy się temu bliżej.
Pomimo, że badania nad noworodkami dowodzą, że ich układ percepcyjny doskonale radzi obie z integracją informacji z rozmaitych ka6
Aby nie poszerzać objętości niniejszego opracowania nie dyskutuję przytaczanych przez Gallaghera badań. Zainteresowanych odsyłam do następujących opracowań: (Meltzoff i Moore 1977, 1994) oraz (Meltzoff i Borton 1979).
78
Adriana Schetz
nałów sensorycznych, to kluczową kwestią dla zrozumienia problemu
Molyneux jest percepcja niestandardowa. Innymi słowy, należy poddać analizie wyniki badań nad deprywacją wzrokową, a nie prawidłowo
funkcjonującą percepcją wzrokową.
Badania przeprowadzone na noworodkach oraz na zwierzętach dowodzą, jak zauważa Gallagher, że jeśli między trzecim a trzynastym
tygodniem życia nie ma miejsca prawidłowa stymulacja wzrokowa, dochodzi do nieodwracalnych ubytków w percepcji wzrokowej do końca
życia (Gallagher 2005, ss. 165-70). Ubytki te powodowane są przez niewłaściwy rozwój komórek nerwowych odpowiedzialnych za percepcję
wzrokową. Podsumowując, zdaniem Gallaghera rozwój neuronalny odpowiedzialny za percepcję zależy od doświadczenia. Jeśli stymulacja
bodźców percepcyjnych jest zbyt uboga, prowadzi do wyhamowania
lub anomalii w rozwoju odpowiednich struktur neuronalnych umożliwiających poprawną percepcję. W przypadku wyhamowania ich rozwoju między trzecim a dwunastym tygodniem życia ma miejsce zatrzymanie rozwoju percepcji na poziomie bardzo ubogim w porównaniu
z percepcją u dorosłego człowieka rozwijającego się prawidłowo. Jeśli
dziecko lub zwierzę jest niewidome od urodzenia deprywacja neuronalna jest jeszcze bardziej zaawansowana i jest nieodwracalna. Powyższe
dane skłaniają Gallaghera do odrzucenia drugiej i trzeciej tezy klasycznych teorii empirystycznych oraz do przeformułowania pierwszej z nich:
Pomimo, że relatywnie zorganizowana eksteroreceptorowa percepcja
jest możliwa od urodzenia, zachowanie kontynuacji i rozwój percepcji
zależy od doświadczenia rozumianego jako stosowanie mechanizmów
percepcji (Gallagher 2005, s. 170).
Przychodzimy na świat z amodalnym lub zdolnym do integracji zmysłowej aparatem percepcyjnym. Nie wystarczy to jednak do zachowania
tej zdolności danej nam przez naturę. Molyneux powinien był wiedzieć,
że nie ma percepcji bez odpowiedniej stymulacji bodźcowej. Innymi
słowy, nie ma percepcji bez doświadczenia. Argumentacja Gallaghera
potwierdza zatem to, co starałam się wcześniej wykazać, mianowicie,
że deprywacja neuronalna obszarów mózgu odpowiedzialnych za widzenie przekłada się na niezdolność do prawidłowych analiz na poziomie
kognitywnym, tj. na poziomie treści apriorycznej.
Widzieć krawędzie, dotykać głębi
79
Literatura
Baumann, P. (2004). Molyneux’s Questions. W: Schumacher, R., (red.)
Perception and Reality. From Descartes to Present. Paderborn: Mentis, s. 168–
187.
Campbell, J. (2005). Information Processing, Phenomenal Consciousness,
and Molyneux’s Question. W: J.L. Bermùdez (red.) Thought, Reference, and
Experience. Oxford: Clarendon Press.
Degenaar M. (1996). Molyneux’s Problem. Three Centuries of Discussion
on the Perception of Forms. Dordrecht/London: Kulwer Academic Publishers.
Evans, G., (2003). Demonstrative Identification. W: Gunther, Y. H., (red.)
Essays on Nonconceptual Content. Cambridge, MA: MIT Press.
Evans, G., (2004). Molyneux Question. W: Schwartz, R. (red.) Perception.
Oxford: Blackwell, s. 130–149.
Fodor, J., A., Pylyshin, Z. (2004). How Direct is Visual Perception? W:
Schwartz, R. (red.) Perception. Oxford: Blackwell, s. 175–199.
Francuz, P. (2007). Teoria wyobraźni Stephena Kosslyna. Próba reinterpretacji. W: Francuz, P. (red.) Obrazy w umyśle. Studia nad percepcją i wyobraźnią. Warszawa: Wydawnictwo Naukowe Scholar.
Gallagher S. (2005). How the Body Shapes the Mind. Oxford: Clarendon
Press.
Gibson, J. J. (1979). The Ecological Approach to Visual Perception. Boston: Houghton Mifflin.
Hopkins, R. (2005). Molyneux’s Question. Canadian Journal of Philosophy 3, s. 441–464.
Jacomuzzi, A., Kobau, P., Bruno, N. (2003). Molyneux’s Question Redux.
Phenomenology and the Cognitive Sciences 2, s. 255–280.
Meltzoff A., R. W. Borton (1979). Intermodal Matching by Human Neonates. Nature, 282, s. 403–404.
Meltzoff A., M. K. Moore (1994). Imitation, Memory, and the Representation of Persons. Infant Behavior and Development 17, s. 83–99.
Meltzoff A., M. K. Moore (1977). Imitation of Facial and Manual Gestures
by Human Neonates. Science 198, s. 75–78.
Niestorowicz, E. (2007). Świat w umyśle i rzeźbie osób głuchoniewidomych.
Lublin: Wydawnictwo Uniwersytetu Marii Curie-Skłodowskiej.
Noë A. (2004). Action in Perception. Cambridge, MA: MIT Press.
Paplińska, M. (2008). Konsekwencje wynikające z braku wzroku. W: Paplińska, M. (red) Edukacja równych szans. Uczeń i student z dysfunkcją wzroku — nowe podejście, nowe możliwości. Warszawa: Wydawnictwo Uniwersytetu Warszawskiego.
Peacocke, Ch. (1992). A Study of Concepts. Cambridge, MA: MIT Press.
Schetz, A. (w przygotowaniu). Dwa problemy Molyneux.
Więckowska, E. (2003). Projekt zasad redagowania rysunku i ilustracji
dla niewidomego. W: Nowoczesne techniki kształcenia niewidomych i słabowidzących. Poznań: Wydawnictwo Oficyna Edukacyjna Wydawnictwa EMPI,
s. 80–88.
Ekotypy poznawcze człowieka
Maciej Błaszak
Uniwersytet im. Adama Mickiewicza w Poznaniu
Instytut Filozofii
Natura moja nosi, widać, ślady
Mego zajęcia, jak ręka farbiarza.
— William Szekspir, Sonet CXI
(przekład Jana Kasprowicza)
Streszczenie. Artykuł oferuje nowe rozwiązanie problemu usytuowania
umysłu ( situated cognition), polegające na wykazaniu, jak i dlaczego
ludzki umysł wydobywa z otoczenia nie informację, lecz wiedzę. Wiedza jest definiowana jako informacja posiadająca dla organizmu określoną wartość. Zaprezentowany został mechanizm, za pomocą którego
owa wartość zostaje do bodźca informacyjnego wprowadzona. Usytuowanie — według tej interpretacji — polega na tym, że część procesów
poznawczych człowieka wykonują za niego inni ludzie, mianowicie ci,
którzy wytworzyli jego otoczenie poznawcze. Otoczenie poznawcze jest
definiowane jako suma wartościowych bodźców informacyjnych. Wiedza
wydobyta z otoczenia definiuje różne style poznawcze człowieka, które
— z uwagi na zewnętrzne źródło klasyfikacji — nazywane są ekotypami
poznawczymi. Wyróżnione zostają cztery ekotypy poznawcze człowieka,
na podstawie kształtu ich otoczenia poznawczego (rodzaje ofert ucieleśniających wartościową informację) oraz kompetencji poznawczych niezbędnych do wydobycia wiedzy z otoczenia.
1. Wartość gibsonowskich ofert
Ekonomia poznania stawia człowieka przed problem wyboru i konstrukcji ofert do działania (affordances) (Gibson 1979)1 , pozwalających mu uniknąć nadmiarowości informacji wypełniającej naturalne
1
Oferty — w rozumieniu Jamesa Gibsona — są sposobnościami do działania, czyli własnościami środowiska zrelatywizowanymi do określonego zwierzęcego organizmu, który potrafi je postrzec i wykorzystać; postrzeganie ofert
i wydobywanie z nich informacji jest — zdaniem Gibsona — bezpośrednie,
Studia z Kognitywistyki i Filozofii Umysłu, 3: 81–96, 2009
c 2009 Maciej Błaszak
Copyright 82
Maciej Błaszak
środowisko jego życia. Oferty mogą być przedmiotami lub zdarzeniami reprezentującymi wycinek środowiska w którym zachodzą procesy poznawcze Homo sapiens. Bez takiej ekologicznej standaryzacji
bodźców wywołujących określone działanie, człowiek nie poradziłby sobie z partykularnością informacji z jednej strony, oraz z jej obfitością
i różnorodnością z drugiej. Pierwszy problem uniemożliwiłby generalizację właściwą percepcji ekologicznej, drugi pochłonąłby kolosalne ilości energii swobodnej, potrzebnej do pozbycia się nadmiaru informacji
docierającej do powierzchni naszego ciała.2
Kompilacja ofert do działania tworzy otoczenie (Von Uexkull 1985)
poznawcze człowieka (Umwelt), kształtujące systemy percepcyjne
(Gibson 1966) niemowlaków i dzieci. Rozwój osobniczy to z jednej strony nabywanie ekspertyzy percepcyjnej w obrębie istniejącego otoczenia,
z drugiej — uczenie się postrzegania tych samych przedmiotów i zdarzeń „na nowo”. Ten ostatni proces jest następstwem wzrostu dziecka,
dojrzewania jego systemu nerwowego i rozwoju jego motoryki, umożliwiających mu korzystanie z nowych ofert znanych już przedmiotów
i zdarzeń, i co za tym idzie, wzbogacanie własnego Umwelt-u.
Otoczenie poznawcze ma zatem charakter dynamiczny: zmieniające
się oferty definiują przedział sposobności do działania dla rozwijającego
się dziecka. Mówiąc metaforycznie, otoczenie jest przewodnikiem z którym człowiek się konsultuje po to, by w trakcie własnej ontogenezy odkryć co można postrzegać, jak to coś funkcjonuje, i — przede wszystkim
— do czego może zostać wykorzystane. W tym sensie Umwelt jest poznawczo autorytatywny: ustanawia standardy według których człowiek
postrzega przedmioty i zdarzenia, a także działa pod ich wpływem.
Odkrywanie, tworzenie i używanie otoczenia jest z istoty przedsięwzięciem zbiorowym, rozciągającym się na wiele pokoleń ludzkich istnień. Jeśli populacja ludzka jest stabilna, standard poznawczy wyzna„niezapośredniczone obrazami siatkówkowymi, obrazami neuronalnymi lub
obrazami mentalnymi” (Gibson 1979, s. 147).
2
Odrzucanie nadmiaru informacji jest — jak wykazał Rolf Landauer (Landauer 1961) — procesem entropijnym, przekształcającym energię swobodną
w pracę. Pracą, w obszarze odrzucania informacji przez ludzki mózg, jest stan
poznawczy o niewielkiej zawartości informacyjnej, która jednak posiada wysoką wartość dla organizmu (na przykład, świadomość: przepustowość rzędu
40 bitów na sekundę [niewielka ilość], będących hipotezą na temat sytuacji w
której organizm się znajduje [wysoka wartość]). Ową wartość definiuje podane niżej w tekście kryterium głębi logicznej. Entropia, czyli energia cieplna
wydzielana podczas odrzucania informacji — układy obliczeniowe nagrzewają się — jest ceną, jaką nasz organizm musi zapłacić za uaktualnianie własnej
wiedzy o wewnętrznym i zewnętrznym środowisku swojego życia.
Ekotypy poznawcze człowieka
83
czony przez oferty otoczenia powinien przez długi okres czasu być niezmienny. To, co nas otacza ucieleśnia testy doboru naturalnego w ciągu milionów lat ewolucji oraz mądrość wielu pokoleń innowatorów —
słowem jest dobrze sprawdzone (użyteczne). Użyteczność otoczenia
można zmierzyć liczbą przeżyć, doświadczeń, prób i błędów, tworzących
jego długą historię, czyli ilością pracy wykonanej przez dobór (skala filogenetyczna) i innych ludzi (skala ontogenetyczna) podczas jego
konstrukcji. Praca ta zostaje zaoszczędzona umysłowi reagującemu na
określone oferty, który nie musi samemu wykonywać mozolnej roboty
standaryzacji i generalizacji bodźców poznawczych. Oznacza to, iż lwią
część poznania przez nas otoczenia wykonują za nas inni, mianowicie
ci którzy to otoczenie wytworzyli.
Ilość pracy wykonanej podczas tworzenia ofert, czyli miara użyteczności otoczenia, pokrywa się z pojęciem „głębi logicznej” jako miary
wartości komunikatu lub złożoności obiektu. Kryterium głębi logicznej zaproponował Charles Bennett (Bennett 2003), który wykazał, iż
dla opisania złożoności układu nie jest istotna informacja w nim zawarta, lecz informacja odrzucona w trakcie tworzenia tego układu. Złożoność jest zatem wskaźnikiem procesu produkcji, a nie samego produktu,
czasu pracy, a nie rezultatu tej pracy, informacji odrzuconej, a nie informacji pozostawionej w układzie. Aby rzeczy wyglądały na proste
należy się napracować. Przejrzystość wymaga głębi.
Oferty są rodzajem zmaterializowanego komunikatu, charakteryzującego się logiczną głębią. Im większych trudności doświadczał nadawca — dobór naturalny oraz inni ludzie — konstruując taki ewolucyjny
przekaz, tym większa wartość wytworzonych ofert. Czas potrzebny do
odbioru ofert nie jest tak ważny — wskazuje na ilość informacji zawartej w ofercie. Tym co się liczy jest czas potrzebny do skonstruowania
oferty — wskazuje na jej wartość dla odbiorcy.
Szum informacyjny nie ma głębi, nie może być opisany zwięźlej.3
Standaryzacja ofert wymaga czasu, czasu w którym powstaje porządek, w którym informacja jest odrzucana, aby odbiorca mógł zarządzać
jej mniejszą ilością. Odbiorcę interesuje tylko ta informacja, która ma
znaczenie w danym kontekście, dzięki której będzie mógł on uruchomić
przystosowawczy rodzaj działań. Konstruowanie ofert jest zatem metodą pozbywania się informacji, którą organizm nie jest zainteresowany,
która dla niego jest tym, co nieistotne.
Ujmując problem obrazowo: skoro otoczenie jest kompilacją ofert,
a oferty są zmaterializowanymi komunikatami, liczy się nie to by móRelacjami między losowością i porządkiem zajmuje się teoria algorytmicznej złożoności Kołmogorowa, Solomonoffa, Chaitina (por. Calude 2007).
3
84
Maciej Błaszak
wić maksymalnie dużo, lecz by myśleć zanim się coś powie. Mówienie
to długość komunikatu, czyli informacja w nim zawarta. Myślenie to
praca wykonana przez nadawcę (dobór naturalny, inni ludzie), zanim
komunikat powstał, to informacja odrzucona podczas konstruowania
komunikatu. Wartościowe oferty mają zatem bardzo bogatą historię:
ich opis nie wymaga tak wielu wyjaśnień, za to ich konstrukcja wymaga wielu przeżyć, doświadczeń, prób i błędów.
2. Wiedza zmaterializowana w ofertach
Klasyczna już metafora jaką Donald Schön zaproponował dla projektowania („rozmowa z materiałami w danej sytuacji”) (Schön 1983,
s. 78), dobrze oddaje charakter ofert jako wytworzonej zmaterializowanej wiedzy.4 Jeśli przyglądamy się jedynie informacji zawartej
w ofercie, nie ma możliwości zmierzyć jak wiele informacji odrzuconej
oferta implikuje. Jedynie kontekst w którym oferta się pojawia może
nas o tym poinformować. Informacja jest widoczna, informacja odrzucona jest widoczna dopiero w kontekście. To sprawia, że trudno jest
zmierzyć wartość oferty, czyli wiedzę w niej zmaterializowaną.
Można to zilustrować za pomocą przykładu: kształt główki młotka
dostarcza człowiekowi użytecznej informacji — kiedyś wbijanie gwoździ
generowało takie to a takie problemy. My jednak nie jesteśmy zainteresowani tymi szczegółami: zakładamy, że główka młotka odnosi się
do ogromu informacji, której w niej nie ma. Kształt główki jest mapą
rozwiązań problemów z wbijaniem gwoździ, mapą wysoce stylizowaną.
Wszystko co pozostało po trudnościach napotykanych przez rzemieślników przeszłości, to forma narzędzia. Ale to w zupełności wystarcza
w kontekście wbijania gwoździ: kształt główki młotka, którym się posługujemy ‘komunikuje’ nam wyraźnie, iż osoba która młotek projektowała wie o wbijaniu gwoździ znacznie więcej niż my. Istnienie tej wiedzy widać po tym, że młotek jest autoryzowany (producent): powstał
w drodze przekształcania informacji, której w nim już nie ma.
Abstrahując od analiz z niniejszego artykułu (oferty charakteryzują się
głębią logiczną), człowiekiem, który jako pierwszy postawił tezę, iż wiedza
to praca, pomiar to akt materialny, a postrzeganie to metabolizm był Leo
Szilard. W słynnym artykule z 1929 roku Szilard opisał hipotetyczny silnik, którego reguły działania miały dowodzić niemożliwości istnienia demona
Maxwella. Propozycja węgierskiego fizyka okazała się chybiona (demon nie
jest możliwy, ale z innego powodu), niemniej artykuł stał się kamieniem milowym informatyki: po raz pierwszy przyjęto w nim, choć nie udowodniono,
że pomiar kosztuje. Dowód tego dostarczył dopiero w latach 60. XX wieku
Rolf Landauer (por. Bennett 1987).
4
Ekotypy poznawcze człowieka
85
Egzemplarz młotka, którym się posługuję, jest jedną z wielu tysięcy
kopii. Producent powiela prototyp, aby wygenerować zysk ze sprzedaży. Istota pracy wytwórcy użytecznego młotka nie polega jednak na powielaniu narzędzia określonego kształtu. Istotne są jedynie te wszystkie
prototypy młotka, które zostały przez producenta przetestowane i odrzucone podczas tworzenia ostatecznego wariantu. Jedna kopia każdego
przetestowanego prototypu została skondensowana do wielu kopii jednego prototypu, tego który wszedł do produkcji. Na tym polega wytwarzanie użytecznego narzędzia, którego oferty mają określoną wartość
dla użytkownika.
O tym, że wartością ofert nie jest ich ostateczny kształt — jak sugerowałby James Gibson — lecz proces ich wytwarzania świadczyć może
następująca sytuacja: czasami producent jest leniwy i skąpy, i nie testuje prototypów młotka. Domyśla się jak młotkiem określonego kształtu
będzie się wbijać gwoździe, ponieważ skopiował jego kształt na targach
narzędzi i na podstawie sporządzonej kopii sam zamierza produkować
taki model. Łatwo jest dostrzec ile informacji narzędzie zawiera: widać
jego kształt, ocenić można jego wagę i materiały z których został wykonany. Trudno jest dostrzec ile informacji odrzuconej prezentuje. Jeśli
jednak testujemy ten młotek przez dłuższy czas i śledzimy linię produktową producenta, jesteśmy w stanie zorientować się, czy jakiekolwiek
prototypy młotka zostały przetestowane i odrzucone zanim powstał
ostateczny produkt. Historia narzędzia stanowi klucz do uchwycenia
jego użyteczności.
Skąd się bierze ludzka zdolność uchwytywania użyteczności, czyli rekonstruowania informacji odrzuconej z informacji postrzeganej? Jak posługując się narzędziem, mogę odtworzyć jego historię? Już jako dzieci
lubimy posługiwać się narzędziami, na przykład drewnianym młotkiem.
Potrafimy stukać nim o różne przedmioty i porównywać go z innymi
‘poręcznymi’ obiektami. Do ulubionych zabawek każdego dziecka należą przybory kuchenne — kuchnia to prawdziwy poligon testowania
rozwijających się kompetencji manipulacyjnych dziecka. Posługując się
wielokrotnie danym narzędziem w różnych konfiguracjach, dzieci ćwiczą się w rozumieniu, uczą się sztuki kojarzenia: jakie są możliwości
tego narzędzia?; jakie usterki zostały wyeliminowane zanim powstał
egzemplarz, którym się posługuję? Oczywiście tych pytań dziecko nie
stawia sobie świadomie i nie werbalizuje problemów, o których mowa.
To raczej matka widząc jak dziecko ‘katuje’ określoną zabawkę sarkastycznie zauważa: „Próbuj dalej, może wreszcie złamiesz”.
Wiedza zmaterializowana w ofertach jest wiedzą w działaniu. Postrzeganie ofert owocuje podejmowaniem działań, które zmieniają stan
umysłu perceptora: wykonując działanie pod wpływem oferty, jedno-
86
Maciej Błaszak
cześnie wydobywa on określony rodzaj wiedzy w niej zawarty. Wiedza
ta jest informacją odrzuconą w trakcie wytwarzania oferty i może zostać wydobyta przez perceptora wówczas, gdy oferta jest postrzegana
w określonym kontekście. Widać to na przykładzie narzędzi materialnych, ale jeszcze lepiej na przykładzie narzędzi językowych.
Młotek, łopatka i wiaderko nie wytrzymują konkurencji z czytaniem
bajek. Dzieci kochają słuchać bajki, nawet jedną i tę samą czytaną
na okrągło. Ćwiczenie się w rozumieniu polega w tym przypadku na
domyślaniu się stanów umysłu autora, umysłu niewątpliwie wypełnionego ideami obiektów, których nazwy umieścił w tekście. Utalentowany bajkopisarz to autor, który przelewając swoje idee na papier myśli
przede wszystkim o tym, co jego odbiorca ma w głowie: komunikat musi bowiem wywoływać skojarzenia u odbiorcy. Najmniej interesującym
aspektem czytania bajek jest to, co zostaje w bajce wypowiedziane.
Dużo ciekawszym aspektem są te wszystkie deliberacje i emocje, które
rozgrywają się w głowach i ciałach autora i odbiorcy, kiedyś podczas
pisania i teraz podczas słuchania. Słowa, czyli oferty językowe, odnoszą się do czegoś nieobecnego — nieobecnego w tekście, ale obecnego w
głowach i ciałach twórcy i odbiorcy ofert. Efektem postrzegania ofert
jest — poza realizacją określonych działań — wyzwolenie podobnych
stanów mentalnych w umysłach ich twórcy i odbiorcy.5
Badania nad funkcjonowaniem materialnego podłoża umysłu — ludzkiego mózgu — potwierdzają istnienie epistemicznego wymiaru gibsonowskich ofert. Spójrzmy najpierw na problem od strony twórcy ofert
— człowieka, który produkuje zestandaryzowany komunikat. Louis Sokoloff wykazał, w pionierskich badaniach nad metabolizmem neuronów
(Sokoloff 1999, s. 321-329), iż kosztowny jest powrót do fizjologicznej
normy, czyli uwolnienie się komórki od konsekwencji własnego metabolizmu. Neuron musi zapłacić za pozbycie się informacji, którą dysponował — zastrzyk energii do komórki następuje nie podczas przebiegu potencjału czynnościowego, lecz wówczas gdy następuje resetowanie
układu, czyli przygotowanie komórki do kolejnego cyklu fizjologicznego.
Przepływ krwi do mózgu, bogatej w tlen i glukozę, jest miarą informacji
odrzuconej przez neurony podczas konstruowania wartościowej oferty
— jest metabolizmem wymaganym do tego, by komórka nerwowa mogła zapomnieć to, co właśnie zrobiła.
Argument powyższy obowiązuje również wówczas, gdy twórcą ofert jest
dobór naturalny. Narzędziem działania doboru są przede wszystkim inni ludzie, ich poznanie ma charakter rozproszony (distributed cognition), a jego
produkt podlega procesowi selekcji w skali wielu pokoleń (na przykład memy).
5
Ekotypy poznawcze człowieka
87
Z perspektywy odbiorcy ofert istotne okazały się pomiary — dokonane technikami neuroobrazowania — różnic w przepływie krwi w mózgu,
gdy ludzie słuchali wypowiedzi w języku, który rozumieli i w języku,
którego nie rozumieli. Lars Friberg — uczeń Nielsa Lassena, współtwórcy technik neuroobrazowania — pokazał, iż kiedy tekst jest rozumiany,
aktywowane są ośrodki słuchania i językowe, kiedy natomiast tekst nie
jest rozumiany, aktywowany jest cały mózg (Friberg 1991). Odbiorca
rozumiejący komunikat doświadcza jedynie bitów, dla których język
jest kodem — to znacznie mniej bitów niż ich całkowita liczba obecna w widmie akustycznym. Więcej pracy mózgu jest wymagane dla
‘przetrawienia’ informacji nie generującej znaczenia niż informacji znaczącej, bałaganu niż porządku. I nie jest tak dlatego, że ‘bałaganiarskie’
bity nie są obecne w zrozumiałym komunikacie, tylko dlatego, że mózg
‘wie’, że nie musi się odnosić do tych wszystkich pozostałych bitów gdy
słyszy znaną sobie mowę.
Codzienne pojęcie informacji („przekazał mi naprawdę cenną wiadomość”) jest zatem o informacji odrzuconej. Postrzegamy oferty jako
znaczące, ponieważ nie musimy odnotowywać wszystkich szczegółów,
całej tej fizycznej informacji wypełniającej w nadmiarze środowisko
naszego życia. Zadowalamy się niewielką liczbą różnic, zmaterializowanych w formie ofert. Wydaje się, że owe różnice przebiegają według
czterech współrzędnych: konstrukcyjnej, instrumentalnej, reprezentacyjnej i interakcyjnej. Współrzędne pozwalają na wyróżnienie
czterech typów ofert i czterech ekotypów poznawczych człowieka, definiowanych wiedzą w ofertach zawartą. Choć ekotypy są typami idealnymi i realny człowiek stanowi po trosze mix ich wszystkich, można
odnaleźć i opisać ludzi których ofertowe otoczenie bardzo przypomina
każdą ze współrzędnych w wersji czystej. Dla ilustracji zobaczmy jak
wygląda najbardziej pierwotna forma otoczenia, swoisty Ur-Umwelt,
w którym perceptor wydobywa z ofert wiedzę kinestetyczną, angażującą równomiernie jego mózg i ciało, i konstruującą jego umysł —
umysł eksperta. Poznajmy Williego, prawdziwego dwudziestowiecznego bricoleura i bohatera książki Douglasa Harpera (Harper 1992).
3. Mój warsztat jest moim światem, czyli kim jest
Willie
Willie przynależy do świata — wartości, umiejętności i stosunków
pracy — którego już nie ma. Jeśli jednak gdzieś przetrwał, jego zasięg
jest niszowy. Willie to człowiek, którego cechuje „myśl nieoswojona”,
to bricoleur, którego — z uwagi na skojarzenia w języku polskim — nie
będziemy nazywać „majsterklepką”, lecz „ekspertem”. Claude Levi-
88
Maciej Błaszak
Strauss nadał ‘wiedzy konkretu’ bricoleura odpowiednią rangę w antropologii kulturowej:
„Świat narzędzi bricoleura jest zamknięty, a regułą gry jest zawsze posługiwanie się środkami będącymi pod ręką, tzn. w każdej chwili skończonym zasobem przedmiotów i materiałów, niejednorodnym z tego
względu, że skład jego nie wiąże się z aktualnie realizowanym planem
ani zresztą z żadnym planem szczególnym, lecz jest przypadkowym
rezultatem wszystkich nadarzających się okazji odnowienia czy wzbogacenia posiadanego zasobu, . . . .”( Levi-Strauss 1969, s. 32).
„. . . bricoleur nie ogranicza się do działań i dokonań; „rozmawia” on
nie tylko z rzeczami (. . . ), lecz i przy pomocy rzeczy: mówi o swym
charakterze i życiu poprzez wybór wśród ograniczonych możliwości.”
(Levi-Strauss 1969, s. 37).
Willie jest właścicielem warsztatu na amerykańskiej prowincji lat
70. XX wieku. Okolica w której mieszka jest ekonomicznie zacofana,
słabo zaludniona, o surowym klimacie. Mogą w niej przetrwać ludzie
w miarę samowystarczalni, zdolni do funkcjonowania w małych kolektywach o silnych wzajemnych zależnościach, zobowiązaniach i świadczeniu przysług. Pieniądz ma tutaj drugorzędne znaczenie, liczą się przede
wszystkim manualne umiejętności, pomysłowość i sprawdzony charakter. Warsztat Willego, w którym można naprawić kilkuletni samochód
(nowe w tej okolicy to rzadkość), maszynę rolniczą, czy element wyposażenia domu stanowi miejsce spotkań, wymiany informacji, towarów
i usług. Właściciel warsztatu, dzięki swoim umiejętnościom, realizuje
zadania kluczowe dla przetrwania tej małej społeczności, a jego status
wynika z rangi oferowanych usług.
Fundamentem działań Williego podejmowanych w obrębie warsztatu jest gruntowna znajomość materiałów z którymi pracuje. Willie
dokładnie wie jak zachowa się dany materiał poddany określonej obróbce, co pozwala mu wykorzystać elementy starych urządzeń, części
zużytych maszyn, fragmenty większych całości przez innych spisane na
straty. Willie dostrzega wartość ‘rupieci’ (junk), a każda naprawa jakiej
się podejmuje jest rodzajem budowania urządzenia od nowa. Wnikliwa znajomość przedmiotów codziennego użytku pozwala mu zrozumieć
dlaczego urządzenie się zepsuło i jak naprawić usterkę, a nie po prostu
wymienić zepsutą część. Wiedza o materiałach i prawach, którym podlegają ma w przypadku Williego adaptacyjny charakter: służy temu by
rozwiązać określony problem. Zbierana jest podczas działań nakierowanych na określone oferty i ma pragmatyczny charakter — dotyczy
tego jak drewno się pali, jak krąży powietrze, jak metal mięknie pod
wpływem uderzeń młotka.
Ekotypy poznawcze człowieka
89
Praca Williego to jednak coś więcej niż tylko rozwiązywanie materialnych problemów lokalnej społeczności. Natura tej pracy opiera się na
organicznym związku z celem, jakim jest sposób bycia Williego w świecie własnego warsztatu. Przejawia się to w każdym działaniu, które
podejmuje, działaniu charakteryzującym się kinestetyczną poprawnością: oceną materiału poprzez dotyk, diagnozą usterki silnika na słuch,
wytrzymałości konstrukcji poprzez siłę, jaką musi przyłożyć do jej skręcenia. Naprawa maszyny jest częścią osobistej historii Williego i buduje
jego biografię — poprzedzona została latami nieformalnego, pozaszkolnego treningu, który do mistrzostwa doprowadził oko, rękę i umysł
bricoleura. Rezultat przerasta sumę poszczególnych składowych, stanowi zagadkę dla tych, którzy nie legitymują się ekspertyzą na takim
poziomie.
Wiedza, którą wydobywa Willie z ofert własnego otoczenia ma kinestetyczny charakter — nie poddaje się łatwo pojęciowej analizie i werbalnemu opisowi. Konceptualizacja zakłada dystynkcje, które w przypadku bricoleura nie istnieją, na przykład między podmiotem i przedmiotem poznania czy obiektywnym czasem dokonywania napraw. Kluczowa w warsztacie jest sama aktywność — to ona buduje tożsamość
Williego i szacuje wartość wykonanej przez niego pracy. Aktywność definiuje również role społeczne Williego — majstra, ojca, wychowawcy,
społecznego rozjemcy — i konstruuje jego umysł, którego dominującym
stanem jest przepływ (flow) (Csikszentmihalyi 2005).
Przepływ jest doświadczaniem teraźniejszości, które jest możliwe
dzięki zawieszeniu świadomego „Ja”. Zawieszenie świadomego „Ja” pozwala nieświadomości żyć na pełnych obrotach — uruchamia znacznie
szersze pasmo przenoszenia informacji przez ludzki mózg.
Stan przepływu przychodzi wraz z praktyką — trening, ćwiczenia,
przygotowania, i jeszcze raz trening. To jest droga do stanu w którym
świadome „Ja” nabiera zaufania do nieświadomości i przestaje ją kontrolować, co owocuje płynnością podejmowanych działań. Trening tworzy automatyczne umiejętności, które mogą zostać zaaplikowane bez
świadomości, że są w ten sposób wykorzystywane. Oko świadomości
jest obecne podczas treningu, ale nie podczas samego kinestetycznego
działania.
Eksperci pokroju Williego stają wobec swoistego paradoksu: lekkiego
zawstydzenia z powodu osiągniętego sukcesu. Jest to dziwne, choć jak
najbardziej realne zjawisko. Dlaczego tak się dzieje?
Cała praca kryjąca się za manualnymi umiejętnościami Williego jest
rezultatem treningu, prób i dyscypliny. Świadome „Ja” zdecydowało
się na ten trening i z czasem nabrało zaufania do nieświadomości, że
poradzi sobie z zadaniami, które są stawiane przed ekspertem. Zada-
90
Maciej Błaszak
nia te są realizowane przez nieświadomość eksperta, mimo że zlecenie
przyjęło jego świadome „Ja”. Kiedy zadanie jest na ukończeniu, zleceniodawca wyraża swoje uznanie i podziw, a świadome „Ja” Willego
powraca z dalekiej podróży. Zawstydzenie pojawia się, ponieważ to nie
świadome „Ja” wykonało pracę, a mimo to pochwały są adresowane do
niego.
Praca Williego sprawia mu przyjemność i satysfakcję, ponieważ najbardziej lubimy robić to, czego nie musimy świadomie kontrolować
przez cały czas. W stanie przepływu Willie jest tym, co robi. Praca,
którą wykonuje wymaga udziału pojedynczego eksperta, angażującego równomiernie własną głowę i ręce. Wiedza, którą wydobywa z ofert
podczas pracy jest całością — dotyczy w tym samym stopniu materiału
nad którym pracuje, co samego bricoleura. Williego stworzyła świadomie narzucona dyscyplina, która pozwoliła mu — w warunkach warsztatu — nieświadomie generować wiedzę kinestetyczną tworzącą jego
unikalny ekotyp poznawczy.
4. Ekotypy poznawcze człowieka — próba typologii
Tworzenie i postrzeganie ofert — odpowiednio — ucieleśnia i wydobywa wiedzę. Tak długo jak wiedza zakłada istnienie poznającego, podmiotowość poznającego będzie epistemologicznym problemem. Modyfikowanie sposobów poznawania rzeczywistości — drogą konstruowania
i wydobywania ofert otoczenia — było, jest i będzie powiązane z modyfikowaniem podmiotu poznania. Innymi słowy, historia poznania jest
historią kształtowania pewnych typów ludzkiej podmiotowości.
Tam gdzie podmiot pojawia się zarówno w obszarze tworzenia, jak
i postrzegania ofert, tam siłą rzeczy pojawia się kwestia wartości. Nie
zawsze mamy do czynienia z tym samym rodzajem wartości i z tym samym rodzajem podmiotowości: ludzkie wartości i ludzka podmiotowość
mają swoje historie. Epistemiczne wartości zmieniają się, a podmiot poznania ewoluuje. Podmiot poznania może jednak podlegać tylko takim
zmianom, jakie są uzasadnione wartościami epistemicznymi (Daston &
Galison 2007).6
Epistemiczne wartości kształtują podmiot poznania i sposób w jaki
to robią pokrywa się ze sposobami na które postrzeganie ofert przekształcane jest w wiedzę o otoczeniu. Praktyki zdobywania wiedzy
o otoczeniu poznawczym uznawane za poprawne według pewnych war6
Rodzaje wartości epistemicznych, które przyjmuję w niniejszym tekście
oraz konsekwencje poznawcze i ontologiczne ich wyróżnienia są zaadoptowanym podziałem zaproponowanym przez Daston & Galiston 2007.
Ekotypy poznawcze człowieka
91
tości epistemicznych, mogą zostać odrzucone na gruncie wartości odmiennych. Typy podmiotów poznania zdefiniowane przez wartości epistemiczne wydobywane z gibsonowskich ofert nazywać będę ekotypami poznawczymi człowieka. Jakie zatem wartości epistemiczne
oferuje otoczenie człowieka, czyli jego Umwelt?
Przyjrzyjmy się raz jeszcze otoczeniu bricoleura. Wiedza kinestetyczna wydobyta z ofert warsztatu wymagała zrównoważonego udziału
umysłu i ciała Williego. Gdy warsztat, jako forma otoczenia poznawczego przestał istnieć, nastąpiła separacja działań, które u bricoleura stanowiły poznawczą jedność: projektowania i produkcji. Działanie
produkcyjne zaczęło angażować wyłącznie ciało wyrobnika, a działanie
projektowe — wyłącznie umysł inżyniera. Złożoność wiedzy potrzebnej
do wytworzenia produktu wzrosła, ale rola konkretnej jednostki ludzkiej w tym całościowym procesie zmalała.
Obfitość wariantów przedmiotów w środowisku Williego — owo oportunistyczne wykorzystywanie przez niego zbędnych ‘rupieci’ — wykluczało możliwość reprezentowania ich za pomocą pojedynczych, typowych ofert (co, jak zobaczymy ma miejsce w otoczeniu inżyniera) lub
instrumentalizacji ich za pomocą pojedynczych, charakterystycznych
ofert (co ma miejsce w otoczeniu wyrobnika). Zamiast reprezentować
typ idealny (w otoczeniu inżyniera) lub instrumentalizować konkretne indywiduum (w otoczeniu wyrobnika), oferty w otoczeniu eksperta
konstruują przedział normy, czyli poznawczy prototyp. Oferty prototypowe z warsztatu bricoleura funkcjonują jak kierunkowskaz, oznajmujący ludziom pokroju Williego, że te i tamte parametry indywidualnego
obiektu, nad którym przyszło im pracować plasują się w przedziale normy, czyli poznawczego prototypu. Ocena, które parametry są normą,
a które poza nią wykraczają, wymaga ze strony bricoleura — którego
nazwijmy ekotypem heideggerowskim — ekspertyzy w obszarze postrzegania tych właśnie ofert. Jak pamiętamy, ekspertyza Williego musiała zostać poprzedzona długoletnim, nieformalnym (pozaszkolnym)
treningiem. Podstawową zdolnością poznawczą, którą Willie rozwinął
w sobie na skutek tego treningu była umiejętność rozpoznawania wzorców.
Separacja pracy na elementy mentalne i manualne, jaka dokonała się
wraz ze zmianą organizacji pracy (punkt serwisowy, zakład produkcyjny, biuro projektowe) oznaczała modyfikację ekotypów wraz z poprzedzającą ją ewolucją ofert poznawczego otoczenia. Związana z tym była
zmiana samego sposobu uczenia się, który z nieformalnego treningu
stał się formalnym systemem edukacyjnym. Eksperci pokroju Williego
musieli zniknąć, ponieważ formalny system szkolenia podkreślał obiektywny charakter pracy, na przykład napraw. Wiedza potrzebna do ich
92
Maciej Błaszak
przeprowadzenia zaczęła być lokalizowana w głowie pracowników punktu serwisowego, a nie w harmonijnym połączeniu ciała i umysłu. Naprawa w coraz większym stopniu przypominała masową produkcję przedmiotu na taśmie montażowej — polegała na usunięciu części wadliwej
i zastąpieniu jej częścią nową. Jest to prosta, mechaniczna czynność,
precyzyjnie zdefiniowana przez pisemne procedury.
Racjonalizacja pracy oznaczała intelektualizację działań pewnych
ludzi i mechanizację działań innych. Pracownik serwisu kieruje się —
całkowicie mechanicznie — wskazówkami, które zostały zapisane —
w trybie całkowicie intelektualnym — wówczas, gdy naprawa została racjonalnie zdefiniowana przez inżyniera. Na innowacyjne działania
autorstwa samego bricoleura w tym świecie nie ma miejsca.
W jakim otoczeniu poznawczym funkcjonuje zatem inżynier i jakie
wartości epistemiczne ucieleśniają oferty pod wpływem których działa?
Oferty otoczenia inżyniera — nazwiemy je archetypowymi — wyzwalają działania nakierowane na typ obiektu, bardziej reprezentatywny
dla środowiska, czyli bardziej realny niż jakikolwiek konkretny egzemplarz tego obiektu. Działania realizowane przez inżyniera, czyli ekotyp
platoński, koncentrują się na taksonomizacji obiektów w środowisku.
Jego poznawczym modus operandi jest selekcja, rozumowanie i synteza:
oferty na które postrzeżeniowo reaguje aspirują do ogólności przekraczającej gatunek czy rodzaj obiektu. Oferty te reprezentują nigdy nie
widziany, niemniej realny archetyp rzeczywistego obiektu.
Dobór naturalny i ludzie, którzy stworzyli oferty archetypowe zadbali o to, by wyzwalały one działania ekotypu platońskiego na „to, co
naprawdę jest” w środowisku. Otoczenie poznawcze inżyniera standaryzuje zarówno podmiot, jak i przedmiot poznania, eliminując wszelkie
specyficzne cechy i osobliwości obiektów w środowisku: one nigdy nie
są reprezentowane przez oferty archetypowe.
Osobliwości eliminowane przez oferty archetypowe dotyczą nie tylko obiektów, lecz również obserwatorów: inżynierowie pozbawieni są
poznawczych odchyleń, emocjonalnych dziwactw czy nawet osobowych
profili, tak charakterystycznych dla ekspertów.
Mocną stroną ekotypu platońskiego jest umiejętność podjęcia działania w stosunku do indywidualnego obiektu, które będzie działaniem
reprezentatywnym dla całej klasy obiektów, a nie dla jednostkowego elementu tej klasy. Pozwala to realizować ideał ekonomii poznania, czyli
skrajnie standaryzować bodźce poznawcze, nie dopuszczając do zaatakowania systemów percepcyjnych zbyt dużą ilością informacji.
Piętą achillesową ekotypu platońskiego jest natura samego środowiska: przyroda rzadko się powtarza, zmienność obiektów i zdarzeń jest
regułą, a nie wyjątkiem.
Ekotypy poznawcze człowieka
93
Cechą ambiwalentną w ocenie jest — od strony podmiotu poznania — marginalizacja zmienności międzyosobniczej, czyli minimalizacja
roli ‘teorii umysłu’: subiektywnie konstruowane stany mentalne, fenomenalne aspekty przeżyć nie pojawiają się w odpowiedzi na oferty archetypowe. W zachowaniu ekotypu platońskiego dominują behawioralne automatyzmy. Patologicznymi wariantami tego ekotypu jest zespół
Aspergera i autyzm.
Wartość epistemiczna prawdy, ucieleśniona podczas wytwarzania
ofert archetypowych, wymaga idealizacji tych ofert: ekotyp platoński
ma nawyk upraszczania rzeczywistości ponad miarę, reprezentowania
środowiska po to, by wydobyć jego esencję na poziomie otoczenia poznawczego. Inżynier posługuje się — w dominującym zakresie — własną
głową.
Z kolei w świecie wyrobnika, w pracy którego dominuje rola rąk,
który odczytuje tylko zracjonalizowane procedury autorstwa inżyniera, oferty ucieleśniają wartość epistemiczną neutralności. Wartość ta
pozwala środowisku „mówić za siebie” i eliminuje mentalne projekcje
podmiotu w fazie tworzenia i odbierania ofert. Ideałem stała się instrumentalizacja ofert, czyli działanie pod ich wpływem w sposób
mechaniczny, nie zapośredniczony udziałem umysłu człowieka. Oferty wydobywające wartość neutralności możemy określić mianem ofert
monotypowych, czyli identycznych z własnościami przedmiotów w środowisku. O ile oferty archetypowe nakierowywały działania podmiotu
na typy obiektów, oferty monotypowe nakierowują działania na indywidualne obiekty.
Działania realizowane przez wyrobnika — sportretowanego przez
Charliego Chaplina w „Dzisiejszych czasach” — koncentrują się na
instrumentalizacji metod zbierania danych o obiektach w środowisku.
Metody te tworzą z podmiotu poznania ekotyp kartezjański, którego modus operandi jest przede wszystkim definiowany negatywnie: powstrzymywanie osobistych celów, ambicji i zapatrywań, oraz genialna
samokontrola na etapie tworzenia ofert, i brak jakiejkolwiek interpretacji na etapie odbierania ofert.
Ekotyp kartezjański ma także swoją mocną stronę: w jego otoczeniu
spekulacje o typach obiektów zostają zastąpione szczegółową obserwacją indywidualnych obiektów. Ideałem zdolności poznawczych wyrobnika byłaby fotograficzna pamięć.
Wszystkie trzy ekotypy — heideggerowski, platoński i kartezjański
— mimo wielu różnic, łączy jedna cecha: obojętnie jak mocno zmieniała
się ofertowa struktura otoczenia (prototypowe, archetypowe i monotypowe) i według jakiej reguły oferty wydobywały wiedzę o środowisku —
konstrukcji, reprezentacji czy instrumentalizacji — oferty, kształtujące
94
Maciej Błaszak
ekotypy, były już ukształtowane w momencie postrzegania ich i podejmowania działań. Otoczenie wszystkich trzech ekotypów jest względnie stabilne, wytworzone w trakcie wcześniejszych działań tego samego
podmiotu (ekspert) lub innych podmiotów (inżynier, wyrobnik). Działania człowieka zmieniały jego środowisko tak, by wytworzyć typy otoczenia pasujące do możliwości poznawczych podmiotu, niemniej gdy
do aktu poznawczego eksperta, inżyniera i wyrobnika dochodziło, oferty na które reagowali w swoim otoczeniu już tam były — podmiot je
zastawał.
W ciągu ostatnich dwudziestu lat pojawił się nowy typ otoczenia,
w którym akt poznawczy podmiotu nie tyle polega na podejmowaniu
działań na istniejące już typy ofert, co na tworzeniu ofert podczas samego działania. Oferty tego typu — nazwiemy je quasitypowymi — nie
mają informować podmiotu o środowisku w którym funkcjonuje, o jego
typowych obiektach (archetypowe), indywidualnych obiektach (monotypowe), czy podobieństwach rodzinnych między obiektami (prototypowe), co raczej za ich pomocą podmiot poznania ma dopiero stworzyć
obiekty środowiska. Oferty quasitypowe muszą być zatem narzędziami
służącymi do tworzenia i modyfikacji obiektów poznania.
Współrzędna według której oferty quasitypowe tworzą — a nie wydobywają — wiedzę o środowisku może być nazwana interaktywną:
modus operandi podmiotu tworzącego takie oferty — nazwijmy go ekotypem normanowskim7 — jest manipulacja, przybierająca w świetle badań kognitywistycznych wiele postaci (na przykład widzenia dla
działania z teorii Milnera-Goodale’a). Oferty quasitypowe mogą mieć
postać wirtualną i umożliwiać nawigację pomiędzy zbiorami danych
(klasyczny layout komputerowy), lub postać haptyczną pozwalającą
modyfikować fizyczne obiekty w czasie rzeczywistym (badania w zakresie ubiquitous computing).
Manipulowanie ofertami — wirtualnymi i haptycznymi — pozwala
podmiotowi stworzyć kolekcję ‘roboczych obiektów’ środowiska, czyli
tych, które są stwarzane, a nie odkrywane. Rola obserwacji w rozumieniu adaptacyjnej roli tych obiektów schodzi na plan dalszy — jej miejsce
zajmuje interwencja w świat, ustalająca co tak naprawdę w świecie istnieje i do czego może zostać użyte. W otoczeniu ofert już istniejących
(pierwsze trzy ekotypy) za realne było uważane to, co możliwie dobrze
wyjaśnia strukturę środowiska, jego typy, indywidua i podobieństwa
rodzinne. W otoczeniu ofert tworzonych podczas działania, za realne
uważa się to, co jest skuteczne w tym środowisku, co może być użyte
Donald Norman jest pionierem badań nad procesami poznawczymi człowieka w kontekście użycia interaktywnych narzędzi.
7
Ekotypy poznawcze człowieka
TABELA 1. Typologia ekotypów poznawczych człowieka
wartość
ekspertyza
prawda
neutralność
epistemiczna
oferty
prototypowe
archetypowe
monotypowe
współrzędna
konstrukcyjna
reprezentacyjna instrumentalna
wydobywania/ tworzenia
wiedzy
o środowisku
ekotyp
heideggerowski platoński
kartezjański
poznawczy
kompetencje
rozpoznawanie selekcja, rofotograficzna
poznawcze
wzorców
zumowanie,
pamięć
synteza
obiekt
rodzina
typ obiektu
indywidualny
poznania
obiektów
obiekt
95
kreatywność
quasitypowe
interakcyjna
normanowski
manipulacja
roboczy
obiekt
do realizacji określonego poznawczego celu.
Ekotyp normanowski jest hybrydową istotą, tworzącą w trakcie podejmowanych działań epistemiczną wartość kreatywności. Realizuje własne cele poznawcze, ale zapożycza wiele od eksperta — intensyfikuje
jego kompetencje projektanta, wytrwałość wyrobnika, ambicje artysty.
Typologię proponowanych ekotypów poznawczych człowieka, wraz
z ich charakterystyką ujmijmy w formie tabeli (por. tabela 1).
Literatura
Bennett, Ch. (2003). How to define complexity in physics, and why.
W: N. H. Gregersen (red.) From complexity to life. Oxford: Oxford University
Press, s. 34–43.
Bennett, Ch. (1987). Demons, engines and the second law. Scientific American, November, s. 108–116.
Calude, C. S. (2007). Randomness and complexity: from Leibniz to Chaitin. New Jersey: World Scientific Publishing Company.
Csikszentmihalyi, M. (2005). Przepływ. Psychologia optymalnego doświadczenia. Taszów: Biblioteka Moderatora, przekład Magdaleny Wajdy-Kacmajor.
Daston, L., P. Galison (2007). Objectivity. New York: Zone Books.
Friberg, L. (1991). Auditory and language processing. W: Lassen, N., Ingvar, D., Raichle, M., Friberg, L. (red.) Brain Work and Mental Activity.
Alfred Benzon Symposium 31, Copenhagen: Munksgaard, s. 44.
Gibson, J.J. (1966). The Senses Considered as Perceptual Systems. Boston, MA: Houghton Mifflin.
Gibson, J.J. (1979). The Ecological Approach to Visual Perception. Boston, MA: Houghton Mifflin.
Harper, D. (1992). Working knowledge. Skill and community in a small
shop. Berkeley: University of California Press
Hayes, B. (2006). Reverse Engineering. American Scientist 94, s. 107–111.
96
Maciej Błaszak
Landauer, R. (1961). Irreversibility and Heat Generation In Computing
Process. IBM Journal of Research and Development 3, s. 183–191.
Levi-Strauss, C. (1969). Myśl nieoswojona. Warszawa: PWN.
Schön D. A. (1983). The reflective practitioner: how professionals think in
action. New York: Basic Books.
Sokoloff, L. (1999). Energetics of functional activation in neural tissues.
Neurochemical Research 24, No. 2, s. 321–329.
Von Uexkull, J. (1985). Environment (Umwelt) and the inner world of
animals. W: G. M. Burghardt (red.) Foundations of comparative ethology.
New York: Van Nostrand Reinhold, s. 222–245.
Poznań 2009
Download