Predykcyjna teoria umysłu

advertisement
Dr hab. Marcin Miłkowski, IFiS PAN
PREDYKCYJNA TEORIA UMYSŁU
Czego można się spodziewać?
 Umysł jako maszyna predykcyjna
 Hierarchiczne wnioskowania bayesowskie
 Problemy koncepcji predykcyjnej
Mózg bayesowski
 Karl Friston (ur. 1959):
 Hierarchiczne kodowanie
predykcyjne to aproksymacja (?) trudnego
obliczeniowo wnioskowania bayesowskiego.
 Mózg minimalizuje tzw. swobodną energię, czyli
zaskoczenie nowymi informacjami.
 Ogólna teoria myślenia i działania.
Teoria hierarchicznego
kodowania predykcyjnego
 Mózgi przewidują przyczyny aktualnych
wejść zmysłowych i minimalizują błędy takich
przewidywań:
 zmieniając przewidywania na temat wejść
zmysłowych lub
 zmieniając świat.
 Jednolita teoria percepcji i działania (A. Clark
2013)
Przewidywania
probabilistyczne
 Wewnętrzne modele generują
przewidywania.
 Przewidywania te odbiegają od
rzeczywistości.
 Zadaniem umysłu jest minimalizacja tej
rozbieżności przez zmianę
prawdopodobieństw w modelu lub
rzeczywistości.
 Umysł = narzędzie minimalizacji błędu
przewidywania
Przykład: model
wyprzedzający ruchu

Martin J. Pickering, Andy Clark, Getting ahead: forward models and their place in
cognitive architecture, „Trends in Cognitive Sciences”, t. 18, nr 9, 2014, s. 451 - 456
Kodowanie predykcyjne
 W informatyce stosowane do kompresji
obrazu: koduje się tylko różnice w stosunku
do poprzedniej klatki; co do reszty zakłada
się, że jest taka sama.
 Innymi słowy, liczy się tylko różnica wobec
tego, co można przewidzieć.
 W dziedzinie percepcji: model przewiduje, co
będzie widać. Różnice w stosunku do
przewidywań służą do zmiany modelu.
Kodowanie predykcyjne
 Tradycyjne modele percepcji (np. Marra) są
oddolne (bottom-up), tj. zakładają budowanie
złożonej reprezentacji z bodźców
zmysłowych.
 Kodowanie predykcyjne polega raczej na
tworzeniu przewidywania, które obejmuje
m.in. pobudzenia receptorów – i
sprawdzaniu, czy się ono zgadza.
 W tym sensie jest to model odgórny (topdown).
Powrót do Kanta?
 I. Kant (1724-1804): koncepcja
poznania zmysłowego jako
opartego na pojęciach i
naoczności.
 Myśli bez naoczności (zmysłów) byłyby puste,
a naoczności bez pojęć – ślepe.
 W wersji neokantowskiej: nie poznajemy
samego świata, tylko naszą ideę świata, którą
tylko modyfikujemy w razie oporu.
Problem z kantyzmem
 Kant argumentował, że poznać możemy tylko
zjawiska, a nie rzeczy same w sobie.
 Ale podstawowy argument na rzecz jego stanowiska
jest niepoprawny formalnie.
 Możemy poznać rzeczy tylko takie, jakie się nam jawią.
 Zatem nie możemy poznać ich takimi, jakie są same w
sobie.
 Tylko że drugie zdanie nie wynika z pierwszego.
 Największym problemem kantyzmu było
powiedzenie, co jest przyczyną pobudzeń
zmysłowych. Bo nie mogły to być rzeczy same w
sobie…
Aktywne wnioskowanie
 Kodowanie predykcyjne regulujące działanie:
modele generują przewidywania dotyczące
reakcji priopriocepcyjnej.
 Rozbieżności wobec przewidywań eliminuje
się przez realizację działania, nie aktualizację
modelu.
 Dlatego przewidywania służą jako instrukcje
motoryczne.
Minimalizacja wolnej energii
 W najogólniejszym sformułowaniu teorii
predykcyjnej (u Fristona) zadaniem układu
samoorganizującego jest minimalizacja wolnej
energii.
 Wolna energia
w sensie
statystycznoinformacyjnym:
rozbieżność
między informacją
w systemie
a faktami
Minimalizacja wolnej energii
 Im lepiej układ dopasowany do otoczenia,
tym mniejszą ma wolną energię.
 Dobre modele pozwalają zachować strukturę
i organizację, a więc też pozwalają unikać
dużego wzrostu entropii [też w sensie
informacyjnym].
 Ta zasada dotyczy nie tylko mózgu, ale
całego organizmu, łącznie z jego fizycznym
kształtem.
Hierarchiczne wnioskowania
bayesowskie
 Aktualizacja prawdopodobieństw uprzednich
(priors) dla wnioskowań bayesowskich na
podstawie świadectw empirycznych to
problem NP-zupełny.
 Innymi słowy, wymaga czasu większego niż
wykładniczy, czyli nie jest to algorytm
praktycznie obliczalny.
 Dlatego „płaskie” modele bayesowskie
byłyby zupełnie nierealistyczne w stosunku
do mózgu.
Hierarchiczne modele
bayesowskie
 NP-zupełność dotyczy złożoności
obliczeniowej w pesymistycznym przypadku.
 Co więcej, dla mniejszego zbioru danych
wejściowych problemy NP-zupełne mogą być
praktycznie obliczalne.
 Jeśli więc aktualizuje się pojedyncze
prawdopodobieństwo, to nie ma problemu.
 I temu ma służyć hierarchia modeli (idea
Karla Fristona).
Hierarchiczne modele
bayesowskie
 Model wyższego poziomu generuje
przewidywania dotyczące wyników modelu
niższego poziomu.
 Model niższego poziomu przesyła do modelu
wyższego poziomu tylko informacje o
błędzie.
 W całej hierarchii przesyłane są tylko takie
informacje o błędzie (czyli tzw. zaskoczeniu).
Umysł probabilistyczny
 Modele generatywne mają postać rozkładów
prawdopodobieństw, a więc ich natura jest
statystyczna.
 Dotyczy to także układu nerwowego, który
ma wg tej teorii funkcje wnioskowania
statystycznego.
 Ale dostępne świadectwa nie dotyczą
mikrostruktury układu nerwowego…
Zastosowania koncepcji
 Istnieją modele dotyczące percepcji
wzrokowej, w tym rywalizacji dwuocznej,
złudzeń; urojeń i halucynacji; neuronów
lustrzanych; snów; psychoz; wyboru
działania; histerii…
 Większość ma jednak naturę bardzo ogólnych
szkiców wnioskowania statystycznego.
Problemy koncepcji
predykcyjnej
 Dwa podstawowe zarzuty wobec koncepcji
Clarka i Fristona:
 Problem ciemnego pokoju
 Problem ciągłego bólu
 Oraz zarzuty mechanicystów:
 Bayesizm jest biologicznie niewiarygodny.
 Bayesizm jest nieobalalny i nie ma treści
empirycznej.
Problem ciemnego pokoju
 Błędy można równie dobrze zminimalizować,
po prostu minimalizując bodźce zmysłowe.
 Wystarczy przejść do pustego, ciemnego i
cichego pokoju.
 Tam będzie prawie brak bodźców.
 Ale tak umysł nie działa!
Problem ciemnego pokoju
 Odpowiedź predykcjonistów:
 Nasz organizm (fenotyp) ma wrodzone wartości
prawdopodobieństw uprzednich, zgodnie z
którymi brak pobudzeń jest skrajnie mało
prawdopodobny (maksymalnie zaskakujący).
 Dlatego organizmy nie starają się eliminować
pobudzeń zmysłowych, bo to jest mało
prawdopodobne.
 Ale czy to nie jest ad hoc?
 Przecież czasem chcemy spać lub uciec!
Problem ciągłego bólu
 Wzmocniony problem ciemnego pokoju: jeśli
postawić szczura na siatce, która razi go
prądem, to czemu zeskakuje?
 Przecież po chwili powinien przewidzieć, że
porażenie będzie trwało.
 Nie można twierdzić, że chcemy unikać bólu,
bo to wrodzone.
 Ostre potrawy bywają smaczne.
 Wysiłek sportowy bywa bolesny.
Ogólna postać problemu
 Dlaczego organizm ma zmieniać swój stan,
który jest dla niego szkodliwy?
 Dlaczego ma poszukiwać interesujące
bodźce?
 Innymi słowy, dlaczego raz ma zmieniać
rozkład prawdopodobieństw w modelu, a raz
tylko świat?
Bayesizm jest biologicznie
niewiarygodny.
 Nie wszystkie części mózgu są hierarchicznie
zbudowane (kora to nie wszystko!):
 Są neurony „milczące”, które prawie nigdy nie




odpalają.
Istnieją neurony oscylujące (modulujące resztę).
Istnieją neuromodulatory.
Istnieje ośrodek limbiczny (i procesy
emocjonalne).
Istnieją też heterarchie: bardziej złożone układy
połączeń.
Kłopot z modelami
predykcyjnymi
 Większość modeli predykcyjnych istnieje
tylko w postaci ogólnikowych równań. Nie
można więc łatwo sprawdzić, czy
rzeczywiście odpowiadają danym
eksperymentalnym.
 Brak szczegółowych hipotez dotyczących
architektury umysłu. Same ogólniki.
Bayesizm jest nieobalalny.
 Bowers i Davis (2012): modele bayesowskie
zawsze dostosują się do danych.
 Arbitralnie dobiera się po prostu wartości
prawdopodobieństw. Zawsze jakieś będą pasować.
 Brak bezpośredniego świadectwa neurologicznego na
niskim poziomie.
 Teorie predykcyjne opierają się na racjonalnej analizie,
a nie na eksperymentalnym badaniu mechanizmów.

Bowers, Jeffrey S i Colin J Davis. 2012. Bayesian just-so stories in
psychology and neuroscience. „Psychological bulletin” 138 (3): 389–414.
doi:10.1037/a0026450.
Podsumowanie
 Predykcyjne ujęcie umysłu to propozycja
jednolitej teorii percepcji i działania, na wielu
poziomach organizacji mózgu-umysłu.
 Można je postrzegać jako pewien rodzaj
neokantowskiej wizji poznania, ale opartej na
współczesnej fizyce, neurobiologii i
psychologii.
Podsumowanie
 Brak jednak bezpośrednich świadectw
neuropsychologicznych, a można mieć
wątpliwości, czy w ogóle tak złożony układ
jak mózg może mieć tak prostą jednolitą
teorię.
 Największe wątpliwości nie dotyczą tego, czy
istnieją modele generatywne, tylko czy sama
zasada aktywnego wnioskowania jest
informatywna.
Dalsze lektury
 Clark, Andy. 2013. Whatever next?
Predictive brains, situated agents, and the
future of cognitive science. „The
Behavioral and brain sciences” 36 (3):
181–204.
doi:10.1017/S0140525X12000477.
 Hohwy, Jakob. 2013. The predictive mind.
New York, Oxford University Press.
 Jones, Matt i Bradley C. Love. 2011.
Bayesian Fundamentalism or
Enlightenment? On the explanatory status
and theoretical contributions of Bayesian
models of cognition. „Behavioral and
Brain Sciences” 34 (04): 169–188.
doi:10.1017/S0140525X10003134.
Download