Dr hab. Marcin Miłkowski, IFiS PAN PREDYKCYJNA TEORIA UMYSŁU Czego można się spodziewać? Umysł jako maszyna predykcyjna Hierarchiczne wnioskowania bayesowskie Problemy koncepcji predykcyjnej Mózg bayesowski Karl Friston (ur. 1959): Hierarchiczne kodowanie predykcyjne to aproksymacja (?) trudnego obliczeniowo wnioskowania bayesowskiego. Mózg minimalizuje tzw. swobodną energię, czyli zaskoczenie nowymi informacjami. Ogólna teoria myślenia i działania. Teoria hierarchicznego kodowania predykcyjnego Mózgi przewidują przyczyny aktualnych wejść zmysłowych i minimalizują błędy takich przewidywań: zmieniając przewidywania na temat wejść zmysłowych lub zmieniając świat. Jednolita teoria percepcji i działania (A. Clark 2013) Przewidywania probabilistyczne Wewnętrzne modele generują przewidywania. Przewidywania te odbiegają od rzeczywistości. Zadaniem umysłu jest minimalizacja tej rozbieżności przez zmianę prawdopodobieństw w modelu lub rzeczywistości. Umysł = narzędzie minimalizacji błędu przewidywania Przykład: model wyprzedzający ruchu Martin J. Pickering, Andy Clark, Getting ahead: forward models and their place in cognitive architecture, „Trends in Cognitive Sciences”, t. 18, nr 9, 2014, s. 451 - 456 Kodowanie predykcyjne W informatyce stosowane do kompresji obrazu: koduje się tylko różnice w stosunku do poprzedniej klatki; co do reszty zakłada się, że jest taka sama. Innymi słowy, liczy się tylko różnica wobec tego, co można przewidzieć. W dziedzinie percepcji: model przewiduje, co będzie widać. Różnice w stosunku do przewidywań służą do zmiany modelu. Kodowanie predykcyjne Tradycyjne modele percepcji (np. Marra) są oddolne (bottom-up), tj. zakładają budowanie złożonej reprezentacji z bodźców zmysłowych. Kodowanie predykcyjne polega raczej na tworzeniu przewidywania, które obejmuje m.in. pobudzenia receptorów – i sprawdzaniu, czy się ono zgadza. W tym sensie jest to model odgórny (topdown). Powrót do Kanta? I. Kant (1724-1804): koncepcja poznania zmysłowego jako opartego na pojęciach i naoczności. Myśli bez naoczności (zmysłów) byłyby puste, a naoczności bez pojęć – ślepe. W wersji neokantowskiej: nie poznajemy samego świata, tylko naszą ideę świata, którą tylko modyfikujemy w razie oporu. Problem z kantyzmem Kant argumentował, że poznać możemy tylko zjawiska, a nie rzeczy same w sobie. Ale podstawowy argument na rzecz jego stanowiska jest niepoprawny formalnie. Możemy poznać rzeczy tylko takie, jakie się nam jawią. Zatem nie możemy poznać ich takimi, jakie są same w sobie. Tylko że drugie zdanie nie wynika z pierwszego. Największym problemem kantyzmu było powiedzenie, co jest przyczyną pobudzeń zmysłowych. Bo nie mogły to być rzeczy same w sobie… Aktywne wnioskowanie Kodowanie predykcyjne regulujące działanie: modele generują przewidywania dotyczące reakcji priopriocepcyjnej. Rozbieżności wobec przewidywań eliminuje się przez realizację działania, nie aktualizację modelu. Dlatego przewidywania służą jako instrukcje motoryczne. Minimalizacja wolnej energii W najogólniejszym sformułowaniu teorii predykcyjnej (u Fristona) zadaniem układu samoorganizującego jest minimalizacja wolnej energii. Wolna energia w sensie statystycznoinformacyjnym: rozbieżność między informacją w systemie a faktami Minimalizacja wolnej energii Im lepiej układ dopasowany do otoczenia, tym mniejszą ma wolną energię. Dobre modele pozwalają zachować strukturę i organizację, a więc też pozwalają unikać dużego wzrostu entropii [też w sensie informacyjnym]. Ta zasada dotyczy nie tylko mózgu, ale całego organizmu, łącznie z jego fizycznym kształtem. Hierarchiczne wnioskowania bayesowskie Aktualizacja prawdopodobieństw uprzednich (priors) dla wnioskowań bayesowskich na podstawie świadectw empirycznych to problem NP-zupełny. Innymi słowy, wymaga czasu większego niż wykładniczy, czyli nie jest to algorytm praktycznie obliczalny. Dlatego „płaskie” modele bayesowskie byłyby zupełnie nierealistyczne w stosunku do mózgu. Hierarchiczne modele bayesowskie NP-zupełność dotyczy złożoności obliczeniowej w pesymistycznym przypadku. Co więcej, dla mniejszego zbioru danych wejściowych problemy NP-zupełne mogą być praktycznie obliczalne. Jeśli więc aktualizuje się pojedyncze prawdopodobieństwo, to nie ma problemu. I temu ma służyć hierarchia modeli (idea Karla Fristona). Hierarchiczne modele bayesowskie Model wyższego poziomu generuje przewidywania dotyczące wyników modelu niższego poziomu. Model niższego poziomu przesyła do modelu wyższego poziomu tylko informacje o błędzie. W całej hierarchii przesyłane są tylko takie informacje o błędzie (czyli tzw. zaskoczeniu). Umysł probabilistyczny Modele generatywne mają postać rozkładów prawdopodobieństw, a więc ich natura jest statystyczna. Dotyczy to także układu nerwowego, który ma wg tej teorii funkcje wnioskowania statystycznego. Ale dostępne świadectwa nie dotyczą mikrostruktury układu nerwowego… Zastosowania koncepcji Istnieją modele dotyczące percepcji wzrokowej, w tym rywalizacji dwuocznej, złudzeń; urojeń i halucynacji; neuronów lustrzanych; snów; psychoz; wyboru działania; histerii… Większość ma jednak naturę bardzo ogólnych szkiców wnioskowania statystycznego. Problemy koncepcji predykcyjnej Dwa podstawowe zarzuty wobec koncepcji Clarka i Fristona: Problem ciemnego pokoju Problem ciągłego bólu Oraz zarzuty mechanicystów: Bayesizm jest biologicznie niewiarygodny. Bayesizm jest nieobalalny i nie ma treści empirycznej. Problem ciemnego pokoju Błędy można równie dobrze zminimalizować, po prostu minimalizując bodźce zmysłowe. Wystarczy przejść do pustego, ciemnego i cichego pokoju. Tam będzie prawie brak bodźców. Ale tak umysł nie działa! Problem ciemnego pokoju Odpowiedź predykcjonistów: Nasz organizm (fenotyp) ma wrodzone wartości prawdopodobieństw uprzednich, zgodnie z którymi brak pobudzeń jest skrajnie mało prawdopodobny (maksymalnie zaskakujący). Dlatego organizmy nie starają się eliminować pobudzeń zmysłowych, bo to jest mało prawdopodobne. Ale czy to nie jest ad hoc? Przecież czasem chcemy spać lub uciec! Problem ciągłego bólu Wzmocniony problem ciemnego pokoju: jeśli postawić szczura na siatce, która razi go prądem, to czemu zeskakuje? Przecież po chwili powinien przewidzieć, że porażenie będzie trwało. Nie można twierdzić, że chcemy unikać bólu, bo to wrodzone. Ostre potrawy bywają smaczne. Wysiłek sportowy bywa bolesny. Ogólna postać problemu Dlaczego organizm ma zmieniać swój stan, który jest dla niego szkodliwy? Dlaczego ma poszukiwać interesujące bodźce? Innymi słowy, dlaczego raz ma zmieniać rozkład prawdopodobieństw w modelu, a raz tylko świat? Bayesizm jest biologicznie niewiarygodny. Nie wszystkie części mózgu są hierarchicznie zbudowane (kora to nie wszystko!): Są neurony „milczące”, które prawie nigdy nie odpalają. Istnieją neurony oscylujące (modulujące resztę). Istnieją neuromodulatory. Istnieje ośrodek limbiczny (i procesy emocjonalne). Istnieją też heterarchie: bardziej złożone układy połączeń. Kłopot z modelami predykcyjnymi Większość modeli predykcyjnych istnieje tylko w postaci ogólnikowych równań. Nie można więc łatwo sprawdzić, czy rzeczywiście odpowiadają danym eksperymentalnym. Brak szczegółowych hipotez dotyczących architektury umysłu. Same ogólniki. Bayesizm jest nieobalalny. Bowers i Davis (2012): modele bayesowskie zawsze dostosują się do danych. Arbitralnie dobiera się po prostu wartości prawdopodobieństw. Zawsze jakieś będą pasować. Brak bezpośredniego świadectwa neurologicznego na niskim poziomie. Teorie predykcyjne opierają się na racjonalnej analizie, a nie na eksperymentalnym badaniu mechanizmów. Bowers, Jeffrey S i Colin J Davis. 2012. Bayesian just-so stories in psychology and neuroscience. „Psychological bulletin” 138 (3): 389–414. doi:10.1037/a0026450. Podsumowanie Predykcyjne ujęcie umysłu to propozycja jednolitej teorii percepcji i działania, na wielu poziomach organizacji mózgu-umysłu. Można je postrzegać jako pewien rodzaj neokantowskiej wizji poznania, ale opartej na współczesnej fizyce, neurobiologii i psychologii. Podsumowanie Brak jednak bezpośrednich świadectw neuropsychologicznych, a można mieć wątpliwości, czy w ogóle tak złożony układ jak mózg może mieć tak prostą jednolitą teorię. Największe wątpliwości nie dotyczą tego, czy istnieją modele generatywne, tylko czy sama zasada aktywnego wnioskowania jest informatywna. Dalsze lektury Clark, Andy. 2013. Whatever next? Predictive brains, situated agents, and the future of cognitive science. „The Behavioral and brain sciences” 36 (3): 181–204. doi:10.1017/S0140525X12000477. Hohwy, Jakob. 2013. The predictive mind. New York, Oxford University Press. Jones, Matt i Bradley C. Love. 2011. Bayesian Fundamentalism or Enlightenment? On the explanatory status and theoretical contributions of Bayesian models of cognition. „Behavioral and Brain Sciences” 34 (04): 169–188. doi:10.1017/S0140525X10003134.