Twórczość, Intuicja, Mózgi i Komputery Włodzisław Duch & Co Katedra Informatyki Stosowanej, Uniwersytet Mikołaja Kopernika, Toruń Google: W. Duch PTI 12.10.2007 Plan 1. 2. 3. 4. 5. 6. 7. 8. 9. Informatyka neurokognitywna: ilustracja Badania kreatywności: psychologia i neuronauki. Intuicja i wgląd. Rzut oka na neurokognitywny model wyższych czynności psychicznych. Słowa w mózgu i ich komputerowe modele. Przykłady zastosowań: tworzenie nowych słów, zagadki i gry słowne. Wymyślanie nowych idei. Program badań nad kreatywnością. Przyszłość. Neurokognitywna informatyka Computational cognitive neuroscience: szczegółowe modele funkcji poznawczych i neuronów, pierwsza doroczna konferencja 11/2005. Informatyka neurokognitywna: uproszczone modele wyższych czynności poznawczych, myślenia, rozwiązywania problemów, uwagi, języka, kontroli zachowania i świadomości => praktyczne algorytmy. Wiele spekulacji, ponieważ nie znamy szczegółów procesów zachodzących w mózgu, ale modele jakościowe wyjaśniające przyczyny syndromów neuropsychologicznych oraz chorób psychicznych rozwijają się szybko od ~ 10 lat tj. od 1995 roku. Nawet proste mózg-podobne przetwarzanie informacji daje podobne rezultaty => złożoność mózgu nie jest głównym problemem! Brain As Complex System (BRACS, EU Project) centralne założenie: najważniejsza jest ogólna neuroanatomiczna struktura kory i obszarów podkorowych mózgu, należy ją w modelach zachować. “Roadmap to human level intelligence” , WD + John Taylor (KCL). Neurony pobudzające i hamujące Kwas glutaminowy otwiera kanały Na+, pobudzająco, GABA działa na kanały Cl- hamując pobudzanie. Siatkówka • • • • Siatkówka nie jest pasywną matrycą rejestrującą obrazy. Kluczowa zasada: wzmacnianie kontrastów podkreślających zmiany w przestrzeni i czasie, wzmacnianie krawędzi, jednolicie oświetlone obszary są mniej istotne. Fotoreceptory w czopkach i pręcikach, 3-warstwowa sieć, komórki zwojowe =>LGN. Pole recepcyjne: obszar, który pobudza daną komórkę. Kombinacja sygnałów w siatkówce daje pola recepcyjne typu centrum-otoczka (on-center) i odwrotnie, wykrywa krawędzie. Każde z pól indywidualnych komórek można modelować Gaussem, więc takie pola otrzymuje się jako różnicę (DOG). Wzrok • Z siatkówki przez ciało kolankowate boczne (część wzgórza) informacja trafia do pierwotnej kory wrokowej V1 i stamtąd wędruje dwiema drogami. Złożony model rozpoznawania Prezentacja dwóch obiektów, uwzględnia LGN, V1, V2, V4/IT, V5/MT Model ma dodatkowe dwie warstwy Spat1 połączone z V1 i Spat2 połączone z V2. Spat1 ma pobudzenia wewnątrz warstwy, skupia się na obiekcie. Przeniesienie uwagi z jednego obiektu na drugi jeśli wszystko dobrze działa; łatwo badać możliwe problemy. Efekty ... Brak akomodacji neuronów spowoduje trudności z przeniesieniem uwagi, a w efekcie u dziecka: • skupienie tylko na jednym, absorbcje • schematyczne, powtarzalne ruchy • niechęć do zróżnicowanej stymulacji czy zabaw • brak kontaktu z opiekunem • trudności językowe • echolalię • traktowanie ludzi tak jak przedmioty • brak „teorii umysłu”, normalnych relacji Co to przypomina? Autyzm, lub podobne formy spektrum autyzmu 6:1000 dzieci. Zaburzenia budowy kanałów upływu? Istotnie, stwierdzono mutacje genów zarówno w kanałach potasowych (gen CASPR2) jak i sodowych (gen SCN2A): http://www.autismcalciumchannelopathy.com/ Najbardziej tajemnicze … Jakie cechy naszego umysłu są najbardziej tajemnicze? Świadomość? Wyobraźnia? Intuicja? Emocje, uczucia? Wyższe czynności psychiczne? Masao Ito (dyrektor RIKEN, neurofizjolog): kreatywność, tworzenie. Lady Lovelace (Turing 1950) napisała o projekcie maszyny analitycznej Babbage'a „Nie ma ona pretensji by cokolwiek zapoczątkować samemu a robi tylko to, co się jej każe”. MIT Encyclopedia of Cognitive Sciences, 1100 stron. 6 artykułów na temat logiki, ponad 100 odwołań do logiki w indeksie. Kreatywność: 1 strona (+1 strona o „osobie twórczej”). Intuicja: 0, nie wymieniona w indeksie. W życiu codziennym częściej wykorzystujemy kreatywność niż logikę. O czym mówimy? Jak zdefiniować kreatywność? Bink & Marsh (2001): Liczba fachowych definicji pojęcia „kreatywność” równa jest liczbie podejść do studiowania tego zjawiska. M. Boden (1991): kreatywność to „a matter of using one’s computational resources to explore, and sometimes to break out of, familiar conceptual spaces.” Według niej można wyróżnić: H-creativity, twórcze idee nieznane dotąd w historii ludzkości; P-creativity, twórcze idee nowe dla agenta, który je wygenerował. E-creativity, twórczość opartą na eksploracji przestrzeni koncepcyjnych, inkrementalną, kombinatoryczną. T-creativity, transformacje podstaw koncepcyjnych, zmiany paradygmatu. Sternberg (Handbook of Human Creativity, 1998): „działania kreatywne wynikają ze zdolności znajdywania rozwiązań nowatorskich i stosownych do sytuacji”, a więc nie tylko nowych teorii i wynalazków, lecz również codziennych decyzji, rozumienia języka, interakcji między ludźmi. Badania kreatywności Rozważania nad zdolnościami twórczymi nadal są domeną filozofów i psychologów, np. pisał na ten temat Eysenck, Weisberg, czy Sternberg. M.A. Boden, The Creative Mind: Myths and Mechanisms (Abacus 1991). Theories of Creativity (Sage, 1990), red. M.A. Runco & S. Albert Handbook of Human Creativity (CUP, 1998), red. R.J. Sternberg Encyclopedia of creativity (Elsevier, 2005), red. M. Runco & S. Pritzke, 167 artykułów, ale nie zawiera testowalnych modeli komputerowych. Pisma: Creativity Research Journal, od 1988 r, LEA. Journal of Creative Behavior, od 1967 r, Creative Education Foundation. Powiązania: inteligencja, pomiary IQ, niezwykłe uzdolnienia, geniusz, psychopatalogie (cyklofrenia jest 10x częstsza u twórczych pisarzy niż średnia), intuicja, procesy wglądu (insight, Eureka lub Aha!), i inne. Psychologia kreatywności G. Wallas, The art of thought (1926): model rozwiązywania problemów w ramach psychologii postaci (Gestalt). 4 stadia: przygotowanie, inkubacja, iluminacja i weryfikacja. Model stosowany jest nadal do opisu kreatywnego rozwiązywania problemów przez jednostki i małe grupy ludzi. Rozszerzenia: dokładniejszy opis poszczególnych etapów, np. przygotowanie wymaga zauważenia problemu i sformułowania pytań, iluminację może poprzedzać okres frustracji, możliwe jest cofanie się, itd. Szczegółowy opis tego rodzaju uważany jest za centralne zadanie psychologii twórczości, ale dla zrozumienia jej mechanizmów nie wystarczy. Poincare (1948) uważał intuicję i kreatywność matematyczną za zdolność do rozróżnienia pomiędzy obiecującymi i mało przydatnymi ideami i ich kombinacjami, sugerując, że jest to wynikiem heurystycznych metod poszukiwania rozwiązań przy udziale wyobraźni przestrzennej, abstrakcji i przybliżonego rozumowania, co istotnie widać w fMRI (Dehaene, 1999). Intuicja Intuicja jest rzadko badana ale powszechnie wierzymy w jej istnienie. Najczęstsza definicja intuicji to „wiedza bez możliwości wyjaśnienia skąd to wiemy”. Definicja Sinclair & Ashkanasy (2005): intuicja to „non-sequential information-processing mode, which comprises both cognitive and affective elements and results in direct knowing without any use of conscious reasoning”. Testy psychologiczne intuicji wprowadził Wescott (1961), obecnie używane są testy Rational-Experiential Inventory (REI), Myers-Briggs Type Inventory (MBTI) oraz Accumulated Clues Task (ACT), ale ich wyniki są słabo skorelowane, mierząc inne aspekty intuicji. Stwierdzono korelację pomiędzy skalą intuicji REI a skalami kreatywności. Intuicja jest wynikiem złożonych ocen na podstawie podobieństwa, które trudno jest wyrazić w symboliczny (logiczny) sposób, oraz utajonego uczenia (implicit learning), zachodzącego w nieświadomy sposób – łatwa! Wglądy i mózgi Można badać aktywność mózgu w czasie rozwiązywania problemów, które wymagają wglądu lub które rozwiązywane są schematycznie. E.M. Bowden, M. Jung-Beeman, J. Fleck, J. Kounios, „New approaches to demystifying insight”. Trends in Cognitive Science 2005. Po rozwiązaniu problemu badani za pomocą EEG i fMRI sami określali, czy w czasie rozwiązywania pojawił się wgląd, czy nie. Około 300 ms przed pojawieniem się wglądu w zakręcie skroniowym górnym prawej półkuli (RH-aSTG) obserwowano salwę aktywności gamma. Interpretacja autorów: „making connections across distantly related information during comprehension ... that allow them to see connections that previously eluded them”. Moja: lewa półkula reprezentująca w STG konkretne obiekty nie może znaleźć pomiędzy nimi związku =>impas; prawa STG widzi jej aktywność na meta-poziomie, ogólne abstrakcyjne kategorie, które może powiązać; salwa gamma zwiększa jednoczesną aktywność reprezentacji w lewej półkuli, emocje Eureka konieczne są do utrwalenia bezpośrednich koneksji. Pamięć i kreatywność Mózgi osób kreatywnych reagują na więcej sygnałów dochodzących ze środowiska, nie blokują mocno sygnałów, które wcześniej były nieistotne, nie ulegając łatwo habituacji (Carson, 2003). Może się to wiązać z bogatszą reprezentacją koncepcji i sytuacji w umysłach osób kreatywnych. Podobne zachowania obserwowano u mnichów Zen. PRIMA, technika skojarzeń par słów pozwala badać, czy w mózgu danej osoby jest ścieżka, łącząca dane koncepcje. A. Gruszka, E. Nęcka, Creativity Research Journal 2002. Słowo 1 Torowanie 0,2 s Słowo 2 Słowa mogą być łatwe lub trudne do skojarzenia; słowa torujące mogą być pomocne lub neutralne; pomocne to skojarzenie semantyczne lub fonologiczne (hogse do horse); neutralne mogą być bezsensowne lub nie związane z prezentowaną parą. Rezultaty dla grupy ludzi silnie/słabo kreatywnych są zadziwiające … Skojarzenia i kreatywność Hipoteza: kreatywność zależy od pamięci skojarzeniowej, zdolności do łączenia odległych koncepcji ze sobą. Rezultat: kreatywność jest skorelowana ze zdolnością do skojarzeń i podatnością na torowanie; trudniejsze skojarzenia mają dłuższe latencje. Torowanie neutralne działa dziwnie: • dla prostych skojarzeń nonsensowne słowa torujące przeszkadzają osobom kreatywnym, pomagają reszcie; w pozostałych przypadkach pomagają! • dla odległych skojarzeń torowanie zawsze zwiększa siłę skojarzeń, u osób kreatywnych dając najsilniejszy efekt. Podobnie zagadkowe są wyniki dla czasów reakcji. Konkluzje autorów: Gęstsze połączenia => lepsze skojarzenia => większa kreatywność. Wyniki dla neutralnych słów torujących są niezrozumiałe. Architektura mózgopodobna Stany mózgu są czasoprzestrzennymi rozkładami pobudzeń tkanki neuronów. Procesy poznawcze operują na znacznie przetworzonych sygnałach dochodzących od zmysłów. • Czerwień, słodycz, ból ... to fizyczne (relacyjne) stany mózgu. • Widzę, słyszę i czuję tylko stany mózgu! Np. złudzenia optyczne. Kora: zbiór mikroobwodów, rezonatorów tworzących stany kolektywne, pojedyncze neurony mają niewielkie znaczenie. Aktywna część kory: pamięć robocza, całkiem odmienna od pamięci w komputerach. Rejestry komputera to nie są stany dynamiczne, które automatycznie prowadzą do skojarzeń. Metafora systemu dynamicznego Umysł/mózg jak system dynamiczny: • • • Thelen E. and Smith L.B. A Dynamic Systems Approach to the Development of Cognition and Action. MIT Press 1994. Smith L.B. and Thelen E, Eds. A Dynamic Systems Approach to the Development. MIT Press 1994. J. A. Scott Kelso, Dynamic Patterns. The Self-Organization of Brain and Behavior. MIT Press 1995 Jak połączyć neuro i psyche ? • • • R. Shepard (BBS, 2001): uniwersalne prawa należy sformułować w odpowiednich abstrakcyjnych przestrzeniach psychologicznych; próba uproszczenia neurodynamiki => geometryczne modele umysłu. K. Lewin, koncepcyjna reprezentacja i pomiary siły psychologicznych (1938), stan kognitywny jako ruch w p-ni fenomenologicznej. George Kelly (1955), personal construct psychology (PCP), geometria p-ni psychologicznych jako alternatywa dla logiki. Słowa w mózgu Eksperymenty psycholingwistyczne dotyczące mowy pokazują, że w mózgu mamy dyskretne reprezentacje fonologiczne, a nie akustyczne. Sygnał akustyczny => fonemy => słowa => koncepcje semantyczne. Aktywacje semantyczne następują 90 ms po fonologicznych (N200 ERPs). F. Pulvermuller (2003) The Neuroscience of Language. On Brain Circuits of Words and Serial Order. Cambridge University Press. Sieci działania – postrzegania, wnioski z badań ERP i fMRI. Fonologiczna gęstość otoczenia słowa = liczba słów brzmiących podobnie jak dane słowo, czyli dająca podobne pobudzenia mózgu. Semantyczna gęstość otoczenia słowa = liczba słów o podobnym znaczeniu (rozszerzona podsieć aktywacji). Słowa: prosty model Cele: • zrobić najprostszy model kreatywnego myślenia; • tworzyć interesujące nowe nazwy, oddające cechy produktów; • zrozumieć nowe słowa, których nie ma w słowniku. Model zainspirowany przez procesy zachodzące w mózgu w czasie wymyślania nowych słów. Dany jest zbiór słów kluczowych, które pobudzają korę słuchową. Fonemy (allofony) są rezonansami, uporządkowane pobudzenie fonemów aktywuje zarówno znane słowa jak i nowe kombinacje; kontekst + hamowanie w procesie zwycięzca bierze wszystko zostawia jedno słowo. Kreatywność = wyobraźnia (fluktuacje) + filtrowanie (konkurencja) Wyobraźnia: wiele chwilowych rezonansów powstaje równolegle, aktywując reprezentacje słów i nie-słów, zależnie od siły połączeń oscylatorów. Filtrowanie: skojarzenia, emocje, gęstość fonologiczna/semantyczna. Skojarzenia - powtórka Dlaczego torowanie neutralne dla prostych skojarzeń i nonsensownych słów torujących pogarsza wyniki osób kreatywnych? Słaba kreatywność = słabe skojarzenia (połączenia) miedzy oscylatorami; dodanie szumu (nonsensownych słów) wzmacnia już zachodzące oscylacje umożliwiając wzajemne pobudzenia, dla silniej połączonej sieci neuronowej i prostych skojarzeń prowadzi do zamieszania, gdyż pobudza wiele stanów. Dla trudnych skojarzeń dodawanie szumu u osób słabo kreatywnych nie pomoże ze względu na brak połączeń, słowa torujące powodują jedynie chaos. Dla osób kreatywnych wywołanie rezonansu miedzy odległymi mikroobwodami jest możliwe: mamy tu rezonans stochastyczny! Dla słów torujących ortograficznie podobnych przy bliskich skojarzeniach pobudza to aktywność reprezentacji drugiego słowa, zawsze zwiększając szansę rezonansu i skracając latencję. Nie pomaga to jednak dla odległych skojarzeń, nie pobudzając pośrednich obwodów, które muszą być aktywne by powstał rezonans, za to słowa nonsensowne wzmagają efekt torowania. Słowa: algorytm Jak to modelować? Sieci skojarzeniowe, model adaptacyjnego rezonansu (~ ARTWORD). Uproszczone modele sieci skojarzeniowych, modele statystyczne. • Utworzyć model sieci prawdopodobieństw łączących fonemy i sylaby • utworzyć funkcję oceny gęstości fonologicznej i semantycznej wyrazów. Algorytm szukania nowych słów: • • • • Przeczytać początkową pulę słów opisujących danych obiekt. Rozszerzyć ją o słowa skojarzone fonologicznie i semantycznie. Rozbić słowa na fragmenty składające się z fonemów, sylab, morfemów. Wyobraźnia: tworzyć kombinacje fragmentów zgodnie z rozkładami prawdopodobieństwa dla n-gramów. • Filtrowanie: utworzyć ranking na podstawie gęstości semantycznej wokół morfemów tworzących nowy wyraz. Słowa: eksperymenty List od przyjaciela: I am looking for a word that would capture the following qualities: portal to new worlds of imagination and creativity, a place where visitors embark on a journey discovering their inner selves, awakening the Peter Pan within. A place where we can travel through time and space (from the origin to the future and back), so, its about time, about space, infinite possibilities. FAST!!! I need it sooooooooooooooooooooooon. creativital, creatival (creativity, portal), używane creatival.com creativery (creativity, discovery), creativery.com (strategy+creativity) discoverity = {disc, disco, discover, verity} (discovery, creativity, verity) digventure ={dig, digital, venture, adventure} , nowe! imativity (imagination, creativity); infinitime (infinitive, time) infinition (infinitive, imagination), nazwa firmy journativity (journey, creativity) learnativity (taken, see http://www.learnativity.com) portravel (portal, travel); sportal (space, sport, portal), używane timagination (time, imagination); timativity (time, creativity) tivery (time, discovery); trime (travel, time) Gry słowne Gry słowne były popularne na długo przed komputerami ... Były bardzo przydatne do rozwoju zdolności analitycznego myślenia. Do niedawna słownych gier komputerowych było bardzo mało. Gra w 20 pytań może być kolejnym wielkim wyzwaniem AI, jest bardziej realistyczna niż nieograniczony test Turinga. Szachy są za proste – komputery szybko liczą, więc wygrywają. Maszyna, zgadująca o czym myślę, musi być inteligentna ... Znajdywanie dobrych pytań wymaga wiedzy i kreatywności. Pozwala na testowanie modeli pamięci semantycznej i pamięci epizodycznej w realistycznych warunkach. Inne zastosowania: identyfikacja obiektów na podstawie ich opisu, uściślanie zapytań dla wyszukiwarek internetowych itp. Potrzebna jest pamięć semantyczna na dużą skalę, miliony pojęć: ontologie, słowniki (Wordnet), encyklopedie, MindNet (Microsoft), projekty kolaboracyjne, np. Concept Net (MIT) … co się da. Nadal nie wystarczy ... przykład gry w 20 pytań. Zapytanie Pamięć semantyczna Zastosowania, np gra w 20 pytań. Magazynowanie Awatar, HIT: interfejs graficzny Oznaczanie części mowy i ekstrakcja frac weryfikacja Słowniki, ontologie, informacja tekstowa ręczne poporawki Parser Generator zagadek Pamięć semantyczną można użyć na wiele sposobów, np. do wymyślania zagadek, które prezentuje awatar. Wybieramy przypadkowe pojęcie z pamięci, szukamy minimalnego podzbioru cech potrzebnych do jego unikalnej definicji; jesli jest wiele takich podzbiorów wybieramy jedne z nich przypadkowo. Algorytm tworzy prawie nieskończenie wiele zagadek. Co to jest: płaz, pomarańczowy, ma czarne kropki? Salamandra. It has charm, it has spin, and it has charge. Jeśli nie wiesz to zapytaj Google! Strona o kwarkach będzie na górze. Reklama Czy kreatywność oparta jest na nieskrępowanej wyobraźni, braku reguł? Nie! Metody „anarchistyczne” – swobodne skojarzenia, burza mózgów, przypadkowa stymulacja, myślenie lateralne – wypadają w testach na kreatywność gorzej niż metody oparte na szablonach i abastrakcyjnych regułach. Eksperymenty z wymyślaniem reklam opisano w: Goldenberg, Mazursky i Solomon, Science 285, 1999. J. Goldenberg & D. Mazursky, Creativity in Product Innovation, CUP 2002 270 charakterystycznych cech (T) zebrano z reklam w pismach + 900 symboli (S) silnie kojarzących się z tymi cechami. Wybrano 3-4 najczęściej wymieniane symbole dla każdej cechy. Schemat Zamiany – powtarzaj: • Zdefiniuj cechę T dla produktu P. • Znajdź symbole S przywołujące na myśl cechy T. • Utwórz zbiór obiektów skorelowanych silnie z P. • Podstaw za aspekt A jednego z obiektów odpowiedni aspekt S. Reklama -wyniki Reklamy utworzone dzięki algorytmom opartym na schematach zostały ocenione na równi z najlepszymi działami ekspertów i znacznie wyżej od amatorów polegających na nieskrępowanej mocy twórczej. Algorytmy stosowane są przez duże firmy przemysłowe w projektowaniu. Przykłady tak wygenerowanych reklam: • Przyjazne komputery Apple: terminale komputerowe oferujące kwiaty. • World Cup Tennis Tournament w Jerozolimie: Meczet Skały z teksturą piłki tenisowej. • Zegar z samolotem zamiast kukułki reklamujący linie lotnicze działające które zawsze dolatują na czas ... • Dwa Jeepy porozumiewające się językiem migowym, reklamujące ciche silniki w samochodach terenowych. • Pocisk zamieniający się w szybki samochód. Rozumienie tekstów Próbujemy rozwinąć neurokognitywne podejście do rozumienia języka w oparciu o koncepcję grafów spójnych koncepcji, aktywnej części pamięci semantycznej z hamowaniem i rozchodzeniem się aktywacji. Dla tekstów medycznych mamy >2 mln koncepcji, 15 mln relacji … Wiele innych zastosowań ... Przyszłość? Te same zasady obowiązują w projektowaniu i innych domenach: wyobraźnia ograniczona jest przez wiedzę, rezultaty … filtrowane przez…? Porównania tworzenia słów dla zabawek, programów, serwerów WWW itd. ze słowami tworzonymi przez ludzi. Porównania wyników gry w 20 pytań – na ile dobrze radzą sobie z tym ludzie a na ile programy? Jest tylko jeden komercyjny program 20Q. Mistrzostwa świata w grach słownych; budowa wielkiej sieci semantycznej? Co naprawdę dzieje się w mózgu? Badania przy użyciu EPR i fMRI aktywności mózgu w czasie tworzenia nowych słów i słuchania nowych słów – droga do badań kreatywności? Zastosowania neurokognitywnego NLP: • gry słowne w telefonach, grach itp. • tworzenie nazw, które można zastrzec; • nadzieja na osiągnięcie kompetencji człowieka w rozumieniu tekstów?