Szkolenie klikerowe (clicker training) - CZE-NE-KA

advertisement
Szkolenie klikerowe (clicker training) - jest metodą szkolenia używającą nagradzania (pozytywnego
wzmocnienia) za pożądane zachowanie. Moment, kiedy to pożądane zachowanie się pojawia jest
zaznaczony dźwiękiem klikera (lub innym, np używa się gwizdka w przypadku delfinów).
Ten zaznaczający dźwięk jest często nazywany mostem pomiędzy zachowaniem a nagrodą.
Szkolenie kliperowe opiera się na zasadzie: zachowanie nagrodzone będzie powtórzone przez
psa. Jest to również sposób porozumiewania się ze zwierzęciem, bardzo jasny, precyzyjny i łatwy dla
niego do zrozumienia.
Celem tego szkolenia jest zrozumienie przez psa, ze to jego zachowanie powoduje pojawienie się
nagrody. Pies ofiarowuje nam jakieś zachowanie, bo jest to w jego interesie. Nasz cel staje się celem
psa. Całkowita zgodność interesów daje nam psa wykonującego komendy z radością, psa który jest
naszym partnerem, a nie niechętnym niewolnikiem
KLIKER to małe pudełko, które wydaje odgłos klik-klak. Do czego służy? Przy uczeniu zachowań
bardzo ważne jest, aby nagroda była dostarczona dokładnie w momencie pożądanego zachowania,
natomiast gdy podajemy np. smakołyk zawsze robimy to z opóźnieniem. Dlatego używa się klikera,
dzięki niemu możemy bardzo precyzyjnie zaznaczyć zachowanie o które nam chodzi. Każde KLIKKLAK oznacza dla psa, że dostanie smakołyk (nagrodę) za to co robił w chwili kliknięcia.
Czy koniecznie kliker?
Po co dodatkowo używać dźwięku, jeżeli można dać psu nagrodę lub pochwałę "dobry piesek"?
Otóż dźwięk klikera jest specyficzny, łatwo wyróżniający się spośród natłoku odgłosów, które zwierzę
słyszy na co dzień. Pies nie może pomylić go z żadnym innym i zawsze kojarzy mu się z nagrodą.
Bardzo ważnym elementem szkolenia, niezależnie od tego, jaką metodę stosujemy, jest szybkość
naszej reakcji. Odpowiedź na właściwe zachowanie zwierzęcia musi być natychmiastowa - ułamek
sekundy, a dźwięk klikera jest krótki. Kliknąć możemy bardzo szybko, w momencie danego
zachowania. Pochwała słowna lub podanie smakołyku trwa znacznie dłużej. Pies zdąży już zrobić coś
innego, zanim dostarczymy mu nagrodę i nasze nagrodzenie tego zachowania nie będzie precyzyjne,
a co za tym idzie, nie będzie skuteczne. Łatwo jest też zdekoncentrować psa mówiąc do niego zbyt
wiele.
Dźwięk klikera dokładnie akcentuje właściwy moment i oznacza dla psa:
- ze zarobił nagrodę
- to co robił w momencie kliknięcia spowodowało pojawienie się tej nagrody
PODSTAWOWE POJĘCIA DOTYCZĄCE UCZENIA SIĘ:
odruch bezwarunkowy – odruch wrodzony, odziedziczony po przodkach, np. wydzielanie śliny przy
jedzeniu
odruch warunkowy – odruch nabyty, wyuczony (pies któremu zawsze przy jedzeniu zapalano
niebieskie światło, wydziela ślinę na sam widok światła);
warunkowanie – wytwarzanie odruchów warunkowych klasycznych i instrumentalnych.
warunkowanie klasyczne - kojarzenie bodźca warunkowego (biologicznie obojętnego) z bodźcem
bezwarunkowym; (wyrabiania skojarzeń typu np: dźwięk dzwonka z porażeniem prądem, kliknięcie ze
smakołykiem)
warunkowanie instrumentalne - kojarzenie reakcji warunkowej z bodźcem bezwarunkowym (np.
pies ciągnie – zostaje szarpnięty; pies siada – dostaje piłeczkę…)
1
Wzmocnienie (reinforcement) R
Wygaszenie (punishment) P
(wzmacnia zachowanie)
(wygasza zachowanie)
Pozytywne wzmocnienie R+
Coś
pozytywnego
"+"
Coś jest dodane do otoczenia, co
zwiększa prawdopodobieństwo
wystąpienia danego zachowania w
przyszłości
(coś jest
dodane)
Np. pies podaje łapę i dostaje za to
smakołyk.
Coś
negatywnego
"-"
(coś jest
zabrane)
Pozytywne wygaszenie P+
Coś jest dodane do otoczenia, co zmniejsza
prawdopodobieństwo wystąpienia danego
zachowania w przyszłości.
Np. krzyczymy na psa za to ze załatwił się na
dywanie.
Negatywne wzmocnienie R-
Negatywne wygaszenie P-
Coś jest zabrane z otoczenia, co zwiększa
możliwość wystąpienia danego
zachowania w przyszłości.
Coś jest zabrane z otoczenia, co zmniejsza
możliwość wystąpienia danego zachowania w
przyszłości.
Np. przestajemy szarpać psa, jak idzie
przy nodze
Np. przestajemy iść do przodu gdy pies
ciągnie.
Przykłady:
- danie psu smakołyka za przybiegnięcie na wołanie(R+)
- otrzymanie zapłaty za pracę (R+)
- puszczenie psa ze smyczy gdy ciągnie (R+)
- zatrzymanie samochodu w drodze na lody, jeżeli dzieci się biją z tyłu(P-)
- pies jest zapięty na smycz i zabrany z parku po powrocie do pana, (P-)
- naciskanie ręką na psa gdy nie chce usiąść(P+)
- szok elektryczny za szczekanie(P+)
- uderzenie w stół gdy pies podchodzi do nas podczas jedzenia(P+)
- ustawiamy psa ręką przy nodze (R-)
- krzyczymy na współlokatora tak długo aż nie pozmywa talerzy(R-)
OTRZYMYWANIE ZACHOWAŃ:
Mamy psa i teraz chcemy by zrobił coś, za co możemy kliknąć i nagrodzić. W jaki sposób uzyskać
zachowanie do nagrodzenia? Są 3 sposoby otrzymywania zachowań:
Sposoby otrzymywania zachowań
1) naprowadzanie
Zachęca się psa w jakiś sposób do konkretnego zachowania (kiedy już to zrobi, klikamy i
nagradzamy); możemy przesuwać psu smakołyk przed nosem, tak żeby ustawił się w pożądanej
pozycji. Np. naprowadzamy na „siad” jak usiądzie klikamy i nagradzamy
2) wyłapywanie
Czekamy aż pies sam zaofiaruje zachowanie którego chcemy nauczyć, i kiedy widzimy, że je robi
klikamy i nagradzamy. Możemy np. wyłapać turlanie się, ziewanie, robienie kóleczek czy patrzenie na
nas.
2
3) kształtowanie
polega na klikaniu kawałków zachowania, prowadzących do końcowego zachowania, takie mówienie
psu 'ciepło, ciepło'. Np. uczymy targetowania nosem: zaczynamy od klikania/nagradzania spojrzenia,
potem przysunięcia głowy, następnie obwąchiwania targetu aż uzyskujemy mocne i świadome
dotykanie nosem.
SZKOLENIE TO MECHANICZNA UMIEJĘTNOŚĆ
Szkolenie psa dzieli się na dwie składowe: zachowania jakie prezentuje pies oraz umiejętności
techniczne trenera. Ciężko jest nauczyć czegoś zwierzę jeśli sami nie umiemy w odpowiednim
momencie kliknąć, podać sprawnie smakołyk czy pobawić się z psem. Nawet doświadczonym
szkoleniowcom zdarza się kliknąć kawałkiem szynki, pakując przy tym kliker psu do pyska.

TIMING – termin angielski, na polski można to przetłumaczyć jako doskonałe wyczucie czasu.
W szkoleniu klikerowym mamy na myśli umiejętność wzmocnienia zachowania (kliknięcia)
dokładnie w czasie gdy ono zachodzi – tak jakbyśmy chcieli sfotografować to zachowanie.
PRACA Z PSEM:
Ważne jest to jak żwawo pracujemy – jeśli trener pracuje z energią, to i pies szybko się uczy; jeśli
trener jest powolny to pies wolno się uczy. Im częściej klikamy / nagradzamy tym mniej dajemy szansy
psu na rozpraszanie czy złe zachowanie (pies musi się lepiej skupiać).
Jeśli nie jesteśmy pewni czy powinniśmy psa nagrodzić to należy wtedy nagrodzić. Lepiej nagradzać
zbyt dużo, niż zbyt mało.
Jeśli klikniemy przez pomyłkę nie wtedy kiedy chcieliśmy, to trzeba dać psu nagrodę. Pies ma ufać, że
każde kliknięcie oznacza nagrodę.
Sesje szkoleniowe powinny być krótkie. Jedna sesja to 5 kliknięć. Naraz nie robimy więcej niż 5 sesji.
Nie pracujemy za psa! To pies ma do nas podchodzić i oczekiwać pracy. Na początku możemy starać
się go w jakiś sposób sobą zainteresować, ale nie gonimy za psem, który nas olewa.
Jeśli chcemy, żeby pies był skoncentrowany na nas, my też musimy być w pełni skoncentrowanym na
nim. (jeśli w chwili gdy pracujemy z psem zadzwoni telefon, my się odwrócimy to ukarzemy psa za to
co w danym momencie robił)
Powoli zwiększamy KRYTERIA, lepiej zatrzymać się na pewnym poziomie zbyt długo, niż
przeskoczyć za szybko do przodu. Pies może uznać ćwiczenie za zbyt trudne i zniechęcić się do
pracy.
Naukę nowego zachowania zaczynamy w „łatwych”, mało rozpraszających dla psa warunkach (np. w
domu). Kiedy już coś umie stopniowo dodajemy rozproszenia. Na przykład najpierw ćwiczymy w
pustych miejscach, aż stopniowo dojdziemy do pracy przy grupie bawiących się psów.
MOTYWACJA:
jedzenie – każdy pies je; jeden jest bardziej łakomy drugi mniej, ale każdego psa można szkolić za
pomocą jedzenia. Dobrze jest przyjąć zasadę – nic za darmo – i wykorzystywać całą porcję dzienną
psa na szkolenie.
Piłeczka (zabawka) – dla większości psów piłeczka sama w sobie nic nie znaczy; dopiero z czasem,
jeżeli przewodnik często się z nim bawi, nabiera znaczenia
Zabawa – każdy pies ma wrodzone pewne predyspozycje do określonych zabaw;
- bieganie za rzuconym przedmiotem
- przeciąganie się
- zabawa w ganianego - pies ucieka ze zdobyczą
- posiadanie przedmiotu
- nie interesują się żadną zabawą z przedmiotem
3
Zmienny i stały system nagradzania: (dotyczy zachowań których pies już się nauczył)
Nauczone zachowania: Nie klikamy w momencie gdy nie mamy zamiaru psa niczego uczyć, natomiast
wciąż powinniśmy nagradzać psa za wykonywanie poleceń.
Stały system nagradzania: zadania wyuczone nagradzane w stosunku 1:1 są bardziej podatne na
wygaszenie.
Zmienny system nagradzania: ten system pozwalał uzyskać zachowania trwalsze, bardziej odporne
na wygaszanie. Spadała natomiast jakość wykonywanych zadań. Sposób jest o tyle trudny do
zastosowania w życiu codziennym, gdyż jeśli my nie nagrodzimy psa, on często może nagrodzić się
sam (pobiec do psów, pogonić kota).
Dobrze się sprawdza wprowadzenie różnorodności nagród, czyli raz to jest smakołyk, raz pochwała,
raz zabawa patykiem, który akurat leży na trawniku, a raz pozwolenie na pobieganie z psami.
4
Download