Les grands maitres et leur pratique équestre ....

Clicker Training

Bridge and Target

Le Clickertraining est le cas particulier de Bridge and Target où un signal sonore neutre serait utilisé comme bridge.

la dénomination Bridge en Target. (B&T) recouvre un processus d'association lent entre un but (Target) à atteindre et l'accomplissement de la tâche.

 "Target"

Le "Target" , ou cible littéralement peut être au départ une partie de votre corps à toucher, un objet à atteindre etc qui permettra à l'animal d'assimiler progressivement une progession complexe de tâches.  Au départ un seul effleurement sera récompensé , puis un contact prolongé, et dès que l'animal associe l'éxécution de cette action demandée à l'obtention d'une récompense la deuxième phase de l'apprentissage peut commencer.  Dans celle-ci le comportement sera façonné en récompensant les variations qui conduisent au but que l'instructeur s'est choisi, chaque étape étant précise , peu différente de la phase précédente, l'animal peut progresser en tout confiance et dans un climat de récompense et d'encouragement.
 
 

De Bridge


Un élément cognitif pouvant varié suivant les especes est utilisé comme signal d'accomplissement de la tâche demandée.  Ce signal peut être une impulsion lumineuse (pigeons), un coup de sifflet (dauphin), des ultrasons (chiens), des sons graves (lions de mer).  Ce signal est "appris" initialement par association avec le nourissement de l'animal  (association pavlovienne).  Mais que que le signal est associé il faut éviter la substitution en le découplant de l'apport systématique de nouriiture pour éviter que l'animal ne vienne quémander à la perception du signal.  Durant les sessions environ un tiers seulement des signaux étaient associés avec de la nourriture.

Ce Signal "bridge" peut également être modulé en "teminal" et "intermediate".  En pratique un signal d'accomplissement total à satisfaction (Terminal) et un signal d'encouragement (C'est bien mais continues tu y es presque...)

exemple : Applaudissez la démonstration : 

En fait la tache complexe "applaudir" doit être décomposée en plusieurs taches élémentaires.  Premièrement il convient de définir une "cible" pour chaque main, Ensuite de commander à chaque main de toucher l'objet, de le faire simultanément, de s'y maintenir.  Dans une étape ultérieure de rapprocher progressivement les cibles, puis de les réunir.L'applaudissement est obtenu en retirant au dernier moment les deux cibles et de faire se heurter les deux mains.  La salve d'applaudissement en répétant à l'infini la tache élémentaire tout en introduisant un concept de vitesse...  Pas si évident que ca n'est ce pas ?
 

en savoir plus

A l'agenda pour 2001 

Alexandra Kurland & Karen Pryor
 

web site en bibliography

Bibliographie


Chapitres en français dans

Hoofdstuk in nederlands in 

Sites :

Nederlands : Deutsch : Français Listes
  • Clickryder list: http://www.onelist.com/subscribe.cgi/clickryder

  • "You can subscribe via the website and we will look forward to seeing you there. It is subscribed to by everyone from rank beginners to accomplished clicker trainers, and many of them are also very familiar with it's usage from training dogs and other animals with it, so you will find yourself in good company, and discussing everything from the everyday training of routine things to the teaching of fun and entertaining tricks".
  • Mailing-Liste Equiclicker : Equiclicker-subscribe@yahoogroupes.fr 
  •  
     

    En savoir Plus extrait de la News Lettre de la BHA


    In september vorig jaar kwam Kayce Cover binnengewaaid voor een snel-snel introductie in Bridge & Target. Sceptisch ernaartoe, ben ik gefascineerd weer naar huis gegaan. Daarom hier een artikel over Clickertraining, en over Bridge & Target in
    het bijzonder, in drie delen: een theoretisch stukje over begrippen rond “leren”, een praktisch stukje over wat Clickertraining en Bridge & Target nu eigenlijk zijn, en als laatste een begin van ethische overweging, als aanzet tot weer een stukje verder op die levenslange weg die horsemanhip is. Met één gevoel héél centraal: “kinship with all life”.

    En Septembre de l'année passée Kayce Cover est venue pour une introduction très (trop) rapide au Bridge and Target.  Septique j'y ai assité puis fasciné je suis rentré à la maison.  De là une étude et un premier article sur le Bridge and Target puis un approfondissment en trois volets :
    1/ Définitions des termes relatifs à l'apprentissage
    2/ Les méthodes Clickertraining et  le Bridge and Target
    3/ le point de vue ethologique de la question

    1. Even vooraf: definities over “leren”

    Reinforcement (versterking)
    al wat je doet om een bepaald bedrag te vermeerderen
     -positive reinforcement  = door een stimulus (prikkel) toe te voegen aan de omgeving (je krijgt een dessert als je netjes je bord leegeet)
    -negative reinforcement = door een stimulus (prikkel) weg te nemen uit de omgeving (kinderen die ruzie maken wordt hun ijsje afgenomen).

    Straf (punishment)
    is al wat je doet om een bepaald gedrag te verminderen
    -positive punishment  = door een stimulus (prikkel) toe te voegen aan de omgeving (blijf daar af! + een tik op de vingers)
    -negative punishment = door een stimulus (prikkel) weg te nemen uit de omgeving (je was veel te laat thuis, nu mag je niet meer uitgaan de rest van de maand).
    Héél belangrijk in deze definities is dat het erom gaat om hoe de ontvanger van de prikkel het ziet - je kan bvb gestrafd worden, maar de voorbeelden van hoe dat averechts kan werken zijn legio.

    Définitions des termes relatifs à l'apprentissage

    Le renforcement  : tout ce que l'instructeur va tenter pour augmenter la survenance d'un comportement
  • renforcement positif (R+) : en apportant un stimulus supplémantaire (typiquement l'enfant qui reçoit une friandise)
  • renforcement négatif (R-) : en retirant un stimulus présent normalement (l'enfant qui se voit privé de désert ou de tv..)

  • La coercission ou correction : tout ce que l'instructeur va tenter pour diminuer la survenance d'un comportement

  •  positive (C+) : en apportant un stimulus supplémantaire (Pas touche! + se fait taper sur les doigts)
  •  négatif (C-) : en retirant un stimulus présent normalement (Rentré trop tard ? plus de sorties ce mois-ci..)

  • Mais le plus important dans ces définitions est le carractère éminement subjectif de la perception du stimuli apporté ou retiré.

    Toegepast naar paardentraining:
    -positive reinforcement: vb "targetten" = als je een voorwerp aanraakt, krijg je een beloning (bvb een wortel)
    -negative reinforcement: hieronder vallen de meeste paardentrainingsmethodes; bvb het "set it up and wait"-principe om een
    paard achteruit te laten gaan op alleen teugelhulp = de teugels aannemen (="coercion"/pressure/druk) en pas lossen bij het ene goede antwoord (achteruit).
    Ook het traditionele op commando neerwaarts vragen van een paardenhoofd is daarop gebaseerd: pas als het paard het hoofd naar beneden doet, geeft de ruiter na. "It's the release that teaches", maar vooraf is er steeds een vorm van druk, hoe klein die ook is.
     

    Applications équestres

    Le renforcement  : tout ce que l'instructeur va tenter pour augmenter la survenance d'un comportement
  • renforcement positif (R+) : exemple si tu touches cet objet tu recois une récompense...(ex : une carotte = après tout CT c'est aussi carottes tentantes...)
  • renforcement négatif (R-) : Là on retrouve presque toutes les méthodes équestres ... (Crédo : "Maintenez la pression jusque qu'au moment où le cheval céde" (exemple type le reculer en "tirant" sur le mors)  Trop souvent on pense que c'est le relachement qui instruit (voir Gail Ivey à ce propos) mais en fait au départ il y a une contrainte imposée.

  • La coercission ou correction : tout ce que l'instructeur va tenter pour diminuer la survenance d'un comportement

  •  positive (C+) : On ne le voit que trop.... Le cheval qui recoit un coup de cravache ou d'éperon parce qu'il refuse l'obstacle..
  •  négatif (C-) : Le cheval qui veut mordre lorsque le personnel nourit, et le palfrenier qui retire le seau de grains (sans frapper le cheval)
  • Positief en negatief als definitie zijn dus plus, wel en min, niet. Een positieve uitslag bij een tbc-onderzoek is dat er wel TBC is geconstateerd. De ervaringswaarde (gevoel, beoordeling) van de patient is negatief. Een negatieve uitslag bij een zwangerschapstest kan een positieve of een negatieve gevoelswaarde opleveren, maar de patient is per definitie niet zwanger! In die zin zijn positive reinforcement  (R+) en negative reinforcement (R-) verwarrende termen, waar je echt plaatjes bij moet maken om ze te kunnen gebruiken naast positief in de zin van goed en negatief in de zin van slecht. R+ en R- willen gedrag stimuleren, straf wil gedrag tegengaan of elimineren. Het kost veel energie en focus om zelf bewust met deze manieren van gedragsbeinvloeding om te blijven gaan. Alles wat we doen of nalaten in onze omgang met paarden is communicatie!
     

    Attention donc au vocabulaire ! Positif et négatif ne sont pas des critères de qualité mais bien des indications de traitement.  Un peu comme en médecine ! exemple un diagnostic T BC ou HIV peut être négatif (le patient n'a PAS la maladie) et très encourageant (le patient est soulagé il est en bonne santé), le diagnostic peut être "Positif" et avoir un effet négatif sur le patient (exemple Diabete positif et contrainte de traitement), ou encore Positif ou Négatif et un effet totalement variable sur le patient (exemple test de grossesse qui verifie si un enfant sera à naitre, son appréciation subjective dépend des souhaits de la mère (grossesse acceptée ou non ...)  Donc attention aux termes R+ et R- visent à renforcer un comportement C+ C- visent à éliminer une attitude, il n'y a aucn côté d'appréciation dans le terme positif ou négatif, l'un n'est pas plus "mauvais" que l'autre serait "bon".  Ce sont des termes qui permettent d'attirer l'attention sur le canal de communication que nous utilisons dans notre relation avec le cheval.

    -positive punishment - tja, daar kennen we voorbeelden genoeg van. Een paard mag niet meer weigeren voor de hindernis, en dus wordt het geslagen.
    -negative punishment = het paard probeert te bijten als je met de voederbak komt, je trekt de voederbak weer weg.
     

    Voor de goede orde: straf NA de actie heeft tot doel dat een aktie van het paard wordt ontmoedigd. Straf TIJDENS de actie heeft tot doel dat de actie wordt afgebroken (dus ook ontmoedigd). Dat geeft naast de onaangename herinnering aan straf ook frustratie (doe ik nu iets fout of heb ik iets fout gedaan).

    Pour la clarté, une punition APRES la faute tente de décourager le cheval de repeter cette action puisqu'elle n'est pas gratifiante, une punition PENDANT la faute a pour but de l'interompre et tente de conscientiser le cheval sur l'élément fautif de son comportement actuel (attention à la frustration si le contexte est vague)

    Met name langdurige 'straf'  als vastgebonden laten staan, geen eten geven enz. zijn zinloze acties en hebben niet tot gevolg dat een paard snapt dat hij voortaan iets moet doen of nalaten om dit te voorkomen.

    Plusieurs "corrections" sont ainsi totalement innefficaces car totalement déconnectées ou hors de propos exemple : chevaux attachés pendant de longues périodes, privés de nouriture etc ... le cheval ne comprend pas le lien entre son comportment et le sévice qu'il subit (oui je le dis cela c'est de la torture! ...)

    Straf kan positief zijn in de zin van toevoegen (een mep na een weigering) of negatief in de zin van weghalen (bak eten wegnemen als het paard tegen de box mept tijdens eten) in de hoop dat in de toekomst een paard de aktie en de straf associeert.

    La coercission est décrite comme positive dans le sens ou un stimuls est ajouté (une claque à la faute) ou négative si un stimulus est retiré (pas de bonbons à la pomme) mais elle reste une punition et est appliquée dans l'espoir que le cheval associe son comportement et la sensation d'inconfort que le cavalier lui impose.

    Uiteindelijk kan het paard er wel iets van leren, maar het zal er nooit een bevredigend gevoel aan over houden. Het zal niet iets 'willen', het zal hooguit iets wat hij eigenlijk wil, nalaten (bijv. NIET weigeren, ondanks dat hij eigenlijk bang is voor die hindernis, is hij nog banger voor de 'straf').

    Finalement le cheval "apprend" mais PAS de façon valorisante, il n'a pas d'"enthousiasme", il tolere une "corvée" exemple il a toujours peur de l'obstacle mais il le franchit car il craint encore plus la punition, mais laissé libre il n'approcherait pas des barres...



     

    Shapen

    Modifieren van operant gedrag door het reinforcen van alleen die variaties in respons, die leiden in de richting van het gedrag verlangd door de trainer (Atkinson, Atkinson, Smith & Bern). Of om het eenvoudiger te zeggen: je bouwt dus een gedrag stukje voor stukje op door elke keer elk stukje-in-de-goede-richting te belonen. “Shapen” is het uitlokken (naar een bepaald gedrag leiden) of “veroorzaken” van een bepaald gedrag, en dan die ruwe vorm van aangeboden gedrag gaan verfijnen tot precies dàt wat je wil.
     

    La modification d'un comportement opérant par le renforcement de certains paramètres de réponse permet à l'instructeur d'orienter le comportement dans le sens souhaité. Pour résumer simplement le comportement  est amené vers le but souhaité par de toutes petites étapes, chaque progrès étant récompensé.  "Shapen" consiste donc en induire un comportment puis à l'orienter progressivement vers le but recherché.

    Trial and error

    Als het gewenste gedrag in (te) grote stukken wordt opgedeeld, ontstaat “trail and error”-gedrag: “Zou het dit zijn? Tiens nee. Misschien is het dit?”. Het grootste nadeel is dat als het proces van “trial en error” te lang duurt, er echt  frustratie bij het dier ontstaat.

    Le danger est que si le but est décomposé en sous unité trop différentes les unes des autres, que le sujet ne puisse percevoir la continuité du processus d'apprentissage. Dans ce cas, les principes de progression relevent souvent de "essais - erreurs"...  Le dialogue devient alors frustrant : Est ce ceci?  NON ! alors cela ? Non plus  encore raté !   L'inconvénient est la longue durée du processus et le risque  à chaque étape d'une erreur qu'il faudra ensuite corriger.
     

    Morfen

    is ook zo'n typische term die betekent dat je het lichaam van zo'n hondje gaat duwen hoe het moet zijn, vb op z'n achterste duwen om 'm te doen zitten. Je instructeur die aan je hielen komt trekken om je te tonen waar je benen moeten liggen,
    is ook aan het morfen (maar dat weet hij/zij vast niet!).

    Ah oui l'un des méthodes les plus utilisées sans le savoir ..;Dans le "Morphing" le sujet est placé dans le comportement ou la position souhaitée par son instructeur.  Exemple le moniteur d'équitation qui place la jambe de son éleve à la sangle, le maître qui pousse l'arriere train de son chien vers le bas pour qu'il s'assaye, etc...
     

    Capturing  from behaviour

    Gewoon wachten op een gewenst gedrag: je wacht tot het hondje toevallig gaat zitten en dat beloon je dan, tot het hondje  door trial and error doorheeft dat het door te gaan zitten een beloning verdient.

    Ici on profite du comportment spontanné que l'on récompense, et l'on espère que par des "essais erreur" le sujet comprenne que la récompense ne survient que lorsqu'il adopte le comportment.

    Targetten

    Het dier leert om een “target” (een doel) aan te raken. Die target kan je hand zijn, maar ook een zweepje, of een bal, of eender wat aangeduid wordt als het “doel”.

    Le sujet apprend un "but" à atteindre.  En Bridge et Target cela peut être la main, un objet mais cela  peut aussi être un geste ou tout autre fait assimilé au "but".

    Primary & secundary reinforcer

    Een “eerstelijnsversterker” is alles waar iemand voor wil werken (of iemand anders dat nu de moeite vind of niet):
    voedsel, aandacht, aaien, liefde, kauw- gom, harde geluiden (zoals kleine jongetjes die bommetjes laten
    knetteren op straat) - eender wat.

    Un reforcement Primaire est un reforcement par une satisfaction en relation directe avec l'action

    Secondary reinforcer is een signaal of stimulus dat eerst geen enkele betekenis heeft, maar uiteindelijk de plaats gaat innemen van een primary reinforcer. Die secondaire versterker wordt dus uiteindelijk een geconditioneerde versterker - op de duur hecht de leerling even veel belang aan de secondary reinforcer als eerst alleen aan de primary reinforcer. Het zijn dus aangeleerde symbolen bvb goeie punten op een rapport, papiergeld,  de belletjes op een flipperkast, een fluitje, een clicker.

    Un reforcement est un stimulus qui au départ est neutre et dépourvu de connotation.  Le dresseur va progressivment le substituer au renforcement primaire et pour le sujet conditionné le renforcement secondaire est parfois m^me plus important que le renforcement primaire. exemple : les "bons points", les médailles, les vignettes, les signaux d'un billiard électronique, ou le sifflet ou clicker utilisés pour les chiens ou dauphins.

    “Secondary” betekent dus zeker niet dat hij zou komen NA een primary reinforcer. Daarom wordt de term in training vaak vermeden - in het geval van Bridge & Target en clickertraining gaat men het hebben over een bridge, of overbruggingssignaal.

    Secondaire ne veut donc PAS signifier qu'il vient subséquement au  primaire.   Il vient en REMPLACEMENT.
    Dans de nombreuses méthode ce terme même est évité et remplacé par un signal d'association.

    Operant Conditioning (OC)

    Er is conditioneren, en er is conditioneren

    Bij conditioneren denken we meestal aan de honden van Pavlov, die gingen kwijlen (voor de Vlamingen: zeveren) bij het horen van een belletje. Ook mensen zijn op belletjes geconditioneerd, let maar eens op als er een GSM gaat ;-). In elk geval: wie “conditioneren” zegt krijgt visioenen van gedachteloos lopende band-werk - en het geconditioneerde individu dat van alle eigenwaarde wordt beroofd.  Pavlov beschreef hier echter de geconditioneerde reflex, dwz: eerst het belletje, dan het eten, dan het gedrag, dat een reflex is, en niet bewust, en dus niet kan gecontroleerd worden door de hond zelf.
     

    Il y a conditionnement et conditionnement.

    Par conditionnement la plupart font l'association avec Pavlov (déjà un conditionnement !).  Pavlov qui étudiait les secrétions salivaires des chiens, avait montré qu'un signal parasite (la sonnette de la porte) perturbait les mesures et déclenchait une salivation plus importante des chiens car elle préludait au repas.  (Note il n'y a pas que les chiens qui peuvent être conditonnés par une sonnerie, faites sonner votre GSM lors d'une réunion de travail et observez...)  En tout cas ceci montre bien qu'il s'agit de conditionnement si le sujet ne maîtrise plus son comportment de façon conscience mais agit de facon impersonnelle en "mode automatique".

    Dans les experimentations de Pavlov il s'agit de conditionnement reflexe : c'est à dire

    1/ le signal (la sonnerie)
    2/l'arrivée de  la récompense
    3/ le comportement reflexe (et non contrôlé)
    4/ éventuellement la mise à disposition de la récompense (la gamelle de nourriture)

    Hier gaat het echter over operant conditioning, dwz eerst het gedrag, dan het belletje (de stem of clicker of...), en dan het eten/de beloning. Het dier (de mens) moet dus iets doen om z'n beloning te "verdienen" en kan er dus ook voor kiezen om het gedrag niet uit te voeren - de dieren worden niet aangelijnd of gehalsterd (bij wilde dieren wordt wel eerst door de tralies gewerkt, maar ook daar heeft het dier dus steeds de keuze om niet mee te doen).

    Quand on parle de comportement par opérant il faut un contrôle conscient du sujet et l'accomplissement volontaire d'un acte.
    Le comportement est demandé par l'instructeur,
    exécuté par le sujet
    puis recompensé (par renforcement primaire ou secondaire)

    Mais le sujet est laissé libre de choisir d'éxécuter l'ordre ou non.  Pour les animaux la liberté de mouvement leur est laissée, ils ne sont pas entravés ou tenu à la longe. il sont donc "libre" même si maintenus en enclots ou en cage de leurs mouvements.

    In traditionele training wordt als het dier niet “meewerkt”  vaak gebruik gemaakt van negative reinforcement of positive punishment, bij operant conditioning wordt (zo zou het moeten ;-) ) alleen de kans weggenomen om succesvol te zijn; er wordt een time-out gegeven: de target bvb wordt even weggenomen en pas een halve minuut later opnieuw gepresenteerd zodat het
    paard eennieuwe kans krijgt om alsnog succesvol te zijn).

    En dressage tradtionnel si l'animal ne "co-opère" pas il est fréquement fait usage de R- ou de C+ alors que dans les Oc la cible est simplement retirée (on remet le compteur à zéro) et représentée plus tard (quelques minutes) ce qui permet une nouvelle tentative.
     
     

    Waarom zijn “conditioneren” en “leren” twee verschillende woorden?


    Misschien wel omdat ze maar gedeeltelijk met elkaar te maken hebben?

    Voor "leren" (= een verandering in respons al gevolg van een ervaring) worden algemeen de volgende 6 opties gehanteerd:

    1) klassieke conditionering (oftewel type I-leren)
    2) operante conditionering (type II -respectievelijk  a. trial-and-error-leren  b. shapen
    3) habituation (=gewenning)
    4) complex learning
    5) latent learning
    6) imprinting

    Pourquoi utiliser deux termes :  "Apprendre" et "Conditionner"


    Peut être parce que les concepts ne sont pas identiques !
    par "apprendre" on sous entend le recours à une de ces 6 méthodes :

  • le conditionnement classique
  • le conditionnement opérant
  • habituation
  • l'apprentissage complexe
  • l'apprentissage latent
  • l'imprinting
  • Ik doe niet aan conditioneren!
    Dat roepen mensen vaak verschrikt, alsof het een grote zonde is. Maar: conditioneren, dat doe je wél. Zodra je een “afspraak” hebt gemaakt over iets, heb je in feite geconditioneerd. Bijvoorbeeld: kuit aandrukken = voorwaarts, druk op bit = stilstaan of nageven, binnenbeen op de singel, buiten achter = hop galop (met eventueel een tik als reinforcer): je bent aan het conditioneren. Niet alleen conditioneer je je paard om onmiddellijk te reageren als je een hulp of aanwijzing geeft, om efficiënt te zijn moet je natuurlijk ook zelf geconditioneerd zijn: de hulpen, waar je als beginner zolang over doet om ze onder de knie te
    krijgen, worden op de duur ingesleten in je spiergeheugen: je bent zelf ook geconditioneerd.  Het resultaat moet nu eenmaal meetbaar, herhaalbaar zijn, en consistent onder veranderende omstandigheden. In onze relatie met paarden (én mensen!) kom je daar nu eenmaal niet onderuit. Of we moeten stoppen met rijden.
     

    Je ne veux pas conditionner !
    Ce "cri du coeur" est fréquement étendu, mais comme Monsieur Jourdain qui faisait de la prose sans le savoir, chacun de nous est conditionné et induit des conditionnements.  Chaque "aide" en équitation  relève d'un conditonnement tant chez le cheval que chez le cavalier.  que se soit le mouvement de la jambe pressant le flanc pour allonger l'allure, la tension sur les rênes pour abaisser l'encolure, ou l'arrêt, la jambe intérieure à la sangle et l'extérieure en arriere demande de galop éventuellement renforcée par une cravache)  tout cela doit être automatique (et si dur à apprendre...) tant chez le cheval que chez le cavalier.
    Il en est de même pour toutes nos relations tant avec les hommes qu'avec les chevaux, c'est ainsi et il n'y a pas une seule échappatoire.



     

    Operant conditioneren in combinatie met positive reinforcement

    In grote lijnen ziet een trainingsstap er als volgt uit:
    1/ vragen om een gedrag
    2/ het dier voert een bepaald gedrag uit + precies op dat moment clicker/belletje/stem als tussenstap = overbruggingssignaal ("bridge")
    3/ beloning, meestal een beetje eten.

    De clicker/belletje/stem (vb. X) wordt tussengelast om als signaal te dienen: dat heb je goed gedaan (daar, dat,  op dat precieze moment), en daar ga je een beloning voor krijgen - het duidt dus voor het dier aan "dat was goed" en is tegelijk de belofte voor een beloning. Het laat ook toe om de tijdspanne tussen bridge en beloning groter te maken, te
    varieren, en uiteindelijk het eten te laten wegvallen.

    Zoals steeds: variaties op een thema In "operant conditioning"-technieken zijn er twee variaties:

    1/ de vooral door Karen Pryor en Gary Wilkes wijdverspreide clickertraining. Zij hebben clickertraining niet uitgevonden (dat hebben dolfijnentrainers gedaan: er was geen enkele traditionele manier die dolfijnen kon motiveren, en een halster of leiband aandoen ging ook al niet) maar ze hebben het wel het best gemarketeerd, vooral Karen Pryor zou je in dat opzicht een beetje de Pat Parelli van de Positive Reinforcement kunnen noemen.

    2/ Bridge&Target, minder gemarketeerd (en dus minder gekend) maar meer gebruikt onder professionele Amerikaanse dierentrainers, vb. het wereldberoemde "Slewth"-project waar zeeleeuwen in de vrije oceaan walvissen gaan filmen. Het is trouwens ook een techniek die door dolfijnentrainers werd ontwikkeld. Eigenlijk zou je kunnen zeggen dat Bridge & Target een beetje het “voortschrijdend inzicht” van Positive Reinforcement-technieken vertegenwoordigt. Het is minder methodisch,
    minder “af” zelfs.

    Clickertraining (vanaf nu CT) en Bridge&Target (vanaf nu B&T) verschillen van elkaar op een paar punten in de methodiek, en die verschillen komen voornamelijk voort uit de verschillende opvattingen over waaróm en wát je moet gaan trainen -
    en die vraag heeft ook het “hoe” beinvloed.

    Overigens zijn er veel meer overeenkomsten dan verschillen. Ook onderling zitten er tussen de mainstream-clickertrainers en de
    toegewijde B&T-trainers een heleboel gradaties. Sommige trainers die zeggen CT-trainers te zijn, zitten soms veel dichter tegen B&T aan dan mensen die zich B&T-trainers noemen. Zoals steeds: het maakt het er allemaal alleen maar boeiender op.
    1 "shapen/morfen" vs. "targetten" CT gebruikt als basisvorm vooral "shapen", in vrij grote boustenen. Het gedrag wordt als geheel uitgelokt, en het dier voert het gedrag eerst onbewust uit. Pas geleidelijk aan, omdat het dier  altijd voor een welbepaald gedrag beloond wordt, begrijpt het waaróm het beloond wordt, en gaat dat gedrag bewust herhalen, om beloond te worden. Op een video van Gary Wilkes is bijvoorbeeld te zien hoe hij een hond een snoepje voor de neus houdt. Die hond probeert het snoepje uit de hand te krijgen, en volgt met z’n neus de hand met het snoepje in. Op die manier maakt hij een volledige rol. Op het moment dat de rol af is, krijgt hij het snoepje. De hond heeft op dat moment geen idee waarom hij dat snoepje krijgt - pas na het vaak herhalen van de hele beweging, valt z’n frank/gulden/euro. Als de hond de hele beweging kent, wordt het hele
    gedrag op commando gezet (“rol”).

    Targetting wordt ook gebruikt bij CT, maar krijgt veel minder nadruk:
    ook daar gaat het erom dat er een gedrag als geheel wordt aangeleerd, bvb. een klassieke oefening (die heel snel gaat met R+) is de Spaanse Pas met een paard. Het paard leert met de knie een target (bvb een zweepje) te raken. Door afwisselend de ene en de andere knie te vragen, voert het paard al gauw een Spaanse Pas uit.

    In B&T is targetten de basisvorm van gedragstraining: het dier leert targetten, (bvb met z’n neus), en leert op die manier eerst een aantal basisgedragingen: aanraken, blijven, gaan naar, vasthouden, duwen enz. Daarna leert het met al z'n lichaamsdelen te targetten. Uit het targetten wordt elke beweging opgebouwd, alsof het het alfabet is waarna je er zinnen mee leert schrijven. B&T gaat dus in het begin essentieel trager dan CT: CT leert in één keer hele “woorden” aan. In B&T wordt dus geen gebruik gemaakt van  "morfen", en shapen wordt alleen gebruikt om de kwaliteiten van een al verkregen verdrag te verbeteren (duur, afstand, snelheid, hoogte enz.).

    2/ stemgebruik en emotionele "warm-koud"-ondersteuning versus clicker:
    Bij CT én B&T is het overbruggings-signaal een essentieel onderdeel. Toch is er een belangrijk verschil. CT gebruikt -de naam zegt het al- een clicker (zoals je vroeger als kind kreeg van de Sint in de Innovation). Waarom een clicker? Het is een droog, altijd hetzelfde klinkend geluid. Het is een signaal dat niet verward kan worden met een ander. Het is ook heel kort, en kan dus heel exact, op de seconde bijna, het “juiste moment” markeren. Het is dus heel duidelijk voor het dier. Het ontbreken van “emotie” in de clicker is voor CT-trainers dus een belangrijk argument: er kan geen negatieve emotie in, en het gedrag is
    niet afhankelijk van de trainer (in B&T kiezen trainers vaker voor een persoonlijk geluid). B&T daarentegen maakt  juist gebruik van de stem precies vanwege zijn emotionele variaties. Meestal wordt als bridge "X" gebruikt  (ook dat is
    een geluid dat "anders" en kort genoeg is om duidelijk te zijn).  Het feit dat je een stem gebruikt laat je toe om gradaties in het
    overbruggingssignaal zelf te leggen en het gaat heel gemakkelijk. Bovendien gebruikt B&T ook een zogenaamde "intermediate bridge" - zodra het paard in de juiste richting werkt wordt "xxxxxxxxxx" gezegd op een ondersteunende manier, gevolgd door de "X" bij het aanraken van de target. Gaat het fout, dan wordt de "xxxxx" afgebroken, net zoals bij het warm/koud-spelletje:  (warm warm JAAAA) er komt al feedback tijdens de actie.  Die "xxxxx" is dus meer een coaching signaal: "je bent er nog
    niet, maar je bent op de goeie weg".

    De click van CT (de YES, de JAAA), maar ook  de X van B&T, moedigt het gedrag weliswaar aan (om weer te doen), maar beeindigt ook op dat moment  (er komt een beloning). En dat kan voor praktische problemen zorgen. Als je bvb galop gaat trainen met CT, en je hebt alleen de click om te zeggen “DAT is het”, dan zou het kunnen  dat het paard in een sliding stop gaat om op de beloning te wachten...

    Sommige CT-trainers hebben daarom een apart aanmoedigingssignaal (een “keep going”-signaal) ingebouwd. Dit wordt dan enkel gebruikt om een al gekend gedrag te laten voortduren. B1T gebruikt het aanmoedigingssignaal essentieel tijdens het aanleren, dus al voor het gedrag gekend is.

    3/ variabele beloning:
    Variabele beloning betekent gewoon dat het belonen niet consistent is. Er wordt niet altijd beloond, of er wordt niet altijd met hetzelfde beloond, of de tijdsduur tussen gedrag en beloning varieert. Bij een nieuwe oefening komt de beloning elke keer, naarmate de oefening consstenter  is wordt het interval groter en de beloning kleiner. Niet anders dus dan bij het aanleren van dressuuroefeningen bijvoorbeeld. In het begin knuffel je je paard plat als het aanspringt in galop in plaats van in galop te vallen, en op de duur wordt het normaal.
    Het interval is trouwens belangrijk voor de kwaliteit van de oefening: als je elke keer beloont wordt het routine, het wordt "normaal". Als de beloning variabel is (groter/kleiner, meer/minder tijd tussen) gaat iemand harder werken. Da's trouwens waarom mensen aan een jackpot verslaafd raken ;-).

    Maar het is ook de motivatie tot gewoonweg willen werken naar steeds beter, zoals een balletdanser blijft werken aan z'n dans -hij werkt voor eerst de goedkeuring van z'n dansleraar en daarna voor het applaus - maar als hij dat applaus bij elke sprong zou krijgen zou de glans er snel afgaan. Integendeel, de danser krijgt zoiets van "hou nu eens op met dat applaus".

    Bij CT wordt de beloning pas variabel
    als het gedrag echt gekend is - normaal wordt er na elke vraag onmiddellijk, en altijd  beloond (er zijn variaties binnen CT maar
    meestal wordt dit toch bij beginners als essentieel aangeleerd).

    In B&T wordt de beloning zo goed als onmiddellijk variabel: zodra de target een paar keer is geraakt. Er wordt gemiddeld maar 1 op de drie keer voedsel (of iets anders waar het dier voor wil werken) gegeven. Het  hangt dus ook van het individuele dier af hoe snel en hoe variabel je variabele beloning kan zijn.

    Zowiezo, als je met voedsel traint,  is het natuurlijk de bedoeling zo snel mogelijk van dat eten af te komen. Na een tijdje geef je de beloning pas op het einde van een hele reeks oefeningen. Ook moet je niet elke keer voedsel gaan geven: zeker met B&T is ook de manier waarop  "X" wordt geroepen een graadmeter, en er wordt ook gewoon veel geaaid.

    Bovendien bestaat er ook zoiets als "extinction outburst". Stel: je krijgt het deksel niet van de confituurpot (sorry, jàm-pot).
    Het deksel zit vast, en hoe hard je ook probeert, je krijgt het niet losgedraaid. Net voor je gaat opgeven, probeer je nog één keer, met oerkreet erbij en extra veel kracht, zo van "nog één keer". Beng, het deksel gaat open.

    Straffe trainers weten wanneer die extinction outburst komt, en belonen daarop - op de supergoede uitvoering, net voor het frustratie (en opgave) wordt. Het is echter weinig trainers gegeven die extinction outburst te voorspellen, maar wie het kan, gaat pijlsnel vooruit. De keerzijde van de medaille is dat als je 'm net mist, er geen tweede komt, en je de oefening voor een tijdje mag vergeten. Maar je kan dus wel degelijk je afwerkings-eisen binnen een bepaalde oefening hoger stellen naarmate je paard ze kent. Maar dat geldt natuurlijk niet alleen voor deze vorm van trainen, dit geldt voor alle vormen van leren.

    Het gebruik van stemcommando’s
    Voor de duidelijkheid: het geluidje (de click, de "X") is zélf geen stemcommando - het betekent alleen maar "dat heb je goed gedaan, en daar krijg je (straks) een beloning voor”. Het klassieke voorbeeld is dat van de dolfijn die door een hoepel springt:
    op het exacte moment dat hij daar door de hoepel gaat, hoor je de trainers fluiten. Niet ervoor, niet erna. Dat betekent voor de dolfijnen: dat heb je goed gedaan, kom nu maar een visje halen.

    Het gebruik van stemcommando’s is toch wel een kenmerk van CT en B&T. Veel meer dan bij andere trainingsmethodes  waar stemcommando’s bvb beperkt zijn tot “hoooo” of “halt”, “stap”, “draf” en “galop” (bvb bij het longeren). Toch moet het niet perse een stémcommando te zijn - het kan ook gewoon wijzen naar een target zijn, of eender welk gebaar.

    Een stemcommando wordt pas op de oefening geplakt als de beweging consistent is. Het zou anders net zoiets zijn als een paard leren longeren: het paard loopt te draven, en jij roept maar steeds "galop, galop" - het paard denkt dan dat wat hij aan het doen is, vast galop heet, terwijl jij zou willen dat hij in galop gáát. Zo werkt het dus niet - je drijft eerst het paard aan - (met
    lichaamsbeweging of met de klassieke longeerzweep of met een beetje zand of of of - en pas als hij in galop gaat zeg je "galop".

    Moet je altijd met voedsel werken?
    Nee - je werkt met eender waarvoor het dier wil werken. Voedsel werkt meestal wel het snelste en ik hebm 'n oorspronkelijke weerstand daartegen overwonnen omdat het zo snel resultaat gaf, terwijl het duidelijk was dat het paard wel de beloning verwacht, maar in feite niet daarvoor werkt.

    Kayce vertelde bvb dat manta's (je weet wel, die enorme vliegende onderwaterschotels) niet voor voedsel werken, wel voor... krabbelen. Een hamster werkt niet voor het eten zelf, maar om te kunnen hamsteren: nootje in z'n mond, naar de voedselplaats rennen, veilig wegstoppen, terugkomen. Orca's vinden het fantastisch om over hun tong gestreeld te worden - net zoals poezen over hun rug.

    Van werken met voedsel krijg je toch opdringerige paarden?
    Het is niet het werken met voedsel dat het opdringerige gedrag veroorzaakt, en ook niet het voedsel geven uit de hand. Als het paard opdringerig wordt, betekent dat alleen dat je de regels niet duidelijk hebt gesteld. Het paard toont je dus alleen maar waar je iets bent vergeten uit te leggen daarover.

    Gazelle (m'n experimenteerpaard) werd in het begin inderdaad opdringerig, maar dan stel je "gewoon" de regels vast: "nee, niet zo". Dus nu loopt Gazelle de kom met worteltjes/appeltjes/whatever gewoon voorbij op weg naar de target, 5 meter verder - want de kortste weg naar een stukje wortel gaat via de target, niet via de kom.

    Wat kan ik ermee onder zadel?
    De manier waarop RWYM omgaat met leren heeft voor mij veel weg van B&T: een beweging wordt opgesplitst in hele kleine onderdelen, en er wordt een "andere" manier (in dit geval: een andere woordenschat, maar dat is targetting tenslotte ook) gebruikt om je van de bewegingen van je eigen lichaam bewust te laten worden, waardoor je die bewegingen ook bewuster
    gaat uitvoeren - omdat je erover moet nadenken hoe je ze precies uitvoert. Vele kleine beweginkjes in  je eigen lichaam vormen ineens samen een perfecte wending - het einddoel overkomt je bijna.

    Helpt het bij het rijden? Ik denk in grote lijnen alleen conceptueel - sommige dingen kan je op de grond al uitleggen. Het bit is de target, of je been, of je bouwt een piaffe op de grond op door te targetten met spronggewrichten; een wending om de achterhand door met schouders te targetten. Zowiezo blijft rijden altijd een mengvorm van technieken - het feit dat
    je met je eigen lichaam het paard hindert in z'n beweging, alleen al omdat je erop zit, veroorzaakt dat. Maar het maakt je er wel bewuster van dat je, als je op die manier over "rijhulpen" gaat nadenken (namelijk dat je het als een vorm van targetting ziet en niet als een vorm van negative reinforcement), dat ze eerder "cues" worden en geen "hulp".

    Het zijn allemaal maar kunstjes, en dus dieronwaardig.
    Ik heb inderdaad moeite met de manier waarop CT soms wordt gebruikt. Een paard piano leren spelen, of uit een colaflesje leren drinken, of een buiging laten maken, “gewoon omdat het zo leuk is”, zou ik inderdaad dieronwaardig kunnen noemen.
    Maar wat doe je dan met   "normale" paardentraining? Wat zijn eigenlijk de criteria om iets dieronwaardig te noemen?
    Als je een “kunstje” zou omschrijven als aangeleerd, maar irrelevant gedrag, wat doen we dan met bvb. dressuur?
    Hoe hoger bijvoorbeeld het (dressuur)niveau: hoe gevarieerder de kunstjes.  Appuyementjes, zijgangen, uitstrekken etc etc: bij alle kunstjes zal je het paard duidelijk moeten maken wat je wilt. De manier waarop, is misschien van minder belang - als het maar met respect voor het wezen “paard” gebeurt.

    Nu:  je zou targetten een "kunstje" zou kunnen noemen. In feite is dat kunstje net zoiets als het concept "letter". Er zijn verschillende letters, als je die aan elkaar plakt heb je woorden, en als je die aan elkaar plakt heb je zinnen.
    Zo ook met het B&T-targetten: dat eerste kunstje (met de neus tegen een stokje bvb) is hem vertellen: kijk, zoiets is een letter. Daarna ga je woorden maken (verschillende targets aanraken, met neus/mond/knie/oor/achterste/ schouder/rug enzovoort). Na een tijdje weet het paard dat hij de target moet aanraken, hij moet er alleen achterkomen welke target, en met welk
    lichaamsdeel; ook je targets veranderen van afstand en uitzicht. Eens een bepaad gedrag samengesteld, verdwijnen de fysieke targets: het gedrag komt als geheel onder één stemcommando te staan.

    Wat mij zo in B&T aantrekt is het belang dat bvb Kayce Cover hecht aan het voorbij-het-kunstje gaan: dat het paard bewust moet zijn van de beweging die hij uitvoert. Dat vonden sommige clickermensen juist eerder een bezwaar - het paard moet onvoorwaardelijk uitvoeren.

    Ik denk dat je dus inderdaad eerst door het "truuks"-stadium heen moet. Het "licht aangaan" van "ha, ik moet targetten" is heel leuk om te zien, maar het  is niet dàt wat ik bewustzijn noem. Maar als een koe de keuze heeft om (aan de hand van abstracte symbolen) te kunnen zeggen "vandaag wil ik wel eens met die knappe stier rollebollen", en morgen kan ze zeggen "uh, geef mij maar de wei" - dan is dat toch een begin om een dier in z'n volle waarde te kunnen laten? Natuurlijk kan je een koe tot
    bij de stier brengen, en kan je het aflezen aan de manier waarop ze zich gedraagt, dan weet je 't ook wel. Maar is het niet veel respectvoller om het vooraf gewoon even beleefd te vragen?

    Om een praktisch voorbeeld te geven: het lijkt het mij niet zo moeilijk om een paard te leren dat ze kan zeggen: vandaag wil ik appels, geen worteltjes, door een van de twee symbolen te kiezen. Net zoals het mogelijk moet zijn om een paard de letters in de piste te leren "lezen".

    Net zoals autisten uit hun gesloten wereld halen (clickertraining wordt gebruikt om autisten te leren functioneren - het geeft hen beelden (ze kunnen niet in woorden denken) waar ze effectief dingen mee kunnen - het stelt hen in staat om terug te praten. En om hun mening te kunnen geven.

    Excessen heb je altijd. Shows zijn dieronwaardig, maar ze tonen mensen wél dat dieren tot méér in staat zijn dan eten en voortplanten en, in het geval van paarden, ons van A neer B brengen op de manier die wij verkiezen.

    Hebben woorden “zin” voor paarden?
    We communiceren natuurljk al lang zonder woorden met onze paarden: wijzen met een vinger. Een vinger tegen de achterhand. Het vastnemen van het leidtouw. De manier waarop we kijken, naar voor stappen, ons omdraaien.We hebben lichaamstaal.
    CT en B&T zijn bovendien geen alomvattende trainingsmethodes. In de eerste plaats komt die lichaamstaal, en je eerlijkheid naar het paard toe.

    Misschien is het aanbrengen van exact omschreven woorden op deze maniertoch interessant. Omdat we minder "ruis" hebben - aan onze kant, én aan hun kant. Minder "verloren" boodschappen. Het is waarschijnlijk alleen een ander/fijner werktuig voor het komen tot een begrijpelijke, gemeenschappelijke taal...De ruis (en er kan veel ruis zijn!) zo veel mogelijk elimineren. Op dezelfde manier als RWYM en Centered Riding precies die woordenschat aanbrengt, waardoor je in staat bent om de
    "ruis" in je eigen lichaam eerst te begrijpen, en daardoor te elimineren.

    In B&T worden dieren bovendien tweetalig getraind: je hebt natuurlijk de Engelse/Nederlandse woorden, maar meer geavanceerde trainers gebruiken ook een “nonsenstaal”: "brok" = “pak vast”, “mwéh” = “kom mee”. Dat maakt dat je er zelf even hard over moet nadenken - over "taal". Een soort Esperanto :-).

    Ik laat nog even Elma Middel aan het woord: “Het voordeel van uitbreiden van onze communicatietool met paarden zie
    ik in  het weerbaarder maken, het bieden van ontwikkeling aan het dier in gevangenschap. De kans om te 'studeren' in de cel of de luchtplaats, waardoor ze de box als speeltuin en de luchtplaats als balzaal gaan apprecieren.  We nemen ze een heleboel af, vrijheid, spanning, keuzes maken onder stress in de natuur, en hoe groter ons onderling esperanto (in woorden, gebaren, whatever) hoe minder verwarring, hoe duidelijker de interactie, hoe minder misverstanden, hoe meer we hen ook leren 'lezen',
    en hoe meer mogelijkheden om belangrijk voor elkaar te worden. In die zin zie ik het als een kans en niet als een bedreiging. Het ontkennen en onthouden van de mogelijkheid dat paarden meer kunnen leren dan stap, drrrrraf, gaaaalop, braaf en voetje zou je kunnen bekijken als debiliseren van het paard en miskennen van hun potentieel. We hebben dat eerder gehad met apen, dolfijnen, slaven, vrouwen... en we doen dat nog met autistische kinderen, mensen met gehoor en gezichtsproblemen enz.
    Zoeken naar vormen van communicatie is echter ook altijd omstreden geweest in de kringen die vonden dat ze het al 'goed'  deden, omdat verandering hoe dan ook gepaard gaat met weerstand en angst. Wat ethisch wel en niet verantwoord is, zal vermoedelijk per persoon en horsanality verschillen. Wel een tuig op om een kar te trekken en geen hoedje? Ik weet niet of dat zo verschillend is, behalve dat het een calvinistisch 'nuttig'  is en het andere 'plezier'? Als het paard er lol in heeft is dat duidelijk zicht-, merk- en voelbaar.”

    “We hebben te maken met persoonlijkheden, feitelijk ontwikkelingsniveau, sociaal ontwikkelingsniveau en een pakket bagage uit het verleden en van daaruit kunnen we kijken hoe ver we met elkaar kunnen en willen komen. It all depends.... “

    Inge, met dank aan Els Van der Zanden en Elma Middel
     
     
     
     

    textes avec les photos:

    Spelen (met de bal) en leren: het paard leert hier het verschil tussen
    rood en blauw.

    Geen hulpteugel komt eraan te pas. een R+-toepassing van de “calm down cue” of kalmeer nu-teken. Eerst tijdens het longeren, later tijdens het rijden wordt het paard gevraagd om het hoofd laag te houden. In een later stadium kan het paard leren de kin meer naar de borst toe te “targetten”. Zo leert het paard hoe het z’n hoofd kan houden, zonder dat het paard ertoe op een of andere manier gedwongen wordt. Het paard zal, zodra er meer impuls wordt gevraagd, sneller de weg vinden naar een lage hoofdspositie, en sneller de weg vinden naar het het strekken van de bovenlijn. Bridge&Target combineert bovendien de lage hoofdhouding met het targetten van de rug naar boven toe.

    Els en Mona: het zitten op commando begon oorspronkeleijk als “betrapt gedrag” (catching the behaviour) en werd daarna op commando gezet.

    Annemarie: desensitizing

    Monique leert de Spaanse pas aan Trix.

    Targetten met de voorknie (foto Carol Dent)
     
     


    d'autres info sur la partie Horsemanship du site