CLICKER TRAINING




Ajoutez cette page à vos favorites

 

Conditionnement opérant

Les principes du conditionnement opérant (CO) décrivent la façon dont les animaux apprennent.

Lorsqu'un entraîneur utilise le CO, il applique les principes pour obtenir les résultats attendus.

Le CO divise l'apprentissage en trois parties :
- le stimulus qui provoque le comportement,
- le comportement réel de l'animal,
- la conséquence, résultant du comportement.


Selon ce schéma théorique, la conséquence d'un comportement détermine s'il se répétera ou non dans le futur.
Si la conséquence renforce le comportement, à savoir que ce comportement se répétera plus souvent, on dira que le comportement a été renforcé.

D'autre part, un comportement qui provoque des conséquences déplaisantes se présentera moins fréquemment.
La punition (comme décrite ci-dessous) supprime les comportements non désirés.

Autrement dit, les comportements qui sont renforcés se reproduiront plus souvent et les comportements qui ne sont pas renforcés tendront à moins se reproduire.

Dans tous les cas, la conséquence résulte de quelque chose ajouté (+) ou retiré (-) à l'environnement.

Ceci nous amène à définir les quatre termes clés du CO.
Mais avant cela, voici quelques définitions importantes à comprendre car certains termes sont utilisés différemment de leur usage courant.

- Comportement : quelque chose que l'animal fait (s'asseoir, voler, sauter, etc.)

- Renforcement : l'utilisation ou la suppression immédiate d'un stimulus pour AUGMENTER la fréquence de reproduction d'un comportement voulu par l'animal

- Punition : l'utilisation ou la suppression immédiate d'un stimulus pour DIMINUER la fréquence de reproduction d'un comportement voulu par l'animal

- Renforceur : type de récompense

- Moyen dissuasif : quelque chose que l'animal cherchera à éviter

- Positif : ajouter quelque chose à l'environnement

- Négatif : retirer quelque chose à l'environnement

Voici à présent les quatre termes clés du CO

- Renforcement positif (R+) : ajouter quelque chose que l'animal aime, immédiatement après un comportement et comme conséquence directe de celui-ci, tend à augmenter la fréquence du comportement
Ex. vous dites à votre enfant comme vous êtes fier de lui quand il dit merci.

- Renforcement négatif (R-) : retirer quelque chose que l'animal n'aime pas, immédiatement après un comportement et comme conséquence directe de celui-ci, tend à augmenter la fréquence du comportement.

Il existe deux types de R- :
a) Le premier est l'évitement : ex. l'enfant range sa chambre pour éviter la réprimande. Dans ce cas, la menace du moyen dissuasif est retirée.
b) Le deuxième est la fuite : ex. les parents crient sur l'enfant tant qu'il n'a pas rangé sa chambre ; les cris cessent lorsque la chambre est rangée.
Dans ce cas, le moyen dissuasif est d'application tant que le comportement n'a pas été obtenu et ne disparaît qu'après l'obtention du comportement.

- Punition positive (P+) : ajouter quelque chose que l'animal n'aime pas, immédiatement après un comportement et comme conséquence directe de celui-ci, tend à diminuer la fréquence du comportement : ex. enfant maltraité.

- Punition négative (P-) : retirer quelque chose que l'animal aime, immédiatement après un comportement et comme conséquence directe de celui-ci, tend à diminuer la fréquence du comportement : ex . un enfant privé de dessert.

Ces quatre principes peuvent être combinés entre eux pour obtenir, maintenir ou éliminer des comportements. Certaines combinaisons seront plus humaines que d'autres et certaines combinaisons sont très traumatisantes pour les animaux.

Skinner a défini des principes qui élargissent les concepts de base.
L'un d'entre eux est l'extinction.
Si un comportement n'est pas renforcé, même après avoir été conditionné, il s'éliminera graduellement ou changera.

Vous pouvez combiner l'extinction avec l'un des quatre principes précédents.
Ex. extinction + R+ : l'oiseau crie, vous ignorez, l'oiseau s'arrête de crier, vous récompensez avec une friandise.

L'extinction seule ne fonctionnera pas si le comportement que vous essayez d'éteindre est auto-valorisant.
Ex. vous pouvez ignorer le chien qui mâche l'os mais comme, pour le chien, mâcher l'os est sa récompense favorite, il n'arrêtera pas.

Les Bailey utilisèrent le R+ , l'extinction et occasionnellement le P-.
Ils ont prouvé que cette approche permet de réussir avec chaque individu dans chaque espèce. Le tout est de savoir si l'entraîneur est capable d'appliquer ces règles.
Il y a de bons et de mauvais entraîneurs.
La fiabilité vient de la rigueur, de la répétition, d'un solide plan d'entraînement et d'un entraîneur dévoué.

Pratiquez avec intention. Généralisez le comportement. Entraînez-vous dans les conditions qui sont celles où vous avez besoin d'un comportement fiable.
Travaillez sur la latence (intervalle entre le moment où vous souhaitez voir le comportement et le moment où l'animal l'exécute. Il devrait être nul).
Gardez des notes et entraînez votre animal jusqu'à ce que vous obteniez le niveau de fiabilité nécessaire.