Adiestramiento Canino: ¿Siempre? ¿A veces? ¿Nunca?

En primer lugar, diremos que en adiestramiento canino es imprescindible reforzar las conductas. El reforzador es el premio de la conducta. Gracias al refuerzo se consolida el comportamiento. En estas líneas hablaremos del siempre, del a veces y del nunca a la hora de emplear reforzadores.

Adiestramiento canino: Breve recuerdo del aprendizaje

Partimos de la base de que el objetivo del adiestramiento canino es enseñar comportamientos.

Para producir en el perro “ganas de hacer”, empleamos estímulos concretos. Por ejemplo, la comida, o la pelota.

Y, durante el adiestramiento canino enseñamos los comportamientos que nos interesan (p. ej.: sentarse bajo comando).

Algunos, desencadenados por nuestra señal (p. ej. sentarse a la orden).
Otros, acordes a la situación (p.ej., el perro presiona al figurante, sin morder, cuando éste está inmóvil).

En este sentido, el perro realiza un comportamiento determinado para lograr un resultado concreto. Por ejemplo: el perro se sienta porque espera recibir comida. La comida es el reforzador.

Hablamos de que hay refuerzo cuando el perro logra lo que desea. Un refuerzo es un premio. Por el contrario, obtener lo que no se quiere es un castigo.

El mejor método del adiestramiento canino en positivo es la captura. Capturar es “fotografiar” el comportamiento. Y premiarlo.

Capturamos con clicker (o con la voz) y reforzamos con aquello que el perro desea en ese momento. Es inconsecuente que, si el perro quiere agua, le demos un paseo. Del mismo modo, si trabaja por la comida no estaría bien premiarle con la pelota.

Igualmente, al tiempo que enseñamos buenas conductas enseñamos que otras no son admisibles (p. ej.: ladrar a los perros).

Al contrario de lo que hacíamos con los comportamientos deseados, los comportamientos indeseados no los premiamos. La ausencia de premio es, en sí misma, un castigo (se denomina castigo negativo, como veremos después.).

En resumen:

Estímulo (E): Señal percibida por el individuo provenientes de agentes externos (medioambientales, seres vivos, etc.) o internos (dolor, bienestar, etc.).
Respuesta: Emoción, cambios fisiológicos y comportamiento relacionados con el estímulo percibido.
Consecuencia:
- Refuerzo (R): Consecuencia positiva del comportamiento secundario a un estímulo determinado.
- Castigo (C): Consecuencia negativa del comportamiento en reacción a un estímulo concreto.

Estímulo –> Comportamiento –> Consecuencia = R o C

Tipos de refuerzo y de castigo

Suele haber confusión con los siguientes términos: refuerzo positivo (R+) y negativo (R-), castigo positivo (C+) y negativo (C-). Así se denominan en los textos de psicología.

Intentaré dejarlos claros.

La regla es:

Refuerzo es bueno / Castigo es malo.
+ equivale a que hay / – significa que no hay.

Por consiguiente:

(R= comida / C = presión / + = Hay / – = No hay)

R+: Hay comida.
R-: No hay presión.
C+: Hay presión.
C-: No hay comida

Aprendizaje asociativo

El proceso de asociación permite aprender y dar sentido a innumerables nuevos estímulos, refuerzos y comportamientos . Al juntar un estímulo que tiene sentido para el perro con otro que no significa nada, éste último acaba significando lo mismo que el primero. Y lo mismo sucede en el caso de los refuerzos.

Repasemos muy brevemente cómo ocurre.

Aprendizaje de estímulos. Condicionamiento clásico. Experimento de Pavlov (Fisiólogo ruso 1849 -1936).
- De entrada, el estímulo incondicionado (EI) y biológico “comida” produce en el perro la respuesta incondicionada (RI) “salivación”. EI — RI
- Igualmente, el estímulo neutro “sonido” (EN) no produce ninguna respuesta. EN — R0
- Durante el condicionamiento, la asociación EN + EI produce “salivación”. EN-EI — RI
- Después de varias repeticiones, se produce el condicionamiento. Entonces, el EN se ha convertido en EC.
- Finalmente, el EC, por sí solo, produce la respuesta condicionada “salivación” (RC), que en este caso es la misma que la RI. EC (=EN)à RC (=RI)

Aprendizaje de refuerzos.
- El mismo proceso de asociación se produce en el caso de los refuerzos. Así se condicionan refuerzos (RC). Un ejemplo sería asociar, durante el condicionamiento, voz y comida. Cuando se ha establecido la asociación, la voz sirve como refuerzo. En este caso, hemos condicionado la voz (RC), que sirve como refuerzo social. Éste es útil en los 3 escenarios: casa, manada y deporte. Sirve para hacer equipo perro-guía, fomentando el vínculo.

Aprendizaje de comportamientos. Condicionamiento experimental. Skinner (Psicólogo americano 1904 – 1990).
- La conducta es el instrumento para lograr el objetivo deseado (dicho objetivo es el R).
- Los comportamientos exitosos, como son reforzados positivamente, tienden a presentarse con mayor frecuencia.
- En cambio, tanto los comportamientos sin refuerzo, como conllevan castigo, tienden a extinguirse.

Aprendizaje no asociativo

A diferencia de lo que ocurre en el aprendizaje asociativo, con aprendizaje no asociativo la conducta se modifica a través de la exposición a un estímulo aislado.

Este tipo de aprendizaje se produce de dos maneras:

Habituación (Encharcamiento): Cuando el estímulo aislado es de pequeña intensidad. La exposición repetida a un estímulo (sonido de disparo, p. ej.) acaba produciendo la ausencia de respuesta ante dicho estímulo.
Sensibilización: Cuando el estímulo aislado es de gran intensidad. Ante una exposición única a un estímulo fuerte y sorpresivo (como una explosión p. ej.), la sensibilización se produce de inmediato. Y, además, sucede simultáneamente en el perro lo que conocemos como “generalización” del comportamiento. Cuando el comportamiento se generaliza, estímulos parecidos al inicial ejercen la misma influencia.

Aprendizaje en el adiestramiento canino

Afortunadamente, los modernos métodos de adiestramiento consideran siempre la cognición y la emoción asociada a ella. El aprendizaje se produce:

Por repetición.
Siempre manteniendo la motivación.
Con compromiso.

En primer lugar, el perro aprende (con técnica de captura, p.ej). Finalmente, el aprendizaje se consolida.

Reforzadores

La motivación se establece en base al reforzador empleado. Por ejemplo: los perros con mucho instinto de presa, alcanzan un mayor nivel de motivación con la pelota que con la comida.

Al comienzo del aprendizaje, el reforzador debe estar a la vista del perro. El reforzador actúa como estímulo motivador. Por consiguiente, al principio se entrena bajo estimulación directa.

Más adelante, el perro debe esperar recibir el refuerzo, sin necesidad de verlo. Por ello, en esta fase, el grado de motivación y, paralelamente, el nivel de energía, se establecen en base a la esperanza de refuerzo.

Recordemos que el refuerzo puede ser de naturaleza:

Social: Voz “Bieen” del guía p. ej.
Ambiental: Hay confort, hay seguridad, hay tranquilidad…
De presa: Comida, pelota…

Y que el castigo es la ausencia de refuerzo o la presencia de presión de cualquier tipo (p. ej. ausencia de comida, correa tensa, etc.).

Por fin, llegamos al título de este artículo.

SIEMPRE, A VECES, NUNCA. ¿Puede ser contraproducente en determinadas ocasiones reforzar siempre?

En la vida, ni todo es bueno ni todo malo. El yin y el yang, según la filosofía taoísta, son opuestos pero interdependientes. Los seres humanos tenemos esta dualidad. Los animales también. Y lo mejor tiene siempre algo no tan bueno, como lo peor conlleva algo no tan malo.

“Siempre” es bueno, pero también algo malo.
“A veces” debe guardar un equilibrio. Mejor sería hablar de “casi siempre”.
“Nunca” habría de ser más bien casi nunca.

Siempre, a veces, nunca. ¿Cómo debemos reforzar?

SIEMPRE / A VECES

Ventajas de reforzar SIEMPRE:

La repetición con refuerzo constante facilita el aprendizaje.
Que exista refuerzo siempre potencia la autoestima.
El refuerzo siempre presente incentiva el esfuerzo.
Además, cuando siempre hay refuerzo se mantiene la motivación durante el adiestramiento canino.

Desventajas de reforzar SIEMPRE:

Reforzando siempre, el refuerzo llega a perder importancia. Por tanto, se puede producir disminución de la apetencia. Y, por tanto, una cierta laxitud en la conducta.
Puede ocurrir que, si siempre hay refuerzo, se produzca una dependencia al mismo. Dicho de otra forma: si el perro no espera el refuerzo no emite conducta.
Si siempre se refuerza no se puede trabajar la frustración. Si llevamos a cabo un adiestramiento verdadero, hemos de enseñar al perro a manejarse en situaciones adversas. Superando, entre otras cosas, la frustración que supone no obtener lo que se espera cuando se desea.
En caso de que el perro se acostumbrase a ser siempre reforzado, sólo trabajaría por apetencia. Porque, reforzando siempre no se entrena el compromiso. Por ejemplo, si el reforzador diario fuese la comida, el perro no desaría trabajar sin hambre.

Conclusiones de la frecuencia de refuerzo en adiestramiento canino

Del análisis de estas ventajas y desventajas se desprenden las siguientes conclusiones enfocadas al adiestramiento canino:

Se debe reforzar siempre durante las fases iniciales del aprendizaje.
Cuando una conducta ya se ha aprendido, es mejor emplear refuerzo intermitente. Así, sobre todo, el perro aprende a gestionar la frustración sin que decaiga la motivación. Es más, de esta forma, la pequeña frustración que supone para el perro el hecho de no recibir el reforzador en una ocasión determinada, aumenta su energía de acción para obtenerlo la próxima.

Refuerzo no siempre

Por consiguiente, el refuerzo no debe estar siempre presente en adiestramiento canino.

Castigo siempre

En cambio, el castigo sí debe ocurrir siempre. Porque el hecho de que un castigo no se produzca cuando el perro lo espera, refuerza la conducta indeseada.

NOTA: Entendamos por castigo el hecho de que no se produzca el refuerzo (castigo negativo). O que produzcamos al perro una pequeña incomodidad, como p.ej. manipularle del collar (castigo positivo).

La primera gran causa culpable de que se produzcan conductas indeseadas es el castigo “a veces”. Si castigamos al perro por subirse al sillón y, alguna vez, le permitimos hacerlo sin que ocurra nada, se reforzará fuertemente el hecho de subirse.

NUNCA. Entonces… ¿cuando el nunca?

Nunca se debería premiar un fallo. Desgraciadamente, con frecuencia no sucede así. Premiar los fallos es la segunda gran causa culpable de que el perro se confunda durante el aprendizaje. La primera es no castigarlos.

El secreto infalible para que funcione un método de enseñanza canina es hacer las cosas siempre igual. O lo más parecido posible.

Debemos dominar el manejo de estímulos y de refuerzos. Se ha de conocer la técnica. A la perfección. Se requiere práctica. Pero no basta con eso.

Lo que marca la diferencia es aplicar la técnica que se domina con arte.

El adiestramiento puede ser artístico. Y si hay arte el espectador sensible lo percibe. Porque arte no es sino la capacidad de producir una emoción en el público.