Aprendizaje e inteligencia animal

Introducción.
  • Los procesos de aprendizaje son la principal herramienta para modificar la conducta de un perro.
  • El aprendizaje y sus leyes subyacen a cualquier programa de adiestramiento canino y es una parte esencial de cualquier tratamiento de un problema de conducta.
  • Sin embargo, no todos los cambios de conducta observados en un perro se deben al aprendizaje.
Aprendizaje.
  • Cambio más o menos duradero de los mecanismos fisiológicos que controlan una determinada conducta y es fruto de la experiencia previa con los eventos ambientales que se relacionan de forma específica con dicha conducta.
  • Es el desarrollo o cambios que tienen los esquemas mentales y consecuentemente el comportamiento del animal como resultado de experiencias y destinado a mejorar sus condiciones de supervivencia o bienestar.

Existen dos situaciones en que el perro varía su conducta, aparentemente por interacción con el ambiente, no siendo realmente así y no constituyendo aprendizaje:

1. Los cambios de comportamiento como consecuencia de la maduración de estructuras físicas necesarias para realizar ese comportamiento concreto. Los cambios conductuales del macho al alcanzar la madurez a consecuencia de la actividad hormonal.

2. Conductas que tienen un origen instintivo pero que requieren un proceso de entrenamiento para perfeccionarse y llegar a ser totalmente funcionales. Las secuencias del perro para la caza.

Factores que influyen y modifican en aprendizaje.

  • Factores Genéticos.
  • Interacciones genotipo- ambiente.
  • Diferencias entre razas.
  • Cambios ambientales.
  • Manipulación neonatal.
  • Malnutrición.
  • Enfermedades.
  • Miedo a situaciones nuevas.
  • Maduración del Sistema Nervioso Central.
  • Hormonas.
  • Fatiga o cansancio físico.
Tipos de aprendizaje.
  • Por ensayo y error (principal forma de aprender).
  • Por mapas mentales (cambios alternativos para llegar a la misma solución).
  • Por imitación.
  • Por comprensión.

Es necesario también una motivación positiva o negativa.

Principales fenómenos del aprendizaje.

Aprendizaje no asociativo:

  • Habituación.
  • Sensibilización.

Aprendizaje asociativo:

  • Condicionamiento Clásico. Sr. Iván Petróvic Paulov.
  • Condicionamiento Operante e Instrumental. Sr. Burrhus Frederic Skinner.
  • Conductismo. Estímulo-Respuesta. Sr. John Broadus Watson.
  • Ley del Efecto. Ensayo y error. Positivismo. Sr. Edward Lee Thorndike.
  • Aprendizaje observacional. Aprendizaje basado en la observación de la conducta del otro.

Aprendizaje no asociativo:

Fenómeno de aprendizaje fundamental en la adaptación de un organismo a su ambiente o medio, variando su conducta ante la presentación repetida de un estímulo. El aprendizaje no asociativo es un tipo de aprendizaje en el que se produce un cambio en la conducta como resultado de la experiencia repetida de un único estímulo.

Habituación.

Consiste en el descenso en la tasa de respuestas del perro tras la exposición repetida a un estímulo.

Características de los efectos de habituación:

  • Más rápido cuanto más débil sea el estímulo.
  • Las respuestas de habituación pueden producirse a corto o largo plazo. El intervalo necesario para la recuperación de una respuesta habituada varía entre minutos y semanas, dependiendo de la especie y la respuesta.
  • La habituación a un estímulo determinado no causa habituación a estímulos similares. Frecuentemente, la presentación de estímulos algo diferentes de aquellos que se ha empleado en el proceso de habituación, produce una recuperación de la respuesta (es decir, una pérdida de la habituación adquirida) que se denomina deshabituación. Ejemplo. El perro se habitúa al timbre de la puerta, pero no al timbre del teléfono.
  • Puede aparecer recuperación espontánea. Tras un período prolongado sin presentación del estímulo el animal puede recuperar la respuesta de ese estímulo.

Hay que tener en cuenta que no todo decremento de una respuesta es habituación. La saciación, la fatiga muscular, y la adaptación sensorial, también producen un decremento de una respuesta y no son habituación.

Sensibilización.

Consiste en el incremento en la tasa de respuesta del perro tras la exposición repetida a un estímulo.

Características de los efectos de sensibilización:

  • La sensibilización puede producirse incluso con una sola presentación del estímulo.
  • Fenómeno contrario a la habituación.
  • La sensibilización es el fenómeno de aprendizaje que subyace en las reacciones de miedo, especialmente en las fobias.
  • La especificidad del estímulo es menos que en la habituación, se extiende más fácilmente a estímulos similares.

Factores que determinan que se produzca habituación o sensibilización

  • Naturaleza del estímulo: Petardos, más sensibilización que habituación.
  • Intensidad del estímulo: Más baja intensidad—-más habituación.
  • Contexto: Si el ambiente es favorable para el perro más fácil habituación.
Técnicas de modificación de la conducta.

Inundación, saturación, flooding.

  • No frecuente, consiste en presentar el estímulo en grado elevado hasta que la conducta desaparece.
  • El animal es expuesto continuamente al estímulo que le causa temor y se le impide escapar hasta que se encuentre completamente relajado.
  • Técnica peligrosa, porque tiene riesgo de producir hiper o sobre sensibilización.
  • Hay que tomar precauciones porque ante una reacción de huida el animal puede producirse un daño físico o psicológico o dañar el entorno.
  • Siempre que el animal tenga poco miedo.

Desensibilización sistemática.

  • Aconsejable. Consiste en presentar el estímulo con una intensidad suficientemente baja como para que no provoque la respuesta o respuesta mínima.
  • Poco a poco el perro se va habituando al estímulo y podemos aumentar la intensidad sin que aparezca la respuesta.
  • Técnica a largo plazo.
Aprendizaje asociativo.
Condicionamiento clásico. (Iván Petróvic Paulov).
  • Consiste en el establecimiento de una asociación entre dos estímulos presentes.
  • Aprende a relacionar dos estímulos que antes del aprendizaje no estaban relacionados.
  • El animal aprende que la presentación del estímulo condicionado predice la del incondicionado.
  • El condicianamiento clásico asocia conductas involuntarias (reflejas): salivación, dilatación de la pupila…y emociones.

Elementos clave en el condicionamiento clásico:

  • Estímulo incondicionado: (no condicionado). El trozo de carne. Debido a que la comida es un estímulo y la vista de ella produce la salivación sin más.
  • Respuesta incondicionada: (no condicionada). Es la salivación del perro, cuando ocurre de forma natural, no aprendida.
  • Estímulo neutro: El sonido de la campana por sí solo. Es el estímulo condicionado de manera natural.
  • Estímulo condicionado: La campana. Cuando suena la campana sin más y es lo que produce la salivación del perro.
  • Respuesta condicionada: La salivación del perro, cuando ocurra como reacción al sonido de la campana. Es una respuesta aprendida.

En resumen se puede decir que el condicionamiento clásico consiste en aprender una respuesta condicionada que involucra la construcción de una asociación entre un estímulo condicionado y un estímulo incondicionado. Al utilizarlos juntos, el estímulo condicionado que de manera natural era neutro, adopta las propiedades del estímulo no condicionado.

Finalizado el aprendizaje, el estímulo condicionado es capaz de evocar una respuesta por sí solo.

Los requisitos para que se produzca aprendizaje son:

  • Timing o simultaneidad: Estímulo condicionado debe presentarse de forma simultánea, ligeramente antes del estímulo incondicionado. El estímulo incondicionado justo después del condicionado.
  • Contingencia: Probabilidad de que, ante la presentación del estímulo condicionado, aparezca seguidamente el incondicionado.

Sobre la base del condicionamiento clásico:

  • Generalización: El animal responderá siempre ante un estímulo parecido al condicionado.
  • Discriminación: El animal aprende a no responder a estímulos que se parezcan al condicionado.

Aprendizaje de rechazo de determinados sabores: Es un caso especial de condicionamiento clásico. Ante la ingestión de comidas nuevas que se asocian con la enfermedad que surgió más tarde, el animal rechazará la comida que lo enfermó.

Extinción: La presentación repetida de un estímulo condicionado sin el incondicionado resultará en un debilitamiento gradual y termina por desaparecer la respuesta condicionada.

Contracondicionamiento: Proceso por el cual cambiamos el significado de un estímulo condicionado previamente.

  • Se utiliza cuando queremos eliminar conductas negativas.
  • Antes que aparezca la respuesta negativa provocamos una respuesta positiva que sea incompatible con la respuesta negativa.
  • Se pretende sustituir un comportamiento indeseable por uno deseable en una situación determinada.
  • Dinámico: La acción sustituida implica movimiento en el perro. Se utiliza para contracondicionar conductas que requieren salida o gasto de actividad en el perro.
  • Estático: La acción sustituida implica inmovilidad en el perro (en cualquier posición). Se utiliza para contracondicionar conductas que requieren extinción de actividad y/o introducción de tranquilidad en el perro.
Condicionamiento operante o instrumental. (Burrhus Frederic Skinner)
  • Establecimiento de una asociación entre una determinada pauta de conducta y las consecuencias (estímulos) derivadas de su presentación.
  • Conductas que producen estímulos.
  • El perro aprende las consecuencias de sus conductas.
  • Es el fundamento del adiestramiento del perro.
  • El comportamiento cambia de forma / frecuencia dependiendo de las consecuencias que este produce.
  • Al comportamiento se le denomina respuesta operante y al estímulo reforzador/ refuerzo, castigador/ castigo.

 

  • Refuerzo: Estímulo que incrementa la probabilidad de un comportamiento previo a él.
  • Castigo: Estímulo que reduce la probabilidad de un comportamiento previo a él.
  • Positivo: (refuerzo o castigo), estímulo que se añade a una situación (comida o sacudida…)
  • Negativo: (refuerzo o castigo), estímulo que es eliminado de una situación (cese de la sacudida o negación de la comida…)

Refuerzo positivo:

  • La conducta se asocia con la aparición de un estímulo positivo para el animal.
  • La presentación de la conducta aumenta.

Refuerzo negativo:

  • La conducta se asocia con la desaparición de un estímulo negativo para el animal.
  • La presentación de la conducta aumenta.

Castigo positivo:

  • La conducta se asocia con la aparición de un estímulo negativo para el animal.
  • La presentación de la conducta disminuye.

Castigo negativo:

  • La conducta se asocia con la desaparición o la no-presentación de un estímulo positivo para el animal.
  • La presentación de la conducta disminuye.

Cómo condicionar un comportamiento.

1. Incitación y desvanecimiento.

Provocar un comportamiento mediante una señal, premiar la respuesta deseada, y en los ensayos posteriores reducir la intensidad de la señal inicial.

2. Moldeamiento.

Entrenamiento por aproximación sucesiva.

  • Reforzar aquellos comportamientos que se dan de un modo natural y que se parecen mucho al comportamiento deseado.
  • En el entrenamiento, la conducta se moldea premiando al principio la acción genérica y posteriormente, ofreciendo la recompensa solo ante la manifestación de acciones específicas.
  • La repetición es importante y la habilidad del entrenador consiste en ir reconociendo los pequeños progresos y en ir recompensando cada uno de ellos ya que incluso el más pequeño de ellos puede ser la clave del objetivo perseguido.
  • Después solo se recompensaran las respuestas deseadas.
3. Reforzadores positivos.

Refuerzo incondicionado o primario. Es aquel que adquiere su capacidad de actuar como refuerzo por estar directamente relacionado a la satisfacción de las necesidades naturales del organismo. Tiene una mayor importancia por encima de otro refuerzo. (ej. Comida y agua).

Refuerzo condicionado o secundario. Es aquel que adquiere su capacidad de fungir como refuerzo porque el organismo lo ha relacionado con la adquisición de refuerzos primarios. Todo estímulo originariamente neutro que ha adquirido sus propiedades reforzantes por medio de la asociación con otros reforzadores. (ej. Voz, caricias, elogios , felicitaciones, clicker).

  • El refuerzo, incondicionado o primario, ej. comida, agua. Va precedido consistentemente por un estímulo neutral, (ej. La voz).
  • El estímulo neutral adquiere propiedades reforzadoras, se convertirá en un refuerzo condicionado.
  • Luego, el refuerzo condicionado necesitara asociarse intermitentemente con el refuerzo primario.
  • Es muy útil porque es fácil de aplicar, incluso a distancia y puede utilizarse en diferentes situaciones.

Programación de refuerzos. Los dos programas están guiados en el reforzamiento positivo.

Refuerzo continúo:

  • El estímulo que se presenta siempre que se realiza la conducta.
  • Da como resultado un aprendizaje rápido.
  • Son poco resistentes a la extinción.

Refuerzo discontinuo o intermitente:

  • El estímulo se presenta sólo en algunas ocasiones en las que se realiza la conducta.
  • Ofrecen una curva de aprendizaje lenta.
  • Son muy resistentes a la extinción.

Programación por tasas:

  • Tasa fija: Se recompensa un número concreto de respuestas.
  • Tasa variable: Se recompensa un número medio de respuestas.

Programación de intervalos:

  • Intervalo fijo: La respuesta no es premiada hasta que no ha pasado un intervalo de tiempo dado desde que se premió por última vez la respuesta.
  • Intervalo variable: La respuesta es premiada sólo después de que haya pasado un intervalo de tiempo variable desde que se presentó por última vez.
4. Sobreaprendizaje.

Es el condicionamiento continuo de respuestas que el animal ya realiza perfectamente.

Sus efectos son:

  • Retención en la memoria por más tiempo.
  • Disminución del tiempo de recuperación espontánea de la habituación.
  • Incrementa la resistencia a la extinción de las respuestas operantes.
  • Respuestas más consistentes en ambientes estresantes o que producen confusión o distracción.
5. Extinción.

Cuando una respuesta aprendida no se refuerza, el comportamiento se perderá gradualmente. La extinción es un proceso activo en el cual las respuestas son realizadas, pero al no ser reforzadas la frecuencia de que se manifieste el comportamiento irá disminuyendo hasta el nivel basal. El refuerzo intermitente hace que un comportamiento sea más resistente a la extinción.

6. Entrenamiento discriminativo.

El comportamiento solo es reforzado cuando se presenta un estímulo determinado, Ej. Al perro solo se le premiara cuando a la orden de “ven” la cumple.

7. Contracondicionamiento.

Se pretende sustituir un comportamiento indeseable por uno deseable en una situación determinada.

8. Encadenamiento.

Es un condicionamiento para que se realice una secuencia de comportamientos. Se condiciona el último comportamiento de la secuencia con un refuerzo primario.

9. Tipos de refuerzos (reforzadores):
  • El premio más valioso es aquel que hace que el animal aprenda más rápidamente.
  • También puede ser la retirada de un premio cuando no realiza lo enseñado.
  • Los premios tienen que darse bajo control de lo consciente.
  • También tienen que ofrecerse en un intervalo de tiempo correcto.
  • El premio tiene que ser el adecuado al comportamiento que se desea.
  • Tienen que ser variados, uno para cada comportamiento (comida, ejercicio, elogios, caricias, etc.)

El principio de Premack es una teoría del reforzamiento psicológico. Este principio fue formulado por David Premack (de quien recibe su nombre) quien pensó que de dos estímulos, el que más probabilidad de ocurrencia tuviera reforzaría al otro.

Este principio parte de dos supuestos:

  • El primero es que si a un sujeto se le da acceso libre a dos actividades dedicará un tiempo determinado a cada una de ellas y ese porcentaje de tiempo refleja la probabilidad de esa actividad y, en consecuencia, el grado de preferencia de esa actividad.
  • El segundo supuesto hace referencia a la relación de reforzamiento, que implica siempre dos conductas: una actividad preferible refuerza la ejecución de una respuesta menos preferente si el acceso a la actividad preferida se hace contingente respecto a la ejecución de la actividad menos preferida.

Ejemplo: A tu perro le encanta salir a la calle, así que cada vez que abres la puerta sale disparado, o por lo menos intenta salir. La conducta de salir a la calle es de alta probabilidad cuando abres la puerta. Entonces, decides usar esta conducta como reforzador para enseñarle a tu perro a esperar hasta que le des una orden para salir a pasear. Abres la puerta pero le bloqueas el paso a tu perro para que no pueda salir. Cuando tu perro retrocede, vuelves a dejar libre el paso. Él vuelve a intentar salir y le vuelves a bloquear el paso. Repites este procedimiento varias veces hasta que tu perro espera por un segundo. En ese momento, le das la orden para ir a pasear y le permites salir. Gradualmente, y en varias sesiones, aumentas el tiempo que tu perro debe esperar hasta que le permitas salir.

A. Los contactos. Ásperos y rápidos, provocan agresión y excitabilidad porque así no es socialmente aceptado.

B. Caricias suaves. Tienen un efecto calmante.

C. Caricia prolongada. Provoca dependencia y el cuidador será perseguido continuamente por el animal reclamándosela.

D. Los sonidos. Los elogios pueden ser utilizados a distancia. Son más eficaces si se asocian con comida (refuerzo condicionado). En el entrenamiento se suele utilizar un tono adecuado como premio en el entrenamiento de relajación o cuando hace un buen comportamiento. El castigo también tiene que acompañarse de un tono fuerte, firme de voz.

E. Comida. Es el mejor, da mejores resultados si es muy deseada o apetitosa.

F. Actividad física y juego.

G. Las actividades orales, las eliminativas, psíquicas. Pueden resultar gratificantes para el perro por el efecto tranquilizador cuando el animal está hiperactivo a causa de una frustración.

H. Atención. Los propietarios pueden premiar inadvertidamente conductas indeseables como: hiperexcitabilidad, arañado de puertas y automordisqueo en reclamación de atención.

I. Evitación del dolor. El entrenar a un animal a cómo evitar o prevenir el dolor por medio de la manifestación de la respuesta correcta es un tipo de entrenamiento por medio del refuerzo negativo. Induce un rápido aprendizaje que es muy resistente a la extinción. Una vez que la respuesta se ha aprendido el comportamiento se consolida porque el perro es premiado cada vez que realiza la respuesta (al no percibir dolor). El tiempo que transcurre entre la orden, el estímulo adverso y el premio es crítico. Si se ha aprendido una orden por medio de la evitación del dolor, aprenderá más rápidamente las otras órdenes que por medio del condicionamiento clásico.

Factores que afectan al refuerzo positivo:

  • La elección del momento adecuado.
  • Tasas de refuerzo.
  • La habilidad de entrenador de poner el criterio.
  • La habilidad de entrenador de aumentar el criterio.
  • El estado emocional de perro.
  • La salud de perro.
  • La propensión del perro para el entrenamiento o para realizar la conducta que está ejecutando.
  • El temperamento de perro.
  • Estrés en el ambiente de entrenamiento.
  • La actitud de entrenador.
  • Eventos significantes que ocurren antes/durante la asociación con el refuerzo o conducta.
  • Qué bienestar o incomodidad asocia con la conducta que está ejecutando.
  • El factor distracción.
  • La asociación del refuerzo con la conducta correcta.
  • La fuerza del reforzador, sobre todo en la competencia entre los reforzadores y castigos.
  • La oportunidad del perro para cambiar su conducta y así seguir consiguiendo el refuerzo.
  • Si adquirimos la habilidad de hacer positivos tantos de estos factores como sea posible, con el tiempo la conducta que estamos intentando entrenar se convertirá así misma en un reforzador: ¡El premio mayor!
  • Sólo recuerda que no es una garantía absoluta.
10. Los castigos.

Cuando empleamos el término castigar, nos referimos a una experiencia desagradable que se recuerda. Hablamos de un susto o un toque de atención, lo suficiente para que no quiera repetir. Lo importante es que asocie el castigo con la mala conducta, nunca con el propietario o entrenador. Por eso se hace a distancia, de una manera impersonal.

¿Cuándo es el mejor momento para castigar un comportamiento?:

Cuándo el perro está pensando en hacerlo; en el momento exacto en que está deseando hacerlo pero todavía no lo ha hecho. Se utiliza para eliminar comportamientos no deseados, como: escarbar la basura, hacer agujeros en el jardín, morder las patas de los muebles, marcar zonas protegidas, etc. Los mejores trabajos se consiguen premiando los comportamientos adecuados e ignorando los incorrectos. El castigo puede asociarse con un estímulo neutro que por sí sólo induzca la respuesta de temor. (castigo condicionado).

Tipos de castigos:

  • Retirada del premio.
  • Dolor físico.
  • Provocar miedo o asustar.
  • Intimidación (cuidado con perros dominantes).

Alternativas al castigo:

  • Reducir la motivación.
  • Retirar el premio.
  • Proporcionar una alternativa.

Las respuestas al castigo dependen de:

  • El carácter del animal.
  • Las experiencias previas en disciplina.
  • El grado de motivación para que se manifieste el comportamiento indeseado.
  • El nivel de castigo.
  • La contingencia con el comportamiento.
  • La posibilidad de una alternativa.
  • La dominancia relativa entre el animal y dueño.

Características de un castigo ideal:

  • Estímulo de intensidad suficiente, proporcional a la conducta expresada.
  • Presentación inmediata o casi inmediata.
  • Ausencia de señales de aviso.
  • Aplicación continua: cada vez que se produce la conducta, se recibe el castigo.

 

Jesús Gutiérrez