Hide/show left column Hide/show left column Hide/show left column
Hide/show right column
Hemeroteca
Sitios Asociados
Visitantes
Clicker: Condicionamiento Instrumental:  
Autor minimum
Publicado: 31/5/2003
Leídas 9238 veces
Tamaño 19.52 KB
Página de impresion amigable Avisar a un amigo
PASALO A TU RED SOCIAL: Bookmark and Share
 

Glosario de términos comúnmente empleados en el Adiestramiento con Clicker

por Melissa Alexander


Titulo Original: Glossary of Clicker Training Terms
Original en : http://www.clickersolutions.com/

ABE- Primer emprendimiento  comercial que aplicó los principios del  Condicionamiento Instrumental al entrenamiento animal. Fundado por Keller y Marian Breland, en  aproximadamente 45 años de  existencia, el personal de ABE entrenó 15.000 animales de 140 especies diferentes.

Aversivo- Algo por el cual el animal estará deseoso de trabajar para evitar.

Bailey, Bob (Robert E.)- químico y zoólogo pionero en  los métodos del Condicionamiento Instrumental aplicado al  entrenamiento de animales, tanto en el ambiente libre como en el laboratorio. Bob y su esposa,  Marian Breland Bailey, enseñaron los principios del Condicionamiento Instrumental a entrenadores de  perros en sus  campamentos de "entrenadores de pollos".

Bailey, Marian Breland-  segunda estudiante  graduado con B.F Skinner.  Marian y su primer marido, Keller Breland, trabajaron con Skinner en el proyecto "pigeon bombing" ("paloma bombardera"*) en la Segunda Guerra Mundial, por entonces dejó sus estudios de graduación para fundar ABE.  Marian consiguió sus Ph.D en 1978 y fue  profesora de la universidad durante veinte años. Aunque ella se retiró en 1998, Marian y su segundo marido,  Bob Bailey, continuó enseñando los principios del OC (siglas en inglés del Condicionamiento Operativo o Instrumental) en sus campamentos.

Bingo o Jakpot-  El gran premio, un mega-premio dado después de un esfuerzo particularmente excepcional.

Breland, Keller- el primer estudiante graduado con B.F. Skinner, trabajó con Skinner en el proyecto  "pigeon bombing" en la Segunda Guerra Mundial. Fundó ABE, junto a su esposa. Keller fue el primero en usar un marcador de evento al que llamó "estímulo puente" (del inglés bridging stimulus), debido a que se tendía un puente entre la contestación deseada y la entrega del refuerzo primario.

Castigo-  En el condicionamiento instrumental;  consecuencia de una conducta en que algo se agrega  o se aleja de los efectos deseados de un comportamiento y que probablemente hará que se modifique en el futuro.

Castigo negativo (P -)-  Hace que el animal trabaje para suprimir (disminuya la frecuencia de) un comportamiento. Por ejemplo, el  perro salta para conseguir  atención. Dándose vuelta  o alejándose de él  le quita la atención que él desea.

Clicker-  Juguete que hace ruido (clásica "ranita" de las fiestas de cumpleaños*). Los entrenadores de animales hacen uso del clicker como un marcador de evento para marcar un comportamiento deseado. El clicker es un marcador excelente porque es único, rápido, y consistente.

Collar de cabeza o ronzal-  Similar al cabestro de un caballo, da el mando de la cabeza del perro a su entrenador, haciéndole más fácil conducirlo que con la traílla. Habitualmente se utiliza  hasta que el perro haya aprendido a  caminar al lado del entrenador. (En otros casos se lo utiliza para enseñar todo tipo de comportamientos*)

Condicionando clásico-  El proceso de asociar un estímulo neutro con una respuesta involuntaria hasta que el estímulo incite la respuesta.

Condicionamiento controlado o contracondicionamiento-  Técnica por la cual se aparean estímulos que evocan una respuesta determinada con una contestación opuesta, para que el estímulo evoque la nueva respuesta. Por ejemplo, un perro tiene miedo a los  hombres con sombrero de determinado tipo. Cuando un hombre que lleva un sombrero se acerca, se alimenta al perro con su comida favorita repetidamente. La meta es reemplazar el miedo con el placer proporcionado por la comida.  Debe hacerse gradualmente, pues si el proceso fuera precipitado, la comida favorita podría asumir la asociación de miedo.

Condicionamiento Instrumental-(O.C en inglés*)-  El proceso de cambiar la conducta de un animal con cierto estímulo manipulando las consecuencias del comportamiento. Los cinco principios de O.C fueron desarrollados por B.F. Skinner. El entrenamiento del Clicker  es un subconjunto de O.C, que sólo usa refuerzo positivo, la extinción, y en menor grado, el castigo negativo.

Consecuencia-  El resultado de una acción. Las consecuencias frecuentemente -pero no siempre- afectan la conducta futura, haciendo más o menos probable que la conducta pueda ocurrir. Los cinco principios de OC describen los resultados potenciales.

Criterio-  Respuesta específica, definida por el  entrenador en una sesión de entrenamiento. El adiestrador hace clic al momento que el animal logra el criterio específico. El criterio no sólo puede incluir la conducta física sino también  elementos como la latencia, duración y distancia.

Criterio temporal-  Se establece para enseñar comportamientos más complejos al final del entrenamiento. Es de carácter  provisorio. No debe abusarse de él pues el animal puede ser renuente a cambiar su conducta si se lo ha reforzado demasiado.

Crossover-dog- Perro que ha estado previamente entrenado por un método tradicional que luego se adiestra con el método del clicker.

Crossover-trainer-  Entrenador que previamente usó los métodos tradicionales para entrenar animales y que ahora entrena con el  clicker.

Cuatro cuadrantes de O.C-  Referencia incorrecta al plan de entrenamiento habitual que ilustra los conceptos de refuerzo y castigo. Esta descripción está errada de dos maneras. Obvia mencionar la extinción, e implica que los otros principios del  O.C son de igual valor en un programa de entrenamiento. 

El blanco-  Algo que se enseña a tocar al animal con alguna parte de su cuerpo. Un blanco es generalmente estacionario; aunque también existen blanco móviles (target stick) que se utilizan para enseñarles a seguirlos en movimiento.

Encadenando hacia atrás -  En una sesión de entrenamiento se relaciona  el próximo comportamiento al último obtenido y así sucesivamente. Encadenando hacia atrás es una técnica útil para el  Principio de Premack.

Entrenamiento balanceado-  Tipo de entrenamiento que utiliza  los cinco principios del  OC  y un marcador de evento (el clicker) para modificar la conducta. Esta metodología también es conocida como "entrenamiento combinado" . El entrenamiento equilibrado implica cantidades iguales de refuerzo y castigo. Sin embargo, el apresuramiento asociado con el castigo lleva a  una opción de entrenamiento pobre pues se pierde el  equilibrio.

Entrenamiento de Compulsión o entrenamiento tradicional-  El entrenamiento tradicional se caracteriza por moldear  o provocar la conducta con el uso del refuerzo negativo y, el castigo positivo para "corregirla".

Encadenando-  El proceso de combinar las conductas múltiples en una conducta continua con una sola señal.

Entrenamiento con clicker- Término acuñado por Karen Pryor y definido por ella como un subconjunto de OC que usa refuerzo positivo, extinción, castigo negativo, y un marcador de evento para modificar la conducta.

Entrenamiento combinado-  Utiliza  los cinco principios de OC  y una señal como marcador (el clicker) para modificar la conducta.

Entrenamiento  compulsivo-  El estilo tradicional de entrenar perros donde se  compele al animal para realizar la conducta y físicamente se  corrige el incumplimiento de esta.

Estímulo puente- Marcador de evento que identifica al comportamiento deseado y el lapso que transcurre entre la contestación y la entrega del refuerzo primario. El clicker es un estímulo puente.

Estímulo- Cambio en el ambiente. Si el estímulo no tiene ningún efecto en el animal, es un estímulo neutro. Un estímulo que destaca en el ambiente -otros animales o estímulos medioambientales- es un estímulo positivo. Un estímulo que causa un cambio en el estado del animal -por ejemplo, lo causa para realizar una conducta específica- es un estímulo negativo

Extinción-  Debilitar una conducta a través del no-refuerzo. "Ignorando" la conducta. En la extinción, nada se agrega o quita del ambiente.  Si una conducta previamente reforzada no se refuerza, el animal aumentará la intensidad o frecuencia de la conducta en el intento por ganar el refuerzo de nuevo. Después de estos estallidos, la presentación de la conducta disminuirá. 

Insensibilización-  El proceso de aumentar la tolerancia a un estímulo particular aumentando la presencia del estímulo gradualmente.

Intervalo fijo-  Horario de refuerzo en que el entrenador alienta la primera repuesta correcta después de un período específico de tiempo  por ejemplo, después de un minuto.

Intervalo variable-  Horario de refuerzo en que el entrenador refuerza la primera contestación correcta después de  períodos disímiles  de tiempo dentro de un cierto contexto o logro. Cronometrar es una habilidad mecánica y requiere práctica. El entrenador debe poder reconocer las conductas que preceden a la conducta designada para hacer clic en el mismo momento  que la elegida ocurre. 

La conducta- Algo que un animal hace.

La señal- Estímulo  que obtiene una conducta. Las señales pueden ser verbales, físicas (es decir, un signo de la mano), o medioambiental (es decir, una restricción puede volverse una señal para sentarse si el perro siempre es enseñado a asumir esa posición antes de cruzar un camino).

Latencia-  Tiempo entre la señal y la respuesta.  Con un buen entrenamiento, ese tiempo es  cero. 

Marcador de evento-  Signo que marca la conducta deseada al momento que ocurre. El clicker es un marcador de evento.

Medios positivos de refuerzo (R+)- Harán que el animal trabaje para consolidar (aumente la frecuencia de) un comportamiento. Por ejemplo, dar al perro un premio para "el sentado" aumentará la probabilidad  de que el perro se sentará otra vez.

Medios positivos de castigo (P+)- Harán que el  animal trabaje para evitar  (disminuya la frecuencia de) un comportamiento. Sacar de un tirón  a un perro que salta para saludar a la gente es un ejemplo de P+ , usado para suprimir el comportamiento de saltar. Otros ejemplos comunes de P+ incluyen el  grito, golpecitos en la nariz, el azote, la descarga eléctrica, y las "trampas explosivas camufladas" .

Medios negativos de refuerzo (R -)-  Harán  que el animal trabaje para evitar fijar (aumente la frecuencia de) un comportamiento. Un sujetador de orejas, usado tradicionalmente para entrenar "el sostener", es un ejemplo clásico de R -. los sujetadores de orejas sirven para hacer que el perro abra su boca, con lo cual el entrenador inserta el rodillo , entonces para reforzar "el sostener" el rodillo , se quita el sujetador de orejas. Se  requiere que un primer estímulo aversivo esté aplicado mediante una orden para  luego ser quitada.

Ningún Marcador de Premio (NRM)- Creado para  ser una señal para decir "No, eso no es lo que yo quiero--intenta de nuevo." Se piensa que agrega una señal verbal a la extinción de la perspectiva de OC. Sin embargo, una vez que algo se ha agregado a la situación, es imposible saber si un cambio ocurrió a través de extinción o castigo.

Principio de Premack- Teoría que declara que una respuesta más fuerte reforzará una respuesta más débil.

Pryor, Karen-  Biólogo, autora y entrenadora de delfines reconocida por acuñar el término de "entrenamiento del clicker" y popularizar el método con entrenadores de perros.

Período de entrenamiento-  Lapso de tiempo destinado al momento de las sesiones de adiestramiento. Un período de entrenamiento puede componerse de sesiones de entrenamiento múltiples.

Proporción del Refuerzo-  El número de refuerzos medido en un período específico de tiempo. Una proporción alta de refuerzos es crítica para entrenar exitosamente.

Proporción variable-  Horario de refuerzo en el que se refuerza el  primer comportamiento correcto después de números inconstantes de contestaciones correctas.

Proporción fija- Tiempo de refuerzo en que el entrenador premia el  primer comportamiento correcto después de un número específico de contestaciones.

Recuperación espontánea- Característica de la extinción en que una conducta que se pensaba que estaba extinta inexplicablemente reaparece.  Si dicha conducta no se refuerza, desaparecerá rápidamente.

Reforzamiento- Algo por el cual  el animal trabajará para obtener.

Reforzamiento continuo-  El horario más simple de refuerzo. Cada  respuesta deseada se refuerza.

Reforzamiento secundario- Refuerzo condicionado. A éste, el animal no lo necesita pero pueden ser iguales o aún más poderosos que un reforzamiento primario.

Refuerzo condicionado- Estímulo neutro apareado con un reforzamiento primario hasta que el estímulo neutro asuma las propiedades del primero. El sonido del clicker, después de ser repetidamente asociado con un premio de comida u otro refuerzo, se vuelve un refuerzo condicionado.

Refuerzo diferencial-  Algunas respuestas correctas se premian y otras no . Todos los tipos de refuerzo excepto el refuerzo continuo son una clase  de refuerzo del diferencial.

Refuerzo primario-  Refuerzo  que el animal necesita para desarrollarse normalmente.  Comida, agua y sexo son reforzadores primarios.

Reforzamiento negativo (R-)- Son estímulos aversivos que pueden bloquearse o evitarse modificando la conducta. Tan pronto como se realiza el nuevo comportamiento, el estímulo aversivo cesa, y de este modo el nuevo comportamiento se refuerza. El perro recibe una corrección cuando camina en otra posición distinta de la de junto a su amo; por lo tanto, caminar junto a su guía es el único lugar seguro. El que evita la corrección. R - es un aversivo que debe aplicarse primero o debe amenazarse para ser luego quitado.

Refuerzo variable- Se refuerza al animal según un lapso de tiempo. En un intervalo fijo, el entrenador refuerza el primer comportamiento correcto después de un período específico de tiempo. Por ejemplo, cada minuto. En un intervalo inconstante, el entrenador refuerza la primera respuesta correcta después de  períodos variables dentro de un cierto horario. Con esta técnica se logra instalar la conducta deseada * .

Señal de avance-( KGS)- Señal, verbal o de otra naturaleza, dada en  el medio de una conducta para decirle  al animal que está realizando correctamente el ejercicio y debe seguir con el resto de la rutina. La señal de avance se emplea frecuentemente en entrenamiento de Agility y otros deportes de obediencia *.

Señales de calma- Signos del cuerpo, sutiles, usados por los perros para indicar tensión, evitar la confrontación y disuadir la agresión.

Sesión de entrenamiento-  Período real de adiestramiento. Su criterio debe permanecer constante durante una sola sesión. Al final de una sesión de entrenamiento, usted evalúa el progreso del  animal y decide si hacer la próxima sesión más compleja o quedarse al mismo nivel.

Skinner, BF-  Científico que definió los principios del Condicionamiento instrumental.

Tiempo variable de refuerzo-  (VSR) Técnicamente, un intervalo inconstante o proporción inconstante. Sin embargo, la mayoría de los entrenadores usan VSR para significar una proporción inconstante.

Three-fer- (se mantiene el vocablo en inglés pues es de común utilización*) El animal tiene que realizar tres conductas correctas para ganar un clic y un premio.

Timing- (idem anterior) La elección del momento adecuado  para hacer sonar el clicker. Con suerte, el clic debe ocurrir exactamente en el mismo momento que el criterio designado.

Two-fer- El animal tiene que realizar dos conductas correctas para ganar un clic y un obsequio.

Melissa Alexander
mcalex@clickersolutions.com

* Notas de traducción.


AUTOR


Melissa Alexander
E-Mail: mcalex@clickersolutions.com
Web: Clicker Solutions

Traducido por : ClickerArgentina
E-Mail: clickerargentina@ciudad.com.ar
Web: ClickerArgentina


 
Volver a Sección | Volver al Indice principal

voraus.com es un web de carácter personal, independiente y sin publicidad, cuyo origen se remonta a finales del 1997, es un proyecto sin fines comerciales, todos los contenidos publicados se ofrece de forma libre y gratuita. Nuestros colaboradores contribuyen sin remuneración ni ánimo de lucro, y la posibilidad de colaborar está abierta permanentemente a todos sus lectores.
voraus.com no es una sociedad mercantil ni desempeña labor remunerada alguna, y los gastos que genera esta publicación son soportados por su editor, que no cuenta para ello con ningún tipo de ayuda económica o patrocinio. Tampoco cuenta con ningún tipo de staff profesional.
Esta web es editada y mantenida por Rafael Sánchez-Garrido, desde Málaga (España). Su editor no se responsabiliza en absoluto de las opiniones vertidas por sus colaboradores en esta publicación, ni de los comentarios públicos realizados por los lectores en el web de la publicación, ni del uso que sus lectores puedan hacer de las mismas, ni de las consecuencias que puedan derivarse de dicho uso, ni de los posibles errores de traducción o mecanización, ni de la calidad o veracidad de los documentos que se referencien.
Esta publicación se suministra gratis y sin garantía, y su editor no se proclama experto en las materias tratadas.Toda información publicada en este sitio debe ser verificada antes de su uso.
Artículo 19 de la Declaración Universal de Derechos Humanos: Todo individuo tiene derecho a la libertad de opinión y de expresión; este derecho incluye el de no ser molestado a causa de sus opiniones, el de investigar y recibir informaciones y opiniones, y el de difundirlas, sin limitación de fronteras, por cualquier medio de expresión.
Powered by XOOPS 2.0.5.2 © 2001-2007 The XOOPS Project
www.voraus.com - www.vorausmedia.com - www.wusv.net - www.mercadog.com