PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

http://apuntesgradopsicologia.wordpress.com Principios de Aprendizaje y Conducta PRINCIPIOS DE APRENDIZAJE Y CONDUCTA TEMA 5 CONDICIONAMIENTO INSTR...
29 downloads 0 Views 550KB Size
http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA TEMA 5

CONDICIONAMIENTO INSTRUMENTAL: FUNDAMENTOS Objetivo El objetivo de este capítulo es el análisis de condicionamiento instrumental y la conducta dirigida a meta y la descripción de los orígenes de la investigación en condicionamiento instrumental y los métodos utilizados en la investigación contemporánea, así como el análisis de los tres elementos fundamentales del paradigma del condicionamiento instrumental: la respuesta instrumental, el suceso meta, y la relación entre la respuesta instrumental y el suceso meta.

INTRODUCCIÓN La conducta que sucede debido a que ha servido previamente como instrumento para producir ciertas consecuencias se denomina Conducta Instrumental.

PRIMERAS INVESTIGACIONES SOBRE EL CONDICIONAMIENTO INSTRUMENTAL Los análisis teóricos y de laboratorio del condicionamiento instrumental comenzaron con el trabajo de Thorndike. La intención original era estudiar la inteligencia animal, qué capacidades intelectuales humanas estaban presentes en los animales. Thorndike estudió esta cuestión mediante cajas problema. Las diferentes cajas problemas requerían diferentes respuestas para salir. Thorndike interpretó los resultados de sus estudios como el reflejo del aprendizaje de una asociación E-R. Thorndike formuló la Ley del Efecto. Esta ley establece que si una respuesta en presencia de un estímulo es seguida por un Suceso Satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la respuesta es seguida por un Suceso Molesto, la asociación E-R se debilita. La Ley del Efecto de Thorndike implica un Aprendizaje E-R.

APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO INSTRUMENTAL PROCEDIMIENTOS DE ENSAYO DISCRETO Los procedimientos de ensayo discreto son similares al método que Thorndike utilizó, en el que cada ensayo de entrenamiento acaba con la retirada del animal del aparato, y la respuesta instrumental se realiza sólo una vez durante cada ensayo, a menudo se han llevado a cabo en algún tipo de laberinto. La utilización de laberintos en las investigaciones de aprendizaje fue introducida por el psicólogo norteamericano W. S. Small. La conducta en el laberinto puede cuantificarse midiendo la Velocidad de la Carrera. La velocidad de la carrera normalmente aumenta con ensayos de entrenamiento repetidos. Otra medida común de la conducta en los corredores es la Latencia – tiempo que tarda el animal en abandonar la caja de salida y empezar a desplazarse por el pasadizo-. Las latencias se hacen más cortas a medida que progresa el entrenamiento.

2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 1

http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

PROCEDIMIENTOS DE OPERANTE LIBRE Los Procedimientos de Operante Libre permiten al animal que repita la respuesta instrumental una y otra vez sin restricciones. Fue ideado por B. F. Skinner. Skinner propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado. Una típica caja de Skinner contiene una palanca que la rata puede empujar hacia abajo repetidamente, proporcionando un reforzador, como comida o agua. Una Respuesta Operante, como presionar la palanca, se define a partir del efecto que produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se consideran ejemplos de la misma respuesta operante. El elemento fundamental no son los músculos involucrados en la conducta, sino la forma en la que la conducta opera en el ambiente. Modelamiento y nueva conducta. Los procedimientos de moldeamiento son utilizados a menudo para generar una nueva conducta; pero ¿hasta qué punto son nuevas esas respuesta? El condicionamiento instrumental incluye a menudo la construcción o síntesis de una nueva unidad conductual a partir de componentes de respuesta prexistentes que ya se encuentran en el repertorio del sujeto. El condicionamiento instrumental puede también utilizarse para producir respuestas que no se parecen en nada a lo que el individuo es probable que haba sin entrenamiento. El modelamiento aprovecha la variabilidad inherente de la conducta. El moldeamiento puede producir nuevas formas de respuesta. La tasa de respuesta como medida de la conducta operante Los métodos de operante libre permiten una observación continua durante largos períodos. Las medidas de la latencia de respuesta y de la velocidad que se emplean normalmente en procedimientos de ensayo discreto no permiten que se repita la respuesta. Skinner propuso que la tasa de ocurrencia de una conducta operante (frecuencia de la respuesta por minuto, por ejemplo) se utilizase como una medida de la probabilidad de la respuesta. Las respuestas más probables ocurren con frecuencia y muestran una tasa alta. Por el contrario, las respuestas improbables ocurren esporádicamente y muestran una tasa baja.

PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL En todas las situaciones de condicionamiento instrumental, el sujeto realiza una respuesta y por tanto produce una consecuencia. Una consecuencia placentera se denomina técnicamente Estímulo Apetitivo. Una consecuencia molesta Estímulo Aversivo. Cuando a un chico se le paga por cortar el césped, se dice que surte efecto una contingencia positiva entre la respuesta y su estímulo consecuente. De forma alternativa la respuesta instrumental puede retirar o eliminar un estímulo, en ese caso se dice que existe un efecto de contingencia negativa entre la respuesta y su consecuencia. Existen cuatro procedimientos comunes de condicionamiento instrumental. Los procedimientos difieren en qué tipo de estímulo (apetitivo o aversivo) es controlado por la respuesta instrumental y si la respuesta produce o elimina el estímulo.

2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 2

http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

Reforzamiento Positivo. Un padre da a su hija una galleta cuando recoge sus juguetes. La respuesta instrumental aproxima o produce un estímulo apetitivo. Si se da la respuesta, el estímulo apetitivo se presenta; si no, el estímulo apetitivo no se presenta. El reforzamiento positivo produce un incremento en la tasa de respuesta. Castigo. Una madre da una reprimenda a su hijo por cruzar la calle. En un procedimiento de castigo, la respuesta instrumental produce o aproxima un estímulo molesto o aversivo. Los procedimientos de castigo producen una disminución en la respuesta instrumental. Reforzamiento Negativo. Tanto el reforzamiento positivo como el castigo incluyen una contingencia positiva entre la respuesta instrumental y el estímulo resultante. Ahora se referirán los procedimientos que involucran una contingencia negativa. En una contingencia negativa, la respuesta retira o previene la presentación de un suceso ambiental. Un procedimiento en el que la respuesta instrumental finaliza o previene la entrega de un estímulo aversivo se denomina Reforzamiento Negativo. Hay dos tipos de procedimientos de reforzamiento negativo: Escape y Evitación. 1. Escape. En el escape, el estímulo aversivo se presenta pero puede ser eliminado por la respuesta instrumental. Se puede escapar del sonido molesto de una radio apagándola. La respuesta instrumental es reforzada por la terminación del estímulo aversivo. 2. Evitación. Implica la programación de un estímulo aversivo para ser presentado en algún momento del futuro. En este caso la respuesta instrumental previene la entrega del estímulo aversivo. Los alumnos estudian antes de un examen para evitar malas calificaciones. Entrenamiento de Omisión. Otro tipo de procedimiento que incluye una contingencia negativa entre la respuesta instrumental y un suceso ambiental se denomina Entrenamiento de Omisión. La respuesta instrumental previene la presentación de un estímulo apetitivo o placentero. No implica la presentación de un estímulo aversivo. Se está utilizando cuando se le dice a un niño que se vaya a su habitación después de haber hecho algo mal. Los procedimientos de entrenamiento de omisión se denominan Reforzamiento Diferencial de Otras Conductas, o RDO. Este término refleja el hecho de que el individuo recibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otra conducta diferente de la respuesta 2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 3

http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

especificada por el procedimiento. La realización de la respuesta crítica deviene en la omisión de la recompensa. El entrenamiento de omisión implica el reforzamiento de otras conductas. La respuesta instrumental disminuye por el castigo y aumenta por el reforzamiento negativo.

ELEMENTOS FUNDAMENTALES DEL CONDICIONAMIENTO INSTRUMENTAL La esencia de la conducta instrumental es que está controlada por sus consecuencias. El condicionamiento instrumental consta de tres elementos claves: una respuesta, una consecuencia (el reforzador) y una relación, o contingencia entre la respuesta y la consecuencia. LA RESPUESTA INSTRUMENTAL El resultado de los procedimientos de condicionamiento instrumental depende en parte de la naturaleza de la respuesta que se esté condicionando. Variabilidad conductual versus estereotipia Thorndike y Skinner enfatizaron que el reforzamiento incrementa la probabilidad de que la respuesta instrumental se repita en el futuro. Este énfasis alentó la creencia de que los procedimientos de condicionamiento instrumental producían repeticiones de la misma respuesta – que producían uniformidad o estereotipia en la conducta-. El condicionamiento instrumental puede también verse involucrado en la producción de respuestas creativas o variables. La variabilidad de la respuesta puede ser la base para el reforzamiento instrumental. La variabilidad de la respuesta puede mantenerse e incrementarse por reforzamiento. Por tanto, la variabilidad de la respuesta puede establecerse como una operante. En ausencia de reforzamiento explícito de la variabilidad, la respuesta llega a ser más estereotipada con un condicionamiento instrumental continuado. Por tanto, el resultado típico del reforzamiento instrumental es una disminución en la variabilidad de la respuesta. Relevancia o pertinencia en el condicionamiento instrumental El condicionamiento instrumental puede actuar sobre componentes manifiestos de la respuesta o sobre dimensiones abstractas de la conducta como la variabilidad. En el condicionamiento clásico, para que dicho condicionamiento ocurra rápidamente, el EC tiene que competer al EI, o ser relevante para el EI. En el condicionamiento instrumental tienen lugar relaciones análogas de pertinencia o relevancia. Thorndike fue el primero en observar diferencias en la facilidad de condicionamiento de varias respuestas. Thorndike propuso el concepto de Pertinencia para explicar los fallos en el entrenamiento. De acuerdo con este concepto, ciertas respuestas se corresponderían de forma natural con el reforzador debido a la historia evolutiva del animal. También Breland y Breland (1961) observaron varias limitaciones en el condicionamiento instrumental al intentar condicionar respuestas instrumentales con reforzamiento de comida en varias especies. Los Breland tuvieron dificultades parecidas con otras especies. Los cerdos, por ejemplo, no podían aprender a introducir monedas en la hucha en forma de cerdito. Tras el entrenamiento inicial, empezaron a hozar las monedas por el suelo. Los Breland llamaron Deriva Instintiva al desarrollo de respuestas como la de hozar en los cerdos, aunque ésta no se reforzó en ningún momento. 2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 4

http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

Sistemas de conducta y limitaciones en el condicionamiento instrumental De acuerdo con la teoría de los sistemas de conducta, cuando un animal está privado de comida y se encuentra en una situación donde podría encontrarla, su sistema de alimentación se activa. Sobre este sistema de conducta se superpone un procedimiento de condicionamiento instrumental. La efectividad del procedimiento para el incremento de una respuesta instrumental dependerá de la compatibilidad de esa respuesta con la organización preexistente del sistema de alimentación. Es más, la naturaleza de otras respuestas que emergen durante el curso del entrenamiento (o deriva instintiva) dependerá de los componentes conductuales del sistema de alimentación que se activen debido al procedimiento de condicionamiento instrumental. La teoría e los sistemas de conducta predice que el reforzamiento de comida podría producir incrementos en actividades como cavar, escarbar y erguirse, pero no en actividades como lavarse la cara y rascarse, ya que estas respuestas no son parte del sistema de alimentación. Por tanto, la susceptibilidad de varias respuestas al reforzamiento con comida puede predecirse observando cómo se alteran esas respuestas con la privación de comida, lo que presumiblemente refleja su compatibilidad con el sistema de alimentación. EL REFORZADOR INSTRUMENTAL Cantidad y naturaleza del reforzador Un cambio en la cantidad del reforzador puede también hacer al reforzador cualitativamente distinto. Cambios en la naturaleza y la cantidad del reforzador ¿Qué pasaría si la cantidad o la naturaleza del reforzador modificaran su valor para el mismo individuo? Los efectos de una cantidad y tipo de reforzador particular dependen de la cantidad y naturaleza de los reforzadores que el individuo ha experimentado previamente. Dicho vagamente, una recompensa favorable se trata como especialmente buena tras el reforzamiento con una recompensa mala, y una recompensa desfavorable se trata como especialmente mala después de una buena recompensa. El Contraste Positivo se refiere a una elevada respuesta por una recompensa favorable, resultado de una experiencia anterior con una consecuencia menos atractiva. El Contraste Negativo se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor. LA RELACIÓN RESPUESTA-REFORZADOR La conducta instrumental produce y es controlada por sus consecuencias. Para ser eficiente, se tiene que saber cuando se debe hacer algo para obtener un reforzador y cuándo el reforzador es probable que sea entregado independientemente de cualquier acción. La conducta instrumental eficiente requiere sensibilidad a la relación respuesta-reforzador. Existen dos tipos de relaciones entre una respuesta y un reforzador. Una es la Relación Temporal, que se refiere al tiempo que transcurre entre la respuesta y el reforzador. Un tipo especial de relación temporal es la Contigüidad Temporal, la cual se refiere a la entrega del reforzador inmediatamente después de la respuesta. El segundo tipo de relación es la Relación Causal o la Contingencia Respuesta-Reforzador, la cual se refiere al hecho de que la respuesta instrumental es 2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 5

http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

necesaria y suficiente para la ocurrencia del reforzador. Los factores temporales y causales son independientes unos de otros. Efectos de la contigüidad temporal El reforzamiento inmediato es preferible al demorado. El condicionamiento instrumental requiere proporcionar el reforzador inmediatamente después de la ocurrencia de la respuesta instrumental. El aprendizaje instrumental se altera demorando el reforzador tras la ocurrencia de la respuesta instrumental. ¿Por qué es el condicionamiento instrumental tan sensible a la demora de reforzamiento? La conducta consiste en un flujo continuo de actividades. Cuando el reforzamiento es demorado tras la realización de una respuesta específica, R1, el organismo no se para y puede realizar R2, R3, R4, y así sucesivamente. Si el reforzador se establece en R1 pero no se entrega hasta algún tiempo después, el reforzador puede ocurrir inmediatamente después de alguna otra respuesta, por ejemplo, R4. Para asociar R1 con el reforzador, el organismo tiene que poder distinguir de alguna forma R1 de otras respuestas que realiza durante el intervalo de demora. Hay dos formas de resolver este problema. La primera técnica, es proporcionar un reforzador secundario o condicionado inmediatamente después de la respuesta instrumental, incluso si el reforzador primario no puede ocurrir hasta algún tiempo después. Un Reforzador Condicionado o Secundario es un estímulo condicionado que ha sido previamente asociado con el reforzador. Las confirmaciones verbales en el adiestramiento, como “bueno” y “eso es”, son reforzadores condicionados que pueden proporcionar reforzamiento inmediato para la conducta adecuada. Los reforzadores condicionados pueden servir para puentear una demora entre la respuesta instrumental y la entrega del reforzador primario. Otra técnica que facilita el aprendizaje con reforzamiento demorado es marcar la respuesta instrumental criterio de alguna manera para hacerla distinguible de otras actividades del organismo. Lieberman, McIntosh y Thomas, demostraron la efectividad del Procedimiento de Marcado. En el experimento, después de dejar la caja de salida, las ratas tuvieron una elección entre entrar en un brazo blanco o uno negro. Se designo el brazo blanco como respuesta instrumental correcta y la entrada en él fue reforzada con el acceso a la comida en la caja de meta tras una demora de 60 segundos. Tanto el reforzamiento secundario como los procedimientos de marcado se centran en conectar mejor la respuesta instrumental crítica con el reforzador demorado. La contingencia respuesta-reforzador Incluso con una relación causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante demasiado tiempo. La contigüidad respuesta-reforzador más que la contingencia era el factor crítico que producía el aprendizaje instrumental. Esta visión ha resultado injustificada por la investigación posteriormente. El experimento de superstición de Skinner La explicación de Skinner de la Conducta Supersticiosa descansa en la idea de Reforzamiento Accidental o Adventicio. El reforzamiento adventicio se refiere al emparejamiento accidental de una respuesta con la entrega del reforzador. Skinner sugirió que cualquier respuesta que un sujeto realizase por casualidad justo antes de conseguir la comida llegaría a fortalecerse y posteriormente incrementaría su frecuencia debido al reforzamiento adventicio. 2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 6

http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

1. Reinterpretación del experimento de superstición. La afirmación de Skinner de que la contigüidad respuesta-reforzador más que la contingencia es lo más importante para el condicionamiento instrumental ha sido puesta en duda por la evidencia empírica posterior. Respuestas Terminales: respuesta que es más probable que se de al final del intervalo entre sucesivos reforzadores que están presentes a intervalos fijos. Respuestas de Ínterin: respuesta que aumenta en frecuencia después de la entrega de un reforzador periódico y que disminuye a medida que se aproxima el siguiente reforzador. La investigación posterior ha proporcionado mucha evidencia adicional de que las presentaciones periódicas de un reforzador producen regularidades conductuales, siendo ciertas respuestas predominantes al final del intervalo entre las sucesivas presentaciones de comida, y otras respuestas predominantes al principio del intervalo comida-comida. 2. Explicación de la periodicidad de las respuestas de ínterin y terminales.¿A qué se debe que se desarrollen respuestas terminales y de ínterin similares en animales expuestos al mismo programa de presentaciones de comida independientes de la respuesta? Staddon y Simmelhag (1971) sugirieron que las respuestas terminales son respuestas típicas de la especie que reflejan la anticipación de la comida a medida que e! tiempo se encuentra más cerca de la próxima presentación de comida. En contraste, entendieron las respuestas de ínterin como una manifestación de otras fuentes de motivación que eran más importantes al comienzo del intervalo entre comidas, cuando la presentación de comida era improbable. Los investigadores posteriores, sin embargo, han favorecido aproximaciones en las cuales las respuestas terminales y de ínterin se consideran diferentes manifestaciones del mismo sistema motivacional. La formulación alternativa mejor desarrollada es la teoría de los sistemas de conducta. De acuerdo con la teoría de los sistemas de conducta, e! sistema de alimentación (y sus respuestas acompañantes de forrajeo) está activado en los animales privados de comida a los que se les proporciona periódicamente pequeñas cantidades de comida. Se asume que la conducta en estas circunstancias es un reflejo de un sistema preorganizado de forrajeo típico de la especie y de conducta de alimentación. Justo después de la entrega de comida, se asume que el organismo desarrolla respuestas de Búsqueda Localizada Poscomida que involucran actividades cerca del comedero. En medio del intervalo entre entregas de comida ocurren respuestas de Búsqueda General que alejan al sujeto del cuenco de comida. Según se aproxima el momento de la próxima entrega de comida, los sujetos exhiben respuestas de Búsqueda Localizada que están de nuevo concentradas cerca del cuenco de comida. La distribución de las actividades que se desarrollan con la entrega periódica de un reforzador depende de la naturaleza de ese reforzador. Efectos de la controlabilidad de los reforzadores. Una contingencia fuerte entre una respuesta instrumental y un reforzador esencialmente significa que la respuesta controla e! reforzador. Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. La mayoría de la investigación se ha centrado en los efectos de control sobre la estimulación aversiva. 2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 7

http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

El hallazgo más importante fe que la exposición a una descarga incontrolable dificultaba el aprendizaje posterior. Este fenómeno se denomina Efecto de Indefensión Aprendida. 1. El diseño triádico. Los experimentos de indefensión aprendida se realizan normalmente utilizando el diseño triádico. El diseño incluye dos fases: la Exposición y el Condicionamiento. Durante la fase de exposición, un grupo de ratas (E, por escape) es expuesto a descargas periódicas que pueden finalizar mediante la realizaron de una respuesta de escape. Cada sujeto del segundo grupo (A por acoplado) es acoplado a un animal del Grupo E y recibe las mismas descargas que el compañero del Grupo E. sin embargo, los animales del Grupo A no pueden hacer nada para evitar las descargas. El tercer grupo (C, por confinado) no recibe descargas. Durante la fase de condicionamiento, los tres grupos reciben entrenamiento de escape-evitación. El hallazgo destacable en los experimentos del efecto de indefensión aprendida es que los efectos de la estimulación aversiva durante la fase de exposición depende de si la descarga es o no escapable.

2. La hipótesis de la indefensión aprendida. La primera explicación importante de los estudios que emplean el diseño triádico –la Hipótesis de la Indefensión Aprendidaestaba basada en la conclusión de que los animales pueden percibir la contingencia entre su conducta y la entrega de un reforzador. La hipótesis de la indefensión aprendida asume que durante la exposición a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta. El déficit de aprendizaje ocurre por dos razones. Primero, la expectativa de falta de control reduce la motivación de los sujetos para realizar una respuesta instrumental. Segundo, incluso si realizan la respuesta y son reforzados en la fase de condicionamiento, la expectativa previamente aprendida de falta de control hace más difícil para los sujetos aprender que su conducta es ahora efectiva para producir reforzamiento. Es importante distinguir la hipótesis de la indefensión aprendida del efecto de indefensión aprendida. El efecto de indefensión aprendida es el patrón de resultados obtenidos con el diseño triádico. La hipótesis de la indefensión aprendida ha sido una explicación sugestiva y controvertida del efecto de indefensión aprendida. 3. Déficit atencional. ¿Por qué la falta de control sobre los reforzadores podría producir un déficit en el aprendizaje si el efecto no es debido a una disminución de la actividad? Una posibilidad es que la descarga inescapable provoque que los 2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 8

http://apuntesgradopsicologia.wordpress.com

Principios de Aprendizaje y Conducta

animales presten menos atención a sus acciones. Si un animal no presta atención a su conducta, tendrá dificultad para asociar sus acciones con los reforzadores en el escape-evitación o en otras formas de condicionamiento instrumental. Maier, Jackson y Tomie, razonaron que un animal que no atendía a su conducta debido a la exposición a una descarga inescapable se enfrenta con el mismo problema que un animal que recibe reforzamiento demorado. Esta analogía sugirió a Maier y sus colegas que las manipulaciones que facilitan el aprendizaje con reforzamiento demorado podrían también ayudar a los animales expuestos a descarga inescapable. El problema de identificar qué respuesta es responsable del reforzamiento demorado puede resolverse mediante el marcado de la respuesta crítica con algún tipo de estímulo inmediato externo de retroalimentación. La presencia de este marcador eliminó completamente el déficit de aprendizaje. Por tanto, como se predijo, marcar la respuesta instrumental supera el déficit de indefensión aprendida. Este resultado sugiere que una de las fuentes del déficit de aprendizaje es una reducción de la atención a las respuestas que el animal realiza. 4. Relaciones estimulares en el condicionamiento de escape. ¿Por qué la exposición a la descarga no es tan dañina si el animal puede realizar una respuesta para escapar de la descarga? El rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminación de un estímulo aversivo. Realizar la respuesta de escape tiene como resultado claves internas de retroalimentación de la respuesta. Algunos de estos estímulos producidos por la respuesta son experimentados al comienzo de la respuesta de escape, justo antes de que la descarga se retire, y se denominan Claves de Retroalimentación de la Terminación de la Descarga. Otros estímulos son experimentados justo después de la descarga se haya retirado al comienzo del intervalo entre ensayos. Éstos se denominan Claves de Retroalimentación de la Señal de Seguridad.

CONTIGÜIDAD Y CONTINGENCIA: COMENTARIOS FINALES Los organismos son sensibles a la contigüidad tanto como a la contingencia entre una respuesta instrumental y un reforzador. Normalmente, estos dos aspectos de la relación entre la respuesta y el reforzador actúan en conjunto para producir el aprendizaje. Ambos factores sirven para entender los efectos del reforzamiento en la respuesta instrumental. La relación causal, o contingencia, asegura que el reforzador es entregado sólo tras la ocurrencia de la respuesta instrumental especificada. La relación de contigüidad asegura que otras actividades no se interpongan entre la respuesta especificada y el reforzador para interferir en el condicionamiento de la respuesta crítica.

2ER SEMESTRE

Miguel Ángel Llamas Romero

Página 9

Suggest Documents