...

...
...

miércoles, 20 de abril de 2016

Condicionamiento Operante



El condicionamiento operante o instrumental, descrito por Edward Thorndike (1874 – 1949) y B. Frederic Skinner (1904 – 1990), es el proceso a través del cual se fortalece un comportamiento que es seguido de un resultado favorable (refuerzo), con lo cual aumentan las probabilidades de que ese comportamiento vuelva a ocurrir. El condicionamiento operante sostiene, de esta forma, que se aprende aquello que es reforzado. Esta postura, como puede verse, se basa en la idea de que el comportamiento está determinado por el ambiente, y que son las condiciones externas -el ambiente y la historia de vida- las que explican la conducta del ser humano (Strom y Bernard, 1982).

 Skinner presenta un análisis funcional del comportamiento, considerando a la conducta como una variable dependiente de sus consecuencias (refuerzo) –a diferencia del condicionamiento clásico en que la conducta depende de los estímulos que la anteceden-. Presenta un modelo de contingencia de tres términos en que un estímulo discriminativo (influencia ambiental antecedente) permite la aparición de una respuesta que es seguida de un estímulo que refuerza (consecuencia), es decir, que aumenta la probabilidad de que la respuesta se produzca en el futuro (el castigo disminuye esa probabilidad) (Schunk, 1997). 

Antecedentes ---> Comportamiento ---> Consecuencias 


El comportamiento puede ser modificado cambiando o controlando tanto los antecedentes como las consecuencias de la conducta, o bien ambos. Pese a esto, la teoría se ha centrado más en describir el efecto de las consecuencias de la conducta que en la modificación de ésta. 

Tanto el condicionamiento clásico como el operante utilizan los componentes básicos -estímulos y respuestas- para explicar el aprendizaje, pero difieren en su ordenamiento. Mientras en el condicionamiento clásico la atención se centra en el estímulo que causa la respuesta, en el condicionamiento operante, la atención está puesta en la consecuencia que sigue a una respuesta determinada y en el efecto que ésta tiene sobre la probabilidad de emisión de la respuesta en el futuro.

De esto surge lo que los conductistas llaman el análisis ABC, es un análisis de la conducta (B de Behavior) y su contexto, o más específicamente de sus antecedentes (A) y sus consecuencias (C). En el modelo conductual de Skinner este tipo de análisis pone su acento en las consecuencias (C), siendo tanto así que los antecedentes (A) que se consideran para el análisis, son aquellos que adquieren su influencia de las consecuencias de la conducta (Williams,1999). Por ejemplo, si el comentario de un estudiante es considerado sólo cuando el profesor le ha dado la palabra, el alumno eventualmente aprenderá a comentar sólo cuando el profesor le de la palabra. Si bien del análisis ABC podrían inferirse causas y efectos, de hecho lo que nos facilita no es eso, sino que sólo nos permite describir la secuencia de eventos. Pero por eso mismo nos puede permitir ver si existen o no cambios en la conducta si introducimos alteraciones ya sea en los antecedentes y/o en las consecuencias.

Refuerzo y Castigo

Las consecuencias de un comportamiento pueden aumentar la probabilidad de ocurrencia de la respuesta (refuerzo) o disminuir la probabilidad de que se repita (castigo).

a.     Refuerzo

Un refuerzo se define como un evento que, presentado inmediatamente después de la ocurrencia de una conducta, aumenta la probabilidad de ocurrencia de dicha conducta.
Existen distintos tipos de refuerzos. Aquellas consecuencias que al ser presentadas aumentan la probabilidad de que ocurra una respuesta son refuerzos positivos; por ejemplo, si se le da una buena nota a un niño cuando éste ha estudiado, tenderá a repetir su conducta de estudio; si los compañeros se ríen y celebran los chistes del payaso del curso, éste probablemente mantendrá comportándose como tal. En cambio, aquellas consecuencias que al ser retiradas de la situación aumentan la probabilidad de que la respuesta vuelva a ocurrir son llamadas refuerzos negativos.


EN EL SIGUIENTE VIDEO UN EJEMPLO DE REFORZAMIENTO POSITIVO EN EL CONDICIONAMIENTO OPERANTE;



Estos refuerzos funcionan como un alivio; si a un niño que se porta mal en clase, porque le produce ansiedad estar sentado escuchando a la profesora, se le echa para afuera, se le está reforzando negativamente, pues se le está retirando el estímulo provocador de ansiedad, y aumentan las probabilidades de que siga portándose mal.

Los refuerzos, además, pueden clasificarse en primarios y secundarios.

Los refuerzos primarios son aquellos que se relacionan con la satisfacción de necesidades biológicas, tales como comida o bebida.

 En cambio los refuerzos secundarios son aprendidos por asociación con los primarios, e incluyen el dinero, las calificaciones escolares o el elogio, por ejemplo (Papalia y Wendkos, 1987).
Es importante notar que lo que es reforzante para una persona no necesariamente lo es para otra, por lo cual hay que tomar en cuenta el contexto y las características personales cuando se quiere enseñar una conducta a través del condicionamiento operante. Además, para que el refuerzo sea efectivo, éste debe ser contingente con la conducta que se desea reforzar, es decir, debe ser administrado lo antes posible después de ejecutada la conducta.

b. Castigo Además de controlar las consecuencias de una conducta con el objeto de aumentar la probabilidad de que ésta vuelva a ocurrir, es posible manipular las consecuencias para producir una disminución en la conducta. Una consecuencia que, inmediatamente después de una conducta, hace que disminuya la probabilidad de que la conducta se vuelva a repetir es un castigo.

Existen dos tipos de castigo: el castigo positivo consiste en la aparición de un evento displacentero o doloroso, mientras que el castigo negativo consiste en la desaparición de un evento “bueno” o placentero. Por ejemplo, una profesora que hace que su curso copie una frase del pizarrón 30 veces está aplicando un castigo positivo, mientras que un profesor que deja a su curso sin recreo, está utilizando un castigo negativo.

Para que un castigo o refuerzo sea efectivo, debe cumplir con ciertas condiciones. La primera, es la contingencia temporal, que significa que el castigo será más efectivo mientras menor sea el intervalo de tiempo que transcurra entre el comportamiento indeseado y el castigo. La segunda se refiere a la constancia; esto implica que el castigo será efectivo cuanto más constante sea; no basta con castigar una conducta a veces: debe castigarse cada vez que se presente para que efectivamente disminuya su aparición. Finalmente, la eficacia depende de la medida en que se refuercen conductas alternativas. No basta con señalarle a la persona qué conducta no debe emitir, sino que además hay que señalarle qué es lo que debe hacer en cambio (Papalia y Wendkos, 1987).

Estímulo Discriminativo

Como se mencionó anteriormente, el comportamiento puede ser modificado manejando tanto las consecuencias como los antecedentes de ésta. Una forma de manejar los antecedentes es dando claves o señales que entreguen información acerca de cuáles son los comportamientos que son apropiados en la situación, es decir, qué comportamientos llevarán a consecuencias positivas y cuáles a consecuencias negativas; o bien señales que indiquen cuándo debe producirse una conducta y cuándo no. A estos estímulos se les llama estímulos discriminativos.

 Por ejemplo, el inspector parado en el pasillo a la salida de clases, es un estímulo discriminativo para la emisión de la conducta de no correr, empujarse ni gritar por parte de los alumnos.

 Procesos en el Aprendizaje por Condicionamiento Operante Además de los procesos de generalización y discriminación, que fueron descritos para el caso del condicionamiento clásico, el aprendizaje mediante condicionamiento operante incluye otros cinco procesos que merecen ser descritos aquí.

Ellos son el priming, el shaping o moldeamiento, el encadenamiento, el contra condicionamiento y la extinción.

a.    Priming Es el proceso por medio del cual se provoca el comportamiento deseado -o algo parecido a él- de manera deliberada, para que éste pueda ser reforzado. Se usa cuando se quiere reforzar una conducta que nunca, o casi nunca, ha sido exhibida por la persona (en cuyo caso sería muy difícil esperar a que ocurra la conducta para reforzarla). Por ejemplo, enseñarle a un niño que siempre da portazos, a cerrar silenciosamente la puerta; si el profesor espera a que el niño muestre la conducta, puede demorarse mucho, ya que el niño no tiene por qué empezar a hacerlo, y así, no tiene cómo reforzar la conducta deseada. Para que la conducta empiece a aparecer, puede recurrir a elementos externos que ayuden al niño a dar tal respuesta, como por ejemplo, apretar la bisagra de la puerta para que cueste dar portazos, o poner un borrador que amortigüe el golpe y por lo tanto reduzca el ruido. El niño se ve obligado a emitir la conducta, de manera que puede ser reforzada.


b.    Shaping o Moldeamiento Es un proceso que se usa para enseñar conductas muy complejas, que no se puede esperar que ocurran correctamente las primeras veces que se llevan a cabo.

El moldeamiento mediante aproximaciones sucesivas es un proceso en que se da un refuerzo cuando la persona muestra un comportamiento que se parece o aproxima al comportamiento deseado; cada comportamiento reforzado debe ser una mejor aproximación a lo deseado.

Por ejemplo, enseñar a escribir a máquina. El alumno comete 15 errores en el primer intento, 13 en el segundo, 17 en el tercero, 14 en el cuarto y 10 en el quinto. El profesor refuerza al alumno en el primer intento, y en el segundo y el quinto; no refuerza en los otros, ya que el tercero fue peor que los demás, y el cuarto fue mejor, pero no mucho mejor.

c.    Encadenamiento Este proceso se relaciona con la aproximación sucesiva y requiere de un programa de reforzamiento que vaya paso a paso; es el reforzamiento de componentes parciales o de ciertas partes de un comportamiento más complejo. Se refuerzan secuencialmente distintas partes del comportamiento con la expectativa de que se aprenda también el comportamiento total.
Hay dos tipos de “encadenamiento”: hacia delante y hacia atrás. En el primero se refuerza cada paso del comportamiento en el orden en que ocurren. En el segundo, se refuerzan primero los pasos finales, y después los primeros pasos del acto complejo.

Ejemplo de encadenamiento hacia adelante:

La profesora que enseña a coser refuerza primero las conductas de cortar telas, marcar patrones; luego refuerza costuras derechas; luego refuerza tipos de costura más complejos; finalmente, se refuerza el producto completo.

Ejemplo de encadenamiento hacia atrás:

Esto se usa especialmente en tareas en que los primeros pasos son más difíciles que los últimos. Una profesora enseña a hacer figuras de greda en un torno.
Como las primeras fases del trabajo son muy difíciles, ella los hace y deja que sus alumnos terminen el trabajo y saquen la figura del torno; cuando hacen eso bien, los refuerza. De a poco, va dejando más tareas por hacer, empezando solamente el trabajo, y finalmente, deja que los alumnos hagan todo. Este tipo de encadenamiento también se aplica con frecuencia cuando los primeros pasos de una tarea son más peligrosos que los finales.
Tal es el caso de una madre que enseña a su hijo a hacer un huevo revuelto. Primero le enseñará a revolver el huevo, más adelante le enseñará a quebrar un huevo, y por último le enseñará a prender el gas de la cocina.

d.    Contracondicionamiento

 Es el proceso a través del cual un comportamiento indeseado es eliminado o removido al mismo tiempo que es sustituido por un comportamiento deseable a través del reforzamiento. Los dos comportamientos son incompatibles, por lo cual el establecimiento de la conducta deseado implica necesariamente la eliminación de la indeseada. Por ejemplo, si un niño molesta en clase por sacarle punta a sus lápices haciendo mucho ruido, la profesora querrá eliminar esa conducta, para ello lo reforzará cuando llega a clases con sus lápices ya con punta. Otro ejemplo (Nordquist y Bradley, 1973) lo encontramos en el niño que no participaba con sus compañeros y se mantiene alejado en los recreos. La profesora, preocupada, se acerca a él, pero este acercamiento parecía reforzar su conducta de alejamiento de sus compañeros. Se le aconseja a la profesora que ignore al niño cuando éste esté solo, y en cambio, lo refuerce cuando se mezcle con los demás.

e.    Extinción
Es el proceso que explica la pérdida de patrones de comportamiento que han sido previamente reforzados. Se produce cuando se elimina el refuerzo a una conducta. Para eliminar o extinguir una conducta, es necesario en primer lugar identificar los refuerzos que están ligados a ella, para luego retirarlos. Por ejemplo, si cuando el profesor reta a un niño, las risas que éste reto producen los compañeros refuerzan la mala conducta del niño, el profesor puede eliminar sus retos, eliminando así el reforzador.



Programas de refuerzo

 El concepto Programas de Reforzamiento se refiere a la pauta con la cual se aplica el refuerzo. En términos generales, el reforzamiento puede ser continuo o parcial.

a.    Refuerzo Continuo
Se refiere al reforzamiento de cada una de las respuestas correctas. Es el tipo de reforzamiento más rápido para aprender una conducta.

b.    Refuerzo Parcial o intermitente
Este es aquel que se entrega de manera frecuente, pero no continuada, es decir, sólo se entrega frente a algunas emisiones de la conducta. Este tipo de reforzamiento demora más en producir el aprendizaje de una respuesta, pero produce un comportamiento más resistente a la extinción. El criterio para administrar o no el refuerzo puede ser de intervalo (fijo o variable) o bien de razón (fija o variable).

c.    Programas de intervalo

Aquí, los refuerzos se administran cada cierto tiempo determinado. En el intervalo fijo, este período de tiempo es siempre el mismo, lo cual lo hace sumamente predecible y por lo cual tiende a disminuir la conducta inmediatamente después de entregado el refuerzo. Por ejemplo, si un curso sabe que la profesora pasará a revisar su trabajo cada quince minutos, es probable que los niños jueguen y conversen durante los primeros minutos, poniéndose a trabajar poco antes de que se cumplan los quince minutos y después que se haya ido la profesora sabrán que vuelven a tener un buen rato para conversar y jugar antes que ella vuelva. En cambio, en el intervalo variable el tiempo que transcurre entre un refuerzo y el próximo va cambiando, de manera que es difícil de predecir su aparición, pero la conducta se hace uniforme, estable y difícil de extinguir.

d.    Programas de razón


 En el reforzamiento de razón lo que importa es el número de respuestas ejecutadas y no el tiempo que pase entre cada refuerzo. En un programa de razón fija, el refuerzo es entregado cada cierto número de respuestas. Los programas de razón variable, por otro lado, refuerzan al individuo después de un número variable de respuestas, que oscilan alrededor de un promedio determinado.Este último programa hace que la conducta reforzada sea más resistente a la extinción. En el primer caso, por ejemplo, se reforzaría al alumno con un premio después de que resuelva correctamente 5 ejercicios de aritmética; en el segundo, en cambio, se reforzaría a veces después de 2 ejercicios correctos, a veces después de 4, 5 ó 6, por ejemplo.



Cuadro Resumen de los tipos de programas de reforzamiento intermitente.


Aplicación del Condicionamiento Operante en Educación 

Tal como se ha visto, el principal potencial del condicionamiento operante al ser aplicado a la educación consiste en su capacidad para instaurar, modificar y eliminar conductas indeseables y para instaurar otras deseables.

Así, los principales usos que se le han dado a esta técnica en la educación han consistido en crear un ambiente conductual apropiado a la situación de aprendizaje, mediante un adecuado uso del refuerzo, castigo y estímulos discriminativos. Según Ervin y Ehrhardt (2000, citados en Ervin, Erhhardt y Poling, 2001) la mayor influencia del análisis funcional propuesto por Skinner a la psicología escolar, son las reglas de un modelo general de disciplina.

Es así como Skinner ( Tuckman, 1992; Travers, Elliot y Kratochwill, 1993), plantea que el profesor debe seguir las siguientes indicaciones para lograr poner en práctica estos principios:

• Seguir el desempeño de una respuesta correcta con consecuencias positivas, ignorando las respuestas incorrectas.

• Proveer óptimas contingencias de reforzamiento por respuestas correctas, las cuales deben ser positivas, inmediatas y frecuentes. Inicialmente deben ser continuas y luego intermitentes.

• Maximizar la ejecución de respuestas correctas y minimizar los errores, utilizando el moldeamiento o shaping, mediante el uso de pequeños pasos instruccionales.

• Evitar utilizar el control aversivo.

• Reforzar la conducta exacta que se quiere enseñar.

• Aplicar el reforzamiento, lo más específicamente posible, evitando ser vago. Se requiere que el aprendiz entienda claramente cúal es el comportamiento que está siendo reforzado.

• Estar atento a la naturaleza y timing de los reforzamientos a utilizar, identificando aquellos pertinentes a cada aprendiz en particular.


Por la especificidad de las recomendaciones que se puede realizar a la educación desde el condicionamiento operante, es que los procesos implicados en el análisis funcional, están siendo reconocidos como la primerísima intervención a realizar con niños con necesidades educativas especiales por el congreso de Estados Unidos en el “Individuals with Disabilities Education Act” (IDEA, 1999, citado en Ervin, Ehrhardt y Poling, 2001).










FUENTES CONSULTADAS

http://www.cippsvonline.com
https://www.blogger.com
https://www.youtube.com
http://galeon.com/nada/parte2.pdf
http://html.rincondelvago.com/conductismo_6.html
http://es.slideshare.net/leyaflor/presentacion-conductismo-psicologia-skinner

http://uoctic-grupo6.wikispaces.com/Conductismo?responseToken=5727beac61e9458005c75a5a7f9aca65





















No hay comentarios:

Publicar un comentario