Abstract El reforzamiento junto con el aprendizaje es un tema que aun causa mucho interés en los profesionistas que se dedican a la investigación sobre este tema. Pero ¿porque una teoría que tiene varios años en el ámbito de la Psicología sigue causando y despertando este interés?. Si bien, todos sabemos sobre la naturaleza de los reforzadores en el aprendizaje, sabemos sus inicios y como se dieron las grandes Teorías del mismo, nos hablan de esas “leyes” como si fueran universales, como si aplicaran en forma global, ¿será que eso es verdad? Será que después ya de varios años siguen aplicando estas leyes? Que tan fácil, que tan rápido, y que tan eficaz siguen siendo en pleno siglo XXI. Como saber, más bien como aclarar y como definir bien lo que es un reforzador, seguido de un reforzamiento, como combinarlo con lo que es el aprendizaje y como explicar su resultado de la combinación antes dicha. Esas cuestiones nos inquietaron a lo que nos llevó a sí no hacer una réplica tal cual sí a basarnos, en experimentos que encontramos en la historia del reforzamiento en el aprendizaje. Poder emplear un experimento en salón de clase y con una de nuestras compañeras fue algo digno de reportar, los resultados fueron interesantes para nosotros como estudiantes en Psicología. Introducción Primeras investigaciones de Thorndike. En 1898, Edward Thorndike presento una teoría del aprendizaje que destacaba el papel de la experiencia para fortalecer o debilitar las conexiones entre estímulos y respuestas .En su tesis doctoral, Thorndike coloco un gato dentro de un laberinto con puerta que solo se abría cuando se manipulaba correctamente una palanca , observo que el gato comenzaba realizando movimientos aleatorios para poder salir del laberinto; llegaba un momento que por casualidad, pulsaba el mecanismo que abría la puerta. La siguiente ves que el gato volvía al laberinto empezaba a realizar de nuevo movimientos por ensayo y error, pero esta vez tardaba menos tiempo en salir. A lo largo de los ensayos, aunque el gato continuaba demostrando que su conducta se basaba en el ensayo y el error, tardaba cada vez menos en salir del laberinto. (Ellis,2005, pág. 60). Thorndike a partir de estas observaciones llego a la conclusión de que el aprendizaje de una conducta estaba influido por la consecuencia de esa conducta. De ahí se deriva la ley del efecto de Thorndike. Expresada en la siguiente cita: las respuestas a una situación que están seguidas de una satisfacción se fortalecen; las respuestas que están seguidas por algo desagradable se debilitan. (Ellis, 2005). En resumen Thorndike nos dice que el aprendizaje consiste de un ensayo y error, con una adquisición progresiva de aquellas conductas que producen satisfacción y la supresión de otras conductas que producen desagrado. (Ellis, 2005, pág. 60). Esta ha sido la primera teoría de aportación hacia la relación entre el aprendizaje y el reforzamiento, ha sido la pauta para nuestra siguiente teoría. El condicionamiento operante de Skinner. A diferencia de Thorndike, Skinner solo nos habló de la fuerza de las respuestas y no de las fuerzas de las conexiones E-R. su principal constaba de estudiar las consecuencias mediante una medida precisa de las respuestas en un entorno cuidadosamente controlado, desarrollo un equipo denominado Caja de Skinner y tiene como objetivo el estudio de la conducta de las ratas se compone de una banda metálica que cuando se baja hace que caiga comida al alcance del animal. Como resultado de este experimento Skinner desarrollo una descripción del aprendizaje, fueron propuestos por primera vez en 1938. La ley básica del condicionamiento de Skinner nos dice que: Una respuesta que va seguida de un refuerzo se fortalece, y por lo tanto tiene más probabilidad de volver a producirse. Cuál es el efecto de un reforzamiento sobre o en el aprendizaje. Para poder responder esta cuestión tenemos que desglosar en varias maneras los conceptos que en ella vienen incluidos y así ir construyendo poco a poco la definición que nos complace para entender el reforzamiento en el aprendizaje. Encontramos que el aprendizaje se define como una experiencia humana tan común que es raro que la gente reflexione sobre el significado exacto de decir que si ha aprendido algo. El aprendizaje es un cambio duradero en los mecanismos de la conducta que involucra estímulos y/o respuestas específicos siendo el resultado de la experiencia previa con esos estímulos y respuestas o con otros similares.(Dojman, 2010, pág.17). Por otro lado tenemos que definir al propio reforzador de alta calidad como aquel que el organismo prefiere en lugar de otros. (Hilgard, 1969, pág. 164). O bien un reforzador es un ESTIMULO o suceso que incrementa la frecuencia de la respuesta a la que sigue.(Ellis,2005, pág. 63). En los reforzadores encontramos dos clasificaciones que son: - Reforzador primario - Reforzador secundario Un reforzador primario es aquel que satisface una necesidad o deseo de carácter biológico o innato (Ellis, 2005,pág. 69). Por otro lado un reforzador secundario también conocido como reforzador condicionado, es un estímulo previamente neutro que ha llegado a ser reforzante mediante su asociación repetida con otro reforzador (Wolfe, citado en Ellis, 2005). Después de que hablamos de la clasificación de los reforzadores tenemos que tener en cuenta la siguiente forma en que estos se pueden encontrar en el modelo de condicionamiento operante. Es el reforzamiento: -Positivo -Negativo El reforzador Positivo es supone la expresión de un estímulo después de la respuesta. La comida, una sonrisa, las alabanzas y el éxito son reforzadores positivos. (Ellis, 2005, pág.71) Para (Domjan, 2010) es un procedimiento en que la respuesta instrumental produce un estímulo apetitivo. Los procedimientos de reforzamiento positivo producen un incremento en la tasa de respuestas. El reforzador negativo incrementa una respuesta mediante la retirada de un estímulo generalmente de carácter aversivo o desagradable. (Ellis, 2005, pág.71). La gente tiende a confundir el reforzamiento negativo con el castigo en ambos procedimientos pero en conclusión se sabe que el castigo disminuye la respuesta instrumental, mientras que el reforzamiento negativo la incrementa. (Domjan, 2010). Sabemos que en el ámbito de la literatura habrá siempre definiciones distintas de lo que es un reforzador ellas causan una serie de dificultades, para contrarrestar ese problema se habla de una descripción empírica de la operación del reforzamiento (el acto de proporcionar un reforzador tras una conducta), (Ellis, 2005, pág.63); lo que se busca con ellas es que se describan la manera en que parámetros del reforzamiento controlan la ejecución en la situación de aprendizaje. (Hilgard, 1969). Existen grupos de parámetros para la asignación de un reforzador, estos son: - Magnitud, (cantidad y calidad) del reforzamiento - Demora del reforzamiento - Intervalo de entre estímulos en el condicionamiento clásico - Programas de reforzamiento. En la magnitud del reforzamiento abarca la cantidad y la calidad del mismo. (Hilgard, 1969, pág. 165). Posteriormente se observa la forma en que la respuesta por una determinada cantidad y tipo de recompensa depende de la experiencia previa de los organismos con otros reforzadores. (Domjan, 2010). La demora del reforzamiento habla de que las respuestas cercanas en espacio o tiempo al reforzamiento se prenden más rápidamente que las respuestas lejanas a él. (Hilgard, 1969, pág. 165). En la clasificación de reforzadores encontramos: Reforzadores materiales Un reforzador material o tangible es un objeto cualquiera, ejemplo, la comida o los juguetes. Reforzadores sociales Un reforzador social es un gesto o un signo de una persona hacia otra que transmite una intensión positiva. Reforzadores de actividad Un reforzador de actividad supone una oportunidad para realizar una actividad favorita. Reforzadores intrínsecos cuando las personas realizan las respuestas no tanto como efecto de estímulos externos, si no debido a los sentimientos internos agradables que genera este tipo de respuestas. Método Participantes Basamos nuestro experimento en un único participante, aplicando todo el control posible, siendo irrelevante su género y otros factores para lo concerniente a este estudio. Posteriormente se incluirán a los demás integrantes del Grupo 3004 de la Facultad de Psicología con el fin de que, al comparar sus experimentos similares, se pueda llegar a una conclusión de si el reforzamiento es o no un método de aprendizaje. Instrumentación El laberinto de Foster será el instrumento principal del experimento, cuya solución será determinante para medir el efecto del reforzamiento en el aprendizaje, de igual manera, la utilización de una bufanda fue esencial para evitar que el participante tenga una visión del laberinto, eliminando así la variable de reconocimiento, aunque fuese sólo de manera táctil a partir de lo que pudiese haber visto. Se requirió de la utilización de Lápiz, hojas blancas y cronómetro, para llevar el registro del tiempo de cada ensayo siendo utilizado un segundo lápiz como guía del sujeto a través del laberinto, trazando con la punta todos sus recorridos. El tiempo se midió en segundos y así fueron representados tanto en la Tabla 1 como en la Figura 1. Para simplificar la Tabla 2 y la Figura 2, se transformó en minutos los segundos, tanto de nuestro experimento como del de los otros equipos, facilitando la representación de datos, que en su mayoría, si se dejaban en el nivel de medición previamente establecido (segundos), habrían dificultado su comprensión. Procedimientos El participante fue informado de que su objetivo sería el llegar al final del laberinto dos veces, sin importar los intentos que le llevaran a ello, siendo irrelevante que ambos éxitos se sucedieran inmediatamente (es decir, que después del primer éxito sucediera el segundo al siguiente ensayo) o bien, que se equivocara al termino de uno, dejando claro que si se diera la segunda opción no se reiniciaría el número de intentos ni de éxitos a cero. Sin mirar, el participante tuvo que trazar el camino hacia la meta, obteniendo un reforzamiento positivo cada vez que giraba correctamente (entiéndase por esto que giraba sin entrar en ningún callejón) que consistía en decirle al participante, por parte de los experimentadores, “muy bien”. Si llegaba a entrar en un callejón sin salida recibía como castigo la palabra “no”. Si el participante no modificaba su camino en este punto (regresando por el camino que vino) y llegaba a tocar la pared del callejón, se le tomaba la mano y se le regresaba al inicio del laberinto, indicándole que debía de intentarlo de nuevo. Al concluir las 2 rondas de ensayos de intentos fallidos con sus dos respectivos ensayos sin error (éxitos), se prosiguió a recabar los datos de los demás equipos de experimentadores del grupo para complementar nuestros resultados con los que hicieron ensayos con reforzamiento (al igual que nosotros) y contrastarlos con los que lo hicieron sus ensayos sin reforzamiento. Resultados En la Tabla 1 es posible observar que realmente hay una disminución significativa en cuanto al número de ensayos necesarios para obtener un recorrido perfecto. Ésta tabla está representada en la Figura 1, en la cual apreciamos algunos altibajos en el tiempo de cada ensayo, aunque al comparar los ensayos a partir de las rondas observamos que la cantidad de ensayos es menor en la segunda ronda, sin embargo el tiempo no se reduce en la segunda ronda si comparamos sus datos individualmente con la segunda, pero sí si comparamos ambas rondas en su total de tiempo. Complementando nuestros resultados con los de los demás equipos podemos apreciar que hay una discrepancia tanto en tiempo como en número de ensayos entre los experimentos hechos con reforzamiento y los hechos sin reforzamiento. Como puede observarse, hay una mayor necesidad de ensayos y tiempo entre un estudio y otro, siendo mucho más efectivo, en términos de menor tiempo y menos ensayos, el experimento con reforzamiento que el experimento sin reforzamiento. En la discusión expondremos nuestras hipótesis respecto a lo que creemos que pudo haber sido el determinante de que se dieran estos resultados, tanto para los que surgieron de nuestra propia investigación y los provenientes de la comparación con el grupo. Tabla1. Datos del Participante X Tiempo Ensayos Ronda 1 Ronda 2 1 10.9 9.5 2 21.4 43.6 3 19.2 6.8 4 5.9 21 5 15.6 19.4 6 7 7.5 7 21.8 14.6 8 58.3 8.7 9 27.3 25.7 10 9.3 11 14.5 12 25.8 13 36.8 14 11.1 15 16.3 16 33.4 R1= 334.6 R2=156.8 Tiempo participante: 491.4 seg Tiempo Total (práctica): 45 min/2700 seg Puede observarse una reducción tanto en tiempo total de ensayos como de total de tiempo para conseguir un segundo éxito, sin embargo la reducción del tiempo podría deberse a la menor cantidad de ensayos, por lo que se volverá a tocar lo concerniente a estos datos en la Discusión. Figura 1.- Comparación entre tiempo y ensayo entre rondas del participante. 70 60 Tíempo 50 40 Ronda 1 30 Ronda 2 20 10 0 0 2 4 6 8 10 12 14 16 Ensayos En esta figura es mucho más fácil distinguir las fluctuaciones de tiempo aparentemente independientes del número de ensayo y si éstos se suceden o no en el tiempo. Se tocará éste tema en la discusión. Tabla 2.- Promedio de tiempo y ensayos por grupo. Ensayo 𝑋̅ Con reforzamiento Sin reforzamiento 32.7 42.125 Tiempo 𝑋̅ 13.61 16.45 Ésta tabla nos muestra la diferencia entre la utilización de una serie de ensayos con reforzamiento y otra serie sin reforzamiento. Nótese el contraste de cantidades entre ambos tipos de experimentos. Hacemos de nuevo hincapié en esperar hasta la discusión para intentar encontrar el porqué de la aparición de éstos resultados. 18 Figura 2.- Tiempo de experimentos con reforzamiento y sin reforzamiento 18 16 Promedio de Tiempo (minutos) 14 12 10 8 6 4 2 0 Con reforzamiento Sin reforzamiento La figura nos muestra que el promedio de tiempo del experimento con reforzamiento fue mucho más eficaz, al requerir menor tiempo para conseguir los dos éxitos. Figura 3.- Ensayos de reforzamiento y sin reforzamiento de grupo 45 40 35 Ensayos 30 25 20 15 10 5 0 Con reforzamiento Sin reforzamiento Hay una menor cantidad de ensayos necesarios para la llegada a la meta en los quipos que aplicaron reforzamiento que los que no lo aplicaron. Discusión Referencias Domjan, M. (2010). Principios de Aprendizaje y Conducta (6° ed.). México: Cengage Learning. Ellis, J. (2005). Aprendizaje Humano (4° ed.). Madrid: Pearson. Hilgard, E., & Marquis, D. (1969). Condicionamiento y Aprendizaje. México: Trillas.