Refuerzo positivo

La idea básica

¿Has presenciado alguna vez un enfrentamiento entre un niño pequeño que pide un juguete y sus padres? El niño puede emplear docenas de tácticas despiadadas, incluso desencadenar la humillación definitiva: una rabieta en medio del centro comercial. Como espectador, piensas: "Cómprale el juguete, ¡lo que sea para que esto pare!". Sin embargo, como bien saben los padres experimentados, esta rendición indicará al niño que comportándose mal consigue lo que quiere. En otras palabras, el juguete actuará como un reforzador positivo del mal comportamiento. En psicología conductista, el refuerzo positivo es un concepto clave del condicionamiento operante, una poderosa forma de aprendizaje en la que las consecuencias del comportamiento determinan la probabilidad de comportamientos futuros.1

¿Qué es el amor sino otro nombre para el uso del refuerzo positivo? O viceversa.


-El psicólogo estadounidense B. F. Skinner en Walden Dos

Theory, meet practice

TDL is an applied research consultancy. In our work, we leverage the insights of diverse fields—from psychology and economics to machine learning and behavioral data science—to sculpt targeted solutions to nuanced problems.

Our consulting services

Términos clave

Condicionamiento operante: Proceso de aprendizaje en el que las consecuencias de un comportamiento influyen en si se repetirá en el futuro.2 Operante se refiere a la acción intencionada.

Refuerzo positivo: Cuando una consecuencia de un comportamiento aumenta la fuerza del comportamiento. "Positivo" se refiere a la adición de un estímulo, mientras que refuerzo se refiere al aumento de la conducta.

Conductismo: Movimiento de la psicología que hacía hincapié en el estudio de los procesos observables (conducta) en lugar de los estados mentales subjetivos.3

Historia

A principios del siglo XX, muchas teorías sobre la mente y el comportamiento humanos no se comprobaban experimentalmente. Para hacer la psicología más científica, algunos investigadores sugirieron que los psicólogos se centraran en el estudio de procesos observables y cuantificables. Estos investigadores desencadenaron un movimiento que ahora se conoce como conductismo. Un contribuyente clave a esta revolución fue E.L. Thorndike. Thorndike estudió principalmente los procesos de aprendizaje de los animales observando cómo los gatos aprendían a escapar de cajas rompecabezas. Sus hallazgos culminaron en su tesis de 1911, en la que esbozó la ley del efecto.4 Esta ley afirmaba que cuando un estímulo y un comportamiento van seguidos de algo agradable, es probable que el comportamiento se repita cuando el estímulo esté presente. Si el estímulo y la conducta van seguidos de una consecuencia desagradable, es probable que la conducta disminuya en respuesta al estímulo. Aunque esta conclusión pueda parecer obvia ahora, la investigación de Thorndike fue muy innovadora en su momento, ya que hacía hincapié en el análisis cuantificable. Su trabajo sobre la ley del efecto se considera el primer estudio de laboratorio sobre el aprendizaje, que sentó las bases para posteriores investigaciones en este campo.

En la década de 1930, un joven psicólogo llamado B.F. Skinner amplió enormemente las investigaciones de Thorndike, llegando incluso a crear su propia caja rompecabezas, más tarde bautizada como "caja de Skinner".5 Esta caja más pequeña, frecuentada más a menudo por ratas que por gatos, se utilizaba para estudiar cómo cambiaba el comportamiento de los animales en función de las distintas consecuencias. Basándose en esta investigación, Skinner definió el condicionamiento operante como el refuerzo o debilitamiento de la conducta debido a sus consecuencias.

También identificó cuatro tipos de aprendizaje operante, que a veces se denominan contingencias. Dos de estos tipos provocan un aumento de la conducta (refuerzo positivo, refuerzo negativo), y los otros dos debilitan la conducta (castigo positivo, castigo negativo).5 La contingencia más conocida, el refuerzo positivo, se refiere al aumento de la probabilidad de que una conducta se repita si se combina con un estímulo consecuente. Este estímulo es un reforzador positivo, a menudo relacionado con algo placentero. Por eso algunos investigadores denominan a esta forma de aprendizaje "aprendizaje de recompensa". Sin embargo, Skinner hizo hincapié en que lo que determina si un estímulo es un reforzador positivo es que refuerce una conducta, en lugar de causar un placer subjetivo. Por ejemplo, en determinadas situaciones, unas descargas eléctricas muy desagradables pueden provocar un aumento de la conducta. Además, lo que una persona encuentra gratificante puede ser completamente desagradable para otra.

Allen Neuringer subrayó más tarde que el refuerzo positivo no sólo aumenta la probabilidad de que un comportamiento se repita, sino que puede influir en otros aspectos del comportamiento, como la duración o la persistencia. Un experimento realizado por Neuringer y Page con palomas demostró que incluso el comportamiento aleatorio puede enseñarse mediante el refuerzo positivo. Lo demostraron proporcionando refuerzos a las palomas sólo cuando su patrón de picoteo era diferente al de todos los ensayos anteriores.6

Personas

Edward Lee Thorndike

Thorndike comenzó su carrera académica en la Universidad de Wesleyan, donde estudió literatura. Más tarde se pasó a la psicología, que estudió tanto en Harvard como en Columbia.4 Durante su estancia en Harvard comenzó a estudiar el aprendizaje en animales.5 Debido a la falta de espacio de laboratorio para esta innovadora investigación, Thorndike se vio obligado a mantener a sus peludos sujetos en su habitación hasta que William James le ofreció amablemente un espacio en el sótano.5 Finalmente, Thorndike obtuvo una beca en Columbia, donde escribió su famosa disertación en la que articulaba la ley del efecto. Tras convertirse en profesor, Thorndike se esforzó por trasladar lo aprendido en sus investigaciones experimentales sobre el aprendizaje al sistema escolar y publicó varios libros en los que instruía sobre cómo aplicar la psicología a la enseñanza.4

Burrhus Frederick Skinner

B.F. Skinner es considerado el Darwin de la ciencia del comportamiento y el psicólogo más eminente del siglo XX. Aunque en un principio aspiraba a convertirse en escritor, los trabajos del fisiólogo Ivan P. Pavlov sobre el condicionamiento clásico y de John B. Watson sobre el conductismo inspiraron a Skinner a dedicarse a la psicología.5,7 Se doctoró en Harvard y más tarde se le atribuirían varias mejoras en el proceso de investigación que estudia el aprendizaje. Propuso utilizar la tasa de cambio de conducta como medida del aprendizaje, ideó la caja de Skinner para estudiar el aprendizaje y avanzó enormemente en el uso de métodos científicos en el campo de la psicología.5,7 La investigación de Skinner y sus obras no académicas, como su novela utópica Walden Dos, han inspirado una gran controversia, pero pocos críticos negarían la importancia de esta figura en el avance del campo de la psicología.

Consecuencias

Varias variables pueden afectar al éxito del refuerzo positivo, así como a las demás formas de condicionamiento operante. La primera variable es la contingencia, la probabilidad de que un reforzador siga a un comportamiento.5 Si las recompensas rara vez se dan después de comportamientos agotadores, no es probable que gastemos una energía preciosa realizando tales comportamientos. Otra variable es el tiempo que transcurre entre una conducta y su reforzador. Normalmente, cuanto más rápido se ofrece la recompensa, más rápido aprende el sujeto. Si pasa demasiado tiempo, puede que se refuerce la conducta equivocada. El tipo, la cantidad y la calidad del reforzador también son importantes. Incluso las ratas tienen preferencias alimentarias: ¡aprenden mejor cuando se les ofrece pan que semillas!5

Cuando se aplica el refuerzo positivo, que tiene una gran repercusión en el aprendizaje, se pueden utilizar diferentes programas.8 Una opción es hacer que el programa sea continuo, en el que las recompensas se dan cada vez que se realiza un comportamiento. Otra es hacer que el programa sea intermitente, lo que sólo proporcionaría una recompensa después de que el comportamiento se haya repetido una cierta cantidad de veces o después de un intervalo de tiempo determinado.

La entrega de recompensas de forma intermitente también puede hacerse de forma variable, lo que significa que el reforzador puede darse después de un periodo de tiempo variable (por ejemplo, cada tres o siete minutos), o una cantidad variable de comportamiento realizado (por ejemplo, cada 2-5 picotazos). Cada esquema de refuerzo puede ser eficaz en distintos escenarios: un jefe que paga a sus empleados de forma variable provocaría el caos, sin embargo, este esquema es muy emocionante para los jugadores de máquinas tragaperras en el casino.

Toda esta investigación llevada a cabo por Thorndike, Skinner y sus sucesores no se ha limitado al laboratorio. El refuerzo positivo se ha aplicado a la crianza de los hijos, la enseñanza, las adicciones, la economía, el comportamiento organizativo y otros campos. La teoría del empujón, por ejemplo, se basa en la idea de que el refuerzo positivo y otros métodos no forzados pueden promover con éxito decisiones y comportamientos saludables.9

Controversias

Desde el inicio del condicionamiento operante y el refuerzo positivo, las críticas han sido frecuentes. Algunos de los primeros críticos afirmaron que las perspectivas de Skinner eran reduccionistas, ya que negaban el papel de la biología, los pensamientos, los sentimientos y la autonomía en el comportamiento.5 Los partidarios de Skinner creen que esta crítica es una tergiversación de sus ideas y destacan que sus métodos fueron cruciales para hacer de la psicología un campo científico basado en pruebas. En la era moderna, campos como la ciencia cognitiva y la neurociencia pueden abordar "la caja negra" de la mente, algo que antes se consideraba inalcanzable cuando se observaba el refuerzo positivo. Como resultado, las críticas modernas se centran en defectos específicos del método y las pruebas de la teoría del refuerzo positivo, en lugar de descartar el concepto en su conjunto.

Los investigadores en educación Scott y Landrum abordaron algunas de estas críticas contemporáneas.10 Aunque su artículo responde principalmente a las críticas al refuerzo positivo en el contexto de la enseñanza, sus razonamientos pueden aplicarse a otros campos. Por ejemplo, una crítica común al refuerzo positivo es que no está respaldado por la investigación. Para rebatir esta afirmación, los autores muestran que los metaanálisis respaldan el uso de la retroalimentación positiva en entornos educativos. La razón por la que las pruebas en este campo pueden parecer contradictorias es que el tipo de reforzador y muchos otros factores pueden influir en el éxito del refuerzo positivo. Otra crítica mencionada es que el refuerzo inhibe la creatividad, lo que los autores refutan proponiendo que la creatividad implica adaptar habilidades a situaciones auténticas, lo que no sería posible si la habilidad no se adquiriera en primer lugar (un proceso que se ve facilitado por el refuerzo positivo). Tras refutar otras críticas, los autores concluyen que el refuerzo positivo en las escuelas está abrumadoramente respaldado por datos científicos y animan a los lectores a leer y confiar en la literatura científica y no en la psicología pop. Es evidente que las afirmaciones generalizadas sobre el refuerzo positivo, ya sean críticas o elogiosas, deben examinarse con cautela.

Estudio de caso

Fomentar la higiene de las manos mediante la tecnología de retroalimentación

Un estudio realizado en una unidad de cuidados intensivos de Nueva York examinó si una retroalimentación positiva podía mejorar las prácticas de higiene de manos del personal sanitario. La intervención consistió en instalar sensores en las puertas de las habitaciones de los pacientes, así como cámaras que grababan los lavabos y los desinfectantes de manos. Unos videoauditores externos controlaron si los trabajadores sanitarios se higienizaban las manos y unos paneles eléctricos les informaron inmediatamente de cómo les había ido en su turno (por ejemplo: ¡gran turno! 92% de éxito), además de resúmenes por correo electrónico e informes semanales de rendimiento. Los investigadores constataron que el cumplimiento no aumentó tras la vigilancia inicial con cámaras, pero sí mejoró una vez que se proporcionó la retroalimentación. La tasa de higiene previa a la retroalimentación, del 10%, aumentó al 81,6% en el periodo posterior a la retroalimentación. Aunque esta tecnología era costosa, los investigadores creen que la inversión estará justificada si futuros estudios demuestran una reducción de la tasa de infecciones hospitalarias.

Refuerzo positivo y adicción a las redes sociales

El popular documental de Netflix, The Social Dilemma, explica cómo las redes sociales aprovechan el refuerzo positivo intermitente para hacer sus plataformas más adictivas. Para explicar cómo funciona esto en la práctica, Tristan Harris, antiguo especialista en ética del diseño de Google, compara las redes sociales con las máquinas tragaperras de Las Vegas.12 Cuando conseguimos una pareja en Tinder, un like en Instagram o vemos que nuestro Youtuber favorito ha subido un vídeo, recibimos un golpe de dopamina como recompensa. Como en una máquina tragaperras, estas recompensas son escasas pero lo suficientemente frecuentes como para mantenernos enganchados. Al obtener un refuerzo positivo de forma relativamente aleatoria, se nos anima a interactuar con estas aplicaciones constantemente.

Contenido TDL relacionado

Refuerzo negativo

Mientras que el refuerzo positivo implica añadir un estímulo para aumentar un comportamiento, el refuerzo negativo implica eliminar un estímulo para aumentar un comportamiento. Estos dos conceptos suelen coincidir en casos reales de condicionamiento operante. Lea este artículo de TDL para saber más sobre el término hermano del refuerzo positivo y sus aplicaciones a la adicción.

La ciencia de la recompensa

La investigación sobre el refuerzo positivo demuestra que no todos los reforzadores son iguales y que varios factores pueden influir en el éxito de esta contingencia de aprendizaje. Este artículo del TDL explora los factores que influyen en el éxito del refuerzo monetario y cómo este tipo de refuerzo interactúa con la motivación intrínseca.

Fuentes

  1. Poling, A., Carr, J. E., & LeBlanc, L. A. (2002). Operant conditioning. Encyclopedia of Psychotherapy, 271-287. https://doi.org/10.1016/b0-12-343010-0/00154-9
  2. Quickel, E. J. (2020). Condicionamiento operante. Encyclopedia of Personality and Individual Differences, 3340-3342. https://doi.org/10.1007/978-3-319-24612-3_987
  3. Dictionary.com. (s.f.). Behaviorism. Dictionary.com. https://www.dictionary.com/browse/behaviorism.
  4. Encyclopedia Britannica, inc. (s.f.). Edward L. Thorndike. Encyclopedia Britannica. https://www.britannica.com/biography/Edward-L-Thorndike#ref253227.
  5. Chance, P. (2014). Aprendizaje y comportamiento (7ª ed.). Cengage Learning.
  6. Page, S., y Neuringer, A. (1985). La variabilidad es una operante. Revista de Psicología Experimental: Animal Behavior Processes, 11(3), 429-452. https://doi.org/10.1037/0097-7403.11.3.429
  7. Encyclopedia Britannica, inc. (s.f.). B.F. Skinner. Encyclopedia Britannica. https://www.britannica.com/biography/B-F-Skinner.
  8. Boundless. (s.f.). Psicología sin límites. Lumen. https://courses.lumenlearning.com/boundless-psychology/chapter/operant-conditioning/.
    indefinido
  9. Scott, T. M., y Landrum, T. J. (2020). Una lógica basada en la evidencia para el uso del refuerzo positivo: Respuestas a las críticas típicas. Beyond Behavior, 29(2), 69-77. https://doi.org/10.1177/1074295620917153
  10. Armellino, D., Hussain, E., Schilling, M. E., Senicola, W., Eichorn, A., Dlugacz, Y., & Farber, B. F. (2011). El uso de alta tecnología para hacer cumplir las medidas de seguridad de baja tecnología: The use of third-party remote video auditing and real-time feedback in healthcare. Clinical Infectious Diseases, 54(1), 1-7. https://doi.org/10.1093/cid/cir773
  11. Marciano, J. (2020, 15 de septiembre). Cómo los medios sociales hackean nuestra psicología. BetterMarketing. https://bettermarketing.pub/how-social-media-hacks-our-psychology-9f901f55e54a.

Read Next

Notes illustration

Eager to learn about how behavioral science can help your organization?