Teoría del refuerzo

La idea básica

¿Recuerdas cuando, en la escuela primaria, te ponían pegatinas y caritas sonrientes en las hojas de ejercicios? O tal vez te elegían de vez en cuando como monitor de clase. Siempre te hacía sentir un calorcito, como si estuvieras haciendo algo bien. Por otro lado, la sensación de recibir un castigo o de perderte el recreo era terrible.

Todos estos premios y castigos son ejemplos de la teoría del refuerzo. Aunque podemos recordar ejemplos de la escuela primaria, la teoría del refuerzo sigue influyendo en nuestra vida cotidiana.

En pocas palabras, la teoría del refuerzo sugiere que un comportamiento puede reforzarse cuando le siguen sucesos buenos y reducirse cuando le siguen sucesos indeseables. Se basa en la idea de que el comportamiento está influido por sus consecuencias. Por ejemplo, cuando una acción A produce un resultado deseable, es más probable que se realice la acción A; cuando una acción B produce un resultado desagradable, es menos probable que se realice la acción B. Es más probable que estudies para el examen de ortografía después de recibir los elogios de tu profesor; es menos probable que le tires del pelo a tu amigo después de recibir un sermón severo.

La teoría del refuerzo es un marco, también conocido como condicionamiento operante, que se detalla en el siguiente cuadro:

Reinforcement theory framework

El refuerzo pretende fomentar un comportamiento, mientras que el castigo pretende reducirlo. Tanto el refuerzo como el castigo pueden ser positivos o negativos. Un estímulo positivo supone añadir efectos deseables, mientras que el negativo supone eliminar los efectos indeseables de un comportamiento.

Creo que, por mucho que la gente se queje de cosas como las ceremonias de entrega de premios, proporcionan a la gente modelos de conducta. Proporciona un verdadero refuerzo positivo de que puedes ser quien eres y aun así conseguir grandes logros.


- Jack Monroe

Términos clave

Conductismo: El estudio sistemático del comportamiento externo

Operante: Comportamiento realizado por un individuo como respuesta

Refuerzo: Fomento de un comportamiento

Castigo: Desaliento de un comportamiento

Negativo: Eliminar las consecuencias de un comportamiento

Positivo: Añadir consecuencias a un comportamiento

Historia

Los primeros avances en el campo del condicionamiento se centraban simplemente en la asociación entre estímulos y la influencia que ejerce sobre las respuestas involuntarias. Probablemente conozca a los perros de Pavlov, que empezaban a salivar cuando oían el sonido de los pasos de su ayudante, mucho antes de tener la comida delante. Esto se conoce como condicionamiento clásico: un estímulo A y una respuesta resultante, como la comida y la salivación, se asocian con un estímulo diferente y neutro, como el sonido del asistente acercándose. Con el tiempo, B se asocia con A y, como resultado, provoca la misma respuesta que A. Con el tiempo, los perros aprenden que las pisadas que se acercan significan comida y salivan al oírlas.

El condicionamiento clásico se desarrolló durante un periodo de la psicología que se centraba principalmente en las necesidades y motivaciones internas del individuo. Maslow y Herzberg completaron trabajos relacionados durante este periodo.

Para los conductistas, el enfoque psicoanalítico era insatisfactorio porque no existían fenómenos externos y observables que permitieran verificar y poner a prueba sus técnicas. A principios del siglo XX, Edward Thorndike concretó la Ley del Efecto, sugiriendo que los individuos son más propensos a realizar acciones que tienen recompensas satisfactorias. Esto marcó un cambio significativo en el conductismo; las investigaciones posteriores empezaron a examinar los efectos externos de una acción y cómo influyen en las elecciones, en contraposición a la teorización de cómo las respuestas internas se veían influidas por acontecimientos pasados. Más concretamente, Thorndike propuso que si se refuerza el vínculo entre una acción y el efecto satisfactorio, la acción será más probable en el futuro.

  1. F. Skinner diferenció aún más los medios por los que el estímulo y la acción afectan al comportamiento, desviándose aún más de los primeros estudios sobre el condicionamiento clásico. Según el marco de Skinner, el trabajo de Pavlov estudiaba los estímulos. En el ejemplo anterior, el estímulo B (pasos) se convierte en un estímulo condicionado que genera la misma acción involuntaria (salivar). Skinner estudió cómo la propia acción se condiciona a través de sus propios efectos y no de otros estímulos. Denominó a esta acción "operante" en lugar de "respuesta" para destacar que la acción no era sólo una respuesta a un estímulo, sino una acción voluntaria que está tangiblemente vinculada a sus efectos.1 Esto dio lugar a su monumental marco: el condicionamiento operante. Skinner, al igual que el paradigma conductista, llegaría a definir un paso evolutivo clave en la psicología, ya que la teoría del refuerzo comenzó a alejar a la psicología de sus raíces psicoanalíticas y a acercarla al paradigma empírico y científico que es hoy.

La historia del refuerzo es el resultado de intentar comprender la interacción entre una acción y sus consecuencias, concretamente cómo funciona el refuerzo probabilístico de este vínculo.

Personas

Ivan Pavlov

Fisiólogo ruso conocido por sus primeras investigaciones sobre el condicionamiento clásico. Pavlov realizó importantes investigaciones sobre el conductismo -el estudio sistemático de las conductas- y el condicionamiento. El condicionamiento clásico es notablemente diferente del condicionamiento operante: el condicionamiento clásico se ocupa del comportamiento involuntario, mientras que el condicionamiento operante implica la modificación del comportamiento voluntario. No obstante, Pavlov fue una gran influencia para todos los conductistas, incluidos los practicantes del condicionamiento operante, como Skinner.

Edward Thorndike

Psicólogo estadounidense pionero en el campo del conductismo. Thorndike desarrolló un enfoque más empírico para evaluar el comportamiento. Formuló la Ley del Efecto, según la cual una acción seguida de un efecto deseable refuerza el vínculo entre esa acción y el efecto siguiente, lo que hace más probable que la acción se repita. Aunque esto pueda parecernos obvio ahora, la ley del efecto de Thorndike sentó las bases para que se produjeran pruebas empíricas del refuerzo.

Burrhus Frederick Skinner

B.F. Skinner, psicólogo estadounidense conocido sobre todo por su obra fundamental sobre el comportamiento, es conocido como el padre del condicionamiento operante. Creía que el comportamiento de las personas es el resultado de cómo han sido condicionadas por las consecuencias de su conducta anterior.

Consecuencias

La teoría del refuerzo puede ser una forma poderosa de promover un comportamiento positivo y, por tanto, es importante para cualquier equipo u organización. A menudo se utiliza para lograr los objetivos de un equipo, como aumentar la productividad o mejorar la comunicación. Otra forma de visualizar la teoría del refuerzo es como una tabla bidimensional, como se muestra a continuación con ejemplos en cada cuadrante:

.
Reforzamiento Castigo
Positivo Recompensar a los empleados por una tarea excepcionalCriticar al empleado por una tarea deficiente
Negativo Quitar dificultades para una tarea después de ver que un empleado lo está haciendo bien No dar a un empleado una bonificación, que de otro modo habría esperado

El refuerzo también puede actuar como potenciador de otras técnicas conductuales. Por ejemplo, los antecedentes, como las advertencias o el suministro de información en un intento de fomentar un determinado comportamiento, son insustanciales por sí solos. Sin embargo, cuando se utilizan junto con consecuencias de refuerzo, resultan mucho más eficaces.2 Así pues, al abordar los problemas de los trabajadores, modificar las consecuencias de las acciones puede servir para potenciar las sugerencias verbales.

Horarios de acondicionamiento:

Al construir su teoría del condicionamiento operante, Skinner descubrió que la eficacia de su condicionamiento se veía alterada significativamente por el programa en el que se empleaba. Esto llevó a Skinner a desarrollar un concepto clave en el conductismo, que ahora se conoce como programas de refuerzo. La teoría se reduce a una conclusión sencilla y práctica: para asegurar el cambio conductual, algunos esquemas de refuerzo pueden ser más adecuados que otros para un problema concreto.

Un programa de refuerzo puede ser continuo, lo que significa que el refuerzo se producirá cada vez que se produzca el comportamiento objetivo. Otra opción es que el refuerzo se produzca a intervalos fijos, que suelen basarse en el transcurso de un cierto periodo de tiempo o después de que la conducta se haya realizado un cierto número de veces. Por último, un programa de refuerzo puede reforzar la conducta a intervalos variables. En este caso, el tiempo o las ocurrencias del comportamiento no son fijos. En esencia, se recompensa a un individuo de forma aleatoria, independientemente de su comportamiento.

Controversias

Skinner era reacio a los exámenes de la mente, las discusiones sobre los objetivos y las motivaciones internas.3 Esta perspectiva en sí misma es un importante punto de desacuerdo en la comunidad psicológica, ya que elimina todo un ángulo de observación de la conducta.

Algunos académicos y estudios han cuestionado la eficacia percibida de la teoría del refuerzo. Ya en 1994, se ha argumentado que los terapeutas conductuales adoptan cada vez más procedimientos apoyados en la teoría del refuerzo que carecen de pruebas empíricas tangibles de que funcionen en un entorno clínico.4 Señalan que incluso ha habido casos en los que tales procedimientos han tenido un efecto contraproducente, sugiriendo que estas técnicas "pueden en realidad reducir las conductas positivas y aumentar la resistencia al cambio."

Por ejemplo, Dan Pink sugiere que tener políticas basadas en incentivos es eficaz cuando la tarea en cuestión está claramente definida con reglas directas, pero de lo contrario "embota el pensamiento y bloquea la creatividad". Por el contrario, la motivación intrínseca, sentirse con un propósito y tener autonomía pueden ser mejores factores para aumentar los comportamientos deseables. Por tanto, las estrategias que fomentan estos comportamientos podrían ser más eficaces en tareas complejas.5

Por último, la teoría del refuerzo puede influir inadvertidamente en nuestro juicio, como cuando tomamos decisiones basadas en experiencias pasadas y descartamos información nueva o contradictoria al hacerlo.

Casos prácticos

Recordatorios de uso del cinturón de seguridad en los coches

Aunque el uso del cinturón de seguridad en los automóviles es obligatorio desde 1960, al principio resultaba difícil garantizar que se cumplía el mandato.6 Tras años de buscar la mejor manera de hacer cumplir la norma, el sonido recordatorio del cinturón de seguridad llegó a la mayoría de los automóviles. Cuando el conductor y los pasajeros no se han abrochado el cinturón y el coche se pone en marcha, emite un pitido fuerte e implacable, hasta que finalmente se abrochan los cinturones. Este molesto pitido es un ejemplo clásico de refuerzo negativo: una vez realizada la acción objetivo, se elimina el estímulo negativo. Para evitar esta molestia en el futuro, se nos anima a ponernos el cinturón de seguridad lo antes posible la próxima vez que subamos al coche.

Examinar el efecto del refuerzo positivo y el castigo en el consumo de cigarrillos

Cuando se trata de fumar, nuestra experiencia con el primer cigarrillo a menudo dicta si desarrollamos una dependencia más adelante. En un estudio de 2018, los investigadores encuestaron a los encuestados sobre sus sentimientos, reacciones y síntomas durante las primeras veces que fumaron. Se descubrió que si nuestro primer cigarrillo fue una experiencia positiva, tendíamos a engancharnos más adelante. Este hallazgo sugiere que el refuerzo podría ser un factor clave en el hábito de fumar, ya que lo asociamos con sentimientos positivos. Por otro lado, descubrieron que una primera experiencia desagradable, que actúa como castigo positivo, no disminuía significativamente la frecuencia de consumo de tabaco más adelante en la vida. En consecuencia, las experiencias de iniciación positivas podían predecir el consumo de cigarrillos con cierta exactitud, mientras que las negativas no.7

Contenido TDL relacionado

Refuerzo positivo y refuerzo negativo

Comprender la diferencia entre refuerzo positivo y negativo es fundamental para utilizar correctamente estos catalizadores del comportamiento. Para profundizar en cada aspecto del refuerzo del condicionamiento operante, consulte estas dos guías que se centran en el refuerzo positivo y negativo.

Utilizar la información conductual para mantener la motivación en el trabajo

Los conceptos de la teoría del refuerzo entran a menudo en juego en el lugar de trabajo, y ser conscientes de ellos puede ayudarnos a adoptar hábitos laborales útiles. Este artículo analiza cómo refuerzos como el reconocimiento, la apreciación y el conocimiento del impacto de nuestro trabajo pueden utilizarse para motivarnos a nosotros mismos y a los demás.

Fuentes

  1. Skinner, B. F. (1937). Two Types of Conditioned Reflex: A Reply to Konorski and Miller. Journal of General Psychology, Vol. 16, No. 1, 272-279.
  2. A. (2016, 1 de febrero). Teoría del refuerzo de la motivación - IResearchNet. Psicología. http://psychology.iresearchnet.com/industrial-organizational-psychology/leadership-and-management/reinforcement-theory-of-motivation/
  3. Banaji, M. R. (2011). Teoría del refuerzo. The Harvard Gazette. Obtenido de https://news.harvard.edu/gazette/story/2011/10/reinforcement-theory/
  4. Viken, R. y McFall, R. (1994). Paradox Lost: Implications of Contemporary Reinforcement Theory for Behavior Therapy. Current Directions in Psychological Science. Retrieved from https://journals.sagepub.com/doi/10.1111/1467-8721.ep10770581
  5. Pink, D. (2009). El rompecabezas de la motivación. TED Global. Obtenido de https://www.ted.com/talks/dan_pink_the_puzzle_of_motivation/transcript
  6. N.d.A. (2019). El recordatorio del cinturón de seguridad: ¿a qué viene ese ruido? Noticias, IEE. Obtenido de https://www.iee-sensing.com/en/blog/details/2019/09/the-seat-belt-reminder-what-s-that-noise-all-about.html

Read Next

Notes illustration

Eager to learn about how behavioral science can help your organization?