Cómo las recompensas pueden destruir la motivación

En 1972, un investigador llamado David Greene estaba de pie en un aula de un jardín de infancia cercano a Stanford y observaba a un grupo de niños de tres y cuatro años que dibujaban con marcadores de punta de fieltro. Estaban absortos, sin prisa, dibujando porque dibujar era divertido. A algunos de estos niños se les había prometido un certificado de Buen Jugador si dibujaban; a otros no se les había prometido nada. Dos semanas más tarde, Greene volvió y contó cuánto elegía dibujar cada niño durante el tiempo libre, cuando no se ofrecía ningún certificado y nadie los observaba con esa intención. Los niños que alguna vez habían dibujado por el certificado ahora pasaban notablemente menos tiempo con los marcadores que los niños que solo habían dibujado por el placer de hacerlo.

A estos niños no se les había quitado nada. Se les había dado una recompensa, pequeña y agradable, y esta había drenado en silencio de la actividad el mismo placer que la hacía digna de hacerse. Los marcadores se habían convertido en trabajo, y el trabajo, habían aprendido los niños, es algo que se hace porque te pagan.

Ese hallazgo incómodo se sitúa en el centro de uno de los resultados más contraintuitivos de la psicología. Tendemos a suponer que recompensar una conducta hace que la gente quiera hacerla más, y a menudo eso es cierto. Pero bajo condiciones específicas y sorprendentemente comunes, pagarle a alguien por hacer lo que ya ama puede dejarlo con menos ganas de hacerlo. Este artículo trata de cuándo ocurre eso, por qué, y qué significa para los padres, los docentes y los empleadores que recurren por instinto a la zanahoria.

Una grieta sorprendente en la imagen estándar del reforzamiento

La intuición de que las recompensas refuerzan la conducta no es una sabiduría popular ingenua, sino una afirmación científica seria con un largo linaje. La visión operante clásica, asociada sobre todo con B. F. Skinner y sus experimentos en los que animales aprendían a presionar palancas para obtener comida, sostiene que reforzar una conducta aumenta su frecuencia, y que el esquema según el cual se entrega el reforzamiento moldea cuán persistente llega a ser esa conducta. Recompensa a una rata por presionar una palanca, y la presionará más. El principio se generaliza ampliamente y sustenta buena parte de cómo estructuramos escuelas, lugares de trabajo y el adiestramiento tanto de mascotas como de niños.

El efecto de sobrejustificación es la complicación que la teoría operante no predijo. Se aplica específicamente a conductas que las personas ya realizan por sí mismas, las cosas que harían sin pago, sin que se las pidan y sin supervisión. Para estas conductas, introducir una recompensa extrínseca puede, paradójicamente, reducir la conducta una vez que se retira la recompensa. La rata que presionaba la palanca no tenía un amor previo por presionar palancas que perder. Un niño que ya adora dibujar sí lo tiene, y ese amor previo resulta ser frágil de una forma que la imagen estándar del reforzamiento nunca anticipó. El enigma no es si las recompensas funcionan, porque con frecuencia lo hacen, sino por qué a veces resultan contraproducentes precisamente con las actividades que más nos gustaría fomentar.

Un cubo, un rompecabezas y la primera demostración limpia

La primera demostración experimental rigurosa del efecto no vino de un jardín de infancia, sino de un laboratorio. En 1971, Edward Deci realizó un estudio con participantes universitarios y un rompecabezas de encaje entonces popular llamado el cubo SOMA, un conjunto de bloques irregulares que pueden ensamblarse en diversas formas, el tipo de tarea que muchas personas encuentran genuinamente atractiva por sí misma.

Deci hizo que los participantes trabajaran en el rompecabezas a lo largo de varias sesiones, y en una de ellas a algunos participantes se les pagaba por cada configuración que resolvían mientras que a otros no. La medición crucial llegó más tarde, durante un periodo de libre elección en el que se dejaba solos a los participantes en una habitación con el rompecabezas y algunas revistas, sin instrucción alguna y sin pago sobre la mesa. La pregunta era simple: cuando nadie te paga y nadie te observa, ¿tomas el rompecabezas? Los participantes a los que se les había pagado antes dedicaron menos de ese tiempo libre al rompecabezas que aquellos a los que nunca se les había pagado. El pago, que durante la sesión remunerada presumiblemente los había motivado a la perfección, había reducido su disposición posterior a hacer la tarea por nada, y Deci había mostrado bajo condiciones controladas que el pago extrínseco podía erosionar la motivación intrínseca.

El estudio del jardín de infancia que lo hizo famoso

Dos años después, en 1973, Mark Lepper, David Greene y Richard Nisbett publicaron el estudio que se convirtió en la demostración canónica del efecto, el que la mayoría de la gente encuentra primero. Trabajando en el jardín de infancia Bing, comenzaron por identificar a niños que ya adoraban dibujar con marcadores, niños que claramente elegirían la actividad por sí misma. Luego asignaron al azar a estos niños a tres condiciones, y el diseño de esas condiciones es lo que hace que el estudio sea tan esclarecedor.

En la condición de recompensa esperada, se les decía a los niños de antemano que recibirían un certificado de Buen Jugador por dibujar, de modo que la recompensa se prometía por anticipado y se vinculaba explícitamente a hacer la actividad. En la condición de recompensa inesperada, los niños dibujaban sin ninguna promesa y luego recibían el mismísimo certificado después como sorpresa. En la condición sin recompensa, los niños simplemente dibujaban, sin certificado en ningún momento. Dos semanas más tarde, los investigadores midieron cuánto elegía dibujar espontáneamente cada niño durante el juego libre.

Solo los niños de la recompensa esperada mostraron una reducción del dibujo espontáneo. Los niños que habían recibido un certificado idéntico como sorpresa inesperada dibujaron tanto como los niños que no habían recibido nada. Este es el detalle que descarta las explicaciones perezosas. No fue el certificado en sí, ni el papel ni el elogio ni el hecho de ser señalados, lo que hizo el daño. Fue el contrato previo, la sensación de que dibujar era ahora algo que se hacía para obtener una recompensa. La recompensa tenía que ser esperada y contingente para corroer la motivación.

Por qué una recompensa reescribe la historia que nos contamos a nosotros mismos

Entonces, ¿qué está ocurriendo en realidad? El mecanismo es al menos en parte cognitivo, una cuestión de cómo las personas se explican a sí mismas su propia conducta. Los seres humanos son intérpretes incansables de sus propias acciones, que responden en silencio a la pregunta: ¿por qué hago esto? Un niño que dibuja por placer lleva consigo una respuesta implícita: hago esto porque lo disfruto. Introduce una recompensa esperada y contingente, y se vuelve disponible una respuesta rival, todavía más obvia: hago esto por el certificado. Cuando la recompensa desaparece, esa segunda explicación deja de aplicarse, y la primera, la genuina, ha quedado desplazada y debilitada, dejando a la actividad sin una razón convincente para continuar.

Una explicación más rica proviene de la teoría de la autodeterminación, un marco desarrollado en gran medida por Deci y su colaborador Richard Ryan. La teoría propone tres necesidades psicológicas básicas que sostienen una motivación saludable: autonomía, competencia y vínculo. El efecto de sobrejustificación, según esta visión, opera socavando las dos primeras. Una recompensa esperada y controladora desplaza lo que se denomina el locus de control percibido desde el interior de la persona hacia el exterior, de modo que la conducta pasa a sentirse impulsada externamente en lugar de elegida por uno mismo, lo que socava la autonomía. La recompensa también puede llevar un mensaje implícito de que la propia competencia de la persona requiere validación externa, de que necesita un certificado para confirmar que está haciendo algo que vale la pena, lo que socava la competencia. Quita esos apoyos y la motivación intrínseca que dependía de ellos también se debilita.

Las condiciones bajo las cuales las recompensas permanecen seguras

Sería una lectura gravemente errónea concluir que las recompensas son sin más un veneno para la motivación. No lo son, y el efecto de sobrejustificación está netamente delimitado, así que comprender sus límites importa más que memorizar el titular.

Varias condiciones evitan de forma confiable que las recompensas extrínsecas socaven la motivación intrínseca. Las recompensas no socavan cuando la actividad no resultaba interesante de entrada, porque no hay motivación intrínseca previa que perder. Tienden a no socavar cuando son informativas en lugar de controladoras, cuando transmiten retroalimentación útil sobre lo bien que alguien lo hizo en vez de funcionar como una palanca para dirigir la conducta. Son mucho menos corrosivas cuando son inesperadas en lugar de prometidas por anticipado, exactamente como demostraron los certificados sorpresa del estudio del jardín de infancia. Y tienden a apoyar en lugar de sabotear la motivación cuando se vinculan a la calidad del desempeño en lugar de a la mera participación, ya que una recompensa ganada por hacer algo genuinamente bien puede reforzar un sentido de competencia en vez de reemplazarlo. El daño proviene de manera más confiable de una receta específica: una recompensa que es esperada, contingente a la actividad en sí, controladora en su tono y desconectada de lo bien que se hace el trabajo.

Lo que ocurre cuando la teoría se encuentra con el mundo real

Los efectos de laboratorio no siempre sobreviven al contacto con las aulas y las esquinas de las calles, así que vale la pena observar dónde se ha puesto a prueba el marco a gran escala. Dos conjuntos de trabajos destacan, y juntos muestran tanto el alcance como el desorden de la idea.

Entre 2007 y 2010, el economista Roland Fryer realizó grandes ensayos controlados aleatorizados en Nueva York, Chicago, Dallas, Houston y Washington, pagando a estudiantes por resultados académicos. El diseño distinguía entre pagar por productos, como las calificaciones de exámenes, y pagar por insumos, como leer libros, asistir o portarse bien. Pagar por productos en general no funcionó, lo cual encaja con el marco, ya que las calificaciones de exámenes son un objetivo lejano y difícil de controlar y la recompensa se convierte fácilmente en una presión controladora desligada del aprendizaje real. Pagar por insumos produjo efectos positivos modestos, plausiblemente porque las acciones recompensadas eran pasos concretos dentro del control del estudiante y funcionaban más como un andamiaje que como un soborno. Los resultados son coherentes con la teoría a la vez que muestran que la imagen empírica es más matizada de lo que permite cualquier eslogan universal.

La demostración del mundo real más aguda proviene de un estudio del año 2000 de Uri Gneezy y Aldo Rustichini que involucró a estudiantes de secundaria israelíes que iban de puerta en puerta recolectando donaciones benéficas. A algunos no se les pagaba nada, lo hacían por la causa y por el sentido de contribución; a otros se les pagaba una pequeña fracción de lo que recolectaban. Los estudiantes a los que se les pagaba una pequeña comisión recolectaron menos dinero que aquellos a los que no se les pagaba nada. Un pago modesto había desplazado la motivación intrínseca y social de hacer el bien, reemplazándola por una transacción que, a ese precio, sencillamente no valía el esfuerzo. Pagarles a los voluntarios, mostró el estudio, puede empujar su esfuerzo por debajo de la línea de base no remunerada, la demostración canónica de la sobrejustificación fuera del aula.

Diseñar recompensas sin matar lo que quieres

El alcance práctico de este marco es amplio. Toca a los padres que pagan a sus hijos por las tareas domésticas, a los docentes que pagan a los estudiantes por las notas, a los empleadores que vinculan bonos a un trabajo que su personal ya encuentra significativo y a las organizaciones que intentan incentivar a los voluntarios. En cada uno de estos contextos, el instinto de recurrir a una recompensa extrínseca puede socavar en silencio la misma motivación que pretendía reforzar.

Pero la lección no es la simplista de que las recompensas siempre son malas y nunca deberían usarse, una conclusión que ignora todo lo que las condiciones límite nos dicen. La conclusión honesta es que las recompensas extrínsecas son una herramienta poderosa con un modo de fallo específico y predecible. Cuando vinculas una recompensa esperada y controladora a algo que una persona ya ama hacer, te arriesgas a convertir el juego en trabajo y a ver cómo el amor se drena una vez que la recompensa cesa. Cuando la actividad era tediosa de entrada, cuando la recompensa lleva información genuina sobre un trabajo bien hecho, o cuando llega como un agradecimiento inesperado en lugar de un precio pactado de antemano, el peligro desaparece en gran medida. La habilidad, para cualquier padre, docente o gerente, reside en saber en qué situación te encuentras y diseñar en consecuencia, en lugar de suponer que más recompensa siempre significa más de la conducta que quieres.

Puntos clave

El efecto de sobrejustificación describe cómo las recompensas extrínsecas, cuando se vinculan a conductas que las personas ya persiguen por sí mismas, pueden reducir paradójicamente esas conductas una vez que se retiran las recompensas, una complicación que la visión skinneriana clásica del reforzamiento no predijo. El estudio del cubo SOMA de Edward Deci de 1971 estableció el efecto primero, al mostrar que los participantes remunerados luego elegían hacer el rompecabezas menos en su tiempo libre, y el estudio del jardín de infancia de 1973 de Lepper, Greene y Nisbett lo hizo famoso al demostrar que solo un certificado esperado y contingente, no uno sorpresa idéntico, reducía el dibujo espontáneo de los niños. El mecanismo es en parte cognitivo, en cuanto la autoexplicación de una persona pasa de "hago esto porque lo disfruto" a "hago esto por la recompensa", y en parte motivacional, en cuanto la teoría de la autodeterminación describe la recompensa socavando las necesidades básicas de autonomía y competencia. De manera crucial, el efecto está delimitado: las recompensas no corroen la motivación cuando la actividad no resultaba interesante de entrada, cuando son informativas en lugar de controladoras, cuando son inesperadas, o cuando se vinculan a la calidad del desempeño. Las pruebas del mundo real, desde los ensayos escolares de pago por desempeño de Roland Fryer hasta el hallazgo de Gneezy y Rustichini de que los recolectores de caridad levemente remunerados recaudaron menos que los no remunerados, confirman tanto el efecto como su matiz, y nos dejan no con la regla "nunca recompensar", sino con la tarea más difícil de comprender cuándo las recompensas apoyan la motivación intrínseca y cuándo la destruyen en silencio.

Learn more with Mindoria

Bite-sized lessons, spaced repetition, and live PvP trivia battles. Free on Android.

Download Free