Condicionamiento Operante: Principios Clave de Thorndike y Skinner

El condicionamiento operante es una forma de aprendizaje en la que la probabilidad de que una conducta se repita o no, depende de las consecuencias que le sigan. A diferencia del condicionamiento clásico, aquí el sujeto no se limita a reaccionar pasivamente, sino que debe actuar o utilizar su conducta de manera instrumental para lograr un resultado.

Los Experimentos Fundacionales de Edward Thorndike

Edward Thorndike, pionero en el estudio del aprendizaje, realizó experimentos con animales, especialmente gatos hambrientos, colocándolos dentro de una jaula con el alimento visible pero inaccesible. En esta situación, el animal debía aprender a abrir la puerta mediante acciones simples, como empujar una palanca.

El gato, motivado por el hambre, realizaba una serie de movimientos al azar (conocidos como ensayos) hasta que, por casualidad, ejecutaba la conducta que le permitía escapar y acceder al alimento. Si se repetía la misma situación experimental con el mismo animal, este tardaba progresivamente menos tiempo en encontrar la respuesta adecuada, hasta que finalmente prescindía de los ensayos ineficaces. Este proceso demostraba que la conducta había sido aprendida, sentando las bases de su famosa Ley del Efecto.

Las Cajas de Skinner y el Perfeccionamiento del Condicionamiento Operante

B.F. Skinner perfeccionó los experimentos de Thorndike con la invención de las célebres cajas de Skinner (también conocidas como cámaras de condicionamiento operante). En estas cajas, se introduce a un animal (comúnmente ratas o palomas) que, al principio, actúa de forma aleatoria. Sin embargo, cuando el animal presiona una palanca específica, se activa una trampilla que dispensa comida.

A medida que aumentan los ensayos, el animal disminuye el número de tentativas al azar hasta que aprende a presionar la palanca correcta cada vez que experimenta hambre, ignorando otras acciones. Este método permitió a Skinner estudiar de forma sistemática cómo las consecuencias de una conducta afectan su frecuencia.

Refuerzos y Castigos: Herramientas para la Modificación de Conducta

Para modificar la conducta, Skinner y otros psicólogos experimentales emplean dos tipos principales de consecuencias: los refuerzos (premios) y los castigos. Estos elementos son fundamentales en el condicionamiento operante.

Tipos de Refuerzos

  • Refuerzo Positivo: Se otorga una recompensa o gratificación cuando el sujeto ha llevado a cabo la conducta deseada. Por ejemplo, dar comida a un perro cuando se sienta.
  • Refuerzo Negativo: Como resultado de la conducta, se suprime o elimina algo desagradable o doloroso para el organismo. Ej.: en un laberinto con el suelo electrificado, se suprime la corriente cada vez que la rata recorre el camino correcto. El animal aprende a realizar la conducta para evitar el estímulo aversivo.

Tipos de Castigos

  • Castigo Positivo (Estímulos Aversivos): Una conducta es acompañada de un estímulo doloroso o desagradable para el sujeto. Ej.: administrar una pequeña corriente a una rata que empuja una palanca equivocada.
  • Castigo Negativo: Como resultado de la conducta, el organismo pierde una situación agradable o un privilegio. Ej.: retirar un juguete a un niño que se porta mal.

El Estímulo Discriminativo en el Condicionamiento Operante

En el condicionamiento operante, es crucial comprender la idea del estímulo discriminativo. Este es una señal o indicio que el animal debe aprender a reconocer para saber cuándo es apropiado emitir la respuesta operante y cuándo no. La presencia del estímulo discriminativo indica que la conducta operante será reforzada.

Ej.: Se puede enseñar a un animal a presionar un botón solo cuando una luz verde está encendida, pero no cuando la luz es roja. La luz verde actúa como el estímulo discriminativo.