El modelo Rescorla – Wagner a los veinte

Andrés M. Pérez-Acosta gs orcid
Universidad del Rosario, Colombia

Resumen

El presente artículo examina y conmemora el modelo teórico de Rescorla-Wagner, destacando su influencia y relevancia en la psicología del aprendizaje. Propuesto en 1972 por Robert A. Rescorla y Allan R. Wagner, el modelo aborda la eficacia del reforzamiento y no-reforzamiento en el aprendizaje. Se discute cómo este modelo ha transformado la percepción del condicionamiento clásico, promoviendo una comprensión más profunda de cómo los organismos procesan información ambiental y cuestionando la relación exclusiva entre el condicionamiento clásico y la conducta refleja. Se destaca la importancia del Modelo Rescorla-Wagner en diversas disciplinas, desde la psicología conductual hasta la etología y la psicología cognoscitiva.

Palabras clave: psicología del aprendizaje, Condicionamiento Clásico, Robert A. Rescorla, Allan R. Wagner, reforzamiento.

Dentro de la psicología científica existen algunas fechas de particular importancia, por ejemplo, su nacimiento en 1879 o la publicación de algunos libros clave, como la primera edición de The conditioned reflexes de Pavlov, en 1927, o The behavior of organisms de Skinner, en 1938.

En este artículo se pretende destacar la década de los setenta, especialmente el año de 1972 -hace veinte años-, en el que apareció publicado un modelo teórico de gran importancia para la psicología del aprendizaje. Sus creadores, Robert A. Rescorla y Allan R. Wagner, le dieron el nombre de Variations in the effectiveness of reinforcement and nonreinforcement, traducido al español como Variaciones en la efectividad del reforzamiento y del no-reforzamiento, que ha sido reconocido por la comunidad científica como el Modelo Rescorla-Wagner (Rescorla y Wagner, 1972).

¿Por qué conmemorar sus veinte años de publicación? La respuesta a este interrogante se encuentra en 1972, cuando se expone por primera vez una teoría completa del condicionamiento clásico, o pavloviano, que iba más allá de una descripción del proceso de aprendizaje bajo procedimiento de asociación de estímulos contingentes. A través de esto, se lograron hacer predicciones cuantitativas de este tipo de aprendizaje asociativo sin perder su carácter molar. Es decir, aparece una teoría predictiva que abarca al organismo entero que aprende, y no sólo a una célula o una «red» que se conecta en el sistema nervioso que debe preocupar más a un biólogo que a un psicólogo.

Así, teniendo en cuenta tal antecedente, se presentan a continuación algunos aspectos del modelo que permiten comprenderlo y, a la vez, demostrar su importancia. Ahora bien, existen algunos textos de aprendizaje donde se pueden hallar explicaciones detalladas del modelo (Ver Schwartz, 1978; Staddon, 1983; Domjan y Burkhard, 1986; Mackintosh, 1988; Staddon y Ettinger, 1989 y Mazur, 1990).

Los Condicionadores Clásicos de Norteamérica

La historia del modelo se remonta a 1963, año en el que se realizó un simposio sobre condicionamiento clásico en la Universidad de Pennsylvania. Allí, se reunió por primera vez la comunidad de los llamados «classical conditioners» (Rachlin, 1991) de Canadá y Estados Unidos, entre quienes figuraban: M. Bitterman, Y. Gormezano, L. Kamin, A. Black y el futuro editor del simposio William Prokasy (Prokasy, 1965). Tal evento, permitió la presentación de aspectos teóricos (como las interacciones con el condicionamiento operante) y metodológicos (entrenamiento de omisión y condicionamiento de parpadeo), que influyeron en la visión del condicionamiento clásico que consolidarían Rescorla y Wagner.

Para esta época, Rescorla realizaba sus estudios en Pennsylvania. Posteriormente, -tres años más tarde- luego de recibir su Doctorado, fue a Yale, donde conoció a Wagner con quien desarrolló trabajos empíricos y teóricos sobre la inhibición condicionadas, el concepto de contingencia, complementarios a los hallazgos experimentales de la segunda mitad de los años sesenta, como el «bloqueo», descubierto por Kamin (1969). Todos estos esfuerzos se integraron para dar lugar al modelo de 1972 (American Psychological Association, 1987).

En síntesis, además de lograr modelos molares predictivos, se resaltó el papel del condicionamiento clásico al interior de la teoría general del aprendizaje, dominada en Norteamérica hasta la década de los cincuenta por los procedimientos, y conceptualizaciones operantes, dicotómicas con respecto al condicionamiento clásico.

A partir del descubrimiento del «automoldeamiento», por parte de Paul Brown y Heber Jenkins (1968), se demostró cómo el condicionamiento operante es precedido por un condicionamiento clásico adquirido a partir de las relaciones entre el estímulo discriminativo (EC) y el reforzado (EI). Posteriores experimentos llevaron a la conclusión de que el automoldeamiento es un seguimiento de señales (sign tracking) informativas de eventos importantes para el organismo (Restrepo, 1986).

Por otra parte, algunos antecedentes formales de este modelo corresponden a «pequeñas teorías» formuladas entre 1969 y 1971 que predecían casos especiales de condicionamiento clásico, publicadas separadamente por Wagner y Rescorla (p.e. predicción del condicionamiento bajo estímulos compuestos de diferente historia de reforzamiento cada uno. Rescorla, 1971). Tales antecedentes fueron descritos por así:

«El ímpetu de un nuevo modelo teórico no está generalmente en un nuevo dato que descarte la teoría existente. Es más probable que esté en la acumulación de patrones de datos sobresalientes, separadas porciones, las cuales pueden ser tratadas como teorías independientes, pero las cuales parecen invitar a una explicación teórica más integrada. Tal es por lo menos, la mejor descripción de los antecedentes del presente trabajo» (Rescorla y Wagner, 1972, p. 64).

Como se describirá más adelante, el condicionamiento, según el modelo, se entiende como una variación en la «fuerza asociativa» que relaciona estímulos condicionados con incondicionados, teniendo como parámetros sus respectivas intensidades o «saliencia» (Mackintosh, 1988; Rescorla y Wagner, 1972). Es decir, un estímulo se condicionará gradualmente, mientras sea un inesperado predictor de su consecuencia (reforzamiento o no-reforzamiento). Dicha «fuerza asociativa», es un tipo de variable interviniente o intermediaria integradora (entre estímulos y respuestas), que se infiere matemáticamente y su naturaleza es puramente formal; se diferencia de un «constructo», el cual es un intermediario hipotetizado con posibles cualidades tangibles (Hilgard y Bower, 1978), donde caben inferencias subjetivas (ver Aguado, 1983) o dualistas no permisibles para la psicología científica.

Es así como el concepto de «fuerza asociativa» se constituye en fundamento del Modelo Rescorla-Wagner. Este, fue publicado en las memorias de una serie de conferencias sobre condicionamiento clásico que se llevaron a cabo en mayo de 1969 en la Universidad de McMaster, Canadá. Allí, se reunieron nuevamente los «classical conditioners» de Norteamérica, en las que participaron treinta personas, incluyendo a Rescorla, Wagner, Jenkins, Solomon, García y Overmier, entre otros; a diferencia de la primera, a la que sólo asistieron 19. Los asistentes de las memorias, denominadas Classical Conditioning II: Current Research and Theory. By Abraham Black y William Prokasy, incluyeron el artículo en la primera parte, Assumpitons, theories, models, y enmarcaron el modelo dentro de la tradición teórica «HullSpeence» (Black y Prokasy, 1972), que se caracterizó por el uso de variables intervinientes y, por ende, de la matemática como herramienta de la teoría del aprendizaje.

Variaciones en la efectividad del reforzamiento y del no-reforzamiento

El condicionamiento clásico se produce por las variaciones cuantitativas en la «fuerza asociativa» que hace que un organismo entre estímulos condicionados e incondicionados; tales variaciones dependen de una discrepancia positiva o negativa entre la fuerza asociativa que tiene el organismo en un momento dado y la verdadera asociación que se presenta en el ambiente entre los ECs y los EIs. Lo dicho hasta ahora se puede presentar formalmente así:

La medida de la discrepancia o diferencia es cero, entones no hubo aprendizaje. Ahora bien, tal diferencia la produce el organismo cuando establece la relación ante un EI A y su consecuencia (reforzamiento o no-reforzamiento), por ello, se plantea que Va corresponde al valor asociativo de A (Mackintosh, 1988).

Va será, entonces, el aprendizaje que tenga el organismo en un momento o ensayo dado, a partir del estímulo A. ¿En función de qué está ese aprendizaje? Mazur (1990) afirma que está en función de otras dos variables: el valor efectivo, objetivo del EI llamado «asíntota» y V que es el valor asociado por el organismo entre el estímulo A y su consecuencia r o EI, antes del ensayo de condicionamiento.

Si el valor resultante de ( V) es positivo, hay aprendizaje o condicionamiento excitatorio; y si es negativo, se presenta aprendizaje inhibitorio. Sin embargo, Va se producirá también de acuerdo al valor de dos parámetros (Mackintosh, 1968), que son la intensidad o «saliencia» del EC y la intensidad del EI. Si los estímulos no tienen la suficiente «saliencia» para el organismo, entonces no se producirá aprendizaje. Estos parámetros se ubican así dentro del modelo:

Al convertirse los parámetros en factores dentro de la ecuación, si el valor de alguno de ellos es cero, el valor de Delta será cero. La formulación dada en la ecuación dos es la más simple del modelo, ya que establece predicciones para el condicionamiento ante un par sencillo EC-EI. Por otro lado, el modelo incluye ecuaciones para EC compuestos, las que permiten predecir casos especiales de condicionamiento clásico como el «bloqueo» y el «ensombrecimiento» (Mazur, 1990). Cuando se tiene un compuesto de estímulos condicionados A y X, sus cambios en fuerza asociativa (aprendizajes) estarán dados según las siguientes ecuaciones:

Estas últimas ecuaciones predicen el aprendizaje ante un compuesto de estímulos condicionados AX (un tono y una luz), asociados con un estímulo incondicionado (Rescorla y Wagner, 1972). Para cada EC, existirá un aprendizaje diferente de acuerdo a su intensidad particular , determinado por el tratamiento que haya recibido el otro EC, representado en la expresión (Va + Vx) común para ambas ecuaciones.

En conclusión, ¿Qué demuestan estas ecuaciones?

Inicialmente, se puede decir que los organismos procesan la información de eventos importantes del medio ambiente. Esta afirmación es suficiente para descartar la tradicional conexión exclusiva que aún se establece entre el condicionamiento clásico y la conducta refleja, pues, sin duda, actúa una parte de cognición (mirada como inferencia objetiva) en la producción del condicionamiento.

Una nueva visión del Condicionamiento Clásico: Los veinte años de la publicación del Modelo rescorla-Wagner es, en parte, los veinte años de una nueva visión general del condicionamiento clásico, la cual puede ser identificada en tres áreas: 1) las circunstancias que producen el aprendizaje (contingencia vs. contigüidad); 2) el contenido del aprendizaje (fuerza asociativa y sus cambios); y 3) los efectos del aprendizaje sobre la conducta (papel de las estructuras asociativas en la conducta instrumental) (Rescorla, 1968).

El modelo Rescorla-Wagner y otras teorías posteriores, sobre aprendizaje asociativo (Mackintosh, 1975; Pearce y Hall, 1980), se constituyeron en ejemplos de renovación en la segunda de las áreas mencionadas. A su vez, esta renovación ha llevado al condicionamiento clásico a tener un lugar preponderante, no sólo en la psicología conductual, sino también en otras disciplinas como la etología, la psicología cognoscitiva y áreas aplicadas que se relacionan con estas (Turkkan, 1989).

En la actualidad, el modelo tiene una vigencia relativa; mantiene su poder predictivo para algunos casos de condicionamiento como los anteriormente enunciados. Sin embargo, casos más recientes hallados en el laboratorio como el «sobrecondicionamiento» superan el poder predictivodel modelo (Staddon, 1983).

Por último, el modelo Rescorla-Wagner, permitió pasar de concebir el condicionamiento clásico desde una visión simple como reflejo, molecular, liso y contigüo, a una conceptualización más compleja: cognoscitiva, molecular, esquelética y contingente.

Referencias

Aguado, L. (1983). Lecturas sobre aprendizaje animal. Madrid: Debate.

American Psychological Association (1987). Awards for distingished scientific contributions: 1986, Robert A. Rescorla. American Psychologist, 42, 285-288.

Black, A. y Prokasy, W. (1972). Classical conditioning II: Current research and theory. Nueva York: Apleton-Century-Crofts.

Brown, P. y Jenkins, H. (1968). Auto- shaping of the pigeon’s keypeck. Journal of the Experimental Analysis of Behavior, 11, 1-8.

Domjam, M. y Burkhard, B. (1986). The principles of learning and behavior. Monterrey, Cal: Brooks and Cole.

Hilgard, E. y Bower, G. (1978). Teorías del aprendizaje. México: Trillas.

Kamin, L. (1969). Predictability, surprise, attention and conditioning. En: B. Campbell y R. Church (Eds.), Psychological Review, 82, 276-298.

Mackintosh, N. (1975). A theory of attention: Variations in the associability of stimuli with reinforcement. Psychological Review, 82, 276-298.

Mackintosh, N. (1988). Condicionamiento y aprendizaje asociativo. Madrid: Alhambra.

Mazur, J. (1990). Learning and Behavior. Hilldale, N.J.: Erlbaum.

Pearce, J. y Hall, G. (1980). A model for pavlovian learning: variations in the effectivenessof conditiones but not unconditioned stimuli. Psychological Review, 87, 532- 552.

Prokasy, W. (1965). Classical condi tioning: A symposium. Nueva York: Appelton-Century-Crofts.

Rachlin, H. (1991). Introduction to modern behaviorism. Nueva York: W.H. Freeman.

Rescorla, R. (1971). Variation in the effectiveness of reinforcement and nonreinforcement following prior inhibitory conditioning. Learning and Motivation, 2, 113- 123.

Rescorla, R. (1988). Pavlovian conditioning: it’s not what you think it is. American Psychologist, 43, 151-160.

Rescorla, R. y Wagner, A. (1972). A theory of pavlovian conditioning: variations in the efectiveness of reinforcement and nonreinforcement. En: A. Black y W. Prokasy (Eds.), Classical conditioning II: current research and theory.

Restrepo, M. (1986). Antecedentes y estado actual de la teoría del condicionamiento. Revista de Psicología, 25, 11-20.

Schwartz, B. (1978). Psychology of learning and behavior. Nueva York: W. W. Norton.

Staddon, J. (1983). Adaptative behavior and learning. Cambridge, Mass: Cambridge University Press. Staddon.

J. y Ettinger, R. (1989). Learning an introductionto the principles of adapitve behavior. San Diego: Harcourt Brace Jovanovich.

Turkkan, J. (1989). Classical Conditioning: The new hegemony. Behavioral and Brain Sciences, 12, 121-179.

Citar:

Pérez-Acosta, A. M.  (2001, 30 de octubre).El modelo Rescorla - Wagner a los veinte. Revista PsicologiaCientifica.com, 3(1). Disponible en: https://psicologiacientifica.com/modelo-rescorla-wagner

1 comentario en «El modelo Rescorla – Wagner a los veinte»

  1. Andrés interesante artículo. Veo que continúa con el trabajo de este modelo, recuerdo este trabajo, cuando lo presentó en una clase que oriento en mis albores como psicólogo en la U Católica. Un tanto denso en ese momento… un aporte para el quehacer y el hacer en nuestra psicología.

    Responder

Deja un comentario