APLICACIÓN DEL MODELO DE THORNDIKE A LA EDUCACIÓN
APLICACIÓN DEL MODELO DE CONDICIONAMIENTO INSTRUMENTAL A LA EDUCACIÓN
El conexionismo de Thorndike
El marco conceptual de Thorndike en su teoría del aprendizaje es una versión temprana de la teoría del refuerzo E-R. Al tiempo que empleaba una metodología completamente objetiva, realzaba el principio de aprendizaje por continuidad con el principio del refuerzo.
En el uso ordinario, el término se utiliza para denotar cualquier evento consecuente a una respuesta si aumenta la probabilidad de que dicha respuesta ocurra. La versión de Thorndike, expresado en la ley del efecto, sostenía que la consecuencia inmediata de una conexión E-R, (especialmente si era algo satisfactorio) podía influir en la asociación para reforzarla. Los mecanicistas rígidos elevaron objeciones a esta ley que situaba la causa después del efecto, objeción que ahora parece insostenible. En esta era del servomecanismo y del principio de retroalimentación, la posibilidad del control de la conducta según la información comunicada por sus consecuencias a duras penas pude ser cuestionada. Afirmando que:
“Por estado de cosas satisfactorio o satisfacer se quiere decir algo que el animal no hace para evitar, sino que con frecuencia procede a mantenerlo o renovarlo. Estado de cosas desagradable quiere decir que el animal no hace nada para preservarlo, procediendo a menudo a ponerle fin”. (Thorndike, 1949 p. 13)
A esta definición puramente empírica se le tacho de tautológica: refuerzo es lo que refuerza como se diría burdamente. Pero Thordike estaba consciente de la fuerza de la crítica y trató de responder a ella dándole un significado independiente, en función de una "reacción de confirmación" en el sistema nervioso central (la conexión neural). Sin embargo, en este aspecto fue más lejos de lo que se puede observar, pasando a una construcción inferencial. El mecanicismo propuesto era muy hipotético, aunque Thorndike pudo reunir un conjunto de pruebas circunstanciales que lo respaldaran. Surgieron varias corrientes psicológicas adoptando los métodos experimentales objetivos de la ciencia natural, pero todas modificando en algún modo el conductismo. Los problemas en debate se centraron en la reducción watsoniana de la conducta a simples conexiones estímulo-respuesta; no se hacía referencia a las necesidades del organismo y sus satisfacciones, ni había oportunidad para encaminarse hacia objetivos o concebir la actividad como un medio de lograr algo para el organismo.
Los nombres que más destacan en este nuevo conductismo transformado son los de Edwrd C Tolman (1886-1959), Clark L Hull (1884-1952) y Burhus F Skinner (1904- )
THORNDIKE Y EL APRENDIZAJE
Las soluciones de Thorndike a los problemas más característicos del aprendizaje, en los siguientes puntos:
1) La capacidad de aprendizaje depende del número de conexiones y su disponibilidad. (tercera ley)
2) La repetición de situaciones (práctica) no modifica por sí sola las conexiones, a menos que dichas conexiones se recompensen. (leyes de efecto y ejercicio)
3) Motivación: la recompensa influye directamente en las conexiones vecinas reforzándolas, pero el castigo carece del efecto debilitador directo correspondiente. Sin embargo, el castigo puede influir indirectamente al llevar al sujeto a elegir otra cosa que tal vez le traiga recompensa. Las conexiones pueden fortalecerse directamente, sin necesidad de tener conciencia o idea de ellas. (ley del efecto y tercera ley).
4) Comprensión: depende de hábitos anteriores. Cuando las situaciones se comprenden de inmediato, es que se produjo transferencia o asimilación.
5) Transferencia: la reacción a las situaciones nuevas se beneficia, en parte, porque son parecidas a antiguas situaciones, y también por un principio de analogía descrito como asimilación.
6) Olvido: sostiene a grandes rasgos la ley del desuso, según la cual el olvido sobreviene con la falta de práctica.
PUNTO CLAVE DE LA LEY DE THORNDIKE ES LA EVIDENCIA DEL ENSAYO Y ERROR COMO VÍA DE RESOLUCIÓN DE PROBLEMAS Y APRENDIZAJE
Los experimentos de Thorndike
Hay dos tipos de “aprendizaje” por condicionamiento:
1) El condicionamiento clásico, pavloviano o respondiente, que consiste en aprender la relación entre sí de varios sucesos del entorno; y
2) El condicionamiento instrumental, que consiste en aprender la relación entre varios eventos contextuales y el comportamiento.
El condicionamiento clásico implica aprender la relación entre ver el pan o sentir su presencia en la boca y su olor, y condicionamiento instrumental es aprender la relación entre la conducta de comer el pan y el gusto del pan.
La ley de efecto fue enunciado por Thorndike en 1898, y dice que un efecto de un comportamiento positivo es incrementar la probabilidad de que vuelva a suceder en condiciones similares.
Trabajó con gatos, perros y gallinas encerrándolos en jaulas, donde los animales debían hacer algo para poder salir o recibir comida. Es decir, trabajó con un condicionamiento instrumental (relación entre el comportamiento y sucesos contextuales significativos, como premios y castigos). Encontró que a más intentos que hacía el animal, menor tiempo usaba para escapar.
La ley del efecto es simplemente la selección natural en la historia de un organismo singular (cuanto más salta el gato para salir equivale, en la selección natural de las especie, a cuanto más debe alargar la jirafa el cuello para comer). Obviamente, la conducta deseada debe ser premiada una vez que ocurre, para que luego el animal vuelva a repetirla. Esto se llama ‘modelamiento’.
Thorndike y Pavlov: Ambos fueron psicólogos moleculares, es decir, concebían que en la base del comportamiento había conexiones simples E-R, las que pueden ordenarse jerárquicamente según la probabilidad de su ocurrencia. Un premio o un castigo puede modificar esta jerarquía, haciendo más probable o menos probable una respuesta.
Respecto a sus diferencias, para Pavlov una conexión (un reflejo condicionado) aumenta su fuerza si el estímulo condicionado es contiguo al estímulo incondicionado (esto se llama refuerzo del reflejo condicionado). Para Thorndike, una conexión (hábito) aumenta su fuerza si la respuesta es contigua con un refuerzo al animal del tipo premio o castigo (esto se llama refuerzo del hábito).
Principios en el condicionamiento instrumental
En el condicionamiento instrumental hay cuatro principios básicos: premio, castigo, huída y omisión. En los cuatro casos ha de tenerse presente que primero se produce la respuesta y luego recién se premia, o se castiga, etc.
Premio: Un premio después de la respuesta aumenta la probabilidad que ocurra. El premio se llama recompensa (retroalimentación positiva) y fue enunciado en la ley del efecto de Thorndike.
Castigo: Un castigo después de la R disminuye la probabilidad que vuelva a ocurrir. Es lo inverso a lo anterior (retroalimentación negativa, castigo positivo).
Huída: Si una respuesta es para escapar de un castigo, aumenta la probabilidad que vuelva a ocurrir. (Es lo que se podría conceptualezar como el refuerzo negativo, a la conducta de escapar del castigo).
Omisión: Si la recompensa o premio está presente pero no se da, la respuesta que lleva esta frustración, decrece su probabilidad de ocurrencia (castigo negativo).
Métodos de medición
Medir en el condicionamiento clásico significa descubrir la respuesta a un estímulo, pero más interesa aquí medir en el condicionamiento instrumental, donde significa detectar con algún aparato los cambios producidos en el comportamiento por el llamado aprendizaje.
Se citan dos medidas para medir la variable dependiente ‘respuesta’: latencia y tasa de respuesta:
Latencia: es el tiempo transcurrido entre una señal y la ocurrencia de la respuesta. Cuando la madre llama al hijo a comer, éste vendrá más rápido (latencia menor) si le gusta la comida, etc.
Tasa de respuesta: es la cantidad de respuestas por unidad de tiempo. Luego de ser llamado a comer (señal) el niño dará más -o menos- mordiscos por unidad de tiempo.
La extinción en el condicionamiento instrumental
En el condicionamiento clásico, extinción significa desaparición de la asociación EC-EI. En el condicionamiento instrumental, significa desaparición de la conexión respuesta-premio (o castigo).
La extinción se define entonces a partir de una correlación cero entre la respuesta y la recompensa, o sea la R sigue ocurriendo aunque haya tantos premios como antes, más premios, menos premios o ningún premio. Lo esperable es que el organismo pare, entonces, de responder, que es lo que pasa normalmente, salvo en tres excepciones.
En efecto, la respuesta sigue ocurriendo cuando hay falta de discriminación, superstición o psuedocondicionamiento. (cuando no se presenta extinción)
a. Falta de discriminación.- El estudiante sigue dando la misma respuesta (por ej sigue estudiando bien) a pesar de que el maestro sigue poniendo mecánicamente la misma nota (mismo premio). Sólo tiende a desaparecer la respuesta cuando ve que el maestro pierde las hojas de exámenes, está distraído, etc.
b. Superstición.- Aunque podamos programar una serie de premios en forma totalmente independiente de la respuesta, se quiera o no los premios establecerán cierta relación con las respuestas. Habrá correlaciones accidentales, aunque tales correlaciones no hayan sido programadas. Un jugador le va mal un día, pero al otro día donde usa otro bate de béisbol, por azar le va bien, entonces decide usar este bate en forma superticiosa.
c. Pseudocondicionamiento.- Ocurre por ejemplo cuando una rata mueve la palanca para salir y en ese momento le damos adrenalina, que aumenta su actividad. La conexión se establece entre la inyección de adrenalina y mover la palanca, lo cual es un pseudocondicionamiento porque el condicionamiento instrumental “verdadero” sería conectar el mover la palanca con el premio (salir de la jaula), y no aumentar la activdad por sí sola.
Vemos que en los tres casos se producen respuestas que no mantienen relación con el premio, o sea, no está marcada una relación instrumental (respondo “para” obtener un premio). En el primer caso la falta de discriminación se debe a que la falta de una relación instrumental, no puede discriminarse de alguna condición anterior, cuando aquélla existía. En el caso de la superstición es debido a una relación instrumental accidental y temporaria. En el tercer caso la relación no tiene nada que ver con la respuesta, pero el premio por sí mísmo puede causar la respuesta. Todas estas conclusiones valen también para los castigos.
Aprendizaje retardado
Es aquel aprendizaje donde la extinción se presenta “antes” que el condicionamiento, lo que trae como consecuencia que el condicionamiento tarde más en formarse (aprendizaje retardado). Si primero castigamos a un niño, haga lo que haga (extinción de la respuesta, no hará nada), y luego cambiamos la situación y castigamos sólo las conductas malas, entonces tardará mucho más tiempo en superar la primera etapa donde no respondía con ninguna conducta.
Aplicación del modelo
Debe destacarse que los fundamentos filosóficos de E. Thorndike son los planteados por el positivismo, esto es, descripción externa de la conducta.
El ser humano bajo el conexionismo de Thorndike aprenden por: (a) las vías de ensayo y error usualmente (pruebo a ver que pasa, veo el resultado y me quedo con la ejecución que me de el resultado… éste, al resultar es la recompensa. (b) También se aprende por conexión y selección, vale decir, establesco una conexión entre el comportamiento más adecuado y la situación problema y selecciono las respuestas más adecuadas y eficaces (eficaz=da los mejores resultados). (c) También se debe mencionar que considerando la tercera ley de Thorndike, se aprende grabando las respuestas correctas y desechando las correctas.
La ley de la preparación al aprendizaje: Es en la motivación de los estudiantes, en los estados emocionaes de los sujetos, se prepara al estudiante para iniciar el proceso de aprendizaje.
Aplicación de la Ley del ejercicio: Una conexión se fortalce mediante la práctica (ley del uso) y repeticiones. Se debilita cuando la práctica se interrumpe (ley del desuso).
Aplicación de la Ley del efecto al aprendizaje: La fuerza de la conexión aumentará cuando una conexión E-R vaya seguida de un acto satisfactorio (una retroalimentación positiva o recompensa), y en el opuesto, la fuerza de una conexión disminuye cuando ésta va seguida de algo molesto (retroalimentación negativa o castigo).
El conexionismo de Thorndike
El marco conceptual de Thorndike en su teoría del aprendizaje es una versión temprana de la teoría del refuerzo E-R. Al tiempo que empleaba una metodología completamente objetiva, realzaba el principio de aprendizaje por continuidad con el principio del refuerzo.
En el uso ordinario, el término se utiliza para denotar cualquier evento consecuente a una respuesta si aumenta la probabilidad de que dicha respuesta ocurra. La versión de Thorndike, expresado en la ley del efecto, sostenía que la consecuencia inmediata de una conexión E-R, (especialmente si era algo satisfactorio) podía influir en la asociación para reforzarla. Los mecanicistas rígidos elevaron objeciones a esta ley que situaba la causa después del efecto, objeción que ahora parece insostenible. En esta era del servomecanismo y del principio de retroalimentación, la posibilidad del control de la conducta según la información comunicada por sus consecuencias a duras penas pude ser cuestionada. Afirmando que:
“Por estado de cosas satisfactorio o satisfacer se quiere decir algo que el animal no hace para evitar, sino que con frecuencia procede a mantenerlo o renovarlo. Estado de cosas desagradable quiere decir que el animal no hace nada para preservarlo, procediendo a menudo a ponerle fin”. (Thorndike, 1949 p. 13)
A esta definición puramente empírica se le tacho de tautológica: refuerzo es lo que refuerza como se diría burdamente. Pero Thordike estaba consciente de la fuerza de la crítica y trató de responder a ella dándole un significado independiente, en función de una "reacción de confirmación" en el sistema nervioso central (la conexión neural). Sin embargo, en este aspecto fue más lejos de lo que se puede observar, pasando a una construcción inferencial. El mecanicismo propuesto era muy hipotético, aunque Thorndike pudo reunir un conjunto de pruebas circunstanciales que lo respaldaran. Surgieron varias corrientes psicológicas adoptando los métodos experimentales objetivos de la ciencia natural, pero todas modificando en algún modo el conductismo. Los problemas en debate se centraron en la reducción watsoniana de la conducta a simples conexiones estímulo-respuesta; no se hacía referencia a las necesidades del organismo y sus satisfacciones, ni había oportunidad para encaminarse hacia objetivos o concebir la actividad como un medio de lograr algo para el organismo.
Los nombres que más destacan en este nuevo conductismo transformado son los de Edwrd C Tolman (1886-1959), Clark L Hull (1884-1952) y Burhus F Skinner (1904- )
THORNDIKE Y EL APRENDIZAJE
Las soluciones de Thorndike a los problemas más característicos del aprendizaje, en los siguientes puntos:
1) La capacidad de aprendizaje depende del número de conexiones y su disponibilidad. (tercera ley)
2) La repetición de situaciones (práctica) no modifica por sí sola las conexiones, a menos que dichas conexiones se recompensen. (leyes de efecto y ejercicio)
3) Motivación: la recompensa influye directamente en las conexiones vecinas reforzándolas, pero el castigo carece del efecto debilitador directo correspondiente. Sin embargo, el castigo puede influir indirectamente al llevar al sujeto a elegir otra cosa que tal vez le traiga recompensa. Las conexiones pueden fortalecerse directamente, sin necesidad de tener conciencia o idea de ellas. (ley del efecto y tercera ley).
4) Comprensión: depende de hábitos anteriores. Cuando las situaciones se comprenden de inmediato, es que se produjo transferencia o asimilación.
5) Transferencia: la reacción a las situaciones nuevas se beneficia, en parte, porque son parecidas a antiguas situaciones, y también por un principio de analogía descrito como asimilación.
6) Olvido: sostiene a grandes rasgos la ley del desuso, según la cual el olvido sobreviene con la falta de práctica.
PUNTO CLAVE DE LA LEY DE THORNDIKE ES LA EVIDENCIA DEL ENSAYO Y ERROR COMO VÍA DE RESOLUCIÓN DE PROBLEMAS Y APRENDIZAJE
Los experimentos de Thorndike
Hay dos tipos de “aprendizaje” por condicionamiento:
1) El condicionamiento clásico, pavloviano o respondiente, que consiste en aprender la relación entre sí de varios sucesos del entorno; y
2) El condicionamiento instrumental, que consiste en aprender la relación entre varios eventos contextuales y el comportamiento.
El condicionamiento clásico implica aprender la relación entre ver el pan o sentir su presencia en la boca y su olor, y condicionamiento instrumental es aprender la relación entre la conducta de comer el pan y el gusto del pan.
La ley de efecto fue enunciado por Thorndike en 1898, y dice que un efecto de un comportamiento positivo es incrementar la probabilidad de que vuelva a suceder en condiciones similares.
Trabajó con gatos, perros y gallinas encerrándolos en jaulas, donde los animales debían hacer algo para poder salir o recibir comida. Es decir, trabajó con un condicionamiento instrumental (relación entre el comportamiento y sucesos contextuales significativos, como premios y castigos). Encontró que a más intentos que hacía el animal, menor tiempo usaba para escapar.
La ley del efecto es simplemente la selección natural en la historia de un organismo singular (cuanto más salta el gato para salir equivale, en la selección natural de las especie, a cuanto más debe alargar la jirafa el cuello para comer). Obviamente, la conducta deseada debe ser premiada una vez que ocurre, para que luego el animal vuelva a repetirla. Esto se llama ‘modelamiento’.
Thorndike y Pavlov: Ambos fueron psicólogos moleculares, es decir, concebían que en la base del comportamiento había conexiones simples E-R, las que pueden ordenarse jerárquicamente según la probabilidad de su ocurrencia. Un premio o un castigo puede modificar esta jerarquía, haciendo más probable o menos probable una respuesta.
Respecto a sus diferencias, para Pavlov una conexión (un reflejo condicionado) aumenta su fuerza si el estímulo condicionado es contiguo al estímulo incondicionado (esto se llama refuerzo del reflejo condicionado). Para Thorndike, una conexión (hábito) aumenta su fuerza si la respuesta es contigua con un refuerzo al animal del tipo premio o castigo (esto se llama refuerzo del hábito).
Principios en el condicionamiento instrumental
En el condicionamiento instrumental hay cuatro principios básicos: premio, castigo, huída y omisión. En los cuatro casos ha de tenerse presente que primero se produce la respuesta y luego recién se premia, o se castiga, etc.
Premio: Un premio después de la respuesta aumenta la probabilidad que ocurra. El premio se llama recompensa (retroalimentación positiva) y fue enunciado en la ley del efecto de Thorndike.
Castigo: Un castigo después de la R disminuye la probabilidad que vuelva a ocurrir. Es lo inverso a lo anterior (retroalimentación negativa, castigo positivo).
Huída: Si una respuesta es para escapar de un castigo, aumenta la probabilidad que vuelva a ocurrir. (Es lo que se podría conceptualezar como el refuerzo negativo, a la conducta de escapar del castigo).
Omisión: Si la recompensa o premio está presente pero no se da, la respuesta que lleva esta frustración, decrece su probabilidad de ocurrencia (castigo negativo).
Métodos de medición
Medir en el condicionamiento clásico significa descubrir la respuesta a un estímulo, pero más interesa aquí medir en el condicionamiento instrumental, donde significa detectar con algún aparato los cambios producidos en el comportamiento por el llamado aprendizaje.
Se citan dos medidas para medir la variable dependiente ‘respuesta’: latencia y tasa de respuesta:
Latencia: es el tiempo transcurrido entre una señal y la ocurrencia de la respuesta. Cuando la madre llama al hijo a comer, éste vendrá más rápido (latencia menor) si le gusta la comida, etc.
Tasa de respuesta: es la cantidad de respuestas por unidad de tiempo. Luego de ser llamado a comer (señal) el niño dará más -o menos- mordiscos por unidad de tiempo.
La extinción en el condicionamiento instrumental
En el condicionamiento clásico, extinción significa desaparición de la asociación EC-EI. En el condicionamiento instrumental, significa desaparición de la conexión respuesta-premio (o castigo).
La extinción se define entonces a partir de una correlación cero entre la respuesta y la recompensa, o sea la R sigue ocurriendo aunque haya tantos premios como antes, más premios, menos premios o ningún premio. Lo esperable es que el organismo pare, entonces, de responder, que es lo que pasa normalmente, salvo en tres excepciones.
En efecto, la respuesta sigue ocurriendo cuando hay falta de discriminación, superstición o psuedocondicionamiento. (cuando no se presenta extinción)
a. Falta de discriminación.- El estudiante sigue dando la misma respuesta (por ej sigue estudiando bien) a pesar de que el maestro sigue poniendo mecánicamente la misma nota (mismo premio). Sólo tiende a desaparecer la respuesta cuando ve que el maestro pierde las hojas de exámenes, está distraído, etc.
b. Superstición.- Aunque podamos programar una serie de premios en forma totalmente independiente de la respuesta, se quiera o no los premios establecerán cierta relación con las respuestas. Habrá correlaciones accidentales, aunque tales correlaciones no hayan sido programadas. Un jugador le va mal un día, pero al otro día donde usa otro bate de béisbol, por azar le va bien, entonces decide usar este bate en forma superticiosa.
c. Pseudocondicionamiento.- Ocurre por ejemplo cuando una rata mueve la palanca para salir y en ese momento le damos adrenalina, que aumenta su actividad. La conexión se establece entre la inyección de adrenalina y mover la palanca, lo cual es un pseudocondicionamiento porque el condicionamiento instrumental “verdadero” sería conectar el mover la palanca con el premio (salir de la jaula), y no aumentar la activdad por sí sola.
Vemos que en los tres casos se producen respuestas que no mantienen relación con el premio, o sea, no está marcada una relación instrumental (respondo “para” obtener un premio). En el primer caso la falta de discriminación se debe a que la falta de una relación instrumental, no puede discriminarse de alguna condición anterior, cuando aquélla existía. En el caso de la superstición es debido a una relación instrumental accidental y temporaria. En el tercer caso la relación no tiene nada que ver con la respuesta, pero el premio por sí mísmo puede causar la respuesta. Todas estas conclusiones valen también para los castigos.
Aprendizaje retardado
Es aquel aprendizaje donde la extinción se presenta “antes” que el condicionamiento, lo que trae como consecuencia que el condicionamiento tarde más en formarse (aprendizaje retardado). Si primero castigamos a un niño, haga lo que haga (extinción de la respuesta, no hará nada), y luego cambiamos la situación y castigamos sólo las conductas malas, entonces tardará mucho más tiempo en superar la primera etapa donde no respondía con ninguna conducta.
Aplicación del modelo
Debe destacarse que los fundamentos filosóficos de E. Thorndike son los planteados por el positivismo, esto es, descripción externa de la conducta.
El ser humano bajo el conexionismo de Thorndike aprenden por: (a) las vías de ensayo y error usualmente (pruebo a ver que pasa, veo el resultado y me quedo con la ejecución que me de el resultado… éste, al resultar es la recompensa. (b) También se aprende por conexión y selección, vale decir, establesco una conexión entre el comportamiento más adecuado y la situación problema y selecciono las respuestas más adecuadas y eficaces (eficaz=da los mejores resultados). (c) También se debe mencionar que considerando la tercera ley de Thorndike, se aprende grabando las respuestas correctas y desechando las correctas.
La ley de la preparación al aprendizaje: Es en la motivación de los estudiantes, en los estados emocionaes de los sujetos, se prepara al estudiante para iniciar el proceso de aprendizaje.
Aplicación de la Ley del ejercicio: Una conexión se fortalce mediante la práctica (ley del uso) y repeticiones. Se debilita cuando la práctica se interrumpe (ley del desuso).
Aplicación de la Ley del efecto al aprendizaje: La fuerza de la conexión aumentará cuando una conexión E-R vaya seguida de un acto satisfactorio (una retroalimentación positiva o recompensa), y en el opuesto, la fuerza de una conexión disminuye cuando ésta va seguida de algo molesto (retroalimentación negativa o castigo).
0 Comments:
Post a Comment
<< Home