Artículos de revistas
Apprentissage du comportement optimal par exposition aux contingences dans le dilemme de Monty Hall
Learning optimal behavior through exposure to contingencies in the Monty Hall dilemma
Autor
Villatte, Matthieu
Scholiers, David
Freixa i Baqué, Esteve
Institución
Resumen
L'étude a pour objet le dilemme de Monty Hall, une situation de jugement de probabilités dans laquelle la très grande majorité des individus émet un comportement de choix non-optimal. Nous formulons l'hypothèse selon laquelle l'exposition répétée aux conséquences du comportement de choix va permettre l'apprentissage du comportement optimal. Trois conditions constituent l'expérience: une condition consistant en une procédure de renforcement positif, une condition consistant en une procédure de punition négative, et une condition consistant en une procédure de renforcement positif et de punition négative. L'ajout d'une valeur aversive en conséquence du choix non-optimal, ainsi que l'extension de la série d' essais à 100, devraient permettre une amélioration de J'efficacité de l'apprentissage par rapport aux études ayant précédemment employé des séries d' essais renforcés dans le dilemme de Monty Hall. Les résultats montrent que le taux de comportement optimal augmente avec la série d'essais, mais reste proche de 50 %. Aucune des trois conditions d'apprentissage ne se révèle plus efficace qu'une autre pour l'acquisition du choix optimal. L'hypothèse selon laquelle le comportement de choix des sujets serait gouverné par des règles verbales les rendant insensibles aux contingences changeantes est formulée. Judgment under uncertainty has generated many research in Cognitive Sciences where the erroneous judgment perceived as the product of mental modules unsuited to the situation and in Experimental Analysis of Behavior, where it is apprehended as a non-optimal behavior acquired by learning. The experiment consists of a game, the Monty Hall Dilemma, in which 3 goblets are presented turned over to a subject who must find a ball hidden under one of them. After a first choice, an empty and non selected goblet is withdrawn. The subject can then stick with his initial choice or switch to the other remaining goblet. The “Switch” strategy and the “Stick” strategy have, respectively, a profit probability of 2/3 and 1/3, but, in great majority, the subject consider that the two strategies are equivalent, what constitutes a non optimal behavior. We formulate the hypothesis according to which repeated exposure to choice consequences will allow learning of the optimal behavior. Three conditions constitute the experiment: a condition consisting of a positive reinforcement procedure, a condition consisting of a negative punishment procedure, and a condition consisting of a positive reinforcement and negative punishment procedure. The addition of an aversive value when the choice of strategy does not make it possible to find the ball and the extension of the series of tries to 100 should allow an improvement of the learning effectiveness compared to the studies having previously employed series of reinforced tries in the Monty Hall Dilemma. Results show that optimal behavior rate increases with series of tests, but remains close to 50 %. No learning procedure appears more effective than another for acquisition of the choice for “Switch” strategy. The hypothesis according to which subjects choice behavior would be controlled by verbal rules making them insensitive with changing contingencies is formulated.