Más allá de la utilidad esperada: una introducción a la utilidad del proceso MÁS ALLÁ DE LA UTILIDAD ESPERADA: UNA INTRODUCCIÓN A LA UTILIDAD DEL PROCESO Juan Manuel López Zafra, Universidad Pontificia de Comillas Sonia de Paz Cobo Universidad Complutense de Madrid RESUMEN Durante los últimos sesenta años, la Teoría de la Utilidad Esperada (TUE) de von Neumann y Morgenstern ha sido el estándar de la decisión individual en régimen de riesgo. Sin embargo, ya desde sus orígenes dio lugar a controversias de toda índole, siendo la más conocida la denominada paradoja de Allais. Tales divergencias han provocado la aparición de las denominadas Teorías de la Utilidad No Esperada (TUNE) o Teorías Descriptivas de la Decisión, por oposición a la normatividad de la original de los autores citados. Más allá de su discutida validez, de lo que no cabe duda es del impresionante esfuerzo científico desarrollado para conseguir la sustitución de la primera por alguna de ellas. Tras efectuar un repaso por las aportaciones más destacadas en el terreno de las TUNE, nos centraremos en una de las más recientes teorías de la decisión, la denominada Utilidad del Proceso o Procedural Utility. De acuerdo con ella, los individuos no tomarían sus decisiones de acuerdo sólo con la utilidad (esperada o no) de los resultados, sino asimismo de acuerdo con la utilidad extraída del propio proceso en el que se involucran, permitiendo incluso resolver la propia paradoja de Allais. XIII Jornadas de ASEPUMA 1 López Zafra, JM; De Paz Cobo, S. 1. INTRODUCCIÓN Fue Allais (1953) quien por primera vez planteó la posibilidad de un comportamiento de los decisores distinto del planteado por la Teoría de la Utilidad Esperada. Ese momento marcó el desarrollo de un conjunto de teorías, conocidas bajo el nombre de Teorías de la Utilidad No Esperada o Teorías de la Utilidad Generalizada, que desde entonces han tratado de explicar el comportamiento de los decisores. El esfuerzo de investigación, tanto teórico como aplicado, ha sido ingente, y los resultados en muchos casos prometedores. ¿Puede decirse entonces que nos encontramos frente a un nuevo paradigma de la decisión individual unicriterio? La respuesta no es sencilla, desgraciadamente. En las próximas páginas trataremos de mostrar los hitos más importantes en la evolución del pensamiento en el ámbito de la decisión individual, señalando algunas de las teorías generalizadas más competentes, para plantear a continuación una introducción al desarrollo más novedoso en ese ámbito, el de la utilidad del proceso. En el último epígrafe señalamos las conclusiones. 2. EL DESBORDAMIENTO DEL MARCO NORMATIVO Como es perfectamente conocido, el primer antecedente histórico de la TUE es debido a Bernouilli (1738), que permitió anticipar la vía de solución de la paradoja de San Petersburgo. Posteriormente, von Neumann y Morgenstern (1944) dieron forma axiomática al comportamiento del individuo ante la decisión en riesgo. Éste es, desde entonces, el paradigma de la decisión individual. Sean tres alternativas (J, K, L) definidas sobre un mismo conjunto de resultados económicos o premios X=(x1, ..., xn), alcanzables en determinadas circunstancias con una cierta probabilidad. La TUE se desarrolla básicamente a partir de los axiomas de ordenación, continuidad e independencia. El primero requiere el cumplimiento de la completitud y la transitividad; la continuidad supone que si J dp K y K dp L (siendo dp débilmente preferido a), existe una probabilidad p tal que K idf M (con idf indiferente a; y M la alternativa compuesta por las dos alternativas J y L con probabilidades respectivas de acaecimiento p y 1-p). La independencia se puede señalar del siguiente modo: supuesto que J dp K, entonces necesariamente (J, p; L, 1-p) dp (K, p; L, 1-p). Este axioma es el que ofrece el mayor poder explicativo de la teoría, y es precisamente el más rebatido por el conjunto de las 2 XIII Jornadas de ASEPUMA Más allá de la utilidad esperada: una introducción a la utilidad del proceso TUNE. De este modo, supuesto el mantenimiento de tales axiomas, se puede plantear la n existencia de una función de valoración de la preferencia del tipo u ( A) = ∑ piu ( xi ) , i =1 siendo A una alternativa cualquiera, x un resultado de tal alternativa, y p su probabilidad de acaecimiento. Ocurre sin embargo que el comportamiento individual ante el riesgo no siempre se adecua a lo previsto por la TUE. La primera y más conocida prueba, aunque no la única, se debe a Maurice Allais (1953), quien la planteó en términos similares a los siguientes. Un individuo debe optar entre dos alternativas; la primera, A1, le ofrece la posibilidad de obtener € 1M con total seguridad, mientras que en la segunda, B1, puede los resultados que puede alcanzar son € 5M con probabilidad p=0.10, € 1M con p=0.89 o € 0 con p=0.011. En una segunda tanda de opciones se le ofrecen otras dos, A2, con p=0.11 de ganar € 1M y p=0.89 de no ganar nada, y B2, cuyos resultados son € 5M con p=0.10 y € 0 con p=0.90. La gente, tal y como el autor presumía, se comportó escogiendo A1 en la primera opción y B2 en la segunda, dando lugar a un comportamiento inconsistente con la ordenación derivada de la TUE, que supondría escoger bien siempre A frente a B, bien la actuación contraria. Ésta es sólo la primera evidencia histórica de comportamientos distintos de los previstos por la TUE, que dio lugar a los denominados efectos de consecuencia común; otro conjunto de procedimientos que se alejan de las previsiones de la TUE los provocan los llamados efectos de proporción común, y que podemos plantear a través del siguiente ejemplo. Sea la elección entre € 9.000 con p=1 y € 10.000 con p=0.8, € 0 con p=0.2. Sea ahora la elección entre € 9.000 con p=0.25 (o nada) y € 10.000 con p=0.2 (o nada). La mayor parte de los individuos escoge los 9.000 euros en la primera opción, y la lotería con los 10.000 euros en la segunda, en forma contraria a lo previsto por la TUE. Así pues, más allá del tipo de efecto escogido (véase Starmer (2000) para muchos otros), lo relevante es que la TUE no explica en todos los casos el comportamiento del decisor ante el riesgo. Por ello, a partir fundamentalmente de finales de los años 70, surge un primer conjunto de teorías que, en términos generales, comparten los siguientes aspectos: (a) representación de las preferencias mediante 1 La unidad monetaria empleada por Allais era, obviamente, el Franco Francés y no el euro. XIII Jornadas de ASEPUMA 3 López Zafra, JM; De Paz Cobo, S. alguna función de valoración U(x) definida sobre el conjunto de alternativas; (b) tal función satisface los postulados de de ordenación y continuidad, y (c) aún permitiendo que la función transgreda el axioma de independencia, sin embargo debe mantenerse el principio de monotonía. Esta última cuestión supone que alternativas estocásticamente dominantes sean siempre preferidas. Este tipo de teorías es el que Starmer (2000) denomina convencionales, frente a un segundo grupo de no convencionales. En ellas, la característica más interesante es la posibilidad de violación de ciertas asunciones implícitas en el conjunto de teorías anterior (y, por supuesto, en la TUE), como son las de invariabilidad del proceso (las preferencias sobre alternativas no dependen de la forma en la que afloren) e invariabilidad descriptiva (distintas presentaciones de las alternativas de un mismo problema de decisión deben dar lugar a decisiones idénticas); en este campo, quienes más han avanzado son los psicólogos, destacando entre otros los trabajos de Lichtenstein y Slovic (1971) y por supuesto de Kahneman y Tversky (1979). Hacemos a continuación un breve repaso de unas y otras. 2.1. La aproximación convencional Una de las más sencillas aproximaciones se debe a Chew y MacCrimmon (1979) con su teoría de la utilidad ponderada o teoría de la elección alpha-nu, en la que la función de evaluación de las preferencias adopta la forma u ( A) = ∑ pi ⋅ g ( xi ) ⋅ u ( xi ) ∑ pi ⋅ g ( xi ) siendo g(x) el conjunto de coeficientes de ponderación no nulos de los resultados. En el caso de ser los pesos idénticos para todos los premios, estamos en presencia de la TUE. Este análisis puede interpretarse, y así lo hace Starmer (2000), como una particularización del caso general propuesto por Machina (1982), en cuyo modelo no se plantean necesariamente funciones de iso-utilidad lineales. Bell (1985) y Loomes y Sugden (1982) presentan otra versión de la teoría de la utilidad, denominada teoría del desacuerdo. La función de valoración, en el caso de los últimos, adopta la forma u ( A) =∑ pi ⋅ u ( xi ) + D ( u ( xi ) − U ) en la que u(x) representa la utilidad de las consecuencias y U es una medida de la expectativa previa de la utilidad de la alternativa. Este modelo supone que si un resultado es peor de lo previsto (esto es, u(x) < U) se generaría en el decisor un cierto 4 XIII Jornadas de ASEPUMA Más allá de la utilidad esperada: una introducción a la utilidad del proceso desacuerdo o malestar; por el contrario, resultados mejores de lo esperado provocarían en él una cierta euforia. Supuesto que D(u(x)-U) sea cero, estamos nuevamente en presencia de la TUE. El planteamiento que realizan los autores pretende recoger un aspecto de la elección caracterizado por la psicología, que supone que los individuos muestran aversión al malestar o desacuerdo (siendo en tal caso D(y) cóncava para y<0) y propensión a la euforia (D(y) convexa para y>0). Otros modelos interesantes son los de la utilidad cuadrática de Chew, Epstein y Segal (1991), o el de la utilidad dependiente de loterías de Becker y Sarin (1989). 2.2. La aproximación no convencional La característica común a las teorías englobadas en la aproximación convencional es la maximización de las preferencias bajo la suposición implícita de una actuación pseudo-optimizante de la función de valoración de las mismas; queremos señalar con ello que tales teorías no se preocupan del procedimiento seguido por los decisores a la hora de adoptar sus decisiones, sino de qué decisiones toman. Nuevamente, la psicología aporta un enfoque distinto al tradicionalmente seguido por los economistas. En su ámbito, un conjunto eminente de profesionales se ha preocupado desde hace más de veinte años en analizar el proceso de toma de decisiones, señalando que generalmente los individuos actúan de acuerdo con unas reglas de comportamiento preconcebidas de algún tipo a la hora de efectuar sus elecciones. Uno de los principales aspectos de este conjunto de teorías lo representa la racionalidad limitada. Conlisk (1996) señala a este respecto que “la racionalidad limitada no es un alejamiento del razonamiento económico sino una necesario extensión del mismo”. Payne, Bettman y Johnson (1993) plantean un modelo según el cual los decisores contarían con una muy variada gama de métodos heurísticos aplicables según el caso, como la determinación de la utilidad esperada, el empleo de reglas satisfacientes, o de ordenaciones lexicográficas, etc., de forma que en cada ocasión el decisor adaptativo “decide cómo decidir”. Sin embargo, el modelo más ampliamente estudiado en este ámbito es el debido a Kahneman y Tversky (1979); su teoría de las expectativas plantea que la elección supone un proceso en dos etapas. En la primera, los individuos “editan” las alternativas de acuerdo a un amplio conjunto de reglas heurísticas de comportamiento; en la segunda, la elección entre las distintas alternativas editadas se efectúa mediante una XIII Jornadas de ASEPUMA 5 López Zafra, JM; De Paz Cobo, S. función de preferencia que en ciertas ocasiones adopta la forma de la denominada por n Starmer (2000) utilidad ponderada simple, esto es, u ( A) = ∑ π ( pi ) ⋅ u ( xi ) , donde π(p) i =1 es un coeficiente de ponderación de la importancia del resultado x. Obviamente, si el decisor considera que tal coeficiente coincide con la probabilidad del resultado, estamos ante la TUE, pero nada impide que así sea. De hecho, los autores plantean que los individuos tienden a sobreestimar ciertos resultados y a subestimar otros, más allá de sus probabilidades objetivas de acaecimiento. En cualquier caso, esta teoría se distingue de todas las anteriores en dos aspectos básicos: (a) presenta una fase de edición de las alternativas, y (b) los resultados se interpretan en relación con un punto de referencia, esto es, como ganancias o pérdidas respecto de tal punto. En general, se considera que tal referencia se sitúa en los niveles de riqueza del decisor, pero que puede variar en función de las circunstancias del problema y de la presentación del mismo. Este punto de referencia resulta esencial para el desarrollo posterior de un subconjunto de teorías denominadas de clasificación y signo como las de Starmer y Sugden (1989), Luce y Fishburn (1991) o Tversky y Kahneman (1992) (en el que los autores eliminan la fase inicial de edición de las alternativas, pues el nuevo marco teórico permite mantener la esencia de su aproximación original sin necesidad de emplear tal fase); así, por ejemplo, en el modelo propuesto por Starmer y Sugden la función de evaluación de las alternativas adopta la forma v( A) ≡ V + ( A) + V − ( A) , donde V+(A) es la utilidad esperada dependiente de clasificación de la alternativa transformada A+ (análoga a la original salvo en que resultados de A que supongan pérdidas se sustituyen por ceros), y V-(A) refleja una utilidad análoga para la lotería transformada A- (en la que los resultados positivos se reemplazan por ceros). Un paso más allá van las teorías que permiten la violación de la transitividad, cuestión ésta tan trascendente que daría lugar a un artículo completo. Simplemente señalemos que, por ejemplo, la teoría del remordimiento de Loomes y Sugden (1982)(1987) (muy cercana a la anteriormente citada del desacuerdo), supone que los individuos comparan los resultados en una alternativa dada, ocasionando la posibilidad del desacuerdo en el caso de que tal consecuencia sea peor que la que podría haber sido; esta teoría permite que comparaciones entre resultados afecten a la elección, pero en tal caso la comparación importante se da entre las consecuencias de opciones alternativas de elección. Es una teoría que presenta ciertas limitaciones (superadas por otros autores, 6 XIII Jornadas de ASEPUMA Más allá de la utilidad esperada: una introducción a la utilidad del proceso como por ejemplo Quiggin (1994)) al plantear elecciones por parejas. Supongamos dos acciones alternativas Ai y Aj que llevarían a los resultados xie y xje en el estado de la naturaleza E. La utilidad de xie viene dada por la función M(xie, xje), creciente en su primer término y decreciente en el segundo. Tal función permite la posibilidad de eliminar por “remordimiento” la utilidad asociada a xie cuando es inferior a xje. Así, el m decisor maximizaría finalmente la expresión ∑ p ⋅M (x e ie , xie ) , con pe la probabilidad e =1 del estado E. Coincide con la TUE cuando M ( xie , xie ) = u ( xie ) . 3. LAS TEORÍAS DE LA UTILIDAD DEL PROCESO 3.1. Introducción a la utilidad del proceso. La última aportación al desarrollo teórica de las teorías de la utilidad lo constituyen las denominadas teorías de utilidad del proceso. En ellas se pretende reflejar el hecho de que los individuos valoran no sólo las consecuencias económicas de sus decisiones sino también el propio hecho de poder decidir. Como ejemplos podemos citar la participación ciudadana en procesos democráticos, o la posibilidad de participar en juegos de azar con esperanza negativa. Frey, Benz y Stutzer (2004) plantean una nueva aproximación al problema de la decisión de acuerdo con tres aspectos esenciales, a saber: (I) regresan al concepto original de utilidad en economía, esto es, en su acepción de medida del bienestar; (II) recogen determinantes no instrumentales de la utilidad, esto es, introduciendo los procesos en los que el individuo participa como fuentes de utilidad más allá de sus consecuencias; y (III) señalan que la utilidad del proceso aparece debido al sentido del yo individual, o lo que es lo mismo, porque el proceso de decisión proporciona una muy importante información acerca de cómo uno mismo es percibido por sí mismo y por los demás. Posteriormente, Frey y Stutzer (2005) abordan el espinoso problema de la medición de la utilidad del proceso, y lo hacen de acuerdo con datos de bienestar subjetivo de los individuos. Plantean una aplicación al caso de la participación ciudadana en procesos políticos, a partir de una hipótesis a contrastar: la utilidad que se deriva del derecho de participar en procesos políticos mejora el bienestar subjetivo de XIII Jornadas de ASEPUMA 7 López Zafra, JM; De Paz Cobo, S. los ciudadanos, que será mayor que el de los extranjeros que habitan en la misma zona y no tienen el mismo derecho. Los resultados de su modelo de análisis parecen confirmar tal planteamiento. 3.2. El problema de la utilidad del juego. Vigencia de la teoría de la utilidad esperada. Uno de los principales problemas enfrentados por la TUE se ha dado siempre en el ámbito de su validez descriptiva en situaciones como la proporcionada por la paradoja del Allais, o por el problema del escalador de Marschak (1950). En general, toda situación que invoque algún tipo de juego puede dar lugar a violaciones de la TUE. Sin embargo, tal situación ha sido satisfactoriamente resuelta por LeMenestrel (2001). Para ello, trata de forma inicialmente separada las consecuencias económicas de las alternativas del propio proceso que lleva a la posibilidad de escogerlas. De esa manera, indica la posibilidad de que la acción de juego (el proceso asociado a jugar) presente una (des)utilidad al decisor, y de esa forma prefiera la posibilidad de no jugar a la de jugar, independientemente de las consecuencias económicas de las alternativas de juego. El tratamiento de la elección combina tanto el proceso con las consecuencias, manteniendo la función de utilidad sobre los resultados (excluyendo de ella el proceso de elección) acorde con la TUE. Así, permite mantener una buena parte del carácter normativo de la citada teoría. Los elementos básicos de la aproximación del autor son las consecuencias (como distribuciones de probabilidad, degeneradas o no, sobre los resultados), el proceso (cualquier acción dependiente exclusivamente de la voluntad del decisor) y el comportamiento (empíricamente observable, y que comprende tanto consecuencias como procesos). Plantea de este modo que la elección se produce a través de la relación de preferencia sobre comportamientos. Y de ese modo mantiene el deseado cumplimiento de la monotonía, esto es, que un comportamiento compuesto por un proceso preferido y una consecuencia preferida sea necesariamente escogido. El autor propone un modelo axiomático que da fuerza a la lógica que subyace en su razonamiento. Siendo A el conjunto de procesos, C el de consecuencias, y dada una función g de A en C, define la situación de elección como el conjunto de comportamientos disponibles B = {( a, g (a) ) : a ∈ A} y una relación binaria f B completa % y transitiva sobre el conjunto de comportamientos que refleja el comportamiento 8 XIII Jornadas de ASEPUMA Más allá de la utilidad esperada: una introducción a la utilidad del proceso racional observable. No es objeto del presente trabajo profundizar más, pero sí señalar que el modelo de LeMenestrel permite efectivamente incorporar las aparentes paradojas observadas en la TUE, sin necesidad de relajarla, cumpliendo con las exigidas condiciones de monotonía e independencia. Eso sí, no define (como el propio autor señal) ningún tipo de función continua y monótona de los comportamientos, por lo que da lugar a una clasificación de los mismos y por tanto a una concepción ordinal de la utilidad del proceso; y dado que las consecuencias sí se siguen evaluando de forma cardinal, se produce entonces una combinación (aún no resuelta formalmente) de escalas cardinales y ordinales. 4. CONCLUSIONES Hemos pretendido a lo largo de las páginas anteriores mostrar de forma muy sintética los enormes progresos que se han dado en los últimos veinte años en el terreno de la teoría de las decisiones en riesgo. A partir de las observadas contradicciones entre el comportamiento previsto por la TUE y el realmente mantenido por los individuos, el ingente esfuerzo teórico de matemáticos, economistas, y psicólogos ha permitido que cada día conozcamos mejor la forma en que tomamos las decisiones. Más allá de las teorías de la utilidad no esperada, que permiten resolver aspectos descriptivos concretos pero que en términos generales carecen de fuerza normativa, tal y como señala Howard (1992), las teorías de la utilidad del proceso surgen con fuerza para, quizá, permitir resolver definitivamente el problema de la validez descriptiva de la TUE, sin renunciar a ella y dotándola del vigor que parecía perder. 5. REFERENCIAS BIBLIOGRÁFICAS • ALLAIS, M (1953) “Le comportement de l´homme rationnel devant le risque : critique des postulats et axiomes de l’école américaine “, Econometrica, 21, pp. 503546. • BECKER, J; SARIN, R (1989) “Decision analysis using lottery-dependent utility”, Journal of Risk and Uncertainty, vol 2/1, pp. 105-117 • BELL, D (1985) “Disappointments in decision making under uncertainty”, Operations Research, 33, pp. 1-27 XIII Jornadas de ASEPUMA 9 López Zafra, JM; De Paz Cobo, S. • BERNOUILLI, D (1954) “Exposition of a new theory on the measurement of risk“, Econometrica, 22, pp. 23-36 (traducción del trabajo original de 1738) • CHEW, SH; EPSTEIN, L; SEGAL, U (1991) “Mixture Symmetry and Quadratic Utility”, Econometrica, 59, pp-139-163 • CHEW, SH; MACCRIMMON, K (1979) “Alpha-un choice theory: a generalisation of expected utility theory”, Working Paper 669, University of British Columbia. • CONLISK, J (1996) “Why bounded rationality?” Journal of Economic Literature, vol 34/2, pp. 669-700 • FREY, B; BENZ, M; STUTZER, A (2004) “Introducing Procedural Utility: Not only What, but also How Matters”, Journal of Institutional and Theoretical Economics, Vol. 160/3, pp. 377-401 • FREY, B; STUTZER, A (2005) “Beyond outcomes: measuring procedural utility”, Oxford Economic Papers, 57(1), pp. 90-111 • KHANEMAN, A; TVERSKY, D (1979) “Prospect theory: an analysis of decision under risk”, Econometrica, 47/2, pp. 263-291 • LE MENESTREL, M (2001) “A Process Approach to the Utility for Gambling”, Theory and Decision, 50(3), pp. 249-262. • LICHTENSTEIN, S; SLOVIC, P (1971) “”Reversals of preference between bids and choices in gambling decisions”, J. of Experimental Psychology, 89, pp. 46-55 • LOOMES, G; SUGDEN, R (1982) “Regret theory: an alternative theory of rational choice under uncertainty”, Economic Journal, 92 (Diciembre), pp. 805-24 • LOOMES, G; SUGDEN, R (1987) “Some implications of a more general form of regret theory”, Journal of Economic Theory, 41/2, pp. 270-287. • LUCE, D; FISHBURN, P (1991) “Rank- and sign-dependent linear utility models for finite first-order gambles”, Journal of Risk and Uncertainty, vol 4/1, pp. 29-59. • MACHINA, M (1982) “Expected utility theory without the independence axiom”, Econometrica, 50, pp. 277-323 • PAYNE, J; BETTMAN, J; JOHNSON, E (1993) The adaptative decision maker, Cambridge University Press. 10 XIII Jornadas de ASEPUMA Más allá de la utilidad esperada: una introducción a la utilidad del proceso • QUIGGIN, J (1994) “Regret theory with general choice sets”, Journal of Risk and Uncertainty, vol 8/2, pp. 153-165 • STARMER, C (2000) “Developments in non-expected utility theory: the hunt for a descriptive theory of choice under risk”, Journal of Economic Literature, 38/2, pp. 332-382 • STARMER, C; SUGDEN, R (1989) “Generalization of expected utility theories: a survey of recent proposals”, Annals of Operations Research, Vol 19 (Mayo), pp. 328 • TVERSKY, A; KAHNEMAN, D (1992) “Advances in prospect theory: Cumulative representation of uncertainty”, Journal of Risk and Uncertainty, vol 5/4, pp. 297-323 • VON NEUMANN, J; MORGENSTERN, O (1944) Theory of Games and Economic Behavior. Princeton: Princeton University Press. • MARSCHAK, J (1950) “Uncertain Prospects, and Measurable Utility”, Econometrica, 18, pp. 111–141 • HOWARD, R (1992) “In Praise of the Old-Time Religion”, en Edwards, W (Ed.): Utility theories: measurements and applications, Kluwer Academic Publishers. XIII Jornadas de ASEPUMA 11