8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 ;,69Ð( 40*96,*65Ô40*( 7905*0706:)Í:0*6:@(4730(*065,: HLKPJP}U Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 ;,69Ð( 40*96,*65Ô40*( 7905*0706:)Í:0*6:@(4730(*065,: HLKPJP}U >HS[LY5PJOVSZVU *OYPZ[VWOLY:U`KLY (TOLYZ[*VSSLNL +HY[TV\[O*VSSLNL ;YHK\JJP}U ,UYPX\L*4LYJHKV.VUamSLa ;YHK\J[VYWYVMLZPVUHS 9L]PZP}U[tJUPJH +Y1LZZ(=HSKtZ+xHaKL=PSSLNHZ <UP]LYZPKHK0ILYVHTLYPJHUH Argentina • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Teoría microeconómica. Principios básicos y ampliaciones, 11a. edición. Walter Nicholson y Christopher Snyder Presidente de Cengage Learning Latinoamérica: Fernando Valenzuela Migoya Director Editorial, de Producción y de Plataformas Digitales para Latinoamérica: Ricardo H. Rodríguez Editora de Adquisiciones para Latinoamérica: Claudia C. Garay Castro Gerente de Manufactura para Latinoamérica: Raúl D. Zendejas Espejel Gerente Editorial en Español para Latinoamérica: Pilar Hernández Santamarina Gerente de Proyectos Especiales: Luciana Rabuffetti Coordinador de Manufactura: Rafael Pérez González Editora: Abril Vega Orozco Diseño de portada: MSDE | MANU SANTOS Design Imagen de portada: ©Mazzzur/Shutterstock ©Gunnar Pippel/Shutterstock Composición tipográfica: José Jaime Gutiérrez Aceves Mariana Sierra Enríquez © D.R. 2015 por Cengage Learning Editores, S.A. de C.V., una Compañía de Cengage Learning, Inc. Corporativo Santa Fe Av. Santa Fe núm. 505, piso 12 Col. Cruz Manca, Santa Fe C.P. 05349, México, D.F. Cengage Learning® es una marca registrada usada bajo permiso. DERECHOS RESERVADOS. Ninguna parte de este trabajo amparado por la Ley Federal del Derecho de Autor podrá ser reproducida, transmitida, almacenada o utilizada en cualquier forma o por cualquier medio, ya sea gráfico, electrónico o mecánico, incluyendo, pero sin limitarse a lo siguiente: fotocopiado, reproducción, escaneo, digitalización, grabación en audio, distribución en Internet, distribución en redes de información o almacenamiento y recopilación en sistemas de información, a excepción de lo permitido en el Capítulo III, Artículo 27 de la Ley Federal del Derecho de Autor, sin el consentimiento por escrito de la Editorial. Traducido del libro Microeconomic Theory: Basic Principles and Extensions, Eleventh Edition. Walter Nicholson and Christopher Snyder. Publicado en inglés por South-Western, una compañía de Cengage Learning ©2012. ISBN: 978-111-1-52553-8 Datos para catalogación bibliográfica: Nicholson, Walter y Christopher Snyder. Teoría microeconómica. Principios básicos y ampliaciones, 11a. edición. ISBN: 978-607-552-029-1 Visite nuestro sitio en: http://latinoamerica.cengage.com Impreso en México 1 2 3 4 5 6 7 17 16 15 14 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Dedicatoria A Beth, Sarah, David, Sophia, Abby, Nate y Christopher A Maura v Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Acerca de los autores Walter Nicholson es titular de la cátedra Ward H. Patton de economía en el Amherst College. Obtuvo una licenciatura en matemáticas en el Williams College y un doctorado en economía en el Massachusetts Institute of Technology (MIT). Sus principales intereses de investigación son los análisis econométricos de problemas del mercado de trabajo como bienestar, desempleo y el impacto del comercio internacional. Ha sido durante muchos años miembro distinguido de Mathematica, Inc., y asesor de los gobiernos de Estados Unidos y Canadá. Vive con Susan, su esposa, en Naples, Florida y en Amherst, Massachusetts. Christopher M. Snyder es profesor de economía en el Dartmouth College. Obtuvo su licenciatura en economía y matemáticas en la Fordham University y su doctorado en economía en el MIT. Es investigador de la National Bureau of Economic Research, miembro del consejo de la Industrial Organization Society y director adjunto del International Journal of Industrial Organization and Review of Industrial Organization. Sus investigaciones cubren diversos temas teóricos y empíricos acerca de organización industrial, teoría de contratos, derecho y economía. El profesor Snyder y su esposa, Maura Doyle (también maestra de economía en Dartmouth), viven muy cerca del campus, en Hanover, New Hampshire, con sus tres hijas de edad escolar. Los profesores Nicholson y Snyder también son autores de Intermediate Microeconomics and Its Application (Cengage Learning, 2010). vii Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Contenido breve Prefacio PARTE UNO PARTE DOS Introducción 1 CAPÍTULO 1 CAPÍTULO 2 PARTE PARTE 3 4 5 6 7 8 PARTE PARTE PARTE PARTE El modelo competitivo de equilibrio parcial Equilibrio general y bienestar 457 409 Monopolio 501 Competencia imperfecta 531 Determinación de precios en mercados de insumos 579 CAPÍTULO 16 CAPÍTULO 17 OCHO Funciones de producción 303 Funciones de costo 333 Maximización de beneficios 371 Poder de mercado 499 CAPÍTULO 14 CAPÍTULO 15 SIETE 301 Mercados competitivos 407 CAPÍTULO 12 CAPÍTULO 13 SEIS 207 Incertidumbre 209 Teoría de juegos 251 Producción y oferta CAPÍTULO 9 CAPÍTULO 10 CAPÍTULO 11 CINCO Preferencias y utilidad 89 Optimización de la utilidad y elección 117 Efectos de ingreso y de sustitución 145 Relaciones de demanda entre bienes 187 Incertidumbre y estrategia CAPÍTULO CAPÍTULO CUATRO 21 Elección y demanda 87 CAPÍTULO CAPÍTULO CAPÍTULO CAPÍTULO TRES Modelos económicos 3 Matemáticas para microeconomía Mercados de trabajo 581 Capital y tiempo 607 Fallas del mercado 639 CAPÍTULO 18 CAPÍTULO 19 Información asimétrica 641 Externalidades y bienes públicos 685 Respuestas breves a las preguntas 717 Soluciones a los problemas de número non 727 Glosario de términos de uso frecuente 739 Índice analítico 747 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. ix 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Contenido detallado Prefacio ........................................................................................................................................................xix PARTE UNO Introducción 1 CAPÍTULO 1 Modelos económicos ...................................................................................................................................3 Modelos teóricos 3 Comprobación de modelos económicos 4 Características generales de los modelos económicos Desarrollo de la teoría económica del valor 9 Evolución moderna 17 Resumen 18 Sugerencias de lecturas adicionales 19 CAPÍTULO 5 2 Matemáticas para microeconomía ..........................................................................................................21 Maximización de una función de una variable 21 Funciones de varias variables 26 Maximización de funciones de varias variables 33 Teorema de la envolvente 35 Maximización restringida 39 Teorema de la envolvente en problemas de maximización restringida Restricciones de desigualdad 46 Condiciones de segundo orden y curvatura 48 Funciones homogéneas 55 Integración 58 Optimización dinámica 63 Estadística matemática 67 Resumen 76 Problemas 77 Sugerencias de lecturas adicionales 82 Extensiones: Condiciones de segundo orden y álgebra matricial 83 PARTE DOS 45 Elección y demanda 87 CAPÍTULO 3 Preferencias y utilidad ...............................................................................................................................89 Axiomas de la elección racional 89 xi Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 xii Contenido Utilidad 90 Intercambios y sustitución 92 Matemática de las curvas de indiferencia 99 Funciones de utilidad para preferencias específicas El caso de muchos bienes 106 Resumen 106 Problemas 107 Sugerencias de lecturas adicionales 110 Extensiones: Preferencias especiales 112 CAPÍTULO 102 4 Optimización de la utilidad y elección .................................................................................................117 Sondeo inicial 118 El caso de dos bienes: análisis gráfico 119 El caso de n bienes 122 Función de utilidad indirecta 128 Principio de suma global 129 Minimización del gasto 131 Propiedades de las funciones de gasto 134 Resumen 136 Problemas 136 Sugerencias de lecturas adicionales 140 Extensiones: Porciones presupuestales 141 CAPÍTULO 5 Efectos de ingreso y de sustitución .......................................................................................................145 Funciones de demanda 145 Variaciones en el ingreso 147 Variaciones en el precio de un bien 149 Curva de demanda de una persona 152 Curvas y funciones de demanda compensada (de Hicks) 155 Desarrollo matemático de la respuesta a las variaciones de precio 160 Elasticidades de la demanda 163 Superávit del consumidor 169 Preferencia revelada y efecto de sustitución 174 Resumen 176 Problemas 177 Sugerencias de lecturas adicionales 180 Extensiones: Conceptos de demanda y evaluación de índices de precios 181 CAPÍTULO 6 Relaciones de demanda entre bienes ...................................................................................................187 El caso de dos bienes 187 Sustitutos y complementarios 189 Sustitutos y complementarios netos (de Hicks) 191 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Contenido xiii Sustituibilidad con muchos bienes 193 Bienes compuestos 193 Producción doméstica, atributos de los bienes y precios implícitos 197 Resumen 200 Problemas 200 Sugerencias de lecturas adicionales 203 Extensiones: Simplificación de la demanda y presupuestación en dos etapas PARTE TRES Incertidumbre y estrategia CAPÍTULO 204 207 7 Incertidumbre ............................................................................................................................................ 209 Estadística matemática 209 Apuestas razonables e hipótesis de la utilidad esperada 210 Utilidad esperada 211 El teorema Von Neumann-Morgenstern 212 Aversión al riesgo 214 Medición de la aversión al riesgo 217 Métodos para reducir la incertidumbre y el riesgo 222 Seguros 222 Diversificación 223 Flexibilidad 224 Información 231 Enfoque de estados de preferencia de la elección en condiciones de incertidumbre Asimetría de información 238 Resumen 238 Problemas 239 Sugerencias de lecturas adicionales 242 Extensiones: El problema de la cartera 244 232 CAPÍTULO 8 Teoría de juegos ....................................................................................................................................... 251 Conceptos básicos 251 Dilema del prisionero 252 Equilibrio de Nash 254 Estrategias mixtas 260 Existencia de equilibrio 265 Continuo de acciones 265 Juegos secuenciales 268 Juegos repetidos 274 Información incompleta 277 Juegos bayesianos simultáneos Juegos de señalamiento 282 Juegos experimentales 288 278 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 xiv Contenido Juegos evolutivos y aprendizaje 290 Resumen 290 Problemas 291 Sugerencias de lecturas adicionales 295 Extensiones: Existencia del equilibrio de Nash PARTE CUATRO Producción y oferta 296 301 CAPÍTULO 9 Funciones de producción.........................................................................................................................303 Productividad marginal 303 Gráficas de isocuantas y tasa de sustitución técnica 306 Rendimientos a escala 310 Elasticidad de sustitución 313 Cuatro funciones de producción simples 316 Progreso técnico 320 Resumen 324 Problemas 325 Sugerencias de lecturas adicionales 328 Extensiones: Funciones de producción con muchos insumos 329 CAPÍTULO 10 Funciones de costo ...................................................................................................................................333 Definiciones de costos 333 Decisiones de insumos de minimización de costos 336 Funciones de costo 341 Funciones de costo y desplazamientos en curvas de costo Lema de Shephard y elasticidad de sustitución 355 Distinción corto plazo, largo plazo 355 Resumen 362 Problemas 363 Sugerencias de lecturas adicionales 366 Extensiones: La función de costo translog 367 345 CAPÍTULO 11 Maximización de beneficios ...................................................................................................................371 Naturaleza y comportamiento de las empresas 371 Maximización de beneficios 373 Ingreso marginal 375 Oferta a corto plazo por una empresa fijadora de precios 380 Funciones de beneficios 383 Maximización de beneficios y demanda de insumos 389 Resumen 395 Problemas 396 Sugerencias de lecturas adicionales 400 Extensiones: Límites de la empresa 401 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Contenido xv PARTE CINCO Mercados competitivos 407 CAPÍTULO 12 El modelo competitivo de equilibrio parcial ........................................................................................409 Demanda del mercado 409 Determinación temporal de la respuesta de la oferta 413 Determinación de precios a muy corto plazo 413 Determinación de precios a corto plazo 415 Desplazamientos en curvas de oferta y demanda: análisis gráfico 419 Modelo matemático del equilibrio del mercado 422 Análisis de largo plazo 425 Equilibrio a largo plazo: caso de costo constante 426 Forma de la curva de oferta a largo plazo 428 Elasticidad de la oferta a largo plazo 431 Análisis de estática comparativa del equilibrio a largo plazo 431 Superávit del productor a largo plazo 435 Eficiencia económica y análisis de bienestar 438 Controles de precios y escasez 441 Análisis de la incidencia tributaria 442 Resumen 447 Problemas 447 Sugerencias de lecturas adicionales 451 Extensiones: Agregación y estimación de la demanda 453 CAPÍTULO 13 Equilibrio general y bienestar ................................................................................................................457 Sistema de precios perfectamente competitivo 457 Modelo gráfico de equilibrio general con dos bienes 458 Análisis de estática comparativa 467 Modelización del equilibrio general y precios de factores 469 Modelo matemático de intercambio 471 Modelo matemático de producción e intercambio 482 Modelos calculables de equilibrio general 485 Resumen 489 Problemas 490 Sugerencias de lecturas adicionales 494 Extensiones: Modelos calculables de equilibrio general 495 PARTE SEIS Poder de mercado 499 CAPÍTULO 14 Monopolio ...................................................................................................................................................501 Barreras de entrada 501 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 xvi Contenido Maximización de beneficios y decisiones de producción 503 Monopolio y asignación de recursos 507 Monopolio y calidad y durabilidad de los productos 510 Discriminación de precios 513 Discriminación de precios de segundo grado mediante programas de precios Regulación del monopolio 519 Visiones dinámicas del monopolio 523 Resumen 523 Problemas 524 Sugerencias de lecturas adicionales 527 Extensiones: Tarifas lineales óptimas en dos partes 528 517 CAPÍTULO 15 Competencia imperfecta ..........................................................................................................................531 Decisiones a corto plazo: Precios y producción 531 Modelo de Bertrand 533 Modelo de Cournot 534 Restricciones de capacidad 540 Diferenciación de productos 541 Colusión tácita 547 Decisiones a largo plazo: Inversión, entrada y salida 551 Disuasión estratégica de la entrada 557 Señalamiento 559 ¿Que entren cuántas empresas? 562 Innovación 566 Resumen 568 Problemas 569 Sugerencias de lecturas adicionales 572 Extensiones: Sustitutos y complementos estratégicos 573 PARTE SIETE Determinación de precios en mercados de insumos 579 CAPÍTULO 16 Mercados de trabajo.................................................................................................................................581 Asignación de tiempo 581 Análisis matemático de la oferta de trabajo 584 Curva de oferta de trabajo del mercado 588 Equilibrio del mercado de trabajo 589 Variación salarial 591 Monopsonio en el mercado de trabajo 595 Sindicatos 598 Resumen 601 Problemas 601 Sugerencias de lecturas adicionales 605 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Contenido xvii CAPÍTULO 17 Capital y tiempo .........................................................................................................................................607 Capital y tasa de rendimiento 607 Determinación de la tasa de rendimiento 609 Demanda de capital de la empresa 616 Enfoque del valor presente descontado de las decisiones de inversión Determinación de precios de los recursos naturales 623 Resumen 626 Problemas 626 Sugerencias de lecturas adicionales 630 618 APÉNDICE Matemáticas del interés compuesto Valor presente descontado Tiempo continuo 633 PARTE OCHO 631 631 Fallas del mercado 639 CAPÍTULO 18 Información asimétrica ............................................................................................................................641 Contratos complejos como respuesta a la información asimétrica 641 Modelo principal-agente 642 Acciones ocultas 645 Relación dueño-gerente 646 Riesgo moral en los seguros 650 Tipos ocultos 655 Determinación de precios no lineales 656 Selección adversa en los seguros 663 Señalamiento del mercado 670 Subastas 672 Resumen 676 Problemas 676 Sugerencias de lecturas adicionales 679 Extensiones: Determinación de precios no lineales con un continuo de tipos 680 CAPÍTULO 19 Externalidades y bienes públicos ..........................................................................................................685 Definición de las externalidades 685 Externalidades e ineficiencia de asignación 687 Soluciones al problema de las externalidades 691 Atributos de los bienes públicos 694 Bienes públicos y asignación de recursos 696 Determinación de precios de Lindahl de bienes públicos El voto y la asignación de recursos 703 Modelo político simple 705 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 700 8/23 xviii Contenido Mecanismos de votación 708 Resumen 710 Problemas 710 Sugerencias de lecturas adicionales 713 Extensiones: Reducción de la contaminación 714 Respuestas breves a las preguntas 717 Soluciones a los problemas de número non 727 Glosario de términos de uso frecuente 739 Índice analítico 747 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Prefacio La decimoprimera edición de Teoría microeconómica. Principios básicos y ampliaciones continúa la exitosa colaboración entre los autores, iniciada en la décima edición. Esta edición representa un esfuerzo importante por seguir afinando y modernizando nuestro tratamiento de la microeconomía. Pese a los cambios significativos en prácticamente la totalidad de los capítulos, el texto conserva todos los elementos que le han merecido éxito en tantas ediciones. El enfoque básico es enfatizar el desarrollo de la intuición en torno a los modelos económicos, brindando al mismo tiempo a los alumnos las herramientas matemáticas que necesitan para progresar en sus estudios. Este texto también busca facilitar ese enlace, proporcionando muchos ejemplos numéricos, problemas avanzados y extensas explicaciones de implementación empírica, todo lo cual persigue mostrar a los estudiantes cómo se usa hoy la teoría microeconómica. Nuevos adelantos hacen que este campo siga siendo interesante; esperamos que esta edición haya logrado capturar ese interés. Novedades de la decimoprimera edición Hemos examinado de nueva cuenta cada capítulo para confirmar que sigan brindando una cobertura clara y actualizada de todos los temas tratados. Las principales modificaciones consisten en lo siguiente. • Muchos temas del capítulo introductorio sobre matemáticas fueron revisados para adecuarlos a los métodos que suelen encontrarse en la nueva bibliografía económica. • Los capítulos sobre incertidumbre y teoría de juegos se abordan ahora en secciones aparte. Esto hace de la parte referente a elección y demanda una sección más manejable y enfatiza la singular naturaleza de los temas de estrategia e incertidumbre. • El apartado sobre incertidumbre (capítulo 7) se revisó exhaustivamente. Se ampliaron las secciones sobre opciones reales y el valor de la información. Las aplicaciones a la economía financiera y el problema del portafolio se aligeraron y reunieron en las extensiones. • El tratamiento de la teoría de juegos (capítulo 8) se aligeró sustancialmente, brindando el mismo nivel de rigor con mayor brevedad. • Un tratamiento moderno de la bibliografía sobre límites y objetivos de las empresas (teoría de la empresa) se añadió al cuerpo del capítulo 9 y se amplió en las extensiones. • El apartado sobre el equilibrio general (capítulo 13) cambió por completo. En particular, ahora lo usamos para ofrecer a los alumnos una introducción elemental a la notación vectorial. • Añadimos a nuestro análisis de los mercados de trabajo varios temas relacionados, sobre todo, con el capital humano y la búsqueda de empleo. • Se amplió la cobertura de la economía conductual, distribuida en varios capítulos relevantes. Se incluyó también una muestra de problemas de economía conductual. • El problema de los bienes públicos fue rigurosamente analizado mediante la teoría de juegos (capítulo 19). • Se añadieron docenas de problemas. xix Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 xx Prefacio Suplementos del texto* Los materiales auxiliares de esta edición, totalmente revisados, contemplan los siguientes: • El Manual de soluciones* y Banco de pruebas* (escritos por los mismos autores de este libro). El manual de soluciones contiene comentarios y las soluciones a todos los problemas y el banco de pruebas se modificó para incluir preguntas adicionales. Ambos están disponibles en versión electrónica en la página web de esta obra: www.cengage.com/economics/ nicholson • Diapositivas en PowerPoint* para las clases. Estas diapositivas brindan una serie de esquemas muy completos para cada capítulo del texto para su uso en el aula o con el fin de que los alumnos las empleen como recursos de estudio. Estas diapositivas están disponibles en la página en internet del libro: www.cengage.com/economics/nicholson Recursos en línea* South-Western, parte integrante de Cengage Learning, ofrece a estudiantes y profesores una serie de valiosos recursos en línea que constituyen un complemento efectivo de este texto. Economic Applications Al adquirir este nuevo libro de texto se obtiene acceso gratuito a la página InfoApps (InfoTrac y Economic Applications) de South-Western. Esta página incluye un juego de funciones web para estudiantes y maestros de economía, las cuales se actualizan con regularidad: EconNews, EconDebates y EconData. Estos recursos pueden ayudar a los alumnos a comprender mejor los conceptos económicos, analizando reportajes, debates políticos y datos económicos de actualidad. EconApps puede ayudar igualmente a los maestros a diseñar tareas, estudios de caso y ejemplos basados en temas reales. EconDebates ofrece cobertura actual de debates de política económica; incluye una introducción a los asuntos de referencia, ligas a información de contexto y comentarios. EconNews resume artículos recientes de economía y ofrece preguntas para un debate adicional. EconData presenta datos económicos tanto actuales como históricos, además de comentarios, análisis y ejercicios. Los alumnos que adquieran un ejemplar usado podrán conseguir acceso a InfoApps en www. cengagebrain.com. InfoTrac College Edition Al adquirir este nuevo libro de texto también se obtienen cuatro meses de acceso a InfoTrac. Esta potente y accesible base de datos en línea ofrece acceso a artículos íntegros de más de un millar de publicaciones, lo mismo de la prensa en general que de revistas académicas. Los maestros pueden buscar temas y seleccionar lecturas para sus alumnos quienes a su vez pueden encontrar artículos y lecturas para tareas y proyectos por realizar en casa. Esas publicaciones cubren una amplia variedad de temas e incluyen artículos que abordan situaciones de actualidad así como nuevas aportaciones teóricas. InfoTrac College Edition concede a profesores y estudiantes la posibilidad de integrar erudición y aplicaciones de la economía al proceso de aprendizaje. *Este material se encuentra disponible sólo en inglés. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Prefacio xxi Agradecimientos Estamos en deuda con el equipo de Cengage, y en especial con Susan Smart por haber invertido una vez más en esta edición sus habilidades de organización y compromiso. Los editores de Cenveo Publisher Services se esmeraron en dar sentido a nuestros desordenados manuscritos. El diseño de texto de Juli Cook logró cumplir dos metas aparentemente inconciliables: que el texto fuera compacto pero fácil de leer. Cliff Kallemeyn llevó por muy buen camino la edición de la obra; apreciamos en particular la forma en que coordinó los procesos de corrección y producción. Devanand Srinivasan supervisó el armado de páginas y manejó expertamente la sobreabundancia de ecuaciones. Agradecemos a nuestros colegas en Amherst College y Dartmouth College por sus valiosas conversaciones y comprensión. Varios colegas que usaron este libro en sus cursos nos hicieron detalladas sugerencias de ajuste. También nos beneficiamos de la reacción de generaciones de estudiantes que han usado el libro en nuestros propios cursos de microeconomía. A lo largo de los años los estudiantes de Amherst: Mark Bruni, Eric Budish, Adrian Dillon, David Macoy, Tatyana Mamut, Anoop Menon, Katie Merrill, Jordan Milev, Doug Norton y Jeff Rodman, y los de Dartmouth: Wills Begor y Glynnis Kearny trabajaron con nosotros en la revisión de diversos capítulos. Walter agradece en especial a su esposa, Susan; luego de haberle brindado su apoyo tan necesario a lo largo de 22 ediciones de sus textos de microeconomía, ella está satisfecha con su éxito pero preocupada por su salud mental. Sus hijos (Kate, David, Tory y Paul) parecen seguir viviendo felices y productivamente a pesar de una severa falta de educación microeconómica. Quizá esto pueda remediarse conforme crezca la siguiente generación (Beth, Sarah, David, Sophia, Abby, Nate y Christopher). Walter espera que al menos ellos se pregunten de qué tratan los libros que les ha dedicado. Esos volúmenes descansan en un librero adecuado en espera de dicha curiosidad. Chris agradece especialmente a su familia —su esposa, Maura Doyle, y sus hijas, Clare, Tess y Meg— por su paciencia durante el proceso de revisión. Maura posee enorme experiencia en el uso de este libro en sus concurridos cursos de microeconomía en Dartmouth College y fue una generosa fuente de sugerencias que se reflejan en esta nueva versión. Quizá nuestra mayor deuda de gratitud sea con los profesores que eligen este texto y quienes comparten una visión similar de cómo debe ser enseñada la microeconomía. Gracias por las sugerencias que maestros y alumnos han compartido con nosotros a lo largo de los años. Los alentamos a seguir enviándonos mensajes electrónicos con sus comentarios sobre el texto ([email protected] o [email protected]). Walter Nicholson, Amherst, Massachusetts Christopher Snyder, Hanover, New Hampshire Julio de 2011 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 PARTE Introducción UNO Capítulo 1 Modelos económicos Capítulo 2 Matemáticas para microeconomía Esta parte contiene dos capítulos. El capítulo 1 examina la filosofía general de la manera en que los economistas elaboran modelos de comportamiento económico. El capítulo 2 estudia algunas de las herramientas matemáticas que se utilizan en la construcción de estos modelos. Las herramientas matemáticas del capítulo 2 se emplearán a lo largo del libro. 1 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO UNO Modelos económicos El objetivo principal de este libro es presentar los modelos más importantes que utilizan los economistas para explicar el comportamiento de consumidores, empresas y mercados. Estos modelos son centrales para el estudio de todas las áreas de la economía. Por consiguiente, es esencial comprender tanto la necesidad de esos modelos como el marco básico que se utiliza para desarrollarlos. El objetivo de este capítulo es iniciar esbozando algunas de las consideraciones conceptuales que determinan la forma en que los economistas estudian prácticamente todas las interrogantes que les interesan. MODELOS TEÓRICOS Una economía moderna es una entidad compleja. Miles de empresas se dedican a la producción de millones de bienes diferentes. Muchos millones de personas trabajan en todo tipo de ocupaciones y toman decisiones sobre cuáles de estos bienes comprar. Usemos como ejemplo los cacahuates o maníes. Los cacahuates deben ser cosechados en el momento justo y ser enviados a sus procesadores quienes los convierten en mantequilla, aceite, turrón de cacahuate y muchos otros manjares. Estos procesadores deben cerciorarse a su vez de que sus productos lleguen a miles de tiendas minoristas en las cantidades adecuadas para satisfacer la demanda. Dado que sería imposible describir en detalle las características de los mercados, incluso de los mercados de cacahuates, los economistas han optado por hacer abstracción de la complejidad de la realidad y desarrollan modelos simples que captan “la esencia”. Así como un mapa es útil, aunque no registre cada casa o tienda, los modelos económicos de, digamos, el mercado de los cacahuates también son útiles aunque no registren hasta el último rasgo de la economía del cacahuate. En este libro estudiaremos los modelos económicos usados con mayor frecuencia. Veremos que, a pesar de que estos modelos hacen abstracciones de las complejidades de la realidad, capturan características esenciales comunes a todas las actividades económicas. El uso de modelos está muy extendido en las ciencias físicas y sociales. En física, la noción de cos estudiar cadas. En química, la idea de un átomo o una molécula cado de la estructura de la materia. A los arquitectos, las maquecios. Los diagramas de cableado les sirven a los reparadores de car problemas. Los modelos de los economistas desempeñan funciones en que las empresas se comportan, así como de la manera en que esos dos grupos interaccio- 3 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 4 Parte 1: Introducción COMPROBACIÓN DE MODELOS ECONÓMICOS Claro que no todos los modelos son “buenos”. Por ejemplo, el modelo geocéntrico del movimiento planetario ideado por Ptolomeo se desechó después porque resultó incapaz de explicar con precisión cómo se mueven los planetas alrededor del Sol. Un propósito importante de la investigación científica es separar los modelos “malos” de los “buenos”. Se han utilizado dos métodos generales para comprobar los modelos económicos: 1) un método directo, que busca establecer la validez de los supuestos básicos en que se funda un modelo, y 2) un método indirecto, que intenta confirmar la validez del modelo, mostrando que un modelo simplificado predice de manera correcta sucesos reales. Para ilustrar las diferencias básicas entre estos dos métodos examinemos de forma breve un modelo que usaremos ampliamente en capítulos posteriores: el de una empresa que intenta maximizar sus beneficios. Modelo de maximización de beneficios El modelo de una empresa que intenta maximizar los beneficios es obviamente una simplificación de la realidad. Ignora las motivaciones personales de los administradores de la empresa y no considera conflictos entre ellos. Supone que los beneficios son el único objetivo relevante de la empresa; otros objetivos posibles, como obtener poder o prestigio, no se tratan como importantes. Asimismo, supone que la empresa tiene información suficiente sobre los costos y la naturaleza de su mercado para descubrir sus opciones de maximización de beneficios. En la realidad es obvio que la mayoría de las empresas no dispone tan fácil de esta información; sin embargo, esas deficiencias del modelo no son necesariamente graves. Ningún modelo puede describir de modo fiel la realidad. La verdadera pregunta es si ese modelo simple merece que se le considere bueno. Prueba de supuestos Una prueba del modelo de una empresa maximizadora de beneficios investiga el supuesto básico de este modelo: ¿es cierto que las empresas buscan beneficios máximos? Algunos economistas han examinado esta pregunta enviando cuestionarios a ejecutivos para que especifiquen los objetivos que persiguen. Los resultados de esos estudios son variados. Las personas de negocios suelen indicar objetivos distintos de los beneficios o afirmar que sólo hacen “lo más que pueden” para aumentar los beneficios, dada su información limitada. Por otra parte, la mayoría de los interrogados menciona un fuerte “interés” en los beneficios y opina que la maximización de los beneficios es un objetivo apropiado. Así, la prueba del modelo de optimización de utilidades que consiste en probar sus supuestos ha proporcionado resultados concluyentes. Prueba de predicciones Algunos economistas, Milton Friedman en particular, niegan que un modelo pueda probarse indagando la “realidad” de sus supuestos.1 Argumentan que todos los modelos teóricos se basan en supuestos “poco realistas”; la naturaleza misma de la teoria de la demanda exige hacer ciertas abstracciones. Estos economistas concluyen que la única manera de determinar la validez de un modelo es ver si es capaz de predecir y explicar sucesos reales. La prueba última de un modelo económico ocurre cuando se le enfrenta con datos de la economía misma. Friedman ofrece una ilustración importante de ese principio. Él pregunta qué tipo de teoría debería usarse para explicar las jugadas que realizarán jugadores expertos de billar. Sostiene que 1 Véase M. Friedman, Essays in Positive Economics (University of Chicago Press, Chicago, 1953), cap. 1. Para una opinión diferente que subraya la importancia de emplear supuestos “realistas”, véase H. A. Simon, “Rational Decision Making in Business Organizations”, American Economic Review, vol. 69, núm. 4 (septiembre de 1979), pp. 493-513. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 1: Modelos económicos 5 las leyes de la velocidad, el impulso y los ángulos de la física teórica serían un modelo adecuado. Los jugadores de billar juegan como si siguieran esas leyes. Sin embargo, la mayoría de los jugadores de billar a quienes se les interrogó sobre si comprenden cabalmente los principios físicos en que se funda el billar sin duda respondieron que no. Aun así, arguye Friedman, las leyes físicas brindan predicciones atinadas y, por tanto, deberían aceptarse como modelos teóricos apropiados de cómo juegan billar los expertos. Por ende, una prueba del modelo de maximización de beneficios se haría prediciendo el comportamiento de empresas reales con base en el supuesto de que estas empresas se comportan como si maximizaran sus beneficios (véase el ejemplo 1.1, más adelante.) Si estas predicciones son razonablemente acordes con la realidad podemos aceptar la hipótesis de maximización de beneficios. No obstante, rechazaríamos el modelo si datos reales parecieran incongruentes con él. De ahí que la prueba última de cualquier teoría sea su capacidad de predecir sucesos reales. Importancia del análisis empírico El principal interés de este libro es la elaboración de modelos teóricos. Pero el objetivo de estos modelos siempre es aprender algo acerca de la realidad. Dado que la inclusión de una larga serie de ejemplos aplicados ampliaría de modo innecesario un libro ya voluminoso,2 las extensiones al final de algunos capítulos intentan ofrecer una transición entre la teoría que se presenta aquí y la forma en que se aplica en estudios empíricos. CARACTERÍSTICAS GENERALES DE LOS MODELOS ECONÓMICOS El número de modelos económicos actualmente en uso es inmenso. Los supuestos específicos utilizados y el grado de detalle provisto varían demasiado, dependiendo del problema de que se trate. Los modelos que se usan para explicar el nivel general de la actividad económica en Estados Unidos, por ejemplo, deben ser mucho más globales y complejos que aquellos que intentan interpretar los precios de las fresas en Arizona. Pese a esta variedad, prácticamente todos los modelos económicos incorporan tres elementos comunes: 1) el supuesto ceteris paribus (“todo lo demás igual”); 2) el supuesto de que los tomadores de decisiones económicas buscan optimizar algo, y 3) una cuidadosa distinción entre cuestiones “positivas” y “normativas”. Puesto que encontraremos estos elementos a lo largo de este libro, puede ser útil describir de antemano la filosofía en que se apoyan. Supuesto ceteris paribus Como en la mayoría de las ciencias los modelos que se emplean en la economía tratan de describir relaciones relativamente simples. Un modelo del mercado del trigo, por ejemplo, podría intentar explicar los precios de ese grano con un número reducido de variables cuantificables como los salarios de los trabajadores agrícolas, la lluvia o el ingreso de los consumidores. Esta parsimonia en la especificación del modelo permite estudiar los precios del trigo en un marco simplificado en el que sea posible saber cómo operan esas fuerzas específicas. Aunque cualquier investigador admitirá que el precio del trigo se ve afectado por muchas fuerzas “externas” (como presencia de plagas en el grano, cambios en el precio de los fertilizantes o los tractores, o cambios en el comportamiento de los consumidores respecto a la ingesta de pan), estas otras fuerzas se mantienen constantes en la construcción del modelo. Es importante advertir que los economistas no suponen que ningún otro factor afecte los precios del trigo; al contrario, dan por sentado que esas otras 2 Para un texto de nivel intermedio con una amplia serie de aplicaciones reales, véase W. Nicholson y C. Snyder, Intermediate Microeconomics and Its Application, 11ª ed. (Thomson/Southwestern, Mason OH, 2010). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 6 Parte 1: Introducción variables se mantienen sin cambios durante el periodo de estudio. Esto permite examinar en un marco simplificado el efecto de unas cuantas fuerzas. Tales supuestos ceteris paribus (“todo lo demás igual”) se utilizan en todos los modelos económicos. El uso del supuesto ceteris paribus plantea algunas dificultades para la comprobación de modelos económicos a partir de datos reales. En otras ciencias estos problemas quizá no sean tan severos, dada la posibilidad de hacer experimentos controlados. Por ejemplo, un físico interesado en probar un modelo de la fuerza de gravedad tal vez no lo haga arrojando objetos desde el Empire State. Experimentos realizados de ese modo estarían sujetos a demasiadas fuerzas extrañas (como corrientes de viento, partículas en el aire y variaciones de temperatura) como para permitir una prueba precisa de la teoría. Más bien el físico haría experimentos en un laboratorio, utilizando un vacío parcial en el que la mayoría de las fuerzas adicionales puedan controlarse o eliminarse. De esta forma, la teoría podría comprobarse en un marco simple sin considerar las demás fuerzas que en el mundo real afectan la caída de los cuerpos. Con notables excepciones los economistas no han podido llevar a cabo experimentos controlados para probar sus modelos. En cambio, al verificar sus teorías se han visto obligados a depender de varios métodos estadísticos para controlar otras fuerzas. Aunque en principio estos métodos estadísticos son tan válidos como los métodos de los experimentos controlados que usan otros científicos, en la práctica plantean varias cuestiones espinosas. Por esta razón las limitaciones y el significado preciso en la economía del supuesto ceteris paribus están sujetos a mayor controversia que en las ciencias de laboratorio. Estructura de los modelos económicos La mayoría de los modelos económicos en este libro tiene una estructura matemática. Destacan las relaciones entre factores que afectan las decisiones de familias y empresas, y los resultados de esas decisiones. Los economistas tienden a usar diferentes nombres para estos dos tipos de factores (o en términos matemáticos, variables). Las variables fuera del control de quienes toman las decisiones se llaman variables exógenas. Estas variables son la entrada de los modelos económicos. Por ejemplo, en la teoría del consumo solemos tratar a los individuos como seguidores de precios. Los precios de los bienes se determinan fuera de nuestros modelos de comportamiento del consumidor, y queremos estudiar cómo se ajustan los consumidores a ellos. Los resultados de esas decisiones (como la cantidad de cada bien que compra un consumidor) son variables endógenas. Estas variables se determinan dentro de nuestros modelos. Esta distinción se representa de forma esquemática en la figura 1.1. Aunque los modelos desarrollados por los economistas pueden ser complicados, todos tienen esta estructura básica. Una buena manera de comenzar a estudiar un modelo particular es identificando precisamente cómo encaja en este marco. La distinción entre variables exógenas y endógenas se aclarará a medida que exploremos varios modelos económicos. Acertar qué variables se determinan fuera de un modelo particular y cuáles dentro de él puede ser confuso; así, trataremos de recordártelo conforme avancemos. Esta distinción entre variables exógenas y endógenas también es útil para comprender la forma en que el supuesto ceteris paribus se incorpora a los modelos económicos. En la mayoría de los casos vamos a querer estudiar cómo cambian los resultados de nuestros modelos cuando una de las variables exógenas cambia. Es posible, incluso probable, que el cambio en esta variable altere todos los resultados calculados a partir del modelo. Por ejemplo, como veremos, es probable que el cambio en el precio de un bien provoque que un individuo modifique las cantidades de prácticamente todos los bienes que compra. Examinar todas estas respuestas es justo el motivo de que los economistas hagan modelos. El supuesto ceteris paribus se cumple cambiando sólo una variable exógena y manteniendo constantes todas las demás. Si se quieren estudiar los efectos de una modificación en el precio de la gasolina sobre las compras de una familia, en el modelo se cambiará ese precio pero no los precios de otros bienes (y, en algunos casos, tampoco el ingreso del individuo). Estudiar el efecto ceteris paribus de un incremento en el precio de la gasolina significa mantener constantes los demás precios. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 1: Modelos económicos FIGURA 1.1 Estructura de un modelo microeconómico representativo. 7 Los valores de las variables exógenas son las entradas de la mayoría de los modelos económicos. Las salidas (resultados) del modelo son los valores de las variables endógenas. VARIABLES EXÓGENAS Familias: precios de los bienes Empresas: precios de los insumos y de producción MODELO ECONÓMICO Familias: maximización de la utilidad Empresas: maximización de los beneficios VARIABLES ENDÓGENAS Familias: cantidades compradas Empresas: bienes producidos, insumos contratados Supuestos de optimización Muchos modelos económicos parten del supuesto de que los actores económicos estudiados persiguen de modo racional un objetivo. Ya examinamos brevemente un supuesto de esa clase al investigar la noción de que las empresas maximizan sus beneficios. El ejemplo 1.1 muestra cómo puede utilizarse ese modelo para hacer predicciones comprobables. Otros ejemplos que se hallarán en este libro incluyen aquellos en que los consumidores maximizan su bienestar (utilidad), las empresas minimizan costos y los órganos reguladores gubernamentales intentan maximizar el bienestar público. Aunque todos esos supuestos son poco realistas (como demostraremos) se les acepta ampliamente como punto de partida para el desarrollo de modelos económicos. Al parecer, esta aceptación tiene dos razones. Primero, los supuestos de optimización son útiles para generar modelos precisos y con solución, principalmente porque tales modelos pueden valerse de diversas técnicas matemáticas adecuadas para problemas de optimización. Muchas de estas técnicas, junto con la lógica que las sustenta, se estudiarán en el capítulo 2. Una segunda razón de la popularidad de los modelos de optimización concierne a su aparente validez empírica. Como indicarán algunas de nuestras extensiones, dichos modelos parecen ser muy apropiados para explicar la realidad. En general, entonces, los modelos de optimización han terminado por ocupar una posición destacada en la teoría económica moderna. EJEMPLO 1.1 Maximización de beneficios La hipótesis de maximización de beneficios es una ilustración útil de cómo pueden usarse los supuestos de optimización para generar proposiciones empíricamente comprobables sobre el comportamiento económico. Supongamos que una empresa puede vender toda la producción que desee a un precio p por unidad, y que el costo total de producción, C, depende de la cantidad producida, q. Así, los beneficios están dados por beneficios pq Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 C(q). (1.1) 8/23 8 Parte 1: Introducción La maximización de los beneficios consiste en hallar el valor de q, que maximiza la expresión de los beneficios en la ecuación 1.1. Este es un problema simple de cálculo. Diferenciar la ecuación 1.1 e igualar a 0 esa derivada da la siguiente condición de primer orden para un máximo: dp p dq C (q) 0 o p C (q). (1.2) Es decir, el nivel de producción de maximización de beneficios (q∗) se determina seleccionando el nivel de producción en que el precio es igual al costo marginal, C(q). Este resultado debe parecerte conocido debido al curso de introducción a la economía. Nótese que en esta derivación el precio de producción de la empresa se trata como una constante porque la empresa es seguidora de precios. Es decir, el precio es una variable exógena en este modelo. La ecuación 1.2 es apenas la condición de primer orden para un máximo. Tomar en cuenta la condición de segundo orden puede ayudarnos a derivar una implicación comprobable de este modelo. La condición de segundo orden para un máximo es que en q∗ debe ocurrir que: d 2p dq 2 C (q) < 0 o C (q ) > 0. (1.3) Es decir, el costo marginal debe aumentar en q∗ para que este sea un punto verdadero de beneficios máximos. Nuestro modelo puede usarse ahora para “predecir” cómo reaccionará una empresa a un cambio de precio. Para hacerlo, diferenciamos la ecuación 1.2 respecto al precio (p), suponiendo que la empresa continúa eligiendo un nivel de maximización de beneficios de q: d[p C (q ) 0 1 dp C (q dq 0. dp (1.4) Al reordenar un poco los términos resulta que: dq 1 > 0. dp C (q ) (1.5) Aquí la desigualdad final refleja de nuevo el hecho de que el costo marginal debe aumentar en q∗ para que este punto sea un máximo verdadero. Esta es, así, una de las proposiciones comprobables de la hipótesis de maximización de los beneficios: si lo demás no cambia, una empresa seguidora de precios debería responder a un incremento de precio aumentando su producción. Si, por el contrario, las empresas responden a incrementos de precio reduciendo su producción, debe haber un error en nuestro modelo. Aunque este es un modelo simple, refleja la forma en que procederemos a lo largo de gran parte de este libro. Específicamente, el hecho de que la implicación primaria del modelo se derive mediante cálculo y consista en mostrar qué signo debe tener una derivada, es el tipo de resultado que veremos muchas veces. Adviértase que en este modelo sólo hay una variable endógena: q, la cantidad que la empresa decide producir. De igual forma, sólo hay una variable exógena: p, el precio del producto que la empresa da por sentado. Nuestro modelo hace una predicción específica sobre la forma en que los cambios en esta variable exógena afectan la decisión de producción de la empresa. PREGUNTAS: En términos generales, ¿cómo cambiarían las implicaciones de este modelo, si el precio que una empresa obtiene por su producción estuviera en función de cuánto vendió? Es decir, ¿cómo operaría el modelo si se abandonara el supuesto de seguimiento de precios? Distinción positivo-normativo Una última característica de la mayoría de los modelos económicos es el intento de diferenciar cuidadosamente entre cuestiones “positivas” y “normativas”. Hasta aquí nos hemos ocupado sobre todo de teorías económicas positivas. Estas teorías toman la realidad como objeto de estudio, tratando de explicar los fenómenos económicos observados. La economía positiva busca determinar la forma en que los recursos se asignan de hecho en una economía. Un tanto diferente en el uso de la teoría económica es el análisis normativo, adoptando una postura definida sobre lo Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 1: Modelos económicos 9 que debería hacerse. Bajo el rubro del análisis normativo los economistas tienen mucho que decir sobre cómo deberían asignarse los recursos. Por ejemplo, un economista dedicado al análisis positivo podría investigar cómo se determinan los precios en la economía de atención a la salud de Estados Unidos. Asimismo, este economista podría desear medir los costos y beneficios de destinar aun más recursos a la atención de la salud ofreciendo, por ejemplo, seguro médico subsidiado por el gobierno. Pero cuando argumenta específicamente que debería adoptarse ese plan de seguros, el análisis se vuelve normativo. Algunos economistas creen que el único análisis propiamente económico es el positivo. Estableciendo una analogía con las ciencias físicas, éstas sostienen que la economía “científica” sólo debe ocuparse de la descripción (y, quizá, la predicción) de sucesos económicos reales. Adoptar posiciones políticas y abogar por intereses especiales se juzga ajeno a la competencia de un economista como tal. Claro que, como cualquier otro ciudadano, un economista es libre de expresar sus opiniones políticas, pero al hacerlo actúa como ciudadano, no como economista. A otros economistas, sin embargo, la distinción positivo-normativo les parece artificial. Creen que el estudio de la economía involucra necesariamente las opiniones de los investigadores sobre ética, moral y justicia. Según estos economistas, en dichas circunstancias es inútil buscar “objetividad” científica. Pese a cierta ambigüedad este libro intenta adoptar un tono positivo, dejando las consideraciones normativas para decisión de cada quien. DESARROLLO DE LA TEORÍA ECONÓMICA DEL VALOR Puesto que la actividad económica es una característica central de todas las sociedades sorprende que estas actividades no se hayan estudiado en detalle hasta fecha muy reciente. A los fenómenos económicos se les trataba casi invariablemente como un aspecto básico de la conducta humana no lo bastante interesante para merecer atención específica. Es cierto, desde luego, que los individuos siempre han estudiado las actividades económicas con la mira puesta en la obtención de algún tipo de beneficio personal. Los comerciantes romanos no eran ajenos a la obtención de beneficios en sus transacciones. Pero las investigaciones sobre la naturaleza básica de esas actividades no empezaron en serio hasta el siglo xviii.3 Dado que este libro trata de la teoría económica en su estado actual más que de la historia del pensamiento económico, nuestro análisis de la evolución de la teoría económica será breve. Se examinará en su marco histórico sólo un área del estudio económico: la teoría del valor. Reflexiones económicas iniciales sobre el valor La teoría del valor se refiere a los determinantes del “valor” de una mercancía. Este tema está en el centro de la teoría microeconómica moderna y se vincula de forma estrecha con el problema económico fundamental de asignar recursos escasos a diferentes usos. El punto de partida lógico es una definición del término “valor”. Por desgracia, el significado de esta palabra no ha sido sistemático durante el desarrollo de este tema. Hoy “valor” es sinónimo del precio de una mercancía.4 Los primeros filósofos-economistas, sin embargo, hacían una distinción entre el precio de mercado de una mercancía y su valor. El término valor se concebía entonces, en cierto sentido, como sinónimo de “importancia”, “esencia” o (a veces) “santidad”. Dado que “precio” y “valor” eran conceptos aparte, podían diferir, y la mayoría de los primeros análisis económicos se centraron en esas divergencias. Por ejemplo, santo Tomás de Aquino creía que el valor estaba divinamente determinado. Como los precios los fijaban seres humanos, era posible que el precio de una 3 Para un tratamiento detallado del pensamiento económico temprano, véase la obra clásica de J. A. Schumpeter, History of Economic Analysis (Oxford University Press, Nueva York, 1954), parte II, capítulos 1-3. 4 Esto no es del todo cierto cuando implica “externalidades”, caso en que debe hacerse una distinción entre valor privado y social (véase el capítulo 19). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 10 Parte 1: Introducción mercancía difiriera de su valor. A una persona acusada de cobrar un precio superior al valor de un bien se le culpaba de imponer un precio “injusto”. Aquino creía que, en la mayoría de los casos, la tasa de interés “justa” era cero. Todo prestamista que exigía un pago por el uso de dinero imponía un precio injusto y podía ser procesado (y en ocasiones así ocurrió) por los funcionarios eclesiásticos. Fundación de la economía moderna A fines del siglo xviii los filósofos comenzaron a adoptar un enfoque más científico de los asuntos económicos. La publicación, en 1776, de The Wealth of Nations (La riqueza de las naciones) de Adam Smith (1723-1790) es considerada, en general, el inicio de la economía moderna. En esa vasta y exhaustiva obra Smith sentó las bases de la reflexión sobre las fuerzas del mercado en forma ordenada y sistemática. Aun así él y sus sucesores inmediatos, como David Ricardo (17721823), siguieron distinguiendo entre valor y precio. Para Smith, por ejemplo, el valor de una mercancía aludía a su “valor de uso”, mientras que el precio representaba su “valor de cambio”. Esta distinción entre ambos conceptos se ilustró con la famosa paradoja del agua y el diamante. El agua, que posee obviamente gran valor de uso, tiene poco valor de cambio (precio bajo); los diamantes son de escasa utilidad práctica, pero tienen gran valor de cambio. Esta paradoja a la que se enfrentaron los primeros economistas se deriva de la observación de que algunos objetos útiles tienen un precio bajo, en tanto que ciertos objetos no esenciales tienen un precio alto. Teoría del valor de cambio del trabajo Ni Smith ni Ricardo resolvieron de modo satisfactorio la paradoja del agua y el diamante. El concepto de valor de uso se cedió al debate de los filósofos mientras los economistas dirigían su atención a explicar las determinantes del valor de cambio (es decir, los precios relativos). Una obvia explicación posible es que el valor de cambio de los bienes está determinado por lo que cuesta producirlos. El costo de producción está principalmente sujeto a la influencia del costo de la mano de obra —o al menos así era en tiempos de Smith y Ricardo—, de manera que faltaba un solo paso para adoptar una teoría del valor-trabajo. Por ejemplo, parafraseando un ejemplo de Smith, si cazar un venado implica el doble de horas de trabajo que cazar un castor, un venado debería intercambiarse por dos castores. En otras palabras, el precio de un venado debería ser el doble del de un castor. De igual manera, los diamantes son relativamente costosos porque su producción requiere un insumo sustancial de trabajo, mientras que el agua se consigue gratis. A los estudiantes con un conocimiento incluso superficial de lo que ahora llamamos la ley de la oferta y la demanda, la explicación de Smith y Ricardo debe parecerles incompleta. ¿Estos autores no reconocieron los efectos de la demanda en el precio? La respuesta a esta pregunta es sí y no. Observaron periodos de precios relativos que subían y bajaban rápidamente, y atribuyeron esos cambios a modificaciones en la demanda. Sin embargo, los consideraron anormalidades que sólo producían una divergencia temporal entre el precio de mercado y el valor del trabajo. Como no desarrollaron una teoría del valor de uso se resistían a conceder a la demanda algo más que un papel fugaz en la determinación de los precios relativos. Suponían más bien que el valor de cambio a largo plazo sólo estaba determinado por los costos laborales de producción. Revolución marginalista Entre 1850 y 1880 los economistas repararon cada vez más en que para elaborar una alternativa adecuada de la teoría del valor-trabajo tenían que concebir una teoría del valor de uso. En la década de 1870 varios de ellos descubrieron que lo que determina el valor de cambio de una mercancía no es su utilidad total, sino la utilidad de la última unidad consumida. Por ejemplo, el agua es sin duda, útil: es necesaria para todas las formas de vida. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 1: Modelos económicos FIGURA 1.2 Intersección ofertademanda de Marshall. 11 Marshall mostró que la demanda y la oferta interactúan entre sí para determinar el precio de equilibrio (p*) y la cantidad (q*) que se comercializará en el mercado. Concluyó que no puede decirse que la demanda o la oferta determinen por sí solas el precio ni que, por tanto, los costos o la utilidad para los compradores determinen por sí solos el valor de cambio. Precio D S p* D S q* Cantidad por periodo Sin embargo, como el agua es relativamente abundante, consumir medio litro más (ceteris paribus) tiene un valor relativamente bajo para la gente. Estos “marginalistas” redefinieron el concepto de valor de uso desde una idea de utilidad general hasta otra de utilidad marginal o incremental: la utilidad de una unidad adicional de una mercancía. El concepto de demanda de una unidad incremental de producción se contrastó entonces con el análisis de Smith y Ricardo sobre los costos de producción para derivar una descripción completa de la determinación de precios.5 Síntesis oferta-demanda de Marshall La formulación más clara de estos principios marginales fue presentada por el economista inglés Alfred Marshall (1842-1924) en sus Principles of Economics (Principios de economía), publicados en 1890. Marshall demostró que demanda y oferta operan simultáneamente para determinar el precio. Como él mismo señaló, así como no puede decirse cuál de las hojas de unas tijeras hace el corte, tampoco puede decirse si es la demanda o la oferta la que determina por sí sola el precio. Este análisis es ilustrado por la famosa intersección de Marshall, que aparece en la figura 1.2. En este diagrama la cantidad de un bien, adquirida por periodo, se indica en el eje horizontal y su precio aparece en el eje vertical. La curva DD representa la cantidad demandada del bien por periodo en cada precio posible. Esta curva es de pendiente negativa para reflejar el principio marginalista de que, al aumentar la cantidad, la gente está dispuesta a pagar menos por la última unidad comprada. Lo que fija el precio de todas las unidades adquiridas es el valor de esta última unidad. La curva SS muestra cómo aumenta el costo (marginal) de producción al incrementarse la producción. Esto refleja el costo creciente de producir una unidad más al aumentar la producción total. En otras palabras, la pendiente ascendente de la curva SS refleja costos marginales crecientes, así como la pendiente descendente DD refleja un valor marginal decreciente. Estas dos curvas se cruzan en p∗, q∗. Este es un punto de equilibrio: tanto compradores como vendedores están satisfechos con la cantidad comerciada y el precio al que se le vende. Si una de las curvas cambiara, el punto de equilibrio pasaría a una nueva ubicación. Así, precio y cantidad están simultáneamente determinados por la operación conjunta de la oferta y la demanda. 5 Ricardo ya había dado un importante primer paso en el análisis marginal en su estudio de la renta. Consideró que al aumentar la producción de maíz se usaría tierra de calidad inferior, lo que causaría un aumento en el precio del maíz. En su argumento reconoció que lo relevante para la fijación del precio es el costo marginal, el costo de producir una unidad adicional. Nótese que mantuvo implícitamente otros insumos constantes al tratar la productividad decreciente de la tierra; es decir, usó una versión del supuesto ceteris paribus. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 12 Parte 1: Introducción EJEMPLO 1.2 Equilibrio oferta-demanda Aunque las presentaciones gráficas son adecuadas para algunos propósitos, los economistas suelen usar representaciones algebraicas de sus modelos tanto para aclarar sus argumentos como para darles más precisión. Como un ejemplo elemental supongamos que queremos estudiar el mercado de los cacahuates y que, con base en el análisis estadístico de datos históricos, concluimos que la cantidad de cacahuates demandada cada semana (q, medida en bushels)6 depende del precio de los cacahuates (p, medido en dólares por bushel), de acuerdo con la ecuación: cantidad demandada qD 1 000 100p. (1.6) Como esta ecuación de qD contiene únicamente la variable independiente p, mantenemos implícitamente constantes todos los demás factores que podrían afectar la demanda de cacahuates. La ecuación 1.6 indica que, de no cambiar nada más, a un precio de $5 por bushel la gente demandará 500 bushels de cacahuates, mientras que a un precio de $4 por bushel, demandará 600 bushels. El coeficiente negativo de p en la ecuación 1.6 refleja el principio marginalista de que un precio menor provocará que la gente compre más cacahuates. Para completar este modelo simple de determinación de precios supongamos que la cantidad de cacahuates ofrecida también depende del precio: cantidad ofrecida qS 125 125p. (1.7) Aquí, el coeficiente positivo del precio refleja asimismo el principio marginal de que un precio más alto ocasionará una oferta mayor, sobre todo porque (como vimos en el ejemplo 1.1) permitirá a las empresas incurrir en costos marginales de producción más altos sin sufrir pérdidas en las unidades adicionales producidas. Determinación del precio de equilibrio. En consecuencia, las ecuaciones 1.6 y 1.7 reflejan nuestro modelo de determinación del precio en el mercado de los cacahuates. Un precio de equilibrio puede hallarse al igualar la cantidad demandada con la cantidad ofrecida: qD qS (1.8) 1 000 100p 125 125p (1.9) 225p 1 125 (1.10) p∗ 5. (1.11) o o así, A un precio de $5 por bushel este mercado está en equilibrio: en ese precio, la gente querrá adquirir 500 bushels, justo lo que los productores de cacahuates están dispuestos a ofrecer. Este equilibrio se representa de manera gráfica como la intersección de D y S en la figura 1.3. Un modelo más general. Para ilustrar cómo podría usarse este modelo de oferta-demanda, adoptemos una notación más general. Supongamos ahora que las funciones de demanda y oferta están dadas por: qD a bp y qS c dp (1.12) donde a y c son constantes que pueden usarse para modificar las curvas de demanda y oferta, respectivamente; y b (0) y d ( 0) representan reacciones de demandantes y ofertantes al precio. El equilibrio en este mercado requiere: qD qS o (1.13) a bp c dp. 7 Así, el precio de equilibrio está dado por: a c . p (1.14) d b 6 El bushel es una unidad de medida inglesa de capacidad (masa o volumen) para mercancía sólida. Se utiliza en el comercio de granos, harinas y otros productos similares. En Reino Unido un bushel tiene 4 pecks o 32 quarts, y equivale a 1.03205 del bushel de los Estados Unidos, que a su vez equivale a 0.35238 hectolitros. 7 La ecuación 1.14 también se conoce como la “forma reducida” del modelo estructural de oferta-demanda de las ecuaciones 1.12 y 1.13. Indica que el valor de equilibrio de la variable endógena p sólo depende en definitiva de los factores exógenos en el modelo (a y c) y de los parámetros de comportamiento b y d. Una ecuación similar puede calcularse respecto de la cantidad de equilibrio. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 1: Modelos económicos FIGURA 1.3 Equilibrios cambiantes de oferta-demanda El equilibrio de oferta-demanda inicial es ilustrado por la intersección de D y S (p* 5, q* 500). Cuando la demanda se desplaza a qD 1 450 100p (denotado por D), el equilibrio cambia a p* 7, q* 750. Precio ($) D′ 14.5 S D 10 7 5 S 0 500 750 D D′ 1 000 1 450 Cantidad por periodo (en bushels) Nótese que en nuestro ejemplo previo a 1 000, b 100, c 125 y d 125; por tanto: p 1 000 125 1 125 5. 125 100 225 (1.15) Con esta formulación más general, sin embargo, podemos plantear preguntas sobre cómo podría cambiar el precio de equilibrio si la curva de demanda o de oferta cambiara. Por ejemplo, la diferenciación de la ecuación 1.14 muestra que: dp 1 0, da d b dp 1 0. dc d b (1.16) Es decir, un aumento en la demanda (un aumento en a) incrementa el precio de equilibrio, mientras que un aumento en la oferta (un aumento en c) reduce el precio. Esto es justo lo que mostraría un análisis gráfico de curvas de oferta y demanda. Por ejemplo, la figura 1.3 indica que cuando la constante, a, en la ecuación de demanda aumenta a 1 450, el precio de equilibrio aumenta a p∗ 7 [ (1 450 125)/225]. PREGUNTAS: ¿Cómo podrías usar la ecuación 1.16 para “predecir” en qué forma cada incremento unitario en la constante exógena a afecta la variable endógena p? ¿Esta ecuación predice correctamente el incremento en p∗, cuando la constante a aumenta de 1 000 a 1 450? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 13 8/23 14 Parte 1: Introducción Resolución de la paradoja El modelo de Marshall resuelve la paradoja del agua y el diamante. Los precios reflejan tanto la evaluación marginal que los demandantes hacen de los bienes, como el costo marginal de producir esos bienes. Visto de esta manera no hay paradoja. El agua es de bajo precio porque tiene un valor marginal bajo y un bajo costo marginal de producción. En cambio, los diamantes son de alto precio porque tienen un valor marginal alto (la gente está dispuesta a pagar mucho por uno más) y un alto costo marginal de producción. Este modelo básico de oferta y demanda está en la base de gran parte del análisis que se presentará en este libro. Modelos de equilibrio general Aunque el modelo de Marshall es un instrumento sumamente útil y versátil, constituye un modelo de equilibrio parcial, ya que sólo considera un mercado a la vez. En algunas cuestiones esta reducción de la perspectiva aporta valiosas ideas y sencillez analítica. Pero en cuestiones más amplias un punto de vista tan estrecho puede impedir que se descubran relaciones importantes entre mercados. Para responder preguntas más generales debemos disponer de un modelo de toda la economía que refleje de manera conveniente las relaciones entre varios mercados y agentes económicos. El economista francés Leon Walras (1831-1910), partiendo de una larga tradición europea en dicho análisis, sentó las bases de la investigación moderna en esas grandes preguntas. Su método de representar la economía con gran número de ecuaciones simultáneas es la base para comprender las interrelaciones implícitas en el análisis del equilibrio general. Walras reconoció que no se puede hablar de un mercado en aislamiento; se requiere un modelo que permita que los efectos del cambio en un mercado sean seguidos en otros. Supongamos, por ejemplo, que la demanda de cacahuates aumenta. Esto provocaría un incremento en su precio. El análisis marshalliano intentaría conocer la magnitud de este incremento, examinando las condiciones de oferta y demanda en el mercado de los cacahuates. El análisis del equilibrio general no sólo examinaría ese mercado, sino también las repercusiones en otros. Un aumento en el precio de los cacahuates incrementaría los costos para los productores de crema de cacahuate, lo que a su vez afectaría la curva de oferta de este producto. De igual manera, un precio más alto de los cacahuates podría significar precios de la tierra más altos para los agricultores, lo que afectaría las curvas de demanda de todos los productos que estos compran. Las curvas de demanda de automóviles, muebles y viajes a Europa cambiarían, lo cual podría generar ingresos adicionales para los proveedores de dichos productos. En consecuencia, los efectos del aumento inicial en la demanda de cacahuates se extenderían a la larga a toda la economía. El análisis del equilibrio general trata de desarrollar modelos que nos permitan examinar tales efectos en un marco simplificado. Varios modelos de este tipo se describirán en el capítulo 13. Frontera de posibilidades de producción Aquí presentaremos brevemente algunas ideas del equilibrio general, usando otro gráfico que debes recordar de tu curso de introducción a la economía: la frontera de posibilidades de producción. Este gráfico muestra las diversas cantidades de dos bienes que una economía puede producir usando sus recursos disponibles durante cierto periodo (una semana, digamos). Dado que la frontera de posibilidades de producción muestra dos bienes, no uno solo como el modelo de Marshall, sirve como componente básico de modelos de equilibrio general. La figura 1.4 muestra la frontera de posibilidades de producción de dos bienes: alimentos y ropa; e ilustra la oferta de estos bienes exhibiendo las combinaciones que es posible producir con los recursos de esa economía. Por ejemplo, podrían producirse 4 kg de alimentos y 3 unidades de ropa, o 1 kg de alimentos y 12 unidades de ropa, aunque también serían posibles muchas otras combinaciones de alimentos y ropa. La frontera de posibilidades de producción las muestra todas. Las combinaciones de alimentos y ropa fuera de esta frontera son imposibles de producir porque Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 1: Modelos económicos FIGURA 1.4 Frontera de posibilidades de producción. 15 La frontera de posibilidades de producción muestra las diferentes combinaciones de dos bienes que pueden producirse a partir de cierta cantidad de recursos escasos. También muestra el costo de oportunidad de producir mayor cantidad de un bien en relación con la cantidad del otro bien que, en consecuencia, no se puede producir. El costo de oportunidad en dos niveles diferentes de producción de ropa puede verse comparando los puntos A y B. Cantidad de alimentos por semana Costo de oportunidad de la ropa = 14 kg de alimentos A 10 9.5 Costo de oportunidad de la ropa = 1 kg de alimentos B 4 2 0 3 4 12 13 Cantidad de ropa por semana no se dispone de recursos suficientes para ello. La frontera de posibilidades de producción nos recuerda la realidad económica básica de que los recursos son escasos: no hay suficientes recursos disponibles para producir todo lo que podríamos querer de cada bien. Esta escasez significa que debemos decidir cuánto producir de cada bien. La figura 1.4 deja en claro que toda decisión tiene sus costos. Por ejemplo, si esta economía produce 4 kg de alimentos y 3 unidades de ropa en el punto A, producir 1 unidad más de ropa “costaría” ¼ kg de alimentos; aumentar la producción de ropa en 1 unidad significa que la producción de alimentos tendría que reducirse ¼ kg. Así, el costo de oportunidad de 1 unidad de ropa en el punto A es ¼ kg de alimentos. Por otro lado, si la economía produce en un principio 2 kg de alimentos y 12 unidades de ropa en el punto B, costaría 1 kg de alimentos producir 1 unidad más de ropa. El costo de oportunidad de 1 unidad más de ropa en el punto B ha aumentado a 1 kg de alimentos. Como en el punto B se producen más unidades de ropa que en el punto A, las ideas de costos incrementales crecientes de Ricardo y Marshall sugieren que el costo de oportunidad de una unidad adicional de ropa será más alto en el punto B que en el punto A. Este efecto se muestra en la figura 1.4. La frontera de posibilidades de producción brinda dos ideas de equilibrio general que no están claras en el modelo de oferta y demanda de un solo mercado de Marshall. Primero, el gráfico indica que producir mayor cantidad de un bien significa producir menos de otro porque los recursos son escasos. Los economistas emplean a menudo (¡quizá demasiado a menudo!) la expresión “ninguna comida es gratis” para explicar que cada acción económica tiene costos de oportunidad. Segundo, la frontera de posibilidades de producción señala que los costos de oportunidad dependen de cuánto se produce de cada bien. Es como una curva de oferta de dos bienes: muestra el costo de oportunidad de producir mayor cantidad de un bien a partir de la disminución en la cantidad del segundo por la escasez de recursos. Así, la frontera de posibilidades de Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 16 Parte 1: Introducción producción es un instrumento particularmente útil para estudiar varios mercados al mismo tiempo. EJEMPLO 1.3 Frontera de posibilidades de producción e ineficiencia económica Los modelos de equilibrio general son herramientas útiles para evaluar la eficiencia de diversos sectores económicos. Como veremos en el capítulo 13 estos modelos se han usado para evaluar una amplia variedad de políticas, como acuerdos comerciales, estructuras tributarias y reglamentos ambientales. En este ejemplo exploraremos la idea de la eficiencia en su forma más elemental. Supóngase que una economía produce dos bienes, x y y, usando el trabajo como único insumo. La función de producción del bien x es x lx0.5 (donde lx es la cantidad de trabajo usada en la producción de x), y la función de producción del bien y es y 2ly0.5. El trabajo total disponible está limitado por lx ly 200. La elaboración de la frontera de posibilidades de producción en esta economía es muy simple: lx ly x2 0.25y2 (1.17) 200 donde la igualdad se mantiene con exactitud si la economía debe producir lo más posible (motivo por el cual, después de todo, este recurso se llama “frontera”). La ecuación 1.17 indica que, en este caso, la frontera tiene la forma de un cuarto de elipse; su concavidad se deriva de los rendimientos decrecientes exhibidos por cada función de producción. Costo de oportunidad. Suponiendo que esta economía está en la frontera, el costo de oportunidad del bien y en términos del bien x puede derivarse despejando y, en esta forma: y2 800 4x2 o y 1800 4x2 [800 4x2]0.5 (1.18) y diferenciando después esta expresión: dy 0.5[800 dx 4x2 0.5 8x) 4x . y (1.19) Supongamos, por ejemplo, que el trabajo se asigna en partes iguales entre los dos bienes. Así, x 10, y 20 y dy/dx 4(10)/20 2. Con esta asignación de trabajo cada incremento unitario en la producción de x requeriría una reducción de 2 unidades en y. Esto puede comprobarse considerando una asignación alternativa, lx 101 y ly 99. Ahora la producción es x 10.05 y y 19.9. El traslado a esta otra asignación resultaría en: y (19.9 20) 0.1 x (10.05 10) 0.05 2, justo lo que se derivó del método de cálculo. Concavidad. La ecuación 1.19 ilustra claramente la concavidad de la frontera de posibilidades de producción. La pendiente de la frontera se vuelve más pronunciada (más negativa) al aumentar la producción de x y disminuir la de y. Por ejemplo, si el trabajo se asigna de tal manera que lx 144 y ly 56, la producción es x 12 y y ≈ 15, de modo que dy/dx 4(12)/15 3.2. Al aumentar la producción de x, el costo de oportunidad de una unidad más de x aumenta de 2 a 3.2 unidades de y. Ineficiencia. Si una economía opera dentro de su frontera de posibilidades de producción, lo hace en forma ineficiente. Rebasar la frontera podría incrementar la producción de ambos bienes. En este libro exploraremos muchas razones de tal ineficiencia. Éstas suelen derivarse de que un mercado no se desempeñe de forma correcta. Para los efectos de nuestro ejemplo supongamos que el mercado de trabajo de esta economía no funciona bien y que 20 trabajadores están permanentemente desempleados. Ahora la frontera de posibilidades de producción se vuelve: x2 0.25y2 180, Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (1.20) 8/23 Capítulo 1: Modelos económicos 17 y las combinaciones de producción previamente descritas ya no son factibles. Por ejemplo, si x 10, la producción de y es ahora y ≈ 17.9. La pérdida de aproximadamente 2.1 unidades de y es una medida del costo de la ineficiencia del mercado de trabajo. O bien, si la oferta de trabajo de 180 se asignara en partes iguales entre la producción de los dos bienes, tendríamos x ≈ 9.5 y y ≈ 19, y la ineficiencia aparecería en la producción de ambos bienes: se podría producir mayor cantidad de ambos si se resolviera la ineficiencia del mercado de trabajo. PREGUNTAS: ¿Cómo se mediría el costo de ineficiencia de las imperfecciones del mercado de trabajo en términos únicamente de la producción de x en este modelo? ¿Cómo se mediría en términos sólo de la producción de y? ¿Qué tendrías que saber para asignar un solo número al costo de eficiencia de la imperfección cuando el trabajo se asigna de modo equitativo a ambos bienes? Economía de bienestar Además de usar modelos económicos para examinar cuestiones positivas sobre cómo opera la economía, las herramientas usadas en el análisis del equilibrio general también se han aplicado al estudio de cuestiones normativas sobre las propiedades de bienestar de varios ordenamientos económicos. Aunque estas cuestiones fueron de enorme interés para los grandes economistas de los siglos xviii y xix (como Smith, Ricardo, Marx y Marshall), quizá los avances más significativos en estos estudio los han logrado el economista británico Francis Y. Edgeworth (1848-1926) y el italiano Vilfredo Pareto (1848-1923) a principios del siglo xx. Estos economistas ofrecieron una definición precisa del concepto de “eficiencia económica” y ayudaron a mostrar las condiciones en las cuales los mercados podrán alcanzar esa meta. Al esclarecer la relación entre los precios derivados de la asignación de recursos dieron cierto sustento a la idea, originalmente enunciada por Adam Smith, de que los mercados que funcionan de manera apropiada brindan una “mano invisible” que ayuda a la eficiente asignación de recursos. En secciones posteriores de este libro se abordan algunas de estas cuestiones de bienestar. EVOLUCIÓN MODERNA La investigación económica se extendió rápidamente en los años que siguieron a la segunda Guerra Mundial. Uno de los principales objetivos de este libro es resumir gran parte de dicha investigación. Al ilustrar cómo los economistas han intentado desarrollar modelos para explicar aspectos más complejos del comportamiento de la vida económica, este libro pretende ayudarte a identificar algunas de las preguntas que aún esperan respuesta. Fundamentos matemáticos de los modelos económicos Un avance importante de la teoría microeconómica en la posguerra fue la aclaración y la formalización de los supuestos básicos sobre individuos y empresas. El primer hito en este sentido fue la publicación, en 1947, de Foundations of Economic Analysis (Fundamentos del análisis económico) de Paul Samuelson (el primer estadounidense en obtener el Premio Nobel de Economía) quien expone varios modelos de comportamiento optimizador.8 Samuelson demostró la importancia de basar los modelos conductuales en postulados matemáticos detalladamente especificados para que fuera posible aplicar varias técnicas matemáticas de optimización. La eficacia de este enfoque dejó ver con toda claridad que las matemáticas se habían vuelto parte integral de la economía moderna. En el capítulo 2 de este libro se estudiarán algunos de los conceptos matemáticos de uso más frecuente en la microeconomía. 8 Paul A. Samuelson, Foundations of Economic Analysis (Harvard University Press, Cambridge, 1947). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 18 Parte 1: Introducción Nuevas herramientas para el estudio de mercados Una segunda característica que se ha incorporado en este libro es la presentación de varias nuevas herramientas para explicar los equilibrios del mercado. Entre ellas están las técnicas para describir la determinación de precios en mercados específicos, como los modelos cada vez más sofisticados de los precios de los monopolios o los de relaciones estratégicas entre empresas que hacen uso de la teoría de juegos. También están las herramientas de equilibrio general para explorar de forma simultánea las relaciones entre muchos mercados. Como veremos, todas estas nuevas técnicas contribuyen a ofrecer una representación más completa y realista de cómo operan los mercados. Economía de la incertidumbre y la información Un último avance teórico del periodo de la posguerra fue la incorporación de la incertidumbre y la información imperfecta en los modelos económicos. Algunos de los supuestos básicos para estudiar el comportamiento de la incertidumbre fueron originalmente desarrollados en la década de 1940 en relación con la teoría de juegos. Adelantos posteriores muestran cómo podían usarse estas ideas para explicar por qué los individuos tienden a sentir aversión al riesgo y cómo podrían reunir información para reducir las incertidumbres que enfrentan. Dentro del análisis en este libro en muchas ocasiones se introducirán problemas de incertidumbre e información. Computadoras y análisis empírico Cabe mencionar un último aspecto de la evolución de la microeconomía en la posguerra: el uso creciente de computadoras para analizar datos y elaborar modelos económicos. A medida que las computadoras han adquirido mayor capacidad de manejar grandes cantidades de información y de ejecutar tratamientos matemáticos complejos, la aptitud de los economistas para probar sus teorías ha aumentado drásticamente. Mientras que las generaciones anteriores tenían que conformarse con rudimentarios análisis tabulares o gráficos de datos reales, hoy los economistas disponen de una extensa variedad de técnicas sofisticadas, además de amplios datos microeconómicos con los cuales probar sus modelos. El examen de estas técnicas y de algunas de sus limitaciones rebasa el alcance y el propósito de este libro; sin embargo, las extensiones al final de la mayoría de los capítulos fueron pensadas para empezar a documentarse sobre algunas de esas aplicaciones. Resumen Este capítulo aporta antecedentes de cómo abordan los economistas el estudio de la asignación de recursos. Seguramente ya se conoce gran parte del material analizado aquí, propio del curso de introducción a la economía. En muchos sentidos el estudio de la economía significa adquirir herramientas cada vez más sofisticadas para tratar los mismos problemas básicos. El propósito de este libro (y de la mayoría de los de nivel superior sobre economía) es proporcionar más herramientas de ese tipo. Como punto de partida este capítulo recuerda los siguientes puntos: • La economía es el estudio de cómo se distribuyen los recursos escasos entre diferentes usos. Los economistas intentan desarrollar modelos simples para entender ese proceso. Muchos de estos modelos tienen una base matemática porque el uso de las matemáticas ofrece una simbología precisa para formular los modelos y explorar sus consecuencias. • El modelo económico de uso más común es el de ofertademanda, exhaustivamente desarrollado por Alfred Marshall a fines del siglo xix. Este modelo muestra que los precios observados pueden entenderse como la representación del equilibrio de los costos de producción en que incurren las empresas y la disposición de los demandantes a pagar dichos costos. • El modelo de equilibrio de Marshall es apenas “parcial”; es decir, considera un mercado por vez. Examinar muchos mercados juntos requiere una serie ampliada de herramientas de equilibrio general. • Probar la validez de un modelo económico es quizá la tarea más difícil que enfrentan los economistas. Ocasionalmente la validez de un modelo puede estimarse preguntando si este se basa en supuestos “razonables”. Más a menudo, sin embargo, los modelos se juzgan por lo bien que pueden explicar sucesos económicos reales. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 1: Modelos económicos 19 Sugerencias de lecturas adicionales Sobre metodología Blaug, Mark y John Pencavel. The Methodology of Economics: Or How Economists Explain, 2a. ed., Cambridge University Press, Cambridge, 1992. Versión corregida y aumentada de un estudio clásico sobre metodología económica. Asocia el análisis con cuestiones más generales de filosofía de la ciencia. Boland, Lawrence E. “A Critique of Friedman’s Critics”, Journal of Economic Literature (junio de 1979), pp. 503-522. Buen resumen de críticas a enfoques positivos de la economía y al papel de la comprobación empírica de supuestos. Friedman, Milton. “The Methodology of Positive Economics”, Essays in Positive Economics, University of Chicago Press, Chicago, 1953, pp. 3-43. Formulación básica de los juicios positivos de Friedman. Harrod, Roy F. “Scope and Method in Economics”, Economic Journal, núm. 48 (1938), pp. 383-412. Enunciación clásica del papel apropiado de la modelización económica. Hausman, David M. y Michael S. McPherson. Economic Analysis, Moral Philosophy, and Public Policy, 2a. ed., Cambridge University Press, Cambridge, 2006. Los autores subrayan su certeza de que la consideración de cuestiones de filosofía moral puede mejorar el análisis económico. McCloskey, Donald N. If You’re So Smart: The Narrative of Economic Expertise, University of Chicago Press, Chicago, 1990. Exposición del juicio de McCloskey de que la persuasión económica depende de la retórica tanto como de la ciencia. Para un intercambio sobre este tema, véanse también los artículos publicados en el Journal of Economics Literature en junio de 1995. Sen, Amartya. On Ethics and Economics, Blackwell Reprints, Oxford, 1989. Este autor intenta cerrar la brecha entre economía y estudios éticos. Reimpresión de un estudio clásico sobre el tema. Fuentes primarias de historia de la economía Edgeworth, F. Y. Mathematical Psychics, Kegan Paul, Londres, 1881. Investigaciones iniciales de la economía de bienestar, que incluyen nociones rudimentarias de eficiencia económica y la curva de contrato. imperfecto) del análisis del equilibrio general. Aporta críticas fundamentales a la institución de la propiedad privada. Ricardo, D. Principles of Political Economy and Taxation, J. M. Dent & Sons, Londres, 1911. Trabajo muy analítico y densamente escrito. Precursor en el desarrollo del minucioso análisis de asuntos de política pública, en especial de los relacionados con el comercio. Analiza las primeras nociones básicas del marginalismo. Smith, A. The Wealth of Nations, Modern Library, Nueva York, 1937. Primer gran clásico de la economía. Largo y detallado, pese a lo cual Smith tuvo la primera palabra en prácticamente todas las materias económicas. Esta edición contiene útiles notas al margen. Walras, L. Elements of Pure Economics, traducción de W. Jaffe, Richard D. Irwin, Homewood, 1954. Los inicios de la teoría del equilibrio general. De lectura un poco difícil. Fuentes secundarias de historia de la economía Backhouse, Roger E. The Ordinary Business of Life: The History of Economics from the Ancient World to the 21st Century, Princeton University Press, Princeton, 2002. Historia iconoclasta. Buen texto (aunque breve) respecto a las primeras ideas económicas, no obstante, con deficiencias en los usos recientes de las matemáticas y la econometría. Blaug, Mark. Economic Theory in Retrospect, 5a. ed., Cambridge University Press, Cambridge, 1997. Muy completo resumen que subraya cuestiones analíticas. Excelentes “Reader’s Guides” (Guías del lector) de los clásicos en cada capítulo. Heilbroner, Robert L. The Worldly Philosophers, 7a. ed., Simon & Schuster, Nueva York, 1999. Fascinantes biografías fáciles de leer de economistas distinguidos. Los capítulos sobre los socialistas utópicos y Thorstein Veblen son muy recomendables. Keynes, John M. Essays in Biography, W. W. Norton, Nueva York, 1963. Marshall, A. Principles of Economics, 8a. ed., Macmillan & Co., Londres, 1920. Ensayos sobre muchos personajes famosos (Lloyd George, Winston Churchill, León Trotsky) y varios economistas (Malthus, Marshall, Edgeworth, F. P. Ramsey y Jevons). Demuestra el genuino talento de Keynes como escritor. Síntesis completa de la visión neoclásica. Texto de inveterada popularidad. Detallado apéndice matemático. Schumpeter, J. A. History of Economic Analysis, Oxford University Press, Nueva York, 1954. Marx, K. Capital, Modern Library, Nueva York, 1906. Desarrollo pleno de la teoría del valor-trabajo. El estudio del “problema de la transformación” sirve como punto de partida (quizá Tratamiento enciclopédico. Abarca a todos los economistas famosos y los no tanto. También resume brevemente acontecimientos simultáneos en otras ramas de las ciencias sociales. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO DOS Matemáticas para microeconomía Los modelos microeconómicos se elaboran usando una amplia variedad de técnicas matemáticas. En este capítulo ofrecemos un breve resumen de algunas de las técnicas más importantes que encontrarás en el presente libro. Un segmento importante del capítulo concierne a procedimientos matemáticos para determinar el valor óptimo de una función. Dado que frecuentemente adoptaremos el supuesto de que un actor económico busca maximizar o minimizar una función, nos encontraremos muchas veces con estos procedimientos (la mayoría de los cuales se basan en el cálculo). Después de nuestro detallado análisis del cálculo de la optimización pasaremos a cuatro temas que se cubrirán con menos detalle. Primero examinaremos algunos tipos especiales de funciones que se presentan en economía. El conocimiento de las propiedades de estas funciones puede ser útil para resolver problemas. Luego se ofrece un pequeño resumen acerca del cálculo integral. Aunque en este libro la integración se usa mucho menos que la diferenciación, encontraremos situaciones en las que se tendrán que usar integrales para medir áreas importantes para la teoría económica o para sumar resultados que ocurren en el tiempo o entre muchos individuos. Un uso ujo de resultados en el tiempo. Nuestro tercer tema adicional se centrará en técnicas por usar para tales problemas de optimización dinámica. Por último, este capítulo concluirá con un breve resumen de estadística matemática el cual será particularmente útil en nuestro estudio del comportamiento económico en situaciones inciertas. MAXIMIZACIÓN DE UNA FUNCIÓN DE UNA VARIABLE Nuestro estudio de la optimización puede motivarse con un ejemplo sencillo. Supongamos que el gerente de una empresa desea maximizar1 cios por concepto de la venta de un bien parcios ( ) recibidos dependen sólo de la cantidad (q) vendida del bien. Matemáticamente, f (q). (2.1) gura 2.1 muestra una posible relación entre y q cios máximos, el gerente debe generar la producción q∗ cios ∗. Si se dispusiera de gura 2.1 todo parecería ser cuestión de trazado con una regla. 1 Aquí exploraremos en general problemas de maximización. Un método prácticamente idéntico se tendría que adoptar para estudiar problemas de minimización porque la maximización de f(x) es equivalente a la minimización de f(x). 21 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 22 Parte 1: Introducción FIGURA 2.1 Relación hipotética entre cantidad producida y beneficios. Si un gerente desea generar el nivel de producción que maximiza los beneficios, debe producirse q∗. Nótese que en q∗, d/dq 0. π π∗ π2 π = f(q) π3 π1 q1 q∗ q2 q3 Cantidad Sin embargo, supóngase que, como es probable, el gerente no tiene una idea tan precisa del mercado. Entonces puede probar varias q para ver dónde se obtienen beneficios máximos. Por ejemplo, comenzando en q1, los beneficios por concepto de ventas serían 1. Luego, el gerente podría probar producir q2 y observar que los beneficios aumentan a 2. La idea de sentido común de que los beneficios aumentan en respuesta a un aumento en q puede enunciarse formalmente como 2 q2 1 q1 0 o q (2.2) 0, donde la notación se usa para significar “la variación en” o q. Mientras / q sea positivo los beneficios aumentarán y el gerente seguirá incrementando la producción. Para los aumentos de producción a la izquierda de q∗, sin embargo, / q será negativo, y el gerente se percatará de que se ha cometido un error. Derivadas Como probablemente conoces, el límite de / q para pequeñas variaciones en q se llama la derivada de la función, f (q), y se denota con d/dq o df/dq o df(q). Más formalmente, la derivada de una función f(q) en el punto q1 se define como d df f (q1 h lím dq dq h→0 h f (q1 ) . (2.3) Nótese que el valor de esta razón depende obviamente del punto q1 que se elija. La derivada de una función puede no existir siempre o ser indefinida en ciertos puntos. La mayoría de las funciones que se estudiarán en este libro son totalmente diferenciables, sin embargo. Valor de la derivada en un punto Cabe mencionar una convención de notación: a veces se desea indicar explícitamente el punto en el que se evaluará la derivada. Por ejemplo, la evaluación de la derivada en el punto q q1 podría denotarse con d . dq qq1 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. (2.4) 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 23 Otras veces nos interesa el valor de d/dq para todos los valores posibles de q, y no se hace mención explícita de un punto de evaluación particular. En el ejemplo de la figura 2.1, d dq qq1 0, mientras que d 0. dq qq3 ¿Cuál es el valor de d/dq en q∗? Parecería ser de 0 porque el valor es positivo para valores de q menores que q∗ y negativo para valores de q mayores que q∗. La derivada es la pendiente de la curva de la función; esta pendiente es positiva a la izquierda de q∗ y negativa a la derecha de q∗. En el punto q∗, la pendiente de f(q) es 0. Condición de primer orden para un máximo Este resultado es general. Para que una función de una variable alcance su valor máximo en algún punto la derivada en ese punto (si existe) debe ser igual a 0. De ahí que si un gerente pudiera estimar la función f (q) con algún tipo de datos reales, sería teóricamente posible hallar el punto donde df/dq 0. En este punto óptimo (q∗, digamos), df dq 0. (2.5) qq Condiciones de segundo orden Un gerente desprevenido podría ser engañado, sin embargo, por una aplicación ingenua de sólo esa regla de la primera derivada. Por ejemplo, supóngase que la función de beneficios fuera como se advierte en las figuras 2.2a o 2.2b. Si la función de beneficios es como se muestra en la figura 2.2a, el gerente, mediante el análisis de la producción en el punto en donde d/dq 0, elegirá el punto q∗a. Este punto produce de hecho un beneficio mínimo, no máximo, para el gerente. De igual manera, si la función beneficio es la que se muestra en la figura 2.2b, el gerente elegirá el punto q∗b, que, aunque rinde beneficios superiores a los de cualquier producción menor que q∗b, es ciertamente inferior a cualquier producción mayor que q∗b. Estas situaciones ilustran el hecho matemático de que d/dq 0 es condición necesaria pero no suficiente para un máximo. Con objeto de garantizar que el punto elegido sea en efecto un punto máximo, debe imponerse una segunda condición. Intuitivamente esta condición adicional es clara: los beneficios disponibles al producir un poco más o un poco menos que q∗ deben ser menores que los disponibles de q∗. De no ser así, al gerente podría irle mejor que con q∗. Matemáticamente esto significa que d/dq debe ser mayor que 0 para q q∗ y menor que 0 para q q∗. Así, en q∗, d/dq debe ser decreciente. Otra manera de decir esto es que la derivada de d/dq debe ser negativa en q∗. Segundas derivadas La derivada de una derivada se llama segunda derivada y se denota con d2 dq2 o d2 f dq2 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. o 23.08.2019 f (q). 8/23 24 Parte 1: Introducción FIGURA 2.2 Dos funciones de beneficios con resultados engañosos si la regla de la primera derivada se aplica de manera indiscriminada. En a) la aplicación de la regla de la primera derivada resultaría en la elección del punto q∗a. Este punto es de hecho un punto de beneficios mínimos. De igual forma, en b), el nivel de producción q∗b sería recomendado por la regla de la primera derivada, pero este punto es inferior a todas las producciones mayores que q∗b. Esto demuestra gráficamente que hallar un punto en el que la derivada sea igual a 0 es condición necesaria, pero no suficiente, para que una función alcance su valor máximo. π π π∗b π∗a q∗a q∗b Cantidad a) Cantidad b) La condición adicional para que q∗ represente un máximo (local) es, por tanto, d2 f (q) dq2 qq 0, (2.6) qq donde la notación es de nuevo un recordatorio de que esta segunda derivada debe evaluarse en q∗. De ahí que aunque la ecuación 2.5 (d/dq 0) sea condición necesaria para un máximo, deba combinarse con la ecuación 2.6 (d 2/dq2 0) para garantizar que el punto sea un máximo local para la función. Juntas, así, las ecuaciones 2.5 y 2.6 son condiciones suficientes para ese máximo. Desde luego es posible que, mediante una serie de ensayos, el gerente se decida por q∗ dependiendo de la información del mercado más que del razonamiento matemático (recuérdese la analogía del jugador de billar de Friedman). En este libro nos interesa menos cómo se descubre el punto que sus propiedades y cómo varía el punto cuando las condiciones cambian. Un desarrollo matemático será útil para resolver estas preguntas. Reglas para la determinación de derivadas He aquí algunas reglas conocidas para calcular derivadas de una función de una variable. Las usaremos en muchos apartados de este libro. 1. Si a es una constante, entonces da 0. dx 2. Si a es una constante, entonces d[af (x af (x). dx 3. Si a es una constante, entonces dxa axa 1 . dx Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 4. 5. 6. 7. 8. 9. 10. 11. 12. 25 d ln x 1 dx x donde ln significa el logaritmo natural de la base e ( 2.71828). dax axlna para cualquier constante a dx Un caso particular de esta regla es dex/dx ex. Supóngase ahora que f(x) y g(x) son dos funciones de x y que f (x) y g(x) existen. Así pues, d [f (x) g(x)] f (x) g (x). dx d [f (x) · g (x)] f (x)g (x) f (x)g(x). dx d [f (x) /g(x)] f (x)g(x f (x)g(x) , dx [g(x)]2 siempre y cuando g(x) 0 Finalmente, si y f (x) y x g(z) y si tanto f(x) como g(z) existen, entonces dy dy dx df dg . dz dx dz dx dz A este resultado se le llama la regla de cadena. Ofrece una manera conveniente de estudiar cómo una variable (z) afecta a otra (y) sólo mediante su influencia en una variable intermedia (x). Algunos ejemplos son deax deax d(ax) eax a aeax . dx d(ax) dx d[ln(ax)] d[ln(ax)] d(ax) 1 1 a . dx d(ax) dx ax x d[ln(x2)] d[ln(x2)] d(x2 ) 1 2 2 2x . dx x x dx d(x2 ) EJEMPLO 2.1 Maximización de beneficios Supóngase que la relación entre el beneficio () y la cantidad producida (q) está dada por (q) 1 000q 5q2 . (2.7) Una gráfica de esta función se parecería a la parábola que se aprecia en la figura 2.1. El valor de q que maximiza el beneficio puede determinarse por diferenciación: d 1 000 10q 0, (2.8) dq así, q 100. (2.9) En q 100, la ecuación 2.7 muestra que el beneficio es de 50 000; el mayor valor posible. Si, por ejemplo, la empresa optara por producir q 50, el beneficio sería de 37 500. En q 200, el beneficio es precisamente de 0. Es posible demostrar que q 100 es un máximo “global”, señalando que la segunda derivada de la función beneficio es 10 (véase la ecuación 2.8). De ahí que la tasa de crecimiento de beneficio sea siempre decreciente hasta q 100 donde la tasa de crecimiento sigue siendo positiva, pero más allá de ese punto se vuelve negativa. En este ejemplo, q 100 es el único valor máximo local para la función . Con funciones más complejas, sin embargo, puede haber muchos de esos máximos. PREGUNTA: Supongamos que la producción (q) de una empresa está determinada por el monto de trabajo (l) que contrata de acuerdo con la función q 2l. Asimismo, que la empresa puede contratar todo el trabajo que desee a 10 dólares por unidad y vender su producción a $50 por unidad. Así, el beneficio es una función de l dada por (l) 100l − 10l. ¿Cuánto trabajo debería contratar esta empresa para maximizar el beneficio, y cuáles serán los beneficios? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 26 Parte 1: Introducción FUNCIONES DE VARIAS VARIABLES Los problemas económicos rara vez implican funciones de una variable. La mayoría de las metas de interés para los agentes económicos depende de varias variables y las opciones que se establecen entre estas variables. Por ejemplo, la utilidad que un individuo recibe de la actividad como consumidor depende de la cantidad de cada bien consumido. Para la función de producción de una empresa, la cantidad producida depende de la cantidad de trabajo, capital y tierra dedicada a la producción. En estas circunstancias esta dependencia de una variable (y) respecto a una serie de otras (x1, x2, …, xn) se denota con y f (x1 , x2 , . . . , xn ). (2.10) Derivadas parciales Nos interesan el punto en que y llega a un máximo y las opciones que debemos resolver para llegar a dicho punto. De nuevo resulta conveniente imaginar que el agente cambia las variables que tiene a su disposición (las x) para localizar un máximo. Por desgracia, para una función de varias variables, la idea de la derivada no está claramente definida. Así como lo empinado de una cuesta para subir por una montaña depende de la dirección que tomes, la pendiente (o derivada) de la función depende de la dirección en que se le calcule. Usualmente las únicas pendientes direccionales de interés son las que se obtienen incrementando una de las x y manteniendo constantes todas las demás variables (la analogía del ascenso de una montaña podría ser la medición de pendientes sólo en dirección Norte-Sur o Este-Oeste). Estas pendientes direccionales se llaman derivadas parciales. La derivada parcial de y respecto a (es decir, en dirección a) x1 se denota con y x1 o f x1 o fx1 o f1 . Se entiende que al calcular esta derivada todas las demás x se mantienen constantes. Cabe enfatizar nuevamente que el valor numérico de esta pendiente depende del valor de x1 y de los valores (preasignados y constantes) de x2, …, xn. Una definición un poco más formal de la derivada parcial es f x1 x2 ,...,xn lím h→0 f (x1 h, x2 , . . . , xn h f (x1 , x2 , . . . , xn ) , (2.11) donde la notación quiere indicar que x2, …, xn se mantienen constantes en los valores preasignados x2, …, xn para que sólo pueda estudiarse el efecto de cambiar x1. Las derivadas parciales respecto a las demás variables x2, …, xn, se calcularían en forma similar. Cálculo de derivadas parciales Es fácil calcular derivadas parciales. La estimación procede, en cuanto a la derivada usual, tratando a x2, …, xn como constantes (lo que en realidad son en la definición de una derivada parcial). Considérense los ejemplos siguientes. 1. Si y f (x1, x2) ax12 bx1x2 cx22, entonces f f1 2ax1 bx2 x1 y f f2 bx1 2cx2 . x2 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 27 Obsérvese que f/x1 es en general una función tanto de x1 como de x2; así, su valor dependerá de los valores particulares asignados a estas variables. También depende de los parámetros a, b y c, que no varían cuando x1 y x2 sí varían. 2. Si y f (x1, x2) eax1 bx2, entonces f f1 aeax1 bx2 x1 y f f2 beax1 bx2 . x2 3. Si y f (x1, x2) a ln x1 b ln x2, entonces f a f1 x1 x1 y f b f2 . x2 x2 Obsérvese aquí que el tratamiento de x2 como constante en la derivación de f/x1 causa que el término b ln x2 desaparezca en la diferenciación, porque no varía cuando x1 varía. En este caso, a diferencia de nuestros ejemplos anteriores, la magnitud del efecto de x1 en y es independiente del valor de x2. En otros casos, el efecto de x1 en y dependerá del nivel de x2. Derivadas parciales y el supuesto ceteris paribus En el capítulo 1 se describió la manera en que los economistas usan en sus modelos el supuesto ceteris paribus para mantener constantes varias influencias externas, a fin de que la relación particular estudiada pueda explorarse en un marco simplificado. Las derivadas parciales es el modo matemático preciso de representar dicho método; es decir, muestran cómo las variaciones en una variable afectan algún resultado cuando otras influencias se mantienen constantes, justo lo que los economistas necesitan en sus modelos. Por ejemplo, la curva de demanda de Marshall muestra la relación entre precio (p) y cantidad (q) demandada cuando otros factores se mantienen constantes. Usando derivadas parciales podríamos representar la pendiente de esta curva como q/p para indicar los supuestos ceteris paribus en vigor. La ley fundamental de la demanda —precio y cantidad se mueven en direcciones opuestas cuando otros factores no cambian— se refleja, por tanto, en el enunciado matemático q/p 0. Una vez más el uso de una derivada parcial sirve como recordatorio de los supuestos ceteris paribus en torno a la ley de la demanda. Derivadas parciales y unidades de medida En matemáticas se presta relativamente poca atención a la forma en que se miden las variables. De hecho, la mayoría de las veces no se hace mención explícita del asunto. Sin embargo, las variables que se usan en economía suelen referirse a magnitudes reales; por tanto, debemos ocuparnos de cómo se miden. Quizá la consecuencia más importante de elegir unidades de medida es que las derivadas parciales suelen usarse para resumir comportamientos económicos que reflejen estas unidades. Por ejemplo, si q representa la cantidad de gasolina demandada por todos los consumidores estadounidenses durante un determinado año (medida en miles de millones de galones) y p representa el precio en dólares por galón, entonces q/p medirá la variación en la demanda (en miles de millones de galones por año) en relación con un cambio de un dólar por galón en el precio. La dimensión numérica de esta derivada depende de cómo se midan q y p. La decisión de Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 28 Parte 1: Introducción medir el consumo en millones de galones por año multiplicaría la dimensión de la derivada por 1 000, mientras que una decisión de medir el precio por galón en centavos la reduciría en un factor de 100. La dependencia de la dimensión numérica de derivadas parciales respecto a las unidades de medida elegidas plantea problemas para los economistas. Aunque muchas teorías económicas hacen predicciones sobre el signo (dirección) de las derivadas parciales, toda predicción sobre la magnitud numérica de esas derivadas dependerá de cómo los autores eligen medir sus variables. Hacer comparaciones entre estudios podría resultar prácticamente imposible, en especial dada la amplia variedad de sistemas de medición en uso en todo el mundo. Por esta razón los economistas decidieron adoptar un modo diferente, sin uso de unidades, para medir impactos cuantitativos. Elasticidad, una definición general Los economistas usan elasticidades para resumir prácticamente todos los impactos cuantitativos de su interés. Puesto que tales medidas se centran en el efecto proporcional de las variaciones de una variable en otra, que no tienen unidades; las unidades “se cancelan” al calcular la elasticidad. Por ejemplo, supóngase que y es una función de x (que podemos denotar con y(x)). Así, la elasticidad de y respecto de x (que denotaremos con ey, x) se define como y y x dy(x) x y ey,x x dx y x y x (2.12) Si la variable y dependiera de varias variables aparte de x (como sucede a menudo), la derivada de la ecuación 2.12 sería reemplazada por una derivada parcial. En cualquier caso nótese cómo las unidades en que se miden y y x se cancelan en la definición de elasticidad; el resultado es una cifra que es un número puro sin dimensiones. Esto hace posible que los economistas comparen elasticidades entre países diferentes o asimismo entre diferentes bienes. Ya debes conocer las elasticidades del precio de la demanda y la oferta, las cuales suelen tratarse en un primer curso de economía. A lo largo de este libro hallarás muchos de estos conceptos. EJEMPLO 2.2 Elasticidad y forma funcional La definición en la ecuación 2.12 deja en claro que la elasticidad debe evaluarse en un punto específico de una función. En general, se esperaría que el valor de este parámetro varíe en diferentes rangos de la función. Esta observación aparece claramente en el caso en que y es una función lineal de x de la forma y a bx otros términos. En este caso, ey,x dy x x x b b , dx y y a bx . . . (2.13) lo que deja en claro que ey,x no es constante. De ahí que para las funciones lineales sea especialmente valioso señalar el punto en el que se estima la elasticidad. Si la relación funcional entre y y x es de la forma exponencial y axb, la elasticidad es una constante, independientemente de en qué lugar se mida: ey,x dy x abxb dx y Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 1 x b. axb 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 29 Una transformación logarítmica de esta ecuación también brinda una conveniente definición alterna de elasticidad. Dado que ln y ln a b ln x, tenemos ey,x b d ln y . d ln x (2.14) De ahí que las elasticidades puedan calcularse mediante “diferenciación logarítmica”. Como veremos, esta es con frecuencia la forma más fácil de proceder al hacer estos cálculos. PREGUNTA: ¿Existen modos funcionales, además del exponencial, que tengan una elasticidad constante cuando menos en algún rango? Derivadas parciales de segundo orden La derivada parcial de una derivada parcial es directamente análoga a la segunda derivada de la función de una variable y se llama derivada parcial de segundo orden. Esta puede escribirse como ( f / x i ) xj o más simplemente como 2f f ij . xj xi En cuanto a los ejemplos ya expuestos: 1. y f (x1, x2) ax12 bx1x2 cx22 f11 2a f12 b f21 b f22 2c 2. y f (x1, x2) eax1bx2 f11 a2eax1bx2 f12 abeax1bx2 f21 abeax1bx2 f22 b2eax1bx2 3. y a lnx1 b lnx2 f11 ax2 1 f12 0 f21 0 f22 bx2 2 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (2.15) 8/23 30 Parte 1: Introducción Teorema de Young Estos ejemplos ilustran el resultado matemático de que, en condiciones generales, el orden en que se hace la diferenciación parcial para evaluar derivadas parciales de segundo orden no importa. Es decir, fij fji (2.16) para cualquier par de variables xi, xj. Este resultado se conoce como teorema de Young. Para una explicación intuitiva de este teorema volvamos a la analogía del ascenso de una montaña. En dicho ejemplo el teorema establece que la ganancia en elevación que experimenta un alpinista depende de las direcciones que se tomen y de las distancias recorridas, pero no del orden en que se presenten. Esto es, la ganancia en altitud es independiente de la ruta seguida siempre y cuando el alpinista proceda de una serie de coordenadas cartográficas a otra. Él puede, por ejemplo, avanzar una milla al Norte y luego una al Este, o proceder en el orden opuesto avanzando primero una milla al Este y luego una más al Norte. En cualquier caso, la ganancia en elevación es la misma, porque en ambos casos el alpinista se mueve de un lugar específico a otro. En capítulos posteriores haremos buen uso de este resultado porque brinda una manera conveniente de mostrar algunas de las predicciones que los modelos económicos hacen acerca del comportamiento.2 Usos de parciales de segundo orden Las derivadas parciales de segundo orden desempeñarán un papel importante en muchas teorías económicas que se desarrollan a lo largo de este libro. Probablemente los ejemplos más relevantes tengan que ver con la parcial “propia” de segundo orden, fii. Esta función muestra cómo la influencia marginal de xi en y (es decir, y/xi) cambia al incrementarse el valor de xi. Un valor negativo de fii es la manera matemática de indicar la idea económica de efectividad marginal decreciente. De igual forma, la parcial cruzada fij indica cómo la efectividad marginal de xi cambia al incrementarse xj. El signo de este efecto podría ser positivo o negativo. El teorema de Young indica que, en general, esos efectos cruzados son simétricos. Generalmente las derivadas parciales de segundo orden de una función dan información sobre la curvatura de la función. Más adelante veremos cómo esa información desempeña un papel importante en la determinación de si se satisfacen varias condiciones de segundo orden para un máximo. Estas también desempeñan un papel importante en la determinación de los signos de gran número de derivadas relevantes en la teoría económica. La regla de cadena con muchas variables Calcular derivadas parciales puede ser más bien complicado en casos en los que algunas variables dependen de otras. Como veremos, en muchos problemas económicos puede ser difícil saber cómo proceder exactamente en la diferenciación de funciones complejas. En esta sección se ilustran casos simples que te ayudarán a hacerte una idea general. Se empezará examinando cómo la “regla de cadena” ya explicada en el contexto de una variable puede generalizarse para muchas variables. Específicamente, supongamos que y es una función de tres variables, y f (x1, x2, x3). Asimismo, supongamos que cada una de estas x es en sí misma la función de un parámetro, digamos a. De ahí que pueda escribirse y f [(x1(a), x2(a), x3(a)]. Ahora podemos preguntarnos cómo una variación en a afecta el valor de y, usando la regla de cadena: dy f dx1 f dx2 f dx3 da x1 da x2 da x3 da 2 (2.17) El teorema de Young implica que la matriz de las derivadas parciales de segundo orden de una función es simétrica. Esta simetría ofrece varios discernimientos económicos. Para una breve introducción a los conceptos matriciales usados en economía, véanse las extensiones de este capítulo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 31 Es decir, las variaciones en a afectan a cada una de las x, y luego estas variaciones en las x afectan al valor final de y. Por supuesto que algunos de los términos en esta expresión pueden ser iguales a cero. Tal sería el caso si una de las x no fuera afectada por a o si una x particular no tuviera ningún efecto en y (en cuyo caso no debería estar en la función). Pero esta versión de la regla de cadena muestra que a puede influir en y a través de muchas rutas.3 En nuestros modelos económicos desearemos estar seguros de que todas esas rutas se tomen en cuenta. EJEMPLO 2.3 Uso de la regla de cadena Como un ejemplo simple (y quizá poco apetitoso) supongamos que cada semana un fanático de la pizza consume tres tipos de pizza, denotados por x1, x2 y x3. La pizza tipo 1 es una pizza simple de queso que cuesta p por unidad. La pizza tipo 2 consta de dos ingredientes más y cuesta 2p. La pizza tipo 3 es la especialidad de la casa, incluye cinco ingredientes y cuesta 3p. Para garantizar un menú (modestamente) diversificado este fanático decide asignar 30 dólares a la semana para cada tipo de pizza. Aquí desearemos examinar cómo el número total de pizzas adquiridas se ve afectado por el precio subyacente p. Nótese que este problema incluye una variable exógena, p, fijada por la pizzería. Las cantidades adquiridas de cada pizza (y las compras totales) son las variables endógenas en el modelo. Dada la manera en que este fanático presupuesta sus compras de pizza, la cantidad adquirida de cada tipo sólo depende del precio p. Específicamente, x1 30/p, x2 30/2p, x3 30/3p. Ahora las compras totales de pizza (y) están dadas por y f [x1(p), x2(p), x3(p)] x1(p) x2(p) x3(p) (2.18) Aplicar la regla de cadena de la ecuación 2.17 a esta función produce: dy dx1 dx2 dx3 f1 f2 f3 dp dp dp dp 30p 2 15p 2 10p 2 55p 2 (2.19) Podemos interpretar esto con una ilustración numérica. Supongamos que inicialmente p 5. Con este precio, las compras totales de pizza serán de 11 unidades. La ecuación 2.19 implica que cada incremento en el precio unitario reducirá las compras en 2.2 ( 55/25) unidades, aunque ese cambio es demasiado grande para que el cálculo (que supone pequeñas variaciones) opere correctamente. Así, supongamos en cambio que p aumenta 5 centavos, a p 5.05. La ecuación 2.19 predice ahora que las compras totales de pizza se reducirán en 0.11 unidades (0.05 55/25). Si calculamos directamente las compras por unidades obtenemos x1 5.94, x2 2.97, x3 1.98. De ahí que las unidades compradas sean 10.89; una reducción de 0.11 respecto al nivel original, justo lo que predijo la ecuación 2.19. PREGUNTA: Debe ser obvio que una manera mucho más fácil de resolver este problema sea definir directamente las compras totales de unidades (y) como una función de p. Aporta una prueba usando este método y luego describe algunas razones por las que este método más simple no puede implementarse siempre. Aquí podemos explicar con claridad un caso especial de esta regla. Supongamos que x3(a) a. Es decir, el parámetro a entra directamente en la determinación de y f [x1(a), x2(a), a]. En este caso, el efecto de a en y puede escribirse como:4 dy f dx1 f dx2 f da x1 da x2 da a (2.20) 3 Si las x en la ecuación 2.17 dependieran de varios parámetros, todas las derivadas en la ecuación serían derivadas parciales para indicar que la regla de cadena examina el efecto de sólo un parámetro a la vez, manteniendo constantes los demás. 4 La expresión en la ecuación 2.20 se conoce como derivada total o derivada completa de la función f, aunque su uso no es consistente entre varios campos de las matemáticas aplicadas. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 32 Parte 1: Introducción Esto indica que el efecto de a en y puede descomponerse en dos tipos de efectos: 1) un efecto directo (dado por fa); y 2) un efecto indirecto que sólo opera mediante las formas en que a afecta a las x. En muchos problemas económicos analizar por separado estos dos efectos puede aportar discernimientos importantes. Funciones implícitas Si el valor de una función se mantiene constante se crea una relación implícita entre las variables independientes que entran en la función. Es decir, las variables independientes ya no pueden adoptar cualquier valor, sino sólo la serie de valores que resulta de que la función retenga el valor requerido. El examen de estas relaciones implícitas puede ofrecer a menudo otra herramienta de análisis para sacar conclusiones de modelos económicos. Probablemente el resultado más útil provisto por este método sea la posibilidad de cuantificar las ventajas y desventajas inherentes a la mayoría de los modelos económicos. Aquí trataremos un caso simple. Considérese la función y f (x1, x2). Si mantenemos constante el valor de y hemos creado una relación implícita entre las x que muestra cómo las variaciones en ellas deben estar asociadas con el hecho de mantener constante el valor de la función. De hecho, en condiciones muy generales5 (la más importante de las cuales es que f2 0) es posible demostrar que el mantener constante a y permite crear una función implícita de la forma x2 g(x1). Aunque a veces calcular esta función puede ser difícil, la derivada de la función g se relaciona de una manera específica con las derivadas parciales de la función original f. Para demostrar esto, primero la función original se iguala con una constante (digamos cero) y se escribe como y 0 f (x1, x2) f (x1, g(x1)) (2.21) Usar la regla de cadena para diferenciar esta relación respecto a x1 produce: 0 f1 f2 dg(x1 ) dx1 (2.22) Reordenar los términos da como resultado final dg(x1 ) dx2 dx1 dx1 f1 . f2 (2.23) Así, hemos demostrado6 que las derivadas parciales de la función f pueden usarse para derivar una expresión explícita de las disyuntivas entre x1 y x2. El ejemplo siguiente nos muestra cómo esto puede facilitar los cálculos en ciertas situaciones. EJEMPLO 2.4 De nuevo una frontera de posibilidades de producción En el ejemplo 1.3 se examinó una frontera de posibilidades de producción para dos bienes de la forma x2 0.25y2 200. (2.24) Debido a que esta función se iguala con una constante es posible estudiar la relación entre las variables, usando el resultado de la función implícita: 5 Para un análisis detallado de este teorema de la función implícita y cómo puede extenderse a varias variables véase Carl P. Simon y Lawrence Blume, Mathematics for Economists (W. W. Norton, Nueva York, 1994), capítulo 15. Un método alterno para comprobar este resultado emplea la diferencial total de f: dy f1 dx1 f2 dx2. Establecer dy 0 y reordenar los términos da el mismo resultado (suponiendo que pueda darse el paso, matemáticamente cuestionable, de dividir entre dx1). 6 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía f dy 2x 4x x , fy dx 0.5y y 33 (2.25) justo el resultado que se obtuvo antes, con mucho menos trabajo. PREGUNTA: ¿Por qué la opción entre x y y sólo depende aquí de la razón de x respecto a y y no del tamaño de la fuerza de trabajo reflejado por la constante 200? MAXIMIZACIÓN DE FUNCIONES DE VARIAS VARIABLES Usar derivadas parciales nos permite hallar el valor máximo de una función con distintas variables. Para entender las matemáticas que se utilizan en la resolución de este problema es útil una analogía con el caso de una variable. En el caso de una variable podemos imaginar un agente que cambia x por una pequeña cantidad, dx, y observa la variación en y, dy. Este cambio está dado por dy f (x)dx. (2.26) La identidad en la ecuación 2.26 registra el hecho de que la variación en y es igual a la variación en x multiplicado por la pendiente de la función. Esta fórmula es equivalente a la de punto y pendiente que se usa para ecuaciones lineales en álgebra básica. Como ya se dijo, la condición necesaria para un máximo es que dy 0 para pequeñas variaciones en x alrededor del punto óptimo. De lo contrario, y podría aumentar por efecto de las variaciones adecuadas en x. Pero como dx no necesariamente es igual a 0 en la ecuación 2.26, dy 0 debe implicar que en el punto deseado f(x) 0. Esta es otra manera de obtener la condición de primer orden para un máximo que ya hemos derivado. Examinemos mediante esta analogía las decisiones tomadas por un agente económico que debe elegir los niveles de distintas variables. Supongamos que este agente desea hallar una serie de x que maximicen el valor de y f (x1, x2, ..., xn). El agente podría considerar cambiar sólo una de las x, digamos x1, y mantener constantes todas las demás. La variación en y (es decir, dy) que resultaría de esta variación en x1 está dado por dy f dx1 f 1 dx1 . x1 (2.27) Esto indica que la variación en y es igual a la variación en x1 multiplicado por la pendiente medida en la dirección x1. Usando de nuevo la analogía de la montaña, la ganancia en altitud que lograría un alpinista en dirección Norte está dada por la distancia recorrida al Norte multiplicada por la pendiente de la montaña medida en dirección Norte. Condiciones de primer orden para un máximo Para que un punto específico ofrezca un valor máximo (local) de la función f, ningún movimiento reducido en ninguna dirección debe poder aumentar su valor. De ahí que ninguno de los términos direccionales similares a la ecuación 2.27 deba incrementar y, y la única manera en la que esto puede suceder es que todas las derivadas direccionales (parciales) sean iguales a cero (recuerda que el término dx1 en la ecuación 2.27 puede ser positivo o negativo). Es decir, una condición necesaria para que un punto sea un máximo local es que en ese punto f f …f 0 (2.28) 1 2 n Técnicamente un punto en el que la ecuación 2.25 es válida se llama punto crítico de la función. No es necesariamente un punto máximo, a menos que sean válidas ciertas condiciones de segundo Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 34 Parte 1: Introducción orden (que analizaremos más adelante). En la mayoría de nuestros ejemplos económicos, sin embargo, estas condiciones serán válidas; así, la ecuación 2.28 nos permitirá hallar un máximo. Las condiciones necesarias “de primer orden” para un máximo descritas en la ecuación 2.28 también tienen una importante interpretación económica. Indican que para que una función alcance su valor máximo cualquier entrada en ella debe aumentar al punto en que su valor marginal (o incremental) sea de cero. Si, digamos, f1 fuera positiva en un punto este no podría ser un máximo verdadero ya que un incremento en x1 (manteniendo constantes todas las demás variables) incrementaría f por la ecuación 2.27. EJEMPLO 2.5 Determinación de un máximo Supongamos que y es una función de x1 y x2 dada por y (x1 1)2 (x2 2)2 10 (2.29) o y x12 2x1 x22 4x2 5. Por ejemplo, y podría representar la salud de un individuo (medida en una escala de 0 a 10), y x1 y x2 podrían ser dosis diarias de dos medicinas para el mejoramiento de la salud. Queremos encontrar valores de x1 y x2 que vuelvan a y lo más grande posible. Tomar las derivadas parciales de y respecto a x1 y x2 y aplicar las condiciones necesarias dadas por la ecuación 2.28 produce y x1 y x2 2x1 2 0, (2.30) 2x2 4 0 o x1 1, x2 2. Así, la función está en un punto crítico cuando x1 1 y x2 2. En ese punto, y 10 es el mejor estado de salud posible. Un poco de experimentación ofrece evidencia convincente de que este es el valor más grande que y puede tener. Por ejemplo, si x1 x2 0, entonces y 5, o si x1 x2 1, entonces y 9. Valores de x1 y x2 mayores que 1 y 2, respectivamente, reducen y porque los términos cuadráticos negativos en la ecuación 2.29 se vuelven grandes. En consecuencia el punto hallado, aplicando las condiciones necesarias es, de hecho, un máximo local (y global).7 PREGUNTA: Supongamos que y adoptó un valor fijo (de 5, digamos). ¿Cómo sería la relación contenida entre x1 y x2? ¿Qué podría decirse entonces de y 7 o y 10? (Estas gráficas son curvas de nivel de la función y se examinarán en detalle en capítulos posteriores. Véase también el problema 2.1.) Condiciones de segundo orden De nueva cuenta, sin embargo, las condiciones de la ecuación 2.28 no son suficientes para garantizar un máximo. Esto puede ilustrarse volviendo a una ya muy citada analogía: todas las cumbres son (más o menos) planas, pero no todos los sitios planos son una cumbre. Se necesita una condición de segundo orden para asegurar que el punto hallado, aplicando la ecuación 2.28, sea un máximo local. Intuitivamente, para un máximo local y debe ser decreciente respecto a cualquier variación pequeña en las x desde el punto crítico. Igual que en el caso de una variable, esto implica examinar la curvatura de la función alrededor del punto crítico para garantizar que el valor de la función realmente decrece en movimientos en cualquier dirección. Para hacer esto debemos con7 Más formalmente, el punto x1 1, x2 2 es un máximo global porque la función descrita en la ecuación 2.29 es cóncava (véase nuestro análisis más adelante). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 35 siderar las segundas derivadas parciales de la función. Una primera condición (que se desprende en forma obvia del caso de una variable) es que la segunda derivada parcial propia de cualquier variable fii debe ser negativa. Si reducimos nuestra atención a movimientos en una sola dirección, un máximo verdadero debe caracterizarse por un patrón en el que la pendiente de la función va de positiva (ascendente) a cero (plana) y a negativa (descendente). Esto es lo que significa la condición matemática fii 0. Por desgracia, las condiciones que aseguran el valor de los decrementos f para movimientos en cualquier dirección arbitraria involucran a todas las segundas derivadas parciales. Más adelante se analizará un ejemplo de dos variables, pero el caso general se examina idealmente con álgebra matricial (véanse las extensiones de este capítulo). Para la teoría económica, sin embargo, el hecho de que las segundas derivadas parciales propias deban ser negativas para un máximo, suele ser lo más importante. TEOREMA DE LA ENVOLVENTE Una de las principales aplicaciones de la idea de las funciones implícitas, que se usará muchas veces en este libro, es el teorema de la envolvente, que concierne la forma en que el valor óptimo de una función particular varía cuando un parámetro de la función también varía. Dado que muchos de los problemas económicos que estudiaremos conciernen a los efectos de variar un parámetro (por ejemplo, el efecto que tendrán las variaciones de precio de mercado de un producto respecto a las compras de un individuo), este es un tipo de cálculo que haremos con frecuencia. El teorema de la envolvente suele brindar un cómodo atajo para resolver el problema. Un ejemplo específico Quizá la manera más fácil de entender el teorema de la envolvente sea mediante un ejemplo. Supóngase que y es la función de una variable (x) y un parámetro (a), dada por y x2 ax. (2.31) Para diferentes valores del parámetro a, esta función representa una familia de parábolas invertidas. Si se le asigna a a un valor específico, la ecuación 2.31 será una función exclusiva de x, y podrá 1 calcularse el valor de x que maximiza a y. Por ejemplo, si a 1, entonces x∗ 2 y, para estos 1 valores de x y a, y 4 (su valor máximo). De igual manera, si a 2, entonces x∗ 1 y y∗ 1. De 3 ahí que un incremento de 1 en el valor del parámetro a aumente el valor máximo de y en 4 . En la tabla 2.1 se usan valores integrales de a entre 0 y 6 para calcular los valores óptimos de x y los valores asociados del objetivo, y. Nótese que cuando a aumenta, el valor máximo de y también aumenta. Esto se ilustra asimismo en la figura 2.3, la cual muestra que la relación entre a y y∗ es cuadrática. Ahora queremos calcular explícitamente cómo variar y∗ al variar el parámetro a. TABLA 2.1 VALORES ÓPTIMOS DE y Y x PARA VALORES ALTERNOS DE a EN y ⴝ ⴚx2 ⴙ ax Valor de a Valor de x∗ Valor de y∗ 0 0 0 1 1 2 1 4 2 1 1 3 3 2 9 4 4 2 4 5 5 2 25 4 6 3 9 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 36 Parte 1: Introducción FIGURA 2.3 Ilustración del teorema de la envolvente. El teorema de la envolvente establece que la pendiente de la relación entre y∗ (el valor máximo de y) y el parámetro a puede hallarse calculando la pendiente de la relación auxiliar que se determina sustituyendo los valores óptimos respectivos de x en la función objetivo y calculando y/a. y∗ 10 y ∗ = f(a) 9 8 7 6 5 4 3 2 1 0 1 2 3 4 5 6 a Un método directo que toma tiempo El teorema de la envolvente establece que hay dos formas equivalentes en las que podemos hacer este cálculo. Primero puede calcularse directamente la pendiente de la función en la figura 2.3. Para ello debe despejarse el valor óptimo de x para cualquier valor de a en la ecuación 2.32: dy dx 2x a 0; de ahí que a x . 2 Al sustituir este valor de x∗ en la ecuación 2.32 da y x ) 2 a(x ) a 2 a a 2 2 a2 a2 a2 , 4 2 4 (2.32) justo la relación que se muestra en la figura 2.3. Con base en la ecuación previa es fácil ver que Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía dy 2a a 4 2 da 37 (2.33) y, por ejemplo, en a 2, dy∗/da 1. Es decir, cerca de a 2 el impacto marginal del aumento de a es incrementar y∗en la misma cantidad. Cerca de a 6, todo pequeño aumento en a incrementará y∗ tres veces esa variación. La tabla 2.1 ilustra este resultado. El atajo de la envolvente Llegar a esta conclusión fue algo complicado. Tuvimos que hallar el valor óptimo de x para cada valor de a y luego sustituir este valor de x∗ en la ecuación para y. En casos más generales esto puede ser oneroso porque requiere maximizar repetidamente la función objetivo. El teorema de la envolvente, al ofrecer otro método, establece que para pequeñas variaciones en a, dy∗/da puede estimarse manteniendo x en su valor óptimo y calculando simplemente y/a a partir directamente de la función objetivo. Proceder de esta manera da dy y da a xx (a) x2 ax) a x (a) (2.34) xx (a) La notación aquí es un recordatorio de que la derivada parcial usada en el teorema de la envolvente debe evaluarse en el valor de x el cual es óptimo para el valor particular del parámetro a. En la ecuación 2.32 demostramos que, para cualquier valor de a, x∗(a)a/2. La sustitución en la ecuación 2.34 produce ahora: dy a x (a) 2 da (2.35) Este es justo el resultado obtenido con anterioridad. La razón de que estos dos métodos den resultados idénticos se ilustra en la figura 2.3. Las tangentes que aparecen en esta figura reportan valores de y para una x∗ fija. Las pendientes de las tangentes son y/a. Evidentemente en y∗ esta pendiente proporciona el valor que buscamos. Este resultado es general y lo usaremos a lo largo de este libro para simplificar nuestro análisis. En suma, el teorema de la envolvente establece que el cambio en el valor óptimo de una función respecto a un parámetro de dicha función puede hallarse diferenciando parcialmente la función objetivo y manteniendo a x en su valor óptimo. Es decir, dy y { x x (a)} , da a (2.36) donde la notación ofrece nuevamente el recordatorio de que y/a debe calcularse en el valor de x óptimo para el valor específico del parámetro a examinado. Caso de muchas variables Un teorema de la envolvente análogo es válido para el caso en que y es una función de diversas variables. Supóngase que y depende de un conjunto de x (x1, …, xn) y de un parámetro particular de interés, digamos a: y f (x1, . . . , xn, a) (2.37) Determinar un valor óptimo de y consistiría en resolver n ecuaciones de primer orden de la forma y 0 (i 1, . . . , n), xi (2.38) y una solución de este proceso daría valores óptimos para esas x (x∗1, x∗2, …, xn∗) que dependerían implícitamente del parámetro a. Suponiendo que se satisfacen las condiciones de segundo orden, Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 38 Parte 1: Introducción entonces se aplicaría el teorema de la función implícita el cual garantiza la resolución de cada x∗i como una función del parámetro a: x1 x1 (a), x2 x2 (a), .. . xn xn (a). (2.39) Sustituir estas funciones en nuestro objetivo original (ecuación 2.37) produce una expresión en la que el valor óptimo de y (digamos y∗) depende del parámetro a, directa e indirectamente, mediante el efecto de a en las x∗: y∗ f [x∗1 (a), x∗2 (a), . . . , xn∗(a), a]. La diferenciación total de esta expresión respecto a a produce dy f dx1 f dx2 da x1 da x2 da f dxn f . xn da a (2.40) Pero dadas las condiciones de primer orden todos estos términos, excepto el último, son iguales a 0 si las x están en sus valores óptimos. De ahí que una vez más tengamos el resultado envolvente: dy f , da a (2.41) donde esta derivada debe evaluarse en los valores óptimos de las x. EJEMPLO 2.6 Teorema de la envolvente: el estado de salud examinado En el ejemplo 2.5 se revisaron los valores máximos de la función estado de salud y (x1 1)2 (x2 2)2 10 (2.42) x1 1, x2 2, (2.43) y se determinó que y y∗ 10. Supongamos ahora que se usa el parámetro arbitrario a en vez de la constante 10 en la ecuación 2.42. Aquí a podría representar una medida de la mejor salud posible para una persona, aunque este valor variaría obviamente de una persona a otra. De ahí que y f(x1, x2, a) (x1 1)2 (x2 2)2 a (2.44) En este caso los valores óptimos de x1 y x2 no dependen de a (siempre son x∗1 1, x∗2 2; por tanto, en esos valores óptimos tenemos y∗ a (2.45) dy 1. da (2.46) y Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 39 Las personas de “buena salud natural” tendrán concomitantemente valores más altos de y∗, siempre y cuando elijan óptimamente x1 y x2. Pero esto es justo lo que indica el teorema de la envolvente porque, con base en la ecuación 2.44 dy f 1 da a (2.47) Aumentar el parámetro a aumenta simplemente el valor óptimo de y∗ en un monto idéntico (suponiendo de nuevo que las dosis de x1 y x2 se eligieron correctamente). PREGUNTA: Supongamos que se atiende, en cambio, la dosis óptima de x1 en la ecuación 2.42; es decir, que se usa un parámetro general, digamos b, en vez de 1. Explica en palabras y usando matemáticas por qué, en este caso, y∗/b sería necesariamente igual a 0. MAXIMIZACIÓN RESTRINGIDA Hasta aquí hemos puesto nuestra atención en determinar el valor máximo de una función sin restringir las opciones de las x disponibles. En la mayoría de los problemas económicos, sin embargo, no todos los valores de las x son factibles. En muchas situaciones, por ejemplo, se requiere que todas las x sean positivas. Este es el tipo de problema que enfrenta un gerente al tomar una decisión de producción para maximizar los beneficios; una producción negativa no tendría sentido. En otros casos las x pueden estar limitadas por consideraciones económicas. Por ejemplo, al decidir respecto a los artículos que va a consumir, un individuo no puede optar por cualquier cantidad deseada. Más bien, las opciones están limitadas por el monto del poder de compra disponible; es decir, por su restricción presupuestal. Estas limitaciones pueden reducir el valor máximo de la función por maximizar. Puesto que no podemos elegir libremente entre todas las x, quizá y no sea tan grande como podría. Las restricciones serían “no vinculantes” si pudiéramos obtener el mismo nivel de y con o sin la imposición de la restricción. Método del multiplicador de Lagrange Un método para resolver problemas de maximización restringida es el método del multiplicador de Lagrange el cual involucra un ingenioso truco matemático que resulta de tener también una útil interpretación económica. La lógica de este método es simple, aunque aquí no intentaremos una presentación rigurosa.8 En una sección anterior se analizaron las condiciones necesarias para un máximo local. Se demostró que, en el punto óptimo, todas las derivadas parciales de f deben ser iguales a 0. Así, hay n ecuaciones (fi 0 para i 1, . . . , n) con n incógnitas (las x). En general, en estas ecuaciones pueden despejarse las x óptimas. Cuando las x están restringidas, sin embargo, hay al menos una ecuación adicional (la restricción), pero no variables adicionales. Por tanto, el conjunto de ecuaciones está sobredeterminado. La técnica de Lagrange introduce una variable adicional (el multiplicador de Lagrange) que no sólo ayuda a resolver el problema en cuestión (porque ahora hay n 1 ecuaciones con n 1 incógnitas), sino que además tiene una interpretación útil en una variedad de circunstancias económicas. El problema formal Más específicamente, supongamos que se desea encontrar los valores de x1, x2, …, xn que maximizan y f (x1, x2, . . . , xn), 8 (2.48) Para una presentación detallada, véase A. K. Dixit, Optimization in Economic Theory, 2a. ed. (Oxford University Press, Oxford, 1990), capítulo 2. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 40 Parte 1: Introducción sujeta a una restricción que sólo permite usar ciertos valores de las x. Una manera general de escribir esa restricción es g(x1, x2, . . . , xn) 0 (2.49) donde la función9 g representa la relación que debe mantenerse entre todas las x. Condiciones de primer orden El método del multiplicador de Lagrange comienza estableciendo la expresión lagrangiana ᏸ f (x1, x2, . . . , xn) g(x1, x2, . . . , xn), (2.50) donde es una variable adicional llamada multiplicador de Lagrange. Más adelante interpretaremos esta nueva variable. Pero primero adviértase que al sostenerse la restricción, ᏸ y f tienen el mismo valor [porque g(x1, x2, . . . , xn) 0]. En consecuencia, si limitamos nuestra atención a los valores de las x que satisfacen la restricción, determinar el valor máximo restringido de f equivale a determinar un valor crítico de ᏸ. Procedamos a hacerlo, tratando a también como una variable (además de las x). Con base en la ecuación 2.50 las condiciones para un punto crítico son: ᏸ f1 g1 0, x1 ᏸ f2 g2 0, x2 .. . ᏸ fn gn 0, xn ᏸ g(x1 , x2 , . . . , xn ) 0. (2.51) Las ecuaciones comprendidas en la ecuación 2.51 son entonces las condiciones para un punto crítico de la función ᏸ. Nótese que hay n 1 ecuaciones (una por cada x y una última para ) con n 1 incógnitas. En general en estas ecuaciones es posible despejar x1, x2, …, xn y . Tal solución tendrá dos propiedades: 1) las x obedecerán la restricción porque la última ecuación en 2.51 impone esa condición; y 2) entre todos los valores de x que satisfacen la restricción, los que también resuelven la ecuación 2.51 harán a ᏸ (y por tanto a f ) tan grande como sea posible (suponiendo que se satisfacen las condiciones de segundo orden). Así, el método del multiplicador de Lagrange ofrece un medio para hallar una solución al problema de maximización restringida que se planteó al principio.10 La solución de la ecuación 2.51 usualmente diferirá de aquella en el caso no restringido (véanse las ecuaciones 2.28). Más que proceder al punto en el que la contribución marginal de cada x es 0, la ecuación 2.51 nos obliga a parar en seco debido a la restricción. Sólo si la restricción no fuera efectiva (en cuyo caso, como se demostrará más adelante, sería igual a 0), las ecuaciones restringida y no restringida (y sus respectivas soluciones) coincidirían. Estas condiciones marginales que hemos revisado tienen interpretaciones económicas en muchas situaciones diferentes. 9 Como ya hemos señalado, cualquier función de x1, x2, …, xn puede escribirse de esta forma implícita. Por ejemplo, la restricción x1 x2 10 puede escribirse como 10 − x1 − x2 0. En capítulos posteriores aplicaremos este procedimiento al tratar con restricciones. Las restricciones que examinaremos frecuentemente serán lineales. 10 En estricto sentido, estas son las condiciones necesarias para un máximo local interior. En algunos problemas económicos es preciso enmendar estas condiciones (en formas muy obvias) para tomar en cuenta la posibilidad de que algunas de las x estén en el límite de la región de x permisibles. Por ejemplo, si se requiere que todas las x sean no negativas, podría ser que las condiciones de la ecuación 2.51 no se sostengan del todo, ya que podrían requerir x negativas. Consideraremos esta situación más adelante. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 41 Interpretación del multiplicador de Lagrange Hasta aquí hemos usado el multiplicador de Lagrange () sólo como un “truco” matemático para llegar a la solución que deseamos. De hecho, esa variable tiene también una interpretación económica importante que será central para nuestro análisis en muchos puntos de este libro. Para desarrollar esta interpretación, reescribamos la primera de las n ecuaciones de 2.51 como fn . gn f1 f 2 g1 g2 (2.52) En otras palabras, en el punto máximo la razón de fi respecto a gi es la misma para todas las x. Los numeradores en la ecuación 2.52 son las contribuciones marginales de cada x a la función f. Muestran el beneficio marginal que una unidad más de xi tendrá para la función maximizada (es decir, para f ). Quizá sea preferible dejar una interpretación completa de los denominadores en la ecuación 2.52 hasta que nos encontremos estas razones en aplicaciones económicas reales. Ahí veremos que estas suelen tener una interpretación de “costo marginal”. Es decir, reflejan la carga añadida a la restricción de usar ligeramente más xi. Como ejemplo, supongamos que la restricción requiere que el gasto total en x1 y x2 esté dado por una cantidad fija en dólares, F. Por tanto, la restricción es p1x1 p2x2 F (donde pi es el costo por unidad de xi). Usando nuestra presente terminología esta restricción se escribirá en forma implícita como g(x1, x2) F p1x1 p2x2 0. (2.53) gi pi (2.54) En esta situación, entonces, y la derivada gi reflejará en efecto el costo marginal por unidad del uso de xi. Prácticamente todos los problemas de optimización que encontraremos en capítulos posteriores tienen una interpretación similar respecto a los denominadores en la ecuación 2.52. El multiplicador de Lagrange como razón costo-beneficio Ahora se le puede dar una interpretación intuitiva a la ecuación 2.52. Esta indica que en las opciones óptimas de las x, la razón del beneficio marginal de incrementar xi respecto al costo marginal de incrementar xi debería ser la misma para cada x. Con objeto de ver que esta es una condición obvia para un máximo supongamos que no es cierta, que la “razón costo-beneficio” es mayor para x1 que para x2. En este caso, para alcanzar un máximo debería usarse un poco más x1. Considérese el uso de más x1, pero renunciando lo suficiente a x2 para mantener constante a g (la restricción). De ahí que el costo marginal de la x1 adicional usada iguale el costo ahorrado usando menos x2. Pero como la razón costo-beneficio (el monto de beneficio por unidad de costo) es mayor para x1 que para x2, los beneficios adicionales de usar más x1 superarían la pérdida en los beneficios de usar menos x2. Usar más x1 y propiamente menos x2 incrementaría entonces y, porque x1 ofrece mayor “impacto”. Sólo si las razones costo marginal-beneficio marginal son iguales para todas las x habrá un máximo local en el que ninguna variación pequeña en las x podrá incrementar el objetivo. En muchos apartados de este libro se desarrollarán aplicaciones concretas de este principio básico. El resultado es fundamental para la teoría microeconómica del comportamiento de optimización. El multiplicador de Lagrange () también puede interpretarse a la luz de este análisis. es la razón común costo-beneficio de todas las x. Es decir, beneficio marginal de xi costo marginal de xi Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (2.55) 8/23 42 Parte 1: Introducción para cada xi. Si la restricción se relajara un poco no importaría exactamente cuál x variara (en realidad, todas las x podrían alterarse), porque en el margen cada una promete la misma razón de beneficios en relación con los costos. El multiplicador de Lagrange proporciona entonces una medida de cómo una relajación general de la restricción afecta el valor de y. En esencia, asigna un “precio sombra” a la restricción. Una alta indica que y puede aumentar sustancialmente, relajando la restricción, porque cada x tiene una alta razón costo-beneficio. Un valor bajo de , por otro lado, indica que no hay mucho por ganar relajando la restricción. Si esta no es vinculante tendrá un valor de 0, indicando por tanto que la restricción no limita el valor de y. En ese caso, hallar el valor máximo de y sujeto a la restricción sería idéntico a hallar un máximo irrestricto. El precio sombra de la restricción es 0. Esta interpretación de también puede demostrarse usando el teorema de la envolvente, como se describirá más adelante.11 Dualidad Este análisis señala que existe una relación clara entre el problema de maximizar una función sujeta a restricciones y el de asignar valores a las restricciones. Esto refleja lo que se conoce como principio matemático de la dualidad: todo problema de maximización restringida tiene un problema dual asociado de minimización restringida, que dirige su atención a las restricciones del problema original (primordial). Por ejemplo, avanzando un poco en nuestra argumentación, los economistas suponen que los individuos maximizan su utilidad sujetos a una restricción presupuestal. Este es el problema primordial del consumidor. El problema dual para el consumidor es minimizar el gasto necesario para alcanzar un nivel dado de utilidad. O bien, el problema primordial de una empresa puede ser minimizar el costo total de los insumos utilizados para generar un cierto nivel de producción, mientras que el problema dual es maximizar la producción respecto a un costo total dado de insumos adquiridos. En capítulos posteriores se desarrollarán muchos ejemplos similares. Cada cual mostrará que siempre hay dos maneras de examinar cualquier problema de optimización restringida. A veces, adoptar un ataque frontal, analizando el problema primordial, puede llevar a grandes discernimientos. En otros casos el método de “puerta trasera” de examinar el problema dual puede ser más instructivo. Cualquiera que sea la ruta que se siga los resultados, por lo general aunque no siempre, serán idénticos; así, la decisión que se tome será sobre todo cuestión de conveniencia. EJEMPLO 2.7 Maximización restringida: estado de salud, nuevamente Volvamos de nuevo a nuestro (quizá tedioso) problema de maximización de la salud. Como ya se dijo, la meta del individuo es maximizar y x21 2x1 x22 4x2 5, pero ahora supongamos que las opciones de x1 y x2 están restringidas por el hecho de que el individuo sólo puede tolerar una dosis de medicamento al día. Es decir, x1 x2 1 (2.56) o 1 x1 x2 0. 11 El análisis en el texto concierne a problemas que involucran una sola restricción. En general, es posible manejar m restricciones (m n) introduciendo simplemente m nuevas variables (multiplicadores de Lagrange) y procediendo en forma análoga a la ya explicada. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía Nótese que el punto óptimo original x1 1, x2 2 ya no es alcanzable, debido a la restricción sobre posibles dosis: hay que hallar otros valores. Para ello primero se establece la expresión lagrangiana: ᏸ x21 2x1 x22 4x2 5 (1 x1 x2). (2.57) La diferenciación de ᏸ respecto a x1, x2 y da la siguiente condición necesaria para un máximo restringido: ᏸ 2x1 2 0, x1 ᏸ 2x2 4 0, x2 ᏸ 1 x1 x2 0. (2.58) Ahora, en estas ecuaciones deben despejarse los valores óptimos de x1, x2 y . El uso de las ecuaciones primera y segunda da 2x1 2 2x2 4 o x1 x2 1. (2.59) Sustituir este valor de x1 en la restricción produce la solución: x2 1, x1 0. (2.60) Es decir, si esta persona puede tolerar sólo una dosis de medicamento debe optar por tomar únicamente el segundo medicamento. Usando cualquiera de las dos primeras ecuaciones, es fácil completar nuestra solución demostrando que 2. (2.61) Esta es entonces la solución del problema del máximo restringido. Si x1 0, x2 1, entonces y adopta el valor 8. Restringir los valores de x1 y x2 para que sumen 1 ha reducido el valor máximo de estado de salud, y, de 10 a 8. PREGUNTA: Supongamos que este individuo puede tolerar dos dosis diarias. ¿Sería esperable que y aumentara? ¿Aumentos en la tolerancia más allá de tres dosis diarias tendrían algún efecto en y? EJEMPLO 2.8 Cercas óptimas y maximización restringida Supongamos que un agricultor posee una cerca de cierta extensión, P, y desea rodear la mayor área rectangular posible. ¿Qué forma de área debería elegir? Este es evidentemente un problema de maximización restringida. Para resolverlo, sea x la longitud de un lado del rectángulo y y la longitud del otro. El problema es entonces elegir x y y de tal manera que maximicen el área del terreno (dada por A x ∙ y), sujeta a la restricción de que el perímetro está fijo en P 2x 2y. Al establecer la expresión lagrangiana da ᏸ x ∙ y (P 2x 2y), Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (2.62) 43 8/23 44 Parte 1: Introducción donde es un multiplicador de Lagrange desconocido. Las condiciones de primer orden para un máximo son ᏸ y x ᏸ x y ᏸ P 2 0, 2 0, 2x (2.63) 2y 0. En las tres ecuaciones 2.63 deben despejarse simultáneamente x, y y . Las dos primeras ecuaciones señalan que y/2 x/2 , lo cual indica que x debe ser igual a y (el terreno debe ser cuadrado). También implican que x y y deben seleccionarse de tal forma que la razón de los beneficios marginales en relación con el costo marginal sea la misma para ambas variables. El beneficio (en términos de área) de una unidad más de x está dado por y (el área aumenta en 1 ∙ y), y el costo marginal (en términos del perímetro) es de 2 (el perímetro disponible se reduce en 2 por cada unidad en la que aumenta la longitud del lado x). Las condiciones para un máximo establecen que esta razón debe ser igual para cada una de las variables. Puesto que ya hemos demostrado que x y, podemos usar la restricción para demostrar que P x y , 4 (2.64) P k . 8 (2.65) y dado que y 2, Interpretación del multiplicador de Lagrange. Si al agricultor le interesara saber cuánto terreno más podría rodear añadiendo una yarda de cerca, el multiplicador de Lagrange sugiere que podría saberlo dividiendo el actual perímetro entre 8. Algunos números específicos podrían aclarar esto. Supongamos que el terreno tiene un perímetro de 400 yardas. Si el agricultor ha planeado “óptimamente”, este terreno será un cuadrado de 100 yardas ( P/4) por lado. El área circundada será entonces de 10 000 yardas cuadradas. Supongamos ahora que el perímetro (es decir, la cerca disponible) se extiende una yarda más. Así, la ecuación 2.65 “predecirá” que el área total aumentaría en aproximadamente 50 ( P/8) yardas cuadradas. Que este es el caso en efecto puede demostrarse como sigue: dado que el perímetro es ahora de 401 yardas, cada lado del cuadrado será de 401/4 yardas. Por tanto, el área total del terreno es (401/4)2, lo que, según la calculadora de los autores, equivale a 10 050.06 yardas cuadradas. De ahí que la “predicción” de un incremento de 50 yardas cuadradas provista por el multiplicador de Lagrange resulte muy próxima. Como en todos los problemas de maximización restringida, aquí el multiplicador de Lagrange ofrece información útil sobre el valor implícito de la restricción. Dualidad. El dual de este problema de maximización restringida es que, respecto a un área dada de un terreno rectangular el agricultor desea minimizar la cerca requerida para rodearlo. Matemáticamente, el problema es minimizar P 2x 2y, (2.66) A x ∙ y. (2.67) ᏸD 2x 2y D(A x ∙ y) (2.68) sujeta a la restricción de Establecer la expresión lagrangiana (donde la D denota el concepto dual) produce las siguientes condiciones de primer orden para un mínimo: Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía ᏸD 2 x ᏸD 2 y 45 D y 0, D x 0, (2.69) ᏸD A x y 0. D La resolución de estas ecuaciones como se hizo antes produce el resultado x y A. (2.70) De nueva cuenta, el terreno debe ser cuadrado para minimizar la longitud de la cerca. El valor del multiplicador de Lagrange en este problema es 2 2 2 D . y x A (2.71) Como ya se comentó, este multiplicador de Lagrange indica la relación entre el objetivo (minimizar la cerca) y la restricción (necesidad de rodear el terreno). Si el terreno fuera de 10 000 yardas cuadradas, como ya vimos, se necesitarían 400 yardas de cerca. Añadir al terreno una yarda cuadrada requeriría alrededor de .02 yardas más de cerca (2/ A 2/100). El lector podría sacar su calculadora para demostrar que este es el caso: una cerca de 100.005 yardas por lado rodeará exactamente 10 001 yardas cuadradas. Aquí, como en la mayoría de los problemas de dualidad, el valor del multiplicador de Lagrange en el dual es el recíproco del valor del multiplicador de Lagrange en el problema original. Ambos dan la misma información, aunque de manera un poco distinta. PREGUNTAS: Una restricción implícita aquí es que el terreno del agricultor es rectangular. Si no se impusiera esta restricción, ¿de qué forma sería el terreno que encierra el área máxima? ¿Cómo lo probarías? TEOREMA DE LA ENVOLVENTE EN PROBLEMAS DE MAXIMIZACIÓN RESTRINGIDA El teorema de la envolvente, ya expuesto en relación con problemas de maximización no restringida, también tiene importantes aplicaciones en problemas de maximización restringida. Aquí se ofrecerá una breve presentación de ese teorema. En capítulos posteriores examinaremos varias aplicaciones. Supongamos que se busca el valor máximo de y f (x1, . . . , xn; a), (2.72) g(x1, . . . , xn; a) 0, (2.73) sujeto a la restricción de donde se ha hecho explícita la dependencia de las funciones f y g respecto a algún parámetro a. Como ya se demostró, una manera de resolver este problema es establecer la expresión lagrangiana ᏸ f (x1, . . . , xn; a) g(x1, . . . , xn; a) (2.74) y resolver las condiciones de primer orden (véanse las ecuaciones 2.51) para los valores óptimos restringidos x1∗, …, xn∗. O bien, es posible demostrar que dy ᏸ (x , . . . , xn ; a). da a 1 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (2.75) 8/23 46 Parte 1: Introducción Es decir, la variación en el valor máximo de y que resulta al variar el parámetro a (y volver a calcularse todas las x de acuerdo con nuevos valores óptimos) puede hallarse diferenciando parcialmente la expresión lagrangiana (ecuación 2.74) y evaluando la derivada parcial resultante en el punto óptimo. De ahí que en la aplicación del teorema de la envolvente a problemas restringidos la expresión lagrangiana desempeñe el mismo papel que el que desempeña la función objetivo en problemas irrestrictos. Como un ejercicio simple, el lector podría querer demostrar que este resultado es válido para el problema de cercar el terreno rectangular descrito en el ejemplo 2.7.12 En el problema 2.12 se ofrece un esbozo de la prueba del teorema de la envolvente en problemas restringidos. RESTRICCIONES DE DESIGUALDAD En algunos problemas económicos no es necesario mantener con exactitud las restricciones. Por ejemplo, la restricción presupuestal de un individuo requiere que no gaste más de cierta cantidad por periodo, no obstante, es posible gastar por debajo de esa cantidad. En los problemas económicos también surgen restricciones de desigualdad en los valores permitidos a algunas variables. Usualmente, por ejemplo, las variables económicas deben ser positivas (sin embargo, pueden adoptar el valor de cero). En esta sección se demostrará cómo la técnica de Lagrange puede adaptarse a esas circunstancias. Aunque más adelante sólo encontraremos unos cuantos problemas que requieren estas matemáticas, el desarrollo aquí ilustrará algunos principios generales congruentes con la intuición económica. Ejemplo de dos variables Para evitar un exceso de notaciones engorrosas exploraremos las restricciones de desigualdad sólo para el caso simple que implica dos variables selectas. Los resultados derivados son fáciles de generalizar. Supongamos que se busca maximizar y f (x1, x2) sujeta a tres restricciones de desigualdad: 1. g(x1 , x2 2. x1 0; 3. x2 0. 0; y (2.76) De ahí que se tome en cuenta la posibilidad de que no sea necesario que la restricción introducida con anterioridad se mantenga con exactitud (no es necesario que una persona gaste todo su ingreso) por el hecho de que ambas x deban ser positivas (como en la mayoría de los problemas económicos). Variables laxas Una manera de resolver este problema de optimización es introducir tres nuevas variables (a, b y c) que conviertan las restricciones de desigualdad de la ecuación 2.76 en igualdades. Para garantizar que las desigualdades sigan siendo válidas elevaremos al cuadrado estas nuevas variables, asegurando así que los valores resultantes sean positivos. Usando este procedimiento las restricciones de desigualdad se convierten en 1. g(x1 , x2 a2 0; 2. x1 b 0; y 3. x2 c2 0. 2 (2.77) 12 En el problema original el perímetro P es el parámetro de principal interés. Al despejar los valores óptimos de x y y, y sustituirlos en la expresión del área (A) del terreno, es fácil demostrar que dA/dP P/8. La diferenciación de la expresión lagrangiana (ecuación 2.62) produce ᏸ/P y en los valores óptimos de x y y, dA/dP ᏸ/P P/8. Entonces el teorema de la envolvente ofrece, en este caso, una prueba adicional de que el multiplicador de Lagrange puede usarse para asignar a la restricción un valor implícito. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 47 Toda solución que obedezca estas tres restricciones de igualdad obedecerá también las de desigualdad. Resultará, asimismo, que los valores óptimos de a, b y c brindarán varios discernimientos sobre la naturaleza de las soluciones de un problema de este tipo. Solución usando multiplicadores de Lagrange Al convertir el problema original que implicaba desigualdades en uno que implica igualdades, ahora estamos en posición de usar métodos de Lagrange para resolverlo. Dado que hay tres restricciones deben introducirse tres multiplicadores de Lagrange: 1, 2 y 3. La expresión lagrangiana completa es ᏸ f(x1, x2) 1[g(x1, x2) a2] 2(x1 b2) 3(x2 c2). (2.78) Deseamos hallar los valores de x1, x2, a, b, c, 1, 2 y 3 que constituyen un punto crítico de esta expresión. Esto necesitará ocho condiciones de primer orden: ᏸ f1 1 g1 2 0, x1 ᏸ f2 1 g2 3 0, x2 ᏸ 2a1 0, a ᏸ 2b2 0, b ᏸ 2c3 0, c ᏸ g(x1 , x2 a2 0, 1 ᏸ x1 b2 0, 2 ᏸ x2 c2 0, 3 (2.79) En muchos sentidos estas condiciones se parecen a las derivadas anteriores para el caso de una restricción de igualdad (véase la ecuación 2.51). Por ejemplo, las tres condiciones finales repiten solamente las tres restricciones revisadas. Esto garantiza que cualquier solución cumpla estas condiciones. Las dos primeras ecuaciones también se parecen a las condiciones óptimas desarrolladas con anterioridad. Si 2 y 3 fueran iguales a 0 las condiciones serían, de hecho, idénticas. Pero aquí la presencia de los multiplicadores de Lagrange adicionales en las expresiones señala que las condiciones óptimas acostumbradas podrían no sostenerse con exactitud. Lasitud complementaria Las tres ecuaciones que implican las variables a, b y c ofrecen los discernimientos más importantes sobre la naturaleza de las soluciones de problemas que implican restricciones de desigualdad. Por ejemplo, la tercera línea de la ecuación 2.79 implica que, en la solución óptima, tanto 1 como a deben ser iguales a 0.13 En el segundo caso (a 0), la restricción g(x1, x2) 0 se sostiene con exactitud, y el valor calculado de 1 indica su importancia relativa para la función objetivo f. Por otro lado, si a 0, entonces 1 0, lo que demuestra que disponer de cierta lasitud en la restricción implica que su valor para el objetivo es de 0. En el contexto del consumo esto significa que si 13 No examinaremos el extraño caso en que estas dos variables son iguales a 0. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 48 Parte 1: Introducción una persona no gasta todo su ingreso, más ingreso inclusive tampoco haría nada para elevar su bienestar. Relaciones similares de lasitud complementaria también son válidas para la selección de variables x1 y x2. Por ejemplo, la cuarta línea de la ecuación 2.79 requiere que la solución óptima con b o 2 sea 0. Si 2 0, entonces la solución óptima tiene x1 0, y esta variable seleccionada satisface la prueba precisa costo-beneficio de que f1 1g1 0. De manera alterna, las soluciones donde b 0 tienen x1 0, y también requieren que 2 0. Así, esas soluciones no implican el uso de x1, porque esa variable no satisface la prueba costo-beneficio que aparece en la primera línea de la ecuación 2.79, la cual implica que f1 1g1 0. Un resultado idéntico es válido para la variable selecta x2. Estos resultados, conocidos como condiciones de Kuhn-Tucker en honor a sus descubridores, demuestran que las soluciones de los problemas de optimización que contienen restricciones de desigualdad diferirán en formas más bien simples de las de problemas similares que contienen restricciones de igualdad. De ahí que no podamos equivocarnos demasiado trabajando principalmente con restricciones que implican igualdades y suponiendo que podemos depender de la intuición para enunciar qué pasaría si los problemas respectivos contuvieran desigualdades. Este es el método general que adoptaremos en este libro.14 CONDICIONES DE SEGUNDO ORDEN Y CURVATURA Hasta aquí nuestro análisis de la optimización se ha centrado principalmente en las condiciones necesarias (de primer orden) para determinar un máximo. Esa es, en efecto, la práctica que seguiremos en gran parte de este libro porque, como veremos, la mayoría de los problemas económicos contienen funciones para las cuales también se satisfacen las condiciones de segundo orden para un máximo. Esto se debe a que esas funciones tienen las propiedades de curvatura correctas para garantizar, asimismo, la suficiencia de las condiciones necesarias para un óptimo. En esta sección ofreceremos un tratamiento general de estas condiciones de curvatura y su relación con las condiciones de segundo orden. Las explicaciones económicas de estas condiciones de curvatura se analizarán a lo largo del texto. Funciones de una variable Consideramos primero el caso en el que el objetivo, y, es una función de una variable, x. Es decir, y f (x). (2.80) Una condición necesaria para que esta función alcance su valor máximo en algún punto es que en ese punto dy f (x) 0 dx (2.81) Para garantizar que dicho punto es en efecto un máximo debemos tener y decreciente para movimientos desde aquél. Ya sabemos (por la ecuación 2.81) que para pequeñas variaciones en x el valor de x no cambia; lo que debemos comprobar es si y es creciente antes de llegar a esa “meseta”, y decreciente después. Ya se ha derivado una expresión para el cambio en y (dy), la cual está dada por la diferencial total dy f (x)dx. (2.82) 14 La situación puede ser mucho más compleja cuando no se puede confiar en este cálculo para dar una solución, quizá porque algunas de las funciones en un problema no son diferenciables. Para un análisis, véase Avinask K. Dixit, Optimization in Economic Theory, 2a. ed. (Oxford University Press, Oxford, 1990). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 49 Lo que requerimos ahora es que dy decrezca en relación con los incrementos reducidos en el valor de x. La diferencial de la ecuación 2.82 está dada por d(dy) d2 y d [f (x)dx dx f (x)dx dx f (x)dx2 . dx (2.83) Pero d2y 0 implica que f (x)dx2 0, (2.84) y debido a que dx2 debe ser positiva (porque todo lo elevado al cuadrado es positivo), tenemos f (x) 0 (2.85) como la condición requerida de segundo orden. Es decir, esta condición requiere que la función f tenga una forma cóncava en el punto crítico (contrástense las figuras 2.1 y 2.2). Las condiciones de curvatura que encontraremos en este libro representan generalizaciones de esta simple idea. EJEMPLO 2.9 Maximización de beneficios nuevamente En el ejemplo 2.1 se consideró el problema de determinar el máximo de la función 1 000q 5q2. (2.86) La condición de primer orden para un máximo requiere d 1 000 dq 10q 0 (2.87) o q∗ 100. (2.88) La segunda derivada de la función está dada por d2 dq2 10 0. (2.89) y de ahí que el punto q∗ 100 cumpla las condiciones suficientes para un máximo local. PREGUNTA: Aquí la segunda derivada siempre es negativa y no sólo en el punto óptimo. ¿Qué implica esto respecto del punto óptimo? ¿Cómo debe interpretarse el hecho de que la segunda derivada sea una constante? Funciones de dos variables Como segundo caso, consideremos y como una función de dos variables independientes: y f (x1, x2). (2.90) Una condición necesaria para que dicha función alcance su valor máximo es que sus derivadas parciales, tanto en la dirección x1 como en la dirección x2, sean iguales a 0. Es decir, Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 50 Parte 1: Introducción y f1 0, x1 y f2 0. x2 (2.91) Un punto que satisface estas condiciones estará en un sitio “plano” de la función (un punto donde dy 0) y, por tanto, será candidato a un máximo. A fin de garantizar que ese punto sea un máximo local y debe disminuir ante movimientos en cualquier dirección desde el punto crítico: en términos gráficos sólo hay un modo de dejar una cumbre y es bajar. Un argumento intuitivo Ya se describió por qué una generalización simple del caso de una variable indica que las dos segundas derivadas parciales propias f11 y f22 deben ser negativas para un máximo local. En nuestra analogía de la montaña, si la atención se reduce a movimientos Norte-Sur o Este-Oeste, la pendiente de la montaña debe disminuir al cruzar la cima; la pendiente debe cambiar de positiva a negativa. La complejidad particular que surge en el caso de dos variables implica movimientos a través del punto óptimo que no están solamente en las direcciones x1 o x2 (movimientos, digamos, de Noreste a Suroeste). En esos casos las derivadas parciales de segundo orden no dan información completa sobre cómo cambia la pendiente cerca del punto crítico. También deben ponerse condiciones a la derivada cruzada parcial (f12 f21) para garantizar que dy decrezca en relación con los movimientos que pasen por el punto crítico en cualquier dirección. Como veremos, estas condiciones equivalen a requerir que las derivadas parciales propias de segundo orden sean suficientemente negativas para servir de contrapeso a toda posible derivada cruzada parcial “perversa” o extraña. Por intuición, si la montaña es lo suficientemente empinada en las direcciones Norte-Sur y Este-Oeste, las fallas a este respecto relativamente menores en otras direcciones pueden ser compensadas. Un análisis formal Procedamos ahora a exponer estos puntos más formalmente. Lo que queremos descubrir son las condiciones que deben imponerse a las segundas derivadas parciales de la función f para garantizar que d2y es negativa para movimientos en cualquier dirección que pasen por el punto crítico. Recuérdese primero que la diferencial total de la función está dada por dy f1dx1 f2dx2. (2.92) La diferencial de esa función está dada por d2y ( f11dx1 f12dx2)dx1 ( f21dx1 f22dx2)dx2 (2.93) d2y f11 dx12 f12dx2dx1 f21dx1dx2 f22 dx22. (2.94) o Debido a que mediante el teorema de Young f12 f21, podemos ordenar los términos para obtener d2y f11 dx12 2f12dx1dx2 f22 dx22. (2.95) A fin de que la ecuación 2.95 sea inequívocamente negativa para cualquier cambio en las x (es decir, para cualquier opción de dx1 y dx2, obviamente es necesario que f11 y f22 sean negativas. Si, por ejemplo, dx2 0, entonces d2y f11 dx12 (2.96) f11 0. (2.97) y d y 0 implica que 2 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 51 Un argumento idéntico vale para f22 estableciendo dx1 0. Si ni dx1 ni dx2 son iguales a 0 debemos considerar la cruzada parcial, f12, al decidir si d2y es inequívocamente negativa. Puede usarse álgebra relativamente simple para demostrar que la condición requerida es15 2 f11 f22 f 12 0. (2.98) Funciones cóncavas Intuitivamente, lo que la ecuación 2.98 requiere es que las segundas derivadas parciales propias f11 y f22 sean suficientemente negativas para que su producto (que es positivo) sea mayor que todo posible efecto “perverso” de las derivadas cruzadas parciales f12 f21. Las funciones que obedecen esta condición se llaman funciones cóncavas. En tres dimensiones esas funciones parecen tazas invertidas (para una ilustración véase el ejemplo 2.11, pág. 53). Esta imagen deja en claro que un sitio plano en esa función es, en efecto, un máximo verdadero porque la función desciende siempre desde ese sitio. De modo más general, las funciones cóncavas tienen la propiedad de hallarse siempre bajo un plano tangente a ellas; el plano definido por el valor máximo de la función es simplemente un caso especial de esta propiedad. EJEMPLO 2.10 Condiciones de segundo orden: estado de salud, por última vez En el ejemplo 2.4 se consideró la función estado de salud y f(x1, x2) x12 2x1 x22 4x2 5. (2.99) Las condiciones de primer orden para un máximo son f1 f2 2x1 2 0, 2x2 4 0 (2.100) o x1 1, x2 2. (2.101) Las derivadas parciales de segundo orden para la ecuación 2.99 son f 11 2, f 22 2, f 12 0. (2.102) Estas derivadas obedecen claramente las ecuaciones 2.97 y 2.98, de manera que se satisfacen las condiciones tanto necesarias como suficientes para un máximo local.16 PREGUNTA: Describe la forma cóncava de la función estado de salud e indica por qué tiene un solo valor máximo global. 15 La prueba procede sumando y restando el término (f12 dx2)2/f11 a la ecuación 2.95 y factorizando. Pero este método sólo es aplicable a este caso especial. Un método más fácil de generalizar y que usa álgebra matricial reconoce que la ecuación 2.95 es una “forma cuadrática” en dx1 y dx2, y que las ecuaciones 2.97 y 2.98 equivalen a requerir que la matriz hessiana f11 f21 f12 f22 sea “definida negativa”. En particular, la ecuación 2.98 requiere que la determinante de esta matriz hessiana sea positiva. Para un análisis, véanse las extensiones de este capítulo. 16 Nótese que la ecuación 2.102 cumple las condiciones suficientes no sólo en el punto crítico, sino también para todas las posibles opciones de x1 y x2. Es decir, la función es cóncava. En ejemplos más complejos este no es necesariamente el caso: las condiciones de segundo orden sólo deben satisfacerse en el punto crítico para que ocurra un máximo local. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 52 Parte 1: Introducción Maximización restringida Para otra ilustración de condiciones de segundo orden, considérese el problema de elegir x1 y x2 para maximizar y f (x1, x2), (2.103) c b1x1 b2x2 0 (2.104) sujeta a la restricción lineal (donde c, b1 y b2 son parámetros constantes en el problema). En este libro encontrarás con frecuencia este tipo de problemas, que es un caso especial de los problemas de máximo restringido que ya examinamos y en los cuales se demostró que las condiciones de primer orden para un máximo pueden derivarse estableciendo la expresión lagrangiana ᏸ f (x1, x2) (c b1x1 b2x2). (2.105) La diferenciación parcial respecto a x1, x2 y produce los resultados ya conocidos: f1 c b1 0, f 2 b2 0, b1 x1 b2 x2 0. (2.106) En general, en estas ecuaciones es posible despejar los valores óptimos de x1, x2 y . Para garantizar que el punto derivado de ese modo sea un máximo local, deben examinarse de nuevo los movimientos desde los puntos críticos, usando la “segunda” diferencial total: d2y f11 dx12 2f12dx1dx2 f22 dx22. (2.107) En este caso, sin embargo, no todos las posibles pequeñas variaciones en las x son permisibles. Sólo aquellos valores de x1 y x2 que continúan satisfaciendo la restricción pueden considerarse opciones válidas del punto crítico. Para examinar estas variaciones debe calcularse el diferencial total de la restricción: b1dx1 b2dx2 0 (2.108) o b1 (2.109) dx1 . b2 Esta ecuación muestra las variaciones relativas en x1 y x2 permisibles al considerar movimientos desde el punto crítico. Para avanzar en este problema debemos usar las condiciones de primer orden. Las dos primeras implican dx2 f 1 b1 , f 2 b2 (2.110) y combinar este resultado con la ecuación 2.109 produce dx2 f1 dx1 . f2 (2.111) Ahora sustituimos esta expresión de dx2 en la ecuación 2.107 para mostrar las condiciones que deben ser válidas para que d2y sea negativa: Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía f1 dx1 f2 d2 y f 11 dx21 2f 12 dx1 f1 dx1 f2 f 22 2 f f2 2f 12 1 dx21 f 22 12 dx21 . f2 f2 f 11 dx21 53 (2.112) La combinación de términos y la colocación de cada uno sobre un denominador común dan d2 y ( f 11 f 22 2f 12 f 1 f 2 f 22 f 21 ) dx21 . f 22 (2.113) En consecuencia, para d2y 0 debe darse el caso de que f 11 f 22 2f 12 f 1 f 2 f 22 f 21 0. (2.114) Funciones cuasi cóncavas Aunque la ecuación 2.114 parece poco más que una masa excesivamente compleja de símbolos matemáticos, de hecho la condición es importante. Caracteriza a un conjunto de funciones denominadas funciones cuasi cóncavas. Estas funciones tienen la propiedad de que el conjunto de todos los puntos para los cuales tal función adopta un valor mayor que cualquier constante específica, es un conjunto convexo (es decir, dos puntos cualesquiera en el conjunto pueden unirse por una línea totalmente contenida en el conjunto). Muchos modelos económicos se caracterizan por dichas funciones y, tal como veremos en mayor detalle en el capítulo 3, en estos casos la condición de cuasi concavidad tiene una interpretación económica relativamente simple. Los problemas 2.9 y 2.10 examinan dos funciones cuasi cóncavas específicas que encontraremos con frecuencia en este libro. El ejemplo 2.11 muestra la relación entre funciones cóncavas y cuasi cóncavas. EJEMPLO 2.11 Funciones cóncavas y cuasi cóncavas Las diferencias entre funciones cóncavas y cuasi cóncavas pueden ilustrarse con la función17 y f (x1 , x2 ) (x1 x2 ) k , (2.115) donde las x sólo adoptan valores positivos, y el parámetro k puede adoptar varios valores positivos. Sea cual sea el valor que k adopte, esta función es cuasi cóncava. Una manera de demostrar esto es examinar las “curvas de nivel” de la función, igualando y con un valor específico, digamos c. En este caso y c (x1 x2 ) k o x1 x2 c1/ k c. (2.116) Pero esta es justo la ecuación de una hipérbola rectangular estándar. Evidentemente, el conjunto de puntos para el que y adopta valores mayores que c es convexo porque está limitado por esta hipérbola. Una forma más matemática de demostrar la cuasi concavidad aplicaría la ecuación 2.114 a esta función. Aunque el álgebra de esto es un poco compleja vale la pena el esfuerzo. Los diversos componentes de la ecuación 2.114 son: f 1 kx1k 1 xk2 , f 2 kxk1 x2k 1 , f 11 k(k 1)x1k 2 xk2 , f 22 k(k 1)xk1 x2k 2 , (2.117) f 12 k2 x1k 1 x2k 1 . 17 Esta función es un caso especial de la función de Cobb-Douglas. Para más detalles sobre esta función véanse el problema 2.10 y las extensiones de este capítulo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 54 Parte 1: Introducción Así, f 11 f22 2 f 12 f 1 f 2 f 22 f 21 k3 (k 1)x13k 2 x23k 2 2k4 x13k 2 x23k 2 k (k 1)x13k 2 x23k 2 2k3 x13k 2 x23k 2 1), 3 (2.118) la cual es evidentemente negativa, como requiere la cuasi concavidad. Que la función f sea cóncava depende del valor de k. Si k 0.5 la función es en efecto cóncava. Un modo intuitivo de ver esto es considerar sólo puntos en los que x1 x2. Para estos puntos, y (x21 ) k x2k 1 , la que, para k 0.5, es cóncava. Como alternativa, para k (2.119) 0.5 esta función es convexa. FIGURA 2.4 Funciones cóncavas y cuasi cóncavas En los tres casos estas funciones son cuasi cóncavas. Para una y fija sus curvas de nivel son convexas. Pero sólo para k 0.2 la función es estrictamente cóncava. El caso k 1.0 muestra evidentemente cuasi concavidad porque la función no está bajo su plano tangente. (a) k = 0.2 (b) k = 0.5 (c) k = 1.0 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 55 Una prueba más definitiva hace uso de las derivadas parciales de la ecuación 2.117. En este caso la condición de concavidad puede expresarse como f 11 f 22 f 212 k2 (k 1) 2 x12k 2 x22k x12k 2 x22k 2 [k2 (k x12k 1 x22k 1 [k2 2 1) 2 k4 x12k 2 x22k 2 k4 (2.120) 2k 1 , y esta expresión es positiva (como lo requiere la concavidad) para 2k 1) Por otro lado la función es convexa para k 0 o k 0.5. 0.5. Ilustración gráfica. La figura 2.4 ofrece ilustraciones tridimensionales de tres ejemplos específicos de esta función: para k 0.2, k 0.5 y k 1. Adviértase que en los tres casos las curvas de nivel de la función tienen formas convexas hiperbólicas. Es decir, para cualquier valor fijo de y las funciones son similares. Esto indica la cuasi concavidad de la función. Las principales diferencias entre las funciones están ilustradas por la forma en que el valor de y aumenta al aumentar ambas x juntas. En la figura 2.4a (cuando k 0.2), el aumento en y se reduce al incrementarse las x. Esto da a la función una forma redondeada, como una taza, que indica su concavidad. Para k 0.5, y parece aumentar linealmente con incrementos en ambas x. Este es el límite entre concavidad y convexidad. Por último, cuando k 1 (como en la figura 2.4c), los aumentos simultáneos en los valores de ambas x incrementan rápidamente y. La columna vertebral de la función es de forma convexa para reflejar esos rendimientos crecientes. Un detenido análisis de la figura 2.4a sugiere que toda función cóncava será también cuasi cóncava. En el problema 2.8 se te pedirá demostrar que este es el caso. Este ejemplo muestra que lo contrario a esta afirmación no es real; las funciones cuasi cóncavas no necesariamente son cóncavas. La mayoría de las funciones que encontraremos en este libro ilustrarán asimismo este hecho; la mayoría será cuasi cóncava pero no forzosamente cóncava. PREGUNTA: Explica por qué las funciones que se muestran en las figuras 2.4a y 2.4c tendrían valores máximos si las x estuvieran sujetas a una restricción lineal, pero sólo la gráfica en la figura 2.4a tendría un máximo restringido. FUNCIONES HOMOGÉNEAS Muchas de las funciones que se desprenden naturalmente de la teoría económica tienen propiedades matemáticas adicionales. Un conjunto particularmente importante de propiedades tiene que ver con el modo en que se comportan las funciones cuando la totalidad (o la mayoría) de sus argumentos aumentan proporcionalmente. Esas situaciones surgen cuando hacemos preguntas como qué pasaría si todos los precios aumentaran 10 por ciento, o cómo cambiaría la producción de una empresa si duplicara todos los insumos que utiliza. Pensar en estas interrogantes conduce naturalmente al concepto de funciones homogéneas. Específicamente, se dice que una función f(x1, x2, …, xn) es homogénea de grado k si f (tx1 , tx2 , . . . , txn ) t k f (x1 , x2 , . . . , xn ). (2.121) Los ejemplos más importantes de funciones homogéneas son aquellos para los cuales k 1 o k 0. Es decir, cuando una función es homogénea de grado uno, una duplicación de todos sus argumentos duplica el valor de la función. Para funciones que son homogéneas de grado cero, una duplicación de todos sus argumentos deja sin variaciones el valor de la función. Las funciones también pueden ser homogéneas para las variaciones en sólo ciertos subconjuntos de sus argumentos; es decir, una duplicación de algunas de las x puede duplicar el valor de la función si los Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 56 Parte 1: Introducción demás argumentos de la función se mantienen constantes. Usualmente, sin embargo, la homogeneidad se aplica a las variaciones en todos los argumentos de una función. Homogeneidad y derivadas Si una función es homogénea de grado k y puede diferenciarse, las derivadas parciales de la función serán homogéneas de grado k 1. Una prueba de esto se desprende directamente de la definición de homogeneidad. Por ejemplo, diferenciar la ecuación 2.121 respecto a su primer argumento da f (tx1 , . . . , txn ) f (x1 , . . . , xn ) t tk x1 x1 o f 1 (tx1 , . . . , txn ) t k 1 f 1 (x1 , . . . , xn ), (2.122) lo que demuestra que f1 satisface la definición de homogeneidad de grado k 1. Dado que las ideas marginales son tan frecuentes en la teoría microeconómica, esta propiedad indica que algunas propiedades importantes de efectos marginales pueden inferirse de las propiedades de la función subyacente. Teorema de Euler Otra caracterísitca útil de las funciones homogéneas puede demostrarse distinguiendo la definición de homogeneidad respecto al factor de proporcionalidad, t. En este caso, diferenciamos primero el miembro derecho de la ecuación 2.121 y luego el miembro izquierdo: kt k 1 f 1 (x1 , . . . , xn ) x1 f 1 (tx1 , . . . , txn xn f n (tx1 , . . . , txn ). Si concedemos que t 1, esta ecuación se convierte en kf (x1 , . . . , xn ) x1 f1 (x1 , . . . , xn xn fn (x1 , . . . , xn ). (2.123) Esta ecuación se denomina teorema de Euler (en honor al matemático que también descubrió la constante e) para funciones homogéneas. Demuestra que para una función homogénea existe una relación definida entre los valores de la función y los valores de sus derivadas parciales. Varias relaciones económicas importantes entre funciones se basan en esta observación. Funciones homotéticas Una función homotética se forma al tomar una transformación monótona de una función homogénea.18 Las transformaciones monótonas, por definición, preservan el orden de la relación entre los argumentos de una función y el valor de esa función. Si ciertos conjuntos de x producen valores más grandes de f, también producirán valores más grandes para una transformación monótona de f. Puesto que las transformaciones monótonas pueden adoptar muchas formas no es de esperar, sin embargo, que preserven una relación matemática exacta como la incorporada en funciones homogéneas. Consideremos, por ejemplo, la función y f(x1, x2) x1x2. Evidentemente, esta función es homogénea de grado 2; una duplicación de sus dos argumentos multiplicará el valor de la función por 4. Sin embargo, la función monótona que simplemente suma 1.0 a f [es decir, F( f ) f 1 x1x2 1] no es homogénea en absoluto. Así, excepto en casos especiales, las funciones homotéticas no poseen las propiedades de homogeneidad de sus funciones subyacentes. Las funciones homotéticas, sin embargo, preservan una importante característica de las 18 Dado que un caso limitante de una transformación monótona es dejar sin variaciones la función, todas las funciones homogéneas son también homotéticas. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 57 funciones homogéneas: que las opciones contenidas por la función sólo dependen de la razón de las dos variables en juego, no de sus niveles absolutos. Para demostrar esto, recuérdese que la ecuación 2.23 señala que para una función de dos variables de la forma y f (x1, x2) la opción contenida entre las dos variables requeridas para mantener constante el valor de la función está dada por dx2 dx1 f1 . f2 Si suponemos que f es homogénea de grado k, sus derivadas parciales serán homogéneas de grado k 1; por tanto, podemos escribir esta disyuntiva como: dx2 dx1 t k 1 f1 (tx1 , tx2 ) t k 1 f2 (tx1 , tx2 ) f1 (tx1 , tx2 ) . f2 (tx1 , tx2 ) (2.124) Sea ahora t 1/x2, de modo que la ecuación 2.124 se convierte en dx2 dx1 f1 (x1 /x2 , 1) , f2 (x1 /x2 , 1) (2.125) lo que demuestra que las opciones contenidas en f sólo dependen de la razón de x1 a x2. Si aplicamos cualquier transformación monótona F (con F 0 ) a la función homogénea original f, las opciones contenidas por la nueva función homotética F[ f(x1, x2)] se mantienen sin variaciones: dx2 dx1 Ff1 (x1 /x2 , 1) Ff2 (x1 /x2 , 1) f1 (x1 /x2 , 1) . f2 (x1 /x2 , 1) (2.126) En muchos apartados de este libro resultará instructivo analizar algunos resultados teóricos con gráficas bidimensionales y la ecuación 2.126 se puede usar para dirigir nuestra atención a las razones de las variables clave más que a sus niveles absolutos. EJEMPLO 2.12 Propiedades cardinales y ordinales En economía aplicada a veces es importante conocer la relación numérica exacta entre variables. Por ejemplo, en el estudio de la producción podría desearse conocer precisamente cuánta producción extra se generaría contratando otro trabajador. Esta es una pregunta acerca de las propiedades “cardinales” (es decir, numéricas) de la función de producción. En otros casos sólo podría interesar el orden en que se clasifican varios puntos. En la teoría de la utilidad, por ejemplo, suponemos que la gente puede clasificar paquetes de bienes y que seleccionará aquel con la más alta clasificación, pero que no hay valores numéricos únicos asignados a esas clasificaciones. Matemáticamente, las propiedades ordinales de las funciones son preservadas por cualquier transformación monótona porque, por definición, una transformación monótona preserva el orden. Usualmente, sin embargo, las propiedades cardinales no son preservadas por transformaciones monótonas arbitrarias. Estas distinciones se ilustran con las funciones que se examinaron en el ejemplo 2.11. Ahí se estudiaron transformaciones monótonas de la función f (x1 , x2 ) (x1 x2 ) k (2.127) considerando varios valores del parámetro k. Se demostró que la cuasi concavidad (una propiedad ordinal) fue preservada por todos los valores de k. De ahí que cuando se abordan problemas centrados en maximizar o minimizar esa función sujeta a restricciones lineales no debe preocupar cuál es precisamente la transformación que se usa. Por otro lado, la función en la ecuación 2.127 es cóncava (una propiedad cardinal) sólo para un rango reducido de valores de k. Muchas transformaciones monótonas destruyen la concavidad de f. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 58 Parte 1: Introducción La función en la ecuación 2.127 también puede usarse para ilustrar la diferencia entre funciones homogéneas y homotéticas. Un incremento proporcional en los dos argumentos de f produciría f (tx1 , tx2 ) t 2k x1 x2 t 2k f (x1 , x2 ). (2.128) De ahí que el grado de homogeneidad para esta función dependa de k; es decir, el grado de homogeneidad no se preserva independientemente de qué transformación monótona se use. O bien, la función en la ecuación 2.127 es homotética porque dx2 dx1 f1 f2 kx1k 1 xk2 kxk1 x2k 1 x2 . x1 (2.129) Es decir, la disyuntiva entre x1 y x2 sólo depende de la razón de estas dos variables y no se ve afectada por el valor de k. De ahí que la homoteticidad sea una propiedad ordinal. Como veremos, esta propiedad resulta conveniente cuando se desarrollan argumentos gráficos sobre proposiciones económicas. PREGUNTA: ¿Cómo cambiaría el análisis en este ejemplo si consideráramos transformaciones monótonas de la forma f (x1, x2, k) x1x2 k para varios valores de k? INTEGRACIÓN La integración es otra de las herramientas de cálculo que halla varias aplicaciones en la teoría microeconómica. Esta técnica se usa para calcular áreas que miden varios resultados económicos, así como generalmente para brindar un medio con el cual resumir resultados que ocurren en el tiempo o entre individuos. Nuestro tratamiento del tema aquí necesariamente ha de ser breve; los lectores interesados en adquirir bases más completas deberán consultar las referencias al final de este capítulo. Antiderivadas Formalmente la integración es la inversa de la diferenciación. Cuando se te pide calcular la integral de una función, f(x), se te pide encontrar una función que tenga f (x) como su derivada. Si llamamos a esta “antiderivada” F(x), se supone que esta función tiene la propiedad de que dF(x) F(x) f (x). dx (2.130) Si esa función existe, se denota como F(x) 3f (x) dx. (2.131) La razón precisa de esta notación, de apariencia más bien extraña se describirá en detalle más adelante. Primero examinemos algunos ejemplos. Si fx x, entonces F(x) 3f (x) dx 3x dx x2 C, 2 (2.132) donde C es una “constante de integración” arbitraria que desaparece en la diferenciación. La exactitud de este resultado puede comprobarse fácilmente: F(x) d(x2 / 2 C) x 0 x. dx Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (2.133) 8/23 Capítulo 2: Matemáticas para microeconomía 59 Cálculo de antiderivadas El cálculo de antiderivadas puede ser muy simple, o difícil, o exasperante, o imposible, dependiendo de la f (x) particular especificada. Aquí consideraremos tres métodos simples para hacer dichos cálculos aunque, como es de esperar, no siempre funcionan. 1. Conjetura creativa. Probablemente el modo más común de determinar integrales (antiderivadas) sea el de trabajar hacia atrás, preguntándonos “¿qué función producirá f (x) como su derivada?”. He aquí algunos ejemplos obvios: x3 F(x) 3x2 dx C, 3 xn1 F(x) 3xn dx C, n 1 ax3 bx2 F(x) 3(ax2 bx c) dx cx C, 3 2 F(x) 3ex dx ex C, F(x) 3ax dx F(x) 3 (2.134) ax C, ln a 1 dx ln(x) C, x F(x) 3(ln x) dx x ln x x C. Deberías usar la diferenciación para comprobar que todas estas ecuaciones cumplen la propiedad de que F(x) f(x). Nótese que en cada caso la integral incluye una constante de integración porque las antiderivadas son únicas sólo hasta una constante aditiva, que se volvería cero en la diferenciación. En muchos sentidos, los resultados de la ecuación 2.134 (o generalizaciones triviales de ella) serán suficientes para nuestros propósitos en este libro. No obstante, he aquí dos métodos más que pueden funcionar cuando la intuición falla. 2. Cambio de variable. Una redefinición ingeniosa de variables puede hacer a veces que una función sea mucho más fácil de integrar. Por ejemplo, no es del todo obvio cuál es la integral de 2x/(1 x2). Pero si se concede que y 1 x2, entonces dy 2xdx y 2x 1 2 31 x2 dx 3 y dy ln(y) ln(1 x ). (2.135) La clave de este procedimiento está en descomponer la función original en un término en y y un término en dy. Se necesita mucha práctica para distinguir patrones en los que esto funcionará. 3. Integración por partes. Un método similar para determinar integrales hace uso de la identidad duv udv vdu para cualesquiera dos funciones u y v. La integración de esta diferencial produce 3duv uv 3u dv 3v du o 3u dv uv 3v du. (2.136) Aquí la estrategia es definir funciones u y v de tal modo que la integral desconocida de la izquierda pueda calcularse mediante la diferencia entre las dos expresiones conocidas de la derecha. Por ejemplo, de ninguna manera es obvio cuál es la integral de xex. Pero podemos definir u x (por tanto, du dx) y dv exdx (por tanto, v ex). De ahí que ahora tengamos x 3xe dx 3u dv uv x 3v du xe Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 x 3e dx ( x 1)ex C. (2.137) 8/23 60 Parte 1: Introducción De nueva cuenta, sólo la práctica puede sugerir patrones útiles en las formas en que u y v pueden definirse. Integrales definidas Las integrales que hemos analizado hasta aquí son integrales “indefinidas”; sólo ofrecen una función general, que es la antiderivada de otra función. Un método algo distinto, aunque conexo, usa la integración para sumar el área bajo una gráfica de una función en un intervalo definido. La figura 2.5 ilustra este proceso. Se desea conocer el área bajo la función f(x) de x a a x b. Una manera de hacer esto sería dividir el intervalo en fragmentos más pequeños de x( x) y sumar las áreas de los rectángulos que aparecen en la figura. Es decir: área bajo f (x f (xi ) (2.138) xi , i donde la notación indica que la altura de cada rectángulo es aproximada por el valor de f(x) para un valor de x en el intervalo. Llevar al límite este proceso, contrayendo el tamaño de los intervalos x, rinde una medida exacta del área deseada y se denota con: xb área bajo f (x) 3 f (x) dx. (2.139) xa Esto explica entonces el origen del peculiar signo de la integral, una S estilizada que indica “suma”. Como veremos, integrar es una manera general de sumar los valores de una función continua en un intervalo. FIGURA 2.5 Las integrales definidas muestran las áreas bajo la gráfica de una función. Las integrales definidas miden el área bajo una curva sumando áreas rectangulares, como se advierte en la gráfica. La dimensión de cada rectángulo es fx(dx). f(x) f(x) a Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. b 23.08.2019 x 8/23 Capítulo 2: Matemáticas para microeconomía 61 Teorema fundamental del cálculo Evaluar la integral en la ecuación 2.139 es simple si conocemos la antiderivada de f (x), digamos F(x). En este caso tenemos xb área bajo f (x) 3 f (x) dx F(b (2.140) F(a). xa Es decir, lo único que debemos hacer es calcular la antiderivada de f(x) y restar el valor de esta función en el límite inferior de la integración a su valor en el límite superior de la integración. Este resultado se conoce como teorema fundamental del cálculo porque une directamente las dos principales herramientas del cálculo: derivadas e integrales. En el ejemplo 2.13 se demuestra que este resultado es mucho más general que simplemente una forma de medir áreas. Puede usarse para ilustrar uno de los principios conceptuales primarios de la economía: la distinción entre “existencias” y “flujos”. EJEMPLO 2.13 Existencias y flujos La integral definida proporciona un medio útil para sumar cualquier función que ofrezca un flujo continuo en el tiempo. Por ejemplo, supongamos que el incremento neto de población de un país (nacimientos menos muertes) puede aproximarse con la función f(t) 1 000e0.02t. De ahí que el cambio neto de población sea creciente, a una tasa de 2 por ciento al año; es decir, 1 000 personas nuevas en el año 0; 1 020 personas nuevas en el primer año, 1 041 en el segundo y así sucesivamente. Supongamos que deseamos conocer cuánto se incrementará en total la población en 50 años. Esta podría ser una estimación tediosa sin el cálculo, pero usar el teorema fundamental del cálculo ofrece una respuesta fácil: t50 t50 50 incremento de la población 3 f (t) dt 3 1 000e0.02t dt F(t) t0 t0 0.02t 50 1 000e 0.02 0 1 000e 0.02 0 50 000 85 914 (2.141) [donde la notación ba indica que la expresión debe evaluarse como F(b) − F(a)]. De ahí que la conclusión sea que la población aumentará en cerca de 86 000 personas en los próximos 50 años. Adviértase cómo el teorema fundamental del cálculo une un concepto de “flujo”, el incremento neto de la población (el cual se mide como monto por año), con un concepto de “existencias”, la población total (la cual se mide en una fecha específica y no tiene una dimensión temporal). Adviértase también que el cálculo de 86 000 se refiere sólo al incremento total entre el año 0 y el año 50. Para conocer la población total real en cualquier fecha, tendríamos que sumar el número de personas en la población en el año 0. Esto sería similar a elegir una constante de integración en este problema específico. Consideremos ahora una aplicación con más contenido económico. Supongamos que los costos totales de una empresa particular están dados por C(q) 0.1q2 500 (donde q representa la producción en cierto periodo). Aquí el término 0.1q2 representa costos variables (costos que varían con la producción), mientras que la cifra de 500 representa costos fijos. Los costos marginales de este proceso de producción pueden hallarse por diferenciación —MC dC(q)/dq 0.2q—, y de ahí que los costos marginales sean crecientes con q y los costos fijos se dejen fuera en la diferenciación. ¿Cuáles son los costos totales asociados con producir, digamos, q 100? Una manera de responder esta pregunta es usar directamente la función de costo total: C(100) 0.1(100)2 500 1 500. Otra sería integrar el costo marginal en el rango de 0 a 100 para obtener el costo variable total: q100 100 costo variable 3 0.2q dq 0.1q2 q0 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 1 000 0 23.08.2019 0 1 000, (2.142) 8/23 62 Parte 1: Introducción a lo que habría que sumar los costos fijos de 500 (la constante de integración en este problema) para obtener los costos totales. Claro que este método para arribar al costo total es mucho más laborioso que sólo usar directamente la ecuación de costo total. Pero la derivación demuestra que el costo variable total entre dos niveles cualesquiera de producción puede hallarse por integración como el área bajo la curva de costo marginal, conclusión que nos será útil en algunas aplicaciones prácticas. PREGUNTA: ¿Cómo calcularías el costo variable total asociado con la expansión de la producción de 100 a 110? Explica por qué los costos fijos no entran en este cálculo. Diferenciación de una integral definida Ocasionalmente desearemos diferenciar una integral definida, usualmente en el contexto de maximizar el valor de dicha integral. Aunque hacer tales diferenciaciones puede ser un poco complejo a veces, hay algunas reglas que deberían facilitar el proceso. 1. Diferenciación respecto a la variable de integración. Esta cuestión es complicada, pero instructiva. Una integral definida tiene un valor constante; de ahí que su derivada sea igual a cero. Es decir: b d ∫a f (x) dx 0. dx (2.143) El proceso de suma requerido por la integración se ha efectuado ya una vez que hemos escrito una integral definida. No importa si la variable de integración es x, t o cualquier otra. El valor de esta suma integrada no cambiará al variar la variable x, sin importar qué sea x (no obstante véase la regla 3, más adelante). 2. Diferenciación respecto al límite superior de la integración. Cambiar el límite superior de la integración obviamente cambiará el valor de una integral definida. En este caso debe distinguirse entre la variable determinante del límite superior de la integración (digamos x) y la variable de integración (digamos t). El resultado es entonces una aplicación simple del teorema fundamental del cálculo. Por ejemplo: x d ∫ a f (t)dt d[F(x F(a f (x dx dx 0 f (x), (2.144) donde F(x) es la antiderivada de f(x). Remitiéndonos a la figura 2.5 podemos ver por qué esta conclusión tiene sentido: la pregunta es cómo variará el valor de la integral definida si x aumenta ligeramente. La respuesta obvia es que el valor de la integral aumenta en el equivalente a la altura de f(x) (nótese que este valor dependerá en última instancia del valor especificado de x). Si el límite superior de la integración es una función de x, este resultado puede generalizarse usando la regla de cadena: g(x) d ∫a f (t) dt d[F(g(x F(a d[F(g(x dx dx dx f dg(x) f (g(x))g(x), dx (2.145) donde, nuevamente, el valor específico de esta derivada dependerá del valor supuesto de x. Por último, adviértase que la diferenciación respecto a un límite inferior de la integración sólo modifica el signo de esta expresión: b d ∫ g(x) f (t) dt dx d[F(b F(g(x dx Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. dF(g(x)) dx 23.08.2019 f (g(x)) g(x). (2.146) 8/23 Capítulo 2: Matemáticas para microeconomía 63 3. Diferenciación respecto a otra variable relevante. En algunos casos lo que se desee será integrar una expresión que sea una función de varias variables. En general, esto puede implicar integrales múltiples y la diferenciación podría complicarse. Pero hay un caso simple que cabe mencionar aquí. Supongamos que tenemos una función de dos variables, f(x, y), y deseamos integrar esta función respecto a la variable x. El valor específico para esta integral dependerá obviamente del valor de y, incluso podemos preguntarnos cómo variará ese valor al variar y. En este caso, para obtener un resultado es posible “diferenciar mediante el signo de la integral”. Es decir: b b d ∫ a f (x, y) dx 3f y (x, y) dx. dy (2.147) a Esta expresión señala que primero podemos diferenciar parcialmente f(x, y) respecto de y antes de proceder a calcular el valor de la integral definida. Por supuesto que el valor resultante podría seguir dependiendo del valor específico asignado a y, pero a menudo producirá más discernimientos económicos que el problema original. En el problema 2.8 encontraremos algunos ejemplos adicionales del uso de integrales definidas. OPTIMIZACIÓN DINÁMICA Algunos problemas de optimización que se presentan en la microeconomía implican periodos múltiples.19 Nos interesa determinar la trayectoria temporal óptima para que una variable o un conjunto de variables consigan optimizar alguna meta. Por ejemplo, un individuo podría querer elegir una trayectoria de consumo de por vida que maximice su utilidad. O una empresa podría estar buscando una trayectoria de decisiones de insumos y producción que maximice el valor presente de todos los beneficios futuros. La caracterísitica particular de estos problemas y que los vuelve difíciles es que las decisiones que se toman en un periodo afectan los resultados en periodos posteriores. De ahí que deba tomarse explícitamente en cuenta esta interrelación al seleccionar trayectorias óptimas. Si las decisiones en un periodo no afectaran periodos posteriores, el problema no tendría una estructura “dinámica”; se podrían sencillamente optimizar las decisiones en cada periodo sin considerar qué sucederá después. Aquí, sin embargo, deseamos tomar explícitamente en cuenta consideraciones dinámicas. El problema del control óptimo Matemáticos y economistas han desarrollado numerosas técnicas para resolver problemas de optimización dinámica. Las referencias al final de este capítulo ofrecen amplias introducciones a esos métodos. Aquí, sin embargo, sólo nos interesará uno de ellos, con muchas semejanzas con las técnicas de optimización que ya hemos estudiado en este capítulo: el problema del control óptimo. El marco del problema es relativamente simple. Un tomador de decisiones busca determinar la trayectoria temporal óptima para alguna variable x(t) en un intervalo específico [t0, t1]. Las variaciones en x son gobernados por una ecuación diferencial: dx(t) g[x(t), c(t), t , dt (2.148) donde la variable c(t) se usa para “controlar” el cambio en x(t). En cada periodo, el tomador de decisiones deriva valor de x y c de acuerdo con la función f[x(t), c(t), t] y su meta de optimizar 19 En esta sección trataremos los problemas de optimización dinámica como ocurrentes en el tiempo. En otros contextos, las mismas técnicas pueden usarse para resolver problemas de optimización que ocurren en un continuo de empresas o individuos cuando las opciones óptimas para un agente afectan lo que es óptimo para otros. El material de esta sección se usará sólo en algunos pocos apartados de este libro, pero se ofrece aquí como una referencia conveniente. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 64 Parte 1: Introducción tt01 f[x(t), c(t), t] dt. A menudo este problema también estará sujeto a restricciones de “punto final” sobre la variable x. Estas podrían escribirse como x(t0) x0 y x(t1) x1. Nótese que este problema es “dinámico”. Cualquier decisión acerca de cuánto variar x en este periodo afectará no sólo el valor futuro de x, sino también valores futuros de la función resultante f. El problema es entonces cómo mantener x(t) en su trayectoria óptima. La intuición económica puede ayudar a resolver este problema. Supongamos que sólo nos interesa la función f y elegimos x y c para optimizarla en cada instante. Hay dos dificultades en este enfoque “miope”. Primero, en realidad no estamos en libertad de “elegir” x en ningún momento. Más bien, el valor de x estará determinado por su valor inicial x0 y su historia de varaciones dadas por la ecuación 2.148. Una segunda dificultad con este enfoque miope es que no considera la naturaleza dinámica del problema, pues no cuestiona cómo las decisiones de este periodo afectarán el futuro. Necesitamos una manera de reflejar la dinámica de este problema en las decisiones de un periodo. Asignar el valor (precio) correcto a x en cada instante hará justo eso. Como este precio implícito tendrá muchas semejanzas con los multiplicadores de Lagrange, que ya hemos estudiado en este capítulo, lo llamaremos (t). El valor de es tratado como una función de tiempo pues la importancia de x obviamente puede cambiar en el tiempo. El principio del óptimo Examinemos ahora el problema del tomador de decisiones en un punto en el tiempo. Este debe interesarse tanto en el valor corriente de la función objetivo f[x(t), c(t), t] como en el cambio implicado en el valor de x(t). Puesto que el valor corriente de x(t) está dado por (t)x(t), el índice de cambio instantáneo de este valor está dado por: d[(t)x(t dx(t) d(t) , (t) x(t) dt dt dt (2.149) así que, en cualquier momento t, una medida completa del valor de interés20 para el tomador de decisiones es H f [x(t), c(t), t (t)g[x(t), c(t), t x(t) d(t) . dt (2.150) Este valor completo representa tanto los beneficios corrientes recibidos como la variación instantánea en el valor de x. Ahora es posible preguntar qué condiciones deben aplicarse a x(t) y c(t) para optimizar esta expresión.21 Esto es: H f c g c 0 o fc g c ; c H d(t) f x g x 0 o f x g x dt x d(t) . dt (2.151) Estas son entonces las dos condiciones óptimas para este problema dinámico. Usualmente se les llama el principio del óptimo. Esta solución del problema de control óptimo fue propuesta originalmente por el matemático ruso L. S. Pontryagin y sus colegas, a principios de la década de 1960. Aunque idealmente la lógica del principio del óptimo se puede ilustrar con las aplicaciones económicas que encontraremos más adelante, un breve resumen de la intuición en su base será útil. La primera condición inquiere sobre la opción óptima de c. Sugiere que, en el margen, la ganancia de c en términos de la función f debe ser compensada por las pérdidas de c en términos 20 Denotamos esta expresión de valor corriente con H para indicar su semejanza con la expresión de Hamilton que se usa en la teoría formal de la optimización dinámica. Sin embargo, generalmente la expresión de Hamilton no tiene el último término de la ecuación 2.150. 21 Obsérvese que aquí en realidad la variable x no es una variable selecta; su valor está determinado por la historia. La diferenciación respecto a x puede considerarse como esta pregunta implícita: “Si x(t) fuera óptima, ¿qué características tendría?”. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 65 del valor de su capacidad para cambiar x. Es decir, los beneficios presentes deben compararse con los costos futuros. La segunda condición tiene que ver con las características que debería tener una trayectoria temporal óptima de x(t). Implica que, en el margen, todo beneficio neto de una unidad más de x (ya sea en términos de f o del valor adjunto de variaciones en x) debe ser compensada por variaciones en el valor implicado de x. Es decir, el beneficio neto de una unidad adicional de x debe compararse con el decreciente valor futuro de x. EJEMPLO 2.14 Asignación de una oferta fija Como muy simple ilustración del principio del óptimo supongamos que alguien hereda 1 000 botellas de vino de un tío rico y planea consumirlas en los próximos 20 años. ¿Cómo debería hacerlo para optimizar la utilidad? Supongamos que la función de utilidad de esa persona respecto al vino está dada por u[c(t)] In c(t). De ahí que la utilidad de beber vino exhiba una utilidad marginal decreciente (u 0, u 0). La meta de esta persona es optimizar 20 20 3 u[c(t dt 3 ln c(t) dt. 0 (2.152) 0 Concedamos que x(t) representa el número de botellas de vino que restan en el momento t. Esta serie está restringida por x(0) 1 000 y x(20) 0. La ecuación diferencial determinante de la evolución de x(t) adopta la forma simple:22 dx(t) dt (2.153) c(t). Es decir, el consumo en cada instante reduce las existencias de botellas. La expresión hamiltoniana de valor corriente para este problema es H ln c(t) c(t x(t) d , dt (2.154) y las condiciones de primer orden para un óptimo son H 1 0, c c H d 0. x dt (2.155) La segunda de estas condiciones requiere que (el valor implícito del vino) sea constante en el tiempo. Esto tiene sentido intuitivo: puesto que consumir una botella de vino reduce siempre en una botella las existencias disponibles, cualquier solución en la que el valor del vino difiera en el tiempo ofrecerá un incentivo para variar de comportamiento consumiendo más botellas cuando es barato y menos cuando es caro. Combinar esta segunda condición de un óptimo con la primera implica que c(t) debe ser constante en el tiempo. Si c(t) k, el número de botellas restantes en cualquier momento será x(t) 1 000 kt. Si k 50, el sistema cumplirá las restricciones de punto final x(0) 1 000 y x(20) 0. Desde luego que en este problema se podría suponer que el plan óptimo es consumir el vino a razón de 50 botellas por 22 La forma simple de esta ecuación diferencial (donde dx/dt sólo depende del valor de la variable de control, c) significa que este problema es idéntico al explorado usando el método de “cálculo de variaciones” de la optimización dinámica. En ese caso, es posible sustituir dx/dt en la función f y comprimir las condiciones de primer orden de un óptimo en la ecuación fx dfdx/dt/dt, llamada ecuación de Euler. En el capítulo 17 encontraremos muchas ecuaciones de Euler. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 66 Parte 1: Introducción año durante 20 años, porque la utilidad marginal decreciente sugiere que uno no desea consumir en exceso en ningún periodo. El principio del óptimo confirma esta intuición. Utilidad más complicada. Tomemos ahora una función de utilidad más complicada que puede arrojar resultados más interesantes. Supongamos que la utilidad de consumir vino en cualquier fecha, t, está dada por [c(t) / si 0, 1; ln c(t) si 0. u[c(t)] (2.156) Supongamos también que el consumidor descuenta el consumo futuro a razón de . De ahí que la meta de esta persona sea optimizar 20 20 t 3 u[c(t)] dt 3 e 0 0 [c(t)] dt (2.157) sujeta a las restricciones siguientes: dx(t) c(t), dt x(0) 1 000, x(20) 0. (2.158) Establecer la expresión hamiltoniana de valor corriente produce H e t [c(t c) x(t) d(t) , dt (2.159) y el principio del óptimo requiere que H e t [c(t 1 0 c H d 0 0 0. x dt y (2.160) Por tanto podemos concluir nuevamente que el valor implícito de las existencias de botellas de vino () debe ser constante en el tiempo (llamemos a esto constante k) y que e t 1 [c(t k o c (t) k1/( 1) t /( 1) e . (2.161) Así, el consumo óptimo de botellas debe reducirse en el tiempo para compensar el hecho de que el consumo futuro se descuenta en la mente del consumidor. Si, por ejemplo, concedemos que 0.1 y −1 (valores “razonables”, como se demostrará en capítulos posteriores), entonces c(t) k 0.5 e 0.05t (2.162) Ahora debemos hacer un poco más de labor en la selección de k para satisfacer las restricciones de punto final. Deseamos 20 20 20 3 c(t) dt 3 k 0 0.5 e 0.05t dt 20k 0.5 e 0.05t 0 0 20k 0.5 (e 1 1) 12.64k 0.5 (2.163) 1 000. Así, por último, tenemos el plan óptimo de consumo como c(t 79e 0.05t Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. . 23.08.2019 (2.164) 8/23 Capítulo 2: Matemáticas para microeconomía 67 Este plan requiere que el consumo de botellas de vino comience en un nivel muy alto y decrezca a un índice continuo de 5 por ciento anual. Dado que el consumo es continuamente decreciente, debemos usar integración para calcular el consumo de vino en un año particular (x) como sigue: x x 3 c (t) dt 3 79e consumo en un año x x 1 x 0.05t dt 1 580e 0.05t x 1 x 1 1 580(e 0.05(x 1) e 0.05x (2.165) ). Si x 1, el consumo es aproximadamente de 77 botellas en el primer año. Luego decrece de manera uniforme, terminando en aproximadamente 30 botellas consumidas en el año 20. PREGUNTA: Nuestra primera ilustración fue sólo un ejemplo de la segunda en la que 0. Explica cómo valores alternos de estos parámetros afectarán la trayectoria de consumo óptimo de vino. Explica tus resultados intuitivamente (para más información sobre consumo óptimo en el tiempo, véase el capítulo 17). ESTADÍSTICA MATEMÁTICA En los últimos años la teoría microeconómica se ha centrado cada vez más en problemas ofrecidos por la incertidumbre y la información imperfecta. Para comprender gran parte de esa bibliografía es importante tener firmes bases de estadística matemática. Así, el propósito de esta sección es resumir algunos principios estadísticos que encontraremos en distintos apartados de este libro. Variables aleatorias y funciones de densidad de probabilidad Una variable aleatoria describe (en forma numérica) los resultados de un experimento sujeto al azar. Por ejemplo, podríamos lanzar una moneda y observar si sale cara o cruz. Si llamamos a esta variable aleatoria x, podemos denotar los resultados posibles (“realizaciones”) de la variable como: x 1 0 si la moneda es cara, si la moneda es cruz. Nótese que antes de lanzar la moneda x puede ser 1 o 0. Sólo después de despejada la incertidumbre (es decir, después de lanzada la moneda) sabremos cuál es el valor de x.23 Variables aleatorias discretas y continuas Los resultados de un experimento aleatorio pueden ser un número finito de posibilidades o un continuo de posibilidades. Por ejemplo, el número que resulta de lanzar un dado es una variable aleatoria con seis resultados posibles. Si se lanzan dos dados podría registrarse la suma de sus caras (en cuyo caso hay 12 resultados, algunos de los cuales tienen más probabilidades que otros) o un número de dos dígitos, uno para el valor de cada dado (en cuyo caso habría 36 resultados igualmente probables). Estos son ejemplos de variables aleatorias discretas. Por otro lado, una variable aleatoria continua puede adoptar cualquier valor en un rango dado de números reales. Por ejemplo, la temperatura a la intemperie del día de mañana podría verse 23 A veces las variables aleatorias se denotan con ~ x para distinguir entre variables cuyo resultado está sujeto al azar y variables algebraicas (no aleatorias). Este recurso de notación puede ser útil para seguir la pista de lo que es aleatorio y lo que no en un problema particular, y lo usaremos en algunos casos. Cuando no haya ambigüedad, sin embargo, no emplearemos esta notación especial. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 68 Parte 1: Introducción como una variable continua (suponiendo que las temperaturas pueden medirse con precisión) que va de, digamos, 50 C a 50 C. Desde luego que algunas de estas temperaturas serían de ocurrencia improbable, pero en principio la temperatura medida de manera precisa podría estar en cualquier punto entre estos dos límites. De igual forma, el cambio porcentual del día de mañana en el valor de un índice bursátil particular podría verse como susceptible de adoptar todos los valores entre 100% y, digamos, 1 000%. De nueva cuenta, por supuesto, serían mucho más probables de ocurrir las variaciones porcentuales alrededor de 0% que los valores extremos. Funciones de densidad de probabilidad La función de densidad de probabilidad (FDP) para cualquier variable aleatoria indica la probabilidad de que ocurra cada resultado específico. Para a una variable aleatoria discreta definir esa función no plantea ninguna dificultad particular. En el caso del lanzamiento de una moneda, por ejemplo, la FDP [denotada por f (x)] estaría dada por f (x 1) 0.5, f (x 0) 0.5. (2.166) Para el caso del lanzamiento de un dado la FDP sería: f (x 1) f (x 2) f (x 3) f (x 4) f (x 5) f (x 6) 1 /6, 1 /6, 1 /6, 1 /6, 1 /6, 1 /6. (2.167) Nótese que en ambos casos las probabilidades especificadas por la FDP suman 1.0. Esto se debe a que, por definición, uno de los resultados del experimento aleatorio debe ocurrir. De modo más general, si todos los resultados de una variable aleatoria discreta se denotan como xi para i 1, …, n, debemos tener: n f (xi ) 1. (2.168) i1 En una variable aleatoria continua debemos tener cuidado al definir el concepto de FDP. Dado que esa variable aleatoria adopta un continuo de valores, si le asignamos cualquier valor diferente de cero como la probabilidad de un resultado específico (es decir, una temperatura de 25.53470 C) pronto podríamos tener sumas de probabilidades infinitamente grandes. De ahí que para una variable aleatoria continua definamos la FDP f (x) como una función con la propiedad de que la probabilidad de que x ocurra en un intervalo reducido particular dx está dada por el área de f(x)dx. Usando esta convención la propiedad de que las probabilidades de un experimento aleatorio sumen 1.0 se enuncia como sigue: 3 f (x) dx 1.0. (2.169) Algunas FDP importantes La mayoría de las funciones operará como una FDP, siempre y cuando f(x) 0 y la función sumen (o integren) 1.0. El truco, desde luego, es encontrar funciones que reflejen experimentos aleatorios que ocurren en la realidad. Aquí nos ocuparemos de cuatro de dichas funciones las cuales nos serán útiles en varias secciones de este libro. Las gráficas de esas cuatro funciones aparecen en la figura 2.6. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía FIGURA 2.6 Cuatro funciones comunes de densidad de probabilidad. 69 Las variables aleatorias con estas FDP son de amplio uso. Cada gráfica indica el valor esperado de la FDP mostrada. f(x) f (x) p 1−p 1 b−a 0 p 1 a+b 2 a x b x (b) Uniforme (a) Binomial f (x) f(x) λ ⎯ ⎯ 1/ √2π 1/λ 0 x (c) Exponencial x (d) Normal 1. Distribuición binomial. Esta es la distribución discreta básica. Usualmente se supone que x adopta sólo dos valores, 1 y 0. La FDP de la binomial está dada por: f (x 1) p, f (x 0) 1 p, donde (2.170) 0 p 1. El ejemplo de lanzar una moneda es obviamente un caso especial de la binomial donde p 0.5. 2. Distribución uniforme. Esta es la FDP continua más simple. Supone que los valores posibles de la variable x ocurren en un intervalo definido y que cada valor es igualmente probable. Es decir: f (x) b f (x) 0 1 a Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. para a x b; para x a o x 23.08.2019 b. (2.171) 8/23 70 Parte 1: Introducción Obsérvese aquí que las probabilidades integran 1.0: b 3 f (x) dx 3b 1 a b x dx b a a a b b a a b a b b a 1.0. a (2.172) 3. Distribución exponencial. Esta es una distribución continua para la cual las probabilidades decrecen a un índice exponencial uniforme al incrementarse x. Formalmente: f (x) e 0 x si x si x 0, 0, (2.173) donde es una constante positiva. De nuevo, es fácil demostrar que esta función integra 1.0: 3 f (x) dx 3 e x dx e x 0 1) 1.0. (2.174) 0 0 4. Distribución normal. La distribución normal (o de Gauss) es la más importante en la estadística matemática. Su importancia se deriva sobre todo del teorema del límite central el cual establece que la distribución de cualquier suma de variables aleatorias independientes aproximará cada vez más la distribución normal conforme el número de esas variables aumente. Dado que los promedios muestrales pueden considerarse sumas de variables aleatorias independientes, este teorema señala que cualquier promedio muestral tendrá una distribución normal sin importar cuál sea la distribución de la población de la cual se seleccionó la muestra. De ahí que suela ser apropiado suponer que una variable aleatoria tiene una distribución normal si se le puede concebir como una especie de promedio. La forma matemática de la FDP normal es f (x) 1 e 2 x2 /2 , (2.175) y esto se define para todos los valores reales de x. Aunque esta función podría parecer complicada, algunas de sus propiedades pueden describirse fácilmente. Primero, esta función es simétrica en torno a cero (a causa del término x2). Segundo, es asintótica a cero al aumentar o reducir x. Tercero, alcanza su valor óptimo en x 0. Este valor es 1/ 2 ≈ 0.4. Por último, la gráfica de esta función tiene una “forma de campana” regular de uso común en la estadística. La integración de esta función es relativamente complicada (aunque fácil en coordenadas polares). La presencia de la constante 1/ 2 es necesaria para que la función integre 1.0. Valor esperado El valor esperado de una variable aleatoria es el valor numérico que se puede esperar que tenga en promedio la variable aleatoria.24 Se trata del “centro de gravedad” de la FDP. Para una variable aleatoria discreta que adopta los valores x1, x2, …, xn, el valor esperado se define como n E(x) xi f (xi ) (2.176) i1 24 El valor esperado de una variable aleatoria también se conoce como media de esa variable. En ocasiones en el estudio del muestreo esto puede causar confusión entre el valor esperado de una variable aleatoria y el concepto diferente del promedio aritmético de la muestra. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 71 Es decir, cada resultado es ponderado por la probabilidad de que ocurra, y se suma a todos los resultados posibles. Para una variable aleatoria continua, la ecuación 2.176 se generaliza fácilmente como E(x) 3 xf (x) dx. (2.177) De nuevo, en esta integración cada valor de x es ponderado por la probabilidad de que ocurra dicho valor. El concepto de valor esperado puede generalizarse para incluir el valor esperado de cualquier función de una variable aleatoria [digamos, g(x)]. En el caso continuo, por ejemplo, escribiríamos E[g(x (2.178) 3 g(x)f (x) dx. Como caso especial, consideremos una función lineal y ax b. Entonces, E(y) E(ax b) 3 (ax b)f (x) dx (2.179) a 3 xf (x) dx b 3 f (x) dx aE (x) b. A veces los valores esperados se formulan en términos de la función de distribución acumulativa (FDA) F(x), definida como x F(x) 3 f (t) dt. (2.180) Es decir, F(x) representa la probabilidad de que la variable aleatoria t sea menor que o igual a x. Usando esta notación el valor esperado de x puede escribirse como E(x) 3 xdF(x) (2.181) Debido al teorema fundamental del cálculo, la ecuación 2.181 y la ecuación 2.177 significan exactamente lo mismo. EJEMPLO 2.15 Valores esperados de algunas variables aleatorias Los valores esperados de cada una de las variables aleatorias con las FDP simples que ya hemos presentado son fáciles de calcular. Todos estos valores esperados están indicados en las gráficas de las FDP de las funciones en la figura 2.6. 1. Binomial. En este caso: E(x) 1 f (x 1) 0 f (x 0) 1 p 0 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 1 p) p. (2.182) 8/23 72 Parte 1: Introducción Para el caso del lanzamiento de la moneda (donde p 0.5), esto indica que E(x) p 0.5; el valor esperado de esta variable aleatoria es, como quizá lo supusiste, de una mitad. 2. Uniforme. Para esta variable aleatoria continua, b E(x) 3 x b a dx x2 2(b a) a b a b2 2(b a) a2 b a . 2(b a) 2 (2.183) De nuevo, como quizá conozcas, el valor esperado de la distribución uniforme está a justo medio camino entre a y b. 3. Exponencial. Para este caso de probabilidades decrecientes: E(x) 3 xe x dx xe x 0 1 e x 0 1 , (2.184) donde la integración se desprende del ejemplo de la integración por partes que ya hemos mostrado (ecuación 2.137). Nótese aquí que cuanto más rápido decrecen las probabilidades, menor es el valor esperado de x. Por ejemplo, si 0.5 entonces E(x) 2, mientras que si 0.05, entonces E(x) 20. 4. Normal. Dado que la FDP normal es simétrica en torno a cero, parece claro que E(x) 0. Una prueba formal usa una integración de cambio de variable, concediendo que u x2/2 (du xdx): 1 xe 3 2 x2 /2 1 dx 3 e 2 u 1 du 2 e x2 /2 1 [0 2 0] 0. (2.185) Claro que el valor esperado de una variable aleatoria distribuida normalmente (o de cualquier variable aleatoria) puede ser alterado por una transformación lineal, como se muestra en la ecuación 2.179. PREGUNTA: Una transformación lineal cambia el valor esperado de una variable aleatoria en forma predecible; si y ax b, entonces E(y) aE(x) b. De ahí que para esta transformación [digamos, h(x)] tengamos E[h(x)] h[E(x). Supongamos, en cambio, que x es transformada por una función cóncava, digamos g(x) con g 0 y g 0. ¿Qué resultaría de comparar E[g(x)] con g[E(x)]? Nota: Esta es una ilustración de la desigualdad de Jensen, concepto que se describirá en detalle en el capítulo 7. Véase también el problema 2.14. Varianza y desviación estándar El valor esperado de una variable aleatoria es una medida de tendencia central. En cambio, la varianza de una variable aleatoria [denotada por x2 o Var(x)] es una medida de dispersión. Específicamente, la varianza se define como la “desviación cuadrada esperada” de una variable aleatoria respecto de su valor esperado. Formalmente: Var(x) 2x E[(x 2 E(x)) ] 3 (x E(x)) 2 f (x) dx. (2.186) Algo imprecisa, la varianza mide la desviación cuadrada “típica” respecto al valor central de una variable aleatoria. Al hacer este cálculo, las desviaciones respecto al valor esperado se elevan al cuadrado para que las desviaciones positivas y negativas respecto al valor esperado contribuyan por igual a esta medida de dispersión. Una vez hecho el cálculo, el proceso de elevación al cuadrado puede revertirse para producir una medida de dispersión que esté en las unidades originales en las que se midió la variable aleatoria. Esta raíz cuadrada de la varianza se llama desviación estándar y se denota con x( x2). El nombre de este término transmite eficazmente su Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 73 significado: x es en efecto la desviación típica (“estándar”) de una variable aleatoria respecto a su valor esperado. Cuando una variable aleatoria está sujeta a la transformación lineal, su varianza y desviación estándar cambiarán en forma muy obvia. Si y ax b, entonces 2y 2 3 [ax b E(x)]2 f (x)dx a2 2x . E(ax b)] f (x) dx 3 a2 [x (2.187) De ahí que la adición de una constante a una variable aleatoria no cambie su varianza, mientras que la multiplicación por una constante multiplica la varianza por el cuadrado de la constante. Así, resulta claro que multiplicar una variable por una constante multiplica su desviación estándar por esa constante: ax ax. EJEMPLO 2.16 Varianzas y desviaciones estándar de variables aleatorias simples En aplicaciones económicas a veces puede ser útil conocer las varianzas y las desviaciones estándar de las cuatro variables aleatorias simples que hemos venido analizando. 1. Binomial. La varianza de la binomial puede calcularse aplicando la definición en su análoga discreta: n 2x (xi E(x)) 2 f (xi ) (1 p) 2 p (0 p) 2 (1 p) (2.188) i1 (1 p)(p p2 p2 ) p(1 p). p(1 p). Una implicación de este resultado es que una variable binomial alcanza De ahí que x su más grande varianza y desviación estándar cuando p 0.5, en cuyo caso x2 0.25 y x 0.5. Dada la forma parabólica relativamente plana de p(1 p), las desviaciones modestas de p respecto a 0.5 no cambian sustancialmente esta varianza. 2. Uniforme. Calcular la varianza de la distribución uniforme produce un resultado algo interesante: b 2 a b 2 2x 3 x 1 b a a b 2 dx x 3 . 3(b a 1 a) 3(b a) 3 (b b) 3 (a 8 8 (b b 1 a) 2 . 12 a) a (2.189) Este es uno de los pocos casos en los que el número 12 tiene un uso en matemáticas, aparte del de medir cantidades de naranjas o donas. 3. Exponencial. Integrar la fórmula de la varianza para la exponencial es relativamente laborioso. Por fortuna, el resultado es simple; para la exponencial, resulta que x2 1/2 y x 1/. De ahí que la media y la desviación estándar sean iguales para la distribución exponencial; esta es una “distribución de un parámetro”. 4. Normal. La integración también puede ser difícil en este caso. Pero, de nuevo, el resultado es simple: para la distribución normal, x2 x 1. Las áreas bajo la curva normal pueden calcularse fácilmente, y las tablas de estas pueden consultarse en cualquier texto de estadística. Dos hechos útiles acerca de la FDP normal son: 1 3 f (x) dx 2 0.68 y 1 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 3 f (x) dx 2 23.08.2019 0.95. (2.190) 8/23 74 Parte 1: Introducción Es decir, existe una probabilidad de aproximadamente dos tercios de que una variable normal esté a 1 desviación estándar del valor esperado, aunque “las más de las veces” (es decir, con una probabilidad de 0.95) estará a 2 desviaciones estándar. Estandarización de la normal. Si la variable aleatoria x tiene una FDP normal estándar, tendrá un valor esperado de 0 y una desviación estándar de 1. Sin embargo, una transformación lineal simple puede usarse para darle a esta variable aleatoria el valor esperado () y la desviación estándar () deseados. Considérese la transformación y x . Ahora, E( y) E(x) Var ( y) 2y 2 Var(x) 2 . y (2.191) Revertir este proceso puede servir para “estandarizar” una variable aleatoria normalmente distribuida (y) con un valor esperado () y desviación estándar () arbitrarios (lo que a veces se denota como y ~ N(, ) usando z (y )/. Por ejemplo, los resultados del Scholastic Aptitude Test (SAT) (y) están normalmente distribuidos con un valor esperado de 500 puntos y una desviación estándar de 100 puntos (es decir, y ~ N(500, 100)). De ahí que z (y − 500)/100 tenga una distribución normal estándar con valor esperado de 0 y desviación estándar de 1. La ecuación 2.190 señala que aproximadamente 68 por ciento de los resultados se ubica entre los 400 y los 600 puntos, mientras que 95 por ciento de ellos se ubica entre los 300 y los 700 puntos. PREGUNTA: Supongamos que la variable aleatoria x está uniformemente distribuida en el intervalo [0, 12]. ¿Cuáles son la media y desviación estándar de x? ¿Qué fracción de la distribución de x está a 1 desviación estándar de la media? ¿Qué fracción de la distribución está a ±2 desviaciones estándar del valor esperado? Explica por qué esto difiere de las fracciones estimadas para la distribución normal. Covarianza Algunos problemas económicos implican dos o más variables aleatorias. Por ejemplo, un inversionista podría considerar repartir su patrimonio entre varios activos, los rendimientos de los cuales se dan como aleatorios. Aunque los conceptos de valor esperado, varianza, etcétera, se aplican en forma más o menos directa al analizar una variable aleatoria en estos casos, también es necesario considerar la relación entre las variables para obtener un cuadro completo. El concepto de covarianza se usa para cuantificar esta relación. Pero antes de ofrecer una definición debemos desarrollar algunas bases. Consideremos un caso con dos variables aleatorias continuas, x y y. La FDP de estas dos variables, denotada por f (x, y), tiene la propiedad de que la probabilidad asociada con un conjunto de resultados en un área reducida (con dimensiones dxdy) está dada por f (x, y)dxdy. Para ser una FDP apropiada debe darse el caso de que: f x, y 0 y 3 3 f ( x, y) dx dy 1. (2.192) Las medidas de una sola variable que ya hemos presentado pueden desarrollarse en este contexto de dos variables “desintegrando” la otra variable. Es decir, E(x) 3 3 xf (x, y) dy dx y (2.193) Var(x) 3 3 x 2 E(x)] f (x, y)dy dx. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 75 De esta manera, los parámetros que describen la variable aleatoria x se miden en todos los resultados posibles de y después de tomar en cuenta la probabilidad de esos diversos resultados. En este contexto, la covarianza entre x y y busca medir la dirección de asociación entre las variables. Específicamente, la covarianza entre x y y [que denota Cov(x, y)] se define como Cov(x, y) 3 3 [x E(x)][y (2.194) E(y)] f (x, y) dx dy. La covarianza entre dos variables aleatorias puede ser positiva, negativa o cero. Si valores de x mayores que E(x) tienden a ocurrir relativamente a menudo con valores de y mayores que E(y) (y, de igual forma, si valores bajos de x tienden a ocurrir junto con valores bajos de y), la covarianza será positiva. En este caso los valores de x y y tienden a moverse en la misma dirección. O bien, si valores altos de x tienden a asociarse con valores bajos de y (y viceversa), la covarianza será negativa. Dos variables aleatorias se definen como independientes si la probabilidad de cualquier valor particular de, digamos, x no se ve afectada por el valor particular que podría ocurrir de y (y viceversa).25 En términos matemáticos esto significa que la FDP debe tener la propiedad de que f(x, y) g(x)h(y); es decir, la FDP conjunta puede expresarse como el producto de las FDP de dos variables. Si x y y son independientes, su covarianza será cero: Cov(x, y) 3 3 [x E(x)][y 3 [x E( y)]g(x) h(y) dx dy E(x)]g(x) dx 3 [y E( y)]h( y) dy 0 0 0. (2.195) Sin embargo, lo opuesto de este enunciado no es necesariamente cierto. Una covarianza de cero no necesariamente implica independencia estadística. Por último, el concepto de covarianza es crucial para comprender la varianza de sumas o diferencias de variables aleatorias. Aunque el valor esperado de una suma de variables aleatorias es (como cabría suponer) la suma de sus valores esperados: E(x y) 3 3 ( x y) f ( x, y) dx dy 3 xf ( x, y) dy dx 3 yf ( x, y) dx dy E(x) E( y) , (2.196) la relación para la varianza de esa suma es más complicada. Usar las definiciones que hemos desarrollado produce 25 Una definición formal se apoya en el concepto de probabilidad condicional. La probabilidad condicional de un evento B dada la ocurrencia de A (lo cual se escribe P(B|A) se define como P(B|A) P(A y B) P(A); B y A se definen como independientes si P(B|A) P(B). En este caso, P(A y B) P(A) ∙ P(B). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 76 Parte 1: Introducción Var(x y) 3 3 x y E( x y) 2 f ( x, y) dx dy 3 3 x E( y) 2 f ( x, y) dx dy E (x) y 3 3 x E( x) 2 y E ( y) 2 2x E( x) y E ( y) f ( x, y) dx dy (2.197) Var( x) Var( y) 2Cov( x, y). De ahí que si x y y son independientes, entonces Var(x y) Var(x) Var(y). La varianza de la suma será mayor que la suma de las varianzas si las dos variables aleatorias tienen una covarianza positiva, y será menor que la suma de las varianzas si tienen una covarianza negativa. Los problemas 2.14-2.16 dan más detalles sobre algunos de los resultados estadísticos que se usan en la teoría microeconómica. Resumen Pese a la formidable apariencia de algunas secciones de este capítulo, este no es un libro de matemáticas. Más bien, la intención aquí ha sido la de reunir varias herramientas que servirán para desarrollar modelos económicos a lo largo de este texto. El material en este capítulo será útil entonces como referencia práctica. Una manera de sintetizar las herramientas matemáticas que se han presentado en este capítulo es subrayar de nueva cuenta las lecciones económicas que dichas herramientas ilustran: • El uso de las matemáticas ofrece a los economistas un medio conveniente y abreviado para desarrollar modelos. Gracias al uso de estas herramientas matemáticas se pueden estudiar en un marco simplificado las implicaciones de varios supuestos económicos. • El concepto matemático de las derivadas de una función es de amplio uso en los modelos económicos porque a los economistas suele interesarles la forma en que las variaciones marginales en una variable afectan a otra. Las derivadas parciales son especialmente útiles para este propósito porque están definidas para representar dichas variaciones marginales cuando todos los demás factores se mantienen constantes. • Las matemáticas de la optimización son una herramienta importante para el desarrollo de modelos que asumen que los agentes económicos persiguen racionalmente una meta. En el caso irrestricto las condiciones de primer orden establecen que cualquier actividad que contribuya a la meta del agente debe expandirse hasta el punto en que la contribución marginal de una expansión adicional sea de cero. En términos matemáticos, la condición de primer orden para un óptimo requiere que todas las derivadas parciales sean iguales a cero. • La mayoría de los problemas de optimización económica implican restricciones a las decisiones que los agentes pueden tomar. En este caso las condiciones de primer orden para un máximo sugieren que cada actividad es operada en un nivel en el cual la razón del beneficio marginal de la actividad con su costo marginal es la misma para todas las actividades utilizadas. Esta razón común de costo marginal-beneficio marginal es igual también al multiplicador de Lagrange, el cual suele introducirse para ayudar a resolver problemas de optimización restringida. El multiplicador de Lagrange puede interpretarse asimismo como el valor implícito (o precio sombra) de la restricción. • El teorema de la función implícita es un recurso matemático útil para ilustrar la dependencia de las opciones que resultan de un problema de optimización respecto a los parámetros de ese problema (precios de mercado, por ejemplo). El teorema de la envolvente es útil para examinar cómo cambian esas opciones óptimas cuando los parámetros del problema (precios) cambian. • Algunos problemas de optimización pueden implicar restricciones que son desigualdades más que igualdades. Las soluciones de estos problemas ilustran a menudo la “lasitud complementaria”. Es decir, las restricciones se mantienen con la igualdad y sus multiplicadores de Lagrange asociados son diferentes de cero, o las restricciones son desigualdades estrictas y sus multiplicadores de Lagrange asociados son iguales a cero. De nuevo esto ilustra cómo el multiplicador de Lagrange implica algo sobre la “importancia” de las restricciones. • Las condiciones de primer orden expuestas en este capítulo son sólo las condiciones necesarias para un máximo o mínimo local. También deben comprobarse las condiciones de segundo orden, que requieren la satisfacción de ciertas condiciones de curvatura. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía • Ciertos tipos de funciones ocurren en muchos problemas económicos. Las funciones cuasi cóncavas (aquellas para las cuales las curvas de nivel forman conjuntos convexos) cumplen las condiciones de segundo orden de los problemas de máximo o mínimo restringido cuando las restricciones son lineales. Las funciones homotéticas poseen la útil propiedad de que las disyuntivas implícitas entre las variables de la función sólo dependen de las razones de dichas variables. • El cálculo integral suele usarse en economía lo mismo como una manera de describir áreas por debajo de las gráficas que como una forma de sumar resultados en el tiempo. Técnicas que implican varios modos de diferenciar integrales desempe- 77 ñan un papel importante en la teoría del comportamiento de optimización. • Muchos problemas económicos son dinámicos en cuanto que las decisiones en una fecha afectan a decisiones y resultados en fechas posteriores. Las matemáticas para resolver estos problemas de optimización dinámica suelen ser una generalización simple de los métodos lagrangianos. • En el estudio de la economía de la incertidumbre y la información suelen usarse conceptos de estadística matemática. El concepto fundamental es la noción de variable aleatoria y su FDP asociada. Parámetros de esta distribución, como su valor esperado o su varianza, también desempeñan papeles importantes en muchos modelos económicos. Problemas 2.1 Supón que U(x, y) 4x2 3y2. a. b. c. d. e. f. g. Calcula U/x, U/y. Evalúa estas derivadas parciales en x 1, y 2. Escribe la diferencial total para U. Calcula dy/dx para dU 0; es decir, ¿cuál es la la opción contenida entre x y y manteniendo constante U? Demuestra que U 16 cuando x 1, y 2. ¿En qué proporción deben cambiar x y y para mantener a U constante en 16 para movimientos respecto a x 1, y 2? De modo más general, ¿cuál es la forma de la curva de nivel U 16 para esta función? ¿Cuál es la pendiente de esa línea? 2.2 Supón que los ingresos totales de una empresa dependen de la cantidad producida (q) de acuerdo con la función R 70q q2. Los costos totales también dependen de q: C q2 30q 100. a. ¿Qué nivel de producción debe generar la empresa para maximizar sus beneficios (R C)? ¿Cuáles serán esos beneficios? b. Demuestra que las condiciones de segundo orden para un máximo se satisfacen en el nivel de producción determinado en el inciso a). c. ¿La solución calculada aquí cumple la regla de “ingreso marginal es igual a costo marginal”? Explica. 2.3 Supón que f (x, y) xy. Halla el valor máximo de f si x y y están restringidas a sumar 1. Resuelve este problema de dos maneras: por sustitución y con el método del multiplicador de Lagrange. 2.4 El problema dual descrito en el problema 2.3 es minimiza xy sujeta a xy 0.25. Resuelve este problema usando la técnica de Lagrange. Luego compara el valor que obtuviste para el multiplicador de Lagrange con aquel que obtuviste en el problema 2.3. Explica la relación entre ambas soluciones. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 78 Parte 1: Introducción 2.5 La altura desde la cual es lanzada una pelota en línea recta con cierta fuerza es una función del momento (t) a partir del cual se le suelta, dado por f (t) 0.5gt2 40t (donde g es una constante determinada por la gravedad). a. b. c. d. ¿Cómo depende del parámetro g el valor de t en el que la altura desde la cual se lanza la pelota está en un máximo? Usa tu respuesta del inciso a) para describir cómo la altura máxima cambia al cambiar el parámetro g. Usa el teorema de la envolvente para contestar directamente el inciso b). En la Tierra g 32, aunque este valor varía un poco alrededor del globo. Si dos lugares tuvieran constantes gravitacionales que difirieran en 0.1, ¿cuál sería la diferencia en la altura máxima desde la que se lanza una pelota en ambos lugares? 2.6 Una forma simple de modelar la construcción de un buque petrolero es partir de una hoja de acero grande de forma rectangular de x pies de ancho y 3x pies de largo. Corta ahora un pequeño cuadrado de t pies por lado de cada esquina de la hoja; dobla y suelda los lados de la hoja de acero para producir una estructura semejante a una bandeja sin tapa. a. Demuestra que el volumen de petróleo que esta bandeja puede contener está dado por V t(x 2t)(3x 2t) 3tx2 8t2x 4t3. b. ¿Cómo debería elegirse t para maximizar V para cualquier valor dado de x? c. ¿Existe un valor de x que maximice el volumen de petróleo que se puede transportar? d. Supón que un constructor naval está obligado a usar únicamente 1 000 000 de pies cuadrados de hoja de acero para fabricar el buque petrolero. Esta restricción puede representarse con la ecuación 3x2 – 4t2 1 000 000 (porque el constructor puede intercambiar los cuadrados recortados por crédito). ¿Qué resultaría de comparar la solución de este problema de máximo restringido con las soluciones descritas en los incisos b) y c)? 2.7 Considera el siguiente problema de maximización restringida: maximiza y x1 5lnx2 sujeta a k x1 x2 0, donde k es una constante a la que se le puede asignar cualquier valor específico. a. Demuestra que si k 10, este problema puede resolverse como uno que sólo implica restricciones de igualdad. b. Demuestra que resolver este problema para k 4 requiere que x1 −1. c. Si las x en este problema deben ser no negativas, ¿cuál es la solución óptima cuando k 4? (Este problema puede resolverse intuitivamente o usando los métodos que hemos descrito en este capítulo.) d. ¿Cuál es la solución de este problema cuando k 20? ¿Qué concluyes al comparar esta solución con la del inciso a)? Nota: Este problema implica lo que se conoce como función cuasi lineal. Este tipo de funciones da ejemplos importantes de ciertos tipos de comportamiento en la teoría del consumo tal como veremos. 2.8 Supón que una empresa tiene una función de costo marginal dada por MC(q) q 1. a. ¿Cuál es la función de costo total de esta empresa? Explica por qué los costos totales sólo se conocen hasta una constante de integración, la cual representa costos fijos. b. Como has de saber, gracias a un curso previo de economía, si una empresa toma el precio (p) como dado en sus decisiones, entonces generará la producción para la cual p MC(q). Si la empresa sigue esta regla de maximización de beneficios, ¿cuánto producirá cuando p 15? Suponiendo que en ese precio alcanza el punto de equilibrio, ¿cuáles serán los costos fijos? c. ¿Cuánto aumentarán los beneficios de esta empresa si el precio aumenta a 20? d. Suponiendo aún la maximización de beneficios, demuestra que las de esta empresa sólo pueden expresarse como una función del precio que recibe por su producto. e. Demuestra que el aumento en beneficios de p 15 a p 20 puede calcularse de dos maneras: i) directamente a partir de la ecuación derivada en el inciso d) y ii) integrando la función inversa de costo marginal [MC1 (p) p – 1] de p 15 a p 20. Explica intuitivamente este resultado usando el teorema de la envolvente. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 79 Problemas analíticos 2.9 Funciones cóncavas y cuasi cóncavas Demuestra que, si f (x1, x2) es una función cóncava, también es una función cuasi cóncava. Hazlo comparando la ecuación 2.114 (definición de cuasi concavidad) con la ecuación 2.98 (definición de concavidad). ¿Puedes dar una razón intuitiva de este resultado? ¿Lo opuesto del enunciado es cierto? ¿Las funciones cuasi cóncavas son necesariamente cóncavas? De no ser así, da un contraejemplo. 2.10 Función de Cobb-Douglas Una de las funciones más importantes que encontraremos en este libro es la función de Cobb-Douglas: y (x1)(x2), donde y son constantes positivas, cada cual menor que 1. a. Demuestra que esta función es cuasi cóncava, usando el método de “fuerza bruta” de aplicar la ecuación 2.114. b. Demuestra que la función de Cobb-Douglas es cuasi cóncava mostrando que cada curva de nivel de la forma y c (donde c es cualquier constante positiva) es convexa y, por tanto, que el conjunto de puntos para los cuales y c es un conjunto convexo. c. Demuestra que si 1, la función de Cobb-Douglas no es cóncava (ilustrando otra vez, por tanto, que no todas las funciones cuasi cóncavas son cóncavas). Nota: En las extensiones de este capítulo se trata nuevamente la función de Cobb-Douglas. 2.11 La función de potencia Otra función que encontraremos a menudo en este libro es la función de potencia: y x, donde 0 1 (a veces también examinaremos esta función para casos en los que también puede ser negativa, en cuyo caso usaremos la forma y x/ para garantizar que las derivadas tengan el signo adecuado). a. Demuestra que esta función es cóncava (y, por tanto, también cuasi cóncava, por el resultado del problema 2.9). Nótese que 1 es un caso especial y que la función es “estrictamente” cóncava sólo para 1. b. Demuestra que la forma multivariada de la función de potencia y f(x1, x2) (x1) (x2) también es cóncava (y cuasi cóncava). Explica por qué, en este caso, el hecho de que f12 f21 0 vuelve especialmente simple determinar la concavidad. c. Una manera de incorporar efectos de “escala” en la función descrita en el inciso b) es usar la transformación monótona g(x1, x2) y [(x1) (x2)], donde es una constante positiva. ¿Esta transformación preserva la concavidad de la función? ¿Es g cuasi cóncava? 2.12 Prueba del teorema de la envolvente en problemas de optimización restringida Puesto que en este libro se usará con frecuencia el teorema de la envolvente en los problemas de optimización restringida, probar este teorema en un caso simple ayudará a desarrollar cierta intuición. Así, supongamos que se desea maximizar una función de dos variables y que el valor de esta función también depende de un parámetro, a: f(x1, x2, a). Este problema de maximización está sujeto a una restricción que puede escribirse como g(x1, x2, a) 0. a. Escribe la expresión lagrangiana y las condiciones de primer orden de este problema. b. Suma las dos condiciones de primer orden que implican las x. c. Diferencia ahora la suma anterior respecto a a; esto muestra cómo deben cambiar las x al cambiar a, al mismo tiempo que se requiere que las condiciones de primer orden sigan siendo válidas. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 80 Parte 1: Introducción d. Como ya se indicó en este capítulo tanto la función objetivo como la restricción de este problema pueden enunciarse como funciones de a: f(x1(a), x2(a), a), g(x1(a), x2(a), a) 0. Diferencia la primera de estas respecto a a. Esto muestra cómo cambia el valor del objetivo al cambiar a mientras las x se mantienen en sus valores óptimos. Deberás tener términos que impliquen las x y un término en f/a. e. Diferencia ahora la restricción formulada en el inciso d) respecto a a. Deberás tener términos en las x y un término en g/a. f. Multiplica los resultados del inciso e) por (el multiplicador de Lagrange), y usa esto junto con las condiciones de primer orden del inciso c) para sustituir en la derivada del inciso d). Deberás poder demostrar que df (x1 (a), x2 (a), a) f g , da a a justo la derivada parcial de la expresión lagrangiana cuando todas las x están en sus valores óptimos. Esto prueba el teorema de la envolvente. Explica intuitivamente cómo las diversas partes de esta prueba imponen la condición de que las x se ajusten de manera constante para permanecer en sus valores óptimos. g. Vuelve al ejemplo 2.8 y explica cómo se puede aplicar el teorema de la envolvente a las variaciones en el perímetro de una cerca P; es decir, ¿cómo afectan las variaciones en P a las dimensiones del área que se puede cercar? Demuestra que en este caso el teorema de la envolvente ilustra cómo el multiplicador de Lagrange asigna un valor a la restricción. 2.13 Aproximaciones de Taylor El teorema de Taylor demuestra que cualquier función puede acercarse a cualquier punto conveniente mediante una serie de términos que involucran a la función y sus derivadas. Aquí examinaremos algunas aplicaciones de este teorema a funciones de una y dos variables. a. Cualquier función continua y diferenciable de una variable, f(x), puede acercarse al punto a mediante la fórmula f (x) f(a) f (a)(x a) 0.5f (a)(x a)2 términos en f , f , . . . . El uso de únicamente los tres primeros términos resulta en una aproximación cuadrática de Taylor. Emplea esta aproximación junto con la definición de concavidad dada en la ecuación 2.85 para demostrar que toda función cóncava debe estar en o por debajo de la tangente de la función en el punto a. b. La aproximación cuadrática de Taylor para cualquier función de dos variables, f(x, y), cerca del punto (a, b) está dada por f (x, y) f (a, b) f 1 (a, b)(x 0.5[ f 11 (a, b)(x a) f 2 (a, b)( y b) 2 a)( y a) 2f 12 (a, b)(x b) f 22 ( y b) 2 . Usa esta aproximación para demostrar que toda función cóncava (definida por la ecuación 2.98) debe estar en o por debajo de su plano tangente en (a, b). 2.14 Más sobre valor esperado Puesto que el concepto de valor esperado desempeña un papel importante en muchas teorías económicas, quizá sea útil resumir algunas propiedades más de esta medida estadística. En este problema se supone que x es una variable aleatoria continua con la FDP f(x). a. (Desigualdad de Jensen) Supón que g(x) es una función cóncava. Demuestra que E[g(x)] g[E(x)]. Pista: Construye la tangente de g(x) en el punto E(x). Esta tangente tendrá la forma c dx g(x) para todos los valores de x y c dE(x) g[E(x)] donde c y d son constantes. b. Usa el procedimiento del inciso a) para demostrar que si g(x) es una función convexa, entonces E[g(x)] g[E(x)]. c. Supón que x adopta sólo valores no negativos; es decir, 0 x . Usa la integración por partes para demostrar que E(x) 3 [1 F(x)] dx, 0 donde F(x) es la función de distribución acumulativa para x [es decir, F(x) 0x f(t)dt]. d. (Desigualdad de Markov) Demuestra que si x sólo adopta valores positivos, se mantiene la desigualdad siguiente: P(x t E(x) . t Pista: E(x) 0 xf (x) dx 0t x f (x) dx t x f (x) dx. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía 81 e. Considera la FDP f(x) 2x–3 para x 1. 1. Demuestra que esta es una FDP apropiada. 2. Calcula la F(x) de esta FDP. 3. Usa los resultados del inciso c) para calcular la E(x) de esta FDP. 4. Demuestra que la desigualdad de Markov es válida para esta función. f. El concepto de valor esperado condicional es útil en algunos problemas económicos. Denotamos el valor esperado de x condicionado la ocurrencia de un evento, A, como E(xA). Para calcular este valor debemos conocer la FDP de x dada la ocurrencia de A [denotada por f (xA)]. Con esta notación, E(xA) x f (xA)dx. Tal vez la manera más fácil de comprender estas relaciones sea mediante un ejemplo. Sea f (x) x2 3 para 1 x 2. 1. Demuestra que esta es una FDP apropiada. 2. Calcula E(x). 3. Calcula la probabilidad de que 1 x 0. 4. Considera el evento 0 x 2, y llama a este evento A. ¿Qué es f(xA)? 5. Calcula E(xA). 6. Explica intuitivamente tus resultados. 2.15 Más sobre varianzas La definición de la varianza de una variable aleatoria puede usarse para demostrar varios resultados adicionales. a. Demuestra que Var(x) E(x2) [E(x)]2. b. Usa la desigualdad de Markov (problema 2.14d) para demostrar que si x sólo puede adoptar valores no negativos, P [(x x k] 2x . k2 Este resultado muestra que existen límites a qué tan a menudo una variable aleatoria puede alejarse de su valor esperado. Si kh, este resultado también indica que P [(x x h] 1 . h2 Así, por ejemplo, la probabilidad de que una variable aleatoria esté a más de dos desviaciones estándar de su valor esperado siempre es menor que 0.25. Este resultado teórico se conoce como desigualdad de Chebyshev. c. La ecuación 2.197 demostró que si dos (o más) variables aleatorias son independientes, la varianza de su suma es igual a la suma de sus varianzas. Usa este resultado para demostrar que la suma de n variables aleatorias independientes, cada una de las cuales tiene valor esperado y varianza 2, posee valor esperado n y varianza n2. Demuestra también que el promedio de estas n variables aleatorias (que también es una variable aleatoria) tendrá valor esperado y varianza 2/n. Esto se conoce como la ley de los números grandes; es decir, la varianza de un promedio se contrae conforme se incluyen más variables independientes. d. Usa el resultado del inciso c) para demostrar que si x1 y x2 son variables aleatorias independientes, cada cual con el mismo valor esperado y varianza, la varianza de un promedio ponderado de ambas X kx1 (1 k)x2, 0 k 1 se minimiza cuando k 0.5. ¿Cuánto se reduce la varianza de esta suma estableciendo apropiadamente k en relación con otros valores posibles de k? e. ¿Cómo cambiaría el resultado del inciso d) si las dos variables tuvieran varianzas desiguales? 2.16 Más sobre covarianzas He aquí algunas relaciones útiles asociadas con la covarianza de dos variables aleatorias, x1 y x2. a. Demuestra que Cov(x1, x2) E(x1x2) E(x1)E(x2). Una implicación importante de esto es que si Cov(x1, x2) 0, E(x1x2) E(x1)E(x2). Es decir, el valor esperado de un producto de dos variables aleatorias es el producto de los valores esperados de estas variables. b. Demuestra que Var(ax1 bx2) a2Var(x1) b2Var(x2) 2abCov(x1, x2). c. En el problema 2.15d se analizó la varianza de X kx1 (1 k)x2 0 k 1. ¿Cambia la conclusión de que esta varianza se minimiza para k 0.5 al considerar casos en los que Cov(x1, x2) 0? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 82 Parte 1: Introducción d. El coeficiente de correlación entre dos variables aleatorias se define como Corr(x1 , x2 ) Cov(x1 , x2 ) Var(x1 )Var(x2 ) . Explica por qué 1 Corr(x1, x2) 1 y procura cierta intuición para este resultado. e. Supón que la variable aleatoria y está relacionada con la variable aleatoria x por la ecuación lineal y x. Demuestra que Cov(y, x) . Var(x) Aquí, se conoce como el coeficiente (teórico) de regresión de y sobre x. Con datos reales, la muestra análoga de esta expresión es el coeficiente de regresión de mínimos cuadrados ordinarios (MCO). Sugerencias de lecturas adicionales Dadkhan, Kamran. Foundations of Mathematical and Computational Economics, Thomson/SouthWestern, Mason, OH: 2007. De consulta básica. El apéndice matemático A ofrece un tratamiento avanzado de condiciones necesarias y suficientes para un máximo. Buena introducción a muchas técnicas de cálculo. Demuestra que numerosas cuestiones matemáticas pueden abordarse usando populares programas de software como Matlab o Excel. Silberberg, E. y W. Suen. The Stractare of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001. Dixit, A. K. Optimization in Economic Theory, 2a. ed., Oxford University Press, Nueva York, 1990. Texto de microeconomía matemática que subraya las predicciones observables de la teoría económica. Hace amplio uso del teorema de la envolvente. Tratamiento completo y moderno de técnicas de optimización. Usa métodos analíticos relativamente avanzados. Simon, Carl P. y Lawrence Blume. Mathematics for Economists, W. W. Norton, Nueva York, 1994. Hoy, Michael, John Livernois, Chris McKenna, Ray Rees y Thanasis Stengos. Mathematics for Economists, 2a. ed., MIT Press, Cambridge, 2001. Útil texto que cubre la mayoría de las áreas matemáticas relevantes para los economistas. El tratamiento es de nivel relativamente alto. Dos temas que se explican aquí mejor que en cualquier otra parte son las ecuaciones diferenciales y la topología básica de fijación de puntos. Completa introducción a la mayor parte de las matemáticas cubiertas en cursos de microeconomía. La fuerza de este libro es que presenta muchos ejemplos resueltos, la mayoría de los cuales se basan en la teoría microeconómica. Luenberger, David G. Microeconomic Theory, McGraw Hill, Nueva York, 1995. Texto avanzado con varios conceptos microeconómicos novedosos. Tiene también cinco breves pero útiles apéndices matemáticos. Mas-Colell, Andreu, Michael D. Whinston y Jerry R. Green. Microeconomic Theory, Oxford University Press, Nueva York, 1995. Tratamiento enciclopédico de microeconomía matemática. Amplios apéndices matemáticos que cubren temas de análisis de nivel relativamente alto. Samuelson, Paul A. Foundations of Economic Analysis, Harvard University Press, Cambridge, MA: 1947, Mathematical Appendix A. Sydsaeter, K., A. Strom y P. Berck. Economists’ Mathematical Manual, 4a. ed., Springer-Verlag, Berlín, 2005. Herramienta indispensable para el repaso matemático. Contiene 35 capítulos que cubren la mayoría de las herramientas matemáticas que usan los economistas. Las explicaciones son breves, así que no es la fuente indicada para adquirir conceptos nuevos por primera vez. Taylor, Angus E. y W. Robert Mann. Advanced Calculus, 3a. ed., John Wiley, Nueva York, 1983, pp. 183-195. Un texto de cálculo completo con un buen análisis de la técnica de Lagrange. Thomas, George B. y Ross L. Finney, Calculus and Analytic Geometry, 8a. ed., Addison-Wesley, Reading, 1992. Texto básico de cálculo con excelente cobertura de técnicas de diferenciación. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Condiciones de segundo orden y álgebra matricial A, donde p 1, n. Si A es de 2 2, el primer menor principal es a11 y el segundo es a11a22 a21a12. 6. Una matriz cuadrada n n, A, es definida positiva si todos sus menores principales son positivos. Es definida negativa si sus menores principales alternan en signo, comenzando por uno de resta.126 7. Una matriz simétrica particularmente útil es la matriz de Hesse, formada por todas las derivadas parciales de segundo orden de una función. Si f es una función continua y dos veces diferenciable de n variables, su matriz de Hesse está dada por Las condiciones de segundo orden descritas en el capítulo 2 pueden escribirse en formas compactas usando álgebra matricial. En esta extensión se examinará brevemente dicha notación. Volveremos a esta en otras partes de las extensiones y en problemas de capítulos posteriores. Fundamentos de álgebra matricial Las extensiones presentadas aquí suponen cierto conocimiento general del álgebra matricial. Un recordatorio sucinto de estos principios podría incluir: 1. Una matriz n k, A, es un arreglo rectangular de términos de la forma A aij a11 a21 .. . a12 a22 a1k a2k an1 an2 ank H( f ) . Aquí, i 1, n; j 1, k. Las matrices pueden sumarse, restarse o multiplicarse siempre que sus dimensiones sean acordes. 2. Si n k, A es una matriz cuadrada. Una matriz cuadrada es simétrica si aij aji. La matriz de identidad, In, es una matriz cuadrada n n donde aij 1 si i j y aij 0 si i j. 3. La determinante de una matriz cuadrada (denotada por |A|) es un escalar (es decir, un término simple) hallado al multiplicar entre sí todos los términos de la matriz. Si A es de 2 2, |A| a11 a22 Ejemplo: Si A 1 5 a21 a12 . 15 f11 f21 .. . f12 f22 f1n f2n fn1 fn2 fnn . Usando estas ideas de notación ahora podemos volver a examinar algunas de las condiciones de segundo orden derivadas en el capítulo 2. E2.1 Funciones cóncavas y convexas Una función cóncava es la que siempre está por debajo de (o en) cualquier tangente a ella. A su vez, una función convexa siempre está sobre (o en) cualquier tangente. La concavidad o convexidad de una función es determinada por su o sus segundas derivadas. Para una función de una variable, f (x), este requisito es simple. Usando la aproximación de Taylor en cualquier punto (x0). dx2 2 términos de orden superior 3 entonces 2 |A| 2 EXTENSIONES f (x0 dx) f (x0 ) f(x0 )dx f ( x0 ) 13. 4. La inversa de una matriz cuadrada n n, A, es otra matriz n n, A−1, de tal manera que Suponiendo que los términos de orden superior son iguales a 0, tenemos f(x0 dx) f(x0) f(x0)dx A . A–1 In. si f(x0) No todas las matrices cuadradas tienen inversa. Una condición necesaria y suficiente para la existencia de A−1 es que |A| 0. 5. Los menores principales de una matriz cuadrada n n A son la serie de determinantes de las primeras filas y columnas p de 0y f(x0 dx) f(x0) f(x0)dx 1 Si algunas de las determinantes en esta definición son de 0, se dice que la matriz es semidefinida positiva o semidefinida negativa. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 84 Parte 1: Introducción si f(x0) 0. Puesto que las expresiones de la derecha de estas desigualdades son, de hecho, la ecuación de la tangente de la función en x0, resulta claro que la función es (localmente) cóncava si f (x0) 0 y (localmente) convexa si f (x0) 0. Extender esta idea intuitiva a muchas dimensiones es laborioso en términos de notación funcional, pero relativamente simple cuando se usa álgebra matricial. La concavidad requiere que la matriz de Hesse sea definida negativa, mientras que la convexidad requiere que esa matriz sea definida positiva. Al igual que en el caso de una variable, estas condiciones equivalen a requerir que la función se aleje sistemáticamente de cualquier tangente a ella sin importar qué dirección adopte.227 Si f(x1, x2) es una función de dos variables, la matriz de Hesse está dada por H f11 f21 f12 . f22 Esta es definida negativa si f11 0 y f11 f12 f21 f12 0, justo la condición descrita en la ecuación 2.98. Las generalizaciones a funciones de tres o más variables siguen el mismo patrón matricial. Ejemplo 1 Para la función estado de salud del capítulo 2 (ecuación 2.29) la matriz de Hesse está dada por H 2 0 0 , 2 así que la función será cóncava, siempre y cuando H2 a( a 1) ( b) ( b ab( 1 a b) x2a 2 y2b 2 0. E2.2 Maximización Como vimos en el capítulo 2 las condiciones de primer orden para un máximo restringido de una función de muchas variables requiere hallar un punto en el que las derivadas parciales sean iguales a cero. Si la función es cóncava estará bajo su plano tangente en este punto; así, el punto será un máximo verdadero.3 Puesto que la función estado de salud es cóncava, por ejemplo, las condiciones de primer orden para un máximo también son suficientes.28 E2.3 Máximos restringidos Cuando en un problema de maximización o minimización las x están sujetas a restricciones, estas tienen que tomarse en cuenta al enunciar las condiciones de segundo orden. También en este caso el álgebra matricial ofrece un medio compacto (si no es que intuitivo) para denotar estas condiciones. Esta notación implica sumar filas y columnas de la matriz de Hesse en el problema irrestricto y comprobar después las propiedades de esta matriz aumentada. Específicamente, se quiere maximizar sujeta a la restricción429 0. g(x1, . . . , xn) 0. En el capítulo 2 vimos que las condiciones de primer orden para un máximo son de la forma Ejemplo 2 La función de Cobb-Douglas xayb, donde a, b ∈ (0, 1), se usa para ilustrar funciones de utilidad y funciones de producción en muchas partes de este texto. Las derivadas de primer y segundo orden de la función son fi gi 0, donde λ es el multiplicador de Lagrange de este problema. Las condiciones de segundo orden para un máximo se basan en la matriz de Hesse aumentada (“limitada”)530 fx axa 1 yb , fy bxa yb 1 , fxx a( a 1) xa 2 yb , fyy b( b 1) xa yb 2 . Hb De ahí que la matriz de Hesse de esta función sea abxa 1 yb 1 b( b 1) xa yb 2 0 g1 g2 .. . g1 f11 f21 g2 f12 f22 ... gn f1n f2n . gn fn1 fn2 . . . fnn . El primer menor principal de esta matriz es 3 Este será un máximo “local” si la función es cóncava sólo en una región, o “global” si lo es en todas partes. 4 Aquí sólo se considera el caso de una restricción. La generalización a muchas restricciones es conceptualmente simple pero compleja respecto a la notación. Para una formulación concisa véase Sydsaeter, Strom y Berck (2005), p. 103. H1 a(a 1)xa2yb 0, Nótese que si gij 0 para todas las i y j, entonces Hb puede considerarse la matriz de Hesse simple asociada con la expresión lagrangiana dada en la ecuación 2.50, la cual es una función de las n 1 variables λ, x1, …, xn. 5 2 a2 b2 x2a 2 y2b f (x1, . . . , xn) De ahí que la función sea cóncava. a( a 1) xa 2 yb H abxa 1 yb 1 2 2 Esta condición es evidentemente válida si a b 1. Es decir, en términos de la función de producción, la función debe exhibir rendimientos decrecientes a escala para ser cóncava. Geométricamente, la función debe descender cuando ambos insumos aumentan juntos. y el primer y segundo menores principales son H1 2 0 y H2 (2)(2) 0 4 1) x2a 2 y2b En el capítulo 21 de Simon y Blume (1994) se muestra una prueba con la versión multivariable de la aproximación de Taylor. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 2: Matemáticas para microeconomía Para un máximo, (1)Hb debe ser definida negativa; es decir, los menores principales de Hb deben seguir el patrón y así sucesivamente, a partir del segundo de esos menores.631 Las condiciones de segundo orden para un mínimo requieren que (1)Hb sea definida positiva; es decir, que todos los menores principales de Hb (excepto el primero) sean negativos. y las condiciones de primer orden para un máximo son fi bi, H La expresión lagrangiana para el problema de estado de salud restringido (ejemplo 2.6) es y la matriz de Hesse limitada para este problema es Hb 0 1 1 1 2 0 1 0 . 2 El segundo menor principal es aquí Hb2 1 2 0 1 1, 0 f1 f2 fn f1 f11 f21 fn1 f2 f12 f22 fn2 fn f1n f2n fnn tienen los mismos menores principales excepto por una constante de proporcionalidad (positiva).7 Las condiciones para un máximo de f, sujeta a una restricción lineal, serán satisfechas siempre que H siga las mismas convenciones de signo que Hb; es decir, (1)H debe ser definida negativa. Una función f para la cual H sigue este patrón se llama cuasi cóncava. Como veremos, f tiene la propiedad de que el conjunto de puntos x para el cual f(x) c (donde c es cualquier constante) es convexo. Para esa función las condiciones necesarias para un máximo también son suficientes.32 Ejemplo y el tercero Hb3 0 1 1 2 1 0 0 0 0 1 0 2 2 Para el problema de la cerca, f(x, y) xy y H está dada por H ( 2) 4, 0 así que los menores principales de Hb tienen el patrón requerido y el punto es un máximo limitado. 0 y x y 0 1 x 1 . 0 Así, y2 0, H 2 H 3 2xy 0, x2 1, x1 0, y la función es cuasi cóncava.833 Ejemplo Ejemplo En el problema de la cerca óptima (ejemplo 2.7), la matriz de Hesse limitada es 0 2 2 Hb 2 0 1 Más generalmente, si f es una función de sólo dos variables, la cuasi concavidad requiere que 2 1 0 y así que también en este caso los menores principales tienen el patrón de signo requerido para un máximo. E2.4 Cuasi concavidad Si la restricción g es lineal las condiciones de segundo orden exploradas en la extensión 2.3 sólo pueden relacionarse con la forma de la función por optimizar, f. En este caso la restricción puede escribirse como g(x1, . . . , xn) c b1x1 b2x2 … bnxn 0, Nótese que el primer menor principal de Hb es 0. H 2 ( f1 ) 2 0 y H 3 f11 f22 f22 f12 2f1 f2 f12 0, justo la condición enunciada en la ecuación 2.114. De ahí que tengamos una forma muy simple de determinar la cuasi concavidad. 4, Hb2 Hb3 8, 6 i 1, . . . , n. Usando estas condiciones resulta claro que la matriz de Hesse limitada Hb y la matriz Ejemplo ᏸ x12 2x1 x22 4x2 5 (1 x1 x2), 85 Referencias Simon, C. P. y L. Blume. Mathematics for Economists, W. W. Norton, Nueva York, 1994. Sydsaeter, R., A. Strom y P. Berck. Economists’ Mathematical Manual, 3a. ed., Springer-Verlag, Berlín, 2000. 7 Esto puede demostrarse señalando que multiplicar una fila (o columna) de una matriz por una constante, multiplica la determinante por esa constante. Puesto que f(x, y) xy es una forma de una función de Cobb-Douglas no cóncava, demuestra que no toda función cuasi cóncava es cóncava. Adviértase que una función monótona de f (como f 1/3) podría, sin embargo, ser cóncava. 8 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Elección y demanda PARTE DOS Capítulo 3 Preferencias y utilidad Capítulo 4 Optimización de la utilidad y elección Capítulo 5 Efectos de ingreso y de sustitución Capítulo 6 Relaciones de demanda entre bienes En la parte 2 investigaremos la teoría económica de la elección. Una meta de este examen es desarrollar la noción de demanda de manera formal para que pueda usarse en secciones posteriores del texto cuando pasemos al estudio de los mercados. Una meta más general de esta parte es ilustrar el método que usan los economistas para explicar cómo toman decisiones los individuos en una amplia variedad de contextos. La parte 2 comienza con una descripción de la forma en que los economistas realizan modelos teóricos de las preferencias individuales, usualmente conocidas con el término formal de utilidad. El capítulo 3 muestra cómo los economistas conceptualizan la utilidad de forma matemática. Esto permite un examen de los diversos intercambios que los individuos están dispuestos a hacer voluntariamente. En el capítulo 4 se usa el concepto de utilidad para ilustrar la teoría de la elección. La hipótesis fundamental de este capítulo es que las personas que enfrentan ingresos limitados tomarán decisiones económicas de tal manera que puedan alcanzar la mayor utilidad posible. El capítulo 4 usa los análisis matemático e intuitivo para indicar los discernimientos que esta hipótesis aporta al comportamiento económico. Los capítulos 5 y 6 usan el modelo de optimización de la utilidad para investigar cómo responderán los individuos a los cambios en sus circunstancias. El capítulo 5 se ocupa principalmente de las respuestas a los cambios en el precio de una mercancía, análisis que conduce directamente al concepto de la curva capítulo 6 aplica este tipo de análisis al desarrollo de una comprensión de las relacio- 87 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO TRES Preferencias y utilidad En este capítulo examinaremos la manera en que los economistas caracterizan las preferencias de los individuos. Comenzaremos con un análisis muy abstracto sobre la “relación de preferencia”, pero pasaremos rápidamente a la principal herramienta de los economistas para estudiar las decisiones individuales: la función de utilidad. Estudiaremos algunas características generales de estas funciones y algucas que encontraremos a lo largo de este libro. AXIOMAS DE LA ELECCIÓN RACIONAL Una forma de iniciar un análisis de las decisiones de los individuos es enunciar una serie básica de postulados o axiomas que caracterizan el comportamiento “racional”. Estos empiezan con el concepto de “preferencia”: se entiende que un individuo que reporta que “A es preferible a B” quiere decir que, habiendo considerado todas las cosas, se siente en mejores condiciones en la situación A que en la situación B. Se supone que la relación de preferencia tiene las tres propiedades básicas siguientes. I. Integridad. Si A y B son dos situaciones cualesquiera car exactamente una de las tres posibilidades siguientes: 1. “A es preferible que B”, 2. “B es preferible que A”, o 3. “A y B son indiferentes”. En consecuencia se supone que los individuos no se paralizan por la indecisión: entienden por completo y siempre pueden hacerse una opinión sobre el atractivo de dos opciones cualesquiera. Este supuesto también descarta la posibilidad de que un individuo pueda reportar tanto que A es preferible a B como que B es preferible a A. II. Transitividad. Si un individuo reporta que “A es preferible a B” y “B es preferible a C”, también debe reportar que “A es preferible a C”. Este supuesto establece que las decisiones del individuo son internamente coherentes. Tal supuesto puede someterse a un estudio empírico. En general, este tipo de estudios concluye carse en que las decisiones de una persona son tran casos en los que el individuo probablemente no comprende completamente las consecuencias de sus decisiones. Dado que en la mayoría de los casos supondremos que las decisiones son totalmente informadas (véase, sin embargo, el análisis de la incertidumbre en el capítulo 7 y en algunas partes más), la propiedad de la transitividad parece ser un supuesto apropiado a establecer sobre las preferencias. III. Continuidad. Si un individuo reporta que “A es preferible a B” las situaciones adecuadamente “cercanas a” A deben ser preferibles a B. Este supuesto más bien técnico se requiere si deseamos analizar las respuestas de los individuos a cambios relativamente reducidos en ingreso y precios. El propósito de este supuesto 89 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 90 Parte 2: Elección y demanda es descartar ciertos tipos de filosas preferencias discontinuas que plantean problemas a un desarrollo matemático de la teoría de la elección. Suponer continuidad no parece implicar el riesgo de pasar por alto tipos de comportamiento económico que son importantes en la realidad (véase el problema 3.14 para algunos contraejemplos). UTILIDAD Dados los supuestos de integridad, transitividad y continuidad, es posible demostrar formalmente que las personas pueden clasificar todas las situaciones posibles entre la menos y la más deseable.1 Siguiendo la terminología introducida por el teórico político del siglo xix, Jeremy Bentham, los economistas llaman a esta clasificación utilidad.2 Nosotros también seguiremos a Bentham al decir que las situaciones más deseables ofrecen más utilidad que las menos deseables. Es decir, si una persona prefiere la situación A a la situación B, diríamos que la utilidad asignada a la opción A, denotada por U(A), excede a la utilidad asignada a B, U(B). No singularidad de las medidas de utilidad Incluso podríamos atribuir números a esas clasificaciones de utilidad; sin embargo, esos números no serán únicos. Cualquier conjunto de números que asignemos arbitrariamente y que refleje con exactitud el orden de las preferencias originales implicará el mismo conjunto de decisiones. No hay ninguna diferencia entre decir que U(A) 5 y U(B) 4, y decir que U(A) 1 000 000 y U(B) 0.5. En ambos casos los números implican que A es preferible a B. En términos técnicos, nuestra noción de utilidad sólo se define hasta una transformación preservadora del orden (“monótona”).3 Cualquier conjunto de números que refleje con exactitud el orden de preferencias de una persona será suficiente. En consecuencia, no tiene sentido preguntar cuánto más es preferible A que B porque esta pregunta no tiene una sola respuesta. Estudios en los que se le pide a los individuos clasificar su “felicidad” en una escala de 1 a 10 bien podrían usar una escala de 7 a 1 000 000. Sólo cabe esperar que una persona que reporte estar en “6” en la escala cierto día y en “7” al día siguiente sea realmente más feliz el segundo día. Así, las clasificaciones de utilidad son como las clasificaciones ordinales para los restaurantes o las películas en las que se usan una, dos, tres o cuatro estrellas; simplemente registran la atracción relativa de conjuntos de mercancías. Esta falta de singularidad en la asignación de números de utilidad también implica que no es posible comparar utilidades de personas diferentes. Si una persona reporta que cenar un bistec brinda una utilidad de “5” y otra reporta que la misma cena ofrece una utilidad de “100”, no puede decirse cuál de ellas valora más esa cena, porque quizá hayan usado escalas diferentes. De igual manera, no se puede medir si un desplazamiento de la situación A a la situación B brinda más utilidad a una persona u otra. No obstante, como veremos, los economistas pueden decir mucho sobre clasificaciones de utilidad, examinando qué deciden hacer las personas en forma voluntaria. El supuesto ceteris paribus Dado que utilidad se refiere a la satisfacción general tal medida se ve claramente afectada por varios factores. La utilidad de una persona se ve afectada no sólo por su consumo de mercancías físicas, sino también por actitudes psicológicas, presiones de grupos de amigos, experiencias personales y el entorno cultural general. Aunque los economistas tienen un interés general en exami1 Estas propiedades y su relación con la representación de las preferencias mediante una función de utilidad se exponen en detalle en Andreu Mas-Colell, Michael D. Whinston y Jerry R. Green, Microeconomic Theory (Oxford University Press, Nueva York, 1995). 2 J. Bentham, Introduction to the Principles of Morals and Legislation (Hafner, Londres, 1848). 3 Podemos denotar matemáticamente esta idea diciendo que cualquier clasificación numérica de utilidad (U) puede ser transformada en otro conjunto de números por la función F siempre y cuando F(U) preserve el orden. Esto puede garantizarse si F(U) 0. Por ejemplo, la transformación F(U) U2 preserva el orden, lo mismo que la transformación F(U) ln U. Para facilitar el análisis de una clasificación de utilidad particular en algunas secciones del libro y los problemas será conveniente hacer esta clase de transformaciones. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad 91 nar esas influencias, suele ser necesario restarle atención. En consecuencia, una práctica común es atender exclusivamente decisiones entre opciones cuantificables (por ejemplo, las cantidades relativas de alimento y techo comprados, el número de horas trabajadas por semana o los votos entre fórmulas tributarias específicas) manteniendo constantes al mismo tiempo las demás cosas que afectan el comportamiento. Este supuesto ceteris paribus (“todo lo demás igual”) se invoca en todos los análisis económicos de decisiones de optimización de la utilidad para volver manejable el análisis de las decisiones en un marco simplificado. Utilidad del consumo de bienes Como un ejemplo importante del supuesto ceteris paribus considérese el problema de elección de un individuo, en un punto en el tiempo, entre n bienes de consumo x1, x2, …, xn. Supondremos que la clasificación de estos bienes por el individuo puede ser representada por una función de utilidad de la forma utilidad U(x1, x2, …, xn; todo lo demás), (3.1) donde las x se refieren a las cantidades de los bienes que podrían elegirse, y la notación “todo lo demás” se usa como recordatorio de que muchos aspectos del bienestar individual se mantienen constantes en el análisis. A menudo es más fácil escribir la ecuación 3.1 como utilidad U(x1, x2, …, xn) (3.2) O, si sólo se consideran dos bienes, como utilidad U(x, y) (3.2’) donde es evidente que todo se mantiene constante (es decir, fuera del marco de análisis) excepto los bienes referidos en la función de utilidad. Sería tedioso recordarte a cada paso qué se mantiene constante en el análisis, pero deberás recordar que alguna forma del supuesto ceteris paribus siempre estará vigente. Argumentos de funciones de utilidad La notación de la función de utilidad se usa para indicar cómo un individuo clasifica los argumentos particulares de la función considerada. En el caso más común, la función de utilidad (ecuación 3.2) se utilizará para representar cómo un individuo clasifica ciertos conjuntos de bienes que podrían ser adquiridos en un cierto momento. En ocasiones se usarán otros argumentos en la función de utilidad, y es mejor aclarar ciertas convenciones desde el principio. Por ejemplo, podría ser útil hablar de la utilidad que recibe una persona de su patrimonio real (W). Así, usaremos la notación utilidad U(W). (3.3) A menos que el individuo sea más bien peculiar, alguien como Scrooge, el patrimonio en sí mismo no ofrece ninguna utilidad directa. Más bien, sólo cuando el patrimonio se gasta en bienes de consumo es que resulta alguna utilidad. Por esta razón se entenderá que la ecuación 3.3 significa que la utilidad del patrimonio se deriva, de hecho, gastando ese patrimonio de tal manera que produzca la mayor utilidad posible. Otros dos argumentos de funciones de utilidad se usarán en capítulos posteriores. En el capítulo 16 será importante la decisión trabajo-ocio del individuo y, por tanto, habrá que considerar la presencia del ocio en la función de utilidad. La función que utilizaremos será una de la forma utilidad U(c, h) (3.4) Aquí, c representa el consumo y h las horas sin trabajar (es decir, el ocio) durante un periodo particular. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 92 Parte 2: Elección y demanda En el capítulo 17 nos interesarán las decisiones de consumo del individuo en periodos diferentes. En ese capítulo se usará una función de utilidad de la forma utilidad U(c1, c2) (3.5) donde c1 es consumo en este periodo y c2 es consumo en el periodo siguiente. Así, al cambiar los argumentos de la función de utilidad podremos concentrarnos en aspectos específicos de las decisiones de un individuo en varios marcos simplificados. En suma, iniciaremos nuestro examen del comportamiento individual con la definición siguiente. DEFINICIÓN Utilidad. Se supone que las preferencias de las personas están representadas por una función de utilidad de la forma U(x1, x2, …, xn), (3.6) donde x1, x2, …, xn son las cantidades de cada uno de los n bienes que podrían consumirse en un periodo. Esta función es única sólo hasta una transformación preservadora del orden. Bienes económicos En esta representación se entiende que las variables son “bienes”; es decir, cualesquiera que sean las cantidades económicas que representen, suponemos que se prefiere más que menos de cualquier xi particular durante cierto periodo. Suponemos que esto se aplica a todo bien, sea un artículo simple de consumo como un hot dog o un agregado complejo como patrimonio u ocio. Hemos descrito esta convención para una función de utilidad de dos bienes en la figura 3.1. Ahí, todos los conjuntos de bienes de consumo en el área sombreada son preferibles al conjunto x∗, y∗ porque cualquier paquete en el área sombreada brinda más de al menos uno de los bienes. De acuerdo con nuestra definición de “bienes”, los conjuntos de bienes en el área sombreada ocupan una clasificación más alta que x∗, y∗. De igual manera, los conjuntos en el área marcada como “peor” son evidentemente inferiores a x∗, y∗ porque contienen menos de al menos uno de los bienes y no más del otro. Los conjuntos en las dos áreas indicadas por signos de interrogación son difíciles de comparar con x∗, y∗, porque contienen más de uno de los bienes y menos del otro. Desplazamientos dentro de estas áreas implican opciones entre ambos bienes. INTERCAMBIOS Y SUSTITUCIÓN La mayor parte de la actividad económica implica el intercambio voluntario entre individuos. Cuando una persona compra, digamos, una hogaza de pan, renuncia voluntariamente a una cosa (dinero) a cambio de otra (pan) de mayor valor para ella. Para examinar este tipo de transacción voluntaria debemos desarrollar un aparato formal para ilustrar intercambios en el contexto de la función de utilidad. Motivaremos inicialmente nuestro análisis con una presentación gráfica y después pasaremos a matemáticas más formales. Curvas de indiferencia y la tasa marginal de sustitución Los intercambios voluntarios pueden estudiarse mucho mejor usando el recurso gráfico de una curva de indiferencia. En la figura 3.2 la curva U1 representa todas las combinaciones alternativas de x y y para las cuales un individuo está igualmente en buenas condiciones (recuerda que todos los demás argumentos de la función de utilidad se mantienen constantes). Esta persona está igualmente satisfecha consumiendo, por ejemplo, la combinación de bienes x1, y1 o la combinación x2, y2. Esta curva que representa todos los conjuntos de bienes de consumo que el individuo clasifica para el mismo nivel de utilidad se llama curva de indiferencia. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad FIGURA 3.1 Es preferible más que menos de un bien. 93 El área sombreada representa las combinaciones de x y y inequívocamente preferibles a la combinación x∗, y∗. Ceteris paribus, los individuos prefieren más que menos de cualquier bien. Las combinaciones identificadas con “?” implican cambios ambiguos en el bienestar porque contienen más de un bien y menos de otro. Cantidad de y ? Preferible a x*, y* y* Peor que x*, y* ? Cantidad de x x* DEFINICIÓN Curva de indiferencia. Una curva de indiferencia (o, en muchas dimensiones, una superficie de indiferencia) muestra una serie de conjuntos de bienes de consumo acerca de los cuales el individuo es indiferente. Es decir, todos los conjuntos brindan el mismo nivel de utilidad. La pendiente de la curva de indiferencia en la figura 3.2 es negativa, lo cual indica que si el individuo es obligado a renunciar a una parte de y, debe ser compensado por una cantidad adicional de x para mantenerse indiferente entre los dos conjuntos de bienes. Esta curva también está trazada de tal modo que la pendiente aumenta al aumentar x (es decir, la pendiente comienza en infinito negativo y aumenta hacia cero). Esta es una representación gráfica del supuesto de que las personas están progresivamente menos dispuestas a ceder y para obtener más x. En términos matemáticos el valor absoluto de esta pendiente disminuye al aumentar x. De ahí que se tenga la definición siguiente. DEFINICIÓN Tasa marginal de sustitución. La pendiente negativa de una curva de indiferencia (U1) en algún punto se denomina tasa marginal de sustitución (TMS) en ese punto. Es decir, TMS dy , dx UU1 donde la notación indica que la pendiente debe calcularse a lo largo de la curva de indiferencia U1. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (3.7) 8/23 94 Parte 2: Elección y demanda FIGURA 3.2 Curva de indiferencia. La curva U1 representa aquellas combinaciones de x y y de las cuales el individuo deriva la misma utilidad. La pendiente de esta curva representa la tasa en la que el individuo está dispuesto a intercambiar x por y mientras permanezca en condiciones igualmente buenas. La pendiente (o, más propiamente, la pendiente negativa se denomina tasa marginal de sustitución. En la figura la curva de indiferencia se traza con base en el supuesto de una tasa marginal de sustitución decreciente. Cantidad de y U1 y1 y2 U1 x1 x2 Cantidad de x Así, la pendiente de U1 y la TMS nos dicen algo sobre los intercambios que esta persona hará en forma voluntaria. En un punto como x1, y1, la persona tiene mucho de y y está dispuesta a intercambiar una cantidad significativa de ella para obtener más x. Por tanto, la curva de indiferencia en x1, y1 es más bien empinada. Esta es una situación en la que la persona tiene, digamos, muchas hamburguesas (y) y poco que beber para acompañarlas (x). Esta persona renunciaría gustosamente a algunas hamburguesas (digamos 5) para saciar su sed con una bebida más. En x2, y2, por otro lado, la curva de indiferencia es más plana. Aquí, esta persona tiene algunas bebidas y está dispuesta a renunciar a relativamente pocas hamburguesas (digamos 1) para obtener otra bebida. En consecuencia, la TMS disminuye entre, x1, y1 y x2, y2. La inestable pendiente de U1 muestra cómo el particular conjunto de bienes de consumo disponible influye en los intercambios que esta persona hará libremente. Mapa de curvas de indiferencia En la figura 3.2 sólo se trazó una curva de indiferencia. El cuadrante x, y, sin embargo, está densamente ocupado por curvas de ese tipo, cada una de las cuales corresponde a un nivel de utilidad diferente. Dado que cada conjunto de bienes puede clasificarse y produce cierto nivel de utilidad, cada punto de la figura 3.2 debe tener una curva de indiferencia que pase por él. Las curvas de indiferencia son similares a las curvas de nivel en un mapa, en el sentido de que representan líneas de igual “altitud” de utilidad. En la figura 3.3 se advierten varias curvas de indiferencia para indicar que en el plano hay un número infinito de estas. El nivel de utilidad representado por dichas curvas aumenta conforme nos movemos hacia el noreste; la utilidad de la curva U1 es menor que la de U2, la cual es menor que la de U3. Esto se debe al supuesto que se establece en la figura 3.1: es preferible más que menos de un bien. Como ya se dijo, no existe una manera única de asignar Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad FIGURA 3.3 Hay infinitas curvas de indiferencia en el plano x-y. 95 Hay una curva de indiferencia que pasa por cada punto en el plano x-y. Cada una de esas curvas registra combinaciones de x y y de las cuales el individuo recibe cierto nivel de satisfacción. Desplazamientos en una dirección noreste representan movimientos a mayores niveles de satisfacción. Cantidad de y U1 U2 U3 Utilidad creciente U3 U2 U1 Cantidad de x números a estos niveles de utilidad. Las curvas sólo muestran que las combinaciones de bienes en U3 son preferibles a aquellas en U2, las cuales son preferibles a aquellas en U1. Curvas de indiferencia y transitividad Como ejercicio de examen de la relación entre preferencias sistemáticas y la representación de preferencias por funciones de utilidad, consideremos la siguiente pregunta: ¿dos curvas de indiferencia cualesquiera de un individuo pueden interceptarse? Dos de tales curvas cruzadas aparecen en la figura 3.4. Queremos saber si estas violan nuestros axiomas básicos de racionalidad. Usando nuestra analogía del mapa parecería haber algo erróneo en el punto E donde la “altitud” es igual a dos números diferentes, U1 y U2. Pero ningún punto puede estar a la vez a 100 y a 200 pies sobre el nivel del mar. Para proceder formalmente analicemos los conjuntos de bienes representados por los puntos A, B, C y D. Por efecto del supuesto de no saciedad (es decir, de que más de un bien siempre incrementa la utilidad) “A es preferible a B” y “C es preferible a D”. Pero esta persona está igualmente satisfecha con B y C (que están en la misma curva de indiferencia), así que el axioma de transitividad implica que A debe preferirse a D. Sin embargo, esto no puede ser cierto, porque A y D están en la misma curva de indiferencia y se consideran por definición indiferentes. Esta contradicción demuestra que las curvas de indiferencia no se pueden interceptar. Así, siempre debemos trazar mapas de curvas de indiferencia como los que aparecen en la figura 3.3. Convexidad de curvas de indiferencia Otra manera de enunciar el principio de tasa marginal de sustitución decreciente usa la noción matemática de conjunto convexo. Se dice que un conjunto de puntos es convexo si dos puntos cualesquiera en él pueden unirse por una línea recta completamente contenida en el conjunto. El Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 96 Parte 2: Elección y demanda Las combinaciones A y D están en la misma curva de indiferencia y, por tanto, son igualmente deseables. Pero el axioma de transitividad puede usarse para demostrar que A es preferible a D. De ahí que curvas de indiferencia interceptadas no son congruentes con las preferencias racionales. FIGURA 3.4 La intersección de curvas de indiferencia implica preferencias asistemáticas. Cantidad de y C D E A U1 B U2 Cantidad de x supuesto de una TMS decreciente es equivalente al de que todas las combinaciones de x y y preferibles o indiferentes a una combinación particular x∗, y∗ forman un conjunto convexo.4 Esto se ilustra en la figura 3.5a, donde todas las combinaciones preferibles o indiferentes a x∗, y∗ están en el área sombreada. Dos combinaciones cualesquiera entre estas —digamos x1, y1 y x2, y2— pueden unirse por una línea recta también contenida en el área sombreada. En la figura 3.5b esto no es cierto. Una línea que une a x1, y1 y x2, y2 pasa fuera del área sombreada. Así, la curva de indiferencia a través de x∗, y∗ en la figura 3.5b no cumple el supuesto de la TMS decreciente porque el conjunto de puntos preferible o indiferente a x∗, y∗ no es convexo. Convexidad y equilibrio en el consumo Usando la noción de convexidad puede demostrarse que los individuos prefieren cierto equilibrio en su consumo. Supongamos que un individuo es indiferente entre las combinaciones x1, y1 y x2, y2. Si la curva de indiferencia es estrictamente convexa la combinación (x1 x2)/2, (y1 y2)/2 será preferible a cualquiera de las combinaciones iniciales.5 Intuitivamente, los conjuntos de bienes “debidamente equilibrados” son preferibles a los conjuntos muy inclinados a un solo bien. Esto se ilustra en la figura 3.6. Dado que la curva de indiferencia se supone convexa, todos los puntos en la línea recta que une a (x1, y1) y a (x2, y2) son preferibles a esos puntos iniciales. En consecuencia, este será el caso del punto (x1 x2)/2, (y1 y2)/2, que está en el punto medio de esa línea. En 4 Esta definición es equivalente a suponer que la función de utilidad es cuasi cóncava. Tales funciones se estudiaron en el capítulo 2 y volveremos a examinarlas en la siguiente sección. A veces se usa el término cuasi concavidad estricta para descartar la posibilidad de curvas de indiferencia que tengan segmentos lineales. En general supondremos cuasi concavidad estricta, pero en algunas secciones ilustraremos las complicaciones planteadas por porciones lineales de curvas de indiferencia. 5 En el caso en que la curva de indiferencia tenga un segmento lineal el individuo será indiferente entre las tres combinaciones. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad FIGURA 3.5 Noción de convexidad como definición alterna de la TMS decreciente. En a), la curva de indiferencia es convexa (toda línea que una dos puntos arriba de U1 también estará arriba de U1). En b) tal no es el caso y la curva mostrada ahí no tiene en todas partes una TMS decreciente. Cantidad de y Cantidad de y U1 U1 y1 y1 y* y* y2 U1 x1 x* x2 Cantidad de x (a) FIGURA 3.6 Son preferibles los conjuntos equilibrados de bienes a los conjuntos extremos. y2 U1 x1 x* x2 Cantidad de x (b) Si las curvas de indiferencia son convexas (si cumplen el supuesto de la TMS decreciente) la línea que una dos puntos cualesquiera que sean indiferentes contendrán puntos preferibles a cualesquiera de las combinaciones iniciales. Intuitivamente, los conjuntos equilibrados son preferibles a los no equilibrados. Cantidad de y U1 y1 y1 + y 2 2 y2 U1 x1 x1 + x 2 2 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. x2 23.08.2019 Cantidad de x 97 8/23 98 Parte 2: Elección y demanda efecto, cualquier combinación proporcional de los dos conjuntos indiferentes de bienes será preferible a los conjuntos iniciales porque representará una combinación más equilibrada. Así, la convexidad estricta es equivalente al supuesto de la TMS decreciente. Ambos supuestos descartan la posibilidad de que una curva de indiferencia sea recta en cualquier porción de su longitud. EJEMPLO 3.1 Utilidad y TMS Supongamos que la clasificación que una persona haga de las hamburguesas (y) y los refrescos (x) pudiera representarse con la función de utilidad utilidad x . y. (3.8) Una curva de indiferencia de esta función se puede hallar identificando el conjunto de combinaciones de x y y para el cual la utilidad tiene el mismo valor. Supóngase que, arbitrariamente, igualamos la utilidad a 10. Entonces, la ecuación de esta curva de indiferencia es utilidad 10 x . y. (3.9) Puesto que elevar al cuadrado esta función preserva el orden, esta curva de indiferencia también es representada por 100 x . y, (3.10) que es más fácil de graficar. En la figura 3.7 aparece esta curva de indiferencia; se trata de una conocida hipérbola rectangular. Una manera de calcular la TMS es despejar y en la ecuación 3.10, y 100/x, (3.11) FIGURA 3.7 Curva de indiferencia de utilidad ⴝ x·y Esta curva de indiferencia ilustra la función 10 U x · y. En el punto A(5, 20), la TMS es 4, lo que implica que esta persona está dispuesta a intercambiar 4y por una x adicional. En el punto B(20, 5), sin embargo, la TMS es 0.25, lo cual implica una muy reducida disposición a intercambiar. Cantidad de y A 20 C 12.5 B 5 U = 10 0 5 12.5 Cantidad de x 20 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad 99 Se usa entonces la definición (ecuación 3.7): TMS dy/dx (a lo largo de U1) 100/x2. (3.12) Evidentemente, esta TMS decrece al incrementarse x. En un punto como A en la curva de indiferencia con muchas hamburguesas (digamos x 5, y 20), la pendiente es empinada, así que la TMS es alta: TMS en (5, 20) 100/x2 100/25 4. (3.13) Aquí la persona está dispuesta a renunciar a 4 hamburguesas para obtener 1 refresco más. Por otro lado en B, donde hay relativamente pocas hamburguesas (aquí x 20, y 5), la pendiente es plana y la TMS baja: TMS en (20, 5) 100/x2 100/400 0.25. (3.14) Ahora esta persona sólo renunciará a un cuarto de hamburguesa por otro refresco. Nótese también cómo la convexidad de la curva de indiferencia U1 es ilustrada por este ejemplo numérico. El punto C está a medio camino entre los puntos A y B; en C esta persona tiene 12.5 hamburguesas y 12.5 refrescos. Aquí la utilidad está dada por utilidad x . y (12.5)2 12.5, (3.15) que obviamente excede la utilidad a lo largo de U1 (la cual fue supuesta como 10). PREGUNTA: Aquí, con base en nuestra derivación, parece que la TMS depende sólo de la cantidad de x consumida. ¿Por qué es engañoso esto? ¿Cómo entra implícitamente la cantidad de y en las ecuaciones 3.13 y 3.14? MATEMÁTICA DE LAS CURVAS DE INDIFERENCIA Una derivación matemática del concepto de curva de indiferencia brinda discernimientos adicionales sobre la naturaleza de las preferencias. En esta sección se examinará un ejemplo de dos bienes directamente relacionados con el tratamiento gráfico que ya hemos provisto. Más adelante se estudiará el caso de muchos bienes, aunque se concluirá que este caso más complicado sólo añade unos cuantos discernimientos. Tasa marginal de sustitución Supongamos que un individuo recibe la utilidad de consumir dos bienes cuyas cantidades están dadas por x y y. La clasificación que esta persona hace de los conjuntos de estos bienes puede representarse con una función de utilidad de la forma U(x, y). Estas combinaciones de los dos bienes que producen un nivel específico de utilidad, digamos k, son representadas por las soluciones de la ecuación implícita U(x, y) k. En el capítulo 2 (véase ecuación 2.23) se demostró que las opciones contenidas por tal ecuación están dadas por: dy dx U ( x, Umgx . Umgy y) k (3.16) Es decir, la tasa a la que x puede intercambiarse por y está dada por la razón negativa de la “utilidad marginal” del bien x con aquella del bien y. Suponiendo que las cantidades adicionales de ambos bienes aportan utilidad agregada, la tasa de esta opción será negativa lo que implica que los incrementos en la cantidad del bien x deben coincidir con los decrementos en la cantidad del bien Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 100 Parte 2: Elección y demanda y para mantener constante la utilidad. Ya se definió la tasa marginal de sustitución como el valor negativo (o el valor absoluto) de estas opciones, así que ahora se tiene: dy dx U ( x, TMS y) k Umgx . Umgy (3.17) Esta derivación ayuda a comprender por qué la TMS no depende específicamente de cómo se mida la utilidad. Dado que la TMS es una razón de dos medidas de utilidad, las unidades “se eliminan” en el cálculo. Por ejemplo, supongamos que el bien x representa los alimentos y que se ha elegido una función de utilidad para la cual una unidad extra de alimentos produce 6 unidades extra de utilidad (unidades también conocidas como útiles). Supongamos también que y representa prendas de vestir y que con esta función de utilidad cada unidad extra de ropa brinda 2 unidades extra de utilidad. En este caso resulta claro que esta persona está dispuesta a renunciar a 3 unidades de ropa (y a perder, por tanto, 6 útiles) a cambio de una unidad extra de alimentos (y a ganar, por tanto, 6 útiles): TMS dy Umgx 6 útiles por unidad x 3 unidades y por unidad x dx Umgy 2 útiles por unidad y (3.18) Obsérvese que la medida de utilidad usada aquí (útiles) se elimina al hacer el cálculo, y lo que resta está puramente en términos de las unidades de los dos bienes. Esto demuestra que la TMS se mantendrá sin cambios, cualquiera que sea la clasificación de utilidad específica utilizada.6 Convexidad de curvas de indiferencia En el capítulo 1 se describió cómo los economistas fueron capaces de resolver la paradoja del agua y el diamante, proponiendo que el precio del agua es bajo porque un galón más ofrece relativamente poco en términos de utilidad creciente. El agua es (en la mayoría de los casos) abundante; así, su utilidad marginal es baja. Claro que en un desierto el agua sería escasa y su utilidad marginal (precio) podría ser alta. Así, puede concluirse que la utilidad marginal asociada con el consumo de agua disminuye al consumir más agua; en términos formales, la segunda derivada (parcial) de la función de utilidad (es decir, Umgxx = 2U/x2) deberá ser negativa. Intuitivamente parece que esta idea de sentido común también debería explicar por qué las curvas de indiferencia son convexas. El hecho de que las personas estén cada vez menos dispuestas a compartir el bien y para obtener más x (manteniendo constante la utilidad) parece remitir al mismo fenómeno: no quieren demasiado de ningún bien. Lamentablemente la relación precisa entre la utilidad marginal decreciente y la TMS decreciente es compleja, aun en el caso de dos bienes. Como se demostró en el capítulo 2, una función tendrá (por definición) curvas de indiferencia convexas, siempre y cuando sea cuasi cóncava. Pero las condiciones requeridas para la cuasi concavidad son caóticas y el supuesto de utilidad marginal decreciente (es decir, de derivadas parciales de segundo orden negativas) no garantiza que se mantendrán.7 Aun así, como veremos, existen buenas razones para suponer que las funciones de utilidad (y muchas otras funciones usadas en microeconomía) son cuasi cóncavas; así, no nos interesaremos demasiado en las situaciones en que no lo son. 6 Más formalmente, sea F[U(x, y)] cualquier transformación monótona de la función de utilidad con F(U) clasificación de utilidad, la TMS está dada por TMS 0. Con esta nueva F/x F(U)·Umg x Umg x , F/y F(U)·Umg y Umg y que es igual a la TMS de la función de utilidad original. 7 Específicamente, para que la función U(x, y) sea cuasi cóncava debe mantenerse la condición siguiente (véase ecuación 2.114): UxxUx2 2UxyUxUy UyyUy2 0. Los supuestos de que Uxx, Uyy 0 no garantizan esto. También hay que fijarse en el signo de la derivada cruzada parcial Uxy. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad 101 EJEMPLO 3.2 Demostración de la convexidad de curvas de indiferencia El cálculo de la TMS de las funciones de utilidad específicas es frecuentemente un buen atajo para demostrar la convexidad de curvas de indiferencia. En particular, el proceso puede ser mucho más simple que aplicar la definición de cuasi concavidad, aunque es más difícil de generalizar a más de dos bienes. Aquí se examinará cómo puede usarse la ecuación 3.17 para tres diferentes funciones de utilidad (para más práctica, véase el problema 3.1). 1. U(x, y) x . y. Este ejemplo repite sencillamente el caso ilustrado en el ejemplo 3.1. Un atajo para aplicar la ecuación 3.17 y que puede simplificar el álgebra es tomar el logaritmo de esta función de utilidad. Dado que tomar logaritmos preserva el orden, esto no alterará la TMS por calcular. Así, sea U∗(x, y) ln[U(x, y)] 0.5 ln x 0.5 ln y. (3.19) Aplicar la ecuación 3.17 produce TMS U / x 0.5/x y , U / y 0.5/y x (3.20) lo cual parece un método mucho más simple que el que usamos previamente.8 Es evidente que esta TMS es decreciente al incrementar x y disminuir y. Así, las curvas de indiferencia son convexas. 2. U(x, y) x xy y. En este caso no hay ninguna ventaja en transformar esta función de utilidad. Aplicar la ecuación 3.17 produce TMS U/ x 1 y . U/ y 1 x (3.21) Nuevamente, esta razón decrece visiblemente al incrementar x y disminuir y; así, las curvas de indiferencia de esta función son convexas. 3. U(x, y) x2 y2 En este ejemplo es más fácil usar la transformación U∗(x, y) [U(x, y)]2 x2 y2. (3.22) Debido a que esta es la ecuación de un cuarto de círculo, deberíamos comenzar por sospechar que puede haber algunos problemas con las curvas de indiferencia de esta función de utilidad. Dichas sospechas se confirman aplicando otra vez la definición de la TMS para producir TMS U / x 2x x . U y 2y y (3.23) Para esta función está claro que al incrementar x y disminuir y la TMS se incrementa. De ahí que las curvas de indiferencia sean cóncavas, no convexas; así que evidentemente esta no es una función cuasi cóncava. PREGUNTAS: ¿La duplicación de x y y cambia la TMS en alguno de estos tres ejemplos? Es decir, ¿la TMS depende sólo de la razón de x con y, y no de la escala absoluta de compras? (Véase también el ejemplo 3.3.) En el ejemplo 3.1 se examinó la curva de indiferencia U 10. Así, para esta curva, y 100/x y la TMS en la ecuación 3.20 sería TMS 100/x2, como se calculó antes. 8 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 102 Parte 2: Elección y demanda FUNCIONES DE UTILIDAD PARA PREFERENCIAS ESPECÍFICAS Las clasificaciones que los individuos hacen de los conjuntos de mercancías y las funciones de utilidad implicadas no son observables. Todo lo que podemos saber de las preferencias de las personas debe proceder del comportamiento que observamos cuando responden a cambios en ingreso, precios y otros factores. No obstante, es útil examinar algunas de las formas que las funciones de utilidad particulares podrían adoptar. Tal examen puede ofrecer discernimientos de la conducta observada y (más específicamente) la comprensión de las propiedades de esas funciones puede ser de utilidad para resolver problemas. Aquí se examinarán cuatro ejemplos específicos de funciones de utilidad de dos bienes. Los mapas de curvas de indiferencia de estas funciones se ilustran en los cuatro paneles de la figura 3.8. Como debería ser evidente, estas cubren unas cuantas formas posibles. Incluso es posible mayor variedad una vez que pasemos a las funciones de tres o más bienes, y algunas de esas posibilidades se mencionarán en capítulos posteriores. FIGURA 3.8 Ejemplos de funciones de utilidad. Estos cuatro mapas de curvas de indiferencia ilustran grados alternos de sustitución de x por y. Las funciones Cobb-Douglas y de elasticidad de sustitución constante (ESC) (trazadas aquí para relativamente baja sustitución) caen entre los extremos de sustitución perfecta (b) y no sustitución (c). Cantidad de y Cantidad de y U2 U1 U2 U1 U0 U0 Cantidad de x (a) Cobb-Douglas Cantidad de x (b) Sustitutos perfectos Cantidad de y Cantidad de y U2 U1 U2 U1 U0 U0 Cantidad de x (c) Complementos perfectos Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. Cantidad de x (d) ESC 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad 103 Utilidad de la función Cobb-Douglas La figura 3.8a muestra la conocida figura de una curva de indiferencia. Una función de utilidad de uso común que genera este tipo de curvas tiene la forma utilidad U(x, y) xy, (3.24) donde y son constantes positivas. En los ejemplos 3.1 y 3.2 se estudió un caso particular de esta función, para el cual 0.5. El caso más general, que se presenta en la ecuación 3.24, se denomina función Cobb-Douglas en honor de los dos investigadores que usaron esta función en un estudio detallado de las relaciones de producción en la economía estadounidense (véase el capítulo 9). En general, las magnitudes relativas de y indican la relativa importancia de los dos bienes para este individuo. Como la utilidad es única sólo hasta una transformación monótona, a menudo resulta conveniente normalizar estos parámetros de tal manera que 1. En este caso la utilidad estaría dada por U(x, y) xy1 (3.25) donde /( ), 1 /( ). Sustitutos perfectos Las curvas de indiferencia lineales de la figura 3.8b son generadas por una función de utilidad de la forma utilidad U(x, y) x y, (3.26) donde, nuevamente, y son constantes positivas. Que las curvas de indiferencia de esta función sean líneas rectas debería ser de inmediato evidente: cualquier curva de nivel particular puede calcularse igualando U(x, y) con una constante que especifique una línea recta. La naturaleza lineal de estas curvas de indiferencia da origen al término de sustitutos perfectos para describir la relación implicada entre x y y. Puesto que la TMS es constante (e igual a /) a lo largo de la curva de indiferencia entera, nuestras nociones previas de la TMS decreciente no se aplican en este caso. Una persona con estas preferencias estaría dispuesta a renunciar a la misma cantidad de y para obtener una x más sin importar cuánta x se haya consumido. Tal situación podría describir la relación entre diferentes marcas de lo que es en esencia el mismo producto. Por ejemplo, a muchas personas (incluidos los autores) no les importa dónde compran gasolina. Un galón de gasolina es un galón de gasolina pese a los mejores esfuerzos de los departamentos de publicidad de Exxon y Shell por convencernos de lo contrario. Dado este hecho, siempre estamos dispuestos a renunciar a 10 galones de Exxon a cambio de 10 galones de Shell porque no nos importa cuál usamos ni dónde llenamos el tanque la última vez. En efecto, como se verá en el capítulo siguiente, una implicación de esa relación es que compraremos toda nuestra gasolina con el distribuidor de menor costo. Como no experimentamos una TMS de Exxon por Shell, no hay razón para buscar un equilibrio entre los tipos de gasolina que utilizamos. Complementos perfectos Las curvas de indiferencia en forma de L de la figura 3.8c ilustran una situación directamente opuesta al caso de sustitutos perfectos. Estas preferencias se aplicarían a bienes complementarios: café y crema, crema de cacahuate y mermelada, queso crema y salmón ahumado son algunos ejemplos conocidos. Las curvas de indiferencia que se advierten en la figura 3.8c implican que esos pares de bienes serán usados en la relación proporcional fija que representan los vértices de las curvas. Una persona que prefiere 1 onza de crema con 8 onzas de café querrá 2 onzas de crema con 16 onzas de café. Café extra sin crema no es de valor para esa persona, así como crema extra tampoco sería de valor sin café. Sólo eligiendo los bienes juntos la utilidad puede aumentar. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 104 Parte 2: Elección y demanda Estos conceptos pueden formalizarse examinando la forma matemática de la función de utilidad que genera dichas curvas de indiferencia en forma de L: utilidad U(x, y) min(x, y). (3.27) Aquí y son parámetros positivos, y el operador “min” significa que la utilidad está dada por el menor de los términos entre paréntesis. En el ejemplo del café-crema, si se concede que las onzas de café están representadas por x y las onzas de crema por y, la utilidad estaría dada por utilidad U(x, y) min(x, 8y). (3.28) Ahora, 8 onzas de café y 1 onza de crema proporcionan 8 unidades de utilidad. Pero 16 onzas de café y 1 onza de crema siguen proporcionando sólo 8 unidades de utilidad porque min(16, 8) 8. El café extra sin crema no es de valor, como lo muestra la sección horizontal de las curvas de indiferencia respecto al desplazamiento desde un vértice; la utilidad no se incrementa cuando sólo se incrementa x (con y constante). Sólo si el café y la crema se duplican por igual (a 16 y 2, respectivamente) la utilidad se incrementará a 16. En general, ninguno de los dos bienes especificados en la función de utilidad dada por la ecuación 3.27 se consumirá en cantidades superfluas si x y. En este caso, la razón de la cantidad del bien x consumida con la del bien y será una constante, dada por y . x (3.29) El consumo ocurrirá en los vértices de las curvas de indiferencia que se muestran en la figura 3.8c. Utilidad ESC Las tres funciones de utilidad específicas ilustradas hasta ahora son casos especiales de la función más general ESC, que adopta la forma x y , (3.30) utilidad U(x, y) ln x ln y (3.31) utilidad U ( x, y) donde 1, 0, y cuando 0. Es obvio que el caso de sustitutos perfectos corresponde al caso límite, 1, en la ecuación 3.30 y que el caso de Cobb-Douglas9 corresponde a 0 en la ecuación 3.31. Es menos obvio que el caso de proporciones fijas corresponde a en la ecuación 3.30, pero ese resultado también puede mostrarse usando un argumento de límites. El uso del término elasticidad de sustitución para esta función se deriva de la noción de que las posibilidades que se ilustran en la figura 3.8 corresponden a varios valores del parámetro de sustitución, , que para esta función está dado por 1/(1 ). En cuanto a los sustitutos perfectos entonces , y el caso de proporciones fijas tiene 0.10 Debido a que la función ESC nos permite explorar todos estos casos, y muchos intermedios, resultará útil para ilustrar el grado de sustitución presente en varias relaciones económicas. La forma específica de la función ESC que se ilustra en la figura 3.8a es para el caso 1. Esto es, utilidad x 1 y 1 1 x 1 . y (3.32) 9 La función ESC puede generalizarse fácilmente para tomar en cuenta diferentes ponderaciones por atribuir a los dos bienes. Como el principal uso de esta función es examinar cuestiones de sustitución, usualmente no haremos esa generalización. En algunas aplicaciones de la función ESC también omitiremos los denominadores de la función, porque sólo constituyen un factor de escala cuando es positiva. Para valores negativos de , sin embargo, el denominador es necesario para garantizar que la utilidad marginal es positiva. 10 El concepto de elasticidad de sustitución será explicado en detalle en relación con las funciones de producción en el capítulo 9. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad 105 Para esta situación 1/(1 ) 1/2 y, como muestra la gráfica, estas curvas de indiferencia marcadamente curvas evidentemente caen entre los casos de Cobb-Douglas y de proporciones fijas. Los signos negativos en esta función de utilidad podrían parecer extraños, pero las utilidades marginales tanto de x como de y son positivas y decrecientes, como era de esperar. Esto explica por qué debe aparecer en los denominadores de la ecuación 3.30. En el caso particular de la ecuación 3.32 la utilidad se incrementa de (cuando x y 0) hacia 0 al incrementarse x y y. Esta es una escala de utilidad extraña, quizá, pero perfectamente aceptable y con frecuencia útil. EJEMPLO 3.3 Preferencias homotéticas Todas las funciones de utilidad descritas en la figura 3.8 son homotéticas (véase el capítulo 2). Es decir, la tasa marginal de sustitución de esas funciones depende sólo de la razón de las cantidades de ambos bienes, no de las cantidades totales de los bienes. Este hecho es obvio para los casos de sustitutos perfectos (cuando la TMS es la misma en cada punto) y de complementos perfectos (donde la TMS es infinita para y/x /, indefinida cuando y/x / y de cero cuando y/x /). Para la función general CobbDouglas, la TMS puede encontrarse como TMS U/x x 1 y y , U/y x y 1 x (3.33) la cual claramente depende de la razón y/x. Demostrar que la función ESC también es homotética se deja como ejercicio (véase el problema 3.12). La importancia de las funciones homotéticas es que una curva de indiferencia es muy parecida a otra. Las pendientes de las curvas dependen sólo de la razón y/x, no de lo distante de la curva desde el origen. Las curvas de indiferencia para mayor utilidad son simples copias de aquellas para menor utilidad. De ahí que se pueda estudiar el comportamiento de un individuo con preferencias homotéticas, analizando únicamente una curva de indiferencia o unas cuantas curvas cercanas sin temer que nuestros resultados cambien drásticamente en diferentes niveles de utilidad. PREGUNTA: ¿Cómo podrías definir geométricamente las funciones homotéticas? ¿Cómo sería el locus de todos los puntos con TMS particular en el mapa de curvas de indiferencia de un individuo? EJEMPLO 3.4 Preferencias no homotéticas Aunque todos los mapas de curvas de indiferencia de la figura 3.8 exhiben preferencias homotéticas, esta necesidad no siempre es cierta. Considérese la función de utilidad cuasi lineal utilidad U(x, y) x ln y. (3.34) Para esta función una buena y exhibe utilidad marginal decreciente, pero una buena x no. La TMS puede calcularse como TMS U/x 1 y U/y 1/y (3.35) La TMS disminuye al decrecer la cantidad elegida de y, pero es independiente de la cantidad consumida de x. Como x tiene una utilidad marginal constante, la disposición de una persona a renunciar a y para obtener una unidad más de x sólo depende de cuánto tenga de y. A diferencia del caso homotético, la duplicación tanto de x como de y duplica la TMS en vez de dejarla sin cambios. PREGUNTAS: ¿Cómo es el mapa de curvas de indiferencia de la función de utilidad de la ecuación 3.34? ¿Por qué esto podría aproximar una situación en la que y es un bien específico y x representa todos los demás? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 106 Parte 2: Elección y demanda EL CASO DE MUCHOS BIENES Todos los conceptos que hasta aquí hemos estudiado para el caso de dos bienes pueden generalizarse a situaciones en que la utilidad es una función arbitraria de muchos bienes. En esta sección se explorarán brevemente esas generalizaciones. Aunque este examen no añadirá mucho a lo ya demostrado, en la economía aplicada puede ser importante considerar las preferencias de las personas por muchos bienes como se verá en capítulos posteriores. Si la utilidad es una función de n bienes de la forma U(x1, x2, . . ., xn), entonces la ecuación U(x1, x2, . . ., xn) k (3.36) define una superficie de indiferencia en n dimensiones. Esta superficie muestra todas las combinaciones de los n bienes que producen el mismo nivel de utilidad. Aunque probablemente sea imposible imaginar cómo sería esa superficie, seguiremos suponiendo que es convexa. Es decir, los conjuntos balanceados de bienes serán preferibles a los desbalanceados. De ahí que la función de utilidad, aun en muchas dimensiones, se suponga cuasi cóncava. TMS con muchos bienes Es posible estudiar los intercambios que una persona podría hacer voluntariamente entre dos bienes cualesquiera (digamos x1 y x2), usando de nuevo el teorema de la función implícita: TMS dx2 dx1 U ( x1 , x2 , ..., xn) k Ux1 ( x1 , x2 , . . . , xn) . Ux2 ( x1 , x2 , . . . , xn) (3.37) La notación aquí destaca el hecho importante de que la disposición de un individuo a intercambiar x1 por x2 dependerá no sólo de las cantidades de ambos bienes, sino también de las cantidades de todos los demás bienes. La disposición de un individuo a intercambiar alimentos por ropa dependerá no sólo de las cantidades de alimentos y ropa que tenga, sino también de cuánto “techo” tenga. En general, sería de esperar que las variaciones en las cantidades de cualquiera de esos otros bienes afecten la opción representada por la ecuación 3.37. Esta posibilidad es la que a veces puede complicar el generalizar los hallazgos de modelos simples de dos bienes al caso de muchos bienes. Se debe tener cuidado de especificar qué se supone acerca de las cantidades de los demás bienes. En capítulos posteriores se examinan ocasionalmente tales complejidades. Sin embargo, en la mayoría de los casos el modelo de dos bienes será suficiente para desarrollar intuición sobre relaciones económicas. Resumen En este capítulo se describió la manera en que los economistas formalizan las preferencias de los individuos acerca de los bienes que eligen. Se llegó a varias conclusiones sobre esas preferencias que, en los capítulos siguientes, desempeñarán un papel central en nuestro análisis de la teoría de la elección: • La pendiente negativa de una curva de indiferencia se define como tasa marginal de sustitución (TMS). Esta muestra la tasa en que un individuo renunciaría voluntariamente a una cantidad de un bien (y) si fuera compensado con la recepción de una unidad más de otro bien (x). • Si los individuos obedecen ciertos postulados conductuales básicos respecto a sus preferencias entre bienes, podrán clasificar todos los conjuntos de mercancías y esa clasificación puede representarse con una función de utilidad. Al tomar decisiones los individuos se comportarán como si optimizara esa función. • El supuesto de que la TMS decrece al sustituir x por y en el consumo es congruente con la noción de que los individuos prefieren cierto equilibrio en sus decisiones de consumo. Si la TMS es siempre decreciente, los individuos tendrán curvas de indiferencia estrictamente convexas. Es decir, su función de utilidad será estrictamente cuasi cóncava. • Las funciones de utilidad para dos bienes pueden ilustrarse con un mapa de curvas de indiferencia. Cada curva de nivel de las curvas de indiferencia de este mapa muestra todos los conjuntos de bienes que producen un nivel de utilidad dado. • Algunas formas funcionales simples pueden recoger diferencias importantes respecto a las preferencias de los individuos por dos (o más) bienes. Aquí se examinaron la función CobbDouglas, la función lineal (de sustitutos perfectos), la función Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad de proporciones fijas (de complementos perfectos) y la función ESC (que incluye los otros tres casos especiales). • Matemáticamente es muy simple generalizar a partir de ejemplos de dos bienes a ejemplos de muchos bienes. Y, como vere- 107 mos, estudiar las decisiones de las personas entre muchos bienes puede arrojar cantidad de discernimientos. Pero las matemáticas de muchos bienes no son especialmente intuitivas; así, para reforzar tal intuición nos apoyaremos principalmente en casos de dos bienes. Problemas 3.1 Grafica una curva de indiferencia típica para las siguientes funciones de utilidad y determina si tienen curvas de indiferencia convexas (es decir, si la TMS declina al incrementarse x). a. U(x, y) 3x y. b. U ( x, y) x y. c. U ( x, y) x y. d. U ( x, y) x2 y2 . xy . e. U ( x, y) x y 3.2 En el pie de nota 7 se demuestra que para que una función de utilidad de dos bienes tenga una TMS estrictamente decreciente (es decir, para que sea estrictamente cuasi cóncava) debe mantenerse la condición siguiente: Uxx Ux2 2Uxy Ux Uy Uyy Uy2 0 Usa esta condición para comprobar la convexidad de las curvas de indiferencia de cada una de las funciones de utilidad del problema 3.1. Describe la relación precisa entre utilidad marginal decreciente y cuasi concavidad en cada caso. 3.3 Considera las funciones de utilidad siguientes: a. U(x, y) xy. b. U(x, y) x2y2. c. U(x, y) ln x ln y. Demuestra que cada una de ellas tiene TMS decreciente pero exhiben utilidad marginal constante, creciente y decreciente, respectivamente. ¿Cuál es tu conclusión? 3.4 Como se vio en la figura 3.5, una manera de demostrar la convexidad de las curvas de indiferencia es demostrar que, respecto a dos puntos x x2 y1 y2 es al cualesquiera (x1, y1) y (x2, y2) en una curva de indiferencia que ofrece U k, la utilidad asociada con el punto 1 , 2 2 menos tan grande como k. Usa este método para analizar la convexidad de las curvas de indiferencia de las tres funciones siguientes. No olvides graficar tus resultados. a. U(x, y) min(x, y). b. U(x, y) max(x, y). c. U(x, y) x y. 3.5 El fanático de los Phillies (FP) siempre come sus bocadillos en el estadio en forma especial; consume un hot dog de un pie de largo con exactamente la mitad de una medianoche, 1 onza de mostaza y 2 onzas de pepinillos. Su utilidad es una función de sólo esos cuatro artículos, y cualquier cantidad extra de cualquiera de ellos sin los demás ingredientes carece de valor. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 108 Parte 2: Elección y demanda a. ¿Qué forma tiene la función de utilidad del FP para esos cuatro bienes? b. ¿Cómo podrían simplificarse las cosas, considerando la utilidad del FP como una función de sólo un bien? ¿Cuál sería ese bien? c. Supón que los hot dogs de un pie de largo cuestan un dólar cada uno, las medianoches $0.50 de dólar cada una, la mostaza $0.05 de dólar por onza y los pepinillos $0.15 de dólar por onza. ¿Cuánto costaría el bien definido en el inciso b)? d. Si el precio de los hot dogs de un pie de largo aumentara 50 por ciento (a $1.50 dólares cada uno), ¿cuál sería el incremento porcentual en el precio del bien? e. ¿Cómo afectaría un aumento de 50 por ciento en el precio de una medianoche el precio del bien? ¿Por qué tu respuesta es diferente de la del inciso d)? f. Si el gobierno quisiera recaudar un dólar, gravando los bienes que el FP compra, ¿cómo debería distribuir este impuesto entre los cuatro bienes para minimizar el costo de utilidad para el FP? 3.6 Muchos lemas publicitarios parecen señalar algo sobre las preferencias de las personas. ¿Cómo recogerías los siguientes lemas con una función de utilidad matemática? a. b. c. d. e. La margarina Promise es tan buena como la mantequilla. Las cosas van mejor con Coca-Cola. No puedes comer sólo una papa frita Pringle. Las donas glaseadas Krispy Kreme son mejores que las Dunkin’ Donuts. Miller Brewing nos recomienda beber (cerveza) “responsablemente”. [¿Cuál sería un consumo “irresponsable”?] 3.7 a. Un consumidor está dispuesto a intercambiar 3 unidades de x por 1 unidad de y cuando tiene 6 unidades de x y 5 de y. También está dispuesto a intercambiar 6 unidades de x por 2 unidades de y cuando tiene 12 de x y 3 de y. Es indiferente entre el paquete (6, 5) y el conjunto (12, 3). ¿Cuál es la función de utilidad para los bienes x y y? Pista: ¿cuál es la forma de la curva de indiferencia? b. Una consumidora está dispuesta a intercambiar 4 unidades de x por 1 unidad de y cuando consume el paquete (8, 1). También está dispuesta a intercambiar 1 unidad de x por 2 unidades de y cuando consume el conjunto (4, 4). De hecho, le son indiferentes ambos conjuntos. Suponiendo que la función de utilidad es Cobb-Douglas de la forma U(k, y) xy, donde y son constantes positivas, ¿cuál es la función de utilidad de esta consumidora? c. ¿Hubo redundancia de información en el inciso b)? De ser así, ¿cuál es cantidad mínima de información requerida en esa pregunta para derivar la función de utilidad? 3.8 Halla funciones de utilidad, dada cada una de las curvas de indiferencia siguientes [definidas por U(.) k]: a. z k1/ x/ y/ . b. y 0.5 x2 4( x2 k) c. z y4 4x( x2 y k) 2x 0.5x. y2 . 2x Problemas analíticos 3.9 Dotaciones iniciales Supón que una persona tiene cantidades iniciales de los dos bienes que le brindan utilidad. Estas cantidades iniciales están dadas por x y y. a. Grafica estas cantidades iniciales en el mapa de curvas de indiferencia de esa persona. b. Si esta persona puede intercambiar x por y (o viceversa) con otras personas, ¿qué tipos de intercambios haría en forma voluntaria? ¿Qué tipos de intercambios no haría? ¿Cómo se relacionan esos intercambios con la TMS de esta persona en el punto (x, y)? c. Supón que esta persona está relativamente satisfecha con las cantidades iniciales en su poder y que sólo considerará intercambios que incrementen su utilidad en al menos la cantidad k. ¿Cómo ilustrarías esto en el mapa de curvas de indiferencia? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad 109 3.10 Utilidad de función Cobb-Douglas El ejemplo 3.3 demuestra que la TMS de la función Cobb-Douglas U ( x, y) x y está dada por TMS y . x a. ¿Acaso este resultado depende de si 1? ¿Esta suma tiene alguna relevancia para la teoría de la elección? b. Para conjuntos de bienes para los cuales y x, ¿cómo depende la TMS de los valores de y ? Desarrolla una explicación intuitiva de por qué, si , TMS 1. Ilustra tu argumento con una gráfica. c. Supón que un individuo obtiene utilidad sólo de cantidades de x y y que exceden los niveles de subsistencia mínima, dados por x0, y0. En este caso, U ( x, y) ( x x0) ( y y0) ¿Esta función es homotética? (Para un análisis adicional, véanse las extensiones del capítulo 4.) 3.11 Utilidades marginales independientes Dos bienes tienen utilidades marginales independientes si 2 U 2 U 0. yx xy Demuestra que, si se supone una utilidad marginal decreciente para cada bien, cualquier función de utilidad con utilidades marginales independientes tendrá una TMS decreciente. Da un ejemplo para demostrar que la inversa de este enunciado no es cierta. 3.12 Utilidad ESC a. Demuestra que la función ESC x y es homotética. ¿Cómo depende la TMS de la razón y/x? b. Demuestra que tus resultados del inciso a) coinciden con nuestro análisis de los casos 1 (sustitutos perfectos) y 0 (CobbDouglas). c. Demuestra que la TMS es estrictamente decreciente para todos los valores de 1. d. Demuestra que si x y, la TMS de esta función sólo depende de las magnitudes relativas de y . e. Calcula la TMS de esta función cuando y/x 0.9 y y/x 1.1 para los dos casos 0.5 y 1. ¿Qué concluyes sobre la medida en que la TMS cambia en las cercanías de x y? ¿Cómo interpretarías esto geométricamente? 3.13 La función cuasi lineal Considera la función U(x, y) x ln y. Esta es una función de uso relativamente frecuente en los modelos económicos, ya que tiene algunas propiedades útiles. a. b. c. d. Halla la TMS de la función. Ahora, interpreta el resultado. Confirma que la función es cuasi cóncava. Halla la ecuación de una curva de indiferencia de esta función. Compara la utilidad marginal de x y y. ¿Cómo interpretas estas funciones? ¿Cómo podrían elegir los consumidores entre x y y, al tratar de incrementar su utilidad mediante, por ejemplo, consumir más cuando su ingreso aumenta? (Estudiaremos en detalle este “efecto ingreso” en los problemas del capítulo 5.) e. Describe algunas situaciones en las que esta función podría ser útil, considerando cómo cambia la utilidad al incrementar las cantidades de los dos bienes. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 110 Parte 2: Elección y demanda 3.14 Relaciones de preferencia El estudio formal de las preferencias usa una notación vectorial general. Un paquete de n mercancías es denotado por el vector x (x1, x2, . . . , xn), y una relación de preferencia (Ɑ) se define sobre todos los conjuntos posibles. El enunciado x1 Ɑ x2 significa que el conjunto x1 es preferible al paquete x2. La indiferencia entre ambos es denotada por x1 ≈ x2. La relación de preferencia es “completa” si respecto a dos conjuntos cualesquiera el individuo puede afirmar ya sea x1 Ɑ x2, x2 Ɑ x1 o x1 ≈ x2. La relación es “transitiva” si x1 Ɑ x2 y x2 Ɑ x3 implica que x1 Ɑ x3. Finalmente, una relación de preferencia es “continua” si respecto a cualquier conjunto y como, por ejemplo, y Ɑ x, cualquier conjunto adecuadamente próximo a y también sea preferible a x. Usando estas definiciones analiza si cada una de las relaciones de preferencia siguientes es completa, transitiva o continua. a. Preferencias de suma: esta relación de preferencia supone que efectivamente pueden sumarse manzanas y naranjas. Específicamente, n que x1 Ɑ x2 si y sólo si xi1 i1 n n n i1 i1 i1 xi2 . Si xi1 xi2 , x1 x2. b. Preferencias lexicográficas: en este caso la relación de preferencia se organiza como un diccionario: si x11 x12, x1 Ɑ x2 (independientemente de las cantidades de los demás n – 1 bienes). Si x11 x12 y x21 x22, x1 Ɑ x2 (independientemente de las cantidades de los demás n 2 bienes). La relación de preferencia lexicográfica continúa luego de esta manera en toda la lista de bienes. c. Preferencias con saciedad: para esta relación de preferencias se supone que hay un paquete de consumo (x∗) que brinda completa “dicha”. La clasificación de todos los demás conjuntos está determinada por lo cerca que están de x∗. Es decir, x1 Ɑ x2 si y sólo si ( x1i x1 ) x2i xx . . . xni xn . x1 x∗ x2 x∗ donde xi x∗ 2 2 2 3.15 La función de beneficio En un artículo publicado en 1992 David G. Luenberger presentó la que denominó la función de beneficio, como una manera de incorporar cierto grado de medición cardinal en la teoría de la utilidad.11 El autor nos pide especificar cierto conjunto de bienes básicos y medir después cuántas repeticiones de este conjunto tendrían que ser proporcionadas a un individuo para aumentar el nivel de utilidad a un objetivo particular. Supón que sólo hay dos bienes y que el objetivo de utilidad está dado por U∗(x, y). Supón también que el paquete de consumo básico está dado por (x0, y0). Entonces el valor de la función de beneficio, b(U∗), es el valor de para el cual U(x0, y0) U∗. a. Supón que la utilidad está dada por U(x, y) xy1. Calcule la función de beneficio para x0 y0 1. b. Usando la función de utilidad del inciso a) calcula la función de beneficio para x0 1, y0 0. Explica por qué tus resultados difieren de los del inciso a). c. La función de beneficio también puede definirse cuando un individuo tiene dotaciones iniciales de ambos bienes. Si estas dotaciones iniciales están dadas por x, y entonces b(U∗, x, y) está dada por el valor de que satisface la ecuación U(x x0, y y0) U∗. En esta situación el “beneficio” puede ser positivo (cuando U(x, y) U∗) o negativo (cuando U(x, y) U∗). Desarrolla una descripción gráfica de estas dos posibilidades y explica cómo la naturaleza del conjunto básico podría afectar el cálculo del beneficio. d. Considera dos posibles dotaciones iniciales, x1, y1 y x2, y2. Explica gráficamente e intuitivamente por qué x1 x 2 y 1 y2 , ) 0.5b U , x1 , y1 0.5b U , x2 , y2 . (Nota: esto demuestra que la función de beneficio es cóncava en las b(U , 2 2 dotaciones iniciales.) Sugerencias de lecturas adicionales Aleskerov, Fuad y Bernard Monjardet. Utility Maximization, Choice, and Preference, Springer-Verlag, Berlín, 2002. Kreps, David M. A Course in Microeconomic Theory, Princeton University Press, Princeton, 1990. Completo estudio de la teoría de la preferencia. Cubre varios modelos de umbral y modelos de toma de decisiones “dependiente del contexto”. El capítulo 1 cubre la teoría de la preferencia con cierto detalle. Buen análisis de la cuasi concavidad. Jehle, G. R. y P. J. Reny. Advanced Microeconomic Theory, 2a. ed., Addison Wesley/Longman, Boston, 2001. Kreps, David M. Notes on the Theory of Choice, Westview Press, Londres, 1988. El capítulo 2 contiene una buena prueba de la existencia de funciones de utilidad cuando se sostienen axiomas básicos de racionalidad. Buen análisis de los fundamentos de la teoría de la preferencia. Mayormente la atención de este libro se dirige a la utilidad en situaciones inciertas. 11 Luenberger, David G., “Benefit Functions and Duality”, Journal of Mathematical Economics, núm. 21, pp. 461-481. La presentación aquí se ha simplificado considerablemente en comparación con la presentada originalmente por el autor, sobre todo se cambió la dirección en la que se miden los “beneficios”. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad 111 Mas-Colell, Andrea, Michael D. Whinston y Jerry R. Green. Microeconomic Theory, Oxford University Press, Nueva York, 1995. Stigler, G. “The Development of Utility Theory”, en Journal of Political Economy, núm. 59, pts. 1-2 (agosto/octubre de 1950), pp. 307-327, 373-396. Los capítulos 2 y 3 proporcionan un desarrollo detallado de relaciones de preferencia y su representación con funciones de utilidad. Estudio lúcido y completo de la historia de la teoría de la utilidad. Contiene muchos discernimientos y complementos interesantes. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 EXTENSIONES Preferencias especiales El concepto de función de utilidad es general y puede adaptarse a gran número de circunstancias especiales. El descubrimiento de ingeniosas formas funcionales que reflejan los aspectos esenciales de algún problema puede brindar varios discernimientos no evidentes de inmediato en un enfoque más literario. Aquí se estudiarán cuatro aspectos de las preferencias que los economistas han tratado mediante el uso de modelos: a) efectos de umbral, 2) calidad, 3) hábitos y adicción y 4) preferencias de segunda parte. En los capítulos 7 y 17 se ilustran maneras adicionales de recoger aspectos de las preferencias. A3.1 Efectos de umbral El modelo de utilidad que se desarrolló en este capítulo implica que un individuo siempre preferirá el conjunto de bienes A al conjunto B, siempre y cuando U(A) U(B). Hay muchas situaciones que harán que los individuos pasen rápidamente de consumir el conjunto A a consumir el B. En muchos casos, sin embargo, tal respuesta relámpago parece improbable. De hecho, los individuos pueden “ser fieles a sus costumbres” y requerir un cambio más de peso en las circunstancias para alterar lo que hacen. Por ejemplo, los individuos pueden no tener una opinión muy firme sobre la marca de pasta dental que eligen, y aferrarse a lo que conocen pese a la proliferación de marcas nuevas (quizá mejores). De igual modo, los individuos podrían aferrarse a su programa de televisión favorito aun si este ha perdido calidad. Una forma de recoger ese comportamiento es suponer que los individuos toman decisiones como si enfrentaran principios de preferencia. En tal situación el conjunto de mercancías A podría ser elegido sobre el B sólo cuando U(A) U(B) , (i) donde es el principio de indiferencia por vencer. Con esta especificación las curvas de indiferencia pueden ser más bien gruesas y hasta difusas, más que poseer las claras curvas de nivel que se muestran en este capítulo. Los modelos del principio de indiferencia son de amplio uso en mercadotecnia. La teoría detrás de estos modelos se presenta detalladamente en Aleskerov y Monjardet (2002). Estos autores consideran varios modos de especificar el principio de indiferencia para que pueda depender de las características de los conjuntos considerados o de otras variables contextuales. Combustibles alternativos Vedenov, Duffield y Wetzstein (2006) usan la idea del principio de indiferencia para examinar las condiciones en las cuales los individuos pasarán del uso de la gasolina al de otro tipo de com- bustibles (principalmente etanol) para impulsar sus automóviles. Estos autores señalan que en años recientes la desventaja más importante de usar gasolina ha sido la excesiva volatilidad del precio del producto en relación con otros combustibles. Concluyen que optar por mezclas con etanol es eficiente (en especial en periodos de mayor volatilidad del precio de la gasolina), siempre y cuando esas mezclas no hagan decrecer la eficiencia del combustible. E3.2 Calidad Puesto que muchos bienes de consumo difieren ampliamente en calidad a los economistas les interesa incorporar esas diferencias en los modelos de elección. Un método consiste simplemente en considerar artículos de diferente calidad como bienes que son sustitutos relativamente cercanos. Sin embargo, este método puede ser poco práctico a causa del gran número de bienes contenidos. Otro método se centra en la calidad como elemento directo de elección. La utilidad podría reflejarse en este caso por utilidad U(q, Q), (ii) donde q es la cantidad consumida y Q la calidad de dicho consumo. Aunque este método permite cierto examen de la opción calidad-cantidad, presenta dificultades cuando la cantidad consumida de una mercancía (vino, por ejemplo) consta de varias calidades. La calidad podría definirse entonces como un promedio (véase Theil,1 1952), pero este enfoque quizá no sea apropiado cuando la calidad de bienes nuevos cambia rápidamente (como en el caso de las computadoras personales). Un método más general (originalmente propuesto por Lancaster, 1971) se centra en un conjunto claramente definido de atributos de bienes y supone que dichos atributos brindan utilidad. Si un bien q brinda dos de esos atributos, a1 y a2, la utilidad podría escribirse como 12 utilidad U[q, a1(q), a2(q)], (iii) y podrían emerger mejoras de utilidad, sea porque la persona elige una mayor cantidad del bien o porque una cantidad dada rinde un nivel mayor de atributos valiosos. Computadoras personales Esta es la práctica que siguen los economistas que estudian la demanda en industrias tan rápidamente cambiantes como la de 1 Theil sugiere asimismo medir la calidad considerando correlaciones entre cambios en el consumo y las elasticidades de ingreso de varios bienes. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 3: Preferencias y utilidad las computadoras personales. En este caso sería evidentemente incorrecto centrarse sólo en la cantidad de computadoras personales adquiridas cada año porque las máquinas nuevas son mucho mejores que las viejas (y, presumiblemente, ofrecen más utilidad). Por ejemplo, Berndt, Griliches y Rappaport (1995) descubrieron que la calidad de las computadoras personales ha aumentado anualmente 30 por ciento en un periodo relativamente largo, a causa sobre todo de atributos perfeccionados, como procesadores más rápidos o mejores discos duros. Un consumidor que hoy gasta, digamos, 2 000 dólares en una computadora personal compra mucho más utilidad que un consumidor semejante 5 años atrás. (2001) indican que el tabaquismo puede abordarse como una elección racional, aunque inconsistente en el tiempo.2 13 E3.4 Preferencias de segundas partes Es obvio que a los individuos les importa el bienestar de los demás. Fenómenos como hacer contribuciones de beneficencia o dejar herencias a los niños no pueden entenderse sin reconocer la interdependencia que existe entre las personas. Las preferencias de segundas partes pueden incorporarse a la función de utilidad de la persona i, digamos, con utilidad Ui(xi, yi, Uj), E3.3 Hábitos y adicción Dado que el consumo ocurre en el tiempo, existe la posibilidad de que las decisiones tomadas en un periodo afecten la utilidad en periodos posteriores. Los hábitos se forman cuando los individuos descubren que les gusta usar una mercancía durante un periodo, lo cual aumenta su consumo en periodos subsecuentes. Un caso extremo es la adicción (a las drogas, los cigarros o las películas de los hermanos Marx), donde el consumo pasado aumenta significativamente la utilidad del consumo presente. Una manera de describir matemáticamente estas ideas es suponer que la utilidad en el periodo t depende del consumo en el periodo t y del total del consumo previo del bien que ha formado el hábito (digamos X): utilidad Ut(xt, yt, st), (iv) 113 (vi) donde Uj es la utilidad de otro. Si Ui/Uj 0 entonces esta persona adoptará una conducta altruista, mientras que si Ui/Uj 0, mostrará el comportamiento malévolo asociado a la envidia. El caso usual de Ui/Uj 0 es simplemente un punto medio entre las alternativas en las preferencias. Gary Becker es pionero en el estudio de estas posibilidades y ha escrito sobre varios temas, tales como la teoría general de las interacciones sociales (1976) y la importancia del altruismo en la teoría de la familia (1981). Biología evolutiva y genética Los biólogos han sugerido una forma particular de la función de utilidad en la ecuación vi, extraída de la teoría de la genética. En este caso donde utilidad Ui ( xi , yi) rj Uj , (vii) j st xt i . i1 En aplicaciones empíricas, sin embargo, usualmente no existen datos sobre todos los niveles de consumo anteriores. Así, es común elaborar modelos sobre los hábitos usando sólo datos del consumo corriente (xt) y del consumo en el periodo previo (xt1). Una forma común de proceder es suponer que la utilidad está dada por utilidad Ut(x∗t , yt), (v) donde x∗t es una función simple de xt y xt1, como en x∗t xt xt1 o x∗t xt/xt1. Estas funciones implican que, ceteris paribus, cuanto mayor sea xt1, se elegirá más xt en el periodo corriente. Modelización de hábitos Estos enfoques de la modelización de hábitos se han aplicado a una amplia variedad de temas. Stigler y Becker (1977) usan modelos de ese tipo para explicar por qué las personas desarrollan un “gusto” por ir a la ópera o por jugar golf. Becker, Grossman y Murphy (1994) adaptan esos modelos al estudio del consumo de cigarros y otras conductas adictivas. Ellos han demostrado que la disminución en el consumo de tabaco a temprana edad puede tener grandes efectos sobre el consumo final de cigarrillos debido a la dinámica de las funciones de utilidad de los individuos. Si el comportamiento adictivo es “racional” o no, es un tema ampliamente estudiado por los economistas. Por ejemplo, Gruber y Koszegi donde rj mide la cercanía de la relación genética entre la persona i y la persona j. En cuanto a padres e hijos, por ejemplo, rj 0.5, mientras que en cuanto a primos rj 0.125. Bergstrom (1996) describe algunas de las conclusiones de la conducta evolutiva a las cuales han llegado los biólogos mediante esta forma funcional particular. Referencias Aleskerov, Fuad y Bernard Monjardet. Utility Maximization, Choice, and Preference, Springer-Verlag, Berlín, 2002. Becker, Gary S. The Economic Approach to Human Behavior, University of Chicago Press, Chicago, 1976. Becker, Gary S., Michael Grossman y Kevin M. Murphy. “An Empirical Analysis of Cigarette Addiction”, American Economic Review (junio de 1994), pp. 396-418. Bergstrom Theodore C. “Economics in a Family Way”, Journal of Economic Literature (diciembre de 1994), pp. 1903-1934. Berndt, Ernst R., Zvi Griliches y Neal J. Rappaport. “Econometric Estimates of Price Indexes for Personal Computers in the 1990s”, Journal of Econometrics (julio de 1995), pp. 243-268. Gruber, Jonathan y Botond Koszegi. “Is Addiction ‘Rational’? Theory and Evidence”, Quarterly Journal of Economics (noviembre de 2001), pp. 1261-1303. 2 Para más información sobre la inconsistencia en el tiempo, véase el capítulo 17. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 114 Parte 2: Elección y demanda Lancaster, Kelvin J. Consumer Demand: A New Approach, Columbia University Press, Nueva York, 1971. Stigler, George J. y Gary S. Becker. “De Gustibus Non Est Disputandum”, American Economic Review (marzo de 1977), pp. 76-90. Theil, Henri. “Qualities, Prices, and Budget Enquiries”, Review of Economic Studies (abril de 1952), pp. 129-147. Vedenov, Dmitry V., James A. Duffield y Michael E. Wetzstein. “Entry of Alternative Fuels in a Volatile U. S. Gasoline Market”, Journal of Agricultural and Resource Economics (abril de 2006), pp. 1-13. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO CUATRO Optimización de la utilidad y elección En este capítulo se examinará el modelo básico de elección que usan los economistas para explicar el comportamiento de los individuos. Este modelo supone que los individuos se ven restringidos por lo limitado de sus ingresos usando su capacidad de poder de compra para alcanzar la máxima utilidad posible. Es decir, se supone que los individuos actúan como si maximizaran la utilidad sujetos a una restricción presupues cas de este modelo son variadas, como lo demostraremos, todas se basan en el mismo modelo matemático fundamental y todas llegan a la misma conclusión general: para optimizar la utilidad los individuos elegirán conjuntos de bienes cuya tasa marginal de sustitución (TMS) es igual a la razón de precios en el mercado de bienes. Los precios de mercado dan información a los individuos sobre costos de oportunidad y esta información desempeña un papel importante en el sentido de que afecta las decisiones realmente tomadas. Optimización de la utilidad y cálculos relámpago Antes de iniciar el estudio formal de la teoría de la elección sería apropiado eliminar dos quejas que los no economistas suelen plantear sobre el enfoque que adoptaremos. Primero está el reclamo de que ninguna persona real puede hacer la clase de “cálculos relámpago” que requiere la maximización de la utilidad. De acuerdo con esta queja, al recorrer el pasillo de un supermercado la gente sencillamente toma lo que está disponible sin ningún patrón o propósito real en sus acciones. toria (cada persona, después de todo, está sujeta a algún tipo de restricción presupuestal) y consideran equivocada la acusación sobre los cálculos relámpago. Recordemos de nueva cuenta al jugador de billar de Friedman que se menciona en el capítulo 1. Tampoco este jugador puede hacer los cálculos relámpago que se requieren para planear un tiro de acuerdo con las leyes de la física, pese a lo cual dichas leyes no dejan de predecir el comportamiento del jugador. De igual forma, como veremos, el modelo de optimización de la utilidad predice muchos aspectos del comportamiento aunque nadie lleve integrada una computadora ni tenga programada en ella su función de utilidad. Para ser precisos, los economistas suponen que los individuos se comportan como si hicieran tales cálculos; así, el argumento de que es imposible realizar esos cálculos es en gran medida irrelevante. De cualquier modo, en tiempos recientes los economistas han tratado cada vez más de modelizar algunas de las complicaciones conductuales que surgen en las decisiones reales que toman los individuos. Estudiaremos algunas de esas complejidades en diversos problemas de este libro. Altruismo y egoísmo El segundo reclamo en contra de nuestro modelo de elección es que parece extremadamente egoísta; nadie, según esta queja, tiene objetivos tan exclusivamente egocéntricos. Pese a que pro117 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 118 Parte 2: Elección y demanda bablemente los economistas están dispuestos a aceptar el interés propio como una fuerza motivadora más que otros pensadores más utópicos (Adam Smith observó: “No nos inclinamos a sospechar que alguien padezca deficiencia de egoísmo”),1 esta acusación también es errónea. Nada en el modelo de optimización de la utilidad impide a los individuos derivar satisfacción de la filantropía, o de “hacer el bien” en general. También es posible suponer que estas actividades ofrecen utilidad. En efecto, los economistas han aplicado extensamente el modelo de optimización de la utilidad para estudiar asuntos como las donaciones de tiempo y dinero a la beneficencia, dejar legados a niños o, incluso, donar sangre. Uno no necesita asumir una posición acerca de si tales actividades son egoístas o desinteresadas, porque los economistas dudan de que los individuos las emprenderían si fueran contrarias a sus mejores intereses, ampliamente concebidos. SONDEO INICIAL Los resultados generales de nuestro examen de la optimización de la utilidad pueden enunciarse sucintamente como sigue. PRINCIPIO DE OPTIMIZACIÓN Optimización de la utilidad. Para optimizar la utilidad, dado un ingreso fijo para gastar, un individuo comprará las cantidades de bienes que agoten su ingreso total y para las cuales la tasa marginal de sustitución entre dos bienes cualesquiera (TMS) es igual a la tasa en la cual los bienes pueden intercambiarse entre sí en el mercado. Obviamente, para la optimización de la utilidad se requiere gastar todo el ingreso individual. Dado que los bienes adicionales brindan utilidad adicional (no hay saciedad), y dado que no existe ningún otro uso para el ingreso, dejar una parte sin gastar impide optimizar la utilidad. Sin embargo, derrochar el dinero no es una actividad optimizadora de la utilidad. La condición que especifica la igualdad de la tasa marginal de sustitución requiere un poco más de explicación. Puesto que la tasa a la que un bien puede ser intercambiado por otro en el mercado está dada por la razón de los precios de ambos; este resultado puede reformularse diciendo que el individuo igualará la TMS (de x por y) con la razón del precio de x respecto al precio de y (px /py). Esta igualación de una tasa marginal de sustitución personal con una razón de precio determinada por el mercado es un resultado común a todos los problemas de optimización de la utilidad individual (y a muchos otros tipos de problemas de optimización). Lo cual ocurrirá una y otra vez en este texto. Ilustración numérica Para ver el razonamiento intuitivo detrás de este resultado supongamos que no es real que un individuo iguala la TMS con la razón de los precios de los bienes; específicamente, que la TMS del individuo es igual a 1 y que está dispuesto a intercambiar 1 unidad de x por 1 unidad de y, y permanecer en condiciones igualmente buenas. Supongamos, asimismo, que el precio de x es de 2 dólares por unidad y el de y de 1 dólar por unidad. Es fácil demostrar que esta persona podría estar en mejores condiciones. Supongamos que reduce el consumo de x en 1 unidad y que la intercambia en el mercado por 2 unidades de y. Sólo 1 unidad adicional de y sería necesaria para mantener a esta persona tan satisfecha como antes del intercambio; la segunda unidad de y es una adición neta al bienestar. Así, el gasto de este individuo no podría haberse distribuido óptimamente en primer término. Cada vez que la TMS y la razón de precio px /py difieran puede usarse un método similar de razonamiento. La condición para una utilidad óptima debe ser la igualdad de estas dos magnitudes. 1 Adam Smith, The Theory of Moral Sentiments (1759, reimpresión, Arlington House, New Rochelle, Nueva York, 1969), p. 446. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección 119 EL CASO DE DOS BIENES: ANÁLISIS GRÁFICO Esta argumentación parece eminentemente razonable, pero apenas si podría llamársele prueba. Más bien, ahora debemos demostrar el resultado en forma rigurosa y, al mismo tiempo, ilustrar otros importantes atributos del proceso de optimización. Primero realizaremos un análisis gráfico; luego adoptaremos un enfoque más matemático. Restricción presupuestal Supongamos que el individuo tiene I dólares por distribuir entre el bien x y el bien y. Si px es el precio del bien x y py el precio del bien y, el individuo está restringido por px x pyy (4.1) I. Es decir, en los dos bienes en cuestión no es posible gastar más de I. Esta restricción presupuestal se muestra gráficamente en la figura 4.1. Esta persona sólo puede permitirse elegir combinaciones de x y y en el triángulo sombreado de la figura. Si todo I se gasta en el bien x, esto comprará I/px unidades de x. De igual manera, si todo se gasta en y, esto comprará I/py unidades de y. Es fácil ver que la pendiente de la restricción es px /py. Esta pendiente muestra cómo puede intercambiarse y por x en el mercado. Si px 2 y py 1, entonces 2 unidades de y se intercambiarán por 1 unidad de x. FIGURA 4.1 Restricción presupuestal del individuo para dos bienes. Las combinaciones de x y y que el individuo se puede permitir aparecen dentro del triángulo sombreado. Si, como suele suponerse, el individuo prefiere más que menos de cada bien, el límite exterior de este triángulo es la restricción relevante donde todos los fondos disponibles se gastan en x o y. La pendiente de este límite en línea recta está dada por px/py. Cantidad de y I py I = px x + p y y 0 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. I px 23.08.2019 Cantidad de x 8/23 120 Parte 2: Elección y demanda Condiciones de primer orden para un óptimo Esta restricción presupuestal puede imponerse al mapa de curvas de indiferencia del individuo para mostrar el proceso de optimización de la utilidad. La figura 4.2 ilustra este procedimiento. El individuo sería irracional si eligiera un punto como A; con sólo gastar más de su ingreso puede llegar a un nivel de utilidad más alto. El supuesto de no saciedad implica que una persona debe gastar la totalidad de su ingreso para recibir una utilidad máxima. De igual forma, reasignando los gastos el individuo puede estar mejor que en el punto B. El punto D está fuera de cuestión porque el ingreso no es lo bastante grande para adquirir D. Resulta claro que la posición de óptima utilidad es el punto C, donde se elige la combinación x∗, y∗. Este es el único punto en la curva de indiferencia U2 que puede comprarse con I dólares; no es posible comprar ningún nivel de utilidad más alto. C es un punto de tangencia entre la restricción presupuestal y la curva de indiferencia. Así, en C tenemos p pendiente de la restricción presupuestal p x pendiente de la curva de indiferencia y dy dx (4.2) U constante o px py FIGURA 4.2 Demostración gráfica de la optimización de la utilidad. dy dx U constante TMS (de x por y) (4.3) Dada la restricción presupuestal el punto C representa el nivel de utilidad más alto que el individuo puede alcanzar. Así, la combinación x∗, y∗ es la forma racional en la cual el individuo debe asignar su poder de compra. Sólo para esta combinación de bienes se mantendrán dos condiciones: todos los fondos disponibles se gastarán y la la tasa marginal de sustitución (TMS) será igual a la razón de precios a la cual los bienes pueden intercambiarse en el mercado (px /py). Cantidad de y U1 U2 U3 B D C y* I = px x + p y y A U3 U1 0 x* Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. U2 Cantidad de x 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección FIGURA 4.3 Ejemplo de mapa de curvas de indiferencia en el que la condición de tangencia no garantiza un óptimo. 121 Si las curvas de indiferencia no obedecen el supuesto de la TMS decreciente, no todos los puntos de tangencia (puntos para los que TMS px /py) pueden ser verdaderamente puntos de óptima utilidad En este ejemplo el punto de tangencia C es inferior a muchos otros puntos que también pueden adquirirse con los fondos disponibles. A fin de que las condiciones necesarias para un óptimo (es decir, las condiciones de tangencia) sean también suficientes, suele suponerse que la TMS es decreciente; esto es, que la función de utilidad es estrictamente cuasi cóncava. Cantidad de y U1 U2 U3 A I = px x + p y y C U3 B U2 U1 Cantidad de x Nuestro resultado intuitivo ha quedado comprobado: para un óptimo de utilidad todo el ingreso debe gastarse, y la TMS debe ser igual a la razón de los precios de los bienes. Del diagrama se desprende claramente que, si esta condición no se cumple, el individuo podría estar mejor reasignando sus gastos. Condiciones de segundo orden para un óptimo La regla de tangencia es sólo una condición necesaria para un óptimo. Para ver que no es una condición suficiente, consideremos el mapa de curvas de indiferencia que aparece en la figura 4.3. Aquí, un punto de tangencia (C) es inferior a un punto de no tangencia (B). En efecto, el óptimo verdadero está en otro punto de tangencia (A). El hecho de que la condición de tangencia no produzca un óptimo inequívoco puede atribuirse a la forma de las curvas de indiferencia en la figura 4.3. Si las curvas de indiferencia tuvieran la forma de aquellas de la figura 4.2, este problema no emergería. Pero ya se ha demostrado que las curvas de indiferencia de forma “normal” resultan del supuesto de la TMS decreciente. Así, si se supone que la TMS siempre es decreciente, la condición de tangencia es tanto necesaria como suficiente para un óptimo.2 Sin este supuesto habría que tener cuidado al aplicar la regla de tangencia. 2 Como se vio en los capítulos 2 y 3, esto equivale a suponer que la función de utilidad es cuasi cóncava. Puesto que usualmente supondremos cuasi concavidad, las condiciones necesarias para un óptimo de utilidad restringida también serán suficientes. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 122 Parte 2: Elección y demanda FIGURA 4.4 Solución de esquina de optimización de la utilidad. Con las preferencias que muestra este conjunto de curvas de indiferencia, la optimización de utilidad ocurre en E, donde se consumen 0 cantidades del bien y. Las condiciones de primer orden para un óptimo deben modificarse un poco para dar cabida a esta posibilidad. Cantidad de y U1 U2 U3 E x* Cantidad de x Soluciones de esquina El problema de optimización de utilidad que se ilustra en la figura 4.2 resulta en un óptimo “interior”, en el que se consumen cantidades positivas de ambos bienes. En algunas situaciones las preferencias de los individuos pueden ser tales que logran obtener un óptimo de utilidad decidiendo no consumir ninguna cantidad de ninguno de los bienes. Si a alguien no le gustan las hamburguesas, no hay razón para asignar ningún ingreso a su compra. Esta posibilidad se refleja en la figura 4.4. Aquí la utilidad se maximiza en E, donde x x∗ y y 0; así, cualquier punto en la restricción presupuestal en el que se consumen cantidades positivas de y produce menor utilidad que el punto E. Nótese que en E la restricción presupuestal no es precisamente tangente a la curva de indiferencia U2. En cambio, en el punto óptimo la restricción presupuestal es más plana que U2, lo que indica que la tasa a la que x puede intercambiarse por y en el mercado es menor que la tasa marginal de sustitución del individuo (la TMS). A los precios de mercado prevalecientes, el individuo está más que dispuesto a intercambiar y para obtener x extra. Como en este problema es imposible consumir cantidades negativas de y, sin embargo, el límite físico de este proceso es el eje X, a lo largo del cual las compras de y son 0. De ahí que, como se desprende claramente de este análisis, sea necesario enmendar un poco las condiciones de primer orden para un óptimo de utilidad a fin de permitir soluciones de esquina del tipo que se muestra en la figura 4.4. Al continuar con nuestro estudio del caso general de n bienes usaremos las matemáticas del capítulo 2 para mostrar cómo puede cumplirse esto. EL CASO DE n BIENES Los resultados gráficamente derivados en el caso de dos bienes se trasladan directamente al caso de n bienes. De nueva cuenta es posible demostrar que para un óptimo interior de utilidad, la TMS entre dos bienes cualesquiera debe ser igual a la razón de los precios de estos bienes. Para estudiar este caso más general, sin embargo, es mejor usar algunas matemáticas. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección 123 Condiciones de primer orden Con n bienes el objetivo del individuo es optimizar la utilidad de los mismos: utilidad U(x1, x2, . . . , xn), (4.4) sujeta a la restricción presupuestal3 I p1x1 p2x2 . . . pnxn (4.5) I p1x1 p2x2 . . . pnxn 0. (4.6) o Siguiendo las técnicas que se desarrollan en el capítulo 2 para optimizar una función sujeta a una restricción establecemos la expresión de Lagrange ᏸ U(x1, x2, . . . , xn) (I p1x1 p2x2 . . . pnxn). (4.7) Igualar a 0 las derivadas parciales de ᏸ (respecto a x1, x2, . . . , xn y ) produce n 1 ecuaciones que representan las condiciones necesarias para un óptimo interior: ᏸ U p1 0, x1 x1 ᏸ U p2 0, x2 x2 .. . ᏸ U pn 0, xn xn ᏸ I p1 x1 p2 x2 (4.8) pn xn 0. En estas n 1 ecuaciones es posible, en principio, despejar las x1, x2, . . . , xn óptimas y (véanse los ejemplos 4.1 y 4.2 para comprobar que tal solución es posible). Las ecuaciones 4.8 son necesarias pero no suficientes para un óptimo. Las condiciones de segundo orden que garantizan un óptimo son relativamente complejas y deben enunciarse en términos matriciales (véanse las extensiones del capítulo 2). Sin embargo, el supuesto de estricta cuasi concavidad (TMS decreciente en el caso de dos bienes) es suficiente para garantizar que cualquier punto que obedezca la ecuación 4.8 es, de hecho, un óptimo verdadero. Implicaciones de las condiciones de primer orden Las condiciones de primer orden representadas por la ecuación 4.8 pueden reescribirse en varias formas instructivas. Por ejemplo, para dos bienes cualesquiera xi y xj tenemos U/ xi pi . U/ xj pj (4.9) En el capítulo 3 se demostró que la razón de las utilidades marginales de dos bienes es igual a la tasa marginal de sustitución entre ellos. Así, las condiciones para una distribución óptima del ingreso se convierten en TMS (xi por xj) 3 pi . pj (4.10) De nuevo, la restricción presupuestal se ha escrito en una igualdad, ya que dado el supuesto de no saciedad resulta claro que el individuo gastará todo el ingreso disponible. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 124 Parte 2: Elección y demanda Este es justo el resultado ya gráficamente derivado en este capítulo; para optimizar la utilidad el individuo debe igualar la tasa marginal de sustitución con la razón de precios del mercado. Interpretación del multiplicador de Lagrange Otro resultado puede derivarse despejando en las ecuaciones 4.8: U/ x1 U/ x2 p1 p2 U/ xn pn (4.11) Estas ecuaciones establecen que en el punto de optimización de la utilidad cada bien adquirido debe producir la misma utilidad marginal por cada dólar que se haya gastado en el mismo. Así, cada bien debe tener una razón costo (marginal)-beneficio (marginal) idéntica. De no ser así un bien prometería más “disfrute marginal por dólar” que cualquier otro y los fondos no se distribuirían óptimamente. Aunque se le advierte nuevamente al lector en contra de hablar confiadamente de utilidad marginal, lo que la ecuación 4.11 indica es que un dólar extra debe producir la misma “utilidad adicional” sea cual sea el bien en que se gaste. El valor común de esta utilidad adicional está dado por el multiplicador de Lagrange para la restricción presupuestal del consumidor (es decir, por ). En consecuencia, puede considerarse como la utilidad marginal de un dólar adicional de gasto de consumo (la utilidad marginal del “ingreso”). Una última manera de reescribir las condiciones necesarias para un óptimo es pi U/ xi (4.12) para cada bien i adquirido. Para interpretar esta expresión, recordemos (de la ecuación 4.11) que el multiplicador de Lagrange, , representa el valor de la utilidad marginal de un dólar adicional de ingreso, sin importar dónde se gaste. Así, la razón en la ecuación 4.12 compara el valor de la utilidad adicional de una unidad más del bien i con este valor común de un dólar marginal en el gasto. Para ser adquirido, el valor de la utilidad de una unidad adicional de un bien debe ser equivalente en términos de dólares al precio que la persona debe pagar por él. Por ejemplo, un precio alto del bien i sólo puede justificarse si también brinda gran cantidad de utilidad adicional. En el margen, por tanto, el precio de un bien refleja la disposición de un individuo a pagar una unidad más. Este es un resultado de importancia en la economía aplicada del bienestar porque la disposición a pagar puede inferirse de las reacciones del mercado ante los precios. En el capítulo 5 se verá cómo este discernimiento puede usarse para evaluar los efectos de bienestar de los cambios de precio, y en capítulos posteriores se usará esta idea para analizar diversas cuestiones sobre la eficiencia de la asignación de recursos. Soluciones de esquina Las condiciones de primer orden de las ecuaciones 4.8 se mantienen exactamente sólo para los óptimos interiores para los cuales se adquiere alguna cantidad positiva de cada bien. Como se explicó en el capítulo 2, cuando aparecen soluciones de esquina (como las ilustradas en la figura 4.4), las condiciones deben modificarse ligeramente.4 En este caso, las ecuaciones 4.8 se convierten en ᏸ U xi xi 4 pi 0 (i 1, . . . , n) Formalmente, estas condiciones se llaman condiciones de Kuhn-Tucker para programación no lineal. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (4.13) 8/23 Capítulo 4: Optimización de la utilidad y elección 125 y si ᏸ U xi xi pi 0, (4.14) entonces xi 0. (4.15) Para interpretar estas condiciones la ecuación 4.14 puede reescribirse como U/ xi . pi (4.16) De ahí que las condiciones óptimas sean las que ya hemos señalado, excepto que cualquier bien cuyo precio (pi) exceda su valor marginal para el consumidor no será adquirido (xi 0). Así, los resultados matemáticos se ajustan a la idea común de que los individuos no adquirirán bienes por los cuales no creen que valga su dinero. Aunque el análisis en este libro no se concentra en las soluciones de esquina, el lector debe considerar tanto las posibilidades de que tales soluciones emerjan como la interpretación económica que puede hacerse de las condiciones óptimas en esos casos. EJEMPLO 4.1 Funciones de demanda Cobb-Douglas Como se demostró en el capítulo 3, la función Cobb-Douglas está dada por U(x, y) xy, (4.17) donde, por conveniencia,5 se supone que 1. Ahora es posible despejar los valores de optimización de utilidad de x y y para cualquier precio (px, py) e ingreso (I). Establecer la expresión lagrangiana ᏸ xy (I pxx pyy) (4.18) produce las condiciones de primer orden ᏸ x 1 y px 0, x ᏸ x y 1 py 0, y ᏸ I px x py y 0. (4.19) Tomar la razón de los dos primeros términos indica que y px , x py (4.20) 1 py y px x p x, x (4.21) o de donde se desprende la última ecuación, ya que 1. La sustitución de esta condición de primer orden de la ecuación 4.21 en la restricción presupuestal da I px x py y px x 1 px x px x 1 1 1 p x; x (4.22) 5 Como se explicó en el capítulo 3, los exponentes en la función de utilidad Cobb-Douglas siempre pueden normalizarse para que sumen 1 porque U1/( ) es una transformación monótona. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 126 Parte 2: Elección y demanda despejar x produce x∗ I , px (4.23) y∗ I . py (4.24) y una serie similar de manipulaciones daría Estos resultados indican que un individuo cuya función de utilidad está dada por la ecuación 4.17, optará siempre por distribuir proporción de su ingreso a comprar el bien x (es decir, px x/I ) y proporción a comprar el bien y (pyy/I ). Aunque esta característica de la función Cobb-Douglas suele facilitar la resolución de problemas simples, sugiere que esta función tiene límites en su capacidad para explicar el comportamiento real de consumo. Como la parte del ingreso dedicada a bienes particulares suele cambiar significativamente en respuesta a las condiciones económicas cambiantes, un modo funcional más general puede ofrecer discernimientos no aportados por la función Cobb-Douglas. Ilustraremos algunas posibilidades en el ejemplo 4.2, mientras que el tema general de las porciones presupuestales se abordará con mayor detalle en las extensiones de este capítulo. Ejemplo numérico. Primero, sin embargo, examinemos un ejemplo numérico específico del caso Cobb-Douglas. Supongamos que x se vende a 1 dólar y y a 4 dólares, y que el ingreso total es de 8 dólares. Supongamos entonces, sucintamente, que px 1, py 4, I 8; asimismo, que 0.5, de tal manera que esta persona divide su ingreso equitativamente entre estos dos bienes. Ahora, las ecuaciones de demanda 4.23 y 4.24 implican que x∗ I/px 0.5I/px 0.5(8)/1 4, y∗ I/py 0.5I/py 0.5(8)/4 1. (4.25) y, en estas elecciones óptimas, utilidad x0.5y0.5 (4)0.5(1)0.5 2. (4.26) Obsérvese asimismo que se puede calcular el valor del multiplicador de Lagrange asociado con esta asignación del ingreso, usando la ecuación 4.19: x1y/px 0.5(4)0.5(1)0.5/1 0.25. (4.27) Este valor implica que cada variación en el ingreso incrementará la utilidad en aproximadamente un cuarto de esa cantidad. Supongamos, por ejemplo, que esta persona 1 por ciento más ingreso ($8.08). En este caso elegiría x 4.04 y y 1.01, y la utilidad sería 4.040.5 . 1.010.5 2.02. De ahí que un incremento de $0.08 en el ingreso aumente la utilidad en 0.02, tal como lo predijo el hecho de que 0.25. PREGUNTA: ¿Afectaría un cambio en py en la cantidad de x demandada en la ecuación 4.23? Explica tu respuesta matemáticamente. Desarrolla también una explicación intuitiva basada en la noción de que la parte del ingreso dedicada al bien y está dada por el parámetro de la función de utilidad, . EJEMPLO 4.2 Demanda ESC Examinemos tres ejemplos específicos de la función ESC para ilustrar casos en los que las porciones presupuestales responden a las circunstancias económicas. Caso 1: ␦ ⴝ 0.5. En este caso, la utilidad es U(x, y) x0.5 y0.5. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (4.28) 8/23 Capítulo 4: Optimización de la utilidad y elección 127 Establecer la expresión lagrangiana ᏸ x0.5 y0.5 (I px x pyy) (4.29) produce las siguientes condiciones de primer orden para un óptimo: ᏸ/x 0.5x0.5 px 0, ᏸ/y 0.5y0.5 py 0, (4.30) ᏸ/ I px x pyy 0. La división de las dos primeras muestra que (y/x)0.5 px /py. (4.31) Al sustituir esto en la restricción presupuestal y mediante una manipulación algebraica un poco complicada podemos derivar las funciones de demanda asociadas con esta función de utilidad: x∗ I/px [1 (px /py)], (4.32) y∗ I/py [1 (px /py)]. (4.33) Sensibilidad ante la variación en los precios. En estas funciones de demanda nótese que la parte del ingreso gastada en, digamos, el bien x —es decir, px x/I 1/[1 (px/py)]— no es una constante; depende de la razón del precio px /py. Cuanto mayor sea el precio relativo de x menor será la parte del ingreso gastada en ese bien. En otras palabras, la demanda de x es tan sensible a su propio precio que un aumento en este reduce el gasto total en x. También puede ilustrarse que la demanda de x es sensible al precio, comparando el exponente contenido en px en la función de demanda dada por la ecuación 4.32 (2) con el exponente de la ecuación 4.23 (1). En el capítulo 5 se analizará con mayor profundidad esta observación al examinar en detalle el concepto de elasticidad. Caso 2: ␦ ⴝ ⴚ1. Examinemos de manera alterna una función de demanda con menos sustituibilidad6 que la Cobb-Douglas. Si 1, la función de utilidad está dada por U(x, y) x1 y1, (4.34) y es fácil demostrar que las condiciones de primer orden para un óptimo requieren y/x (px /py)0.5. (4.35) Nuevamente, la sustitución de esta condición en la restricción presupuestal, junto con un poco de álgebra algo complicada, produce las funciones de demanda x∗ I/px [1 (py /px)0.5], y∗ I/py [1 (px /py)0.5]. (4.36) Que estas funciones de demanda son menos sensibles al precio puede verse de dos maneras. Primero: ahora la parte del ingreso que se gastó en el bien x —esto es, px x/I 1/[1 (py /px)0.5]— responde positivamente a incrementos en px. Al aumentar el precio de x este individuo reduce sólo modestamente su consumo del bien x; así, el gasto total en ese bien se incrementa. Que las funciones de demanda en la ecuación 4.36 son menos sensibles al precio que las de la función Cobb-Douglas también se ilustra mediante los relativamente reducidos exponentes implicados del precio de cada bien (0.5). 6 Una manera de medir la sustituibilidad es con la elasticidad de sustitución, la cual para la función ESC está dada por 1/ (1 ). Aquí, 0.5 implica que 2, 0 (la función Cobb-Douglas) implica que 1, y 1 implica que 0.5. Véase también el análisis de la función ESC en relación con la teoría de la producción en el capítulo 9. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 128 Parte 2: Elección y demanda Caso 3: ␦ ⴝ ⴚⴥ. Este es el importante caso en el que x y y deben consumirse en proporciones fijas. Supongamos, por ejemplo, que cada unidad de y debe ser consumida junto con exactamente 4 unidades de x. La función de utilidad que representa esta situación es U(x, y) min (x, 4y). (4.37) En esta situación para optimizar la utilidad un individuo sólo elegirá combinaciones de ambos bienes para las cuales x 4y; es decir, la optimización de utilidad implica que esta persona elegirá estar en un vértice de sus curvas de indiferencia en forma de L. Debido a la forma de estas curvas de indiferencia para resolver este problema no se puede usar el cálculo. En cambio, sí es posible adoptar el procedimiento simple de sustituir directamente la condición de optimización de la utilidad en la restricción presupuestal: I px x py y px x py x ( px 0.25py )x. 4 (4.38) De ahí que x I , px 0.25py (4.39) I . 4px py (4.40) y sustituciones similares, producen y En este caso la porción del presupuesto de una persona dedicada a, digamos, el bien x aumenta rápidamente al incrementarse el precio de x porque x y y deben consumirse en proporciones fijas. Por ejemplo, si se usan los valores supuestos en el ejemplo 4.1 (px 1, py 4, I 8), las ecuaciones 4.39 y 4.40 predecirían x∗ 4, y∗ 1 y, como antes, la mitad del ingreso del individuo se gastará en cada bien. Si usamos, en cambio, px 2, py 4 e I 8, entonces x∗ 8/3, y∗ 2/3 y esta persona gasta dos tercios [px x/I (2 . 8/3)/8 2/3] de su ingreso en el bien x. Probar otros números sugiere que la parte del ingreso dedicada al bien x se aproxima a 1 al aumentar el precio de x.7 PREGUNTA: ¿Los cambios en el ingreso afectan las porciones de gasto en alguna de las funciones ESC que hemos analizado aquí? ¿Qué relación existe entre el comportamiento de las porciones de gasto y la naturaleza homotética de esta función? FUNCIÓN DE UTILIDAD INDIRECTA Los ejemplos 4.1 y 4.2 ilustran el principio de que a menudo es posible manipular las condiciones de primer orden para un problema de optimización de utilidad restringida a fin de despejar los valores óptimos de x1, x2, . . . , xn. Estos valores óptimos dependerán en general de los precios de todos los bienes y del ingreso del individuo. Esto es, x1 x1 ( p1 , p2 , . . . , pn , I), x2 x2 ( p1 , p2 , . . . , pn , I), .. . (4.41) xn xn ( p1 , p2 , . . . , pn , I): En el capítulo siguiente se analiza con mayor detalle este conjunto de funciones de demanda que muestra la dependencia de la cantidad de cada xi demandada respecto a p1, p2, . . . , pn e I. Aquí se 7 Estas relaciones para la función ESC se detallan en el problema 4.9 y en la extensión E4.3. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección 129 usan los valores óptimos de las x de la ecuación 4.42 para sustituirlos en la función de utilidad original, lo cual produce utilidad máxima U[x1 ( p1 , . . . pn , I), x2 ( p1 , . . . pn , I), . . . , xn ( p1 , . . . pn , I)] V( p1 , p2 , . . . , pn , I). (4.42) (4.43) Es decir, debido al deseo del individuo de optimizar su utilidad, dada una restricción presupuestal, el nivel óptimo de utilidad obtenible dependerá indirectamente de los precios de los bienes comprados y de su ingreso. Esta dependencia se refleja en la función de utilidad indirecta V. Si los precios o el ingreso cambiaran, el nivel de utilidad que podría alcanzarse también se vería afectado. Tanto en la teoría del consumo como en muchos otros contextos, a veces es posible usar este método indirecto para estudiar cómo los cambios en las circunstancias económicas afectan diversos tipos de resultados como la utilidad o (más adelante) los costos de las empresas. PRINCIPIO DE SUMA GLOBAL Muchos discernimientos económicos se desprenden del reconocimiento de que la utilidad depende, en última instancia, del ingreso y de los precios que enfrentan los individuos. Uno de los discernimientos más importantes es el llamado principio de suma global el cual ilustra la superioridad de los impuestos ante la capacidad del poder de compra de un individuo en relación con los impuestos a determinados bienes. Un discernimiento conexo es que las subvenciones al ingreso general para las personas de bajos ingresos elevarán la utilidad en mayor medida que una cantidad similar de dinero gastado en subsidiar bienes específicos. La intuición detrás de estos resultados se deriva directamente de la hipótesis de optimización de la utilidad; un impuesto o subsidio al ingreso deja al individuo en libertad de decidir cómo distribuir su ingreso final. Por otro lado, los impuestos o subsidios a bienes específicos cambian el poder de compra de una persona y distorsionan sus decisiones debido a los precios artificiales que se incorporan en esos esquemas. De ahí que sean preferibles los impuestos y subsidios al ingreso general, si la eficiencia es un criterio importante en la política social. En la figura 4.5. se ilustra el principio de la suma global tal como se aplica a la tributación. Inicialmente, esta persona tiene un ingreso de I y elige consumir la combinación x∗, y∗. Un impuesto al bien x elevaría su precio, y la decisión de optimización de la utilidad pasaría a la combinación x1, y1. La recaudación de impuestos sería t . x1 (donde t es la tasa tributaria impuesta al bien x). O bien, un impuesto al ingreso que desplazara hacia dentro la restricción presupuestal a I recaudaría esta misma cantidad de ingresos tributarios.8 Sin embargo, la utilidad provista por el impuesto al ingreso (U2) excede la provista por el impuesto a x solamente (U1). Por tanto, hemos demostrado que la carga para la utilidad del impuesto al ingreso es menor. Un argumento similar puede usarse para ilustrar la superioridad de subvenciones al ingreso sobre subsidios a bienes específicos. EJEMPLO 4.3 Utilidad indirecta y principio de suma global En este ejemplo se usará la noción de una función de utilidad indirecta para ilustrar el principio de suma global tal como se aplica a la tributación. Primero debemos derivar las funciones de utilidad indirecta de dos casos ilustrativos. Caso 1: Cobb-Douglas. En el ejemplo 4.1 se demostró que para la función Cobb-Douglas con 0.5, las compras óptimas son 8 Dado que I (px + t)x1 + pyy1, tenemos que I I tx1 px x1 + pyy1, lo cual demuestra que la restricción presupuestal con un impuesto al ingreso de igual magnitud también pasa por el punto x1, y1. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 130 Parte 2: Elección y demanda I , 2px I y . 2py x (4.44) Así, la función de utilidad indirecta es, en este caso, V( px , py , I) U(x , y ) (x ) 0.5 ( y ) 0.5 I . 0.5 2p0.5 x py (4.45) Adviértase que cuando px 1, py 4 y I 8, tenemos V 8/(2 . 1 . 2) 2, es decir, la utilidad que calculamos con anterioridad para esta situación. Caso 2: Proporciones fijas. En el tercer caso del ejemplo 4.2 se determinó que I , px 0.25py I y . 4px py x (4.46) Así, en este caso la utilidad indirecta está dada por I px 0.25py 4 I 4y ; 4px py px 0.25py V( px , py ,.I) min(x , 4y ) x (4.47) con px 1, py 4 e I 8, la utilidad indirecta está dada por V 4, lo que calculamos antes. El principio de suma global. Consideremos primeramente el uso del caso de de la función CobbDouglas para ilustrar el principio de suma global. Supongamos que se aplica un impuesto de 1 dólar al bien x. La ecuación 4.45 muestra que en este caso la utilidad indirecta pasaría de 2 a 1.41 [ 8/(2 . 20.5 . 2)]. Puesto que esta persona elige x∗ 2 con el impuesto, la recaudación tributaria total será de 2 dólares. Así, un impuesto al ingreso reducirá el ingreso neto a 6 dólares y la utilidad indirecta será de 1.5 [ 6/(2 . 1 . 2)]. Por tanto, el impuesto al ingreso es una evidente mejora en la utilidad en el caso en el que sólo se grava x. El impuesto al bien x reduce la utilidad por dos razones: reduce el poder de compra de una persona y sesga sus decisiones alejándolas del bien x. Con el impuesto sobre la renta, sólo se percibe el primer efecto, por lo que el impuesto es más eficiente.9 El caso de las proporciones fijas confirma dicha percepción. En este caso, un impuesto de 1 dólar al bien x reduciría la utilidad indirecta de 4 a 8/3 [ 8/(2 1)]. En esta situación x∗ 8/3 y la recaudación tributaria sería de $8/3. Un impuesto al ingreso que recaudara $8/3 dejaría a este consumidor con $16/3 de ingreso neto, y este ingreso produciría una utilidad indirecta de V 8/3 [ (16/3)/(1 1)]. De ahí que después de impuestos la utilidad sea la misma, tanto en el caso de los impuestos internos como en el de los impuestos al ingreso. La razón por la cual el principio de suma global no se sostiene en este caso es que con la utilidad de las proporciones fijas los impuestos internos no distorsionan las decisiones porque las preferencias son muy rígidas. PREGUNTA: Las dos funciones de utilidad indirecta que hemos ilustrado aquí demuestran que la duplicación del ingreso y de todos los precios dejaría sin cambio a la utilidad indirecta. Explica por qué podemos esperar que esta sea una propiedad de todas las funciones de utilidad indirecta. Es decir, explica por qué la función de utilidad indirecta es homogénea de grado cero en todos los precios e ingresos. 9 Este análisis supone que no hay efectos incentivadores del impuesto sobre la renta, lo cual quizá no es un buen supuesto. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección FIGURA 4.5 El principio de suma global de la tributación. 131 Un impuesto al bien x desplazaría la decisión de optimización de la utilidad de x∗, y∗ a x1, y1. Un impuesto al ingreso que recaudara el mismo monto desplazaría la restricción presupuestal a I. La utilidad sería más alta (U2) con el impuesto al ingreso que con el impuesto a x solamente (U1). Cantidad de y y1 I′ y* y2 U3 U2 I U1 x1 x2 x* Cantidad de x MINIMIZACIÓN DEL GASTO En el capítulo 2 se señaló que muchos problemas de máximo restringido tienen problemas asociados de mínimo restringido “duales”. Para el caso de la optimización de la utilidad el problema asociado dual de minimización concierne a distribuir el ingreso de tal manera que sea posible alcanzar un nivel de utilidad dado con el gasto mínimo. Este problema es evidentemente similar al problema original de optimización de la utilidad, pero los objetivos y restricciones de los problemas se han invertido. La figura 4.6 ilustra este problema dual de minimización del gasto. Ahí, el individuo debe alcanzar el nivel de utilidad U2; esta es ahora la restricción del problema. Tres posibles montos de gasto (E1, E2 y E3) aparecen en la figura como tres líneas de “restricción presupuestal”. El nivel de gasto E1 es obviamente demasiado reducido para alcanzar U2; de ahí que no pueda resolverse el problema dual. Con los gastos dados por E3 el individuo puede llegar a U2 (en cualesquiera de los dos puntos B o C), pero este no es el nivel de gasto mínimo requerido. En cambio, E2 ofrece evidentemente los gastos totales suficientes para llegar a U2 (en el punto A), y esta es de hecho la solución del problema dual. Al comparar las figuras 4.2 y 4.6 resulta obvio que tanto el método primario de optimización de la utilidad como el método dual de minimización del gasto producen la misma solución (x∗, y∗); son simplemente modos alternos de ver el mismo proceso. El método de minimización del gasto suele ser más útil, sin embargo, porque los gastos son directamente observables, mientras que la utilidad no. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 132 Parte 2: Elección y demanda FIGURA 4.6 El problema dual de minimización del gasto. El problema dual de la optimización de la utilidad es alcanzar un nivel de utilidad dado (U2) con gastos mínimos. Un nivel de gasto de E1 no permite alcanzar U2, mientras que E3 brinda más poder de gasto del estrictamente necesario. Con el gasto E2, esta persona puede llegar a U2 consumiendo x∗ y y∗. Cantidad de y B E3 E2 E1 A y* C U2 Cantidad de x x* Enunciación matemática Más formalmente, el problema dual de minimización del gasto del individuo es elegir x1, x2, . . . , xn para minimizar gastos totales E p1x1 p2x2 . . . pnxn, (4.48) utilidad U U(x1, x2, . . . , xn). (4.49) sujetos a la restricción Las cantidades óptimas de x1, x2, . . . , xn elegidos en este problema dependerán de los precios de los diversos bienes (p1, p2, . . . , pn) y del nivel de utilidad requerido U. Si alguno de los precios cambiara o si el individuo tuviera un “objetivo” de utilidad diferente, otro conjunto de bienes sería el óptimo. Esta dependencia puede resumirse como una función de gasto. DEFINICIÓN Función de gasto. La función de gasto del individuo muestra los gastos mínimos necesarios para alcanzar un nivel de utilidad dado para una serie particular de precios. Es decir, gastos mínimos E(p1, p2, . . . , pn, U). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (4.50) 8/23 Capítulo 4: Optimización de la utilidad y elección 133 Esta definición indica que la función de gasto y la función de utilidad indirecta son funciones inversas entre sí (compárense las ecuaciones 4.43 y 4.50). Ambas dependen de los precios del mercado, pero implican diferentes restricciones (ingreso o utilidad). En el capítulo siguiente se verá que esta relación es útil al permitirnos examinar la teoría de cómo reaccionan los individuos a cambios de precio. No obstante, consideremos primero dos funciones de gasto. EJEMPLO 4.4 Dos funciones de gasto Hay dos maneras de calcular una función de gasto. El primer método, más sencillo, sería formular directamente el problema de minimización del gasto y aplicar la técnica de Lagrange. Algunos de los problemas al final de este capítulo te pedirán hacer eso precisamente. Aquí, sin embargo, adoptaremos un procedimiento más ágil, aprovechando la relación entre funciones de gasto y funciones de utilidad indirecta. Dado que estos dos tipos de funciones son inversos entre sí, el cálculo de uno facilita enormemente el del otro. Ya se calcularon las funciones de utilidad indirecta de dos casos importantes en el ejemplo 4.3. Recuperar las funciones de gasto asociadas es cuestión de simple álgebra. Caso 1: Utilidad Cobb-Douglas. La ecuación 4.45 muestra que la función de utilidad indirecta en el caso de la función Cobb-Douglas de dos bienes es V( px , py , I) I . 0.5 2p0.5 x py (4.51) Si ahora se intercambia el rol de la utilidad (que ahora trataremos como el “objetivo” de utilidad denotado por U) y del ingreso (que ahora denominaremos “gastos”, E, y lo trataremos como una función de los parámetros de este problema), tenemos la función de gasto E(px, py, U) 2px0.5p0.5 y U. (4.52) Comparando esto con nuestros resultados anteriores, usaremos un objetivo de utilidad de U 2 con, nuevamente, px 1 y py 4. Con estos parámetros la ecuación 4.52 indica que los gastos mínimos requeridos son de 8 dólares ( 2 . 10.5 . 40.5 . 2). No es de sorprender que tanto el problema primordial de optimización de la utilidad como el problema dual de minimización del gasto sean formalmente idénticos. Caso 2: Proporciones fijas. Para el caso de las proporciones fijas, la ecuación 4.47 dio la función de utilidad indirecta como V( px , py , I) I . px 0.25py (4.53) Si intercambiamos nuevamente el rol de la utilidad y los gastos, derivamos rápidamente la función de gasto: E(px, py, U) (px 0.25py)U. (4.54) Una comprobación de los valores hipotéticos usados en el ejemplo 4.3 (px 1, py 4, U 4) demuestra nuevamente que llegar al objetivo de utilidad de 4 costaría 8 dólares [(1 0.25 . 4) . 4]. Compensación de un cambio de precio. Estas funciones de gasto nos permiten investigar cómo podría ser compensada una persona por un cambio de precio. En específico supongamos que el precio del bien y aumenta de 4 a 5 dólares. Obviamente esto reduciría la utilidad de una persona, así que podría preguntarse qué monto de compensación monetaria mitigaría el daño. Puesto que la función de gasto permite mantener constante la utilidad, esto ofrece una estimación directa de ese monto. Específicamente, en el caso de la función Cobb-Douglas, los gastos tendrían que aumentar de 8 a 8.94 dólares ( 2 . 1 . 50.5 . 2) para brindar suficiente poder de compra adicional a fin de compensar precisamente dicho aumento de precio. Con proporciones fijas los gastos tendrían que aumentar de 8 a 9 dólares Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 134 Parte 2: Elección y demanda para compensar el aumento de precio. De ahí que las compensaciones sean casi iguales en estos casos simples. Hay, sin embargo, una diferencia importante entre ambos ejemplos. En el caso de proporciones fijas, el dólar de compensación adicional permite sencillamente a esta persona volver a su paquete de consumo previo (x 4, y 1). Esta es la única manera de devolver la utilidad a U 4 para esta rígida persona. En el caso de la función Cobb-Douglas, en cambio, esta persona no usará la compensación adicional para retornar a su conjunto de consumo previo. En lugar de ello la optimización de la utilidad requerirá que los 8.94 dólares se distribuyan de tal manera que x 4.47 y y 0.894. Esto seguirá brindando un nivel de utilidad de U 2, pero la persona economizará en el ahora más costoso bien y. En el capítulo siguiente se detalla este análisis de los efectos de bienestar de los cambios de precio. PREGUNTAS: ¿Cómo debería ser compensada una persona por una reducción de precios? ¿Qué tipo de compensación requerirá, si el precio del bien y disminuye de 4 a 3 dólares? PROPIEDADES DE LAS FUNCIONES DE GASTO Puesto que las funciones de gasto son ampliamente usadas en la economía aplicada, es importante entender algunas de las propiedades compartidas por todas esas funciones. Aquí se estudiarán tres propiedades. Todas ellas se desprenden directamente del hecho de que las funciones de gasto se basan en la optimización de la utilidad individual. 1. Homogeneidad. Para las dos funciones ilustradas en el ejemplo 4.4 la duplicación de todos los precios duplicará precisamente el valor de los gastos requeridos. Técnicamente, estas funciones de gasto son “homogéneas de grado uno” en todos los precios.10 Esta es una propiedad general de las funciones de gasto. Debido a que la restricción presupuestal del individuo es lineal en precios, todo aumento proporcional tanto en precios como en poder de compra le permitirá adquirir el mismo conjunto de bienes elegido que optimice la utilidad antes del aumento de precio. En el capítulo 5 se verá que, por esta razón, las funciones de demanda son homogéneas de grado cero en todos los precios e ingresos. 2. Las funciones de gasto son no decrecientes en precios. Esta propiedad puede resumirse sucintamente con el enunciado matemático E 0 pi para cada bien i. (4.55) Esto parece intuitivamente obvio. Puesto que la función de gasto reporta el gasto mínimo necesario para llegar a un nivel de utilidad dado, un aumento en cualquier precio debe incrementar ese mínimo. Más formalmente, supongamos que el precio de un bien aumenta y que todos los demás precios se mantienen iguales. Sea que A represente el conjunto de bienes adquirido antes del aumento de precio y B el conjunto adquirido después del aumento de precio. Evidentemente, el conjunto B cuesta más que antes luego del aumento de precio. El único cambio entre ambas situaciones es el aumento en uno de los precios; así, el gasto en ese bien se incrementa y todos los demás gastos permanecen iguales. Sin embargo, también sabemos que antes del aumento de precio el conjunto A costaba menos que el conjunto B, porque A era el conjunto minimizador del gasto. De ahí que los gastos reales, cuando se elige B desComo se describió en el capítulo 2, se dice que la función f(x1, x2, . . . , xn) es homogénea de grado k si f(tx1, tx2, . . . , txn) tk f (x1, x2, . . . , xn). En este caso, k 1. 10 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección 135 En p1∗ esta persona gasta E(p1∗, ...). Si sigue comprando la misma serie de bienes al cambiar p1 los gastos estarán dados por Eseudo. Como es probable que sus patrones de consumo se modifiquen al cambiar p1, los gastos reales serán menores que este. FIGURA 4.7 Las funciones de gasto son cóncavas en los precios. E( p1, . . .) E seudo E( p1, . . .) E( p1*, . . .) E( p1*, . . .) p1 pués del aumento de precio, excedan los gastos en A antes del aumento de precio. Una cadena lógica similar podría usarse para demostrar que una reducción de precio debería causar una reducción de gastos (o posiblemente una permanencia en su mismo nivel). 3. Las funciones de gasto son cóncavas en los precios. En el capítulo 2 se analizaron las funciones cóncavas las cuales se definen como funciones que siempre se ubican abajo, tangentes a ellas. Aunque las condiciones matemáticas técnicas que describen estas funciones son complicadas, es relativamente simple mostrar cómo se aplica este concepto a las funciones de gasto, considerando la variación en un solo precio. La figura 4.7 muestra los gastos de un individuo como una función del precio p1. En el precio inicial, p1∗, los gastos de esta persona están dados por E(p1∗, . . .). Considérense ahora precios más altos o más bajos que p1∗. Si esta persona continuara comprando el mismo conjunto de bienes, los gastos aumentarían o disminuirían linealmente al cambiar el precio. Esto daría origen a la función de seudogasto Eseudo en la figura. Esta línea señala un nivel de gastos que permitiría a la persona comprar el conjunto original de bienes, pese al valor cambiante de p1. Si, como parece más probable, esta persona ajustara sus compras al cambiar p1, sabemos (a causa de la minimización del gasto) que los gastos reales serían menores que esos seudomontos. De ahí que la función de gasto real, E, se ubique en cualquier punto bajo Eseudo y que la función sea cóncava.11 La concavidad de la función de gasto es una propiedad útil para varias aplicaciones, en especial aquellas relacionadas con el efecto de sustitución de cambios de precio (véase capítulo 5). 11 Un resultado de la concavidad es que fii 2E/p2i 0. Esto es precisamente lo que muestra la figura 4.7. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 136 Parte 2: Elección y demanda Resumen En este capítulo se exploró el modelo económico básico de la optimización de la utilidad sujeta a una restricción presupuestal. Aunque este problema se abordó de distintas maneras todos los enfoques condujeron al mismo resultado básico. óptimo de consumo de algunos bienes es de cero. En este caso, la razón de la utilidad marginal con el precio de ese bien estará bajo la razón común de costo marginal-beneficio marginal de los bienes efectivamente adquiridos. • Para alcanzar un óptimo restringido un individuo debe gastar todo el ingreso disponible y elegir un conjunto de bienes tal que la TMS entre dos bienes cualesquiera sea igual a la razón de los precios de mercado de dichos bienes. Esta tangencia básica resultará en que el individuo iguale las razones de la utilidad marginal con el precio de mercado de cada bien efectivamente consumido. Este resultado es común a la mayoría de los problemas de optimización restringida. • Una consecuencia del supuesto de optimización de utilidad restringida es que las decisiones óptimas del individuo dependerán implícitamente de los parámetros de su restricción presupuestal. Es decir, las decisiones observadas serán funciones implícitas de todos los precios e ingresos. Así, la utilidad también será una función indirecta de dichos parámetros. • Las condiciones de tangencia, sin embargo, son sólo las condiciones de primer orden para un óptimo restringido. Para garantizar que estas condiciones también sean suficientes el mapa de curvas de indiferencia del individuo debe exhibir una TMS decreciente. En términos formales, la función de utilidad debe ser estrictamente cuasi cóncava. • Las condiciones de tangencia también deben modificarse para tomar en cuenta soluciones de esquina en las cuales el nivel • El problema dual de optimización de utilidad restringida es minimizar el gasto requerido para llegar a un nivel de utilidad dado. Aunque este enfoque dual produce la misma solución óptima que el problema primordial de óptimo restringido, también arroja discernimientos adicionales sobre la teoría de la elección. Específicamente, este enfoque conduce a funciones de gasto en las que el gasto requerido para alcanzar un objetivo de utilidad dado depende de los precios de mercado de los bienes. Así, las funciones de gasto son en principio mensurables. Problemas 4.1 Cada día Paul, quien está en tercer grado, almuerza en la escuela. Sólo le gustan los pastelillos (t) y la soda (s), los cuales le brindan una utilidad de ts. utilidad U(t, s) a. Si los pastelillos cuestan $0.10 cada uno y el vaso con soda, $0.25 ¿cómo debería gastar Paul el dólar que su madre le da, a fin de optimizar su utilidad? b. Si la escuela intenta desalentar el consumo de pastelillos, aumentando su precio a $0.40, ¿cuánto tendría que incrementar la madre de Paul la cantidad de dinero para el almuerzo y proporcionarle el mismo nivel de utilidad que recibía en el inciso a)? 4.2 a. Una joven conocedora de vinos tiene $600 para gastar en la construcción de una pequeña cava. Le gustan dos cosechas en particular: la del Bordeaux francés de 2001 (wF), a $40 por botella, y un vino californiano menos costoso de 2005 (wC) a un precio de $8. Si su utilidad es U(wF, wC) wF2/3wC2/3, ¿cuánto debería comprar de cada vino? b. Cuando llegó a la vinatería, nuestra joven enóloga descubrió que el precio del Bordeaux francés había bajado a $20 la botella, debido a una reducción en el valor del euro. Si el precio del vino californiano se mantiene estable en $8 por botella, ¿cuánto de cada vino debería comprar nuestra amiga para optimizar su utilidad en estas condiciones alteradas? c. Explica por qué esta aficionada al vino estaría en mejores condiciones en el inciso b) que en el a). ¿Cómo asignarías un valor monetario a este aumento de utilidad? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección 137 4.3 a. En una determinada noche, J. P. disfruta el consumo de puros (c) y brandy (b) de acuerdo con la función U(c, b) 20c c2 18b 3b2. ¿Cuántos puros y copas de brandy consume en una noche? (El costo no es problema para J. P.) b. Últimamente, sin embargo, sus médicos le han recomendado a J. P. limitar a 5 el total de copas de brandy y puros consumidos. ¿Cuántas copas de brandy y puros consumirá en estas circunstancias? 4.4 a. El señor Omar Excéntrico disfruta los productos x y y de acuerdo con la función de utilidad x2 y2. U(x, y) La utilidad del señor Excéntrico se optimiza si px $3, py $4 y tiene $50 para gastar. Pista: Aquí podría ser más fácil optimizar U2 en lugar de U. ¿Por qué esto no alterará tus resultados? b. Grafica la curva de indiferencia del señor Excéntrico y su punto de tangencia con su restricción presupuestal. ¿Qué indica esta gráfica sobre el comportamiento del señor Excéntrico? ¿Encontraste un óptimo verdadero? 4.5 El señor A deriva utilidad de martinis (m) en proporción con la cantidad que bebe: U(m) m. El señor A, sin embargo, es muy especial con los martinis: sólo le gustan preparados con una proporción exacta de dos partes de ginebra (g) por una de vermut (v). De ahí que la función de utilidad del señor A pueda reescribirse como g U(m) U(g, v) min 2 , v . a. Grafica la curva de indiferencia del señor A en términos de g y v para varios niveles de utilidad. Demuestra que, independientemente de los precios de ambos ingredientes, el señor A nunca alterará la forma en que prepara los martinis. b. Calcula las funciones de demanda de g y v. c. Usando los resultados del inciso b), ¿cuál es la función de utilidad indirecta del señor A? d. Calcula la función de gasto del señor A; para cada nivel de utilidad muestra el gasto como una función de pg y pv. Pista: Dado que este problema implica una función de utilidad de proporciones fijas, no es posible despejar las decisiones optimizadoras de utilidad usando el cálculo. 4.6 Supón que un fanático de la comida rápida deriva utilidad de tres bienes —refrescos (x), hamburguesas (y) y helados (z)— de acuerdo con la función de utilidad de función Cobb-Douglas U(x, y, z) x0.5y0.5(1 z)0.5. Supón también que los precios de estos bienes están dados por px 1, py 4 y pz 8 y que el ingreso de este consumidor está dado por I 8. a. Demuestra que, para z 0 la optimización de la utilidad resulta en las mismas decisiones óptimas que en el ejemplo 4.1. Demuestra, asimismo, que toda decisión que resulte en z 0 (aun para una z fraccionaria) reduce la utilidad desde ese óptimo. b. ¿Cómo explicas el hecho de que z 0 sea óptimo aquí? c. ¿Qué tan alto tendría que ser el ingreso de este individuo para poder comprar todas las z? 4.7 El principio de suma global que se ilustra en la figura 4.5 se aplica a la política de transferencias y a la tributación. En este problema se examinará la aplicación de ese principio. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 138 Parte 2: Elección y demanda a. Usa una gráfica similar a la de la figura 4.5 para demostrar que una subvención al ingreso para una persona brinda más utilidad que un subsidio al bien x el cual le cuesta la misma cantidad al gobierno. b. Usa la función de gasto Cobb-Douglas que se presenta en la ecuación 4.52 para calcular el poder de compra adicional necesario para incrementar la utilidad de esta persona de U 2 a U 3. c. Usa de nuevo la ecuación 4.52 para estimar el grado en el cual el bien x debe subsidiarse para incrementar la utilidad de esta persona de U 2 a U 3. ¿Cuánto le costaría este subsidio al gobierno? ¿Qué resulta de comparar este costo con el calculado en el inciso b)? d. En el problema 4.10 se te pedirá calcular una función de gasto para una función Cobb-Douglas más general que la que se usa en el ejemplo 4.4. Aplica aquí esa función de gasto para volver a resolver los incisos b) y c) para el caso 0.3, cifra cercana a la fracción del ingreso que las personas de bajos ingresos gastan en alimentos. e. ¿Cómo habrían cambiado tus cálculos en este problema si hubiéramos utilizado la función de gasto para el caso de proporciones fijas (ecuación 4.54)? 4.8 Dos de las funciones de utilidad más simples son: 1. Proporciones fijas: U(x, y) min[x, y]. 2. Sustitutos perfectos: U(x, y) x y a. Para cada una de estas funciones de utilidad, calcula lo siguiente: • Funciones de demanda de x y y • Función de utilidad indirecta • Función de gasto b. Analiza las formas particulares de las funciones que calculaste; ¿por qué adoptan esas formas específicas? 4.9 Supón que se tiene una función de utilidad que implica dos bienes y que es lineal de la forma U(x, y) ax by. Calcula la función de gasto de esta función de utilidad. Pista: La función de gasto tendrá problemas en varias razones de precio. Problemas analíticos 4.10 Utilidad Cobb-Douglas En el ejemplo 4.1 se examinó la función Cobb-Douglas U(x, y) xy1, donde 0 de esa función. 1. Este problema ilustra algunos atributos más a. Calcula la función de utilidad indirecta para este caso de la función Cobb-Douglas. b. Calcula la función de gasto de este caso. c. Demuestra explícitamente cómo la compensación requerida para neutralizar el efecto de un aumento en el precio de x se relaciona con la magnitud del exponente . 4.11 Utilidad ESC La función de utilidad ESC que se utilizó en este capítulo está dada por U(x, y) x y . a. Demuestra que las condiciones de primer orden para un máximo de utilidad restringida con esta función requiere que los individuos elijan bienes en la proporción x y px py 1/( 1) . b. Demuestra que el resultado del inciso a) implica que los individuos distribuirán sus fondos en partes iguales entre x y y para el caso Cobb-Douglas ( 0), como se demostró anteriormente en varios problemas. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección 139 c. ¿Cómo depende la razón pxx/pyy del valor de ? Explica intuitivamente tus resultados. (Para más detalles sobre esta función, véase la extensión E4.3.) d. Deriva las funciones de utilidad indirecta y gasto de este caso y comprueba tus resultados describiendo las propiedades de homogeneidad de las funciones que calculaste. 4.12 Utilidad de Stone-Geary Supón que los individuos requieren cierto nivel de alimentos (x) para mantenerse vivos. Concedamos que esta cantidad está dada por x0. Una vez adquirido x0 los individuos obtienen la utilidad de los alimentos y otros bienes (y) de la forma U(x, y) (x x0)y, donde 1. a. Demuestra que si I pxx0, el individuo maximizará su utilidad gastando (I pxx0) pxx0 en el bien x y (I pxx0) en el bien y. Interpreta este resultado. b. ¿Cómo cambian las razones pxx/I y pyy/I al aumentar el ingreso en este problema? (Véase también la extensión E4.2 para más detalles sobre esta función de utilidad.) 4.13 Funciones de utilidad indirecta ESC y de gasto En este problema se usará una forma más estándar de la función de utilidad ESC para derivar funciones de utilidad indirecta y de gasto. Supón que la utilidad está dada por U(x, y) (x y)1/ [en esta función la elasticidad de sustitución 1/(1 )]. a. Demuestra que la función de utilidad indirecta de la función de utilidad que acaba de darse es V I(pxr pyr)1/r, b. c. d. e. donde r /( 1) 1 . Demuestra que la función derivada en el inciso a) es homogénea de grado cero en precios e ingreso. Demuestra que esta función es estrictamente creciente en ingreso. Demuestra que esta función es estrictamente decreciente en cualquier precio. Demuestra que la función de gasto para este caso de utilidad ESC está dada por E V(pxr pyr)1/r. f. Demuestra que la función derivada en el inciso e) es homogénea de grado uno en los precios de los bienes. g. Demuestra que esta función de gasto es creciente en cada uno de los precios. h. Demuestra que la función es cóncava en cada precio. 4.14 Altruismo Michele quien tiene un ingreso relativamente alto I demuestra altruismo hacia Sofía quien vive en una pobreza tal que en esencia no tiene ningún ingreso. Supongamos que las preferencias de Michele están representadas por la función de utilidad U1(c1, c2) c11ac2a, donde c1 y c2 son los niveles de consumo de Michele y Sofía los cuales aparecen como bienes en una función Cobb-Douglas. Supón que Michele puede gastar su ingreso en su propio consumo, o en el de Sofía (mediante donativos de beneficencia), y que $1 compra una unidad de consumo para cualquiera de las dos (así, los “precios” de consumo son p1 p2 1). a. Argumenta que el exponente a puede tomarse como una medida del grado del altruismo de Michele, ofreciendo una interpretación de los valores extremos a 0 y a 1. ¿Qué valor la convertiría en una perfecta altruista (considerando a los demás igual que a sí misma)? b. Despeja las decisiones óptimas de Michele y muestra cómo cambian con a. c. Despeja las decisiones óptimas de Michele bajo un impuesto al ingreso con tasa t. ¿Cómo cambian sus decisiones si hay una deducción a la beneficencia (de manera que el ingreso que se gastó en donativos no es gravado)? ¿La deducción a la beneficencia tiene mayor efecto de incentivo en las personas más altruistas o en las menos altruistas? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 140 Parte 2: Elección y demanda d. Para mayor simplicidad vuelve al caso sin impuestos. Supón ahora que el altruismo de Michele está representado por la función de utilidad U1(c1, U2) c11aU2a, la cual es similar a la representación del altruismo en la extensión E3.4 del capítulo anterior. De acuerdo con esta especificación, Michele se ocupa directamente del nivel de utilidad de Sofía y sólo indirectamente de su nivel de consumo. 1. Despeja las decisiones óptimas de Michele, si la función de utilidad de Sofía es simétrica respecto a la de Michele: U2(c2, U1) c21aU1a. Compara tu respuesta con el inciso b). ¿Michele es más o menos caritativa bajo la nueva especificación? Explica tu respuesta. 2. Repite el análisis previo suponiendo que la función de utilidad de Sofía es U2(c2) c2. Sugerencias de lecturas adicionales Barten, A. P. y Volker Böhm. “Consumer Theory”, en K. J. Arrow y M. D. Intriligator, eds., Handbook of Mathematical Economics, vol. II, North-Holland, Ámsterdam, 1982. Las secciones 10 y 11 tienen resúmenes compactos de muchos de los conceptos cubiertos en este capítulo. Deaton, A. y J. Muelbauer. Economics and Consumer Behavior, Cambridge University Press, Cambridge, 1980. La sección 2.5 ofrece un buen tratamiento geométrico de conceptos de dualidad. Dixit, A. K. Optimization in Economic Theory, Oxford University Press, Oxford, 1990. El capítulo 2 brinda varios análisis lagrangianos centrados en la función de utilidad Cobb-Douglas. Hicks, J. R. Value and Capital, Clarendon Press, Oxford, 1946. gasto, más estándar. Ese capítulo también ofrece ideas sobre varias estructuras inusuales de preferencias. Mas-Colell, A., M. D. Whinston y J. R. Green. Microeconomic Theory, Oxford University Press, Oxford, 1995. El capítulo 3 contiene un completo análisis de funciones de utilidad y de gasto. Samuelson, Paul A. Foundations of Economic Analysis, Harvard University Press, Cambridge, 1947. El capítulo V y el apéndice A ofrecen un sucinto análisis de las condiciones de primer orden para un óptimo de utilidad. Tal apéndice brinda asimismo una buena cobertura de condiciones de segundo orden. Silberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwing/McGraw-Hill, Boston, 2001. El capítulo II y el apéndice matemático proporcionan algunas sugerencias tempranas acerca de la importancia de la función de gasto. Útil aunque muy difícil tratamiento de la dualidad en la teoría del consumo. Luenberger, D. G. Microeconomic Theory, McGraw Hill, Nueva York, 1992. Theil, H., Theory and Measurement of Consumer Demand, NorthHolland, Ámsterdam, 1975. En el capítulo 4 este autor muestra varias relaciones interesantes entre su “función de beneficio” (véase el problema 3.15) y la función de Buen resumen de teoría básica de la demanda junto con implicaciones para la estimación empírica. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 EXTENSIONES Porciones presupuestales El economista del siglo xix Ernst Engel fue uno de los primeros científicos sociales en estudiar a fondo los patrones de gasto reales de los individuos. Se concentró específicamente en el consumo de alimentos. Su hallazgo de que la fracción del ingreso que se gasta en alimentos disminuye al aumentar el ingreso llegó a conocerse como ley de Engel y se ha confirmado en muchos estudios. La ley de Engel es de tal regularidad empírica que algunos economistas han propuesto medir la pobreza por la fracción del ingreso que se gasta en alimentos. Hay otras dos aplicaciones interesantes: 1) el estudio de Hayashi (1995) el cual demuestra que la porción del ingreso dedicada a los alimentos que prefieren los ancianos es mucho más alta en familias de dos generaciones que en familias de una sola generación, y 2) los hallazgos de Behrman (1989), procedentes de países menos desarrollados, que demuestran que los deseos de la gente de llevar una dieta más variada, al aumentar sus ingresos, pueden resultar de hecho en una reducción de la fracción del ingreso que se gasta en nutrientes particulares. En el resto de esta extensión se examinarán algunas evidencias sobre las porciones presupuestales (denotadas por si pixi/I) junto con algo más de teoría sobre el tema. dente: al aumentar el ingreso las familias gastan en alimentos una menor proporción de sus fondos. Otras variaciones importantes en la tabla incluyen la porción decreciente del ingreso que se gasta en cubrir necesidades de atención a la salud y una mayor porción del ingreso que los individuos de ingresos más altos dedican a planes de retiro. Curiosamente, las porciones del ingreso dedicadas a vivienda y transporte son relativamente constantes en el rango de ingreso que se muestra en la tabla; al parecer, individuos de altos ingresos compran casas y automóviles más grandes. Las porciones variables del ingreso, en la tabla E4.1 ilustran por qué la función Cobb-Douglas no es útil para estudios empíricos detallados respecto al comportamiento de las familias. Cuando la utilidad está dada por U(x, y) xy (donde 1), las ecuaciones de demanda implicadas son x I/px y y I/py. Así, sx pxx/I y sy pyy/I , (i) y las porciones presupuestales son constantes para todos los niveles de ingreso y precios relativos observados. Debido a esta deficiencia los economistas han investigado otras formas posibles de la función de utilidad que permitan mayor flexibilidad. E4.1 La variabilidad de las porciones presupuestales E4.2 Sistema de gasto lineal En la tabla E4.1 aparecen datos actualizados de las porciones presupuestales de Estados Unidos. En esta tabla la ley de Engel es evi- Una generalización de la función Cobb-Douglas que incorpora la idea de que ciertos montos mínimos de cada bien deben TABLA E4.1 PORCIONES PRESUPUESTALES DE FAMILIAS ESTADOUNIDENSES, 2008 Ingreso anual $10 000-$14 999 $40 000-$49 999 Más de $70 000 Concepto de gastos Alimentos 15.7 13.4 11.8 Vivienda 23.1 21.2 19.3 Servicios públicos y combustible 11.2 8.6 5.8 Transporte 14.1 17.8 16.8 5.3 4.0 2.6 Seguro médico Otros gastos de atención a la salud 2.6 2.8 2.3 Entretenimiento (bebidas alcohólicas incluidas) 4.6 5.2 5.8 Educación 2.3 1.2 2.6 Seguro y pensiones Otros (electrodomésticos, aseo personal, otros gastos de vivienda y varios) 2.2 8.5 14.6 18.9 17.3 18.4 Consumer Expenditure Report, 2008, página en internet de la Bureau of Labor Statistics, http://www.bls.gov. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 142 Parte 2: Elección y demanda ser comprados por un individuo (x0, y0) es la función de utilidad U(x, y) (x x0)(y y0) (ii) para x x0 y y y0 donde, nuevamente, 1. Las funciones de demanda pueden derivarse de esta función de utilidad en forma similar al caso de la función Cobb-Douglas, introduciendo el concepto de ingreso supernumerario (I∗) el cual representa el monto de poder de compra restante después de adquirir el paquete mínimo I∗ I pxx0 pyy0. (iii) Usando esta notación las funciones de demanda son x (px x0 I )/px , y (py y0 I )/py . (iv) En este caso el individuo gasta entonces una fracción constante de ingreso supernumerario en cada bien, una vez adquirido el conjunto mínimo. La manipulación de la ecuación iv produce las ecuaciones de porciones sx (px x0 sy (py y0 py y0 )/I, px x0 )/I, (v) que muestran que este sistema de demanda no es homotético. La revisión de la ecuación v exhibe el previsible resultado de que la porción presupuestal de un bien se relaciona positivamente con la cantidad mínima necesaria de dicho bien, y negativamente con la cantidad mínima del otro bien requerido. Puesto que la noción de compras necesarias parece estar acorde con la observación de la realidad, este sistema de gasto lineal (SGL), inicialmente desarrollado por Stone (1954), es de uso muy común en estudios empíricos. La función de utilidad en la ecuación ii también se conoce como función de utilidad de Stone-Geary. Compras tradicionales Uno de los usos más interesantes del SGL es examinar cómo cambia esta noción de compras necesarias al cambiar también las condiciones. Por ejemplo, Oczkowski y Philip (1994) estudian cómo el acceso a bienes de consumo modernos puede afectar la parte del ingreso que los individuos en economías de transición dedican a los artículos locales tradicionales. Estos autores demuestran que los lugareños de Papúa, Nueva Guinea, reducen significativamente esas porciones al acceder cada vez más a bienes del exterior. De ahí que adelantos, como mejores carreteras para el transporte de bienes, sean una de las formas en las que se socavan las prácticas culturales tradicionales. E4.3 Utilidad ESC En el capítulo 3 se presentó la función de utilidad ESC U(x, y) x y (vi) para 1, 0. El principal uso de esta función es ilustrar posibilidades alternas de sustitución (que se reflejan en el valor del parámetro . Las porciones presupuestales implicadas por esta función de utilidad aportan variados discernimientos de este tipo. La manipulación de las condiciones de primer orden para un óptimo de utilidad restringida con la función ESC rinde las ecuaciones de porciones sx 1/[1 ( py /px ) K , sy 1/[1 ( px /py ) K , (vii) donde K /( 1). La naturaleza homotética de la función ESC se demuestra por el hecho de que estas expresiones de porciones sólo dependen de la razón de precio, px/py. El comportamiento de estas porciones en respuesta a los cambios en precios relativos depende del valor del parámetro K. Para el caso Cobb-Douglas, 0, así que K 0 y sx sy 1/2. Cuando 0 las posibilidades de sustitución son grandes y K 0. En este caso, la ecuación vii demuestra que sx y px/py se mueven en direcciones opuestas. Si px/py aumenta, la persona sustituye y por x en tal grado que sx disminuye. O bien, si 0, entonces las posibilidades de sustitución son limitadas, K 0, y sx y px/py se mueven en la misma dirección. En este caso, un incremento en px/py sólo causa una sustitución menor de y por x, y sx en realidad se incrementa debido al precio relativamente más alto del bien x. Libre comercio en América del Norte Las funciones de demanda ESC se usan, la mayoría de las veces, en modelos por computadora a gran escala de equilibrio general (véase el capítulo 13), mismos que los economistas usan para evaluar el impacto de importantes cambios económicos. Puesto que el modelo ESC subraya que las porciones responden a cambios en los precios relativos, tal modelo es particularmente apropiado para examinar innovaciones como cambios en política tributaria o en restricciones al comercio internacional, donde los cambios en precios relativos son probables. Un área importante de tal investigación ha sido el impacto del Tratado de Libre Comercio de América del Norte para Canadá, México y Estados Unidos. En general, estos modelos determinan que es de esperar que todos los países involucrados se beneficien con ese tratado, pero que los beneficios para México podrían ser los mayores, ya que este país está experimentando el mayor cambio en los precios relativos. Kehoe y Kehoe (1995) presentan varios modelos de equilibrio computables que los economistas han usado en estos exámenes.1 E4.4 El sistema de demanda casi ideal Otra manera de estudiar las porciones presupuestales es a partir de una función de gasto específica. Este método es especialmente conveniente porque el teorema de la envolvente demuestra que las porciones presupuestales pueden derivarse directamente de las funciones de gasto a través de la diferenciación logarítmica (para más detalles véase el capítulo 5): 12 ln E(px , py , V) 1 E px ln px E(px , py , V) px ln px xpx sx . E (viii) 1 En las extensiones del capítulo 13 se analiza con más detalle la investigación sobre el Tratado de Libre Comercio de América del Norte. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 4: Optimización de la utilidad y elección Deaton y Muellbauer (1980) hacen amplio uso de esta relación para estudiar las características de una clase particular de funciones de gasto que denominan sistema de demanda casi ideal (SDCI). Su función de gasto adopta la forma ln E( px , py , V) a0 a1 ln px a2 ln py 0.5b1 (ln px ) 2 b2 ln px ln py 0.5b3 (ln py ) 2 Vc 0 pcx1 (ix) pcy 2 . Esta forma aproxima cualquier función de gasto. Para que la función sea homogénea de grado uno en los precios sus parámetros deben cumplir las restricciones a1 a2 1, b1 b2 0, b2 b3 0 y c1 c2 0. El uso de los resultados de la ecuación viii muestra que para esta función sx a1 b1 ln px b2 ln py c1 Vc0 pcx1 pcy 2 , sy a2 b2 ln px b3 ln py c2 Vc0 pcx1 pcy 2 . (x) Nótese que, dadas las restricciones de los parámetros, sx sy 1. Hacer uso de la relación inversa entre las funciones de utilidad indirecta y de gasto, así como de cierta manipulación algebraica adicional, simplifica estas ecuaciones de porciones presupuestales de una manera adecuada para la estimación econométrica: sx a1 b1 ln px b2 ln py c1 (E/p), sy a2 b2 ln px b3 ln py c2 (E/p), (xi) donde p es un índice de precios definido por ln p a0 a1 ln px a2 ln py 0.5b1 (ln px ) 2 b2 ln px ln py 0.5b3 (ln py ) 2 . (xii) En otras palabras, las ecuaciones de porciones del SDCI establecen que las porciones presupuestales son lineales en los logaritmos de precios y en los gastos totales reales. En la práctica, los índices de precios más simples suelen sustituirse por el más bien complejo índice dado en la ecuación xii, aunque existe cierta controversia sobre esta práctica (véanse las extensiones del capítulo 5). 143 Patrones de gasto británicos Entre 1954 y 1974, Deaton y Muellbauer aplican este sistema de demanda al estudio de los patrones de gasto británicos. Determinan que los alimentos y la vivienda tienen coeficientes negativos de gastos reales, lo que implica que la porción del ingreso que se dedica a esos conceptos disminuye (al menos en Gran Bretaña) a medida que la gente enriquece. Estos autores detectan asimismo efectos significativos de los precios relativos en muchas de sus ecuaciones de porciones, además de que los precios tienen efectos especialmente grandes en la explicación de la parte de los gastos que se asignan a transporte y comunicación. Al aplicar el modelo del SDCI a datos reales, estos autores también encuentran varias dificultades econométricas, la más importante de las cuales es que muchas de las ecuaciones no parecen cumplir las restricciones necesarias para la homogeneidad. Abordar este tipo de asuntos ha sido un tema relevante en investigaciones adicionales sobre este sistema de demanda. Referencias Behrman, Jere R. “Is Variety the Spice of Life? Implications for Caloric Intake”, Review of Economics and Statistics (noviembre de 1989), pp. 666-672. Deaton, Angus y John Muellbauer. “An Almost Ideal Demand System”, American Economic Review (junio de 1980), pp. 312326. Hyashi, Fumio. “Is the Japanese Extended Family Altruistically Linked? A Test Based on Engel Curves”, Journal of Political Economy (junio de 1995), pp. 661-674. Kehoe, Patrick J. y Timothy J. Kehoe. Modeling North American Economic Integration, Kluwer Academic Publishers, Londres, 1995. Oczkowski, E. y N. E. Philip. “Household Expenditure Patterns and Access to Consumer Goods in a Transitional Economy”, Journal of Economic Development (junio de 1994), pp. 165183. Stone, R. “Linear Expenditure Systems and Demand Analysis”, Economic Journal (septiembre de 1954), pp. 511-527. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO CINCO Efectos de ingreso y de sustitución En este capítulo se usará el modelo de optimización de la utilidad para estudiar cómo la cantidad de un bien que un individuo elige se ve afectada por un cambio en el precio del mismo. Este examen nos permitirá elaborar la curva de demanda del individuo relativa a dicho bien. Entre tanto se proporcionarán varios discernimientos sobre la naturaleza de la respuesta al precio y sobre los tipos de supuestos en que se basa la mayoría de los análisis de la demanda. FUNCIONES DE DEMANDA Como se señaló en el capítulo 4, en principio es usualmente posible establecer las condiciones necesarias de un máximo de utilidad para los niveles óptimos de x1, x2, . . . xn (y , el multiplicador de Lagrange) como funciones de todos los precios y el ingreso. Matemáticamente, esto puede expresarse como n funciones de demanda1 de la forma x1 ( p1 , p2 , . . . , pn , I), x1 x2 x2 ( p1 , p2 , . . . , pn , I), .. . (5.1) xn ( p1 , p2 , . . . , pn , I). xn Si sólo hay dos bienes, x y y (el caso que por lo general nos interesará), esta notación puede simcarse un poco como x x( px , py , I), y y( px , py , I). (5.2) Una vez que se conoce la forma de las funciones de demanda, así como los valores de todos los precios y el ingreso, se puede “predecir” cuánto de cada bien decidirá comprar un individuo. La notación subraya el hecho de que precios e ingreso son “exógenos” a este proceso; es decir, son parámetros sobre los cuales el individuo no tiene control en esta etapa del análisis. Los cambios en esos parámetros alterarán, desde luego, la restricción presupuestal y causarán que un individuo tome decisiones diferentes. Este cuestionamiento es el tema central de este y del siguiente capícamente, en este capítulo se considerarán las derivadas parciales x/ I y x/ px para 1 Las funciones de demanda en la ecuación 5.1 se conocen como funciones de demanda de Marshall (así llamadas en honor a Alfred Marshall) para diferenciarlas de las funciones de demanda de Hicks (en honor a John Hicks), que abordaremos más adelante. La diferencia entre estos dos conceptos se deriva de si el ingreso o la utilidad entra en las funciones. Para mayor simplicidad, a lo largo de este texto el término funciones de demanda o curvas de demanda remitirá al concepto marshalliano, mientras que las referencias a funciones de demanda y curvas de demanda hicksianas (o “compensadas”) se señalarán explícitamente. 145 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 146 Parte 2: Elección y demanda cualquier bien x. En el capítulo 6 se abundará en este análisis al examinar los efectos de “precio cruzado” de la forma x/py para cualquier par de bienes x y y. Homogeneidad Una primera propiedad de las funciones de demanda requiere un poco de matemáticas. Si se duplicaran todos los precios y el ingreso (si, en realidad, se les multiplicara por cualquier constante positiva), las cantidades óptimas demandadas se mantendrían sin cambios. Duplicar todos los precios y el ingreso sólo cambia las unidades con las que contamos, no la cantidad “real” de bienes demandados. Este resultado puede verse de diversas formas, aunque quizá la más fácil de ellas sea mediante gráficas. En referencia a las figuras 4.1 y 4.2 resulta claro que duplicar px, py e I no afecta la gráfica de la restricción presupuestal. De ahí que x∗, y∗ siga siendo la combinación elegida. En términos algebraicos, pxx pyy I es la misma restricción que 2pxx 2pyy 2I. Un poco más técnicamente, este resultado puede escribirse diciendo que para cualquier bien xi, xi∗ xi(p1, p2, . . . , pn, I) xi(tp1, tp2, . . . , tpn, tI) (5.3) para cualquier t 0. Se dice que las funciones que cumplen la propiedad ilustrada en la ecuación 5.3 son homogéneas de grado 0.2 De ahí que se haya demostrado que las funciones de demanda individual son homogéneas de grado 0 en todos los precios y en el ingreso. Cambiar todos los precios y el ingreso en las mismas proporciones no afectará las cantidades físicas de los bienes demandados. Este resultado indica que (en teoría) las demandas de los individuos no se verán afectadas por una inflación “pura” durante la cual todos los precios e ingresos aumentan proporcionalmente. Estos seguirán demandando el mismo conjunto de bienes. Claro que si una inflación no fuera pura (es decir, si algunos precios aumentaran más rápido que otros), no sería éste el caso. EJEMPLO 5.1 Homogeneidad La homogeneidad de la demanda es el resultado directo del supuesto de optimización de la utilidad. Las funciones de demanda derivadas de la optimización de la utilidad serán homogéneas y a la inversa: las funciones de demanda no homogéneas no pueden reflejar optimización de la demanda (a menos que los precios entren directamente en la función de utilidad misma, como podría ocurrir para los bienes con algún atractivo para los esnobs). Si, por ejemplo, la utilidad de un individuo respecto a alimentos (x) y vivienda (y) está dada por utilidad U(x, y) x0.3y0.7, (5.4) todo se reduce entonces (siguiendo el mismo procedimiento que en el ejemplo 4.1) a derivar las funciones de demanda 0.3I , px 0.7I . y py x (5.5) Estas funciones obviamente exhiben homogeneidad porque una duplicación de todos los precios y el ingreso no afectarían a x∗ ni a y∗. Si las preferencias de un individuo por x y y se reflejaran, en cambio, en la función ESC U(x, y) x0.5 y0.5, 2 (5.6) Más generalmente, como se vio en los capítulos 2 y 4, de una función f(x1, x2, . . . , xn) se dice que es homogénea de grado k si f (tx1, tx2, . . . , txn) tkf(x1, x2, . . . , xn) para cualquier t 0. Los casos más comunes de funciones homogéneas son k 0 y k 1. Si f es homogénea de grado 0, duplicar todos sus argumentos la deja sin cambios en valor. Si f es homogénea de grado 1, duplicar todos sus argumentos duplicará su valor. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 147 entonces (como se mostró en el ejemplo 4.2) las funciones de demanda estarían dadas por 1 1 px /py I , px 1 y 1 py /px I . py x (5.7) Como ya vimos, estas dos funciones de demanda son homogéneas de grado 0; una duplicación de px, py e I no afectaría a x∗ ni a y∗. PREGUNTA: Las funciones de demanda derivadas en este ejemplo, ¿garantizan que el gasto total en x y y agote el ingreso de un individuo para cualquier combinación de px, py e I? ¿Puedes demostrar que es éste el caso? VARIACIONES EN EL INGRESO Al aumentar el poder de compra de una persona es natural esperar que la cantidad de cada bien comprado también aumente. Esta situación se ilustra en la figura 5.1. Al incrementarse los gastos de I1 a I2 a I3, la cantidad de x demandada aumenta de x1 a x2 a x3. Asimismo, la cantidad de y aumenta de y1 a y2 a y3. Nótese que las líneas presupuestales I1, I2 e I3 son paralelas, en reflejo de FIGURA 5.1 Efecto de un incremento en el ingreso sobre las cantidades de x y y elegidas. Al incrementarse el ingreso de I1 a I2 a I3 las opciones óptimas (de optimización de la utilidad) de x y y se indican mediante los puntos sucesivamente más altos de la tangencia. Obsérvese que la restricción presupuestal se desplaza en forma paralela porque su pendiente (dada por px/py) no cambia. Cantidad de y U1 U2 U3 y3 y2 U3 I3 y1 U2 I2 I1 x1 x2 U1 x3 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. Cantidad de x 23.08.2019 8/23 148 Parte 2: Elección y demanda FIGURA 5.2 Mapa de curvas de indiferencia que exhibe inferioridad. En este diagrama el bien z es inferior porque la cantidad adquirida decrece al incrementar el ingreso. Aquí, y es un bien normal (como debe de ser si sólo hay dos bienes disponibles), y las compras de y aumentan al aumentar los gastos totales. Cantidad de y y3 U3 y2 U2 y1 I1 I2 I3 U1 Cantidad de z z3 z2 z1 que lo único que cambia es el ingreso, no los precios relativos de x y y. Como la razón px /py se mantiene constante, las condiciones de optimización de la utilidad también requieren que la TMS se mantenga constante conforme el individuo se desplaza a mayores niveles de satisfacción. Así, la TMS es igual en el punto (x3, y3) y en (x1, y1). Bienes normales e inferiores En la figura 5.1 tanto x como y se incrementan al crecer el ingreso; tanto x/I como y/I son positivas. Esta podría considerarse la situación común, y los bienes que tienen esta propiedad se llaman bienes normales en el rango de cambio de ingreso observado. Para algunos bienes, sin embargo, la cantidad elegida puede decrecer al incrementar el ingreso en algunos rangos. Ejemplos de tales bienes son la garrafa de whisky, las papas y la ropa de segunda mano. Un bien z para el cual z/I es negativo se llama bien inferior. Este fenómeno se ilustra en la figura 5.2. En ese diagrama el bien z es inferior porque para los incrementos en el ingreso en el rango mostrado se elige menos de z. Nótese que las curvas de indiferencia no tienen que ser de formas “raras” para exhibir inferioridad; las curvas correspondientes a los bienes y y z en la figura 5.2 siguen cumpliendo el supuesto de la TMS decreciente. El bien z es inferior dada la manera en que se relaciona con los demás bienes disponibles (aquí el bien y), no a causa de una peculiaridad exclusiva del mismo. De ahí que se desarrollen las siguientes definiciones. DEFINICIÓN Bienes normales e inferiores. Un bien xi para el cual xi /I 0 en algún rango de variaciones en el ingreso es un bien inferior en ese rango. Si xi /I 0 en algún rango de variación en el ingreso, el bien es un bien normal (o “no inferior”) en ese rango. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 149 VARIACIONES EN EL PRECIO DE UN BIEN El efecto de un cambio de precio sobre la cantidad demandada de un bien es más complejo de analizar que el efecto de un cambio en el ingreso. Geométricamente, esto se debe a que cambiar un precio implica cambiar no sólo una de las intercepciones de la restricción presupuestal, sino también su pendiente. En consecuencia, el desplazamiento a la nueva opción de optimización de la utilidad supone no sólo pasar a otra curva de indiferencia, sino también cambiar la TMS. Así, cuando un precio cambia entran en juego dos efectos analíticamente diferentes. Uno de ellos es el efecto de sustitución: aun si el individuo permaneciera en la misma curva de indiferencia se asignarían patrones de consumo que igualarían la TMS con la nueva razón de precio. Emerge un segundo efecto, el efecto de ingreso, porque un cambio de precio cambia necesariamente el ingreso “real” de un individuo. Una persona no puede permanecer en la curva de indiferencia inicial y debe transitar a una nueva. Analicemos estos efectos gráficamente. Luego ofreceremos un desarrollo matemático. Análisis gráfico de un decremento en el precio En la figura 5.3 se ilustran los efectos de ingreso y de sustitución. Una persona optimiza inicialmente su utilidad (sujeta a gastos totales, I), consumiendo la combinación x∗, y∗. La restricción presupuestal inicial es I px1x pyy. Supongamos ahora que el precio de x decrece a px2. La nueva restricción presupuestal está dada por la ecuación I px2x pyy en la figura 5.3. Resulta claro que la nueva posición de utilidad óptima es x∗∗, y∗∗, donde la nueva línea presupuestal es tangente a la curva de indiferencia U2. El desplazamiento a este nuevo punto puede verse compuesto por dos efectos. Primero, el cambio en la pendiente de la restricción presupuestal motiva un desplazamiento al punto B, aun si las opciones se hubieran limitado a la curva de indiferencia original U1. La línea punteada en la figura 5.3 tiene la misma pendiente que la nueva restricción presupuestal (I px2x pyy), pero sigue un trazo tangente a U1 porque conceptualmente se mantiene constante el ingreso “real” (es decir, la utilidad). Un precio relativamente menor para x causará un movimiento de x∗, y∗ a B si no permitimos que este individuo esté en mejores condiciones a raíz del precio menor. Este desplazamiento es una demostración gráfica del efecto de sustitución. El movimiento adicional de B al punto óptimo x∗∗, y∗∗ es analíticamente idéntico a la clase de cambio exhibido por variaciones en el ingreso. Como el precio de x ha decrecido, esta persona tiene un mayor ingreso “real” y puede permitirse un nivel de utilidad (U2) mayor que el que antes podía alcanzar. Si x es un bien normal se elegirá más del mismo en respuesta a este incremento en el poder de compra. Esta observación explica el origen del término efecto de ingreso para ese desplazamiento. En general, entonces, el resultado del decremento de precio es que causa que se demande más x. Es importante reconocer que en realidad esta persona no toma una serie de decisiones de x∗, y∗ a B y luego a x∗∗, y∗∗. Jamás observamos el punto B; sólo se reflejan las dos posiciones óptimas en el comportamiento observado. Sin embargo, la noción de los efectos de ingreso y de sustitución son analíticamente valiosos porque muestra que un cambio de precio afecta la cantidad demandada de x en dos formas conceptualmente distintas. Veremos cómo esta separación ofrece importantes discernimientos en la teoría de la demanda. Análisis gráfico de un incremento en el precio Si el precio del bien x se incrementara se usaría un análisis similar. En la figura 5.4 la línea presupuestal se ha desplazado hacia dentro debido a un incremento en el precio de x de px1 a px2. El desplazamiento desde el punto inicial de optimización de la utilidad (x∗, y∗) al nuevo punto (x∗∗, y∗∗) puede descomponerse en dos efectos. Primero, aun si esta persona pudiera permanecer en la curva de indiferencia inicial (U2), habría un incentivo para sustituir y por x y transitar a lo largo de U2 al punto B. Sin embargo, puesto que el poder de compra se ha reducido, debido al incre- Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 150 Parte 2: Elección y demanda FIGURA 5.3 Demostración de los efectos de ingreso y de sustitución de un decremento en el precio de x. Cuando el precio de x decrece de px1 a px2, la opción de optimización de la utilidad pasa de x∗, y∗ a x∗∗, y∗∗. Este desplazamiento puede desglosarse en dos efectos analíticamente distintos: primero, el efecto de sustitución, que implica un desplazamiento a lo largo de la curva de indiferencia inicial al punto B, donde la TMS es igual a la nueva razón de precio; y segundo, el efecto de ingreso, que supone un desplazamiento a un nivel de utilidad más alto porque el ingreso real se ha incrementado. En el diagrama los efectos tanto de sustitución como de ingreso provocan que se compre más x cuando su precio decrece. Nótese que el punto I/py es el mismo que antes del cambio de precio; esto se debe a que py no ha cambiado. Así, el punto I/py aparece tanto en las antiguas como en las nuevas restricciones presupuestales. Cantidad de y U1 U2 I py I = px1x + pyy y** y* I = p2x x + pyy B U2 U1 x* xB Cantidad de x x** Efecto Efecto de sustitución de ingreso Incremento total en x mento en el precio de x, debe desplazarse a un nivel de utilidad más bajo. Este desplazamiento se llama, como ya se dijo, efecto de ingreso. Adviértase en la figura 5.4 que los efectos tanto de ingreso como de sustitución operan en la misma dirección y provocan que la cantidad demandada de x se reduzca, en respuesta a un incremento en su precio. Efectos de las variaciones de precio para bienes inferiores Hasta aquí se ha demostrado que los efectos de sustitución y de ingreso tienden a reforzarse entre sí. Para un decremento de precio ambos provocan que se demande más del bien, mientras que para un incremento de precio, ambos propician que se demande menos. Aunque este análisis es atinado para el caso de los bienes normales (no inferiores), la posibilidad de bienes inferiores complica la historia. En este caso, los efectos de ingreso y de sustitución operan en direcciones opuestas, y el resultado combinado de un cambio de precio es indeterminado. Un decremento en el precio, por ejemplo, siempre hará que un individuo tienda a consumir más de un bien a Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución FIGURA 5.4 Demostración de los efectos de ingreso y de sustitución de un incremento en el precio de x. 151 Cuando el precio de x se incrementa la restricción presupuestal se desplaza hacia dentro. El desplazamiento desde el punto inicial de optimización de la utilidad (x∗, y∗) al nuevo punto (x∗∗, y∗∗) puede analizarse como dos efectos aparte. El efecto de sustitución se describiría como un desplazamiento al punto B sobre la curva de indiferencia inicial (U2). El incremento en el precio, sin embargo, creará una pérdida de poder de compra y un desplazamiento consecuente a una curva de indiferencia más baja. Este es el efecto de ingreso. En el diagrama los efectos tanto de ingreso como de sustitución causan que la cantidad de x decrezca a raíz del incremento en su precio. También en este caso el punto I/py no se ve afectado por el cambio en el precio de x. Cantidad de y I py U1 U2 B y** I = p x2 x + p y y y* I = p x1 x + p y y U2 U1 x** xB x* Cantidad de x Efecto de Efecto de ingreso sustitución Reducción total en x causa del efecto de sustitución. Pero si el bien es inferior el incremento en el poder de compra causado por el decremento de precio puede provocar que se compre menos del bien. Así, el resultado es indeterminado: el efecto de sustitución tiende a incrementar la cantidad del bien inferior comprado, mientras que el (perverso) efecto de ingreso tiende a reducir esa cantidad. A diferencia de la situación para los bienes normales, aquí no es posible predecir siquiera la dirección del efecto de un cambio en px sobre la cantidad consumida de x. Paradoja de Giffen Si el efecto de ingreso de un cambio de precio es lo bastante fuerte, el cambio en el precio y el cambio resultante en la cantidad demandada podrían moverse en realidad en la misma dirección. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 152 Parte 2: Elección y demanda Cuenta la leyenda que el economista inglés Robert Giffen observó esta paradoja en la Irlanda del siglo xix: supuestamente, cuando el precio de las papas subía la gente consumía más papas. Este resultado peculiar puede explicarse estudiando la magnitud del efecto de ingreso de un cambio en el precio de las papas. Las papas no sólo eran bienes inferiores, sino que también absorbían una gran porción del ingreso del pueblo irlandés. Así, un incremento en el precio de las mismas reducía sustancialmente el ingreso real. Los irlandeses se veían obligados a reducir el consumo de otros alimentos suntuarios para comprar más papas. Aunque esta versión de los hechos es históricamente inverosímil, la posibilidad de un incremento en la cantidad demandada, en respuesta a un incremento en el precio de un bien, ha dado en llamarse paradoja de Giffen.3 Más adelante se proporcionará un análisis matemático de cómo puede presentarse esta paradoja. Sinopsis De ahí que nuestro análisis gráfico nos lleve a las conclusiones siguientes. PRINCIPIO DE OPTIMIZACIÓN Efectos de ingreso y de sustitución. La hipótesis de optimización de la utilidad sugiere que para bienes normales un decremento en el precio de un bien conduce a un incremento en la cantidad adquirida, debido a que 1) el efecto de sustitución provoca que se compre más a medida que la persona se desplaza a lo largo de una curva de indiferencia, y 2) el efecto de ingreso hace que se compre más porque el decremento en el precio ha incrementado el poder de compra, permitiendo así un desplazamiento a una curva de indiferencia más alta. Cuando el precio de un bien normal se incrementa, un razonamiento similar predice un decremento en la cantidad adquirida. Para bienes inferiores los efectos de sustitución y de ingreso operan en direcciones opuestas y no es posible hacer predicciones definidas. CURVA DE DEMANDA DE UNA PERSONA Con frecuencia los economistas desean graficar funciones de demanda. Sin duda no te sorprenderá saber que esas gráficas se llaman “curvas de demanda”. Comprender cómo se relacionan esas curvas de uso muy común con las funciones de demanda subyacentes brinda discernimientos adicionales incluso sobre los argumentos económicos fundamentales. Para simplificar el desarrollo supongamos que sólo hay dos bienes y que, como antes, la función de demanda para el bien x está dada por x∗ x(px, py, I). La curva de demanda derivada de esta función examina la relación entre x y px, manteniendo constantes py, I y las preferencias. Es decir, muestra la relación x∗ x(px, py, I). (5.8) donde las barras sobre py e I indican que estos determinantes de la demanda se mantienen constantes. Esta construcción se advierte en la figura 5.5. La gráfica muestra opciones de optimización de la utilidad de x y y conforme se le presentan a este individuo precios sucesivamente más bajos del bien x (manteniendo constantes py e I). Suponemos que las cantidades de x elegidas aumentan de x a x y x al decrecer el precio de ese bien de px a p a px. Tal supuesto concuerda con nuestra 3 Un problema importante de esta explicación es que desestima la observación de Marshall en el sentido de que factores tanto de oferta como de demanda deben tomarse en cuenta al analizar las variaciones de precio. Si el precio de las papas hubiera aumentado a causa de una plaga en Irlanda, la oferta se habría reducido; por tanto, ¿cómo es posible que se hayan consumido más papas? Asimismo, dado que muchos irlandeses cultivaban papas, el incremento en el precio de estas habría incrementado el ingreso real por ellas. Para un análisis detallado de estos y otros interesantes aspectos del saber popular sobre las papas, véase G. P. Dwyer y C. M. Lindsey, “Robert Giffen and the Irish Potato”, American Economic Review (marzo de 1984), pp. 188-192. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución FIGURA 5.5 Construcción de la curva de demanda de una persona. 153 En a) se muestran las opciones de optimización de la utilidad del individuo de x y y para tres diferentes precios de x(px, px y px). En b), esta relación entre px y x se usa para elaborar la curva de demanda de x. Esta curva de demanda se traza con base en el supuesto de que py, I y las preferencias se mantienen constantes conforme px varía. Cantidad de y por periodo I /py I = p x′ x + p y y I = p x″ x + p y y I = p x′′′ x + p y y U3 U2 U1 x′ x″ x′′′ Cantidad de x por periodo a) Mapa de curvas de indiferencia del individuo px p x′ p x″ p ′′′ x x( p x , p y, I) x′ x″ Cantidad de x por periodo x′′′ (b) Curva de demanda Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 154 Parte 2: Elección y demanda conclusión general de que, salvo en el caso inusual de la paradoja de Giffen, x/px la pendiente es negativa. En la figura 5.5b la información sobre las opciones de optimización de la utilidad del bien x se transfiere a una curva de demanda con px en el eje vertical y compartiendo el mismo eje horizontal de la figura 5.5a. La pendiente negativa de la curva refleja de nuevo el supuesto de que x/px es negativa. De ahí que la curva de demanda individual pueda definirse como sigue. DEFINICIÓN Curva de demanda de una persona. Una curva de demanda de una persona muestra la relación entre el precio de un bien y la cantidad de ese bien adquirida por un individuo, suponiendo que todos los demás determinantes de la demanda se mantienen constantes. La curva de demanda que se ilustra en la figura 5.5 permanece en una posición fija sólo mientras todos los demás determinantes de la demanda se mantengan sin cambios. Si uno de estos otros factores cambiara la curva podría desplazarse a una nueva posición, como describiremos en seguida. Desplazamientos en la curva de demanda Tres factores se mantuvieron constantes al derivar esta curva de demanda: 1) ingreso, 2) precios de otros bienes (digamos, py) y 3) las preferencias del individuo. Si alguno de ellos cambiara, la curva de demanda entera podría desplazarse a una nueva posición. Por ejemplo, si I se incrementara, la curva se desplazaría hacia fuera (siempre y cuando x/I 0; es decir, que el bien sea un bien “normal” en este rango de ingreso). Para cada menor precio se demandaría más cantidad de x. Si otro precio cambiara (digamos, py) la curva se desplazaría hacia dentro o hacia fuera, dependiendo justamente de cómo se relacionen x y y. En el capítulo siguiente se examinará en detalle esa relación. Por último, si las preferencias del individuo por el bien x cambiaran, la curva se desplazaría. Una súbita campaña publicitaria de la McDonald’s Corporation podría desplazar la demanda de hamburguesas hacia fuera, por ejemplo. Como obviamente deja ver este análisis debemos recordar que la curva de demanda es sólo una representación bidimensional de la verdadera función de demanda (ecuación 5.8) y que sólo es estable si lo demás se mantiene constante. Es importante tener en claro la diferencia entre un movimiento a lo largo de una curva de demanda dada, causado por un cambio en px y un desplazamiento de la curva entera motivado por un cambio en el ingreso, en uno de los demás precios o en las preferencias. Tradicionalmente, el término un incremento en la demanda se reserva para un desplazamiento hacia fuera en la curva de demanda, mientras que el término un incremento en la cantidad demandada se refiere a un movimiento a lo largo de una curva dada, causado por una caída en px. EJEMPLO 5.2 Funciones de demanda y curvas de demanda Para poder graficar una curva de demanda a partir de una función de demanda dada debemos suponer que las preferencias que generaron la función permanecen estables y que se conocen los valores del ingreso y de otros precios relevantes. En el primer caso que se estudió en el ejemplo 5.1 se determinó que x 0.3I px y 0.7I . py (5.9) y Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 155 Si las preferencias no cambian y si el ingreso de una persona es de 100 dólares, estas funciones se convierten en 30 , px 70 y , py x (5.10) o px x 30, py y 70, lo cual deja en claro que las curvas de demanda para esos dos bienes son hipérbolas simples. Un incremento en el ingreso desplazaría hacia fuera las dos curvas de demanda. Nótese también, en este caso, que la curva de demanda para x no es desplazada por variaciones en py y viceversa. Para el segundo caso que se examinó en el ejemplo 5.1 el análisis es más complejo. Respecto al bien x, sabemos que x 1 1 px /py I , px (5.11) así que para graficar esto en el plano px x debemos conocer tanto I como py. Si suponemos también que I 100 y concedemos que py 1, entonces la ecuación 5.11 se convierte en x 100 , p2x px (5.12) la que, al graficarse, también exhibirá una relación hiperbólica general entre precio y cantidad consumida. En este caso la curva será relativamente más plana porque los efectos de sustitución son mayores que en el caso de la función Cobb-Douglas. Por la ecuación 5.11 también sabemos que x 1 I 1 px /py 1 px 0 (5.13) y x I py ( px py ) 2 0, de manera que los incrementos en I o py desplazarían hacia fuera la curva de demanda del bien x. PREGUNTA: ¿Cómo cambiarían las funciones de demanda en las ecuaciones 5.10 si una persona gastara la mitad de su ingreso en cada bien? Demuestra que estas funciones de demanda predicen el mismo consumo de x en el punto px 1, py 1, I 100 que la ecuación 5.11. Usa un ejemplo numérico para demostrar que la función de demanda ESC es más sensible a un incremento en px que la función de demanda Cobb-Douglas. CURVAS Y FUNCIONES DE DEMANDA COMPENSADA (DE HICKS) En la figura 5.5 el nivel de utilidad que una persona obtiene varía a lo largo de la curva de demanda. Al decrecer px, la persona se encuentra en condiciones cada vez mejores, como lo indica el incremento en utilidad de U1 a U2 a U3. La razón de que esto ocurra es que la curva de demanda se traza con base en el supuesto de que el ingreso nominal y otros precios se mantienen constantes; de ahí que una reducción en px deje en mejores condiciones a esta persona al incrementar su Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 156 Parte 2: Elección y demanda capacidad de poder de compra real. Aunque esta es la forma más común de imponer el supuesto ceteris paribus al desarrollar una curva de demanda, no es la única. Otro método mantiene constante el ingreso real (o utilidad) al examinar reacciones a las variaciones en px. La derivación se ilustra en la figura 5.6, donde se mantiene constante la utilidad (en U2) al tiempo que se reduce sucesivamente px. Al decrecer px el ingreso nominal del individuo se reduce de manera efectiva, impidiendo así todo incremento en utilidad. En otras palabras, los efectos de la variación de precio en el poder de compra son “compensados” para obligar al individuo a permanecer en U2. Las reacciones a los precios cambiantes sólo incluyen efectos de sustitución. Si, en cambio, se examinaran los efectos de los incrementos en px la compensación del ingreso sería positiva: el ingreso de la persona tendría que incrementarse para permitirle permanecer en la curva de indiferencia U2 en respuesta a los incrementos de precio. Estos resultados pueden resumirse como sigue. FIGURA 5.6 Elaboración de una curva de demanda compensada. La curva xc muestra cómo la cantidad demandada de x cambia cuando px cambia, manteniendo constantes py y la utilidad. Es decir, el ingreso del individuo es “compensado” para mantener constante la utilidad. De ahí que xc sólo refleje efectos de sustitución de precios cambiantes. Cantidad de y Pendiente = p x′ py Pendiente = p x″ py Pendiente = p′′′ x py U2 x′ x″ x ′′′ Cantidad de x (a) Mapa de curvas de indiferencia de un individuo px p x′ p x″ p ′′′ x x c ( p x , p y, U) x′ x″ x″ (b) Curva de demanda compensada Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 Cantidad de x 8/23 Capítulo 5: Efectos de ingreso y de sustitución DEFINICIÓN 157 Curva de demanda compensada. Una curva de demanda compensada muestra la relación entre el precio de un bien y la cantidad adquirida con base en el supuesto de que los demás precios y la utilidad se mantienen constantes. Así, esta curva (también llamada curva de demanda de Hicks en honor al economista británico John Hicks) sólo ilustra efectos de sustitución. Matemáticamente, la curva es una representación bidimensional de la función de demanda compensada xc xc(px, py, U). (5.14) Adviértase que la única diferencia entre la función de demanda compensada en la ecuación 5.14 y las funciones de demanda no compensada en las ecuaciones 5.1 o 5.2 es si la utilidad o el ingreso entran en las funciones. De ahí que la principal diferencia entre las curvas de demanda compensada y no compensada es si la utilidad o el ingreso se mantienen constantes en la elaboración de las curvas. Lema de Shephard Muchos hechos sobre las funciones de demanda compensada pueden comprobarse fácilmente usando un resultado notorio de la teoría de la dualidad llamada lema de Shephard (la cual debe su nombre a R. W. Shephard, pionero en el uso de la teoría de la dualidad en funciones de producción y costo; véanse los capítulos 9 y 10). Consideremos el problema dual de minimización del gasto, expuesto en el capítulo 4. La expresión lagrangiana para ese problema fue ]. ᏸ pxx pyy [U(x, y) U (5.15) La solución de este problema produce la función de gasto E(px, py, U). Es posible aplicar el teorema de la envolvente a esta función advirtiendo que su derivada respecto a los precios de uno de los bienes puede interpretarse diferenciando la expresión lagrangiana en la ecuación 5.15: E( px , py , U) ᏸ xc ( px , py , U). px px (5.16) Es decir, la función de demanda compensada de un bien siempre puede hallarse a partir de la función de gasto por diferenciación respecto al precio de ese bien. Para ver intuitivamente por qué esa derivada es una función de demanda compensada nótese primero que tanto la función de gasto como la función de demanda compensada dependen de las mismas variables (px, py y U); el valor de una derivada siempre dependerá de las mismas variables que intervienen en la función original. Segundo, puesto que se diferencia una función minimizada se tiene la seguridad de que a cualquier cambio en precios le corresponderá una serie de ajustes en cantidades compradas que seguirá minimizando los gastos necesarios para llegar a un nivel de utilidad dado. Por último, variaciones en el precio de un bien afectarán los gastos en relativa proporción con la cantidad comprada de ese bien, justo lo que indica la ecuación 5.16. Uno de los muchos discernimientos que pueden derivarse del lema de Shephard concierne a la pendiente de la curva de demanda compensada. En el capítulo 4 se demostró que la función de gasto debe ser cóncava en precios. En términos matemáticos, 2E(px, py, V)/px2 0. Tomar en cuenta el lema de Shephard, sin embargo, implica que: 2 E( px , py , V) [E( px , py , V)/ px] x c ( px , py , V) 0. px2 px px (5.17) De ahí que la curva de demanda compensada deba tener pendiente negativa. La ambigüedad que surge cuando los efectos de sustitución y de ingreso operan en direcciones opuestas para las Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 158 Parte 2: Elección y demanda curvas de demanda de Marshall no emerge en el caso de las curvas de demanda compensada porque estas sólo implican efectos de sustitución. Relación entre curvas de demanda compensada y no compensada Esta relación entre los dos conceptos de curva de demanda se ilustra en la figura 5.7. En px las curvas se interceptan porque a ese precio el ingreso del individuo es suficiente para alcanzar el nivel de utilidad U2 (compárense las figuras 5.5 y 5.6). De ahí que x se demande en cualquier concepto de demanda. Para precios inferiores a px, sin embargo, el individuo sufre una reducción compensatoria en el ingreso sobre la curva xc que impide que un incremento en utilidad surja del precio más bajo. De la suposición de que x es un bien normal se desprende que se demanda menos x en px a lo largo de xc que a lo largo de la curva no compensada x. O bien, para un precio superior a px (como px), la compensación del ingreso es positiva porque el individuo necesita cierta ayuda para permanecer en U2. Suponiendo nuevamente que x es un bien normal, en px se demanda más x a lo largo de xc que de x. En general, entonces, para un bien normal la curva de demanda compensada es un poco menos sensible a variaciones de precio que la curva no compensada. Esto se debe a que esta última refleja efectos de las variaciones de precio, tanto de sustitución como de ingreso, mientras que la curva compensada sólo refleja efectos de sustitución. La decisión entre usar curvas de demanda compensada o no compensada en el análisis económico, es en gran medida, cuestión de conveniencia. En casi todos los trabajos empíricos se usan las curvas de demanda no compensada (o de Marshall) por los datos sobre precios e ingresos FIGURA 5.7 Comparación de curvas de demanda compensada y no compensada. Las curvas de demanda compensada (xc) y no compensada (x) se interceptan en px porque x es demandado en cada concepto. Para precios por encima de px el poder de compra del individuo debe incrementarse con la curva de demanda compensada; por tanto, se demanda más x que con la curva no compensada. Para precios por debajo de px el poder de compra debe reducirse para la curva compensada; de este modo, se demanda menos x que con la curva no compensada. La curva de demanda estándar es más sensible al precio porque incorpora efectos tanto de sustitución como de ingreso, mientras que la curva xc sólo refleja efectos de sustitución. px p x′ p x″ p ′′′ x x( p x , p y, I) x c ( p x , p y, U) x′ x∗ x″ Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. x ∗∗ x′′′ 23.08.2019 Cantidad de x 8/23 Capítulo 5: Efectos de ingreso y de sustitución 159 nominales necesarios para estimarlas son fáciles de conseguir. En las extensiones del capítulo 12 se describen algunas de estas estimaciones y se muestra cómo podrían usarse para propósitos políticos prácticos. Para algunos propósitos teóricos, sin embargo, las curvas de demanda compensada son un concepto más apropiado, ya que la posibilidad de mantener constante la utilidad ofrece ciertas ventajas. Nuestro análisis del “superávit del consumidor”, que aparecerá más adelante, aporta una ilustración de dichas ventajas. EJEMPLO 5.3 Funciones de demanda compensada En el ejemplo 3.1 se supuso que la función de utilidad para hamburguesas (y) y refrescos (x) estaba dada por utilidad U(x, y) x0.5y0.5, (5.18) y en el ejemplo 4.1 se mostró que las funciones de demanda de Marshall pueden calcularse para esas funciones de utilidad como 0.5I px 0.5I y( px , py , I) . py x( px , py , I) (5.19) En el ejemplo 4.4 se estableció que la función de gasto en este caso está dada por E(px, py, U) 2px0.5py0.5U. Así, ahora podemos usar el lema de Shephard para calcular las funciones de demanda compensada como: E( px , py , U) px 0.5 p0.5 y U px E( px , py , U) 0.5 yc ( px , py , U) p0.5 U. x py py xc ( px , py , U) (5.20) A veces se emplea la utilidad indirecta, V, en estas funciones de demanda compensada en vez de U, pero esto no cambia el significado de las expresiones; estas funciones de demanda muestran cómo reacciona un individuo a las variaciones de precio, manteniendo constante la utilidad. Aunque py no interviene en la función de demanda no compensada para x, sí lo hace en la función compensada: incrementos en py desplazan hacia fuera la curva de demanda compensada para x. Los dos conceptos de demanda coinciden en el punto inicial supuesto px 1, py 4, I 8 y U 2; las ecuaciones 5.19 predicen x 4, y 1 en este punto, igual que las ecuaciones 5.20. Sin embargo, para px 1 o px 1 las demandas difieren en ambos conceptos. Si, por decir algo, px 4, las funciones no compensadas predicen x 1, y 1, mientras que las funciones compensadas predicen x 2, y 2. La reducción en x resultante del incremento en su precio es menor con la función de demanda compensada que con la función no compensada porque el primer concepto ajusta el efecto negativo sobre el poder de compra ocasionado por el incremento de precio. Este ejemplo deja en claro los diferentes supuestos ceteris paribus inherentes a los dos conceptos de demanda. Con la demanda no compensada los gastos se mantienen constantes en I 2, de modo que el incremento en px de 1 a 4 resulta en una pérdida de utilidad; en este caso, la utilidad decrece de 2 a 1. En el caso de la demanda compensada, la utilidad se mantiene constante en U 2. Para mantener constante la utilidad los gastos deben aumentar a E 4(2) 4(2) 16 para neutralizar los efectos del incremento de precio. PREGUNTAS: ¿Las funciones de demanda compensada dadas en las ecuaciones 5.20 son homogéneas de grado 0 en px y py, si la utilidad se mantiene constante? ¿Esperarías que esto fuera cierto para todas las funciones de demanda compensada? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 160 Parte 2: Elección y demanda DESARROLLO MATEMÁTICO DE LA RESPUESTA A LAS VARIACIONES DE PRECIO Hasta este punto nos hemos apoyado en gran medida en recursos gráficos para describir la manera en que los individuos responden a las variaciones de precio. Discernimientos adicionales son provistos por un enfoque más matemático. Nuestro objetivo básico es examinar la derivada parcial x/px; es decir, cómo un cambio en el precio de un bien afecta su compra, ceteris paribus para la curva de demanda usual de Marshall. En el capítulo siguiente se aborda el tema de cómo las variaciones en el precio de una mercancía afectan las compras de otra. Método directo Nuestro objetivo es usar el modelo de optimización de la utilidad para saber algo sobre la forma en que cambia la demanda del bien x cuando px cambia; esto es, queremos calcular x/px. El método directo para resolver este problema hace uso de las condiciones de primer orden para la optimización de la utilidad. La diferenciación de esas n 1 ecuaciones produce un nuevo sistema de n 1 ecuaciones, que eventualmente pueden despejar la derivada que buscamos.4 Lamentablemente, obtener esta solución es muy laborioso y los pasos requeridos para hacerlo aportan pocos discernimientos económicos. De ahí que, en cambio, adoptemos un método indirecto fundado en el concepto de la dualidad. Al final, ambos métodos arrojan la misma conclusión, pero el indirecto es mucho más rico para la economía por los términos que contiene. Método indirecto Para iniciar nuestro método indirecto5 supondremos (una vez más) que sólo hay dos bienes (x y y) y nos centraremos en la función de demanda compensada, xc(px, py, U), y su relación con la función de demanda ordinaria, x(px, py, I). Por definición sabemos que xc(px, py, U) x[px, py, E(px, py, U)]. (5.21) Esta conclusión ya fue introducida en relación con la figura 5.7, que mostró que la cantidad demandada es idéntica para las funciones de demanda compensada y no compensada cuando el ingreso es justo el necesario para alcanzar el nivel de utilidad requerido. La ecuación 5.21 se obtiene insertando ese nivel de gasto en la función de demanda, x(px, py, I). Ahora podemos proceder diferenciando parcialmente la ecuación 5.21 respecto a px y reconociendo que esta variable interviene en la función de demanda ordinaria en dos lugares. De ahí que xc x x E , px px E px (5.22) x xc px px (5.23) y reordenar los términos produce x E . E px 4 Véase, por ejemplo, Paul A. Samuelson, Foundations of Economic Analysis (Harvard University Press, Cambridge, 1947), pp. 101103. 5 La prueba siguiente fue originalmente popularizada por Phillip J. Cook en “A ‘One Line’ Proof of the Slutsky Equation”, American Economic Review, núm. 62 (marzo de 1972), p. 139. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 161 Efecto de sustitución En consecuencia, la derivada que buscamos tiene dos términos. La interpretación del primero es simple: es la pendiente de la curva de demanda compensada. Pero esa pendiente representa movimiento a lo largo de una sola curva de indiferencia; es, de hecho, lo que hemos llamado el efecto de sustitución. El primer término de la derecha de la ecuación 5.23 es una representación matemática de dicho efecto. Efecto de ingreso El segundo término de la ecuación 5.23 refleja la manera en que las variaciones en px afectan la demanda de x a través de las variaciones en los niveles de gastos necesarios (es decir, cambios en la capacidad de poder de compra ). Por tanto, este término refleja el efecto de ingreso. El signo negativo en la ecuación 5.23 señala la dirección del efecto. Por ejemplo, un incremento en px incrementa a su vez el nivel de gasto que habría sido necesario para mantener constante la utilidad (matemáticamente, E/px 0). Pero como el ingreso nominal se mantiene constante en la demanda de Marshall, estos gastos adicionales no están disponibles. De ahí que x (y y) deben reducirse para enfrentar esta deficiencia. La medida de la reducción en x está dada por x/E. Por otro lado, si px decrece, el nivel de gasto requerido para alcanzar una utilidad determinada también decrece. La reducción en x que acompañaría normalmente dicho decremento en gastos es justo el monto que debe reponerse mediante el efecto de ingreso. Nótese que en este caso el efecto de ingreso opera para incrementar el monto de x. La ecuación de Slutsky Las relaciones incorporadas en la ecuación 5.23 fueron descubiertas por el economista ruso Eugen Slutsky, a fines del siglo xix. Para enunciar el resultado como Slutsky lo hizo se requiere un ligero cambio en la notación. Escribamos primero el efecto de sustitución como efecto de sustitución xc x px px (5.24) Uconstante para indicar movimiento a lo largo de una sola curva de indiferencia. En cuanto al efecto de ingreso tenemos efecto de ingreso x E E px x E , I px (5.25) porque las variaciones en el ingreso o los gastos equivalen a lo mismo en la función x(px, py, I). El segundo término del efecto de ingreso puede interpretarse usando el lema de Shephard. Esto es, E/px xc. En consecuencia, el efecto de ingreso total está dado por efecto de ingreso xc x . I (5.26) Forma final de la ecuación de Slutsky Unir las ecuaciones 5.24-5.26 nos permite ensamblar la ecuación de Slutsky en la forma en que se le derivó originalmente: x x( px , py , I) efecto de sustitución efecto de ingreso px px x Uconstante x (5.27) I en donde hemos considerado el hecho de que en el punto de optimización de la utilidad x(px, py, I) xc(px, py, V). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 162 Parte 2: Elección y demanda Esta ecuación permite un tratamiento más definido de la dirección y la magnitud de los efectos de sustitución e ingreso del que fue posible con el análisis gráfico. Primero, como se ha demostrado, el efecto de sustitución (y la pendiente de la curva de demanda compensada) siempre es negativo. Este resultado se deriva lo mismo de la cuasi concavidad de las funciones de utilidad (TMS decreciente), que de la concavidad de la función de gasto. En la última sección de este capítulo se mostrará la negatividad del efecto de sustitución en una forma algo diferente. El signo del efecto de ingreso (xx/I) depende del signo de x/I. Si x es un bien normal, entonces x/I es positiva y el efecto de ingreso total, al igual que el de efecto sustitución, es negativo. Por tanto, para bienes normales, precio y cantidad siempre se mueven en direcciones opuestas. Por ejemplo, un decremento en px incrementa el ingreso real, y como x es un bien normal, las compras de x se incrementan. De igual modo, un incremento en px reduce el ingreso real y por tanto, las compras de x decrecen. En general, entonces, como ya se describió al usar el análisis gráfico, los efectos de sustitución e ingreso operan en la misma dirección para producir una curva de demanda de pendiente negativa. En el caso de un bien inferior, x/I 0 y los dos términos de la ecuación 5.27 tienen signos diferentes. De ahí que el impacto general de un cambio en el precio de un bien sea ambiguo; todo depende de las magnitudes relativas de los efectos. Al menos teóricamente es posible que, en el caso de los bienes inferiores, el segundo término domine al primero lo cual conduce a la paradoja de Giffen (x/px 0). EJEMPLO 5.4 Una descomposición de Slutsky La descomposición de un efecto de precio, descubierto por Slutsky, puede ilustrarse convenientemente con el ejemplo de la función Cobb-Douglas que ya hemos estudiado. En el ejemplo 5.3 se estableció que la función de demanda de Marshall para el bien x es x(px , py , I) 0.5I px (5.28) y que la función de demanda compensada para este bien es xc(px, py, U) px0.5py0.5U. (5.29) De ahí que el efecto total de un cambio de precio sobre la demanda de Marshall pueda determinarse diferenciando la ecuación 5.28: x(px , py , I) 0.5I 2 . px px (5.30) Deseamos demostrar que esta es la suma de los dos efectos identificados por Slutsky. Para derivar el efecto de sustitución primero se debe diferenciar la función de demanda compensada de la ecuación 5.29: efecto de sustitución xc (px , py , U) px 0.5px 1.5 py U. (5.31) Ahora, en vez de U se usa la utilidad indirecta: V(px, py, I) 0.5Ipx0.5py0.5: efecto de sustitución 0.5px1.5py0.5V 0.25px2I (5.32) En este ejemplo el cálculo del efecto de ingreso es considerablemente más fácil. Aplicando los resultados de la ecuación 5.27, tenemos efecto de ingreso x x I 0.5I px 0.5 px 0.25I . p2x (5.33) Una comparación entre la ecuación 5.30 y las ecuaciones 5.32 y 5.33 indica que en realidad hemos descompuesto la derivada del precio de esta función de demanda en sus componentes de sustitución e Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 163 ingreso. Curiosamente, los efectos de sustitución e ingreso son justo de la misma magnitud. Esta, como se verá en ejemplos posteriores, es una de las razones por las cuales el caso de la función Cobb-Douglas es un caso especial. El trillado ejemplo numérico que hemos usado muestra también esta descomposición. Cuando el precio de x se incrementa de 1 a 4 dólares la demanda (no compensada) de x decrece de x 4 a x 1, pero la demanda compensada de x sólo decrece de x 4 a x 2. Esta reducción de 50 por ciento es el efecto de sustitución. El decremento adicional de 50 por ciento de x 2 a x 1 representa reacciones a la reducción del poder de compra, incorporada en la función de demanda de Marshall. Este efecto de ingreso no ocurre cuando se utiliza la noción de demanda compensada. PREGUNTA: En este ejemplo una persona gasta la mitad de su ingreso en el bien x y la otra mitad en el bien y. ¿Cómo se alterarían las magnitudes relativas de los efectos de sustitución e ingreso si los exponentes de la función de utilidad Cobb-Douglas no fueran iguales? ELASTICIDADES DE LA DEMANDA Hasta aquí, en este capítulo, hemos examinado cómo responden los individuos a las variaciones de precio e ingreso estudiando las derivadas de la función de demanda. Para muchas cuestiones analíticas esta es una buena manera de proceder porque se pueden aplicar directamente métodos de cálculo. Sin embargo, como se señala en el capítulo 2, concentrarse en las derivadas tiene una desventaja importante para el trabajo empírico: las magnitudes de las derivadas dependen directamente de cómo se miden las variables. Esto puede dificultar la comparación entre bienes, o a través de países y periodos. Por esta razón en casi todos los trabajos empíricos en microeconomía se usa alguna forma de la medida de elasticidad. En esta sección se presentarán los tres tipos más comunes de elasticidades de la demanda y se explorarán algunas de las relaciones matemáticas entre ellas. Una vez más, para mayor simplicidad, analizaremos una situación en la cual una persona elige únicamente entre dos bienes, aunque estas ideas son fáciles de generalizar. Elasticidades de la demanda de Marshall La mayoría de las elasticidades de demanda de uso más común se deriva de la función de demanda de Marshall x(px, py, I). Específicamente se usan las definiciones siguientes. DEFINICIÓN 1. Elasticidad precio de la demanda (ex, px). Mide la variación proporcional en la cantidad demandada en respuesta a una variación proporcional en el precio de un bien. Matemáticamente, ex, px x/ x x px x px , py , I px px / px px x px . x (5.34) 2. Elasticidad ingreso de la demanda (ex, I). Mide la variación proporcional en la cantidad demandada en respuesta a una variación proporcional en el ingreso. En términos matemáticos, ex, I x/ x x I x px , py , I I/ I I x I I . x (5.35) 3. Elasticidad cruzada de la demanda (ex, py). Mide la variación proporcional en la cantidad demandada de x en respuesta a una variación proporcional en el precio de otro bien (y): ex, py x/ x x py x px , py , I py py / py py x Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 py . x (5.36) 8/23 164 Parte 2: Elección y demanda Obsérvese que todas estas definiciones usan derivadas parciales lo cual significa que todas los demás determinantes de la demanda deben mantenerse constantes al examinar el impacto de una variable específica. En el resto de esta sección se explorará en mayor detalle la definición de la elasticidad precio. El examen de la elasticidad cruzada de la demanda es el tema principal del capítulo 6. Elasticidad precio de la demanda La elasticidad precio de la demanda es quizá el concepto de elasticidad más importante de toda la microeconomía. No sólo brinda una manera conveniente de resumir cómo responden los individuos a las variaciones de precio en una amplia variedad de bienes económicos, sino que también es un concepto central en la teoría de cómo reaccionan las empresas a las curvas de demanda que enfrentan. Como tal vez conoces de cursos previos de economía, suele distinguirse entre los casos de demanda elástica (en los que el precio afecta significativamente la cantidad) y los de demanda inelástica (en los que el efecto del precio es reducido). Una complicación matemática en la precisión de estas ideas es que la elasticidad precio de la demanda es en sí misma negativa6 porque, salvo en el improbable caso de la paradoja de Griffen, x/px es negativa. La línea divisoria entre reacciones grandes y pequeñas generalmente se fija en 1. Si ex, px 1, los cambios en x y px son de la misma magnitud proporcional. Es decir, un incremento de 1 por ciento en el precio conduce a un decremento de 1 por ciento en la cantidad demandada. En este caso, se dice que la demanda es “elástica y unitaria”. O bien, si ex, px 1, entonces los cambios en cantidad son proporcionalmente mayores que las variaciones de precio, y se dice que la demanda es “elástica”. Por ejemplo, si ex, px 3, cada incremento de 1 por ciento en el precio conduce a un decremento de 3 por ciento en la cantidad demandada. Finalmente, si ex, px 1, la demanda es inelástica y los cambios en cantidad son proporcionalmente menores que las variaciones de precio. Un valor de ex, px 0.3, por ejemplo, significa que un incremento de 1 por ciento en el precio conduce a un decremento en la cantidad demandada de 0.3 por ciento. En el capítulo 12 se verá cómo se usan los datos agregados para estimar la elasticidad precio de la demanda del individuo típico para un bien, y cómo esas estimaciones se usan en varias cuestiones de microeconomía aplicada. Elasticidad precio y gasto total La elasticidad precio de la demanda determina el modo en que una variación de precio, ceteris paribus, afecta el gasto total en un bien. Esta relación es fácil de demostrar mediante el cálculo: ( px x) x px x x(ex, px px px 1). (5.37) Así, el signo de esta derivada depende de si ex, px es mayor o menor que 1. Si la demanda es inelástica (0 ex, px 1), la derivada es positiva y el precio y el gasto total se mueven en la misma dirección. Intuitivamente, si el precio no afecta mucho la cantidad demandada, la cantidad se mantiene relativamente constante al cambiar el precio, y el gasto total refleja principalmente esos movimientos de precio. Este es el caso, por ejemplo, de la demanda de la mayoría de los productos agrícolas. Las variaciones de precio inducidas por el clima para cultivos específicos suelen provocar que el gasto total en esos cultivos se mueva en la misma dirección. Por otro lado, si la demanda es elástica (ex, px 1), las reacciones a una variación de precio son tan grandes que el efecto en el gasto total se invierte: un incremento en el precio causa que el gasto total decrezca (porque la cantidad decrece mucho), y un decremento en el precio provoca que el gasto total se incremente (la cantidad se incrementa en forma significativa). Para el caso elástico igual a la unidad (ex, px 1), el gasto total es constante sin importar cómo varíe el precio. 6 A veces, en sus análisis, los economistas usan el valor absoluto de la elasticidad precio de la demanda. Aunque esto es matemáticamente incorrecto, dicho uso es común. Por ejemplo, un estudio que encuentra que ex, px 1.2 en ocasiones podría reportar la elasticidad precio de la demanda como “1.2”. Sin embargo, nosotros no lo haremos aquí. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 165 Elasticidades precio compensadas Dado que algunos análisis microeconómicos se centran en la función de demanda compensada, también es útil definir elasticidades basadas en dicho concepto. Esas definiciones se desprenden directamente de sus contrapartes de Marshall. DEFINICIÓN Concedamos que la función de demanda compensada está dada por xc(px, py, U). Tenemos entonces las definiciones siguientes. 1. Elasticidad precio compensada de la demanda (exc, px). Esta elasticidad mide la variación compensada proporcional en la cantidad demandada, en respuesta a una variación proporcional en el precio de un bien: exc , px xc /xc xc px xc px , py , U px /px px xc px px . xc (5.38) 2. Elasticidad cruzada compensada de la demanda (exc, py). Mide la variación compensada proporcional en la cantidad demandada en respuesta a una variación proporcional en el precio de otro bien: exc , py xc /xc xc py xc px , py , U py py /py py xc py . xc (5.39) Que estas elasticidades precio difieran mucho de sus contrapartes de la demanda de Marshall depende de la importancia de los efectos ingreso en la demanda general del bien x. La relación precisa entre ambos tipos de elasticidad puede demostrarse multiplicando el resultado de Slutsky de la ecuación 5.27 por el factor px /x: px x ex, x px px px xc x px px x x exc , x I px sx ex, I , (5.40) donde sx px x/I es la parte del ingreso total dedicada a la compra del bien x. La ecuación 5.40 señala que las elasticidades precio compensada y no compensada de la demanda serán similares, si se cumple una de dos condiciones: 1) la parte del ingreso dedicada al bien x(sx) es reducida, o 2) la elasticidad ingreso de la demanda para el bien x(ex, I) es reducida. Cualquiera de estas condiciones sirve para reducir la importancia de la compensación del ingreso que se usa en la elaboración de la función de demanda compensada. Si el bien x no es importante en el presupuesto de una persona, la cantidad de compensación del ingreso requerido para neutralizar una variación de precio será reducida. Aun cuando un bien tiene una porción presupuestal grande, si la demanda no reacciona intensamente a las variaciones en el ingreso, los resultados de ambos conceptos de demanda serán similares. De ahí que haya muchas circunstancias en las que pueden usarse los dos conceptos de elasticidad precio en forma más o menos indistinta. Para decirlo de otra manera, existen muchas circunstancias económicas en las cuales los efectos de sustitución constituyen el componente más importante de las respuestas al precio. Relaciones entre elasticidades de la demanda En esta sección se han desarrollado varias relaciones entre los conceptos de elasticidad. Todas estas se derivan del modelo subyacente de optimización de la utilidad. Aquí se estudiarán tres de esas relaciones las cuales proporcionan discernimientos adicionales sobre la naturaleza de la demanda individual. Homogeneidad. La homogeneidad de las funciones de demanda también puede expresarse en términos de elasticidad. Dado que cualquier incremento proporcional en todos los precios y el ingreso deja sin cambios a la cantidad demandada, la suma neta de todas las elasticidades precio, Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 166 Parte 2: Elección y demanda junto con la elasticidad ingreso de un bien particular, debe ser de cero. Una comprobación formal de esta propiedad se vale del teorema de Euler (véase el capítulo 2). La aplicación de ese teorema a la función de demanda x(px, py, I), recordando que esta función es homogénea de grado 0, produce 0 px x x x py I px py I (5.41) Si la ecuación 5.41 se divide entre x obtenemos 0 ex, px ex, py ex, I, (5.42) como sugiere la intuición. Este resultado indica que las elasticidades de la demanda de cualquier bien no pueden seguir un patrón totalmente flexible. Deben exhibir algún tipo de coherencia interna que refleje el enfoque básico de optimización de la utilidad en que se funda la teoría de la demanda. Agregación de Engel. En las extensiones del capítulo 4 se expone el análisis empírico de porciones del mercado y se tomó especial nota de la ley de Engel en la cual la parte del ingreso dedicada a alimentos decrece al incrementar el ingreso. Desde la perspectiva de la elasticidad la ley de Engel es una formulación de la regularidad empírica de que la elasticidad ingreso de la demanda de alimentos suele determinarse como considerablemente menor que 1. Dado lo anterior, debe ser el caso de que la elasticidad ingreso de todos los productos no alimentarios tiene que ser mayor que 1. Si una persona experimenta un incremento en su ingreso se espera que sus gastos en alimentos aumenten en un monto proporcional menor, pese a lo cual el ingreso debe gastarse en algo. En el agregado estos otros gastos deben incrementarse proporcionalmente más rápido que el ingreso. Una enunciación formal de esta propiedad de las elasticidades ingreso puede derivarse diferenciando la restricción presupuestal del individuo (I pxx pyy) respecto al ingreso, al tiempo que los precios se tratan como constantes: 1 px x y py . I I (5.43) Un poco de manipulación algebraica de esta expresión produce 1 px x xI y yI py sx ex, I sy ey, I ; I xI I yI (5.44) aquí, nuevamente, si representa la parte del ingreso gastada en el bien i. La ecuación 5.44 indica que el promedio ponderado de las elasticidades de ingreso de todos los bienes que compra una persona debe ser de 1. Si supiéramos, por decir algo, que una persona gastó un cuarto de su ingreso en alimentos y que la elasticidad ingreso de la demanda de alimentos era de 0.5, la elasticidad ingreso de la demanda de todo lo demás debe ser aproximadamente de 1.17 [ (1 0.25 . 0.5)/0.75]. Puesto que los alimentos son una “necesidad” importante todo lo demás es, en cierto sentido, un “lujo”. Agregación de Cournot. El economista francés del siglo xviii, Antoine Cournot, aportó uno de los primeros análisis matemáticos respecto a las variaciones de precio mediante el cálculo. Su descubrimiento más importante fue el concepto de ingreso marginal, concepto central en la hipótesis de maximización de los beneficios para las empresas. A Cournot también le interesó cómo la variación en un precio afecta la demanda de todos los bienes. Nuestra relación final señala que, en efecto, existen conexiones entre todas las reacciones a las variaciones en un solo precio. Comenzaremos diferenciando la restricción presupuestal una vez más, ahora respecto a px: I x y 0 px x py . px px px Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 167 La multiplicación de esta ecuación por px /I produce p x px x y px y , x x py I px I x px I y 0 px 0 sx ex, px sx sy ey, (5.45) px , por tanto el resultado final de Cournot es sxex, px syey, px sx. (5.46) Esta ecuación indica que la magnitud del efecto cruzado de una variación en el precio de x sobre la cantidad de y consumida es limitada debido a la restricción presupuestal. Los efectos precio directos no pueden ser totalmente abrumados por los efectos cruzados. Esta es la primera de muchas relaciones entre las demandas de bienes que estudiaremos más intensivamente en el capítulo siguiente. Generalizaciones. Aunque sólo se han demostrado estos resultados de agregación para el caso de dos bienes, es fácil generalizarlos al caso de muchos bienes. En el problema 5.11 se te pedirá hacer justamente eso. Un asunto más difícil es si debe esperarse que estos resultados se sostengan respecto a los datos económicos típicos en los cuales se combinan las demandas de muchas personas. Con frecuencia los economistas tratan las relaciones de demanda agregada como descriptivas del comportamiento de una “persona representativa”, y de hecho estas relaciones deberían aplicarse a esta persona. Pero la situación quizá no sea tan simple, como se demostrará al analizar más adelante la agregación. EJEMPLO 5.5 Elasticidades de la demanda: importancia de los efectos de sustitución En este ejemplo se calculan las elasticidades de la demanda contenidas por tres de las funciones de utilidad que hemos usado. Aunque son demasiado simples para reflejar cómo los economistas estudian empíricamente la demanda, las posibilidades incorporadas en estas funciones señalan que en última instancia las elasticidades reflejan las preferencias de las personas. Una lección especialmente importante es mostrar por qué la variación en las elasticidades de la demanda entre bienes surge, probablemente, en su mayor parte a causa de las diferencias en la magnitud de los efectos de sustitución. Caso 1: Cobb-Douglas ( ⴝ 1). U(x, y) xy, donde 1. Las funciones de demanda derivadas de esta función de utilidad son I , px I (1 )I y( px , py , I) . py py x( px , py , I) La aplicación de las definiciones de elasticidad indica que ex, px ex, py x px x py ex, I px px I 2 x px I/px py py 0 0, x x 1, (5.47) x I I 1. I x px I/px Las elasticidades para el bien y adoptan valores similares. De ahí que las elasticidades asociadas con la función Cobb-Douglas sean constantes en todos los rangos de precios e ingreso y adopten valores espe- Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 168 Parte 2: Elección y demanda cialmente simples. Se puede demostrar fácilmente que estos obedecen las tres relaciones expuestas en la sección anterior, usando el hecho de que aquí sx y sy . Homogeneidad: ex, px ex, py ex, I 1 0 1 0. Agregación de Engel: sxex, I syey, I . 1 . 1 1. Agregación de Cournot: sxex, px syey, sxex, px (1) . 0 sx. También se puede usar la ecuación de Slutsky en forma de elasticidad (ecuación 5.40) para derivar la elasticidad precio compensada en este ejemplo: exc, px ex, px sxex, I 1 (1) 1 . (5.48) Aquí la elasticidad precio compensada para x depende de la importancia de otros bienes (y) en la función de utilidad. Caso 2: ESC ( ⴝ 2; ␦ ⴝ 0.5). U(x, y) x0.5 y0.5. En el ejemplo 4.2 se demostró que las funciones de demanda que pueden derivarse de esta función de utilidad son I , px (1 px py 1 ) I y( px , py , I) . py (1 px 1 py ) x( px , py , I) Como es lógico imaginar, calcular elasticidades directamente de estas funciones puede llevar algo de tiempo. Aquí nos ocuparemos sólo de la elasticidad precio y haremos uso del resultado (del problema 5.6) de que la “porción de elasticidad” de cualquier bien está dada por esx , sx px 1 ex, px sx sx px x 1 , I 1 px py 1 px (5.49) px . En este caso, por tanto que la elasticidad de porción es más fácil de calcular y está dada por esx, px py 1 sx px px px sx (1 px py 1 ) 2 (1 px py 1 ) 1 px py 1 1 px py 1 . (5.50) Debido a que las unidades en que se miden los bienes son, de hecho, arbitrarias en la teoría de la utilidad, también podríamos definirlas para que inicialmente px py, en cuyo caso7 obtenemos ex, px esx , px 1 1 1 1 1 1.5. (5.51) De ahí que la demanda sea más elástica en este caso que en el ejemplo de la función Cobb-Douglas. La razón de lo anterior es que el efecto de sustitución es mayor para esta versión de la función de utilidad ESC. Esto puede demostrarse aplicando nuevamente la ecuación de Slutsky (y usando los hechos de que ex,I 1 y sx 0.5): exc, px ex, px sxex, I 1.5 0.5(1) 1, (5.52) una magnitud del doble de la del efecto de sustitución para el caso de la función Cobb-Douglas. Caso 3: ESC ( ⴝ 0.5; ␦ ⴝ ⴚ1). U(x, y) x1 y1. En referencia al ejemplo 4.2 puede verse que la parte del bien x implicada por esta función de utilidad está dada por 7 Nótese que esta sustitución debe realizarse después de la diferenciación porque la definición de elasticidad requiere que cambiemos únicamente px mientras mantenemos constante py. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución sx 169 1 , 0:5 1 p0.5 y px de modo que la elasticidad de porción está dada por esx , px 1.5 0.5p0.5 px sx px y px 2 0.5 0.5 px sx (1 p0.5 ) (1 py px 0.5 ) y px 1 0.5 0.5p0.5 y px 0.5 1 p0.5 y px . (5.53) Si se adopta de nuevo la simplificación de precios iguales, la elasticidad precio puede calcularse como ex, px esx , px 1 0.5 2 1 0.75 (5.54) y la elasticidad precio compensada como exc, px ex, px sxex, I 0.75 0.5(1) 0.25. (5.55) Por tanto, para esta versión de la función de utilidad ESC, la elasticidad precio es menor que en los casos 1 y 2 porque el efecto de sustitución es menor. De ahí que la variación principal entre los casos sea provocada en realidad por diferencias en la magnitud del efecto de sustitución. Si quisieras no tener que resolver nuevamente este tipo de elasticidad podrías hacer uso del resultado general de que exc, px (1 sx). (5.56) Puedes querer comprobar que esta fórmula funciona en estos tres ejemplos (con sx 0.5 y 1, 2, 0.5, respectivamente), mientras que en el problema 5.9 se te pedirá demostrar que este resultado es por lo general cierto. Puesto que todos estos casos basados en la función de utilidad ESC tienen una elasticidad ingreso igual a la unidad, la elasticidad precio puede calcularse a partir de la elasticidad precio compensada, añadiendo simplemente sx a la cifra calculada en la ecuación 5.56. PREGUNTA: ¿A qué se debe que la porción presupuestal para bienes distintos de x (es decir, 1 sx) interviene, en este ejemplo, en las elasticidades precio compensadas? SUPERÁVIT DEL CONSUMIDOR Un problema importante de la economía del bienestar aplicada es el de idear una medida monetaria de los beneficios y pérdidas de utilidad que los individuos experimentan cuando varían los precios. Un uso para este tipo de medida es asignar un valor en dólares a la pérdida de bienestar que las personas experimentan cuando un mercado es monopolizado con precios que exceden los costos marginales. Otra aplicación consiste en medir los beneficios de bienestar que la gente experimenta cuando el progreso técnico reduce los precios que paga por los bienes. Aplicaciones similares se producen en la economía ambiental (para medir los costos de bienestar de los recursos a los cuales se les ha fijado un precio incorrecto), en leyes y economía (para evaluar los costos de bienestar de protecciones excesivas adoptadas por temor a juicios) y en la economía pública (para medir la carga excesiva de un impuesto). Con objeto de realizar estos cálculos los economistas usan datos empíricos de estudios de la demanda del mercado en combinación con la teoría que subyace en dicha demanda. En esta sección se examinarán las herramientas principales utilizadas en ese proceso. Bienestar del consumidor y función de gasto La función de gasto aporta el primer componente para el estudio de la relación precio/bienestar. Supongamos que se desea medir la variación en bienestar que experimenta un individuo, si el precio del bien x se incrementa de px0 a px1. Inicialmente, se requieren gastos de E(px0, py, U0) para alcanzar una utilidad de U0. Para alcanzar esa misma utilidad, una vez que el precio de x increReg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 170 Parte 2: Elección y demanda menta, esta persona requiere gastar al menos E(px1, py, U0). Por tanto, para compensar el incremento de precio se necesitará una compensación (formalmente llamada variación compensatoria8 o VC) de VC E(px1, py, U0) E(px0, py, U0). (5.57) Esta situación se muestra gráficamente en el panel superior de la figura 5.8. Esta figura indica la cantidad del bien cuyo precio ha variado en el eje horizontal y el gasto en todos los demás bienes (en dólares) en el eje vertical. Inicialmente, un individuo consume la combinación x0, y0 y obtiene una utilidad de U0. Cuando el precio de x se incrementa, se verá obligada a moverse a la combinación x2, y2 y sufrir una pérdida en utilidad. Si esta persona fuera compensada con poder de compra adicional de la cantidad VC, podría permitirse permanecer en la curva de indiferencia U0, pese al incremento de precio, eligiendo la combinación x1, y1. La distancia VC, en consecuencia, proporciona una medida monetaria de cuánto debe ser compensada esta persona por el incremento de precio. Uso de la curva de demanda compensada para mostrar la VC Lamentablemente, las funciones de utilidad de los individuos y sus mapas de curvas de indiferencia asociados no son directamente observables. Pero podemos avanzar en la medición empírica, determinando cómo la cantidad de VC puede mostrarse en la curva de demanda compensada en el panel inferior de la figura 5.8. El lema de Shephard indica que la función de demanda compensada de un bien se puede determinar directamente de la función de gasto por diferenciación: xc ( px , py , U) E( px , py , U) px . (5.58) De ahí que la compensación descrita en la ecuación 5.57 pueda determinarse, integrando en una secuencia de incrementos reducidos de precio de px0 a px1: p1x p1x p0x p0x E( px , py , U0 ) VC 3 dpx 3 xc ( px , py , U0 ) dpx px (5.59) al tiempo que se mantienen constantes py y la utilidad. La integral que se define en la ecuación 5.59 tiene una interpretación geométrica, la cual se muestra en el panel inferior de la figura 5.8: se trata del área sombreada a la izquierda de la curva de demanda compensada y delimitada por px0 y px1. Por tanto, el costo de bienestar de este incremento de precio también puede ilustrarse usando cambios en el área bajo la curva de demanda compensada. Concepto de superávit del consumidor Existe otra manera de examinar este asunto. Es posible preguntarse cuánto estaría dispuesta a pagar una persona por el derecho a consumir todo el bien que quiera al precio de mercado de px0 en lugar de quedarse por completo sin el bien. La curva de demanda compensada en el panel inferior de la figura 5.8 indica que si el precio de x se incrementara a px2 el consumo de esta persona decrecería a cero y requeriría una cantidad de compensación igual al área px2Apx0 para aceptar voluntariamente la variación. De este modo, el derecho a consumir x0 a un precio de px0 vale esta 8 Algunos autores definen la variación compensatoria como la cantidad de ingreso que se le debe dar a una persona para permitirle incrementar su utilidad de U1 a U0 dado el nuevo precio del bien x, esto es, VC E(px1, py, U0) E(px1, py, U1). Esta expresión es equivalente a la proporcionada en la ecuación 5.57 porque mediante supuestos E(px0, py, U0) E(px1, py, U1). Algunos autores también examinan la VC desde el punto de vista del presupuesto de un “planificador social”, que debe hacer estas compensaciones, más que desde el punto de vista del consumidor que las recibe. En este caso, la VC que se ilustra sería negativa. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución FIGURA 5.8 Demostración de la variación compensatoria. 171 Si el precio de x se incrementara de px0 a px1, una persona necesitaría gastos adicionales de VC para permanecer en la curva de indiferencia U0. La integración indica que VC también puede ser representada por el área sombreada bajo la curva de demanda compensada en el panel b). Gasto en otros bienes ($) E( px1, . . . ,U0) VC E( px1, . . . ,U0) E(px0, . . . ,U0) y1 y2 y0 U0 U1 x2 x1 x0 E( px0, . . . ,U0) Cantidad de x (a) Mapa de curvas de indiferencia Precio p x2 p x1 B p x0 A xc( px , . . . ,U0) x1 x0 (b) Curva de demanda compensada Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 Cantidad de x 8/23 172 Parte 2: Elección y demanda FIGURA 5.9 Efectos de bienestar de las variaciones de precio y curva de demanda de Marshall. La curva de demanda de Marshall (ingreso nominal constante) para el bien x es x(px, . . .). Además, xc(. . . , U0) y xc(. . . ,U1) denotan las curvas de demanda compensada asociadas con los niveles de utilidad experimentados cuando prevalecen, respectivamente, px0 y px1. El área a la izquierda de x(px, . . .) entre px0 y px1 está delimitada por las áreas similares a la izquierda de las curvas de demanda compensada. De ahí que para variaciones pequeñas de precio, el área a la izquierda de la curva de demanda de Marshall sea una buena medida de pérdida de bienestar. px p x1 C B A p x0 D x(px , . . . ) xc( . . . ,U0) . . ,U1) x c( . x1 x0 Cantidad de x por periodo cantidad para este individuo. Éste es el beneficio adicional que una persona recibe por ser capaz de hacer transacciones de mercado al precio de mercado prevaleciente. Este valor, dado por el área bajo la curva de demanda compensada y sobre el precio de mercado se denomina superávit del consumidor. Visto de esta manera, el problema de bienestar causado por un incremento en el precio de x puede describirse como una pérdida en el superávit del consumidor. Cuando el precio se incrementa de px0 a px1 el “triángulo” del superávit del consumidor decrece en magnitud de px2Apx0 a px2Bpx1. Como lo aclara la figura, esta es simplemente otra forma de describir la pérdida de bienestar representada en la ecuación 5.59. Cambios de bienestar y curva de demanda de Marshall Hasta aquí nuestro análisis de los efectos de bienestar respecto a las variaciones de precio se ha centrado en la curva de demanda compensada. Esto es lamentable en cierto sentido porque la mayor parte del trabajo empírico sobre la demanda estima en realidad curvas de demanda ordinaria (de Marshall). En esta sección se demostrará que estudiar los cambios en el área bajo una curva de demanda de Marshall puede ser, de hecho, una buena manera de medir pérdidas de bienestar. Consideremos la curva de demanda de Marshall x(px, . . .) que se ilustra en la figura 5.9. Inicialmente, este consumidor enfrenta el precio px0 y decide consumir x0. Este consumo produce un nivel de utilidad de U0, y la curva de demanda compensada inicial para x [es decir, xc(px, py, U0)] también pasa por el punto x0, px0 (el cual hemos denominado punto A). Cuando el precio se incrementa a px1 la demanda de Marshall del bien x decrece a x1 (punto C en la curva de demanda) y la utilidad de la persona también decrece a, digamos, U1. Hay otra curva de demanda compensada asociada con este nivel de utilidad más bajo, que igualmente se muestra en la figura 5.9. Tanto la Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 173 curva de demanda de Marshall como esta nueva curva de demanda compensada pasan por el punto C. La presencia de una segunda curva de demanda compensada en la figura 5.9 plantea una interesante pregunta conceptual. ¿Deberíamos medir la pérdida de bienestar causada por el incremento de precio, como lo hicimos en la figura 5.8, usando la variación compensatoria (VC) asociada con la curva de demanda compensada inicial (área px1BApx0), o quizá debemos usar esta nueva curva de demanda compensada y medir la pérdida de bienestar, como el área px1CDpx0? Una posible razón para usar el área bajo la segunda curva sería centrarnos en la situación de este individuo después del incremento de precio (con nivel de utilidad U1). Podríamos preguntarnos cuánto estaría dispuesto a pagar para ver que el precio regresa a sus antiguos niveles inferiores.9 La respuesta a lo anterior estaría dada por el área px1CDpx0. Por tanto, la decisión entre qué curva de demanda compensada utilizar se reduce a decidir qué nivel de utilidad se considera el objetivo apropiado de análisis. Por fortuna, la curva de demanda de Marshall proporciona un arreglo conveniente entre estas dos medidas. Dado que la magnitud del área entre ambos precios y bajo la curva de demanda de Marshall (área px1CApx0) es menor que la que se encuentra bajo la curva de demanda compensada basada en U0, pero mayor que la que se encuentra bajo la curva basada en U1, aquélla parece un punto medio atractivo. Por lo anterior esta será la medida de pérdidas de bienestar que usaremos principalmente en este libro. DEFINICIÓN Superávit del consumidor. El superávit del consumidor es el área bajo la curva de demanda de Marshall y sobre el precio de mercado. Muestra lo que un individuo pagaría por el derecho a hacer transacciones voluntarias a dicho precio. Se pueden usar las variaciones en el superávit del consumidor para medir los efectos de bienestar de las variaciones de precio. Debemos señalar que algunos economistas emplean VC o VE para calcular los efectos de bienestar de las variaciones de precio. En efecto, los economistas no siempre tienen claro qué medida de cambio de bienestar están usando. Nuestro análisis de la sección anterior demuestra que en realidad no hace mucha diferencia si los efectos de ingreso son reducidos en cualquier caso. EJEMPLO 5.6 Pérdida de bienestar causada por un incremento de precio Estas ideas pueden ilustrarse numéricamente volviendo a nuestro viejo ejemplo de hamburguesas/refrescos. Examinemos las consecuencias de bienestar de un incremento desmesurado del precio de los refrescos (bien x) de 1 a 4 dólares. En el ejemplo 5.3 se determinó que la demanda compensada del bien x estaba dada por xc ( px , py , V) Vp0.5 y p0.5 x (5.60) . Por tanto, el costo de bienestar del incremento de precio está dado por 4 4 0.5 0.5 VC 3xc ( px , py , V) dpx 3Vp0.5 dpx 2Vp0.5 y px y px 1 1 px 4 . (5.61) px 1 Esta medida alterna se denomina variación equivalente (VE). Más formalmente, VE E(px1, py, U1) E(px0, py, U1). Nuevamente, algunos autores usan una definición diferente de VE como el ingreso necesario para restaurar la utilidad, dados los precios antiguos, es decir VE E(px0, py, U0) E(px0, py, U1). Pero debido a que E(px0, py, U0) E(px1, py, U1) estas definiciones son equivalentes. 9 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 174 Parte 2: Elección y demanda Si se usan los valores que hemos asumido a lo largo de este festín gastronómico (V 2, py 4), entonces VC 2 . 2 . 2 . (4)0.5 2 . 2 . 2 . (1)0.5 8. (5.62) Esta cifra se reduciría a la mitad (4) si creyéramos que el nivel de utilidad después del incremento de precio (V 1) fuera el objetivo de utilidad más apropiado para medir la compensación. Si, en cambio, hubiéramos usado la función de demanda de Marshall x(px, py, I) 0.5Ipx1 , (5.63) la pérdida se calcularía como 4 4 4 pérdida 3x( px , py , I) dpx 30.5Ipx 1 dpx 0.5I ln px . 1 (5.64) 1 1 Así, con I 8, esta pérdida es pérdida 4 ln(4) 4 ln(1) 4 ln(4) 4 (1.39) 5.55, (5.65) lo que parece un arreglo razonable entre las dos medidas alternas basadas en funciones de demanda compensada. PREGUNTAS: En este problema, ninguna de las curvas de demanda tiene un precio finito en el que la demanda se dirija precisamente a cero. ¿Cómo afecta esto en el cálculo del superávit total del consumidor? ¿Afecta los tipos de cálculos de bienestar que hemos hecho aquí? PREFERENCIA REVELADA Y EFECTO DE SUSTITUCIÓN La principal predicción inequívoca que se puede derivar del modelo de optimización de la utilidad es que la pendiente (o elasticidad precio) de la curva de demanda compensada es negativa. Hemos demostrado este resultado de dos maneras. La primera prueba se basó en la cuasi concavidad de las funciones de utilidad; es decir, puesto que toda curva de indiferencia debe exhibir una TMS decreciente, cualquier cambio en un precio inducirá un cambio de cantidad en la dirección opuesta a lo largo de esa curva de indiferencia. Una segunda prueba se deriva del lema de Shephard: dado que la función de gasto es cóncava en los precios, la función de demanda compensada (la cual es la derivada de la función de gasto) debe tener una pendiente negativa. Nuevamente, la utilidad se mantiene constante en este cálculo como un argumento de la función de gasto. Para algunos economistas depender de una hipótesis sobre una función de utilidad no observable representaba un fundamento débil en el cual basar una teoría de la demanda. Un enfoque alterno que conduce al mismo resultado fue propuesto originalmente por Paul Samuelson, a fines de la década de 1940.10 Este enfoque, que Samuelson llamó teoría de la preferencia revelada, define un principio de racionalidad basado en el comportamiento observado y usa después este principio para aproximar una función de utilidad de un individuo. En este sentido, una persona que sigue el principio de racionalidad de Samuelson se comporta como si optimizara una función de utilidad apropiada y exhibiera un efecto de sustitución negativo. Puesto que el enfoque de Samuelson brinda discernimientos adicionales a nuestro modelo de decisiones de consumo, lo examinaremos brevemente. 10 Paul A. Samuelson, Foundations of Economic Analysis (Harvard University Press, Cambridge, 1947). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución FIGURA 5.10 Demostración del principio de racionalidad de la teoría de la preferencia revelada. 175 Con un ingreso I1 un individuo puede permitirse los puntos A y B. Si se selecciona A, entonces A es la preferencia revelada sobre B. Sería irracional que B fuera la preferencia revelada sobre A en otra configuración precio-ingreso. Cantidad de y ya A C B yb I2 I3 xa I1 xb Cantidad de x Enfoque gráfico El principio de racionalidad de la teoría de la preferencia revelada es tal como sigue: considérense dos conjuntos de bienes, A y B. Si, a ciertos precios y nivel de ingreso un individuo puede permitirse A y B pero elige A, se dice que A es la “preferencia revelada” sobre B. El principio de racionalidad establece que en cualquier disposición distinta precio-ingreso, B nunca puede ser la preferencia revelada sobre A. Si, de hecho, B es elegida en otra configuración precio-ingreso ha de deberse a que no pudo permitirse A. Este principio es ilustrado en la figura 5.10. Supongamos que, cuando la restricción presupuestal está dada por I1 se elige el punto A, aunque B también podía haberse comprado. Entonces, A es la preferencia revelada sobre B. Si para otra restricción presupuestal, de hecho, se elige B este debe ser un caso como el representado por I2, donde A no pudo comprarse. Si se eligiera B cuando la restricción presupuestal es I3, sería una violación del principio de racionalidad porque con I3 pueden comprarse A y B. Con la restricción presupuestal I3 es probable que algún punto diferente de A o B (digamos C) sea comprado. Nótese cómo este principio usa reacciones observables a las restricciones presupuestales alternativas para clasificar mercancías en vez de suponer la existencia de una función de utilidad. Nótese, asimismo, cómo este principio ofrece un atisbo de por qué las curvas de indiferencia son convexas. Pasemos ahora a una comprobación formal. Negatividad del efecto de sustitución Supongamos que un individuo es indiferente entre dos paquetes, C (compuesto por xC y yC) y D (compuesto por xD y yD). Sean pxC, pCy los precios en los que se elige el paquete C, y pxD, pDy los precios en los que se elige el paquete D. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 176 Parte 2: Elección y demanda Puesto que el individuo es indiferente entre C y D, debe ser el caso de que cuando se elige C, D cuesta al menos tanto como C: pxCxC pCy yC pxCxD pCy yD. (5.66) Un enunciado similar es válido cuando se elige D: pxDxD pDy yD pxDxC pDy yC. (5.67) Reescribir estas ecuaciones da pxC(xC xD) pCy (yC yD) 0, (5.68) pxD(xD xC) pDy (yD yC) 0. (5.69) Sumar estas produce (pxC pxD)(xC xD) (pCy pDy )(yC yD) Supongamos ahora que lo único que cambia es el precio de x, y que (pxC pxD)(xC xD) (5.70) 0. pCy pDy . Entonces, (5.71) 0. Pero la ecuación 5.71 indica que precio y cantidad se mueven en la dirección opuesta cuando la utilidad se mantiene constante (recuérdese que los paquetes C y D son igualmente atractivos). Este es justamente el enunciado sobre la naturaleza no positiva del efecto de sustitución: xc ( px , py , V) px x px 0. (5.72) Uconstante Hemos llegado al resultado mediante un método que no requiere la existencia de una función de utilidad cuasi cóncava. Resumen En este capítulo se usó el modelo de optimización de la utilidad para estudiar cómo la cantidad de un bien que un individuo elige responde a variaciones en el ingreso o en el precio de ese bien. El resultado final de este examen es la derivación de la conocida curva de demanda de pendiente negativa. Para llegar a este resultado, sin embargo, extrajimos una amplia variedad de discernimientos de la teoría económica general de la elección. • Variaciones proporcionales en todos los precios y el ingreso no hacen que se desplace la restricción presupuestal de una persona y, por tanto, no varían las cantidades de bienes elegidas. En términos formales, las funciones de demanda son homogéneas de grado 0 en todos los precios y el ingreso. • Cuando la capacidad del poder de compra varía (es decir, cuando el ingreso se incrementa con precios que se mantienen sin cambios) las restricciones presupuestales se desplazan y los individuos elegirán nuevos conjuntos de bienes. Para bienes normales un incremento en el poder de compra provoca que se elija más. En el caso de los bienes inferiores, en cambio, un incremento en el poder de compra propicia que se adquiera menos. De ahí que el signo de xi/I puede ser positivo o negativo, aunque xi/I 0 es el caso más común. • Un decremento en el precio de un bien produce efectos de sustitución y de ingreso que, para un bien normal, hacen que se compre más del bien. Para los bienes inferiores, sin embargo, los efectos de sustitución e ingreso operan en direcciones opuestas, y no es posible hacer predicciones inequívocas. • De igual forma, un incremento en el precio induce efectos tanto de sustitución como de ingreso que, en el caso normal, generan que se demande menos. Para los bienes inferiores el resultado neto es, nuevamente, ambiguo. • Las curvas de demanda de Marshall representan descripciones bidimensionales de funciones de demanda para las cuales sólo el propio precio varía; los demás precios y el ingreso se mantienen constantes. Variaciones en estas otras variables usualmente harán que se desplace la posición de la curva de demanda. El signo de la pendiente de la curva de demanda de x( px , py , I) Marshall es teóricamente ambiguo porque los px efectos de sustitución e ingreso pueden operar en direcciones opuestas. La ecuación de Slutsky permite un estudio formal de esta ambigüedad. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución • Las funciones de demanda compensada (o de Hicks) muestran cómo las cantidades demandadas son funciones de todos los precios y de la utilidad. La función de demanda compensada para un bien puede generarse diferenciando parcialmente la función de gasto respecto al precio de ese bien (lema de Shephard). • Las curvas de demanda compensada (o de Hicks) representan descripciones bidimensionales de funciones de demanda compensada para las cuales sólo el propio precio varía; los demás precios y la utilidad se mantienen constantes. El signo de la xc ( px , py , U) pendiente de la curva de demanda compensada px es inequívocamente negativo, debido a la cuasi concavidad de las funciones de utilidad o a la concavidad conexa de la función de gasto. • Las elasticidades de la demanda suelen usarse en el trabajo empírico para sintetizar cómo reaccionan los individuos a las variaciones en precios e ingreso. La más importante de estas elasticidades es la elasticidad precio de la demanda, ex, px. Esta mide la variación proporcional en cantidad en respuesta a un cambio de 1 por ciento en precio. Una elasticidad similar 177 puede definirse para los movimientos a lo largo de la curva de demanda compensada. • Existen muchas relaciones entre las elasticidades de la demanda. Algunas de las más importantes son: 1) las elasticidades precio determinan cómo un cambio de precio afecta el gasto total en un bien, 2) los efectos de sustitución e ingreso pueden compendiarse en la ecuación de Slutsky en forma elástica, y 3) varias relaciones de agregación privan entre elasticidades y muestran cómo se relacionan entre sí las demandas de bienes diferentes. • Con las áreas cambiantes bajo las curvas de demanda compensada o de la demanda de Marshall pueden medirse los efectos de bienestar de las variaciones de precio. Tales variaciones afectan la magnitud del superávit del consumidor que los individuos reciben si tienen la capacidad de hacer transacciones de mercado. • La negatividad del efecto de sustitución es la conclusión básica de la teoría de la demanda. Este resultado puede demostrarse usando la teoría de la preferencia revelada, así que no requiere suponer la existencia de ninguna función de utilidad. Problemas 5.1 El sediento Ed sólo bebe agua pura de manantial, pero puede adquirirla en dos envases de diferente tamaño: de 0.75 y de 2 litros. Como el agua en sí misma es idéntica, considera estos dos “bienes” como sustitutos perfectos. a. Supón que la utilidad de Ed sólo depende de la cantidad de agua consumida y que los envases mismos no ofrecen ninguna utilidad. Expresa esta función de utilidad en términos de cantidades de envases de 0.75 litros (x) y de envases de 2 litros (y). b. Formula la función de demanda de Ed para x en términos de px , py e I. c. Grafica la curva de demanda de x, manteniendo constantes I y py. d. Las variaciones en I y py ¿cómo hacen que se desplace la curva de demanda de x? e. ¿Cómo sería la curva de demanda compensada de x en esta situación? 5.2 A David N. se le asignan $3 a la semana para gastar como le plazca. Dado que sólo le gustan los emparedados de crema de cacahuate y mermelada, gasta la cantidad entera en crema de cacahuate (a $0.05 la onza) y mermelada (a $0.10 la onza). El pan es provisto sin costo por un vecino muy considerado. David es un consumidor especial y hace sus emparedados con exactamente 1 onza de mermelada y 2 de crema de cacahuate. Es de hábitos firmes por lo que nunca varía estas proporciones. a. b. c. d. e. ¿Cuánta crema de cacahuate y mermelada comprará David en una semana con su asignación de $3? Supón que el precio de la mermelada aumenta a $0.15 la onza. ¿Cuánto comprará de cada mercancía? ¿Cuánto debería aumentar la asignación de David para compensar el incremento en el precio de la mermelada del inciso b)? Grafica tus resultados de los incisos a) a c). ¿En qué sentido este problema implica únicamente un solo producto: emparedados de crema de cacahuate y mermelada? Grafica la curva de demanda de este producto único. f. Analiza los resultados de este problema en términos de los efectos de ingreso y de sustitución implicados en la demanda de mermelada. 5.3 Como se definió en el capítulo 3, una función de utilidad es homotética si cualquier línea recta a través del origen cruza todas las curvas de indiferencia en puntos de igual pendiente: la TMS depende de la razón y/x. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 178 Parte 2: Elección y demanda a. Comprueba que, en este caso, x/I es constante. b. Comprueba que, si los gustos de un individuo pueden representarse mediante un mapa de indiferencia homotética, precio y cantidad deben moverse en direcciones opuestas; es decir, comprueba que no puede ocurrir la paradoja de Giffen. 5.4 Igual que en el ejemplo, 5.1, supón que la utilidad está dada por utilidad U(x, y) x0.3y0.7. a. Usa las funciones de demanda no compensada que aporta el ejemplo 5.1 para calcular la función de utilidad indirecta y la función de gasto de este caso. b. Usa la función de gasto calculada en el inciso a) junto con el lema de Shephard para calcular la función de demanda compensada del bien x. c. Usa los resultados del inciso b) junto con la función de demanda no compensada del bien x para demostrar que la ecuación de Slutsky es válida para este caso. 5.5 Supón que la función de utilidad de los bienes x y y está dada por utilidad U(x, y) xy y. a. Calcula las funciones de demanda no compensada (de Marshall) de x y y, y describe cómo las curvas de demanda de x y y son desplazadas por las variaciones en I o en el precio de otro bien. b. Calcula la función de gasto de x y y. c. Usa la función de gasto calculada en el inciso b) para calcular las funciones de demanda compensada de los bienes x y y. Describe cómo las curvas de demanda compensada de x y y son desplazadas por las variaciones en el ingreso o por las variaciones en el precio del otro bien. 5.6 A lo largo de un periodo de tres años un individuo exhibe el comportamiento de consumo siguiente: px py x y Año 1 3 3 7 4 Año 2 4 2 6 6 Año 3 5 1 7 3 ¿Es congruente este comportamiento con los axiomas de la preferencia revelada? 5.7 Supón que una persona considera complementarios puros el jamón y el queso; siempre usará una rebanada de jamón con una rebanada de queso para hacer un emparedado. Supón también que el jamón y el queso son los únicos bienes que esta persona compra, pues el pan es gratis. a. Si el precio del jamón es igual al del queso demuestra que la elasticidad precio de la demanda de jamón es de 0.5 y que la elasticidad cruzada de la demanda de jamón respecto al precio del queso también es de 0.5. b. Explica por qué los resultados del inciso a) sólo reflejan efectos de ingreso y no efectos de sustitución. ¿Cuáles son las elasticidades precio compensadas en este problema? c. Usa los resultados del inciso b) para mostrar cómo cambiarían tus respuestas del inciso a) si el costo de una rebanada de jamón fuera del doble del precio de una rebanada de queso. d. Explica cómo podría resolverse intuitivamente este problema, suponiendo que la persona consume sólo un bien: un emparedado de jamón y queso. 5.8 d ln E Demuestra que la parte del ingreso que se gasta en un bien x es sx d ln px, donde E es el gasto total. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución 179 Problemas analíticos 5.9 Porción de elastidades En las extensiones del capítulo 4 se demostró que casi todo el trabajo empírico en la teoría de la demanda se centra en porciones del ingreso. Para cualquier bien, x, la porción del ingreso se define como sx pxx/I. En este problema se demostrará que la mayoría de las elasticidades de la demanda pueden derivarse de porciones de elasticidades correspondientes. a. Demuestra que la elasticidad de la porción presupuestal de un bien respecto al ingreso (esx, I sx /I . I/sx) es igual a ex, I 1. Interpreta esta conclusión con algunos ejemplos numéricos. b. Demuestra que la porción de elasticidad presupuestal de un bien respecto a su precio (esx, px sx /px . px/sx) es igual a ex, px 1. Nuevamente, interpreta este hallazgo con algunos ejemplos numéricos. c. Usa tus resultados en el inciso b) para demostrar que la “elasticidad gasto” del bien x respecto a su precio [ex . px, px (px . x)/px . 1/x] también es igual a ex, px 1. d. Demuestra que la porción de elasticidad presupuestal de un bien respecto a una variación en el precio de otro (esx, py sx /py . py/sx) es igual a ex, py. e. En las extensiones del capítulo 4 se demostró que con una función de utilidad ESC, la parte del ingreso dedicada al bien x está dada por sx 1/(1 pykpxk), donde k /( 1) 1 . Usa esta ecuación de porción para comprobar la ecuación 5.56: exc, px (1 sx). Pista: Este problema puede simplificarse suponiendo que px py, en cuyo caso sx 0.5. 5.10 Más sobre elasticidades El inciso e) del problema 5.9 tiene un número de aplicaciones útiles porque demuestra cómo las respuestas al precio dependen, en última instancia, de los parámetros subyacentes de la función de utilidad. Usa, específicamente, ese resultado junto con la ecuación de Slutsky en términos de elasticidad para demostrar que: a. En el caso de la función Cobb-Douglas ( 1), la relación siguiente es válida entre las elasticidades precio de x y y: ex, px ey, py 2. b. Si 1, entonces ex, px ey, py 2, y si 1, entonces ex, px ey, py 2. Ofrece una explicación intuitiva de este resultado. c. ¿Cómo generalizarías este resultado a casos de más de dos bienes? Analiza si esa generalización será especialmente significativa. 5.11 Agregación de elasticidades de muchos bienes Las tres relaciones de agregación que se presentaron en este capítulo pueden generalizarse a cualquier número de bienes. En este problema se te pedirá hacer eso. Supón que hay n bienes y que la parte del ingreso dedicada al bien i está denotada por si. Definimos asimismo las elasticidades siguientes: ei, I ei, j xi I I xi xi pj pj xi , . Utilice esta notación para demostrar: n a. Homogeneidad: j1 ei, j ei, I 0. n b. Agregación de Engel: i1 si ei, I 1. n c. Agregación de Cournot: i1 si ei, j sj. 5.12 Utilidad cuasi lineal (revisitada) Considera una función de utilidad cuasi lineal simple de la forma U(x, y) x ln y. a. b. c. d. Calcula el efecto de ingreso para cada bien. Calcula igualmente la elasticidad de ingreso de la demanda de cada bien. Calcula el efecto de sustitución para cada bien. Calcula también la elasticidad de precio compensada de la demanda de cada bien. Demuestra que la ecuación de Slutsky se aplica a esta función. Demuestra que la forma de elasticidad de la ecuación de Slutsky también se aplica a esta función. Describe las características especiales que observes. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 180 Parte 2: Elección y demanda 5.13 Sistema de demanda casi ideal La forma general para la función de gasto del sistema de demanda casi ideal (SDCI) está dada por n ln E( p1 , . . . , pn , U) a0 i1 i ln pi 1 2 n n k ij i1 j1 ln pi ln pj U 0 i 1 pk k , Por facilidad analítica supón que se aplican las restricciones siguientes: n ij ji , n i 1, i1 y j1 n ij k 0. k1 a. Deriva la forma funcional SDCI para un caso de dos bienes. b. Dadas las restricciones previas demuestra que esta función de gasto es homogénea de grado 1 en todos los precios. Esto, junto con el hecho de que esta función se parece mucho a los datos reales, la convierte en una función “ideal”. d ln E c. Usando el hecho de que sx d ln px (véase el problema 5.8) calcula la parte del ingreso de cada uno de los dos bienes. 5.14 Curvas de indiferencia al precio Las curvas de indiferencia al precio son curvas de isoutilidad con los precios de dos bienes en los ejes X y Y, respectivamente. Así, tienen la forma general siguiente: (p1, p2) v(p1, p2, I) v0. a. Deriva la fórmula para las curvas de indiferencia al precio del caso de función Cobb-Douglas con 0.5. Traza una de ellas. b. ¿Qué demuestra la pendiente de esa curva? c. ¿Cuál es la dirección de utilidad creciente en tu gráfica? Sugerencias de lecturas adicionales Cook, P. J. “A ‘One Line’ Proof of the Slutsky Equation”, American Economic Review, núm. 62 (marzo de 1972), p. 139. Samuelson, Paul A. Foundations of Economic Analysis, Harvard University Press, Cambridge, 1947, capítulo 5. Ingenioso uso de la dualidad para derivar la ecuación de Slutsky; usa el mismo método que en el capítulo 5, pero con notación algo compleja. Brinda un completo análisis de los efectos de sustitución e ingreso. Desarrolla asimismo la noción de preferencia revelada. Fisher, F. M. y K. Shell. The Economic Theory of Price Indices, Academic Press, Nueva York, 1972. Silberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001. Análisis técnico completo de las propiedades económicas de varios índices de precios; describe en detalle índices “ideales” basados en modelos de maximización de la utilidad. Aporta una derivación amplia de la ecuación de Slutsky y una extensa presentación de conceptos de elasticidad. Luenberger, D. G. Microeconomic Theory, McGraw Hill, Nueva York, 1992. Sydsaetter, K., A. Strom y P. Berck. Economist’s Mathematical Manual, Springer-Verlag, Berlín, 2003. Las páginas 147-151 ofrecen un conciso resumen de cómo formular la ecuación de Slutsky en notación matricial. Ofrece una síntesis compacta de los conceptos de elasticidad. La cobertura de nociones de elasticidad de sustitución es especialmente completa. Mas-Colell, Andreu, Michael D. Whinston y Jerry R. Green. Microeconomic Theory, Oxford University Press, 1995. Varian, H. Microeconomic Analysis, 3a. ed., W. W. Norton, Nueva York, 1992. El capítulo 3 cubre gran parte del material de este capítulo en un nivel un poco elevado. La sección I sobre la medición de los efectos de bienestar de las variaciones de precio es especialmente recomendable. Desarrollo formal de nociones de preferencia. Amplio uso de funciones de gasto y su relación con la ecuación de Slutsky. También contiene una buena prueba de la identidad de Roy. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Conceptos de demanda y evaluación de índices de precios En los capítulos 4 y 5 se presentaron diversos conceptos de demanda relacionados entre sí, todos los cuales se derivaron del modelo subyacente de maximización de la utilidad. Las relaciones entre esos diversos conceptos se resumen en la figura E5.1. En esta tabla se examina formalmente la mayoría de esos vínculos, pero aún no se ha analizado la relación matemática entre funciones de utilidad indirecta y funciones de demanda de Marshall (identidad de Roy), lo que se hará a continuación. Todas las entradas de la tabla dejan en claro que existen muchas maneras de saber algo sobre la relación entre el bienestar de los individuos y los precios que enfrentan. En esta extensión se exploran algunos de esos enfoques. Específicamente, se considera la forma en que estos conceptos pueden arrojar luz sobre la precisión del índice de precios EXTENSIONES al consumidor (IPC), la principal medida de la inflación en Estados Unidos. Se examinarán asimismo otros conceptos de índice de precios. El IPC es un índice de “canasta básica” del costo de la vida. Los investigadores miden los montos que las personas consumen de una serie de bienes en un periodo base (en el caso de dos bienes, estos niveles de consumo en el periodo base podrían denotarse con x0 y y0) y después usan datos de precios corrientes para calcular las variaciones de precio en esa canasta básica. Usando este procedimiento, el costo de la canasta básica sería inicialmente I0 px0x0 py0y0 y el costo en el periodo 1 sería I1 px1x0 py1y0. El cambio en el costo de la vida entre estos dos periodos se mediría entonces con I1/I0. Aunque este procedimiento es una manera FIGURA E5.1 Relaciones entre conceptos de demanda. Primordial Dual Maximizar U(x, y) s.t. I = px x + pyy Minimizar E(x, y) s.t. U = U(x, y) Función de utilidad indirecta U′ = V(px, py, I) Inversas Identidad de Roy Lema de Shephard Demanda de Marshall ∂V ∂px x(px, py, I) = − ∂V ∂I Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. Función de gasto E′ = E(px, py, U) Demanda compensada xc(px, py, U) = 23.08.2019 ∂E ∂px 8/23 182 Parte 2: Elección y demanda intuitivamente verosímil de medir la inflación y aunque los índices de precios de la canasta básica son de uso muy frecuente, tales índices presentan muchas deficiencias. E5.1 Funciones de gasto y sesgo de sustitución Los índices de precios de la canasta básica sufren de “sesgo de sustitución”. Puesto que los índices no permiten a los individuos hacer sustituciones en la canasta básica, en respuesta a las variaciones en precios relativos, tienden a exagerar las pérdidas de bienestar de la gente a causa del aumento de precios. Esta exageración se muestra en la figura E5.2. Alcanzar el nivel de utilidad U0 requiere, inicialmente, gastos de E0, lo que resulta en una compra de la canasta x0, y0. Si px/py decrece el nivel de utilidad inicial puede obtenerse ahora con gastos de E1, alterando el paquete de consumo por x1, y1. Al calcular el nivel de gasto necesario para continuar consumiendo x0, y0 se exagera cuánto poder de compra extra necesita una persona para restaurar su nivel de bienestar. Los economistas han estudiado extensamente el grado de este FIGURA E5.2 Sesgo de sustitución en el IPC. sesgo de sustitución. Aizcorbe y Jackman (1993), por ejemplo, determinan que esta dificultad con el índice de la canasta básica puede exagerar el nivel de inflación mostrado por el IPC en aproximadamente 0.2 por ciento al año. E5.2 Identidad de Roy y sesgo de bienes nuevos Cuando se introducen bienes nuevos pasa un poco de tiempo antes de ser integrados en el IPC. Por ejemplo, Hausman (1999, 2003) afirma que los teléfonos celulares tardaron más de 15 años en aparecer en el índice. El problema de esta demora es que los índices de canasta básica no reflejarán las ganancias de bienestar que experimentan las personas por el uso de bienes nuevos. Para medir estos costos, Hausman intentó medir un precio “virtual” (p∗) en el que la demanda de, digamos, teléfonos celulares fuera de cero y después argumentó que la introducción de ese bien a su precio de mercado representaba un cambio en el superávit del consumidor, susceptible de ser medido. De ahí que este autor haya enfrentado el problema de cómo pasar de la función de demanda Inicialmente los gastos están dados por E0, y la persona compra x0, y0. Si px/py decrece, el nivel de utilidad U0 puede alcanzarse a menor costo consumiendo x1, y1 y gastando E1. Comprar x0, y0 a los nuevos precios costaría más que E1. Por tanto, mantener constante el paquete de consumo impone un sesgo ascendente a los cálculos tipo IPC. Cantidad de y E0 y0 E1 U0 x0 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. x1 Cantidad de x 23.08.2019 8/23 Capítulo 5: Efectos de ingreso y de sustitución de Marshall de los teléfonos celulares (la cual estimó econométricamente) a la función de gasto. Para hacerlo usó la identidad de Roy (véase Roy, 1942). Recuérdese que el problema de maximización de la utilidad del consumidor puede representarse con la expresión lagrangiana ᏸ U(x, y) (I pxx pyy). Si se aplica a esta expresión el teorema de la envolvente, se sabe que U ᏸ x px , py , I , px px U ᏸ . I I (i) Por tanto, la función de demanda de Marshall está dada por x( px , py , I) U /px . U /I (ii) Usando estas estimaciones de la función de demanda de Marshall, Hausman integró la ecuación ii para obtener la función de utilidad indirecta implicada y después calculó su inversa, la función de gasto (consúltese la figura E5.1 para ver la lógica de este proceso). Aunque éste es, sin duda, un procedimiento indirecto produjo grandes estimaciones de la ganancia en bienestar del consumidor procedente de los teléfonos celulares, un valor presente en 1999 de más de 100 mil millones de dólares. Entonces las demoras en la inclusión de esos bienes en el IPC pueden resultar en una medida engañosa del bienestar del consumidor. E5.3 Otras quejas sobre el IPC Los investigadores han descubierto también otras fallas del IPC en su versión actual. La mayoría de ellas se centra en las consecuencias de usar precios incorrectos para calcular el índice. Por ejemplo, cuando la calidad de un bien aumenta, la gente se halla en mejores condiciones aun cuando esto no aparece en el precio del bien. En las décadas de 1970 y 1980 la confiabilidad de los televisores a color mejoró drásticamente, pero su precio no cambió mucho. Una canasta básica que incluyera “un televisor a color” habría dejado de lado esta fuente de mayor bienestar. De igual modo la inauguración de grandes almacenes como Costco y Home Depot, durante la década de 1990, redujo indudablemente los precios que los consumidores pagaban por diversos bienes. Sin embargo, la inclusión de estos nuevos establecimientos en el esquema muestral del IPC tardó varios años, así que el índice tergiversó lo que la gente pagaba en realidad. La evaluación de la magnitud del error introducido por estos casos en los que se usan precios incorrectos en el IPC también puede hacerse usando los diversos conceptos de demanda de la figura E5.1. Para un resumen de estas investigaciones véase Moulton (1996). E5.4 Índices de precios exactos En principio es posible que algunas de las deficiencias de los índices de precios como el IPC se superen con una atención más cuidadosa a la teoría de la demanda. Si se conociera la función de gasto del consumidor representativo, por ejemplo, podría elaborarse un índice “exacto” de los cambios en el poder de compra que tomara en cuenta la sustitución de mercancías. Para ilustrar esto, supongamos que sólo hay dos bienes y que se desea saber cómo ha 183 cambiado el poder de compra entre el periodo 1 y el periodo 2. Si la función de gasto está dada por E(px, py, U), entonces la razón I1,2 E( p2x , p2y , U) (iii) E( p1x , p1y , U) muestra cómo el costo de alcanzar el nivel de utilidad objetivo U ha cambiado entre los dos periodos. Si, por ejemplo, I1,2 1.04 se diría que el costo de alcanzar el objetivo de utilidad aumentó 4 por ciento. Desde luego que esta respuesta es únicamente conceptual. Sin conocer la función de utilidad de la persona representativa, ignoraríamos la forma específica de la función de gasto. Pero en algunos casos la ecuación iii puede sugerir cómo proceder en la elaboración del índice. Supongamos, por ejemplo, que las preferencias de la persona típica pudieran representarse con la función de utilidad Cobb-Douglas U(x, y) xy1. En este caso es fácil demostrar que la función de gasto es una generalización de la que ofrece el ejemplo 4.4: E(px, py, U) pxpy1 U/(1 )1 kpxpy1 U. Insertar esta función en la ecuación iii produce I 1,2 k(p2x ) (p2y ) 1 k(p1x ) (p1y ) 1 U U (p2x ) (p2y ) 1 (p1x ) (p1y ) 1 . (iv) Así, en este caso, el índice de precios exacto es una función relativamente simple de los precios observados. La característica particularmente útil de este ejemplo es que el objetivo de utilidad se elimina en la elaboración del índice del costo de la vida (como ocurrirá siempre que la función de gasto sea homogénea en la utilidad). Nótese también que las porciones de gasto ( y 1 ) desempeñan un papel importante en el índice: cuanto mayor sea la porción de un bien, más importantes serán las variaciones de precio de dicho bien en el índice final. E5.5 Desarrollo de índices de precios exactos La función de utilidad Cobb-Douglas es, por supuesto, muy simple. Muchas investigaciones recientes sobre los índices de precios se han centrado en tipos más generales de funciones de utilidad y en el descubrimiento de los índices de precios exactos que implican. Por ejemplo, Feenstra y Reinsdorf (2000) señalan que el sistema de demanda casi ideal, descrito en las extensiones del capítulo 4, implica un índice de precios exacto (I) que adopta una forma “Divisia”: n ln(I) wi ln pi (v) i1 (aquí wi son ponderaciones por atribuir al cambio en el logaritmo del precio de cada bien). A menudo, las ponderaciones en la ecuación v se interpretan como las porciones presupuestales de los bienes. Curiosamente, éste es justo el índice de precios implicado por la función de utilidad Cobb-Douglas en la ecuación iv, porque ln(I 1, 2 ) ln p2x (1 ln p1x ) ln p2y 1 ln px (1 )ln p1y (vi) ) ln py . En aplicaciones reales las ponderaciones cambiarían de un periodo a otro en reflejo de las porciones presupuestales cambiantes. De Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 184 Parte 2: Elección y demanda igual forma, los cambios a lo largo de varios periodos se “encadenarían” a partir de distintos índices de cambio de precios de un solo periodo. Cambios en la demanda de alimentos en China China tiene una de las economías de más rápido crecimiento del mundo: actualmente su PIB per capita crece a una tasa de aproximadamente 8 por ciento al año. Los consumidores chinos gastan, asimismo, una gran fracción de su ingreso en alimentos, aproximadamente 38 por ciento del gasto total, según datos recientes. Una implicación del rápido crecimiento del ingreso en China, sin embargo, es que los patrones de consumo de alimentos están cambiando aceleradamente. Las compras de productos básicos como arroz o trigo han reducido su importancia relativa, mientras que las compras de aves, pescado y alimentos procesados aumentan rápidamente. En un artículo de Gould y Villarreal (2006) se estudian en detalle esos patrones, usando el modelo SDCI. Estos autores identifican diversos efectos de sustitución en categorías específicas de alimentos, en respuesta a las variaciones en sus precios relativos. Estos patrones cambiantes implican que un índice fijo de precios de la canasta básica (como el índice de precios al consumidor de Estados Unidos) sería particularmente inadecuado para medir cambios en el costo de la vida en China y que deberían examinarse otros métodos. Referencias Aizcorbe, Ana M. y Patrick C. Jackman. “The Commodity Substitution Effect in CPI Data, 1982-91”, Monthly Labor Review (diciembre de 1993), pp. 25-33. Feenstra, Robert C. y Marshall B. Reinsdorf. “An Exact Price Index for the Almost Ideal Demand System”, Economics Letters (febrero de 2000), pp. 159-162. Gould, Brain W. y Héctor J. Villarreal. “An Assessment of the Current Structure of Food Demand in Urban China”, Agricultural Economics (enero de 2006), pp. 1-6. Hausman, Jerry. “Cellular Telephone, New Products, and the CPI”, Journal of Business and Economic Statistics (abril de 1999), pp. 188-194. Hausman, Jerry. “Sources of Bias and Solutions to Bias in the Consumer Price Index”, Journal of Economics Perspectives (invierno de 2003), pp. 23-44. Moulton, Brent R. “Bias in the Consumer Price Index: What Is the Evidence?”, Journal of Economics Perspectives (otoño de 1996), pp. 159-177. Roy, R. De l’utilité, contribution á la théorie des choix, Hermann, París, 1942. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO SEIS Relaciones de demanda entre bienes En el capítulo 5 se examinó cómo las variaciones de precio de un bien particular (digamos el bien x) afectan la cantidad elegida de ese bien. En el análisis se mantuvieron constantes los precios de todos los demás bienes. Debería quedar claro, sin embargo, que una variación en uno de esos otros precios también podría afectar la cantidad elegida de x. Por ejemplo, si se entiende que x representa la cantidad de millas que un individuo recorre en automóvil, es de esperar que esta cantidad decrezca cuando el precio de la gasolina se incrementa, o aumente cuando el precio de viajar en avión o autobús se incrementa. En este capítulo se usará el modelo de optimización de la utilidad para estudiar dichas relaciones. EL CASO DE DOS BIENES Iniciaremos nuestro estudio de las relaciones de demanda entre bienes con el caso de dos bienes. Lamentablemente, este caso resulta ser poco interesante porque los tipos de relaciones que pueden ocurrir cuando sólo hay dos bienes son limitados. Aun así, el caso de dos bienes es útil, ya que dos ejemplos de cómo la cantidad elegida de x podría verse afectada mediante un cambio en el precio de y py ha decrecido. Esto desplaza la restricción presupuestal hacia fuera, de I0 a I1. En ambos casos la cantidad elegida del bien y también se ha incrementado de y0 a y1 a raíz del decremento en py, como sería de esperar si y es un bien normal. En cuanto al bien x de indiferencia tienen casi forma de L, lo cual implica un efecto de sustitución muy pequeño. Un decremento en py no induce un movimiento grande a lo largo de U0 cuando y es sustituida por x. Es decir, x se reduce relativamente poco a raíz de la sustitución. El efecto de ingreso, sin embargo, x se incremente. De ahí que x/ py sea negativa (x y py se mueven en direcciones opuestas). x/ py es positiva. Las curvas de indiferencia relatipy. La cantidad de x decrece marcadamente cuando y es sustituida por x a lo largo de U0. Tal como en la py provoca que se compre más de x, pero ahora el efecto de sustitución predomina y la cantidad de x decrece a x1. En este caso, x y py se mueven entonces en la misma dirección. Tratamiento matemático La ambigüedad en el efecto de las variaciones en py puede ilustrarse adicionalmente con una ecuación tipo Slutsky. Usando procedimientos similares a los del capítulo 5 es muy simple demostrar que 187 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 188 Parte 2: Elección y demanda FIGURA 6.1 Diferentes direcciones de efectos cruzados. En ambos paneles, el precio de y ha decrecido. En a) los efectos de sustitución son pequeños; así, la cantidad consumida de x se incrementa junto con y. Puesto que x/py 0, x y y son complementarios brutos. En b) los efectos de sustitución son grandes; así, la cantidad elegida de x decrece. Dado que x/py 0, x y y se denominan sustitutos brutos. Cantidad de y Cantidad de y I1 I1 I0 I0 y1 y1 y0 U1 U0 y0 U1 U0 x 0 x1 Cantidad de x x1 x 0 a) Complementarios brutos Cantidad de x b) Sustitutos brutos x(px , py , I) efecto de sustitución efecto de ingreso py x py y Uconstante (6.1) x , I o, en términos de elasticidad, ex, py exc , py sy ex, I . (6.2) Nótese que la magnitud del efecto de ingreso está determinada por la porción del bien y en las compras de una persona. El impacto de una variación en py sobre el poder de compra está determinado por lo importante que es y para este individuo. Para el caso de dos bienes, los términos del miembro derecho de las ecuaciones 6.1 y 6.2 tienen diferentes signos. Suponiendo que las curvas de indiferencia son convexas, el efecto de sustitución x/py|U constante es positivo. Si nos limitamos a movimientos a lo largo de una curva de indiferencia, incrementos en py incrementan x y decrementos en py hacen decrecer la cantidad de x elegida. Sin embargo, suponiendo que x es un bien normal, el efecto de ingreso (yx/I o syex, I) es claramente negativo. De ahí que el efecto combinado sea ambiguo; x/py podría ser positiva o negativa. Aun en el caso de dos bienes la relación de demanda entre x y py es algo compleja. EJEMPLO 6.1 Otra descomposición de Slutsky para efectos cruzados En el ejemplo 5.4 se examinó la descomposición de Slutsky para el efecto de una variación en el precio de x. Ahora se considerará el efecto cruzado de una variación en los precios de y sobre las compras de x. Recuérdese que las funciones de demanda no compensada y compensada para x están dadas por Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 6: Relaciones de demanda entre bienes x (px , py , I ) 0:5I px 189 (6.3) y 0.5 xc ( px , py , V) Vp0.5 . y px (6.4) Como ya se señaló, la función de demanda de Marshall en este caso produce x/py 0; es decir, las variaciones en el precio de y no afectan las compras de x. Ahora se demostrará que esto ocurre porque los efectos de sustitución y de ingreso de una variación de precio están equilibrados. El efecto de sustitución en este caso está dado por x py Uconstante xc 0.5Vpy 0.5 px 0.5 . py (6.5) Al sustituir V a partir de la función de utilidad indirecta (V 0.5Ipy0.5px0.5) se obtiene un enunciado final para el efecto de sustitución: x py 0.25Ipy 1 px 1 . (6.6) U constante Volviendo a la función de demanda de Marshall para y(y 0.5Ipy1), calcular el efecto de ingreso produce y x I 0.5Ipy 1 0.5px 1 0.25Ipy 1 px 1 , (6.7) y combinar las ecuaciones 6.6 y 6.7 da el efecto total de variación en el precio de y como x 0.25Ipy 1 px 1 py 0.25Ipy 1 px 1 0. (6.8) Esto deja en claro que la razón de que las variaciones en el precio de y no tengan ningún efecto en las compras de x en el caso de la función Cobb-Douglas, es porque los efectos de sustitución e ingreso de esa variación se neutralizan con exactitud; ninguno de los efectos en particular, sin embargo, es de cero. Para volver a nuestro ejemplo numérico (px 1, py 4, I 8, V 2), supóngase ahora que py disminuye a 2. Esto no debería tener ningún efecto en la demanda de Marshall del bien x. La función de demanda compensada en la ecuación 6.4 indica que la variación de precio provocaría que la cantidad demandada de x decreciera de 4 a 2.83 ( 22) cuando y es sustituida por x con la utilidad sin cambios. No obstante, el poder de compra aumentado debido al decremento en el precio invierte este efecto con toda precisión. PREGUNTAS: ¿Por qué sería incorrecto argüir que si x/py 0, entonces x y y no tienen posibilidades de sustitución (es decir, deben consumirse en proporciones fijas)? ¿Existe algún caso en el cual se podría llegar a esta conclusión? SUSTITUTOS Y COMPLEMENTARIOS En el caso de una gran cantidad de bienes hay mucho mayor margen para relaciones interesantes entre ellos. Es relativamente fácil generalizar la ecuación de Slutsky para dos bienes cualesquiera xi, xj como xi ( p1 , . . . , pn , I ) xi pj pj xj U constante xi , I (6.9) y, nuevamente, esto puede traducirse fácilmente en una relación de elasticidad: ei, j eci, j sj ei, I . (6.10) Lo anterior indica que el cambio en el precio de cualquier bien (el bien j en este caso) induce efectos de ingreso y de sustitución que pueden cambiar la cantidad demandada de cada bien. Las Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 190 Parte 2: Elección y demanda ecuaciones 6.9 y 6.10 pueden usarse para analizar la idea de sustitutos y complementarios. Intuitivamente, estas ideas son más bien simples. Dos bienes son sustitutos si, a raíz de un cambio en las condiciones, uno de ellos puede reemplazar en uso al otro. Algunos ejemplos son té y café, hamburguesas y hot dogs, mantequilla y margarina. Los complementarios, por otro lado, son bienes que “van juntos”, como café y crema, pescado y papas fritas o brandy y puros. En cierto sentido, los “sustitutos” se reemplazan entre sí en la función de utilidad, mientras que los “complementarios” se complementan entre sí. Hay dos maneras de precisar estas ideas intuitivas. Una se centra en los efectos “brutos” de las variaciones de precio, incluyendo los efectos tanto de ingreso como de sustitución; la otra atiende sólo los efectos de sustitución. Dado que usaremos ambas definiciones, examinemos en detalle cada una de ellas. Sustitutos y complementarios brutos (de Marshall) Que dos bienes sean sustitutos o complementarios puede establecerse en referencia a las reacciones observadas respecto al precio, como sigue. DEFINICIÓN Sustitutos y complementarios brutos. Se dice que dos bienes, xi y xj, son sustitutos brutos si xi 0 pj (6.11) xi 0 pj (6.12) y complementarios brutos si Es decir, dos bienes son sustitutos brutos si un incremento en el precio de uno de ellos provoca que se compre más del otro bien. Los bienes son complementarios brutos si un incremento en el precio de uno de ellos hace que se adquiera menos del otro bien. Por ejemplo, si el precio del café se incrementa, es de esperar que la demanda de té aumente (son sustitutos), en tanto que la demanda de crema podría decrecer (café y crema son complementarios). La ecuación 6.9 deja en claro que es una definición “bruta” en cuanto que incluye los efectos tanto de ingreso como de sustitución, procedentes de las variaciones de precio. Puesto que estos efectos, de hecho, están combinados en cualquier observación de la realidad que podamos hacer, sería razonable siempre hablar sólo de sustitutos “brutos” y complementarios “brutos”. Asimetría de las definiciones brutas Sin embargo, hay varios detalles indeseables en las definiciones brutas de sustitutos y complementarios. El más importante es que las definiciones no son simétricas. Es posible, por efecto de las definiciones, que x1 sea un sustituto de x2 y que al mismo tiempo x2 sea un complementario de x1. La presencia de efectos de ingreso puede producir resultados paradójicos. Veamos un ejemplo específico. EJEMPLO 6.2 Asimetría en efectos cruzados Supongamos que la función de utilidad para dos bienes (x y y) tiene la forma cuasi lineal U(x, y) ln x y. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (6.13) 8/23 Capítulo 6: Relaciones de demanda entre bienes 191 Establecer la expresión lagrangiana ᏸ ln x y (I px x py y) (6.14) genera las siguientes condiciones de primer orden: ᏸ 1 x x ᏸ 1 y ᏸ I px 0, py 0, (6.15) py y 0. px x El traslado de los términos en a la derecha y la división de la primera ecuación entre la segunda produce 1 px , x py (6.16) px x py . (6.17) La sustitución en la restricción presupuestal permite ahora despejar y en la función de demanda de Marshall: I px x py y py py y. (6.18) De ahí que y I py py . (6.19) Esta ecuación indica que un incremento en py debe hacer decrecer el gasto en el bien y (es decir, pyy). Así, debido a que px e I se mantienen sin variación, el gasto en x debe incrementarse. Por tanto, x 0, py (6.20) y denominaríamos a x y y sustitutos brutos. Por otro lado, la ecuación 6.19 muestra que el gasto en y es independiente de px. En consecuencia, y 0 px (6.21) y, visto de esta manera, se diría que x y y son independientes entre sí; no son ni sustitutos brutos ni complementarios brutos. Basarse en las respuestas brutas a las variaciones de precio para definir la relación entre x y y nos llevaría a la ambigüedad. PREGUNTA: En el ejemplo 3.4 se demostró que una función de utilidad de la forma dada por la ecuación 6.13 no es homotética. La TMS no depende sólo de la razón de x con y. ¿Puede surgir asimetría en el caso homotético? SUSTITUTOS Y COMPLEMENTARIOS NETOS (DE HICKS) Debido a las posibles asimetrías implicadas en la definición de sustitutos y complementarios netos, suele usarse una definición alterna centrada exclusivamente en los efectos de sustitución. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 192 Parte 2: Elección y demanda DEFINICIÓN Sustitutos y complementarios netos. Se dice que los bienes xi y xj son sustitutos netos si xi pj U constante xi pj U constante 0 (6.22) 0. (6.23) y complementarios netos si Estas definiciones1 entonces sólo consideran los términos de sustitución para determinar si dos bienes son sustitutos y complementarios. Esta definición es intuitivamente atractiva (porque sólo considera la forma de una curva de indiferencia) y teóricamente deseable (porque es inequívoca). Una vez que se ha descubierto que xi y xj son sustitutos, permanecen como tales, sin importar en qué dirección se aplique la definición. En la práctica las definiciones son simétricas: xi pj U constante xj pi . (6.24) U constante El efecto de sustitución de una variación en pi sobre el bien xj es idéntico al efecto de sustitución de una variación en pj sobre la cantidad de xi elegida. Esta simetría es importante en el trabajo teórico y empírico.2 Las diferencias entre las definiciones de sustitutos y complementarios son fáciles de demostrar en la figura 6.1a. En esa figura, x y y son complementarios brutos pero sustitutos netos. La derivada x/py resulta ser negativa (x y y son complementarios brutos) porque el efecto de sustitución (positivo) es rebasado por el efecto de ingreso (negativo) (un decremento en el precio de y causa que el ingreso real se incremente en alto grado y que, en consecuencia, las compras reales de x se incrementen también). Sin embargo, como lo deja ver claramente la figura, si sólo hay dos bienes entre los cuales elegir deben ser sustitutos netos, aunque puedan ser sustitutos brutos o complementarios brutos. Debido a que se ha supuesto una TMS decreciente, el efecto de sustitución del precio debe ser negativo y, en consecuencia, el efecto de sustitución cruzado debe ser positivo. 1 También se les llama sustitutos y complementarios de Hicks, en honor al economista británico John Hicks quien desarrolló originalmente las definiciones. 2 Esta simetría es fácil de demostrar usando el lema de Shephard. Las funciones de demanda compensada pueden calcularse a partir de las funciones de gasto por diferenciación: xic (p1 , . . . , pn , V) E(p1 , . . . , pn , V) . pi De ahí que el efecto de sustitución esté dado por xi pj U constante xci 2E Eij . pj pj pi Pero ahora podemos aplicar el teorema de Young a la función de gasto: Eij Eji xjc pi xj pi , U constante lo que comprueba la simetría. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 6: Relaciones de demanda entre bienes 193 SUSTITUIBILIDAD CON MUCHOS BIENES Una vez que el modelo de optimización de la utilidad se extiende a muchos bienes, se vuelve posible una amplia variedad de patrones de demanda. Que un par de bienes en particular sean sustitutos netos o complementarios netos depende básicamente de las preferencias de una persona; así, podrían observarse toda suerte de relaciones. Un importante dato teórico de interés para los economistas es saber cuál es más frecuente, si la sustitución o la complementariedad. En la mayoría de los análisis se tiende a considerar los bienes como sustitutos (un incremento de precio en un mercado tiende a incrementar la demanda en la mayoría de los demás mercados). Sería conveniente saber si esta intuición se justifica. El economista británico John Hicks estudió este tema con cierto detalle hace más de 70 años y llegó a la conclusión de que en su “mayoría” los bienes deben ser sustitutos. Este resultado se resume en lo que se conoce como segunda ley de la demanda de Hicks.3 Una comprobación moderna comienza con la función de demanda compensada para un bien particular: xci(p1,…, pn, V). Esta función es homogénea de grado 0 en todos los precios (si la utilidad se mantiene constante y los precios se duplican, las cantidades demandadas no varían porque las tangencias de optimización de la utilidad tampoco lo hacen). Aplicar el teorema de Euler a esa función produce p1 xci xci p2 p1 p2 pn xci 0. pn (6.25) Este resultado puede formularse en términos de elasticidad dividiendo la ecuación 6.25 entre xi: eci1 eci2 Pero sabemos que ecii caso de que ecin 0. (6.26) 0 debido a la negatividad del efecto de sustitución. De ahí que deba ser el ecij 0. (6.27) j i Es decir, la suma de todas las elasticidades cruzadas, compensadas para un bien particular, debe ser positiva (o de cero). Es en este sentido que la “mayoría” de los bienes son sustitutos. La evidencia empírica parece, en general, congruente con este hallazgo teórico: en los estudios empíricos de la demanda se encuentran relativamente con menos frecuencia casos de complementariedad neta entre bienes. BIENES COMPUESTOS Nuestro análisis en la sección anterior demostró que las relaciones de demanda entre bienes pueden ser complicadas. En el caso más general, un individuo que consume n bienes tendrá funciones de demanda que reflejen n(n 1)/2 efectos de sustitución diferentes.4 Cuando n es grande (como lo es sin duda para todos los bienes específicos que realmente consumen las personas) este caso general puede ser inmanejable. A menudo es mucho más conveniente agrupar los bienes en agregados más extensos como alimentos, ropa, vivienda, etcétera. En el nivel extremo de agregados se podría querer examinar un bien específico (digamos gasolina), que puede llamarse x, y su 3 Véase John Hicks, Value and Capital (Oxford University Press, Oxford, 1939), apéndices matemáticos. Existe cierto debate acerca de si este resultado debería llamarse segunda o tercera ley de Hicks. De hecho, otras dos leyes, que ya hemos visto, son enlistadas por Hicks: 1) xci /pi 0 (negatividad del efecto de sustitución) y 2) xci /pj xcj/pi (simetría de efectos de sustitución cruzados). Sin embargo, en el resumen por escrito de sus resultados, él mismo se refiere explícitamente a sólo dos “propiedades”. 4 Para ver esto nótese que todos los efectos de sustitución, sij, podrían registrarse en una matriz n n. Sin embargo, la simetría de los efectos (sij sji) implica que sólo los términos sobre y bajo la diagonal principal de esta matriz pueden ser diferentes entre sí. Esto equivale a la mitad de los términos de la matriz (n2/2) más la mitad restante de los términos en la diagonal principal de la matriz (n/2). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 194 Parte 2: Elección y demanda relación con “todos los demás bienes”, que pueden llamarse y. Este es el procedimiento que hemos usado en algunas de nuestras gráficas bidimensionales, y seguiremos haciéndolo así en muchos otros apartados de este libro. En esta sección se mostrarán las condiciones en las cuales este procedimiento puede defenderse. En las extensiones de este capítulo se exploran cuestiones más generales que tienen que ver con la agregación de bienes en grupos más extensos. Teorema de los bienes compuestos Supóngase que los consumidores eligen entre n bienes pero sólo nos interesa específicamente uno de ellos, digamos x1. En general, la demanda de x1 dependerá de los precios particulares de los otros n 1 bienes. Pero si todos estos precios se mueven juntos, podría tener sentido agruparlos en un solo “bien compuesto”, y. Formalmente, si se concede que p02,…, p0n representan los precios iniciales de estos bienes, entonces suponemos que dichos precios sólo pueden variar juntos. Podrán duplicarse todos, o decrecer todos 50 por ciento, pero los precios relativos de x2,…, xn no variarán. Definamos ahora el bien compuesto y como los gastos totales en x2,…, xn, usando los precios iniciales p02,…, p0n: y p02x2 p03x3 … p0nxn. (6.28) La restricción presupuestal inicial de esta persona está dada por I p1x1 p02x2 … p0nxn p1x1 y. (6.29) Por efecto de nuestra suposición, todos los precios p2,…, pn varían al mismo tiempo. Supóngase que todos estos precios varían por un factor de t(t 0). Ahora la restricción presupuestal es I p1x1 tp02x2 … tp0nxn p1x1 ty. (6.30) En consecuencia, el factor de proporcionalidad, t, desempeña en la restricción presupuestal de este individuo la misma función que el precio de y (py) en nuestro análisis anterior de dos bienes. Variaciones en p1 o en t promueven los mismos tipos de efectos de sustitución que hemos analizado. Mientras p2,…, pn se muevan juntos, podemos limitar nuestro examen de la demanda a decisiones entre comprar x1 o comprar “todo lo demás”.5 Así, las gráficas simplificadas que presentan estos dos bienes en sus ejes pueden defenderse rigurosamente, siempre y cuando se satisfagan las condiciones del “teorema de bienes compuestos” (es decir, que todos los demás precios se mueven juntos). Adviértase, sin embargo, que este teorema no hace predicciones sobre el comportamiento de las decisiones de x2,…, xn; estas no necesitan moverse al mismo tiempo. El teorema se centra únicamente en el gasto total en x2,…, xn, no en la forma en que se distribuye este gasto entre artículos específicos (aunque se supone que dicha distribución se hace a modo de optimizar la utilidad). Generalizaciones y limitaciones El teorema de los bienes compuestos se aplica a cualquier grupo de bienes cuyos precios relativos se mueven juntos. Es posible tener más de uno de esos bienes si hay varios grupos que obedecen este teorema (es decir, gastos en “alimentos”, “ropa”, etcétera). De ahí que hayamos desarrollado la definición siguiente. Esta definición y el teorema asociado son resultados eficaces. Ayudan a simplificar muchos problemas que, de otra forma, serían irresolubles. Aun así, se debe tener cuidado al aplicar este 5 La idea de un bien compuesto también fue presentada por J. R. Hicks en Value and Capital, 2a. ed. (Oxford University Press, Óxford, 1946), pp. 312-313. La prueba de este teorema se basa en la noción de que para alcanzar una utilidad óptima la razón de las utilidades marginales para x2, . . . , xn debe permanecer sin cambios cuando todos los p2, . . . , pn se mueven juntos. De ahí que el problema de n bienes pueda reducirse al problema bidimensional de igualar la razón de la utilidad marginal de x con la de y a la “razón de precio” p1/t. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 6: Relaciones de demanda entre bienes DEFINICIÓN 195 Bien compuesto. Un bien compuesto es un grupo de bienes, cuyos precios en su totalidad se mueven juntos. Estos bienes pueden tratarse como un solo “bien” en cuanto que el individuo se comporta como si eligiera entre otros bienes y el gasto total en el grupo compuesto entero. teorema en la realidad porque sus condiciones son muy estrictas. Hallar una serie de bienes cuyos precios se mueven juntos es raro. Ligeras desviaciones de la estricta proporcionalidad pueden negar el teorema de los bienes compuestos, si los efectos de sustitución cruzada son grandes. En las extensiones de este capítulo se examinan formas de simplificar situaciones en las que los precios se mueven independientemente. EJEMPLO 6.3 Costos de vivienda como bien compuesto Supongamos que un individuo recibe utilidad de tres bienes: alimentos (x), servicios de vivienda (y) medidos en cientos de pies cuadrados y operaciones domésticas (z) medidas por uso de electricidad. Si su utilidad está dada por la función ESC de tres bienes 1 x utilidad U(x, y, z 1 y 1 , z (6.31) se puede usar la técnica de Lagrange para calcular las funciones de demanda de Marshall para estos bienes como x I , px px py px pz y I , py py px py pz z I . pz pz px pz py (6.32) Si inicialmente I 100, px 1, py 4 y pz 1, entonces las funciones de demanda predicen x 25, y 12.5, z 25. (6.33) De ahí que 25 se gaste en alimentos y 75 en necesidades relacionadas con la vivienda. Si suponemos que los precios de los servicios de vivienda (py) y los precios de las operaciones domésticas (pz) siempre se mueven juntos, podemos usar los precios iniciales para definir el “bien compuesto” vivienda (h) como h 4y 1z. (6.34) Aquí también definimos (arbitrariamente) como 1 el precio inicial de vivienda (ph). La cantidad inicial de vivienda es simplemente el total de dólares gastados en h: h 4(12.5) 1(25) 75. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (6.35) 8/23 196 Parte 2: Elección y demanda Además, debido a que py y pz siempre se mueven juntos, ph siempre estará relacionado con estos precios por ph pz 0.25py . (6.36) Usando esta información puede recalcularse la función de demanda para x como función de I, px, y ph: I px 4px ph px ph I . py 3 px ph x (6.37) De nueva cuenta, inicialmente I 100, px 1 y ph 1; por tanto, x* 25. El gasto en vivienda puede calcularse más fácil a partir de la restricción presupuestal como h* 75 porque el gasto en vivienda representa “todo” lo que no es alimentos. Incremento en los costos de vivienda. Si los precios de y y z se incrementaran proporcionalmente a py 16, pz 4 (con px sin variar en 1), entonces ph también se incrementaría a 4. La ecuación 6.37 predice ahora que la demanda de x decrecería a x 100 100 7 1 3 4 (6.38) y que las compras por concepto de vivienda estarían dadas por ph h 100 100 600 , 7 7 (6.39) o, debido a que ph 4, h 150 . 7 (6.40) Adviértase que este es justo el nivel de compras por concepto de vivienda predicho por las funciones de demanda originales para los tres bienes en la ecuación 6.32. Con I 100, px 1, py 16 y pz 4, estas ecuaciones pueden resolverse como 100 , 7 100 , y 28 100 z , 14 x (6.41) así que la cantidad total consumida del bien compuesto “vivienda” (de acuerdo con la ecuación 6.34) está dada por h 4y 1z 150 . 7 (6.42) De ahí que obtengamos las mismas respuestas a variaciones de precio independientemente de si elegimos examinar la demanda de los tres bienes x, y y z o considerar sólo las decisiones entre x y el bien compuesto h. PREGUNTAS: ¿Cómo saber que la función de demanda de x en la ecuación 6.37 continúa garantizando la optimización de la utilidad? ¿Por qué el problema lagrangiano de optimización restringida se mantiene sin variación al hacer las sustituciones representadas por la ecuación 6.36? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 6: Relaciones de demanda entre bienes 197 PRODUCCIÓN DOMÉSTICA, ATRIBUTOS DE LOS BIENES Y PRECIOS IMPLÍCITOS Hasta aquí, en este capítulo, nos hemos concentrado en lo que los economistas pueden saber sobre las relaciones entre bienes, observando el cambiante consumo de los individuos de estos bienes en reacción a las variaciones de los precios en el mercado. En cierto sentido este análisis elude la pregunta central de por qué el café y la crema van juntos o por qué el pescado y el pollo pueden sustituirse entre sí en la dieta de una persona. Para desarrollar una comprensión más profunda de estas cuestiones los economistas han tratado de explorar actividades dentro de los hogares de los individuos. Es decir, han ideado modelos no mercantiles de tipos de actividades como la atención de los hijos por parte de los padres, la preparación de alimentos, o el bricolaje o “hágalo usted mismo” para entender cómo estas actividades resultan, en última instancia, en demandas de bienes en el mercado. En esta sección se revisarán brevemente algunos de dichos modelos. El objetivo principal es ilustrar algunas de las implicaciones de este enfoque para la teoría tradicional de la elección. Modelo de producción doméstica El punto de partida para la mayoría de los modelos de producción doméstica es suponer que los individuos no reciben utilidad directamente de los bienes que adquieren en el mercado (como hemos supuesto hasta aquí). En cambio, sólo cuando la gente combina los bienes del mercado con aportaciones de tiempo es que se generan productos generadores de utilidad. Desde este punto de vista la carne cruda de res y las papas sin cocer no rinden ninguna utilidad hasta que se cocinan juntas para preparar un guiso. De igual forma, las adquisiciones mercantiles de carne de res y papas sólo pueden entenderse examinando las preferencias de guisos de una persona y la tecnología subyacente para su preparación. En términos formales, supongamos nuevamente que hay tres bienes que un individuo podría adquirir en el mercado: x, y y z. Adquirir estos bienes no brinda ninguna utilidad directa, pero pueden ser combinados para generar uno de dos bienes de producción doméstica: a1 o a2. La tecnología de esta producción doméstica puede ser representada por las funciones de producción f1 y f1 (véase el capítulo 9 para un análisis más completo del concepto de función de producción). Así, a1 f1 (x, y, z), a2 f2 (x, y, z), (6.43) utilidad U(a1, a2) (6.44) y El objetivo de un individuo es elegir x, y, z para optimizar su utilidad sujeta a las restricciones de producción y a una restricción presupuestal financiera:6 pxx pyy pzz I. (6.45) Aunque no examinaremos en detalle los resultados que pueden derivarse de este modelo general, cabe mencionar dos discernimientos que pueden extraerse de él. Primero, este modelo puede ayudar a esclarecer la naturaleza de las relaciones de mercado entre los bienes. Puesto que las funciones de producción en las ecuaciones 6.43 son, en principio, mensurables usando datos detallados sobre las operaciones domésticas, las familias pueden ser tratadas como empresas “multiproductos” y ser estudiadas usando muchas de las técnicas que emplean los economistas para analizar la producción. Un segundo discernimiento provisto por el enfoque de producción doméstica es la noción de los precios “implícitos” o “sombra” asociados a los bienes de producción doméstica a1 y a2. Debido 6 A menudo, la teoría de la producción doméstica también se centra en la asignación de tiempo que hace una persona para producir a1 y a2 o para trabajar en el mercado. En el capítulo 16 se analizan algunos modelos simples de este tipo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 198 Parte 2: Elección y demanda a que consumir más de a1, por decir algo, requiere el uso de más de los “ingredientes” x, y y z, esta actividad tiene obviamente un costo de oportunidad en términos de la cantidad de a2 que se puede producir. Para producir más pan, por ejemplo, una persona no sólo debe disponer de algo de harina, leche y huevos para preparar pastelillos, sino que también tiene que alterar las cantidades relativas de adquisición de estos bienes porque está limitada por una restricción presupuestal general. De ahí que el pan tenga un precio implícito en términos del número de pastelillos a los que se debe renunciar para poder consumir una hogaza más. Ese precio implícito se reflejará no sólo en los precios de mercado de los ingredientes del pan, sino también en la tecnología disponible para la producción doméstica y, en modelos más complejos, en las aportaciones relativas de tiempo requeridas para producir ambos bienes. Como punto de partida, sin embargo, la noción de precios implícitos puede ilustrarse inmejorablemente con un modelo simple. Modelo de atributos lineales Una forma particularmente simple del modelo de producción doméstica fue desarrollada originalmente por K. J. Lancaster para examinar los “atributos” subyacentes de los bienes.7 En este modelo son los atributos de los bienes los que brindan utilidad a los individuos, y cada bien específico contiene un conjunto fijo de atributos. Si, por ejemplo, nos fijamos únicamente en las calorías (a1) y vitaminas (a2) que aportan diversos alimentos, el modelo de Lancaster supone que la utilidad es una función de estos atributos y que los individuos adquieren diversidad de alimentos sólo con el propósito de obtener las calorías y vitaminas que estos ofrecen. En términos matemáticos, este modelo supone que las ecuaciones de “producción” tienen la forma simple a1 a1x x a1y y a1z z, a2 a2x x a2y y a2z z, (6.46) donde a1x representa el número de calorías por unidad del alimento x, a2x representa el número de vitaminas por unidad del alimento x, y así sucesivamente. En esta forma del modelo no hay ninguna “producción” real en el hogar. Más bien, el problema de decisión es cómo elegir una dieta que provea la combinación óptima de calorías y vitaminas, dado el presupuesto alimentario disponible. Ilustración de las restricciones presupuestales Para iniciar nuestro examen de la teoría de la elección conforme al modelo de atributos, ilustraremos primero la restricción presupuestal. En la figura 6.2 el radio 0x registra las diversas combinaciones de a1 y a2 disponibles de cantidades sucesivamente mayores del bien x. Debido a la tecnología de producción lineal supuesta en el modelo de los atributos estas combinaciones de a1 y a2 se tienden a lo largo de una línea recta, aunque en modelos más complejos de producción doméstica ése podría no ser el caso. De igual forma, los radios de 0y y 0z muestran las cantidades de los atributos a1 y a2 provistas por diversas cantidades de los bienes y y z que podrían adquirirse. Si esta persona gasta todo su ingreso en el bien x, la restricción presupuestal (ecuación 6.45) permite la adquisición de I (6.47) x , px y esto producirá a1 I a1 a1x x x , px (6.48) 2 a I a2 a2x x x . px 7 Véase K. J. Lancaster, “A New Approach to Consumer Theory”, Journal of Political Economy, núm. 74 (abril de 1966), pp. 132-157. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 6: Relaciones de demanda entre bienes 199 Los puntos x*, y* y z* indican las cantidades de los atributos a1 y a2 que es posible adquirir comprando sólo x, y o z, respectivamente. El área sombreada muestra todas las combinaciones que se pueden comprar con conjuntos mixtos. Algunos individuos pueden optimizar su utilidad en E, y otros en E'. FIGURA 6.2 Optimización de la utilidad en el modelo de atributos. a2 x U′0 a*2 y x* E′ y* z E U0 z* 0 a*1 a1 Este punto se registra como punto x* en el radio 0x de la figura 6.2. De igual manera, los puntos y* y z* representan las combinaciones de a1 y a2 que se obtendrían si todo el ingreso se gastara en el bien y o en el bien z, respectivamente. Conjuntos obtenibles de a1 y a2 adquiriendo tanto x como y (con un presupuesto fijo) son representados por la línea que une a x* y y* en la figura 6.2.8 De igual modo, la línea x* z* representa las combinaciones de a1 y a2 disponibles de x y z, y la línea y* z* muestra las combinaciones disponibles de la mezcla de y y z. Todas las combinaciones posibles de la mezcla de los tres bienes del mercado están representadas por el área triangular sombreada x* y* z*. Soluciones de esquina Un hecho salta inmediatamente a la vista en la figura 6.2: un individuo optimizador de su utilidad nunca consumiría cantidades positivas de los tres bienes. Sólo el perímetro noreste del triángulo x* y* z* representa las cantidades máximas de a1 y a2 a disposición de este individuo, dados su ingreso y los precios de los bienes del mercado. Individuos con una preferencia por a1 tendrán curvas de indiferencia similares a U0 y optimizarán su utilidad eligiendo un punto como E. La combinación de a1 y a2 especificada por ese punto puede obtenerse consumiendo sólo los bienes y y z. De la misma manera, una persona con preferencias representadas por la curva de indiferencia U0ʹ elegirá el punto Eʹ y consumirá sólo los bienes x y y. Así, el modelo de atributos predice que las soluciones de esquina en las cuales los individuos consumen cero cantidades de algunos bienes 8 Matemáticamente, supongamos que una fracción del presupuesto se gasta en x y (1 ) en y; entonces, a1 a1xx* (1 )a1yy*, a1 a2xx* (1 )a2yy*. La línea x*y* se traza permitiendo que triangular x*y*z*. varíe entre 0 y 1. Las líneas x*z* y y*z* se trazan en forma similar, lo mismo que el área Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 200 Parte 2: Elección y demanda relativamente comunes, especialmente en casos en que los individuos adjudican valor a menos atributos (dos aquí) que a los bienes del mercado entre los cuales elegir (tres). Si el ingreso, los precios o las preferencias varían, los patrones de consumo también podrían variar abruptamente. Los bienes previamente consumidos podrían dejar de comprarse y bienes previamente omitidos podrían experimentar un incremento significativo en adquisiciones. Esto es resultado directo de los supuestos lineales inherentes a las funciones de producción que hemos asumido aquí. En los modelos de producción doméstica con supuestos de mayor sustitución, esas reacciones discontinuas son menos probables. Resumen En este capítulo se usó el modelo de elección de optimización de la utilidad para estudiar relaciones entre bienes de consumo. Aunque estas relaciones pueden ser complejas, el análisis que presentamos aquí ofrece varias maneras de clasificarlas y simplificarlas. • Cuando hay sólo dos bienes los efectos de ingreso y de sustitución de la variación en el precio de un bien (digamos py) sobre la demanda de otro bien (x) suelen operar en direcciones opuestas. Así, el signo de x/py es ambiguo: su efecto de sustitución es positivo pero su efecto de ingreso, negativo. • En casos de más de dos bienes las relaciones de demanda pueden especificarse de dos maneras. Dos bienes xi y xj son “sustitutos brutos” si xi/pj 0 y “complementarios brutos” si xi/pj 0. Lamentablemente, y debido a que estos efectos de precio incluyen efectos de ingreso, no tienen que ser simétricos. Es decir, xi/pj no necesariamente es igual a xj/pi. • Atender únicamente los efectos de sustitución de variaciones de precio elimina esta ambigüedad porque los efectos de sustitución son simétricos; esto es, xci/pj xcj/pi. Ahora, dos bienes se definen como sustitutos netos (o de Hicks) si xci/pj 0 y como complementarios netos si xci/pj 0. La “segunda ley de la demanda” de Hicks demuestra que los sustitutos netos son más frecuentes. • Si un grupo de bienes tiene precios que siempre se mueven al mismo tiempo, los gastos en esos bienes pueden tratarse como un bien “compuesto” cuyo “precio” está dado por la magnitud de la variación proporcional en los precios de los bienes compuestos. • Otra forma de desarrollar la teoría de la elección entre bienes de mercado es atender los modos en que estos se usan en la producción doméstica para ofrecer atributos aportadores de utilidad lo cual puede brindar discernimientos adicionales sobre las relaciones entre bienes. Problemas 6.1 Heidi recibe utilidad de dos bienes: leche de cabra (m) y strudel (s), de acuerdo con la función de utilidad U(m, s) m . s. a. Demuestra qué incrementos en el precio de la leche de cabra no afectarán la cantidad de strudel que Heidi compra; es decir, que s/pm 0. b. Demuestra asimismo que m/ps 0. c. Usa la ecuación de Slutsky y la simetría de los efectos de sustitución neta para comprobar que los efectos de ingreso implicados en las derivadas de los incisos a) y b) son idénticos. d. Comprueba el inciso c), usando explícitamente las funciones de demanda de Marshall para m y s. 6.2 Burt el Correoso compra únicamente whisky de garrafa y donas con mermelada para mantenerse. Para él, el whisky de garrafa es un bien inferior que exhibe la paradoja de Giffen; aunque ese tipo de whisky y las donas con mermelada son sustitutos de Hicks en el sentido tradicional. Desarrolla una explicación intuitiva para sugerir por qué un incremento en el precio del whisky de garrafa debe generar que se compren menos donas con mermelada. Es decir, estos bienes deben ser complementarios brutos. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 6: Relaciones de demanda entre bienes 201 6.3 Donaldo, un frugal estudiante de posgrado, sólo consume café (c) y pan tostado con mantequilla (bt). Compra estos productos en la cafetería de la universidad y siempre usa dos porciones de mantequilla por cada rebanada de pan. Donaldo gasta exactamente la mitad de su magro estipendio en café y la otra mitad en pan tostado con mantequilla. a. En este problema el pan tostado con mantequilla puede tratarse como un bien compuesto. ¿Cuál es su precio en términos de los precios de la mantequilla (pb) y el pan tostado (pt)? b. Explica por qué c/pbt 0. c. Asimismo, ¿es cierto aquí que c/pb y c/pt son iguales a 0? 6.4 La señorita Sarah Viajera no tiene automóvil y sólo viaja en autobús, tren o avión. Su función de utilidad está dada por utilidad b . t . p, donde cada letra significa millas recorridas por modo de transporte específico. Supón que la razón del precio del boleto de tren con el del autobús (pt/pb) no varía nunca. a. b. c. d. ¿Cómo podría definirse un bien compuesto para el transporte terrestre? Formula el problema de optimización de Sarah como un problema de elección entre transporte terrestre (g) y aéreo (p). ¿Cuáles son las funciones de demanda de Sarah para g y p? Una vez que Sarah decide cuánto gastar en g, ¿cómo distribuirá esos gastos entre b y t? 6.5 Supón que un individuo consume tres bienes, x1, x2 y x3, y que x1 y x2 son bienes similares (es decir, comidas en restaurante baratas y caras), con p2 kp3, donde k 1; es decir, los precios de los bienes tienen una relación constante entre sí. a. Demuestra que x2 y x3 pueden tratarse como un bien compuesto. b. Supón que x2 y x3 están sujetos a un costo de transacción de t por unidad (para algunos ejemplos, véase el problema 6.6). ¿Cómo afectará este costo de transacción el precio de x2 en relación con el de x3? ¿Cómo variará este efecto con el valor de t? c. ¿Puedes predecir cómo un incremento de ingreso compensado en t afecta los gastos en el bien compuesto x2 y x3? ¿El teorema de bienes compuestos se aplica estrictamente a este caso? d. ¿Cómo afectará el incremento de ingreso compensado en t, la forma de asignar el gasto total en el bien compuesto entre x2 y x3? 6.6 Aplica los resultados del problema 6.5 para explicar las observaciones siguientes: a. Es difícil hallar manzanas de alta calidad por comprar en el estado de Washington o buenas naranjas frescas en Florida. b. Los individuos con gastos significativos en la contratación de niñeras tienen más probabilidades de comer en restaurantes caros (antes que hacerlo en sitios baratos) que aquellas sin ese tipo de gastos. c. Los individuos con alto valor de tiempo son más proclives a viajar en el Concorde que aquellos con un bajo valor de tiempo. d. Es más probable que los individuos obtengan gangas de artículos caros que de artículos baratos. Nota: Las observaciones b) y d) componen la base de, quizá, los dos únicos casos de homicidio en los que un economista resuelve el crimen; véase Marshall Jevons, Murder at the Margin (Asesinato marginal) y The Fatal Equilibrium (El equilibrio fatal). 6.7 En general, los efectos cruzados no compensados no son iguales, es decir, xi pj xj . pi Usa la ecuación de Slutsky para demostrar que estos efectos son iguales si una persona gasta una fracción constante de su ingreso en cada bien, sin considerar los precios relativos. (Esta es una generalización del problema 6.1.) Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 202 Parte 2: Elección y demanda 6.8 En el ejemplo 6.3 se calcularon las funciones de demanda implicadas por la función de utilidad ESC de tres bienes U( x, y, z ) 1 x 1 y 1 . z a. Usa la función de demanda de x en la ecuación 6.32 para determinar si x y y o x y z son sustitutos brutos o complementarios brutos. b. ¿Cómo determinarías si x y y o x y z son sustitutos netos o complementarios netos? Problemas analíticos 6.9 Superávit del consumidor con muchos bienes En el capítulo 5 se demostró cómo los costos de bienestar de las variaciones en un precio pueden medirse usando funciones de gasto y curvas de demanda compensada. En este problema se te pedirá generalizar estas variaciones de precio en dos (o muchos) bienes. a. Supón que un individuo consume n bienes y que los precios de dos de ellos (digamos p1 y p2) se incrementan. ¿Cómo usarías la función de gasto para medir la variación compensatoria (VC) para este individuo como resultado del aumento de precio? b. Una forma de mostrar gráficamente estos costos de bienestar sería usar curvas de demanda compensada para los bienes x1 y x2, suponiendo que un precio aumentó antes que el otro. Ilustra este enfoque. c. En tu respuesta al inciso b), ¿es relevante en qué orden consideras las variaciones de precio? Explica tu respuesta. d. En general, ¿crees que la VC para un aumento de precio de estos dos bienes sea mayor si los bienes son sustitutos netos o complementarios netos?, ¿o la relación entre los bienes no tiene ninguna consecuencia en los costos de bienestar? 6.10 Utilidad separable Una función de utilidad se llama separable si puede escribirse como U(x, y) U1(x) U2(y), donde Uʹi 0, Uʹʹi 0 y U1, U2 no son necesariamente la misma función. a. ¿Qué supone la separabilidad sobre la derivada parcial cruzada Uxy? Aporta un análisis intuitivo de lo que significa esta condición y en qué situaciones podría ser verosímil. b. Demuestra que si la utilidad es separable, ningún bien puede ser inferior. c. ¿El supuesto de separabilidad te permite concluir definitivamente si x y y son sustitutos netos o complementarios netos? Explica tu respuesta. d. Usa la función de Cobb-Douglas para demostrar que la separabilidad no es invariante respecto a las transformaciones monótonas. Nota: Las funciones separables se examinarán con mayor detalle en las extensiones de este capítulo. 6.11 Graficar complementarios Graficar complementarios es complicado porque una relación de complementariedad entre bienes (conforme a la definición de Hicks) no puede ocurrir con únicamente dos bienes. Más bien, la complementariedad implica necesariamente las relaciones de demanda entre tres (o más) bienes. En su revisión de la complementariedad Samuelson ofrece una manera de ilustrar el concepto con un diagrama de curva de indiferencia bidimensional (véase “Sugerencias de lecturas adicionales”). Para examinar este diagrama supón que hay tres bienes entre los cuales puede escoger un consumidor. Las cantidades de estos se denotan con x1, x2 y x3. Ahora procede como sigue. a. Traza una curva de indiferencia para x2 y x3, manteniendo constante la cantidad de x1, en x01. Esta curva de indiferencia tendrá la forma convexa acostumbrada. b. Traza ahora una segunda curva de indiferencia (más alta) para x2, x3 manteniendo x1 constante en x01 h. Para esta nueva curva de indiferencia muestra la cantidad de x2 extra que compensaría a esta persona por la pérdida de x1; designa a este monto j. De igual manera, muestra la cantidad de x3 adicional que compensaría la pérdida de x1, y llama a esta cantidad k. c. Supón ahora que un individuo recibe las cantidades j y k, lo que le permite moverse a una curva de indiferencia más alta x2, x3. Muestra este movimiento en tu gráfica y traza esta nueva curva de indiferencia. d. Samuelson sugiere ahora las definiciones siguientes: • Si la nueva curva de indiferencia corresponde a la curva de indiferencia cuando x1 x01 2h, los bienes 2 y 3 son independientes. • Si la nueva curva de indiferencia brinda más utilidad que cuando x1 x01 2h, los bienes 2 y 3 son complementarios. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 6: Relaciones de demanda entre bienes 203 • Si la nueva curva de indiferencia brinda menos utilidad que cuando x1 x01 2h, los bienes 2 y 3 son sustitutos. Demuestra que estas definiciones gráficas son simétricas. e. Analiza cómo es que estas definiciones gráficas se corresponden con las definiciones más matemáticas de Hicks dadas en el texto. f. Al examinar tu gráfica final, ¿crees que este enfoque explica por completo los tipos de relaciones que podrían existir entre x2 y x3? 6.12 Embarque de las manzanas buenas Los detalles del análisis sugerido en los problemas 6.5 y 6.6 fueron originalmente resueltos por Borcherding y Silberberg (véase “Sugerencias de lecturas adicionales”) con base en una suposición inicialmente propuesta por Alchian y Allen. Estos autores analizan cómo un cargo de transacción afecta la demanda relativa de dos artículos cercanamente sustituibles. Supón que los bienes x2 y x3 son sustitutos cercanos y están sujetos a un cargo de transacción de t por unidad. Supón, asimismo, que el bien 2 es el más costoso de ambos (es decir, “manzanas buenas” en oposición a “manzanas preparadas”). De ahí que el cargo de transacción disminuya el precio relativo del bien más costoso [esto es, (p2 t)/(p3 t) decrece al incrementar t]. Esto a su vez incrementará la demanda relativa del bien costoso, si (xc2/xc3)/t 0 (donde se usan funciones de demanda compensada para eliminar incómodos efectos de ingreso). Borcherding y Silberberg demuestran que este resultado probablemente sería válido, siguiendo estos pasos. a. Usa la derivada de una regla del cociente para desarrollar (xc2/xc3)/t. b. Usa tu resultado del inciso a), junto con el hecho de que en este problema xci/t xci/p2 xci/p3 para i 2, 3, para demostrar que la derivada que buscamos puede escribirse como (xc2 / xc3 ) xc2 s22 s23 c x3 x 2 x 2 t s32 x3 s33 , x3 donde sij xci/pj. c. Reescribe el resultado del inciso b) en términos de elasticidades de precio compensadas: ecij xci pj . pj xci d. Usa la tercera ley de Hicks (ecuación 2.26) para demostrar que el término entre corchetes en los incisos b) y c) puede escribirse ahora como [(e22 e23)(1/p2 1/p3) (e21 e31)/p3]. e. Desarrolla un argumento intuitivo de por qué es probable que la expresión del inciso d) sea positiva en las condiciones de este problema. Pistas: ¿Por qué el primer producto entre corchetes es positivo? ¿Por qué es probable que el segundo término entre corchetes sea reducido? f. Vuelve al problema 6.6 y ofrece explicaciones más completas de estos diversos hallazgos. Sugerencias de lecturas adicionales Borcherdin, T. E. y E. Silberberg. “Shipping the Good Apples Out—The Alchian-Allen Theorem Reconsidered”, Journal of Political Economy (febrero de 1978), pp. 131-138. Buen análisis de las relaciones entre tres bienes en la teoría de la demanda. Véanse también los problemas 6.5 y 6.6. Hicks, J. R. Value and Capital, 2a. ed., Oxford University Press, Oxford, 1946. Véanse los capítulos I-III y apéndices asociados. Prueba del teorema de los bienes compuestos. Ofrece también uno de los primeros tratamientos de sustitutos y complementarios netos. Mas-Colell, A., M. D. Whinston y J. R. Green. Microeconomic Theory, Oxford University Press, Nueva York, 1995. Explora las consecuencias de la simetría de los efectos cruzados compensados para varios aspectos de la teoría de la demanda. Adecuado tratamiento gráfico y matemático del enfoque de atributos de la teoría del consumo y del concepto de “mercados” de atributos. Samuelson, P. A. “Complementarity—An Essay on the 40th Anniversary of the Hicks-Allen Revolution in Demand Theory”, Journal of Economic Literature (diciembre de 1977), pp. 1255-1289. Revisa varias definiciones de complementariedad y muestra las relaciones entre ellas. Contiene un intuitivo análisis gráfico y un apéndice matemático detallado. Silberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001. Buen análisis de funciones de gasto y el uso de funciones de utilidad indirecta para ilustrar el teorema de bienes compuestos y otros resultados. Rosen, S. “Hedonic Prices and Implicit Markets”, Journal of Political Economy (enero/febrero de 1974), pp. 34-55. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 204 Parte 2: Elección y demanda EXTENSIONES Simplificación de la demanda y presupuestación en dos etapas En el capítulo 6 se vio que la teoría de la optimización de la utilidad impone, en su generalidad, pocas restricciones a lo que podría ocurrir. Aparte del hecho de que los efectos netos de sustitución cruzada son simétricos, prácticamente cualquier tipo de relación entre bienes es congruente con la teoría subyacente. Esta situación plantea problemas para los economistas que desean estudiar el comportamiento de consumo en la realidad; la teoría sencillamente no da mucha orientación cuando hay muchos miles de bienes potencialmente disponibles para su estudio. Existen dos maneras generales de hacer simplificaciones. La primera se sirve del teorema de los bienes compuestos del capítulo 6 para agregar bienes en categorías en las que los precios relativos se mueven juntos. Para situaciones en que los economistas están específicamente interesados en las variaciones en los precios relativos dentro de una categoría de gasto (como variaciones en los precios relativos de varias formas de energía), sin embargo, este proceso no bastará. Una opción es suponer que los consumidores siguen un proceso de dos etapas en sus decisiones de consumo. Primero distribuyen su ingreso a diversos y amplios grupos de bienes (alimentos y ropa, por ejemplo) y luego, dadas estas restricciones de gasto, optimizan su utilidad en cada una de las subcategorías de bienes, usando sólo información sobre los precios relativos de dichos bienes. De esta forma, las decisiones pueden estudiarse en un marco simplificado, considerando únicamente una categoría por cada vez. Este proceso se llama presupuesto en dos etapas. En estas extensiones se examina primero la teoría general del presupuesto en dos etapas para luego analizar algunos ejemplos empíricos. E6.1 Teoría de la presupuestación en dos etapas La cuestión que surge en el presupuesto en dos etapas puede enunciarse sucintamente: ¿existe una división de bienes en m grupos no empalmados (denotados por r 1, m) y un presupuesto aparte (lr) dedicado a cada categoría, de tal manera que las funciones de demanda de los bienes en una categoría sólo dependan de los precios de los bienes de esa categoría y de la asignación presupuestal a esa misma categoría? Es decir, ¿los bienes pueden dividirse de tal forma que la demanda esté dada por xi(p1, . . . , pn, I) xi∈r (pi∈r, Ir) (i) para r 1, m? Que esto se puede hacer es algo que se sugiere al comparar el siguiente problema de optimización en dos etapas, V ð p1 , . . . , pn , I 1 , . . . , I m Þ " ¼ max Uðx1 , . . . , xn Þ s.t. x1 , ... , xn X # pi xi I r , r ¼ 1, m (ii) i2r y max V s.t. I 1 , ... , I m M X I r ¼ I, r¼1 con el problema de optimización de la utilidad que hemos estudiado, max Uðx1 , . . . , xn Þ xi s.t. n X pi xi I: (iii) i¼1 Sin restricciones adicionales estos dos procesos de optimización producirán el mismo resultado; esto es, la ecuación ii es sencillamente una manera más complicada de formular la ecuación iii. Así, ciertas restricciones deben imponerse a la función de utilidad para garantizar que las funciones de demanda que resultan de resolver el proceso en dos etapas sean de la forma en que se especifica en la ecuación i. Intuitivamente, parece que tal clasificación de bienes debería funcionar siempre y cuando las variaciones en el precio de un bien en una categoría no afecten la asignación de gasto a bienes en cualquier otra categoría que no sea la propia. En el problema 6.9 se mostró un caso en el que esto es cierto para una función de utilidad “aditivamente separable”. Lamentablemente, este resulta ser un caso especial. Las más generales restricciones matemáticas que deben imponerse a la función de utilidad para justificar el presupuesto en dos etapas se han derivado ya (véase Blackorby, Primont y Russell, 1978), pero no son especialmente intuitivas. Claro que los economistas que desean estudiar las decisiones descentralizadas por consumidores (o, quizá sobre todo, por empresas que operan muchas divisiones) deben hacer algo para simplificar las cosas. Estudiemos ahora algunos ejemplos aplicados. E6.2 Relación con el teorema de los bienes compuestos Por desgracia, ninguno de los dos enfoques teóricos disponibles de la simplificación de la demanda es completamente satisfactorio. El teorema de los bienes compuestos requiere que los precios relativos de los bienes de un grupo se mantengan constantes en el tiempo, supuesto que ha sido rechazado durante muy diferentes periodos históricos. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 6: Relaciones de demanda entre bienes Por otro lado, el tipo de separabilidad y presupuesto en dos etapas, indicado por la función de utilidad en la ecuación i también requiere supuestos firmes sobre cómo las variaciones en los precios de un bien en un grupo afectan el gasto en bienes de cualquier otro grupo. Estos supuestos parecen ser rechazados por los datos (véase Diewert y Wales, 1995). Los economistas han tratado de idear métodos híbridos aún más elaborados para la agregación entre bienes. Por ejemplo, Lewbel (1996) muestra cómo el teorema de los bienes compuestos podría generalizarse a casos en que los precios relativos en un grupo exhiben variabilidad considerable. Usa esta generalización para agregar gastos de consumo estadounidenses en seis grandes grupos (alimentos, ropa, operación doméstica, atención médica, transporte y recreación). Usando estos agregados concluye que su procedimiento es mucho más acertado que suponer un presupuesto en dos etapas entre esas categorías de gasto. E6.3 Funciones homotéticas y demanda de energía Un modo de simplificar el estudio de la demanda cuando hay muchos bienes es suponer que la utilidad de ciertas subcategorías de bienes es homotética y puede separarse de la demanda de otros bienes. Este procedimiento fue seguido por Jorgenson, Slesnick y Stoker (1997) en su estudio de la demanda de energía por consu- 205 midores estadounidenses. Suponiendo que las funciones de demanda de tipos específicos de energía son proporcionales al gasto total en energía, los autores pudieron concentrar su estudio empírico en el tema que más les interesaba: estimar las elasticidades precio de la demanda de varios tipos de energía. Llegan a la conclusión de que la mayoría de los tipos de energía (electricidad, gas natural, gasolina) tienen funciones de demanda muy elásticas. La demanda parece ser muy sensible al precio de la electricidad. Referencias Blackorby, Charles, Daniel Primont y R. Robert Russell. Duality, Separability and Functional Structure: Theory and Economic Applications, North Holland, Nueva York, 1978. Diewert, W. Erwin y Terrence J. Wales. “Flexible Functional Forms and Tests of Homogeneous Separability”, Journal of Econometrics (junio de 1995), pp. 259-302. Jorgenson, Dale W., Daniel T. Slesnick y Thomas M. Stoker. “TwoStage Budgeting and Consumer Demand for Energy”, en Dale W. Jorgerson, ed., Welfare, vol. 1: Aggregate Consumer Behavior, MIT Press, Cambridge, 1997, pp. 475-510. Lewbel, Arthur. “Aggregation without Separability: A Standardized Composite Commodity Theorem”, American Economic Review (junio de 1996), pp. 524-543. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Incertidumbre y estrategia PARTE TRES Capítulo 7 Incertidumbre Capítulo 8 Teoría de juegos Esta tercera parte extiende el análisis de la elección individual a marcos más complicados. En el capítulo 7 se examina el comportamiento individual en situaciones inciertas. Una decisión ya no se asocia con un resultado único, sino con varios de ellos más o menos probables. Se describirá por qué a los individuos suele desagradarles el riesgo implicado en esas situaciones. Trataremos de entender los pasos que dan para mitigar el riesgo que incluyen compra de seguros, adquisición de más información y preservación de opciones. El capítulo 8 atenderá decisiones tomadas en situaciones estratégicas en las que el bienestar de un individuo depende no sólo de sus propias acciones, sino también de las acciones de otros y viceversa. Esto conduce a cierta circularidad en el análisis de decisiones estratégicas, la cual se resolverá usando las herramientas de la teoría de los juegos. Las nociones de equilibrio que se desarrollarán en el estudio de tales situaciones son de amplio uso en economía. Aunque esta parte puede considerarse la extensión natural del análisis de las elecciones del consumidor de la parte 2 a marcos más complicados, se aplica a una serie mucho más amplia de tomadores de decisiones como empresas u otras organizaciones, incluso países enteros. Por ejemplo, la teoría de los juegos proporcionará un marco para el estudio de la competencia imperfecta entre unas cuantas empresas en el capítulo 15. 207 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO SIETE Incertidumbre En este capítulo se exploran algunos de los elementos básicos de la teoría del comportamiento individual en situaciones inciertas. Se analizará por qué a los individuos no les agrada el riesgo, así como los diversos métodos (compra de seguros, adquisición de más información y preservación de opciones) que pueden adoptar para reducirlo. De manera más general, este capítulo pretende ofrecer una breve introducción a asuntos planteados por la posibilidad de que la información sea imperfecta cuando los individuos toman decisiones de optimización de su utilidad. La sección “Extensiones” brinda una aplicación detallada de los conceptos de este capítulo al prohasta el capítulo 18 es aquella referente a cuando un individuo bien informado puede tomar ventaja de otro que esté mal informado en una transacción de mercado (información asimétrica). ESTADÍSTICA MATEMÁTICA Muchas de las herramientas formales para modelizar la incertidumbre en situaciones económicas fueron originalmente desarrolladas en el campo de la estadística matemática. Algunas de estas herramientas se repasaron en el capítulo 2, y en este capítulo se hará amplio uso de los conceptos present Variablealeatoria:Una variable aleatoria es aquella que registra, en forma numérica, los posibles resultados de un evento aleatorio.1 t Funcióndedensidaddeprobabilidad (FDP): Función f(x) que muestra las probabilidades asociadas con los posibles resultados de una variable aleatoria. t Valoresperadodeunavariablealeatoria: Resultado de una variable aleatoria que ocurrirá “en promedio”. El valor esperado se denota con E(x). Si x es una variable aleatoria discreta con n n resultados, entonces E(x) i 1 xif (xi). Si x es una variable aleatoria continua, entonces E(x) xf(x) dx. t Varianzaydesviaciónestándardeunavariablealeatoria: Estos conceptos miden la dispersión de una variable aleatoria respecto a su valor esperado. En el caso discreto, Var(x) 2 n 2 E(x) 2f(xi); en el caso continuo, Var(x) x E(x) 2f(x) dx. La x i 1 xi x desviación estándar es la raíz cuadrada de la varianza. Como veremos, todos estos conceptos entrarán en juego cuando iniciemos nuestro examen del proceso de toma de decisiones de una persona que enfrenta varios resultados inciertos que pueden ser conceptualmente representados por una variable aleatoria. 1 Cuando sea necesario distinguir entre variables aleatorias y variables no aleatorias se usará la notación x̃ para denotar el hecho de que la variable x es aleatoria en cuanto que adopta un número de resultados posibles aleatoriamente determinados. A menudo, sin embargo, no será necesario hacer esa distinción porque la aleatoriedad será evidente en el contexto del problema. 209 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 210 Parte 3: Incertidumbre y estrategia APUESTAS RAZONABLES E HIPÓTESIS DE LA UTILIDAD ESPERADA Una apuesta “razonable” es una serie especificada de premios y probabilidades asociadas con un valor esperado de cero. Por ejemplo, si lanzas al aire una moneda con un amigo para ganar un dólar, el valor esperado de esta apuesta es igual a cero porque E(x) 0.5($1) 0.5($1) 0, (7.1) donde los beneficios se registran con un signo de suma y las pérdidas con un signo de resta. De igual forma un juego que prometía hacerte ganar 10 dólares, si el resultado del lanzamiento de una moneda era cara, pero que sólo te costaría 1 dólar, si el resultado era cruz, sería “no razonable” porque E(x) 0.5($10) 0.5($1) $4.50. (7.2) Sin embargo, este puede convertirse fácilmente en un juego razonable, aportando simplemente una cuota de entrada de 4.50 dólares por el derecho a jugar. Desde hace mucho se ha reconocido que la mayoría de los individuos preferirían no hacer apuestas razonables.2 Con fines de entretenimiento las personas pueden apostar unos dólares al lanzar una moneda al aire, pero en general evitarían participar en un juego similar cuyo resultado fuera de $1 millón o $1 millón. Uno de los primeros matemáticos en estudiar los motivos de esta renuencia a incurrir en apuestas razonables fue Daniel Bernoulli, en el siglo xviii.3 Su examen de la famosa paradoja de San Petersburgo fue el punto de partida para prácticamente todos los estudios del comportamiento de los individuos en situaciones inciertas. Paradoja de San Petersburgo En la paradoja de San Petersburgo se propuso la apuesta siguiente: se lanza al aire una moneda hasta que caiga cara. Si cae cara por primera vez en el enésimo lanzamiento, el jugador recibe $2n. Esta apuesta tiene un número infinito de resultados (una moneda podría ser lanzada al aire constantemente hasta el día del juicio final sin que cayera cara nunca, aunque la probabilidad de esto es reducida), pero los primeros pueden consignarse fácilmente. Si xi representa el premio concedido cuando cae cara en el intento de orden i, entonces x1 $2, x2 $4, x3 $8, …, xn $2n. (7.3) 1 ( 2 )i; La probabilidad de que caiga cara por primera vez en el intento de orden i es de esta es la probabilidad de que caigan (i 1) cruces y luego cara. De ahí que las probabilidades de los premios dadas en la ecuación 7.3 sean 1 1 1 1 p1 ¼ , p2 ¼ , p3 ¼ , . . . , pn ¼ n : 2 4 8 2 (7.4) Así, el valor esperado de la apuesta es infinito: EðxÞ ¼ 1 X i¼1 pi xi ¼ 1 X 2i ð1=2i Þ i¼1 ¼ 1 þ 1 þ 1 þ þ 1 þ ¼ 1. (7.5) 2 Se supone que las apuestas analizadas aquí no producen en el juego más utilidad que la de los precios; de ahí que la observación de que muchas personas apuestan de manera “no razonable” no es necesariamente una refutación de este enunciado. Más bien, de esos individuos puede suponerse, razonablemente, que derivan cierta utilidad de las circunstancias asociadas con la ejecución del juego. Por tanto, es posible diferenciar el aspecto de consumo de apostar del aspecto de riesgo puro. 3 Esta paradoja debe su nombre a la ciudad en la que se publicó el manuscrito original de Bernoulli. Reimpresión en D. Bernoulli, “Exposition of a New Theory on the Measurement of Risk”, Econometrica, núm. 22 (enero de 1954), pp. 23-36. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 211 Cierta introspección, sin embargo, debería convencer a cualquiera de que ningún jugador pagaría mucho (y menos aún el infinito) por hacer esta apuesta. Si se cobraran 1 000 millones de dólares por entrar al juego, indudablemente que no habría jugadores, pese al hecho de que 1 000 millones de dólares es una cantidad considerablemente menor que el valor esperado del juego. Esta es entonces la paradoja: la apuesta de Bernoulli no vale en cierto sentido su (infinito) valor esperado en dólares. UTILIDAD ESPERADA La solución de Bernoulli a esta paradoja fue argüir que los individuos no se interesan directamente en los premios en dinero de una apuesta; más bien, responden a la utilidad que el dinero proporciona. Si suponemos que la utilidad marginal de la riqueza decrece al incrementar la riqueza, la apuesta de San Petersburgo puede converger con un valor finito de utilidad esperada, aunque su valor monetario esperado sea infinito. Puesto que la apuesta sólo brinda una utilidad esperada finita, los individuos estarían dispuestos a pagar una cantidad finita por hacerla. El ejemplo 7.1 examina algunos asuntos relacionados con la solución de Bernoulli. EJEMPLO 7.1 Solución de Bernoulli a la paradoja y sus deficiencias Supón, como hizo Bernoulli, que la utilidad de cada premio en la paradoja de San Petersburgo está dada por U(xi) 1n(xi). (7.6) Esta función de utilidad logarítmica exhibe una utilidad marginal decreciente (es decir, U' 0 pero U'' 0), y el valor de la utilidad esperada de este juego converge en un número finito: 1 X utilidad esperada ¼ i¼1 1 X ¼ i¼1 pi Uðxi Þ 1 lnð2i Þ: 2i (7.7) Cierta manipulación de esta expresión resulta4 en que la utilidad esperada de esta apuesta es 1.39. Por tanto un individuo con este tipo de función de utilidad podría estar dispuesto a invertir recursos que, de lo contrario, producirían hasta 1.39 unidades de utilidad (cierta riqueza de aproximadamente 4 dólares proporciona esta utilidad) comprando el derecho a ejecutar este juego. En consecuencia, la suposición de que los grandes premios prometidos por la paradoja de San Petersburgo encontrarían una utilidad marginal decreciente permitió a Bernoulli ofrecer una solución a la paradoja. Utilidad ilimitada. Lamentablemente, la solución de Bernoulli a la paradoja de San Petersburgo no resuelve por completo el problema. Mientras no haya un límite superior a la función de utilidad la paradoja puede regenerarse redefiniendo los premios de la apuesta. Por ejemplo, con la función de utilidad i logarítmica los premios pueden fijarse como xi e2 , en cuyo caso i U(xi) lne2 2i (7.8) y la utilidad esperada de la apuesta sería nuevamente infinita. Desde luego que los premios en esta apuesta redefinida son grandes. Por ejemplo, si en el quinto lanzamiento cayera cara por primera vez, una per5 sona ganaría e2 79 billones de dólares, aunque la probabilidad de ganar esto sería de sólo 1/25 0.031. 4 Prueba: utilidad esperada ¼ 1 1 X X i i ln 2 ¼ ln 2 . 2i 2i i¼1 i¼1 Pero es posible demostrar que el valor de esta serie infinita final es de 2. De ahí que la utilidad esperada 2 ln 2 1.39. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 212 Parte 3: Incertidumbre y estrategia A muchos observadores les parece improbable la idea de que los individuos pagarían mucho (digamos billones de dólares) para participar en juegos con pocas probabilidades de obtener premios tan grandes. De ahí que, en muchos sentidos, el juego de San Petersburgo siga siendo una paradoja. PREGUNTA: He aquí dos soluciones alternas a la paradoja de San Petersburgo. Calcula, para cada una, el valor esperado del juego original. 1. Supón que los individuos asumen que cualquier probabilidad menor que 0.01 es de hecho cero. 2. Supón que la función de utilidad de los premios de San Petersburgo está dada por Uðxi Þ ¼ xi 1 000 000 si si xi 1 000 000, xi 1 000 000. EL TEOREMA VON NEUMANNMORGENSTERN Una de las muchas contribuciones importantes a la parte 3 de nuestro texto es el libro de John von Neumann y Oscar Morgenstern, The Theory of Games and Economic Behavior (Teoría de los juegos y comportamiento económico), quienes desarrollaron un fundamento matemático para la solución de Bernoulli a la paradoja de San Petersburgo.5 En particular, elaboraron axiomas básicos de racionalidad y demostraron que cualquier individuo racional, en ese sentido, tomaría decisiones en condiciones de incertidumbre, aunque tuviera una función de utilidad sobre el dinero de U(x) y optimizara el valor esperado de U(x) (más que el valor esperado del mismo beneficio monetario x). Aunque la mayoría de estos axiomas parece eminentemente razonable a primera vista, se han planteado muchas preguntas importantes sobre su sustentabilidad.6 Sin embargo, aquí no nos ocuparemos de estas cuestiones. Índice de utilidad Von Neumann-Morgenstern Para comenzar, supongamos que hay n premios posibles que una persona podría ganar participando en una lotería. Concedamos que los premios se denotan con x1, x2, …, xn, y supongamos que estos han sido dispuestos en atractivo orden ascendente. Por tanto, x1 es el premio con menos preferencia y xn el más preferible. Ahora asignemos números de utilidad arbitrarios a estos premios extremos. Por ejemplo, es conveniente asignar Uðx1 Þ ¼ 0, Uðxn Þ ¼ 1, (7.9) pero cualquier otro par de números lo haría igualmente bien.7 Usando estos dos valores de utilidad, el propósito del teorema Von Neumann-Morgenstern es demostrar que existe una forma razonable de asignar números específicos de utilidad a los demás premios disponibles. Supongamos que elegimos otro premio, digamos xi. Considérese el experimento siguiente. Le pedimos a un individuo enunciar la probabilidad, digamos i, en la cual se muestre indiferente entre xi con certidumbre y una apuesta que ofreciera premios de xn con probabilidad de i y de x1 con proba5 J. von Neumann y O. Morgenstern, The Theory of Games and Economic Behavior (Princeton University Press, Princeton, 1944). Los axiomas de racionalidad en situaciones inciertas se analizan en el apéndice de este libro. 6 Para un estudio de algunas de las cuestiones planteadas en el debate sobre los axiomas de Von Neumann-Morgenstern, especialmente el supuesto de independencia, veáse C. Gollier, The Economics of Risk and Time (MIT Press, Cambridge, M.A., 2001), cap. 1. 7 Técnicamente, un índice de utilidad de Von Neumann-Morgenstern es único sólo hasta una opción de escala y origen; es decir, hasta una “transformación lineal”. Este requisito es más estricto que el de que una función de utilidad sea única hasta una transformación monótona. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 213 bilidad (1 i). Parece razonable (aunque este es el supuesto más problemático en el enfoque de Von Neumann-Morgenstern) que tal probabilidad exista: un individuo siempre será indiferente entre una apuesta y algo seguro, siempre y cuando se ofrezca una probabilidad lo bastante alta de obtener el mejor premio. También parece probable que i será mayor que el xi más deseable; cuanto mejor sea xi, mejor debería ser la posibilidad de obtener xn para inducir al individuo a apostar. Por tanto, la probabilidad de i mide cuán deseable es el premio xi. De hecho, la técnica de Von Neumann-Morgenstern define la utilidad de xi como la utilidad esperada de la apuesta que el individuo considera igualmente deseable xi: U(xi) iU(xn) (1 i)U(x1). (7.10) Debido a nuestra elección de escala en la ecuación 7.9, tenemos U(xi) i . 1 (1 i) . 0 i. (7.11) Al elegir con criterio las cifras de utilidad que se asignarán a los mejores y peores premios, hemos podido idear una escala conforme a la cual el índice de utilidad atribuido a cualquier otro premio, es simplemente la probabilidad de obtener el mayor en una apuesta que se considera equivalente al premio en cuestión. Esta elección de índices de utilidad es arbitraria. Otros dos números cualesquiera podrían haberse usado para elaborar esta escala de utilidad, aunque nuestra elección inicial (ecuación 7.9) es particularmente conveniente. Optimización de la utilidad esperada En consonancia con la elección de escala y origen, representada por la ecuación 7.9, supongamos que a cada premio xi se le ha asignado un índice de utilidad i. Nótese en particular que 1 0, n 1, y que los demás índices de utilidad se ubican entre estos extremos. Al usar estos índices de utilidad es posible demostrar que un individuo “racional” elegirá entre apuestas con base en sus “utilidades” esperadas (es decir, con base en el valor esperado de estos números del índice de utilidad Von Neumann-Morgenstern). Como ejemplo, considérense dos apuestas. La apuesta A ofrece x2 con probabilidad a y x3 con probabilidad (1 a). La apuesta B ofrece x4 con probabilidad b y x5 con probabilidad (1 b). Se quiere demostrar que una persona elegirá la apuesta A si y sólo si la utilidad esperada de la apuesta A excede la de la apuesta B. Ahora, para las apuestas: utilidad esperada de A aU(x2) (1 a)U(x3), utilidad esperada de B bU(x4) (1 b)U(x5). (7.12) Sustituir los números del índice de utilidad (es decir, 2 es la “utilidad” de x2, y así sucesivamente) da utilidad esperada de A a2 (1 a)3, utilidad esperada de B b4 (1 b)5. (7.13) Se desea demostrar que un individuo preferirá la apuesta A a la apuesta B si y sólo si a2 (1 a)3 b4 (1 b)5. (7.14) Para demostrar esto recuérdense las definiciones del índice de utilidad. El individuo es indiferente entre x2 y una apuesta que ofrece x1 con probabilidad (1 2) y xn con probabilidad 2. Podemos usar este hecho para sustituir las apuestas que sólo implican a x1 y xn por todas las utilidades en la ecuación 7.13 (aun cuando el individuo sea indiferente respecto a ellas, el supuesto que esta sustitución puede establecer asume implícitamente que los individuos pueden ver a través de complejas combinaciones de lotería). Luego de un poco de complicada álgebra puede concluirse que la apuesta A es equivalente a una apuesta que promete xn con probabilidad a2 (1 a) 3, y que la apuesta B es equivalente a una apuesta que promete xn con probabilidad b4 (1 b) 5. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 214 Parte 3: Incertidumbre y estrategia Presumiblemente, un individuo preferirá la apuesta con la mayor probabilidad de obtener el mejor premio. En consecuencia, elegirá la apuesta A si y sólo si a2 (1 a)3 b4 (1 b)5. (7.15) Pero esto es exactamente lo que queríamos demostrar. Por consiguiente, hemos probado que un individuo elegirá la apuesta que proporcione el nivel más alto de utilidad esperada (Von Neumann-Morgenstern). Ahora haremos un uso considerable de este resultado, que puede resumirse como sigue. PRINCIPIO DE OPTIMIZACIÓN Optimización de la utilidad esperada. Si los individuos obedecen los axiomas de comportamiento Von Neumann-Morgenstern en situaciones inciertas, entonces actuarán como si eligieran la opción que optimiza el valor esperado de su utilidad Von Neumann-Morgenstern. AVERSIÓN AL RIESGO Los economistas han descubierto que los individuos tienden a evitar situaciones riesgosas, aun si la situación equivale a una apuesta razonable. Por ejemplo, pocos individuos considerarían apostar 10 000 dólares por el resultado de lanzar una moneda al aire, aun cuando el beneficio promedio fuera de 0. Lo anterior es debido a que los premios en dinero de la apuesta no reflejan completamente la utilidad provista por los premios. La utilidad que los individuos obtienen de un incremento en el precio del dinero puede incrementar con menos rapidez que el valor en dólares de dichos premios. Una apuesta razonable en términos monetarios puede ser irrazonable en términos de utilidad y, por tanto, será rechazada. En términos más técnicos, dinero adicional puede brindar a los individuos una utilidad marginal decreciente. Un ejemplo sencillo puede ayudar a explicar por qué. Un aumento en el ingreso, digamos, de 40 000 a 50 000 dólares puede incrementar sustancialmente el bienestar de un individuo, garantizándole que no se quedará sin bienes esenciales como alimento y vivienda. Un incremento adicional de 50 000 a 60 000 dólares le permitiría un estilo de vida aún más confortable, quizá al proveerlo de alimentos más sabrosos y una casa más grande, pero la mejora probablemente no sería tan grande como la inicial. A partir de un patrimonio de 50 000 dólares el individuo sería resistente a apostar 10 000 dólares por el resultado de lanzar una moneda al aire. La posibilidad de 50 por ciento de las mayores comodidades que podría tener con 60 000 dólares no compensa la posibilidad de 50 por ciento de terminar con 40 000 y quizá tenga que privarse de algunas cosas esenciales. Estos efectos sólo se magnifican con apuestas más arriesgadas, es decir con apuestas con resultados incluso de mayor variabilidad.8 El individuo con un patrimonio inicial de 50 000 dólares probablemente sería aún más resistente a hacer una apuesta de 20 000 sobre el lanzamiento de una moneda porque enfrentaría la perspectiva de terminar con sólo 30 000 dólares si el lanzamiento le resultara desfavorable, reduciendo severamente los bienes esenciales para vivir. La igual posibilidad de terminar con 70 000 dólares no es compensación suficiente. Por otro lado, una apuesta de sólo 1 dólar sobre el lanzamiento de una moneda es relativamente irrelevante. Aunque de todas maneras uno podría rechazar la apuesta, no se empeñaría mucho en ello, pues su patrimonio último apenas si variaría con el resultado del lanzamiento de la moneda. Aversión al riesgo y apuestas razonables Este argumento se ilustra en la figura 7.1. Aquí W0 representa el patrimonio corriente de un individuo y U(W) es un índice de utilidad de Von Neumann-Morgenstern (que en adelante llamare8 Con frecuencia los conceptos estadísticos de varianza y desviación estándar se usan para medir. Lo haremos así en varias partes posteriores de este capítulo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 215 Si la función de utilidad patrimonial es cóncava (es decir, si exhibe una utilidad patrimonial marginal decreciente), un individuo rechazará apuestas razonables. Una posibilidad de 50-50 de ganar o perder h dólares, por ejemplo, produce menos utilidad esperada [EU(A)] que rechazar la apuesta. La razón de esto es que ganar h dólares significa menos para este individuo que perder h dólares. FIGURA 7.1 Utilidad patrimonial de dos apuestas razonables de diferente variabilidad. Utilidad U(W) U(W0) EU(A) = U(CEA) EU(B) W0 – 2h W0 + h W0 W0 + h W0 + 2h Patrimonio (W) CEA mos una función de utilidad) que refleja cómo se siente un individuo respecto a varios niveles de patrimonio.9 En la figura, U(W) se traza como una función cóncava de W para reflejar el supuesto de una utilidad marginal decreciente. Supongamos ahora que a este individuo se le ofrecen dos apuestas razonables: la apuesta A, que es una posibilidad 50-50 de ganar o perder $h, y la apuesta B, que es una posibilidad 50-50 de ganar o perder $2h. La utilidad del patrimonio corriente es U(W0), el cual es también el valor esperado del patrimonio corriente porque este es seguro. La utilidad esperada si el individuo participa en la apuesta A está dada por EU(A): 1 1 EUðAÞ ¼ UðW0 þ hÞ þ UðW0 hÞ, 2 2 (7.16) y la utilidad esperada de la apuesta B está dada por EU(B): 1 1 EUðBÞ ¼ UðW0 þ 2hÞ þ UðW0 2hÞ. 2 2 (7.17) La ecuación 7.16 indica que la utilidad esperada de la apuesta A está a medio camino entre la utilidad del resultado desfavorable W0 h y la utilidad del resultado favorable W0 h. De igual manera, la utilidad esperada de la apuesta B está a medio camino entre las utilidades de los resultados desfavorable y favorable, aunque los beneficios de estos resultados varían más que con la apuesta A. 9 Técnicamente U(W) es una función de utilidad indirecta porque es el consumo permitido por el patrimonio que brinda utilidad directa. En el capítulo 17 se retomará la relación entre funciones de utilidad, basadas en el consumo y su utilidad indirecta implicada de funciones de patrimonio. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 216 Parte 3: Incertidumbre y estrategia De la figura se desprende claramente que, en términos geométricos,10 U(W0) EU(A) EU(B) (7.18) Por tanto, este individuo preferirá mantener su patrimonio corriente que hacer cualquiera de las apuestas razonables. Forzada a elegir una apuesta, preferirá la menor (A) a la mayor (B). La razón de esto es que ganar una apuesta razonable es menos disfrutable de lo que duele perder. Aversión al riesgo y seguros En la práctica un individuo podría estar dispuesto a pagar una cantidad para no participar en ninguna apuesta. Nótese que cierto patrimonio de CEA brinda la misma utilidad esperada que participar en la apuesta A. CEA se denomina equivalente de certidumbre de la apuesta A. El individuo estaría dispuesto a pagar hasta W0 CEA para no participar en la apuesta. Esto explica por qué los individuos compran seguros. Renuncia a un pequeña cantidad segura (la prima del seguro) para evitar el resultado riesgoso contra el que se asegura. La prima que paga un individuo por un seguro contra accidentes automovilísticos, por ejemplo, brinda una póliza en la que se acuerda que en caso de ocurrir un accidente su auto será reparado. El extendido uso de los seguros parecería implicar que la aversión al riesgo es frecuente. De hecho, el individuo en la figura 7.1 pagaría aún más para no hacer la apuesta mayor, B. Como ejercicio, intenta identificar el equivalente de certidumbre CEB de la apuesta B y la cantidad que el individuo pagaría para evitar la apuesta B en la figura. El análisis en esta sección puede sintetizarse en la definición siguiente. DEFINICIÓN Aversión al riesgo. De un individuo que siempre rechaza apuestas razonables se dice que tiene aversión al riesgo. Si los individuos exhiben una utilidad marginal decreciente de su patrimonio, presentarán aversión al riesgo. En consecuencia, estarán dispuestos a pagar algo para no hacer apuestas razonables. EJEMPLO 7.2 Disposición a pagar seguros Para ilustrar la relación entre la aversión al riesgo y los seguros, consideremos a un individuo con un patrimonio corriente de 100 000 dólares que enfrenta la perspectiva de una posibilidad de 25 por ciento de perder su automóvil, con valor de 20 000 dólares, por robo el próximo año. Supongamos también que la función de utilidad Von Neumann-Morgenstern de este individuo es logarítmica; esto es, U(W) ln (W). Si este individuo afronta el año próximo sin seguro, su utilidad esperada será EU(sin seguro) 0.75U(100 000) 0.25U(80 000) 0.75 ln 100 000 0.25 ln 80 000 11.45714 (7.19) En esta situación, una prima de seguro razonable sería de 5 000 dólares (25 por ciento de $20 000, suponiendo que la aseguradora sólo tiene costos de reclamación y que los costos administrativos son de 0 dólares). 10 Técnicamente, este resultado es consecuencia directa de la desigualdad de Jensen en la estadística matemática. Esta desigualdad establece que si x es una variable aleatoria y f(x) es una función estrictamente cóncava de esa variable, entonces E f(x) f E(x). En el contexto de la utilidad esto significa que si esta es cóncava en una variable aleatoria que mide el patrimonio (es decir, si U'(W) 0 y U''(W) 0), la utilidad esperada del patrimonio será menor que la asociada con el valor esperado de W. Con la apuesta A, por ejemplo, EU(A) U(W0) porque, como apuesta razonable, A brinda un patrimonio esperado de W0. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 217 En consecuencia, si este individuo asegura por completo su automóvil, su patrimonio será de 95 000 dólares, independientemente de si se lo roban. En este caso, entonces, EU (seguro razonable) U(95 000) ln (95 000) 11.46163 (7.20) Este individuo está en mejor situación adquiriendo un seguro razonable. En realidad, estaría dispuesto a pagar por el seguro más que la prima razonable. La prima máxima del seguro (x) puede determinarse estableciendo EU (prima máxima del seguro) U(100 000 x) ln(100 000 x) 11.45714 (7.21) Despejar x en esta ecuación produce 100 000 x e11.45714 (7.22) x 5 426. (7.23) o Este individuo estaría dispuesto a pagar hasta 426 dólares en costos administrativos a una aseguradora (además de la prima de 5 000 dólares para cubrir el valor esperado de la pérdida). Aun si se pagaran esos costos este individuo estaría en mejores condiciones que si enfrentara el mundo no asegurado. PREGUNTAS: Supóngase que la utilidad del patrimonio fuera lineal. ¿Este individuo estaría dispuesto a pagar por el seguro algo más que la cantidad actuarialmente razonable? ¿Qué podría decirse del caso en que la utilidad es una función convexa del patrimonio? MEDICIÓN DE LA AVERSIÓN AL RIESGO En el estudio de las decisiones económicas en situaciones de riesgo a veces es conveniente tener una medida cuantitativa de qué tan reacio al riesgo es un individuo. La medida de uso más común de aversión al riesgo fue inicialmente desarrollada por J. W. Pratt en la década de 1960.11 Esta medida de aversión al riesgo, r(W), se define como rðWÞ ¼ U 00 ðWÞ : U 0 ðWÞ (7.24) Dado que el rasgo distintivo de los individuos con aversión al riesgo es una utilidad marginal decreciente de su patrimonio U''(W) 0, la medida de Pratt es positiva en esos casos. Esta medida es invariante respecto a las transformaciones lineales de la función de utilidad y, por tanto, no se ve afectada por la ordenación particular Von Neumann-Morgenstern que se use. Aversión al riesgo y primas de seguros Un rasgo útil de la medida de aversión al riesgo de Pratt es que es proporcional a la cantidad que un individuo pagará por el seguro contra la realización de una apuesta razonable. Supongamos que los beneficios de esa apuesta razonable se denotan con la variable aleatoria h (la cual adopta 11 J. W. Pratt, “Risk Aversion in the Small and in the Large”, Econometrica (enero-abril 1964), pp. 122-136. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 218 Parte 3: Incertidumbre y estrategia valores tanto positivos como negativos). Dado que la apuesta es razonable, E(h) 0. Sea ahora p la magnitud de la prima de seguros que volvería al individuo exactamente indiferente entre hacer la apuesta razonable h y pagar p con certidumbre para evitar la apuesta: E U(W h) U(W p), (7.25) donde W es el patrimonio corriente del individuo. Desarrollemos ahora ambas partes de la ecuación 7.25 usando la serie de Taylor.12 Puesto que p es una cantidad fija, bastará con una aproximación lineal de la expresión del lado derecho de la ecuación: U(W p) U(W) pU(W) términos de orden superior (7.26) En cuanto a la expresión del lado izquierdo necesitamos una aproximación cuadrática que tome en cuenta la variabilidad en la apuesta, h: h2 00 0 E½UðW þ hÞ ¼ E UðWÞ þ hU ðWÞ þ U ðWÞ þ términos de orden superior (7.27) 2 ¼ UðWÞ þ EðhÞU 0 ðWÞ þ Eðh2 Þ 00 U ðWÞ þ términos de orden superior 2 (7.28) Si se recuerda que E(h) 0, se eliminan los términos de orden superior y se usa la constante k en representación de E(h2)/2, las ecuaciones 7.26 y 7.28 pueden igualarse como U(W) pU(W) U(W) kU(W) (7.29) o p kU 00 ðWÞ ¼ krðWÞ: U 0 ðWÞ (7.30) Es decir, la cantidad que un individuo renuente al riesgo está dispuesto a pagar para evitar una apuesta razonable es aproximadamente proporcional a la medida de aversión al riesgo de Pratt.13 Puesto que las primas de seguros pagadas son observables en la realidad, a menudo se les usa para estimar los coeficientes de aversión al riesgo o para comparar dichos coeficientes entre grupos de individuos. Por tanto, es posible usar información del mercado para saber un poco sobre las actitudes ante situaciones riesgosas. Aversión al riesgo y patrimonio Una cuestión importante es si la aversión al riesgo incrementa o disminuye con la riqueza. Intuitivamente podría pensarse que la disposición a pagar para evitar una apuesta razonable dada disminuye al incrementarse la riqueza, ya que la utilidad marginal decreciente volvería menos serias las pérdidas potenciales para los individuos muy ricos. Sin embargo, esta respuesta intuitiva no es necesariamente correcta porque la utilidad marginal decreciente también vuelve menos atractivos los beneficios de ganar apuestas. Por tanto, el resultado neto es indeterminado; todo depende de la forma precisa de la función de utilidad. En efecto, si la utilidad es cuadrática en el patrimonio, U(W) a bW cW2, (7.31) 12 La serie de Taylor brinda una manera de aproximar cualquier función diferenciable alrededor de algún punto. Si f(x) tiene derivadas de todos los órdenes, es posible demostrar que f (x h) f (x) hf '(x) (h2/2)f ''(x) términos de orden superior. La fórmula de punto y pendiente en álgebra es un ejemplo simple de la serie de Taylor. En este caso el factor de proporcionalidad también es proporcional a la varianza de h porque Var(h) E h E(h)2 E(h2). Para una ilustración en la que esta ecuación se ajusta exactamente, véase el ejemplo 7.3. 13 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 219 donde b 0 y c 0, así que la medida de aversión al riesgo de Pratt es rðWÞ ¼ U 00 ðWÞ 2c , ¼ U 0 ðWÞ b þ 2cW (7.32) lo cual, contra lo que indica la intuición, se incrementa al aumentar el patrimonio. Por otro lado, si la utilidad es logarítmica en el patrimonio, U(W) ln(W), (7.33) entonces tenemos rðWÞ ¼ U 00 ðWÞ 1 ¼ , 0 U ðWÞ W (7.34) que decrece al incrementarse el patrimonio. La función exponencial de utilidad U(W) eAW exp(AW) (7.35) (donde A es una constante positiva) exhibe aversión al riesgo constante absoluta en todos los rangos patrimoniales, porque ahora rðWÞ ¼ U 00 ðWÞ A2 eAW ¼ ¼ A: U 0 ðWÞ AeAW (7.36) Este rasgo de la función exponencial de utilidad14 puede usarse para ofrecer algunas estimaciones numéricas de la disposición a pagar para evitar apuestas, como lo muestra el ejemplo siguiente. EJEMPLO 7.3 Aversión al riesgo constante Supongamos que un individuo cuyo patrimonio inicial es W0 y cuya función de utilidad muestra aversión al riesgo constante absoluta enfrenta una posibilidad de 50-50 de ganar o perder 1 000 dólares. ¿Cuánta (f ) pagaría para evitar el riesgo? Para determinar este valor la utilidad de W0 f se iguala con la utilidad esperada de la apuesta: exp½AðW 0 f Þ ¼ 0:5 exp½AðW 0 þ 1000Þ 0:5 exp½AðW 0 1 000Þ (7.37) Debido a que el factor exp(AW0) está contenido en todos los términos de la ecuación 7.37 ésta puede dividirse, mostrando así que (para la función exponencial de utilidad) la disposición a pagar para evitar una apuesta dada es independiente del patrimonio inicial. Los términos restantes expðAf Þ ¼ 0:5 expð1 000AÞ þ 0:5 expð1 000AÞ (7.38) pueden usarse ahora para despejar f en busca de varios valores de A. Si A 0.0001, entonces f 49.9; un individuo con este grado de aversión al riesgo pagaría aproximadamente 50 dólares para evitar una apuesta razonable de 1 000. O bien, si A 0.0003, este individuo resistente al riesgo pagaría f 147.8 por evitar la apuesta. Como la intuición sugiere que estos valores no son irrazonables, los valores del parámetro de aversión al riesgo A en estos rangos se usan a veces para investigaciones empíricas. Riesgo normalmente distribuido. La función de utilidad de aversión al riesgo constante puede combinarse con el supuesto de que un individuo enfrenta un impacto aleatorio a su patrimonio, el cual sigue 14 Dado que la función exponencial de utilidad exhibe aversión al riesgo constante (absoluta), esto suele abreviarse con el término utilidad ARCA. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 220 Parte 3: Incertidumbre y estrategia una distribución normal (véase el capítulo 2) para llegar a un resultado particularmente simple. Específicamente, si el patrimonio en riesgo de un individuo sigue una distribución normal con media y varianza 2 2, la función de densidad de probabilidad del patrimonio está dada por f (W) (1/ 2)ez /2, donde z (W )/. Si este individuo tiene una función de utilidad de su patrimonio dada por U(W) eAW, la utilidad esperada de su patrimonio en riesgo es 1 ð E½UðWÞ ¼ 1 ð 2 1 UðWÞf ðWÞ dW ¼ pffiffiffiffiffi eAW e½ðWlÞ=r =2 dW: 2p (7.39) Quizá, sorpresivamente, esta integración no sea demasiado difícil de hacer, aunque requiere paciencia. Realizar esta integración y tomar una variedad de transformaciones monótonas de la expresión resultante produce el resultado final de que E½UðW Þ ffi l Ar2 : 2 (7.40) De ahí que la utilidad esperada sea una función lineal de los dos parámetros de la función de densidad de probabilidad del patrimonio, y que el parámetro de aversión al riesgo del individuo (A) determine la magnitud del efecto negativo de variabilidad en la utilidad esperada. Por ejemplo, supongamos que un individuo ha invertido sus fondos de tal manera que su patrimonio tiene un valor esperado de 100 000 dólares pero una desviación estándar () de $10 000. Por tanto, con la distribución normal, este individuo podría esperar que su patrimonio decreciera por debajo de los 83 500 dólares en alrededor de 5 por ciento de los casos, y que se incrementara por encima de los 116 500 dólares en una fracción similar de los casos. Con estos parámetros la utilidad esperada está dada por E[U(W)] 100 000 (A/2)(10 000)2. Si A 0.0001 104, la utilidad esperada está dada por 100 000 0.5 ∙ 104 ∙ (104)2 95 000. De ahí que este individuo reciba la misma utilidad de su patrimonio en riesgo que la que obtendría de un patrimonio seguro de 95 000 dólares. Un individuo con mayor aversión al riesgo podría tener A 0.0003, y en este caso el equivalente de certidumbre de su patrimonio sería de 85 000 dólares. PREGUNTA: Supongamos que un individuo tiene dos formas de invertir su patrimonio: asignación 1, 1 107 000 y 1 10 000; asignación 2, 2 102 000 y 2 2 000. ¿Cómo afectaría su actitud ante el riesgo, su decisión entre estas asignaciones?15 Aversión al riesgo relativa Parece improbable que la disposición a pagar para evitar una apuesta dada sea independiente del patrimonio de un individuo. Un supuesto más atractivo podría ser que esa disposición a pagar es inversamente proporcional al patrimonio y que la expresión rrðWÞ ¼ WrðWÞ ¼ W U 00 ðWÞ U 0 ðWÞ (7.41) es aproximadamente constante. Siguiendo la terminología propuesta por J. W. Pratt,16 la función rr(W) definida en la ecuación 7.41 es una medida de aversión al riesgo relativa. La función de potencias de utilidad UðW, RÞ ¼ W R =R ln W si R < 1, R 6¼ 0 si R ¼ 0 (7.42) 15 Este ejemplo numérico aproxima (más o menos) datos históricos de rendimientos reales de acciones y bonos, respectivamente, aunque los cálculos son meramente ilustrativos. 16 Pratt, “Aversión al riesgo”. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 221 muestra una aversión al riesgo absoluta decreciente, rðWÞ ¼ U 00 ðWÞ ðR 1ÞW R2 1 R , ¼ ¼ 0 U ðWÞ W W R1 (7.43) pero aversión al riesgo constante relativa:17 rr(W) Wr(W) 1 R. (7.44) La evidencia empírica es generalmente congruente con valores de R en el rango de 3 a 1. De ahí que los individuos parezcan algo más renuentes al riesgo de lo que implica la función logarítmica de utilidad, aunque en muchas aplicaciones esta función brinda una aproximación razonable. Cabe señalar que la función de utilidad de aversión al riesgo constante relativa en la ecuación 7.42 tiene la misma forma que la función de utilidad ESC general, descrita en el capítulo 3. Esto brinda cierta intuición geométrica sobre la naturaleza de la aversión al riesgo que se explorará más adelante. EJEMPLO 7.4 Aversión relativa al riesgo constante Un individuo cuyo comportamiento se caracteriza por una función de utilidad de aversión relativa al riesgo constante se interesará en beneficio o pérdidas proporcionales de la riqueza. Por tanto, podemos preguntarnos a qué fracción de su patrimonio inicial (f ) estaría dispuesto a renunciar para evitar una apuesta razonable de, digamos, 10 por ciento de dicho patrimonio. Primero suponemos I 0, por tanto, la función logarítmica de utilidad es apropiada. Igualar la utilidad del patrimonio restante seguro de este individuo con la utilidad esperada de la apuesta de 10% produce ln½ð1 f ÞW0 ¼ 0:5 ln ð1:1W0 Þ þ 0:5 ln ð0:9W0 Þ: (7.45) Puesto que cada término contiene W0, el patrimonio inicial puede eliminarse de esta expresión: lnð1 f Þ ¼ 0:5½lnð1:1Þ þ lnð0:9Þ ¼ ln ð0:99Þ0:5 ; de ahí que ð1 f Þ ¼ ð0:99Þ0:5 ¼ 0:995 y f 0.005. (7.46) Por tanto, este individuo sacrificará hasta 0.5% de su patrimonio para evitar la apuesta de 10%. Un cálculo similar puede usarse para el caso R 2, lo que produce f 0.015. (7.47) De ahí que este individuo más renuente al riesgo esté dispuesto a renunciar a 1.5% de su patrimonio inicial para evitar una apuesta de 10 por ciento. PREGUNTA: Con la función de aversión relativa al riesgo constante ¿cómo depende la disposición de este individuo a pagar para evitar una apuesta absoluta dada (de 1 000, por decir algo) de su patrimonio inicial? 17 Algunos autores escriben la función de utilidad en la ecuación 7.42 como U(W) W1a/(1 a) e intentan medir a 1 I. En este caso, a es la medida de aversión al riesgo relativa. La función de aversión al riesgo constante relativa suele abreviarse como utilidad ARCR. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 222 Parte 3: Incertidumbre y estrategia MÉTODOS PARA REDUCIR LA INCERTIDUMBRE Y EL RIESGO Hemos visto que los individuos con aversión al riesgo evitarán las posibles apuestas y otras situaciones arriesgadas. Pero a menudo es imposible evitar el riesgo por completo. Cruzar la calle implica cierto riesgo de daños. Enterrar el patrimonio propio en el patio trasero no es una estrategia de inversión perfectamente segura, ya que aún existe cierto riesgo de robo (para no hablar de la inflación). Nuestro análisis hasta ahora implica que los individuos estarían dispuestos a pagar algo por reducir al menos esos riesgos si no los puede evitar por entero. En las cuatro secciones siguientes se estudiarán por separado cuatro métodos que pueden seguir los individuos para mitigar el problema del riesgo y la incertidumbre: seguros, diversificación, flexibilidad e información. SEGUROS Ya hemos analizado una de estas estrategias: comprar un seguro. Los individuos con aversión al riesgo pagarían una prima para que la aseguradora cubra el riesgo de pérdida. Cada año los estadounidenses gastan más de medio billón de dólares en seguros de todo tipo. Más comúnmente, compran cobertura para su vida, su hogar y sus automóviles y para sus costos de atención a la salud. No obstante es posible comprar un seguro (quizá a un precio alto) para cubrir prácticamente cualquier riesgo imaginable; seguros que van desde aquellos contra sismos para una casa que esté construida sobre una falla tectónica, hasta los de cobertura especial como, por ejemplo, un seguro que cubra a un cirujano contra la posibilidad de lesionarse una o las dos manos. Un individuo con aversión al riesgo querría comprar siempre seguros razonables para cubrir cualquier riesgo que enfrente. Ninguna aseguradora podría subsistir si ofreciera seguros razonables (en el sentido de que la prima equivalga exactamente al pago esperado por las reclamaciones). Además de cubrir reclamaciones las aseguradoras también deben mantener registros, cobrar primas, investigar fraudes y tal vez devolver beneficios a los accionistas. De ahí que el cliente de seguros siempre pueda esperar pagar más que una prima actuarialmente razonable. Si los individuos son muy resistentes al riesgo, comprarán incluso seguros irrazonables, como se mostró en el ejemplo 7.2; cuanto más resistente al riesgo sea, mayor será la prima que esté dispuesta a pagar. Varios factores dificultan o imposibilitan proporcionar seguros. Desastres a gran escala, como huracanes y guerras, pueden resultar en pérdidas tan grandes que las aseguradoras quebrarían antes de poder pagar todas las reclamaciones. Sucesos raros e impredecibles (como guerras o accidentes en plantas nucleares) ofrecen a las aseguradoras antecedentes confiables para establecer primas. Otras dos razones de la ausencia de cobertura de seguros tienen que ver con la desventaja informativa que una compañía puede tener en relación con el cliente. En algunos casos un individuo puede saber sobre la probabilidad de sufrir una pérdida más que la aseguradora. Sólo los “peores” clientes (quienes esperan pérdidas mayores o más probables) podrían terminar comprando una póliza de seguros. Este problema de selección adversa puede trastornar todo el mercado de los seguros a menos que la compañía encuentre la manera de controlar quién compra (mediante algún tipo de filtramiento o coacción). Otro problema es que tener seguro puede volver menos dispuestos a los clientes a dar los pasos necesarios para evitar pérdidas, conduciendo, por ejemplo, de manera más temeraria al tener un seguro de automóvil o consumiendo alimentos grasosos o fumando al poseer un seguro médico. Ese, así llamado, problema de riesgo moral también puede perjudicar al mercado de los seguros, si las aseguradoras no hallan la manera de monitorear a bajo costo el comportamiento de sus clientes. Analizaremos en más detalle los problemas de selección adversa y riesgo moral en el capítulo 18, así como las formas en que las aseguradoras pueden combatirlos, las que además de las estrategias anteriores también incluyen ofrecer sólo un seguro parcial y requerir el pago de deducibles y copagos. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 223 DIVERSIFICACIÓN Un segundo modo en que los individuos con aversión al riesgo pueden reducir el riesgo es la diversificación. Este es el principio económico detrás del adagio “No pongas todos los huevos en una sola canasta”. Disipando convenientemente el riesgo es posible reducir la variabilidad de un resultado sin aminorar el beneficio esperado. El marco más conocido para la diversificación es la inversión. A los inversionistas se les aconseja rutinariamente “diversificar su cartera”. Para comprender lo atinado de este consejo, consideremos un ejemplo en el que un individuo tiene un patrimonio W para invertir. Este dinero puede invertirse en dos activos riesgosos independientes, 1 y 2, con igual valor esperado (los rendimientos medios son 1 2) e igual varianza (las varianzas son 12 22). Un individuo cuya cartera no diversificada, CND, incluye sólo uno de esos activos (poniendo así todos los “huevos” en esa “canasta”) obtendría un rendimiento esperado de UP 1 2 y enfrentaría una varianza de 2 12 22. CND Supongamos, en cambio, que este individuo elige una cartera diversificada, CD. Sea 1 la fracción invertida en el primer activo y 2 1 1 en el segundo. Veremos que a este individuo puede irle mejor que con la cartera no diversificada en el sentido de que obtiene una varianza menor sin variar el rendimiento esperado. El rendimiento esperado de la cartera diversificada no depende de la asignación entre activos y es el mismo que para cualquiera de estos activos en particular: CD 11 (1 1)2 1 2. (7.48) Para analizar esto remitámonos a las reglas para el cálculo de valores esperados del capítulo 2. La varianza dependerá de la asignación entre los dos activos: 2CD 2 2 11 (1 2 2 1) 2 (1 2 1 2 12)12. (7.49) También este cálculo puede entenderse repasando la sección sobre varianzas del capítulo 2. Ahí podrás estudiar los dos “hechos” que se usan en este cálculo: primero, que la varianza de una constante multiplicada por una variable aleatoria es esa constante al cuadrado por la varianza de una variable aleatoria; segundo, que la varianza de variables aleatorias independientes, debido a que su covarianza es de 0, es igual a la suma de las varianzas. r2 1 Elegir 1 para minimizar la ecuación 7.49 produce 1 2 y r2CD ¼ 21 . Por tanto la cartera óptima divide el patrimonio en partes iguales entre los dos activos, manteniendo el mismo rendimiento esperado que una cartera no diversificada pero reduciendo la varianza a la mitad. La diversificación funciona aquí porque los rendimientos de los activos son independientes. Cuando un rendimiento es bajo existe la posibilidad de que el otro sea alto, y viceversa. De este modo los rendimientos extremos se equilibran en al menos parte del tiempo, reduciendo la varianza general. La diversificación operará de esta manera mientras no haya una correlación perfecta en los rendimientos de los activos de tal manera que, en efecto, no sean el mismo activo. Cuanto menos correlacionados estén los activos mejor funcionará la diversificación para reducir la varianza de la cartera general. Este ejemplo, elaborado para destacar los beneficios de la diversificación en la forma más simple posible, tiene el elemento artificial de que los rendimientos de los activos se suponen iguales. La diversificación fue en este caso una “comida gratis”, en el sentido de que la varianza de la cartera podría reducirse sin reducir el rendimiento esperado en comparación con una cartera no diversificada. Si el rendimiento esperado de uno de los activos (el activo 1, por ejemplo) es más alto que el otro la diversificación dejará de ser, en el otro activo, una “comida gratis” y resultaría en un menor rendimiento esperado. Aun así, los beneficios de reducción del riesgo pueden ser tan grandes como para que un inversionista resistente al riesgo esté dispuesto a poner parte de su patrimonio en el activo con menor rendimiento esperado. Un ejemplo práctico de esta idea se relaciona con el consejo que se le daría al empleado de una empresa con un plan de adquisición de acciones. Aun si el plan permite que los empleados compren títulos de las acciones de capital de la compañía con un generoso descuento en comparación con el mercado, tal vez fuera conveniente recomen- Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 224 Parte 3: Incertidumbre y estrategia darles a los empleados no invertir todos sus ahorros en esas acciones, pues de lo contrario sus ahorros completos —para no hablar de su sueldo e incluso del valor de su casa (en la medida en que el valor de las residencias depende de la solidez de los negocios en la economía local)— estarían atados a la suerte de una sola compañía, lo que generaría un enorme grado de riesgo. En las extensiones de este capítulo se ofrece un análisis mucho más general del problema de elegir la cartera óptima. Sin embargo, el principio de diversificación se aplica a una gama mucho más amplia de situaciones que los mercados financieros. Por ejemplo, los estudiantes indecisos acerca de sus intereses o respecto a cuáles de sus habilidades les serán útiles en el mercado del empleo harían bien en inscribirse en muy diversos cursos más que en cursos exclusivamente técnicos o artísticos. FLEXIBILIDAD La diversificación es un método útil para reducir el riesgo de una persona que puede dividir una decisión, asignando cantidades reducidas de una suma mayor entre varias opciones. En algunas situaciones, sin embargo, una decisión no puede dividirse: es todo o nada. Por ejemplo, al comprar un automóvil, el consumidor no puede combinar los atributos que le agradan de un modelo (digamos eficiencia de combustible) con los de otro (digamos caballos de fuerza o ventanillas eléctricas) comprando la mitad de cada cual; los autos se venden como una unidad. En el caso de decisiones de todo o nada, el tomador de decisiones puede obtener parte del beneficio de la diversificación tomando decisiones flexibles. La flexibilidad permite al individuo ajustar la decisión inicial, dependiendo de cómo se desenvuelva el futuro. Cuanto más incierto es el futuro, más valiosa es la flexibilidad. Esta impide que el consumidor se ate un solo curso de acción y ofrece, en cambio, varias acciones. El consumidor puede elegir la opción que mejor se acomode a las circunstancias posteriores. Un buen ejemplo del valor de la flexibilidad es considerar los combustibles con que operan los automóviles. Hasta ahora la mayoría de los autos estaban limitados en lo que se refiere a cuánto biocombustible (como el etanol de origen vegetal) podía combinarse con productos (como la gasolina o el diésel). El comprador de un vehículo de ese tipo tendría dificultades si el gobierno aprobara reglamentos que incrementaran el índice de etanol en los combustibles para autos o si prohibieran por entero los productos derivados del petróleo. Ya se han diseñado automóviles capaces de quemar exclusivamente etanol, pero no son útiles en caso de que prevalezcan las condiciones actuales porque en la mayoría de las gasolineras no se vende combustible con altas concentraciones de etanol. Un tercer tipo de vehículos tiene componentes internos que pueden funcionar con varios tipos de combustible, tanto derivados del petróleo como etanol, y en cualquier proporción. Estos autos son costosos de fabricar debido a los componentes especializados implicados, pero un consumidor podría pagar de todas maneras el costo adicional pues el auto sería útil aun si los biocombustibles no se volvieran más importantes durante su periodo de vida útil.18 Tipos de opciones La posibilidad de que los automóviles de “combustible flexible” quemen cualquier combinación de combustibles derivados del petróleo y biocombustibles es valiosa porque brinda a los dueños más opciones en relación con un auto que sólo puede operar con un tipo de combustible. Es probable que ya conozcas la noción de que las opciones son valiosas gracias a otro contexto en el que este término se usa con frecuencia —el de los mercados financieros—, donde se oye hablar de opciones sobre acciones y otras formas de contratos de opciones. Existe una estrecha relación entre la opción contenida en los autos de combustible flexible y estos contratos de opciones que investigaremos con más detalle. Pero antes de analizar las semejanzas entre las opciones surgidas de diferentes contextos, presentaremos algunos términos para distinguirlas. 18 Aunque la actual generación de automóviles de combustible flexible implica tecnología de punta, el primer coche de esa clase, producido en 1908, fue el Modelo T de Henry Ford, uno de los autos más vendidos de todos los tiempos. La disponibilidad de gasolina de bajo costo quizá haya inclinado el mercado hacia los autos de la competencia, de un solo tipo de combustible lo cual significó la ruina del Modelo T. Para más información sobre la historia de este modelo, véase L. Brooke, Ford Model T: The Car That Put the World on Wheels (Motorbooks, Mineápolis, 2008). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre DEFINICIÓN DEFINICIÓN 225 Contrato de opciones financieras. Un contrato de opciones financieras ofrece el derecho, aunque no la obligación, de comprar o vender un activo (como un título de acciones de capital) en un periodo futuro a determinado precio. Opción real. Una opción real es una opción surgida en un marco ajeno a los mercados financieros. El automóvil de combustible flexible puede verse como un auto ordinario combinado con una opción real adicional de quemar biocombustibles, si estos se vuelven más importantes en el futuro. Los contratos de opciones financieras se presentan en varias formas, algunas de las cuales pueden ser complejas. También existen muchos tipos de opciones reales, surgidas en diversos ámbitos, lo que a veces dificulta determinar con exactitud qué tipo de opción está inserta en la situación. Aun así, todas las opciones comparten tres atributos fundamentales. Primero, especifican la transacción subyacente, trátese de una acción por negociar, o de un automóvil o combustible por adquirir. Segundo, especifican un periodo en el que la opción puede ejercerse. Una opción sobre acciones puede especificar un periodo de 1 año, por ejemplo. La opción inserta en un auto de combustible flexible preserva la opción del dueño durante la vida operativa del vehículo. Mientras más largo es el periodo cubierto por la opción, más valiosa es ésta, porque mayor es también la incertidumbre que puede resolverse durante ese periodo. Tercero, el contrato de opciones especifica un precio. Una opción sobre acciones podría venderse a un precio de 70 dólares. Si esta se comercia más tarde en una bolsa de valores su precio podría variar de un momento a otro, según el movimiento de los mercados. Las opciones reales no suelen tener precios explícitos, pero a veces pueden calcularse precios implícitos. Por ejemplo, si un auto de combustible flexible cuesta 5 000 dólares más que un auto, por lo demás equivalente, que sólo quema un tipo de combustible, estos 5 000 dólares podrían verse como el precio de la opción. Modelo de opciones reales Concedamos que x incorpora toda la incertidumbre en el entorno económico. En el caso del auto de combustible flexible, x podría reflejar el precio de los combustibles fósiles en relación con los biocombustibles o con el rigor de la regulación gubernamental de combustibles fósiles. En términos de la sección sobre estadística del capítulo 2, x es una variable aleatoria (también conocida como “englobadora de cada elemento del espacio muestral”) que puede adoptar muchos valores diferentes. Un individuo tiene cierto número, I 1, … , n, de opciones a su disposición. Sea Ai(x) los beneficios provistos por la opción i, donde el argumento (x) permite a cada opción brindar un patrón distinto de rendimientos dependiendo de cómo resulte el futuro. La figura 7.2a ilustra el caso de dos opciones. La primera opción ofrece un beneficio decreciente al incrementarse x, indicado por la pendiente descendente de A1. Esto podría corresponder a la propiedad de un auto que sólo opera con combustibles fósiles; al volverse más importantes los biocombustibles que los combustibles fósiles, el valor de un vehículo que sólo quema combustibles fósiles decrece. La segunda opción brinda un beneficio creciente, correspondiente tal vez a la propiedad de un auto que sólo opera con biocombustibles. La figura 7.2b traduce los beneficios en utilidades (de Von Neumann-Morgenstern) que el individuo obtiene de los beneficios graficando U(Ai) más que Ai. La inclinación introducida al pasar de beneficios a utilidades refleja la utilidad marginal decreciente de beneficios más altos para un individuo con aversión al riesgo. Si un individuo no tiene la flexibilidad provista por una opción real debe tomar la decisión antes de observar cómo resulta el estado x. Este individuo debe elegir la mejor alternativa en promedio. Su utilidad esperada de esta decisión es maxfE½UðA1 Þ, . . . , E½UðAn Þg: Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (7.50) 8/23 226 Parte 3: Incertidumbre y estrategia FIGURA 7.2 Naturaleza de una opción real. El panel a) muestra los beneficios y el panel b) las utilidades provistas por dos alternativas a través de las situaciones del mundo (x). Si la decisión debe ser tomada al principio, se elige la curva con la más alta utilidad esperada. Si la opción real de tomar cualquier decisión puede preservarse hasta después, se puede obtener la utilidad esperada de la envolvente superior de las curvas, el cual aparece resaltado. Beneficio Utilidad A2 U(A2) U(A1) A1 x′ x′ Estado x a) Beneficios de alternativas Estado x b) Utilidades de alternativas La figura 7.2 no proporciona información suficiente para juzgar cuál utilidad esperada es más alta porque no conocemos las probabilidades de las diferentes x, pero si las x son más o menos igualmente probables, todo indica que el individuo elegiría la segunda alternativa, la cual brinda una utilidad más alta en un rango mayor. La utilidad esperada del individuo procedente de esta decisión es E[U(A2)]. Si, por otro lado, la opción real puede preservarse para tomar una decisión que indique el espacio muestral en que x ha ocurrido, el individuo estará en mejores condiciones. En la aplicación del automóvil la opción real podría corresponder a comprar un auto de combustible flexible, lo cual no ata al comprador a un solo combustible, sino que permite optar por el combustible que resulte más común o menos costoso en el periodo de vida útil del vehículo. En la figura 7.2, en vez de elegir una sola alternativa, el individuo elegiría la primera opción si x x, y la segunda si x x'. La utilidad provista por esta estrategia está dada por la curva resaltada, la cual es la “envolvente superior” de las curvas de las opciones particulares. Con un número general (n) de opciones, la utilidad esperada de esta envolvente superior de opciones particulares es Efmax½UðA1 Þ, . . . , UðA1 Þg: (7.51) La utilidad esperada en la ecuación 7.51 es más alta que en la 7.50. Esto podría no ser obvio a primera vista, pues parecería que el simple intercambio del orden de las expectativas y los operadores “max” no debería hacer ninguna diferencia. Pero sí la hace. Mientras que la ecuación 7.50 es la utilidad esperada, asociada con la mejor curva de utilidad, la ecuación 7.51 es la utilidad esperada asociada con la envolvente superior de todas las curvas de utilidad.19 19 Este resultado puede comprobarse formalmente usando la desigualdad de Jensen, presentada en la nota 10. En esta última se analizaron las implicaciones de la desigualdad de Jensen para las funciones cóncavas: E[ f (x)] f [E(x)]. La desigualdad de Jensen tiene la implicación inversa para las funciones convexas: E[ f (x)] f [E(x)]. En otras palabras, para funciones convexas, el resultado es mayor si el operador de expectativas se aplica fuera de la función que si el orden de ambas se invierte. En el contexto de las opciones el operador “max” tiene las propiedades de una función convexa. Esto puede verse en la figura 7.2b donde tomar la envolvente superior “convexifica” las curvas particulares dándoles más forma de V. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre FIGURA 7.3 Más opciones no pueden dejar en peores condiciones al tomador de decisiones. 227 La adición de una tercera alternativa a las dos representadas en la figura 7.2 es valiosa en a) porque desplaza hacia arriba la envolvente superior (resaltada) de las utilidades. La nueva alternativa es despreciable en b) porque no desplaza la superior, pero el individuo no está en peores condiciones por tenerla. Utilidad Utilidad U(A3) U(A2) U(A2) U(A3) U(A1) U(A1) Estado x Estado x a) Opción adicional valiosa b) Opción adicional despreciable Más opciones son mejores (por lo general) Añadir opciones nunca puede hacer daño a un tomador de decisiones individual (mientras no se le cobre por ellas), porque las opciones adicionales siempre pueden ser ignoradas. Esta es la esencia de las opciones: dan al tenedor el derecho —pero no la obligación— de elegirlas. La figura 7.3 ilustra este punto, mostrando el efecto de añadir una tercera opción a las dos representadas en la figura 7.2. En el primer panel el individuo se beneficia estrictamente de la tercera opción porque hay algunos espacios muestrales (los valores más altos de x en la figura) para los cuales es mejor que cualquier otra alternativa, desplazando hacia arriba la envolvente superior de las utilidades (la curva resaltada). La tercera opción es despreciable en el segundo panel. Aunque la tercera opción no es la peor para muchos estados o situaciones del espacio muestral, nunca es la mejor, así que tampoco mejora la envolvente superior de las utilidades en relación con la figura 7.2. Aun así la adición de la tercera opción no es perjudicial. Este discernimiento podría no sostenerse en un marco estratégico con múltiples tomadores de decisiones. En un marco estratégico los actores económicos podrían beneficiarse de la eliminación de algunas de sus opciones. Esto quizá le permita a un actor comprometerse con un curso de acción más estrecho que el que hubiera elegido de otra manera, y este compromiso podría afectar las acciones de otras partes, posiblemente en beneficio de la parte que asumió el compromiso. Una ilustración famosa de este punto es provista en uno de los tratados de estrategia militar más antiguos, cuyo autor es Sun Tzu, general chino que escribió en el año 400 a.C. Parece insensato que un ejército destruya todos los medios de repliegue, quemando puentes tras de sí y hundiendo sus naves, entre otras medidas. Pero esto es lo que Sun Tzu recomendaba como táctica militar. Si el segundo ejército observa que el primero no podrá retirarse y que combatirá a muerte, podría retirarse él mismo antes de trabar combate con el primero. Analizaremos más formalmente cuestiones estratégicas como ésta en el capítulo siguiente que se refiere a la teoría del juego. Cálculo del valor de las opciones Podemos llevar más lejos el análisis para derivar una expresión matemática para el valor de una opción real. Sea F la cuota por pagar por la posibilidad de elegir la mejor alternativa después de realizada x en vez de antes. Un individuo estaría dispuesto a pagar esa cuota siempre y cuando Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 228 Parte 3: Incertidumbre y estrategia Efmax ½UðA1 ðxÞ FÞ, . . . , ½UðAn ðxÞ FÞg maxfE½UðA1 ðxÞÞ, . . . , E½UðAn ðxÞÞg: (7.52) La expresión de la derecha es la utilidad esperada de tomar la decisión de antemano, repetida de la ecuación 7.50. La expresión de la izquierda permite que la decisión se tome después de ocurrir x, un beneficio, pero se resta la cuota de la opción a cada beneficio. Naturalmente se supone que la cuota se paga por adelantado, lo que reduce el patrimonio en F sea cual sea la opción que se elija después. El valor de la opción real es la F más alta para la cual la ecuación 7.52 sigue satisfaciéndose, misma que, desde luego, es la F para la cual la condición se mantiene con la igualdad. EJEMPLO 7.5 Valor de un automóvil de combustible flexible Determinemos el valor de la opción provista por un automóvil de combustible flexible en un ejemplo numérico. Sea A1(x) 1 x el beneficio de un auto que sólo opera con combustibles fósiles y A2(x) x el beneficio de un auto que opera únicamente con biocombustibles. El espacio muestral, x, refleja la relativa importancia de los biocombustibles en comparación con los combustibles fósiles durante el periodo de vida útil del automóvil. Supongamos que x es una variable aleatoria uniformemente distribuida entre 0 y 1 (la variable aleatoria continua más simple con la cual trabajar aquí). La sección sobre estadística del capítulo 2 brinda ciertos detalles sobre la distribución uniforme, mostrando que la función de densidad de probabilidad (FDP) es f (x) 1 en el caso especial en que la variable aleatoria uniforme va de 0 a 1. Neutralidad al riesgo. Para facilitar lo más posible los cálculos en un principio, supongamos primero que el comprador del auto es neutral al riesgo, obteniendo un nivel de utilidad igual al nivel de beneficio. Supongamos que el comprador se ve obligado a elegir un auto para biocombustible. Esto ofrece una utilidad esperada de x¼1 ð1 ð1 x2 1 E½A2 ¼ A2 ðxÞf ðxÞ dx ¼ x dx ¼ ¼ , (7.53) 2 2 0 0 x¼0 donde la integral se simplifica gracias a que f (x) 1. Cálculos similares muestran que la utilidad esperada de la compra de un automóvil para combustibles fósiles también es de 1/2. Así, si sólo se dispone de autos para un solo tipo de combustible, el individuo será indiferente entre ellos, obteniendo una utilidad esperada de 1/2 de cualquiera. Supongamos ahora que es posible disponer de un auto de combustible flexible, lo cual permite obtener A1(x) o A2(x), la que sea más alta en las circunstancias más actuales. La utilidad esperada por el comprador de este auto es ð1 ð1 ð1 2 E½maxðA1 , A2 Þ ¼ maxð1 x, xÞ f ðxÞ dx ¼ ð1 xÞ dx þ x dx 0 0 ¼2 ð1 1 2 x¼1 3 x dx ¼ x2 x¼1 ¼ . 2 4 1 2 (7.54) La segunda línea de la ecuación 7.54 se desprende del hecho de que las dos integrales en la expresión precedente son simétricas. Como la utilidad del comprador es exactamente igual a los beneficios, podemos calcular directamente el valor de la opción del auto de combustible flexible, tomando la diferencia entre los beneficios esperados en las ecuaciones 7.53 y 7.54, que es igual a 1/4. Este es el recargo máximo que un individuo pagaría por el auto de combustible flexible, sobre un auto para un solo tipo de combustible. Si se escalan los beneficios a niveles más realistas multiplicando por, digamos, 10 000 dólares, el recargo sobre el precio (y el valor de la opción) del auto de combustible flexible sería de 2 500 dólares. Este cálculo muestra el discernimiento general de que las opciones son una manera de enfrentar la incertidumbre que posee valor, aun para individuos neutrales al riesgo. En la parte siguiente de este ejemplo se investigará si la aversión al riesgo vuelve más o menos valiosas las opciones. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 229 Aversión al riesgo. Supongamos ahora que el comprador es resistente al riesgo, con la función de utilidad de Von Neumann-Morgenstern U(x) x. La utilidad esperada del comprador de un auto para biocombustible es x¼1 ð 1 pffiffiffiffiffiffiffiffiffiffiffiffi ð1 2 3 2 1 2 2 ¼ , A2 ðxÞ f ðxÞ dx ¼ x dx ¼ x E½UðA2 Þ ¼ 3 3 0 0 x¼0 (7.55) la misma que la de un auto para combustibles fósiles, como demuestran cálculos similares. Por tanto, un auto para un solo tipo de combustible brinda una utilidad esperada de 2/3. La utilidad esperada de un auto de combustible flexible que cuesta F más que un auto para un solo tipo de combustible es Efmax½UðA1 ðxÞ FÞ, UðA2 ðxÞ FÞg ¼ ð1 pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi pffiffiffiffiffiffiffiffiffiffiffi maxð 1 x F , x F Þf ðxÞ dx 0 ð 1 pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi ð 1 pffiffiffiffiffiffiffiffiffiffiffi ð 1 pffiffiffiffiffiffiffiffiffiffiffi 2 ¼ 1 x F dx þ x F dx ¼ 2 x F dx 1 2 0 1 2 4 3 u¼1F 1 ¼2 u2 du ¼ u2 1 3 u¼1F 2F 2 " 32 # 3 4 1 F . ¼ ð1 FÞ2 3 2 ð 1F (7.56) FIGURA 7.4 Método gráfico para calcular el recargo para un auto de combustible flexible Para determinar el recargo máximo F que el comprador resistente al riesgo estaría dispuesto a pagar por el auto de combustible flexible se traza la utilidad esperada de un auto para un solo tipo de combustible de la ecuación 7.55 y del auto de combustible flexible de la ecuación 7.56 y se ve el valor de F donde las curvas se cruzan. Utilidad esperada 1.0 0.9 0.8 0.7 Un solo tipo de combustible 0.6 0.5 Combustible flexible 0.4 0.3 0.2 0.1 0.0 0.00 0.10 0.20 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 0.30 23.08.2019 0.40 0.50 F 8/23 230 Parte 3: Incertidumbre y estrategia Los cálculos implicados en la ecuación 7.56 son algo complejos y requieren, por tanto, cierto análisis. La segunda línea se apoya en la simetría de las dos integrales que aparecen ahí, lo que nos permite colapsarlas en dos veces el valor de una de ellas, y nosotros elegimos la más simple de las dos con estos propósitos. La tercera línea usa el cambio de variables u x F para simplificar la integral. (Véase la ecuación 2.135 del capítulo 2 para otro ejemplo del truco de cambio de variables y análisis adicionales.) Para hallar el recargo máximo que el comprador pagaría por un auto de combustible flexible podemos igualar las ecuaciones 7.55 y 7.56 y despejar F. Lamentablemente, la ecuación resultante es demasiado complicada para resolverla en forma analítica. Un método simple consiste en graficar la última línea de la ecuación 7.56 para un rango de valores de F y mirar de arriba abajo para determinar dónde ofrece la gráfica el valor requerido de 2/3 de la ecuación 7.55. Esto se hace en la figura 7.4, donde vemos que este valor de F es ligeramente menor que 0.3 (0.294 para ser más precisos). Así, el comprador resistente al riesgo está dispuesto a pagar un recargo de 0.294 por el auto de combustible flexible, lo cual es también el valor de la opción de este tipo de automóvil. Al escalar, multiplicando por 10 000 dólares, en busca de valores monetarios más realistas el recargo sobre el precio sería de 2 940 dólares. Esta cifra es superior en 440 dólares a lo que el comprador neutral al riesgo estuvo dispuesto a pagar. En consecuencia, el valor de la opción es mayor en este caso para el comprador resistente al riesgo. PREGUNTA: ¿La aversión al riesgo incrementa siempre el valor de las opciones? De ser así, explica por qué. De no ser así, modifica el ejemplo con diferentes formas de las funciones de beneficios para ofrecer un ejemplo en el que el comprador neutral al riesgo pagaría más. Valor de demora de las opciones La sociedad parece ver con malos ojos a quienes dejan las cosas para después. “No dejes para mañana lo que puedas hacer hoy” es una conocida máxima. Pero la existencia de opciones reales sugiere un posible valor del hecho de posponer. Quizá haya un valor en aplazar grandes decisiones —como la adquisición de un carro— difíciles de revertir después. Aplazar estas grandes decisiones permite al tomador de decisiones preservar el valor de las opciones y reunir más información sobre el futuro. Para el observador externo, quien quizá no entienda todas las incertidumbres implicadas en la situación, podría parecer que el tomador de decisiones es demasiado inerte, por no optar la que parece la decisión correcta en ese momento. De hecho, aplazar puede ser exactamente la decisión correcta frente a la incertidumbre. Elegir un curso de acción descarta cursos posteriores. La demora preserva las opciones. Si las circunstancias siguen siendo favorables, o se vuelven más favorables todavía, la acción puede emprenderse después. Pero si el futuro cambia y la acción es inadecuada, el tomador de decisiones puede haberse ahorrado muchas dificultades gracias a no haber decidido. El valor de la demora puede verse volviendo a la aplicación del automóvil. Pongamos por caso que en el mercado se dispone únicamente de automóviles para un solo tipo de combustible (sean combustibles fósiles o biocombustible); los autos de combustible flexible no se han inventado aún. Aun si las circunstancias empiezan a favorecer al auto para biocombustible, dado que el número de gasolineras que ofrecen biocombustibles parece descollar, el comprador podría preferir aplazar la compra de un vehículo hasta estar más seguro. Esto puede ser cierto incluso si el comprador renuncia por este motivo a un considerable superávit del consumidor procedente del uso de un auto nuevo durante el periodo de la demora. El problema es que si los biocombustibles no terminan por apoderarse del mercado, el comprador podría quedar en poder de un auto difícil de abastecer de combustible y de reemplazar por uno que queme el otro tipo de combustible. El comprador, así, estaría dispuesto a experimentar costos de demora de hasta F para preservar su flexibilidad. El valor de la demora gira en torno a la irreversibilidad de la decisión subyacente. Si, en el ejemplo del auto, el fabricante del comprador pudiera recuperar casi el precio de venta, vendiendo el vehículo en el mercado de automóviles usados, no habría razón de demorar la compra. Pero es bien sabido que el valor de un auto nuevo decrece precipitadamente una vez salido de la agencia distribuidora (analizaremos las razones de esto, incluido el “efecto limones” en el capítulo 18); por tanto, podría no ser tan fácil revertir la adquisición de un coche. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 231 Implicaciones para el análisis de costo-beneficio Para un observador externo la demora podría parecer un síntoma de irracionalidad o ignorancia. ¿Por qué el tomador de decisiones deja pasar la oportunidad de emprender una acción beneficiosa? En este capítulo se han provisto ya varias razones de que un tomador de decisiones racional pueda no querer emprender una acción pese a que los beneficios esperados de la acción excedan los costos esperados. Primero, un individuo con aversión al riesgo podría evitar una apuesta aun si ésta ofreciera un beneficio monetario esperado positivo (a causa de la utilidad marginal decreciente del dinero); y el valor de la opción brinda una razón adicional de que la acción no se lleve a cabo: el tomador de decisiones podría esperar a tener mayor certidumbre sobre los posibles resultados de la decisión. Muchos de nosotros nos hemos topado con la regla de costo-beneficio la cual establece que una acción debe emprenderse si los costos previstos son menores que los beneficios. Esta es una regla generalmente sensata, ya que indica el curso de acción correcto en ámbitos simples sin incertidumbre. Pero debe tenerse cuidado al aplicar esta regla en condiciones que implican incertidumbre. La regla de decisión correcta es más complicada entonces porque se deben tomar en cuenta las preferencias de riesgo (convirtiendo beneficios en utilidades) y el valor de demora de la opción, de estar presente. No aplicar la regla simple de costo-beneficio en condiciones de incertidumbre puede indicar sofisticación antes que irracionalidad.20 INFORMACIÓN El cuarto método para reducir la incertidumbre implicada en una situación es adquirir mejor información sobre el resultado probable. Ya se consideró una versión de esto en la sección anterior, donde se evaluó la estrategia de preservar opciones al tiempo que se aplaza una decisión hasta recibir mejor información. La demora implicó algunos costos, que pueden concebirse como una suerte de “precio de compra” de la información adquirida. Aquí seremos más directos en la consideración de la información como un bien que puede adquirirse directamente y analizaremos en gran detalle por qué y cuánto están dispuestos a pagar los individuos por ella. La información como un bien Para este momento ya debería estar claro para el lector que la información es un valioso recurso económico. Ya vimos un ejemplo: un comprador puede tomar una mejor decisión sobre qué tipo de automóvil adquirir si tiene mejor información sobre la clase de combustibles que estarán fácilmente disponibles durante el periodo de vida útil del auto. Pero los ejemplos no terminan ahí. Los compradores que saben dónde adquirir bienes de alta calidad a bajo costo pueden estirar más su presupuesto que aquellos que no tienen este conocimiento; los médicos, por ejemplo, pueden brindar mejor atención si están al día en las investigaciones científicas más recientes. El estudio de la economía de la información se ha vuelto una de las principales áreas de investigación en la actualidad. Esto implica varios retos. A diferencia de los bienes de consumo que hemos estudiado hasta ahora, la información es difícil de cuantificar. Y aun si se pudiera cuantificar, tiene algunas propiedades técnicas que la vuelven un bien de un tipo inusual. La mayor parte de la información es durable y mantiene su valor después de haber sido usada. A diferencia de un hot dog, el cual se consume una sola vez, el conocimiento de una venta especial puede ser usado no sólo por el individuo que la descubre, sino también por cualquier otro con quien se comparta 20 A los economistas les intriga la renuencia de los consumidores a instalar electrodomésticos eficientes pese a que es probable que los ahorros en energía sufraguen en poco tiempo el precio de compra de esos aparatos. Una explicación procedente de la economía del comportamiento es que los consumidores son demasiado ignorantes para realizar cálculos de costo-beneficio, o demasiado impacientes para esperar a que se acumulen los ahorros de energía. K. Hassett y G. Metcalf, en “Energy Conservation Investment: Do Consumers Discount the Future Correctly?” (Energy Policy, junio de 1993, pp. 710-716), sugieren que la inercia de los consumidores puede ser una demora racional ante la fluctuación de los precios de la energía. Véase el problema 7.9 para un ejemplo numérico conexo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 232 Parte 3: Incertidumbre y estrategia la información. Los amigos pueden beneficiarse entonces de la información aunque no hayan tenido que gastar nada para obtenerla. En efecto, en un caso especial de esta situación, la información tiene la característica de un bien público puro (véase el capítulo 19). Es decir, la información es no rival en cuanto que otros pueden usarla con cero costos, y no exclusiva en cuanto que ningún individuo puede impedir a otros que la usen. El ejemplo clásico de estas propiedades es un descubrimiento científico. Cuando individuos prehistóricos inventaron la rueda, otros pudieron usarla sin demérito del valor del descubrimiento, y todos los que veían la rueda podían copiarla libremente. La información es, asimismo, difícil de vender porque el acto de describir el bien ofrecido a un posible consumidor supone entregárselo. Estas propiedades técnicas de la información implican que los mecanismos del mercado podrían operar a menudo imperfectamente en la asignación de recursos a la provisión y adquisición de información. Después de todo, ¿para qué invertir en la producción de información cuando es posible adquirirla de otros sin costo alguno? Por tanto los modelos estándar de oferta y demanda podrían ser de uso relativamente limitado para comprender tales actividades. Como mínimo, deben desarrollarse modelos que reflejen atinadamente las propiedades supuestas respecto al entorno informativo. En secciones posteriores de este libro se describirán algunas de las situaciones que requieren esos modelos. Aquí, sin embargo, prestaremos relativamente poca atención a los equilibrios oferta-demanda y nos centraremos en cambio en un ejemplo que ilustra el valor de la información al ayudar a los individuos a tomar decisiones en condiciones de incertidumbre. Cuantificación del valor de la información Ya tenemos todas las herramientas necesarias para cuantificar el valor de la información a partir de la sección sobre el valor de las opciones. Supongamos de nueva cuenta que el individuo está inseguro respecto a cuál será el espacio muestral (x) en el futuro. Debe tomar una de n decisiones hoy (lo que nos permite dejar de lado el valor de demora de las opciones y otras cuestiones que ya estudiamos). Como antes, Ai(x) representa los beneficios provistos por la opción i. Ahora reinterpretemos F como la cuota cobrada por el dato acerca del valor preciso que x adoptará en el futuro (quizá esto sea el sueldo del economista contratado para hacer tales pronósticos). Los mismos cálculos de la sección sobre las opciones pueden usarse aquí para demostrar que el máximo de F es, nuevamente, el valor con el cual la ecuación 7.52 se mantiene con la igualdad. Así como este fue el valor de la opción real en aquella sección, aquí es el valor de la información. El valor de la información sería menor que esta F si el pronóstico de las condiciones futuras fuera imperfecto más que perfecto, como se supone aquí. Otros factores que afectan el valor de la información para un individuo incluyen el grado de incertidumbre antes de adquirir la información, el número de opciones entre las cuales puede elegir y sus preferencias de riesgo. Cuanta más incertidumbre resuelva la nueva información, más valiosa será esta, desde luego. Si el individuo no tiene mucho margen para responder a la información por tener sólo una gama limitada de decisiones por tomar, la información no será valiosa. El grado de aversión al riesgo tiene efectos ambiguos en el valor de la información (contestar la pregunta del ejemplo 7.5 te dará idea de por qué). ENFOQUE DE ESTADOS DE PREFERENCIA DE LA ELECCIÓN EN CONDICIONES DE INCERTIDUMBRE Aunque nuestro análisis en este capítulo ha ofrecido discernimientos sobre varios asuntos, parece algo distinto del enfoque que hemos adoptado en otros capítulos. El modelo básico de la optimización de la utilidad sujeta a una restricción presupuestal parece haberse perdido. Para avanzar en el estudio del comportamiento en condiciones de incertidumbre, desarrollaremos Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 233 nuevas técnicas que nos permitirán reinsertar el análisis de esa conducta en el marco teórico estándar de la elección. Espacios muestrales y mercancías contingentes Comenzaremos insistiendo en una idea que ya hemos mencionado: pensar en un futuro incierto en términos de espacios muestrales. No podemos predecir exactamente qué sucederá mañana, aunque suponemos que es posible clasificar todas las cosas que podrían suceder en un número fijo de espacios claramente definidos. Por ejemplo, podría hacerse la burda aproximación de decir que mañana la muestra estará en sólo una de dos situaciones posibles: en un “buen momento” o en un “mal momento”. Podría hacerse una gradación mucho más fina del espacio muestral (que implicara incluso millones de espacios posibles), pero casi todo lo esencial de la teoría puede desarrollarse usando sólo dos estados. Una idea conceptual que puede desarrollarse concurrentemente con la noción de espacio muestral es la de bienes contigentes. Se trata de bienes que sólo se proporcionan si ocurre un espacio muestral particular. Como ejemplo, “1 dólar en un buen momento” es un bien contingente que promete al individuo 1 dólar en un buen momento, pero nada si el día de mañana resultara ser un mal momento. Incluso es factible, extendiendo un poco la capacidad intuitiva propia, concebir la posibilidad de adquirir el bien: yo podría comprarle a alguien la promesa de 1 dólar si mañana resultara ser un buen momento. Pero como mañana podría ser un mal momento, este bien probablemente se venda por menos de 1 dólar. Si alguien también estuviera dispuesto a venderme el bien contingente “1 dólar en un mal momento”, yo podría cerciorarme de tener 1 dólar mañana, comprando los dos bienes contingentes “1 dólar en un buen momento” y “1 dólar en un mal momento”. Análisis de utilidad El examen de decisiones de optimización de la utilidad entre bienes contingentes procede formalmente casi de la misma forma en que ya hemos analizado las decisiones. La principal diferencia es que, a posteriori, un individuo sólo habrá obtenido un bien contingente (dependiendo de si el momento resulta ser bueno o malo). Antes de resolver la incertidumbre, sin embargo, el individuo tiene dos bienes contingentes entre los cuales elegir y probablemente compre algo de cada uno, porque no sabe qué estado ocurrirá. Denotaremos estos dos bienes contingentes con Wg (patrimonio en un buen momento) y Wb (patrimonio en un mal momento). Suponiendo que la utilidad es independiente del estado que se presente21 y que la persona cree que probablemente ocurrirá un buen momento , la utilidad esperada asociada con estos dos bienes contingentes es V(Wg, Wb) U(Wg) (1 )U(Wb). (7.57) Esta es la magnitud que el individuo quiere optimizar dado su patrimonio inicial, W. Precios de mercancías contingentes Suponiendo que un individuo puede adquirir 1 dólar de patrimonio en un buen momento para pg y 1 dólar de patrimonio en un mal momento para Pb, su restricción presupuestal es entonces W pgWg pbWb. (7.58) La razón de precio pg/pb muestra cómo este individuo puede cambiar dólares de patrimonio en un buen momento por dólares en uno malo. Si, por ejemplo, pg 0.80 y pb 0.20, el sacrificio de 1 dólar de patrimonio en un buen momento le permitiría comprar derechos contingentes que pro21 Este supuesto es insostenible en circunstancias en las que la utilidad del patrimonio depende del espacio muestral. Por ejemplo, la utilidad provista por un nivel dado de patrimonio puede diferir dependiendo de si un individuo está “enfermo” o “sano”. Sin embargo, no nos ocuparemos de esas complicaciones aquí. En la mayor parte de nuestro análisis se supone que la utilidad es cóncava en el patrimonio: U(W) 0, U(W) 0. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 234 Parte 3: Incertidumbre y estrategia dujeran 4 dólares de patrimonio si el momento resultara ser malo. Que ese canje mejore la utilidad dependerá, desde luego, de los detalles de la situación. Pero estudiar problemas que implican incertidumbre como situaciones en las que se intercambian varios derechos contingentes es el discernimiento clave que ofrece el modelo de estado de preferencia. Mercados justos de bienes contingentes Si los mercados de derechos patrimoniales contingentes están firmemente desarrollados y existe un acuerdo general sobre la probabilidad de un buen momento (), los precios de esos derechos serán actuarialmente justos; es decir, iguales a la probabilidades subyacentes: pg ¼ p, pb ¼ 1 p: (7.59) De ahí que la razón de precio pg/pb refleje simplemente las posibilidades en favor de un buen momento: pg p : ¼ pb 1 p (7.60) En nuestro ejemplo anterior, si pg 0.8 y pb (1 ) 0.2, entonces /(1 ) 4. En este caso, las posibilidades en favor de un buen momento se enunciarían como “4 a 1”. Los mercados justos de derechos contingentes (como los mercados de los seguros) también reflejarán esas posibilidades. Una analogía es provista por las “posibilidades” en las carreras de caballos. Estas posibilidades son “razonables” cuando reflejan las verdaderas probabilidades de que diversos caballos ganen. Aversión al riesgo Ahora estamos en posición de mostrar cómo se manifiesta la aversión al riesgo en el modelo de estado de preferencia. Específicamente, es posible demostrar que, si los mercados de derechos contingentes son justos, un individuo optimizador de su utilidad optará por una situación en la que Wg Wb; es decir, dispondrá las cosas de tal manera que el patrimonio finalmente obtenido sea el mismo, sea cual sea el espacio que se presente. Como en capítulos anteriores, la optimización de la utilidad sujeta a una restricción presupuestal requiere que este individuo iguale la TMS de Wg para Wb con la razón de los precios de estos “bienes”: TMS ¼ @V=@Wg pU 0 ðWg Þ pg ¼ : ¼ @V=@Wb ð1 pÞU 0 ðWb Þ pb (7.61) En vista del supuesto de que los mercados de derechos contingentes son justos (ecuación 7.60), esta condición de primer orden se reduce a o22 U 0 ðWg Þ ¼1 U 0 ðWb Þ Wg Wb. (7.62) De ahí que un individuo, al enfrentar mercados justos de derechos contigentes sobre el patrimonio, sea resistente al riesgo y elija cerciorarse de que tendrá el mismo nivel de patrimonio independientemente del espacio que ocurra. 22 Este paso requiere que la utilidad sea independiente del espacio y que U(W) 0. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre FIGURA 7.5 Aversiones al riesgo en el modelo de estado de preferencia. 235 La línea I representa la restricción presupuestal del individuo para derechos patrimoniales contingentes: W pgWg pbWb. Si el mercado de derechos contingentes es actuarialmente justo [pg/pb /(1 )], la optimización de la utilidad ocurrirá en la línea de certidumbre donde Wg Wb W*. Si los precios no son actuarialmente justos, la restricción presupuestal podría parecerse a I, y la optimización de la utilidad ocurrirá en un punto donde Wg Wb. Wb Línea de certidumbre W* I I′ U1 W* Wg Análisis gráfico La figura 7.5 ilustra la aversión al riesgo con una gráfica. Está demostrado que la restricción presupuestal de un individuo (I) es tangente a la curva de indiferencia U1 donde Wg Wb; un punto en la “línea de certidumbre” en el que el patrimonio (W*) es independiente del espacio muestral que se presente. En W* la pendiente de la curva de indiferencia [/(1 )] es exactamente igual a la razón de precios pg/pb. Si el mercado de derechos patrimoniales contingentes no fuera justo, la optimización de la utilidad podría no ocurrir en la línea de certidumbre. Supongamos, por ejemplo, que /(1 ) 4, pero que pg/pb 2, porque asegurar el patrimonio en un mal momento resulta costoso. En este caso la restricción presupuestal se asemejaría a la línea I en la figura 7.5, y la optimización de la utilidad ocurriría bajo la línea de certidumbre.23 En este caso el individuo apostaría un poco optando por Wg Wb porque los derechos sobre Wb son relativamente costosos. El ejemplo 7.6 muestra la utilidad de este enfoque para evaluar algunas de las alternativas que podrían estar disponibles. EJEMPLO 7.6 Seguros en el modelo de estados de preferencia El enfoque de estado de preferencia puede ilustrarse reformulando la ilustración del seguro de automóvil del ejemplo 7.2 como un problema que implica los dos bienes contingentes, “patrimonio sin robo” (Wg) y “patrimonio con robo” (Wb). Si, nuevamente, se supone utilidad logarítmica y que la probabilidad de un robo (es decir, 1 ) es de 0.25, entonces 23 Dado que (como demuestra la ecuación 7.61) la TMS en la línea de certidumbre siempre es /(1 ), tangencias con una pendiente más plana que esta deben ocurrir bajo esa línea. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 236 Parte 3: Incertidumbre y estrategia utilidad esperada 0.75U(Wg) 0.25U(Wb) 0.75 ln Wg 0.25 ln Wb. (7.63) Si el individuo no emprende ninguna acción, la utilidad está determinada por la dotación patrimonial inicial, W*g 100 000 y W*h 80 000, de modo que utilidad esperada 0.75 ln 100 000 0.25 ln 80 000 11.45714 (7.64) Para estudiar intercambios a partir de estas dotaciones iniciales la restricción presupuestal se escribe en términos de los precios de los bienes contingentes, pg y pb: pgWg* pbWb* pgWg pbWb. (7.65) Suponiendo que estos precios igualan las probabilidades de los dos estados (pg 0.75, pb 0.25), esta restricción puede escribirse como 0.75(100 000) 0.25(80 000) 95 000 0.75Wg 0.25Wb; (7.66) es decir, el valor esperado del patrimonio es de 95 000 dólares, y un individuo puede asignar esta cantidad entre Wg y Wb. Ahora, la optimización de la utilidad respecto a esta restricción presupuestal produce Wg Wb 95 000. En consecuencia, el individuo se moverá hacia la línea de certidumbre y recibirá una utilidad esperada de utilidad esperada ln 95 000 11.46163, (7.67) una mejora evidente respecto a no haber hecho nada. Para obtener esta mejora se deben poder transferir 5 000 dólares de patrimonio en un buen momento (sin robo) a 15 000 de patrimonio adicional en un mal momento (robo). Un contrato de seguros razonable permitiría esto porque costaría 5 000 dólares pero devolvería 20 000 si ocurriera un robo (aunque nada si no ocurriera un robo). Nótese aquí que los cambios patrimoniales prometidos por el seguro —dWb/dWg 15 000/5 000 3— son exactamente iguales a la negativa de la razón de posibilidades /(1 ) 0.75/0.25 3. Póliza con cláusula de deducible. Otros contratos de seguros podrían mejorar la utilidad en esta situación, aunque no todos ellos llevarían a opciones en la línea de certidumbre. Por ejemplo, una póliza que costara 5 200 dólares y devolviera 20 000 en caso de robo permitiría a un individuo llegar a la línea de certidumbre con Wg Wb 94 800 y utilidad esperada ln 94 800 11.45953, (7.68) lo que también excede la utilidad obtenible de la dotación inicial. Una póliza que cuesta 4 900 dólares y requiere que el individuo incurra en los primeros 1 000 dólares de una pérdida por robo produciría Wg 100 000 4 900 95 100, Wb 80 000 4 900 19 000 94 100; (7.69) entonces, utilidad esperada 0.75 ln 95 100 0.25 ln 94 100 11.46004. (7.70) Esta póliza mejora la utilidad aunque no permite arribar a la línea de certidumbre. El seguro no necesariamente debe ser completo para ofrecer la promesa de mayor utilidad. PREGUNTA: ¿Cuál es la cantidad máxima que un individuo estaría dispuesto a pagar por una póliza de seguros en la que tuviera que absorber los primeros 1 000 dólares de una pérdida? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 237 Aversión al riesgo y primas de riesgo El modelo de estado de preferencia también es especialmente útil para analizar la relación entre la aversión al riesgo y la disposición de los individuos a pagar por riesgos. Consideremos a dos individuos, cada uno de los cuales comienza con cierto patrimonio, W*. Cada individuo busca optimizar una función de utilidad esperada de la forma VðWg , Wb Þ ¼ p WgR R þ ð1 pÞ WbR : R (7.71) Aquí la función de utilidad exhibe aversión al riesgo constante relativa (véase el ejemplo 7.4). Nótese también que esta función se parece mucho a la función de utilidad ESC que se examinó en el capítulo 3 y otras partes. El parámetro R determina tanto el grado de aversión al riesgo como el grado de curvatura de las curvas de indiferencia implicadas por la función. Un individuo con aversión al riesgo tendrá un gran valor negativo de R y marcadas curvas de indiferencia, como U1 en la figura 7.6. Un individuo con más tolerancia al riesgo tendrá un valor más alto de R y curvas de indiferencia más planas (como U2).24 Supongamos ahora que estos individuos enfrentan la perspectiva de perder h dólares de patrimonio en un mal momento. Ese riesgo sería aceptable para el individuo 2 si el patrimonio en un buen momento se incrementara de W* a W2. Para el individuo 1 resistente al riesgo, sin embargo, el patrimonio tendría que incrementar a W1 para volver aceptable el riesgo. Por tanto, la diferencia entre W1 y W2 indica el efecto de la aversión al riesgo respecto a la disposición a asumir riesgos. La curva de indiferencia U1 representa las preferencias de un individuo con aversión al riesgo, mientras que el individuo con preferencias representadas por U2 está dispuesto a asumir más riesgo. Frente al riesgo de perder h en un mal momento, la persona 2 requerirá una compensación de W2 W* en un buen momento, mientras que la persona 1 requerirá una mayor cantidad dada por W1 W*. FIGURA 7.6 Aversión al riesgo y primas de riesgo. Wb Línea de certidumbre W* W* − h U1 U2 W* W2 W1 Wg La tangencia de U1 y U2 en W* está asegurada porque la TMS a lo largo de la línea de certidumbre está dada por /(1 ) independientemente del valor de R. 24 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 238 Parte 3: Incertidumbre y estrategia Algunos de los problemas de este capítulo hacen uso de este recurso gráfico para mostrar la relación entre preferencias (reflejadas por la función de utilidad en la ecuación 7.71) y el comportamiento en situaciones arriesgadas. ASIMETRÍA DE INFORMACIÓN Una implicación obvia del estudio de la adquisición de informativa es que el nivel de información que un individuo compra depende del precio por unidad de los mensajes. A diferencia del precio de mercado de la mayoría de los bienes (que suele suponerse el mismo para todos ellos), hay muchas razones para creer que los costos de la información pueden diferir significativamente entre los individuos. Algunos tendrán habilidades específicas relevantes para la adquisición de información (por ejemplo, podrían ser mecánicos calificados), mientras que otros pueden no poseer dichas habilidades. Habrá quienes tengan otros tipos de experiencias que produzcan información valiosa, mientras que otros podrían carecer de esa experiencia. Por ejemplo, el vendedor de un producto usualmente sabrá más sobre las limitaciones del mismo que un comprador, porque el primero sabe exactamente cómo fue hecho el bien y dónde podrían aparecer los problemas. De igual forma, compradores frecuentes a gran escala de un bien podrían tener mayor acceso a información respecto a los compradores primerizos. Por último, algunos individuos pueden haber invertido en algún tipo de servicio de información (por ejemplo, una liga de computación con una casa de bolsa o mediante una suscripción a Consumer Reports) lo cual reduce el costo marginal de obtener información adicional en comparación con alguien sin ese tipo de inversión. Todos estos factores sugieren que el nivel de información difiere en ocasiones entre los participantes en transacciones en el mercado. Desde luego que en muchos casos los costos de información pueden ser bajos y tales diferencias, menores. La mayoría de los individuos puede evaluar muy bien la calidad de las verduras frescas con sólo mirarlas, por ejemplo. Pero cuando los costos de información son altos y variables entre individuos, es de esperar que resulte ventajoso adquirir diferentes cantidades de información. Pospondremos al capítulo 18 un estudio detallado de estas situaciones. Resumen El objetivo de este capítulo es proporcionar material básico para el estudio del comportamiento individual en situaciones inciertas. Los conceptos clave cubiertos se enlistan en seguida. • La forma más común de modelizar el comportamiento en condiciones de incertidumbre es suponer que los individuos tratan de optimizar la utilidad esperada de sus acciones. • Los individuos que exhiben una utilidad marginal decreciente de su patrimonio presentan aversión al riesgo. Es decir, por lo general rechazan apuestas razonables. • Los individuos con aversión al riesgo querrán asegurarse por completo contra sucesos inciertos, si las primas de seguros son actuarialmente razonables. Podrían estar dispuestos a pagar primas más que actuarialmente razonables para no correr riesgos. • Dos funciones de utilidad se han usado ampliamente en el estudio del comportamiento en condiciones de incertidum- bre: la función de aversión al riesgo constante absoluta (ARCA) y la función de aversión al riesgo constante relativa (ARCR). Ninguna de éstas es completamente satisfactoria en terrenos teóricos. • Entre los métodos para reducir el riesgo implicado en una situación se incluyen: transferir el riesgo a quienes pueden soportarlo más eficazmente mediante seguros; dispersar el riesgo entre varias actividades a través de la diversificación, preservar las opciones para hacer frente a los diversos resultados que surjan y adquirir información para determinar qué resultados son más probables. • Uno de los temas más estudiados en la economía de la incertidumbre es el “problema de cartera”, que cuestiona en qué forma dividirá un inversionista su patrimonio entre activos disponibles. Una versión simple de este problema se usa para ilustrar el valor de la diversificación en el texto; las extensiones ofrecen un análisis detallado. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre • La información es valiosa porque permite a los individuos tomar mejores decisiones en situaciones inciertas. La información puede ser óptimamente valiosa cuando los individuos tienen cierta flexibilidad en su toma de decisiones. 239 • El enfoque de estado de preferencia permite abordar la toma de decisiones en condiciones de incertidumbre en un conocido marco teórico de la elección. Problemas 7.1 Se ve a Jorge hacer una apuesta de 100 000 dólares en favor de los Bulls en la final de la NBA. Si Jorge tiene una función logarítmica de utilidad patrimonial y su patrimonio corriente es de 1 000 000 de dólares, ¿cuál considera que es la mínima probabilidad de que ganen los Bulls? 7.2 Demuestra lo siguiente: si la función de utilidad patrimonial de un individuo es convexa preferirá apuestas razonables a la certeza del ingreso, incluso podría estar dispuesto a aceptar apuestas un tanto irrazonables. ¿Crees que este tipo de comportamiento de asumir riesgos es común? ¿Qué factores podrían tender a limitar su ocurrencia? 7.3 Un individuo adquiere una docena de huevos y debe llevarla a casa. Aunque hacer viajes a casa no tiene costo alguno, hay 50% de posibilidades de que todos los huevos transportados en un viaje se rompan durante el trayecto. El individuo considera dos estrategias: 1) llevar los 12 huevos en un solo viaje o 2) hacer dos viajes con seis huevos cada uno. a. Enlista los posibles resultados de cada estrategia y las probabilidades de esos resultados. Demuestra que, en promedio, seis huevos permanecerán sin romperse después del viaje a casa en cualquier estrategia. b. Desarrolla una gráfica para mostrar la utilidad obtenible en cada estrategia. ¿Cuál estrategia será preferible? c. ¿La utilidad podría mejorar haciendo más de dos viajes? ¿Cómo se vería afectada esta posibilidad, si los viajes adicionales implicaran un costo? 7.4 Supón que hay una posibilidad de 50-50 de que un individuo resistente al riesgo con patrimonio corriente de 20 000 dólares contraiga una enfermedad debilitante y sufra una pérdida de $10 000. a. Calcula el costo de un seguro actuarialmente razonable en esta situación y usa una gráfica de utilidad patrimonial (como la de la figura 7.1) para mostrar que el individuo preferirá un seguro razonable contra esta pérdida a aceptar la apuesta sin haberse asegurado. b. Supón que se dispone de dos tipos de pólizas de seguros: 1) una póliza razonable que cubra la pérdida total y 2) una póliza razonable que sólo cubra la mitad de cualquier pérdida incurrida. Calcula el costo del segundo tipo de póliza y demuestra que, en general, el individuo la considerará inferior a la primera. 7.5 La señorita Fogg planea hacer un viaje alrededor del mundo en el que piensa gastar 10 000 dólares. La utilidad del viaje es una función de cuánto gastará realmente (Y), dada por U(Y) ln Y. a. Si hay 25 por ciento de probabilidad de que la señorita Fuentes pierda 1 000 dólares de su dinero en efectivo durante el viaje, ¿cuál es la utilidad esperada de éste? b. Supón que la señorita Fuentes puede comprar un seguro contra la pérdida de esos 1 000 dólares (comprando, digamos, cheques de viajero) a una prima “actuarialmente razonable” de 250 dólares. Demuestra que su utilidad esperada es más alta si adquiere este seguro, que si enfrenta el riesgo de perder los 1 000 dólares sin seguro. c. ¿Cuál es la cantidad máxima que la señorita Fuentes estaría dispuesta a pagar para asegurar sus 1 000 dólares? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 240 Parte 3: Incertidumbre y estrategia 7.6 Al decidir estacionarse en un sitio prohibido, un individuo sabe que la probabilidad de recibir una infracción es p y que la multa por esa infracción es f. Supón que todos los individuos son resistentes al riesgo (es decir, U(W) 0 donde W es el patrimonio del individuo). Un incremento proporcional en la probabilidad de ser sorprendido o un incremento proporcional en la multa ¿será un elemento disuasorio más eficaz para impedir el estacionamiento? Pista: Usa la aproximación de la serie de Taylor U(W f) U(W) f U'(W) (f 2/2)U(W). 7.7 Un agricultor cree que hay una posibilidad de 50-50 de que la siguiente temporada de cultivo sea especialmente lluviosa. Su función de utilidad esperada tiene la forma 1 1 utilidad esperada 2 ln YNR 2 ln YR, donde YNR y YR representan el ingreso del agricultor en situaciones de “lluvia normal” y “muy lluvioso”, respectivamente. a. Supón que el agricultor debe elegir entre dos cultivos que prometen las siguientes perspectivas de ingresos: Cultivo YNR YR Trigo $28 000 $10 000 Maíz $19 000 $15 000 ¿Cuál de estos cultivos sembrará? b. Supón que el agricultor puede sembrar la mitad de su campo con cada cultivo. ¿Elegiría hacerlo? Explica tu resultado. c. ¿Qué mezcla de trigo y maíz le ofrecería al agricultor el óptimo de utilidad esperada? d. ¿Asegurar el trigo —algo que está a disposición de los agricultores que sólo siembran trigo y que cuesta 4 000 dólares y rinde 8 000 en caso de una temporada agrícola lluviosa— lo haría cambiar su siembra? 7.8 En la ecuación 7.30 se mostró que la cantidad que un individuo está dispuesto a pagar para evitar una apuesta razonable (h) está dada por p 0.5E(h2)r(W), donde r(W) es la medida de aversión al riesgo absoluta en el nivel patrimonial inicial de este individuo. En este problema se analizará la magnitud de dicho pago como una función de la magnitud del riesgo enfrentado y del nivel patrimonial de este individuo. a. Considera una apuesta razonable (v) de ganar o perder $1. Para esta apuesta, ¿cuál es E(v2)? b. Considera ahora variar la apuesta del inciso a), multiplicando cada premio por una constante positiva k. Considera que h kv. ¿Cuál es el valor de E(h2)? c. Supón que este individuo tiene una función logarítmica de utilidad U(W) ln W. ¿Cuál es la expresión general para r(W)? d. Calcula la prima de riesgo (p) para k 0.5, 1 y 2 y para W 10 y 100. ¿Qué concluyes de comparar los seis valores? 7.9 Vuelve al ejemplo 7.5, en el que se calculó el valor de la opción real provista por un automóvil de combustible flexible. Sigue suponiendo que el beneficio de un auto que quema combustibles fósiles es A1(x) 1 x. Supón ahora que el beneficio del auto para biocombustible es más alto, A2(x) 2x. Nuevamente, x es una variable aleatoria uniformemente distribuida entre 0 y 1, lo que recoge la disponibilidad relativa de biocombustibles versus combustibles fósiles en el mercado durante el periodo de vida futura del automóvil. a. Supón que el comprador es neutral al riesgo con una función de utilidad de Von Neumann-Morgenstern U(x) x. Calcula el valor de la opción de un auto de combustible flexible que permite al comprador reproducir el beneficio de cualquier auto para un solo tipo de combustible. b. Repite el cálculo del valor de la opción para un comprador resistente al riesgo con función de utilidad U(x) x. c. Compara tus respuestas con las del ejemplo 7.5. Explica cómo el incremento en el valor del auto para biocombustible afecta el valor de la opción provista por el auto de combustible flexible. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre 241 Problemas analíticos 7.10 Utilidad ARAA Las funciones de utilidad ARCA y ARCR pertenecen a una clase más general de funciones de utilidad llamadas funciones de aversión al riesgo armónica absoluta (ARAA). La forma general de esta función es U(W) ( W/)1, donde los diversos parámetros obedecen las restricciones siguientes: • 1, • W/ 0, • (1 )/ 0. Las razones de las dos primeras restricciones son obvias; la tercera se requiere para que U 0. a. Calcula r(W) para esta función. Demuestra que la inversa de esta expresión es lineal en W. Este es el origen del adjetivo armónica en el nombre de la función. b. Demuestra que cuando 0 y (1 )/ 1, esta función se reduce a la función ARCR dada en el capítulo 7 (véase la nota 17). c. Usa tu resultado del inciso a) para demostrar que si S , entonces r(W) es una constante en esta función. d. Considera que la constante hallada en el inciso c) está representada por (A). Demuestra que la forma incluida de la función de utilidad en este caso es la función ARCA dada en la ecuación 7.35. e. Por último, demuestra que una función de utilidad cuadrática puede generarse a partir de la función ARAA simplemente estableciendo 1. f. Pese a su aparente generalidad, la función ARAA exhibe varias limitaciones para el estudio del comportamiento en situaciones inciertas. Describe algunas de estas deficiencias. 7.11 Teoría de prospectos Dos pioneros en el campo de la economía del comportamiento, Daniel Kahneman y Amos Tversky (ganadores del Premio Nobel en economía, en 2002), realizaron un experimento en el que presentaron a diferentes grupos de sujetos con uno de estos dos escenarios: • Escenario 1: Además de pagar $1 000 por adelantado, el individuo debe elegir entre dos apuestas. La apuesta A ofrece una posibilidad pareja de ganar $1 000 o nada. La apuesta B ofrece $500 con seguridad. • Escenario 2: Además de pagar $2 000 por adelantado, el sujeto debe elegir entre dos apuestas. La apuesta C ofrece una posibilidad pareja de perder $1 000 o nada. La apuesta D resulta en la pérdida de $500 con seguridad. a. Supón que Norma Ecuánime toma decisiones en condiciones de incertidumbre, de acuerdo con la teoría de la utilidad esperada. Si Ecuánime es neutral al riesgo, ¿qué decisión tomaría en cada escenario? b. ¿Qué decisión tomaría Stan si es resistente al riesgo? c. Kahneman y Tversky determinaron que 16% de los individuos eligió A en el primer escenario y 68% eligió C en el segundo. Con base en tus respuestas precedentes, explica por qué estos hallazgos son difíciles de conciliar con la teoría de la utilidad esperada. d. Kahneman y Tversky propusieron una alternativa a la teoría de la utilidad esperada, llamada teoría de prospectos, para explicar los resultados experimentales. Esta teoría dice que el nivel actual de ingreso de los individuos funciona como un “punto de partida” para ellas. Son resistentes al riesgo frente a beneficios más allá de ese punto, pero sensibles a pérdidas reducidas por debajo de ese punto. Esta sensibilidad a pérdidas reducidas es lo contrario de la aversión al riesgo: un individuo resistente al riesgo sufre desproporcionadamente más por una pérdida grande que por una reducida. 1) Pedro Prospecto toma decisiones en condiciones de incertidumbre, de acuerdo con la teoría de prospectos. ¿Qué decisiones tomaría en el experimento de Kahneman y Tversky? Explica tu respuesta. 2) Traza un diagrama esquemático de una curva de utilidad de dinero para Pedro Prospecto en el primer escenario. Traza una curva de utilidad para él en el segundo escenario. ¿La misma curva puede bastar para ambos escenarios, o debe desplazarse? ¿En qué difieren las curvas de utilidad de Pedro de las que se usaron para describir a individuos como Standard Stan? 7.12 Más sobre la función ARCR Respecto a la función de utilidad ARCR (ecuación 7.42) se demostró que el grado de aversión al riesgo se mide con 1 I. En el capítulo 3 se demostró que la elasticidad de sustitución de la misma función está dada por 1/(1 I). De ahí que las medidas sean recíprocas entre sí. Usando este resultado, analiza las preguntas siguientes. a. ¿Por qué la aversión al riesgo se relaciona con la disposición de un individuo a sustituir patrimonio entre los espacios muestrales? ¿Qué fenómeno recogen ambos conceptos? b. ¿Cómo interpretarías los casos polares I 1 y I en los marcos tanto de aversión al riesgo como de sustitución? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 242 Parte 3: Incertidumbre y estrategia c. Un aumento en el precio de derechos contingentes en un “mal” momento (pb) inducirá efectos de sustitución e ingreso en las demandas de Wg y Wb. Si el individuo tiene un presupuesto fijo para dedicarlo a estos dos bienes, ¿de qué manera afectan a los bienes estas decisiones? ¿Por qué el aumento o la disminución en Wg podría depender del grado de aversión al riesgo exhibido por el individuo? d. Supón que los datos empíricos sugieren que un individuo requiere un rendimiento promedio de 0.5% para verse tentado a emplear una inversión que tiene una posibilidad de 50-50 de ganar o perder 5%. Es decir, este individuo recibiría la misma utilidad de W0 que de una apuesta pareja sobre 1.055 W0 y 0.955 W0. 1) ¿Qué valor de I es congruente con este comportamiento? 2) ¿Cuánto rendimiento promedio requerirá este individuo para aceptar una posibilidad de 50-50 de ganar o perder 10 por ciento? Nota: Este inciso requiere resolver ecuaciones no lineales, así que bastará con soluciones aproximadas. La comparación de la disyuntiva de recompensas de riesgo ilustra lo que se conoce como enigma de la prima de equidad, en el sentido de que las inversiones arriesgadas en realidad parecen ganar mucho más que lo congruente con el grado de aversión al riesgo sugerido por otros datos. Véase N. R. Kocherlakota, “The Equity Premium: It’s Still a Puzzle”, Journal of Economic Literature (marzo de 1996), pp. 42-71. 7.13 Gráfica de inversiones arriesgadas La inversión en activos arriesgados puede examinarse en el marco de la preferencia de estado, suponiendo que W* dólares invertidos en un activo con cierto rendimiento r producirán W*(1 + r) en ambos estados del mundo, mientras que una inversión en un activo arriesgado producirá W*(1 + rg) en un buen momento y W*(1 + rb) en uno malo (donde rg r rb). a. Grafica los resultados de las dos inversiones. b. Muestra cómo podría ilustrarse en tu gráfica una “cartera mixta” con activos tanto libres de riesgo como riesgosos. ¿Cómo mostrarías la fracción patrimonial invertida en el activo riesgoso? c. Muestra cómo las actitudes de los individuos ante el riesgo determinarán la mezcla de activos libres de riesgo y riesgosos que llevarán a cabo. ¿En qué caso un individuo no tendría activos riesgosos? d. Si la utilidad de un individuo adopta la forma de aversión al riesgo constante relativa (ecuación 7.42), explica por qué ese individuo no cambiará la fracción de activos riesgosos en su poder al incrementar su patrimonio.25 7.14 El problema de cartera con un activo riesgoso normalmente distribuido En el ejemplo 7.3 se demostró que un individuo con una función de utilidad ARCA, que enfrenta un riesgo normalmente distribuido, tendrá una utilidad esperada de la forma EU(W) W (A/2)2W, donde W es el valor patrimonial esperado y 2W, su varianza. Usa este hecho para despejar la asignación óptima de cartera para un individuo con una función de utilidad ARCA que debe invertir k de su patrimonio en un activo riesgoso normalmente distribuido cuyo rendimiento esperado es r y cuya varianza en rendimiento es r2 (tu respuesta debería depender de A). Explica tus resultados intuitivamente. Sugerencias de lecturas adicionales Arrow, K. J. “The Role of Securities in the Optimal Allocation of Risk Bearing”, Review of Economic Studies, núm. 31 (1963), pp. 91-96. Presenta el concepto de preferencia de estado e interpreta los valores bursátiles como derechos sobre mercancías contingentes. _____. “Uncertainty and the Welfare Economics of Medical Care”, Review of Economic Studies, núm. 53 (1963), pp. 941-973. Excelente análisis de las implicaciones de bienestar de los seguros. Contiene un apéndice matemático claro y conciso. Debería leerse junto con el artículo de Pauly sobre riesgo moral (véase el capítulo 18). Bernoulli, D. “Exposition of a New Theory on the Measurement of Risk”, Econometrica, núm. 22 (1954), pp. 23-36. Reimpresión del análisis clásico de la paradoja de San Petersburgo. Dixit, A. K. y R. S. Pindyck. Investment under Uncertainty, Princeton University Press, Princeton, 1994. Se centra principalmente en la decisión de inversión de empresas, pero contiene una buena cobertura de concepto de opciones. Friedman, M. y L. J. Savage. “The Utility Analysis of Choice”, Journal of Political Economy, núm. 56 (1948), pp. 279-304. Analiza por qué los individuos podrían tanto apostar como comprar seguros. Muy legible. Gollier, Christian. The Economics of Risk and Time, MIT Press, Cambridge, MA, 2001. Contiene un completo tratamiento de muchos de los temas analizados en este capítulo. Especialmente bueno sobre la relación entre asignación en condiciones de incertidumbre y asignación a lo largo del tiempo. 25 Este problema se basa en J. E. Stiglitz, “The Effects of Income, Wealth, and Capital Gains Taxation in Risk Taking”, Quarterly Journal of Economics (mayo de 1969), pp. 263-283. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre Mas-Colell, Andreu, Michael D. Whinston y Jerry R. Green. Microeconomic Theory, Oxford University Press, Nueva York, 1995, capítulo 6. Brinda un buen resumen de los fundamentos de la teoría de la utilidad esperada. Examina asimismo en detalle el supuesto de “independencia de estado” y muestra que algunas nociones de aversión al riesgo se aplican a casos de dependencia de estado. Pratt, J. W. “Risk Aversion in the Small and in the Large”, Econométrica, núm. 32 (1964), pp. 122-136. Desarrollo teórico de medidas de aversión al riesgo. Tratamiento muy técnico pero legible. 243 Rothschild, M. y J. E. Stiglitz. “Increasing Risk: 1. A Definition”, Journal of Economic Theory, núm. 2 (1970), pp. 225-243. Desarrolla una definición de economía de lo que significa que una apuesta sea “más arriesgada” que otra. Una secuela en el Journal of Economic Theory ofrece ilustraciones de la economía. Silberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001. El capítulo 13 proporciona una buena introducción a la relación entre conceptos estadísticos y maximización de la utilidad esperada. Muestra asimismo en detalle la integración mencionada en el ejemplo 7.3. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 244 Parte 3: Incertidumbre y estrategia EXTENSIONES El problema de la cartera Uno de los problemas clásicos en la teoría del comportamiento en condiciones de incertidumbre es la cuestión de cuánto de su patrimonio deber asignar un inversionista con aversión al riesgo a un activo riesgoso. Intuitivamente, todo indica que la fracción invertida en activos riesgosos debería ser menor en el caso de inversionistas con aversión al riesgo, y una meta de nuestro análisis en estas extensiones es demostrar esto formalmente. Luego se verá cómo generalizar ese modelo para considerar carteras con muchos de esos activos para abordar finalmente el modelo de valuación de activos de capital, básico en los cursos de economía financiera. E7.1 Modelo básico con un activo riesgoso Para comenzar, supón que un inversionista tiene cierto monto patrimonial, W0, para invertir en uno de dos activos. El primero de ellos produce cierto rendimiento de rf, mientras que el rendimiento del segundo es una variable aleatoria, r. Si se concede que el monto invertido en el activo riesgoso se denota con k, el patrimonio de este individuo al final de un periodo será W ¼ ðW0 kÞð1 þ rf Þ þ kð1 þ rÞ ¼ W0 ð1 þ rf Þ þ kðr rf Þ: (i) Adviértanse tres cosas en este patrimonio al final de periodo. Primero, W es una variable aleatoria porque su valor depende de r. Segundo, k puede ser positiva o negativa aquí, dependiendo de si un individuo compra el activo riesgoso o si lo vende rápido. Como veremos, sin embargo, en el caso usual E(r rf) 0, y esto implica que k 0. Por último, nótese que la ecuación i permite una solución en la que k W0. En este caso, el inversionista apalancaría su inversión en el activo riesgoso, pidiendo un préstamo a la tasa libre de riesgo rf. Si se considera que U(W) representa la función de utilidad del inversionista, el teorema de Von Neumann-Morgenstern establece que elegirá k para maximizar E[U(W)]. La condición de primer orden para ese máximo es @E½UðWÞ @E½UðW 0 ð1 þ rf Þ þ kðr rf ÞÞ ¼ @k @k ¼ E½U 0 ðr r f Þ ¼ 0: (ii) Al calcular la condición de primer orden, podemos diferenciar a través del operador de valor esperado, E. Véase el capítulo 2 para un análisis de la diferenciación de integrales (de la cual un operador de valor esperado es un ejemplo). La ecuación ii implica el valor esperado del producto de la utilidad marginal y el término r rf. Estos dos términos son aleatorios. Que r rf sea positivo o negativo depende de lo bien que los activos riesgosos se desempeñen en el periodo siguiente. Pero el rendimiento de este activo riesgoso también afectará el patrimonio del inversionista al final de periodo, afectando por tanto su utilidad marginal. Si la inversión se desarrolla bien, W será grande y la utilidad marginal relativamente baja (debido a la utilidad marginal decreciente). Si la inversión se desarrolla mal el patrimonio será relativamente bajo y la utilidad marginal relativamente alta. De ahí que en el cálculo del valor esperado en la ecuación ii, los resultados negativos de r rf pesen más que los positivos para tomar en cuenta las consecuencias de utilidad de estos resultados. Si el valor esperado en la ecuación ii fuera positivo, un individuo podría incrementar su utilidad esperada invirtiendo más en el activo riesgoso. Si el valor esperado fuera negativo, este individuo podría incrementar su utilidad esperada reduciendo el monto del activo riesgoso en su poder. Sólo cuando la condición de primer orden se cumpla este individuo tendrá una cartera óptima. Otras dos conclusiones pueden extraerse de la ecuación ii. Primero, mientras E(r rf) 0, un inversionista elegirá montos positivos del activo riesgoso. Para ver por qué, adviértase que satisfacer la ecuación ii requerirá que muy grandes valores de U se atribuyan a situaciones en las que r rf resulte negativo. Esto sólo puede ocurrir si el inversionista posee montos positivos del activo riesgoso, de tal modo que su patrimonio al final del periodo sea bajo en muchas situaciones. Una segunda conclusión de la ecuación ii es que los inversionistas con más aversión al riesgo tendrán montos menores del activo riesgoso. Nuevamente, la razón de esto tiene que ver con la forma de la función U. Para los inversionistas con aversión al riesgo la utilidad marginal aumenta rápidamente al reducirse el patrimonio. De ahí que necesiten relativamente poca exposición a posibles resultados negativos de tener el activo riesgoso para satisfacer la ecuación ii. E7.2 Utilidad ARCA Avanzar en el problema de la cartera requiere elaborar supuestos específicos sobre la función de utilidad del inversionista. Supón que ésta se halla dada por la forma ARCA: U(W) exp(AW). Entonces, la función de utilidad marginal está dada por U(W) A exp(AW); sustituyendo para el patrimonio al final del periodo, tenemos U 0 ðWÞ ¼ A exp½AðW0 ð1 þ rf Þ þ kðr rf ÞÞ ¼ A exp½AW0 ð1 þ rf Þexp½Akðr rf Þ: (iii) Es decir, la función de utilidad marginal puede separarse en una parte aleatoria y en una parte no aleatoria (tanto el patrimonio Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre inicial como la tasa libre de riesgo son no aleatorias). De ahí que la condición óptima de la ecuación ii pueda escribirse como E½U 0 ðr r f Þ ¼ A exp½AW 0 ð1 þ r f Þ E½expðAkðr r f ÞÞ ðr r f Þ ¼ 0: (iv) Ahora es posible dividir entre la función exponencial del patrimonio inicial, lo que deja una condición óptima que sólo involucra los términos en k, A y r rf. Despejar el nivel óptimo de k en esta condición puede ser difícil en general (véase, sin embargo, el problema 7.14). No obstante, más allá de la solución específica, la ecuación iv muestra que este monto óptimo de inversión será una constante independientemente del nivel patrimonial inicial. De ahí que la función ARCA implique que la fracción del patrimonio que un inversionista mantiene en activos riesgosos debería decrecer al incrementarse el patrimonio, conclusión que parece precisamente opuesta a los datos empíricos, los cuales tienden a mostrar que la fracción del patrimonio mantenida en activos riesgosos se incrementa junto con el patrimonio. Si supusiéramos, en cambio, que la utilidad adopta la forma ARCR en vez de la forma ARCA, podríamos demostrar (con un poco de paciencia) que todos los individuos con la misma tolerancia al riesgo tendrán la misma fracción patrimonial en activos riesgosos, más allá de sus niveles absolutos de patrimonio. Aunque esta conclusión es ligeramente más consistente con los hechos que la conclusión resultante de la función ARCA, sigue siendo insuficiente para explicar por qué la fracción de patrimonio mantenida en activos riesgosos tiende a incrementarse junto con el patrimonio. E7.3 Carteras de muchos activos riesgosos Discernimientos adicionales pueden obtenerse si el modelo se generaliza para tomar en cuenta muchos activos riesgosos. Sea el rendimiento de cada uno de los n activos riesgosos la variable aleatoria ri (i 1,…, n). Los valores esperados y varianzas de los rendimientos de estos activos están denotados por E(ri) i y Var(ri) 2i, respectivamente. Un inversionista que invierte una porción de su patrimonio en una cartera con estos activos obtendrá un rendimiento aleatorio (rp) dado por rp ¼ n X (v) ai ri , i¼1 donde ai ( 0) es la fracción de la cartera riesgosa mantenida en el activo i y donde ni1 i 1. En esta situación el rendimiento esperado de esta cartera será n X Eðr p Þ ¼ lp ¼ ai li : (vi) i¼1 Si los rendimientos de cada activo son independientes, la varianza del rendimiento de la cartera será Var(r p Þ ¼ r2p ¼ n X a2i r2i : (vii) i¼1 Si los rendimientos no son independientes la ecuación vii tendrá que modificarse para tomar en cuenta las covarianzas entre rendimientos. Usando esta notación general procederemos ahora a examinar algunos aspectos de este problema de asignación de cartera. 245 E7.4 Carteras óptimas Con muchos activos riesgosos el problema de la cartera óptima puede dividirse en dos pasos. El primero es considerar carteras con únicamente los activos riesgosos. El segundo, añadir el menos riesgoso. Para resolver la cartera óptima con únicamente activos riesgosos puede procederse como en el texto en el cual en la sección sobre diversificación se examinaron ponderaciones de la inversión óptima entre sólo dos activos riesgosos. Aquí se elegirá un conjunto general de ponderaciones de activos (las i) para minimizar la varianza (o desviación estándar) de la cartera para cada posible rendimiento esperado. La solución de este problema produce una “frontera de eficiencia” de carteras de activos riesgosos como la representada por la línea EE en la figura E7.1. Las carteras ubicadas bajo esta frontera son inferiores a aquellas sobre la frontera porque ofrecen menores rendimientos esperados en relación con cualquier grado de riesgo. Los rendimientos de cartera por encima de la frontera son inalcanzables. Sharpe (1970) analiza las matemáticas asociadas con la elaboración de la frontera EE. Añádase ahora un activo sin riesgo con rendimiento esperado f y f 0, indicado como punto R en la figura E7.1. Las carteras óptimas constarán ahora de combinaciones de este activo con los riesgosos. Todas estas carteras se ubicarán a lo largo de la línea RP en la figura porque esta señala el rendimiento máximo alcanzable para cada valor de para varias asignaciones de cartera. Estas asignaciones sólo contendrán un conjunto específico de activos riesgosos: el representado por el punto M. En equilibrio, esta será la “cartera del mercado” integrada por activos de capital, mantenidos en proporción con sus valuaciones de mercado. Esta cartera del mercado ofrecerá un rendimiento esperado de M y una desviación estándar de ese rendimiento de M. La ecuación para la línea RP que representa a cualquier cartera mixta está dada por la ecuación lineal lM lf lp ¼ lf þ rp : (viii) rM Esto indica que la línea del mercado RP permite a los inversionistas individuales “adquirir” rendimientos que exceden el rendimiento sin riesgo (M f), asumiendo proporcionalmente más riesgo (P/M). Para opciones en RP a la izquierda del punto de mercado M, P/M 1 y f P M. Puntos de alto riesgo a la derecha de M —los cuales pueden obtenerse pidiendo préstamos para producir una cartera apalancada— tendrán P/M 1 y prometerán un rendimiento esperado superior al provisto por la cartera del mercado (P M). Tobin (1958) fue uno de los primeros economistas en reconocer el papel que esos activos sin riesgo desempeñan en la identificación de la cartera del mercado y en el establecimiento de los términos en los cuales los inversionistas pueden obtener rendimientos superiores a los niveles sin riesgo. E7.5 Decisiones individuales La figura E7.2 ilustra las decisiones de cartera de varios inversionistas frente a las opciones ofrecidas por la línea RP. Esta figura ilustra el tipo de modelo de decisiones de cartera ya descrito en este capítulo. Los individuos con baja tolerancia al riesgo (I) optarán por carteras muy inclinadas al activo sin riesgo. Los inversionistas dispuestos a asumir un grado modesto de riesgo (II) optarán Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 246 Parte 3: Incertidumbre y estrategia FIGURA E7.1 Carteras eficientes. La frontera EE representa combinaciones óptimas de activos riesgosos que minimizan la desviación estándar de la cartera, P, para cada rendimiento esperado, P. Un activo sin riesgo con rendimiento f ofrece a los inversionistas la oportunidad de mantener carteras mixtas a lo largo de RP que combinen este activo sin riesgo con la cartera del mercado, M. P P E M M f R E M FIGURA E7.2 Comportamiento del inversionista y aversión al riesgo. P Dadas las opciones del mercado RP, los inversionistas pueden elegir cuánto riesgo desean asumir. Inversionistas con aversión al riesgo (UI) mantendrán principalmente activos sin riesgo, mientras que los corredores de riesgos (UIII) optarán por carteras apalancadas. P UIII P UII UI f M R P Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 7: Incertidumbre por carteras cercanas a la cartera del mercado. Los inversionistas de alto riesgo (III) podrían optar por carteras apalancadas. Nótese que todos los inversionistas enfrentan el mismo “precio” de riesgo (M f), mientras que sus rendimientos esperados están determinados por cuánto riesgo relativo (P/M) están dispuestos a correr. Nótese también que el riesgo asociado con la cartera de un inversionista sólo depende de la fracción de la cartera invertida en la cartera del mercado ( ) porque 2P 22M (1 )2 · 0. De ahí que P/M , así que la decisión de cartera del inversionista es equivalente a su decisión de riesgo. Fondos de inversión mobiliaria La noción de eficiencia de cartera se ha aplicado ampliamente al estudio de los fondos de inversión mobiliaria. En general, estos fondos son una buena respuesta a las necesidades de diversificación de los pequeños inversionistas. Dado que tales fondos reúnen los fondos de muchos individuos, pueden alcanzar economías de escala en transacciones y costos de manejo de cuenta. Esto les permite a los dueños de los fondos compartir la suerte de una variedad mucho más amplia de valores bursátiles de la que sería posible si cada uno actuara por separado. Sin embargo, los administradores de fondos de inversión mobiliaria tienen sus propios incentivos; así, las carteras en su poder quizá no siempre sean representaciones perfectas de las actitudes ante el riesgo de sus clientes. Por ejemplo, Scharfstein y Stein (1990) desarrollaron un modelo que muestra por qué los administradores de fondos de inversión mobiliaria tienen incentivos para “seguir a la manada” en sus selecciones de inversión. Otros estudios, como la investigación clásica de Jensen (1968), establecen que los administradores de los fondos de inversión mobiliaria rara vez pueden alcanzar rendimientos extra lo bastante grandes para neutralizar los gastos que cobran a los inversionistas. En años recientes esto ha llevado a muchos compradores de fondos de inversión mobiliaria a favorecer fondos “de índice” que buscan simplemente duplicar su promedio del mercado (representado, digamos, por el índice accionario Standard & Poor’s 500). Tales fondos tienen gastos bajos y, por tanto, permiten a los inversionistas alcanzar diversificación a un costo mínimo. E7.6 Modelo de valuación de activos de capital Aunque el análisis de E7.5 muestra cómo se determinará el precio de una cartera que combina un activo sin riesgo con la cartera del mercado no describe la disyuntiva de riesgo-rendimiento de un activo. Puesto que (suponiendo transacciones sin costo) un inversionista siempre puede evitar el riesgo no asociado con el mercado general, optando por diversificarse con una “cartera del mercado”, ese riesgo “asistemático” no garantizará un rendimiento excedente. Sin embargo, un activo obtendrá un rendimiento excedente en la medida en que contribuya al riesgo general del mercado. Un activo que no produce esos rendimientos extra no se mantendría en la cartera del mercado, así que no se le tendría en absoluto. Este es el discernimiento fundamental del modelo de valuación de activos de capital (MVAC). Para examinar formalmente estos resultados considera una cartera que combina un monto reducido ( ) de un activo con rendimiento aleatorio de x con la cartera del mercado (la cual tiene un rendimiento aleatorio de M. El rendimiento de esta cartera (z) estaría dado por z ¼ ax þ ð1 aÞM: 247 (ix) El rendimiento esperado es lz ¼ alx þ ð1 aÞlM (x) r2z ¼ a2 r2x þ ð1 aÞ2 r2M þ 2að1 aÞrx,M , (xi) con varianza donde x,M es la covarianza entre el rendimiento de x y el rendimiento del mercado. Pero nuestro análisis previo indica que rz : lz ¼ lf þ ðlM lf Þ (xii) rM Igualar las ecuaciones x a xii y diferenciar respecto a lM lf @rz @lz ¼ lx lM ¼ : @a rM @a arroja (xiii) Al calcular z/ de la ecuación xi y tomar el límite conforme se aproxima a cero, se obtiene lM lf rx,M r2M (xiv) lx lM ¼ , rM rM o, reordenando los términos, lx ¼ lf þ ðlM lf Þ rx;M : r2M (xv) Nuevamente, el riesgo tiene una recompensa de M f, pero ahora la cantidad de riesgo es medida por x,M/2M. Esta razón de la covarianza entre el rendimiento x y el mercado con la varianza del rendimiento del mercado se conoce como coeficiente beta del activo. En muchas publicaciones se reportan los coeficientes beta estimados para activos financieros. Estudios del MVAC Esta versión del MVAC tiene importantes implicaciones para las determinantes de la tasa esperada de rendimiento de cualquier activo. Debido a esta simplicidad el modelo ha sido sometido a gran número de pruebas empíricas. En general, estas establecen que la medida de riesgo sistémico (beta) del modelo se correlaciona en efecto con los rendimientos esperados, mientras que medidas de riesgo más simples (como la desviación estándar de rendimientos pasados) no. Quizá la prueba empírica temprana más influyente que llegó a esa conclusión sea la de Fama y MacBeth (1973). Pero el MVAC mismo sólo explica una reducida fracción de las diferencias en los rendimientos de varios activos. Y contrariamente al MVAC, varios autores han descubierto que muchos otros factores económicos afectan significativamente los rendimientos esperados. De hecho, un notorio desafío al MVAC procede de uno de sus fundadores originales (véase Fama y French, 1992). Referencias Fama, E. F. y K. R. French. “The Cross Section of Expected Stock Returns”, Journal of Finance, núm. 47 (1992), pp. 427-466. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 248 Parte 3: Incertidumbre y estrategia Fama, E. F. y J. MacBeth. “Risk Return and Equilibrium”, Journal of Political Economy, núm. 8 (1973), pp. 607-636. Jensen, M. “The Performance of Mutual Funds in the Period 1945-1964”, Journal of Finance (mayo de 1968), pp. 386-416. Scharfstein, D. S. y J. Stein. “Herd Behavior and Investment”, American Economic Review (junio de 1990), pp. 465-489. Sharpe, W. F. Portfolio Theory and Capital Markets, McGraw-Hill, Nueva York, 1970. Tobin, J. “Liquidity Preference as Behavior towards Risk”, Review of Economic Studies (febrero de 1958), pp. 65-86. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO OCHO Teoría de juegos En este capítulo se ofrece una introducción a la teoría de juegos no cooperativa, herramienta usada para entender las interacciones estratégicas entre dos o más agentes. La gama de aplicaciones de la teoría de juegos se ha incrementado constantemente, incluidas todas las áreas de la economía (de la economía del trabajo a la macroeconomía) y otros campos, como los de la ciencia política y biológica. La teoría de juegos es particularmente útil para comprender la interacción entre empresas en un oligopolio, así que los conceptos que se estudien aquí se usarán ampliamente en el capítulo 15. Comenzaremos con el concepto central del equilibrio de Nash y estudiade Nash, que se usan en juegos con estructuras de tiempo e información más complicadas. CONCEPTOS BÁSICOS Hasta aquí, en la parte 3 de este texto, se han estudiado las decisiones individuales tomadas en aislamiento. En este capítulo se estudiará la toma de decisiones en un marco estratégico más complicado. En un marco estratégico un individuo ya no puede tener una decisión obvia que es la mejor para él. Lo mejor para un tomador de decisiones puede depender de lo que hace el otro y viceversa. Por ejemplo, considera la interacción estratégica entre automovilistas y la policía. El que los trampas de velocidad. Que la policía considere valiosas esas trampas depende de en cuánto exceavance en el análisis del comportamiento estratégico. De hecho, las herramientas de la teoría de juegos nos permitirán llevar el análisis casi tan lejos como, por ejemplo, nuestro análisis de la optimización de la utilidad del consumidor en el capítulo 4. Hay dos grandes tareas implicadas en el uso de la teoría de juegos para analizar una situación económica. La primera es descubrir la situación en un juego simple. Dado que el análisis implicado en marcos estratégicos pronto se complica, más que en problemas de decisión simples, es imporcierto arte en descubrir juegos de situaciones que es difícil de enseñar. Los ejemplos en el texto y problemas de este capítulo pueden servir como modelos que ayuden a abordar situaciones nuevas. La segunda tarea es “resolver” el juego dado, lo cual resulta en una predicción respecto a lo que ocurrirá. Para resolver un juego se toma un concepto de equilibrio (como el equilibrio de Nash) y se hacen los cálculos requeridos para aplicarlo al juego dado. Gran parte de este capítulo se dedicará a enseñar los conceptos de equilibrio de uso más común y a practicar los cálculos necesarios para aplicarlos a juegos particulares. Un juego es un modelo abstracto de una situación estratégica. Aun los juegos más elementales 251 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 252 Parte 3: Incertidumbre y estrategia y la información que tienen los jugadores al moverse (quién sabe qué y cuándo) para describir el juego en su totalidad. Jugadores En un juego se le denomina jugador a cada tomador de decisiones. Los jugadores pueden ser individuos (como en los juegos de póquer), empresas (como en los mercados con pocas firmas) o naciones enteras (como en los conflictos militares). Un jugador se caracteriza por poseer la capacidad de elegir entre una serie de acciones posibles. Usualmente, el número de jugadores es fijo durante la “ejecución” del juego. Los juegos se caracterizan a veces por el número de jugadores implicados (juegos de dos jugadores, de tres jugadores, de n jugadores). A la manera de buena parte de la bibliografía económica, este capítulo tenderá a concentrarse en juegos de dos jugadores, porque este es el marco estratégico más simple. Denominaremos a los jugadores con números; así, en un juego de dos jugadores tendremos a los jugadores 1 y 2. En un juego de n jugadores tendremos a los jugadores 1, 2,…, n, mientras que al jugador genérico se le designará como i. Estrategias Cada curso de acción del que dispone un jugador durante el juego se llama estrategia. Dependiendo del juego bajo examen, una estrategia puede ser una acción simple (exceder o no el límite de velocidad) o un complejo plan de acciones que puede ser contingente de una jugada anterior en el juego (digamos, infraccionar sólo si el automovilista ha observado las trampas de velocidad en menos de la cuarta parte de los casos en viajes previos). Muchos aspectos de la teoría de los juegos pueden ilustrarse en juegos en los que los jugadores eligen entre sólo dos acciones posibles. Concédase que S1 denota la serie de estrategias a disposición del jugador 1, S2 la serie a disposición del jugador 2 y (más generalmente) Si la serie a disposición del jugador i. Sea s1 僆 S1 una estrategia particular elegida por el jugador 1 entre la serie de posibilidades, s2 僆 S2 la estrategia particular elegida por el jugador 2 y si 僆 Si por el jugador i. Un perfil de estrategias remitirá a una lista de estrategias particulares elegidas por cada uno de los miembros de un grupo de jugadores. Beneficios El rendimiento final para cada jugador en la conclusión de un juego se llama beneficio. Los beneficios se miden en niveles de utilidad obtenidos por los jugadores. Para mayor simplicidad suelen usarse beneficios monetarios (como ganancias de las empresas). En general los beneficios pueden incorporar factores no monetarios como prestigio, emoción, preferencias de riesgo, etcétera. En un juego de dos jugadores, u1(s1, s2) denota el beneficio del jugador 1, dado que elige s1 y el otro jugador elige s2 e, igualmente, u2(s2, s1) denota el beneficio del jugador 2.1 El hecho de que el beneficio del jugador 1 pueda depender de la estrategia del jugador 2 (y viceversa) es el punto donde aparece la interdependencia estratégica. En un juego de n jugadores, el beneficio de un jugador genérico i puede escribirse como ui(si, si), lo que depende de la estrategia si del jugador i y el perfil si (s1,…, si1, si1,…, sn) de las estrategias de todos los demás jugadores aparte de i. DILEMA DEL PRISIONERO El dilema del prisionero, introducido por A. W. Tucker en la década de 1940, es uno de los juegos más famosos estudiados en la teoría de juegos y servirá aquí de ejemplo para ilustrar toda lo notación que hemos presentado. El título se deriva de la situación siguiente. Dos sospechosos son arrestados por un crimen. El fiscal del distrito tiene pocas evidencias del caso y ansía extraer una 1 Técnicamente, estas son las funciones de utilidad Von Neumann-Morgenstern del capítulo anterior. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 253 confesión. Separa a los sospechosos y le dice a cada uno: “Si delatas a tu compañero, pero él no te delata a ti, te prometo una sentencia reducida (de un año), mientras que tu compañero obtendrá cuatro. Si ambos se delatan entre sí, cada uno obtendrá una sentencia de tres años”. Cada sospechoso sabe, asimismo, que si ninguno delata, la falta de evidencias resultará en que se le juzgue por un crimen menor, con una sentencia de dos años. Reducido a su esencia el dilema del prisionero tiene dos jugadores estratégicos: el sospechoso 1 y el sospechoso 2. (También hay un fiscal de distrito, pero como sus acciones ya fueron completamente especificadas no hay razón de complicar el juego e incluirlo en la especificación.) Cada jugador tiene dos estrategias posibles a su disposición: delatar o callar. Por tanto, escribimos sus series de estrategias como S1 S2 {delatar, callar}. Para evitar números negativos, los beneficios se especificarán como los años de libertad sobre los cuatro años siguientes. Por ejemplo, si el sospechoso 1 delata y el sospechoso 2 no, el sospechoso 1 disfrutará de tres años de libertad y el sospechoso 2 de ninguno, es decir u1 (delatar, callar) 3 y u2 (callar, delatar) 0. Forma normal El dilema del prisionero (y juegos como éste) puede resumirse con la matriz que aparece en la figura 8.1, llamada forma normal del juego. Cada uno de los cuatro cuadros representa una combinación diferente de estrategias y muestra los beneficios de los jugadores para tal combinación. La convención usual es que las estrategias del jugador 1 aparezcan en los encabezados de las filas y las del jugador 2 en los encabezados de las columnas, así como enlistar los beneficios correspondientes del jugador 1 y luego del jugador 2 en cada cuadro. Pensar estratégicamente en el dilema del prisionero Aunque no se ha analizado aún cómo resolver los juegos, vale la pena detenerse a pensar en lo que podría predecirse respecto al dilema del prisionero. Estudiando la figura 8.1, lo primero que uno podría predecir es que ambos sospechosos callarán. Esto da a ambos el total más alto de años de libertad (cuatro) en comparación con cualquier otro resultado. Pero luego de pensarlo mejor, ésa podría no ser la mejor predicción del juego. Imaginémonos un momento en la posición del jugador 1. No sabemos qué hará el jugador 2, pero como aún no hemos resuelto el juego investiguemos cada posibilidad. Supongamos que el jugador 2 decidiera delatar. Delatándonos, nosotros obtendríamos un año de libertad contra ninguno si calláramos, así que delatar es lo mejor para nosotros. Supongamos ahora que el jugador 2 decide callar. Delatar sigue siendo para nosotros mejor que callar, porque así obtendremos tres, no dos años de libertad. Más allá de lo que haga el otro jugador delatar es mejor para nosotros que callar, porque resulta en un año adicional de libertad. Como los jugadores son simétricos, el mismo razonamiento vale si nos imaginamos en la posición del jugador 2. Por tanto, la mejor predicción en el dilema del prisionero es que FIGURA 8.1 Sospechoso 2 Delatar Callar Forma normal del dilema del prisionero. Sospechoso 1 Delatar u1 1, u2 1 u1 3, u2 0 Callar u1 0, u2 3 u1 2, u2 2 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 254 Parte 3: Incertidumbre y estrategia ambos delatarán. Cuando se introduzca formalmente el concepto de solución principal —equilibrio de Nash— se descubrirá que, en efecto, el hecho de que ambos delaten es un equilibrio de Nash. Esta predicción tiene una propiedad paradójica: al delatar ambos, los sospechosos sólo disfrutarán de un año de libertad, pero si ambos callaran les iría mejor, pues disfrutarían de dos años de libertad. Esta paradoja no debe interpretarse como que los jugadores son tontos o nuestra predicción errónea. Más bien, revela un discernimiento central de la teoría de juegos en el sentido de que oponer a los jugadores entre sí en situaciones estratégicas lleva a veces a resultados ineficientes para ellos.2 Los sospechosos podrían tratar de evitar pasar tiempo adicional en prisión llegando al previo acuerdo de callar, reforzado tal vez por amenazas de represalias posteriores en caso de que uno u otro delate. Introducir acuerdos y amenazas conduce a un juego que difiere del dilema básico del prisionero, un juego que debe analizarse en sus propios términos usando las herramientas que se desarrollarán en breve. Resolver el dilema del prisionero fue fácil porque sólo había dos jugadores y dos estrategias y porque los cálculos estratégicos implicados eran muy sencillos. Sería útil disponer de una manera sistemática de resolver estos juegos, así como juegos más complicados. El equilibrio de Nash nos brinda esa solución sistemática. EQUILIBRIO DE NASH En la teoría económica de los mercados el concepto de equilibrio se desarrolla para indicar una situación en la que tanto ofertantes como demandantes están satisfechos con el resultado del mercado. Dados el precio y la cantidad de equilibrio ningún participante en el mercado tiene un incentivo para cambiar su comportamiento. En el marco estratégico de la teoría de juegos se adoptará una noción asociada de equilibrio, formalizada por John Nash en la década de 1950, llamada equilibrio de Nash.3 El equilibrio de Nash implica decisiones estratégicas que, una vez tomadas, no dan incentivos a los jugadores para alterar adicionalmente su comportamiento. Un equilibrio de Nash es una estrategia para cada jugador la cual consiste en la mejor decisión para cada uno de ellos, dadas las estrategias de equilibrio de los demás. En las secciones siguientes se dará una definición formal del equilibrio de Nash, se aplicará este concepto al dilema del prisionero y se mostrará un atajo (que implica enfatizar los beneficios) para elegir equilibrios de Nash a partir de la forma normal. Como en otras partes de este capítulo, el lector que quiera evitar tantas matemáticas puede saltarse la notación y las definiciones y pasar directamente a las aplicaciones sin perder demasiado del discernimiento básico detrás de la teoría de los juegos. Una definición formal El equilibrio de Nash puede definirse simplemente en términos de mejores respuestas. En un juego de n jugadores la estrategia si es una mejor respuesta a las estrategias de los rivales si, si el jugador i no puede obtener un beneficio estrictamente más alto con ninguna otra estrategia posible, s'i 僆 Si, dado que los rivales juegan si. DEFINICIÓN Mejor respuesta. si es una mejor respuesta del jugador i a las estrategias de los rivales si, denotada como si 僆 BRi(si), si ui(si, si) ui(s'i, si) para todas las s'i 僆 Si. (8.1) 2 Cuando se dice que el resultado es ineficiente se atienden sólo las utilidades de los sospechosos; si la atención se dirigiera a la sociedad en general, el hecho de que ambos delaten podría ser un buen resultado para el sistema de justicia penal, presumiblemente la motivación detrás del ofrecimiento del fiscal del distrito. 3 John Nash, “Equilibrium Points in n-Person Games”, Proceedings of the National Academy of Sciences, núm. 36 (1950), pp. 48-49. Nash es la principal figura en la película de 2001 A Beautiful Mind (véase el problema 8.5 para un ejemplo de la teoría de juegos, tomado de ese filme) y coganador del Premio Nobel de Economía en 1994. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 255 Un tecnicismo inserto en esta definición es que podría haber un conjunto de mejores respuestas en vez de una sola; por eso usamos la notación de inclusión de conjuntos si 僆 BRi(si). Podría haber un empate para la mejor respuesta, en cuyo caso el conjunto BRi(si) contendrá más de un elemento. Si no hay empate, habrá una sola mejor respuesta si y podemos escribir simplemente si BRi(si). Ahora es posible definir un equilibrio de Nash en un juego de n jugadores como sigue. DEFINICIÓN Equilibrio de Nash. Un equilibrio de Nash es un perfil de estrategias (s*1 , s*2 ,…, s*n ) tal que, para cada jugador, i 1, 2,…, n, s*i es una mejor respuesta a las estrategias de equilibrio de los demás jugadores s*i. Es decir, s*i 僆 BRi(s*i). Estas definiciones implican mucha notación. La notación es un poco más simple en un juego de dos jugadores. En un juego de dos jugadores (s*1, s*2) es un equilibrio de Nash si s*1 y s*2 son mejores respuestas mutuas: u1(s*1, s*2) u1(s1, s*2) para todas las s1 僆 S1 (8.2) u2(s*1, s*2) u2(s2, s*1) para todas las s2 僆 S2. (8.3) y Un equilibrio de Nash es estable en cuanto que, aun si todos los jugadores revelaran sus estrategias unos a otros, ninguno tendría un incentivo para desviarse de su estrategia de equilibrio y elegir otra. Las estrategias de no equilibrio no son estables en este sentido. Si un resultado no es un equilibrio de Nash, al menos un jugador debe beneficiarse del desvío. De jugadores hiperracionales sería de esperar que resolvieran el problema de inferencia y dedujeran que todos aplicarán un equilibrio de Nash (especialmente si sólo hay uno). Aun si los jugadores no son hiperracionales, a la larga es de esperar que su juego converja en un equilibrio de Nash, a medida que vayan abandonando estrategias que no son mejores respuestas mutuas. Aparte de esta propiedad de estabilidad, otra razón del amplio uso en economía del equilibrio de Nash es que su existencia está garantizada para todos los juegos que estudiaremos (lo cual permite estrategias mixtas que se definirán más adelante; en estrategias puras no necesariamente existen los equilibrios de Nash). Las matemáticas detrás de este resultado de existencia se analizarán ampliamente en las extensiones de este capítulo. El equilibrio de Nash tiene algunos inconvenientes. Puede haber múltiples equilibrios de Nash lo que dificulta dar con una predicción única. Asimismo, la definición de equilibrio de Nash deja sin aclarar cómo un jugador puede elegir una estrategia de mejor respuesta antes de saber cómo jugarán los rivales. Equilibrio de Nash en el dilema del prisionero Apliquemos los conceptos de mejor respuesta y equilibrio de Nash al ejemplo del dilema del prisionero. Nuestra suposición informada fue que ambos jugadores terminarán delatando. Demostraremos que la delación por ambos es un equilibrio de Nash de este juego. Para hacerlo, debe comprobarse que delatar es una mejor respuesta a la delación de los demás jugadores. Remitámonos a la matriz de beneficios de la figura 8.1. Si el jugador 2 delata, se está en la primera columna de la matriz. Si el jugador 1 también delata, su beneficio es 1; si calla, su beneficio es 0. Puesto que se obtiene más de delatar dada la delación del jugador 2, delatar es la mejor respuesta del jugador 1 ante la delación del jugador 2. Puesto que los jugadores son simétricos, la misma lógica implica que la delación del jugador 2 es una mejor respuesta a la delación del jugador 1. Así, la mutua delación es, en efecto, un equilibrio de Nash. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 256 Parte 3: Incertidumbre y estrategia Podemos demostrar más aún: que la delación de ambos es el único equilibrio de Nash. Para hacerlo, deben descartarse los otros tres resultados. Consideremos el resultado en que el jugador 1 delata y el jugador 2 calla, abreviado (delatar, callar), el extremo superior derecho de la matriz. Este no es un equilibrio de Nash. Dado que el jugador 1 delata, como ya se dijo, la mejor respuesta del jugador 2 es delatar, no callar. Simétricamente, el resultado en que el jugador 1 calla y el jugador 2 delata en el extremo inferior izquierdo de la matriz no es un equilibrio de Nash. Esto resulta en que los dos callan. Dado que el jugador 2 calla, dirigimos nuestra atención a la segunda columna de la matriz: las dos filas en esa columna muestran que el beneficio para el jugador 1 de callar es 2 y de delatar es 3. Así, callar no es una mejor respuesta a delatar; por tanto, el silencio de ambos no puede ser un equilibrio de Nash. Para descartar un equilibrio de Nash, basta con determinar que un solo jugador no ejerce una mejor respuesta y, por tanto, querría desviarse a otra estrategia. Considerando el resultado (delatar, callar), aunque el jugador 1 no se desviara de este (obtiene 3, que es lo más posible), el jugador 2 preferirá desviarse de callar a delatar. Simétricamente, considerando el resultado (callar, delatar), aunque el jugador 2 no quiera desviarse, el jugador 1 prefiere desviarse de callar a delatar, así que este no es un equilibrio de Nash. Considerando el resultado (callar, callar), ambos jugadores prefieren desviarse a otra estrategia, lo cual es más que suficiente para descartar este resultado como un equilibrio de Nash. Énfasis en los beneficios de la mejor respuesta Una manera rápida de encontrar los equilibrios de Nash de un juego es hacer énfasis en los beneficios de la mejor respuesta en la matriz. El procedimiento de énfasis se muestra en relación con el dilema del prisionero en la figura 8.2. El primer paso es subrayar los beneficios correspondientes a las mejores respuestas del jugador 1. La mejor respuesta del jugador 1 es delatar si el jugador 2 delata, así que subrayamos u1 1 en el cuadro superior izquierdo; y delatar si el jugador 2 calla, así que subrayamos u1 3 en el cuadro superior izquierdo. Luego se procede a subrayar los beneficios correspondientes a las mejores respuestas del jugador 2. La mejor respuesta del jugador 2 es delatar si el jugador 1 delata, así que se subraya u2 1 en el cuadro superior izquierdo; y delatar si el jugador 1 calla, así que se subraya u2 3 en el cuadro inferior izquierdo. Una vez subrayados los beneficios de las mejores respuestas, se buscan los cuadros en los que se ha subrayado el beneficio de cada jugador. Estos cuadros corresponden a los equilibrios de Nash. (Puede haber equilibrios de Nash adicionales que impliquen estrategias mixtas, los cuales se definirán más adelante.) En la figura 8.2, sólo en el cuadro superior izquierdo se subrayaron FIGURA 8.2 Procedimiento de subrayado en el dilema del prisionero. Sospechoso 2 Delatar Callar u1 1, u2 1 u1 3, u2 0 Callar u1 0, u2 3 u1 2, u2 2 Sospechoso 1 Delatar Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 257 ambos beneficios, lo que comprueba que (delatar, delatar) —y ninguno de los demás resultados— es un equilibrio de Nash. Estrategias dominantes (Delatar, delatar) es un equilibrio de Nash en el dilema del prisionero porque la delación es una mejor respuesta a la delación del otro jugador. Más todavía: delatar es la mejor respuesta a todas las estrategias del otro jugador, delatar y callar. (Esto puede verse, entre otras cosas, en el procedimiento de subrayado que se muestra en la figura 8.2: todos los beneficios del jugador 1 están subrayados en la fila, en la que él juega a delatar, y todos los beneficios del jugador 2 están subrayados en la columna en la que él juega a delatar.) Una estrategia que es una mejor respuesta a cualquier estrategia que los demás jugadores podrían elegir se llama estrategia dominante. Los jugadores no siempre tienen estrategias dominantes, pero cuando las tienen hay firmes razones para creer que jugarán de esa manera. Las complicadas consideraciones estratégicas no importan cuando un jugador tiene una estrategia dominante porque lo mejor para ese jugador es independiente de lo que hagan los demás. DEFINICIÓN Estrategia dominante. Una estrategia dominante es una estrategia s*i para el jugador i, que es una mejor respuesta a todos los perfiles de estrategias de otros jugadores. Es decir, s*i 僆 BRi(si) para todas las si. Nótese la diferencia entre una estrategia de equilibrio de Nash y una estrategia dominante. Una estrategia que es parte de un equilibrio de Nash debe ser sólo una mejor respuesta a un perfil de estrategias de otros jugadores, es decir sus estrategias de equilibrio. Una estrategia dominante debe ser una mejor respuesta no sólo a las estrategias de equilibrio de Nash de otros jugadores, sino a todas las estrategias de esos jugadores. Si todos los jugadores en un juego tienen una estrategia dominante, se dice que el juego tiene un equilibrio de estrategia dominante. Además de ser el equilibrio de Nash del dilema del prisionero (delatar, delatar) es un equilibrio de estrategia dominante. Es generalmente cierto para todos los juegos que un equilibrio de estrategia dominante, si existe, es también un equilibrio de Nash y es el único equilibrio de ese tipo. Batalla de los sexos El famoso juego de la batalla de los sexos es otro ejemplo que ilustra los conceptos de mejor respuesta y equilibrio de Nash. El caso es que una esposa (jugador 1) y un esposo (jugador 2) desean FIGURA 8.3 Forma normal de la batalla de los sexos Jugador 1 (Esposa) Jugador 2 (Esposo) Ballet Box Ballet 2, 1 0, 0 Box 0, 0 1, 2 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 258 Parte 3: Incertidumbre y estrategia coincidir acerca de a dónde ir en la noche. Pueden ir al ballet o al box. Ambos prefieren pasar tiempo juntos que separados. A condición de estar juntos, la esposa prefiere ir al ballet y el esposo al box. La forma normal de este juego se presenta en la figura 8.3. Para abreviar, omitimos las etiquetas u1 y u2 de los beneficios y simplemente enfatizamos la convención de que el primer beneficio es del jugador 1 y el segundo del jugador 2. Examinaremos los cuatro cuadros de la figura 8.3 y determinaremos cuáles son equilibrios de Nash y cuáles no. Comencemos por el resultado en el que ambos jugadores eligen el ballet, anotado como (ballet, ballet) en el extremo superior izquierdo de la matriz de beneficios. Dado que el esposo juega ballet, la mejor respuesta de la esposa es jugar ballet (esto le da su mayor beneficio en la matriz de 2). Usando la notación, ballet BR1(ballet). [No necesitamos el elaborado símbolo de inclusión de conjuntos como en “ballet 僆 BR1(ballet)” porque el esposo sólo tiene una mejor respuesta a la elección de ballet de la esposa.] Dado que la esposa juega ballet, la mejor respuesta del esposo es jugar ballet. Si se desviara al box, obtendría 0 en lugar de 1, porque ambos terminarían no coordinándose. Usando la notación, ballet BR2(ballet). Por tanto (ballet, ballet) es, en efecto, un equilibrio de Nash. Simétricamente (box, box) es un equilibrio de Nash. Considérese el resultado (ballet, box) en el extremo superior izquierdo de la matriz. Dado que el esposo elige box, la esposa obtiene 0 por elegir ballet, pero 1 por elegir box; así, ballet no es una mejor respuesta para la esposa a la elección de box del esposo. En la notación, ballet 僆 BR1(box). De ahí que (ballet, box) no pueda ser un equilibrio de Nash. [La estrategia de box del esposo tampoco es una mejor respuesta al jugar ballet de la esposa; por tanto, ambos jugadores preferirían desviarse de (ballet, box), aunque nos basta con encontrar un solo jugador que quiera desviarse para descartar un resultado como un equilibrio de Nash.] Simétricamente (box, ballet) tampoco es un equilibrio de Nash. La batalla de los sexos es un ejemplo de un juego con más de un equilibrio de Nash (de hecho, tiene tres, un tercero en estrategias mixtas, como veremos). Es difícil saber cuál de los dos que hemos hallado hasta este momento es más verosímil, porque son simétricos. Por tanto, es difícil hacer una predicción firme en este juego. La batalla de los sexos es también un ejemplo de un juego sin estrategias dominantes. Un jugador prefiere jugar ballet si el otro juega ballet, y jugar box si el otro juega box. La figura 8.4 aplica el procedimiento de subrayado —el cual se usó para encontrar rápido los equilibrios de Nash—, a la batalla de los sexos. Este procedimiento comprueba que los dos resultados en que los jugadores logran coordinarse son equilibrios de Nash y que los dos resultados en los que no se coordinan no lo son. Los ejemplos 8.1 y 8.2 brindan práctica adicional en el hallazgo de equilibrios de Nash en marcos más complicados (un juego que tiene muchos empates de mejores respuestas en el ejemplo 8.1 y un juego que tiene tres estrategias para cada jugador en el ejemplo 8.2). FIGURA 8.4 Procedimiento de subrayado en la batalla de los sexos Jugador 1 (esposa) Jugador 2 (esposo) Ballet Box Ballet 2, 1 0, 0 Box 0, 0 1, 2 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 259 EJEMPLO 8.1 El dilema del prisionero reducido En esta variación del dilema del prisionero, un sospechoso es condenado y recibe una sentencia de cuatro años si lo delatan y, si no, sale libre. El fiscal del distrito no recompensa la delación. La figura 8.5 presenta la forma normal de este juego antes y después de aplicar el procedimiento de subrayar mejores respuestas. Los beneficios se reformulan nuevamente en términos de años de libertad. FIGURA 8.5 El dilema del prisionero reducido a) Forma normal Sospechoso 1 Sospechoso 2 Delatar Callar Delatar 0, 0 1, 0 Callar 0, 1 1, 1 b) Procedimiento de subrayado Sospechoso 1 Sospechoso 2 Delatar Callar Delatar 0, 0 1, 0 Callar 0, 1 1, 1 Los empates de mejores respuestas abundan. Por ejemplo, dado que el jugador 2 delata, el beneficio del jugador 1 es 0 si delata o calla. Por tanto hay un empate de mejor respuesta del jugador 1 a la delación por el jugador 2. Este es un ejemplo en el que el conjunto de mejores respuestas contiene más de un elemento: BR1 (delatar) {delatar, callar}. El procedimiento de subrayado muestra que hay un equilibrio de Nash en cada uno de los cuatro cuadrantes. Dado que los sospechosos no reciben ninguna recompensa o sanción personal por delatar, ambos son indiferentes entre delatar y callar; por tanto, cualquier resultado puede ser un equilibrio de Nash. PREGUNTA: ¿Alguno de los jugadores tiene una estrategia dominante? EJEMPLO 8.2 Piedra, papel o tijeras “Piedra, papel o tijeras” es un juego infantil en el que los dos jugadores muestran simultáneamente uno de tres símbolos con la mano. La figura 8.6 presenta la forma normal. Los cero beneficios a lo largo de la diagonal indican que si los jugadores adoptan la misma estrategia, no se hará ningún pago. En otros casos los beneficios indican un pago de 1 dólar del perdedor al ganador conforme a la jerarquía usual (la piedra rompe las tijeras, las tijeras cortan el papel, el papel cubre la piedra). Como sabe quienquiera que haya jugado este juego, y como lo revela el procedimiento de subrayado, ninguno de los nueve cuadros representa un equilibrio de Nash. Todo par de estrategias es inestable Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Parte 3: Incertidumbre y estrategia porque ofrece al menos a uno de los jugadores un incentivo para desviarse. Por ejemplo, (tijeras, tijeras) da un incentivo para que el jugador 1 o 2 elija piedra; (papel, piedra) da un incentivo al jugador 2 para elegir tijeras. FIGURA 8.6 Piedra, papel o tijeras a) Forma normal Jugador 1 Jugador 2 Piedra Papel Tijeras Piedra 0, 0 −1, 1 1, −1 Papel 1, −1 0, 0 −1, 1 Tijeras −1, 1 1, −1 0, 0 b) Procedimiento de subrayado Jugador 2 Jugador 1 260 Piedra Papel Tijeras Piedra 0, 0 −1, 1 1, −1 Papel 1, −1 0, 0 −1, 1 Tijeras −1, 1 1, −1 0, 0 Este juego tiene un equilibrio de Nash no en los nueve cuadros de la figura, sino en estrategias mixtas, que se definirán en la sección siguiente. PREGUNTAS: ¿Algún jugador tiene una estrategia dominante? ¿Por qué (papel, tijeras) no es un equilibrio de Nash? ESTRATEGIAS MIXTAS Las estrategias de los jugadores pueden ser más complicadas que simplemente elegir una acción con certidumbre. En esta sección se estudiarán las estrategias mixtas, en las que el jugador selecciona aleatoriamente a partir de varias acciones posibles. En contraste, las estrategias consideradas en los ejemplos hasta aquí implicaban que un jugador eligiera con certidumbre una acción u otra; estas se llaman estrategias puras. Por ejemplo, en la batalla de los sexos se consideraron las Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 261 estrategias puras de elegir con seguridad entre ballet y box. Una posible estrategia mixta en este juego sería lanzar una moneda al aire y luego asistir al ballet si y sólo si la moneda resulta en cara, produciendo una posibilidad de 50-50 de que caiga uno u otro evento. Aunque a primera vista podría parecer extraño hacer que los jugadores lancen monedas al aire para determinar cómo jugarán, hay buenas razones para estudiar las estrategias mixtas. Primero, algunos juegos (como el de “Piedra, papel o tijeras”) no tienen equilibrios de Nash en estrategias puras. Como se verá en la sección sobre la existencia, esos juegos siempre tienen un equilibrio de Nash en estrategias mixtas; por tanto, considerar estrategias mixtas nos permitirá hacer predicciones en aquellos juegos en los que de otra forma sería imposible hacerlo. Segundo, las estrategias que implican aleatorización son naturales y conocidas en ciertos ámbitos. Los estudiantes conocen el ámbito de los exámenes de cursos. El tiempo de una clase suele ser demasiado limitado para que el profesor examine a los alumnos sobre cada tema impartido en el aula, pero puede ser suficiente para probarlos en un subconjunto de temas para inducirlos a estudiar todo el material. Si los estudiantes supieran qué temas aparecerán en el examen podrían inclinarse a estudiar sólo esos y no los demás; así, el profesor debe escoger los temas al azar para lograr que los alumnos estudien todo. Las estrategias aleatorias también son comunes en los deportes (el mismo futbolista dispara a veces a la derecha de la portería y a veces a la izquierda en penaltis) y en los juegos de cartas (el jugador de póquer a veces se repliega y a veces engaña con una mano igualmente mala en distintos momentos).4 Definiciones formales Para ser más formales, supongamos que un jugador i tiene una serie de M posibles acciones Ai {ai1,…, ami,…, aMi}, donde el subíndice se refiere al jugador y el superíndice a las diferentes opciones. Una estrategia mixta es una distribución de probabilidad sobre las M acciones, si {i1,…, mi, …, Mi }, donde mi es un número entre 0 y 1 que indica la probabilidad de que el jugador i ejecute la acción ami. Las probabilidades en si deben sumar la unidad: i1 … mi … mi 1. En la batalla de los sexos, por ejemplo, ambos jugadores tienen las mismas dos acciones de ballet y box, así que puede escribirse A1 A2 {ballet, box}. Una estrategia mixta puede escribirse como un par de probabilidades (, 1 ), donde es la probabilidad de que el jugador elija ballet. Las probabilidades deben sumar la unidad, así que, con dos acciones, y una vez especificada la probabilidad de una acción, se determina la probabilidad de la otra. La estrategia mixta (1/3, 2/3) significa que el jugador juega ballet con probabilidad de 1/3, y box con probabilidad de 2/3; (1/2, 1/2) significa que el jugador tiene la misma probabilidad de jugar ballet o box; (1, 0) significa que el jugador elegirá ballet con toda certeza; y (0, 1), que con seguridad elegirá box. En nuestra terminología una estrategia mixta es una categoría general que incluye el caso especial de una estrategia pura. Una estrategia pura es el caso especial en el que sólo se ejecuta una acción con probabilidad positiva. Las estrategias mixtas que implican dos o más acciones ejecutadas con probabilidad positiva se llaman estrategias estrictamente mixtas. Para volver a los ejemplos del párrafo anterior de estrategias mixtas en la batalla de los sexos, las cuatro estrategias (1/3, 2/3), (1/2, 1/2), (1, 0) y (0, 1) son estrategias mixtas. Las dos primeras son estrictamente mixtas, y las dos segundas estrategias puras. Con esta notación para las acciones y estrategias mixtas detrás de nosotros no necesitamos nuevas definiciones para mejor respuesta, equilibrio de Nash y estrategia dominante. Las definiciones que se presentaron cuando si se tomó como una estrategia pura también se aplican al caso en el que si se toma como una estrategia mixta. El único cambio es que la función de beneficio 4 Una tercera razón es que las estrategias mixtas puedan “purificarse”, especificando un juego más complicado en el que una u otra acción es mejor para el jugador por razones privadas y donde esa acción con seguridad se ejecuta. Por ejemplo, un profesor de historia podría decidir hacer una pregunta en un examen sobre la primera Guerra Mundial porque, sin que los estudiantes lo sepan, recientemente leyó en una revista especializada un interesante artículo sobre ella. Véase John Harsanyi, “Games with Randomly Disturbed Payoffs: A New Rationale for Mixed-Strategy Equilibrium Points”, International Journal of Game Theory, núm. 2 (1973), pp. 1-23. Harsanyi fue coganador (junto con Nash) del Premio Nobel de Economía en 1994. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 262 Parte 3: Incertidumbre y estrategia ui(si, si), más que ser un beneficio cierto, debe reinterpretarse como el valor esperado de un beneficio aleatorio con probabilidades dadas por las estrategias si y si. El ejemplo, 8.3 proporciona alguna práctica en el cálculo de beneficios esperados en la batalla de los sexos. EJEMPLO 8.3 Beneficios esperados en la batalla de los sexos Calculemos los beneficios esperados de los jugadores si la esposa elige la estrategia mixta (1/9, 8/9) y el esposo (4/5, 1/5) en la batalla de los sexos. El beneficio esperado de la esposa es U1 1 8 4 1 1 4 1 1 , , , ¼ U1 ðballet, balletÞ þ U1 ðballet, boxÞ 9 9 5 5 9 5 9 5 8 4 8 1 U1 ðbox, balletÞ þ U1 ðbox, boxÞ þ 9 5 9 5 1 4 1 1 8 4 8 1 ð2Þ þ ð0Þ þ ð0Þ þ ð1Þ ¼ 9 5 9 5 9 5 9 5 16 ¼ : 45 (8.4) Para entender la ecuación 8.4 es útil repasar el concepto de valor esperado del capítulo 2. El valor esperado de una variable aleatoria es igual a la suma de todos los resultados de la probabilidad del resultado multiplicada por el valor de la variable aleatoria en ese resultado. En la batalla de los sexos hay cuatro resultados, correspondientes a los cuatro cuadrantes en la figura 8.3. Como los jugadores deciden de manera aleatoria e independiente, la probabilidad de llegar a un cuadrante particular es igual al producto de las probabilidades de que cada jugador ejecute la estrategia que conduce a ese cuadrante. Por tanto, por ejemplo, la probabilidad (box, ballet) —es decir, que la esposa juegue box y el esposo ballet— equivale a (8/9) × (4/5). Las probabilidades de los cuatro resultados se multiplican por el valor de la variable aleatoria relevante (en este caso, el beneficio del jugador 1) en cada resultado. Calculemos ahora el beneficio esperado de la esposa si esta ejecuta la estrategia pura de ir al ballet [igual que la estrategia mixta (1, 0)] y el esposo sigue ejecutando la estrategia mixta (4/5, 1/5). Esta vez sólo hay dos resultados relevantes dados por los dos cuadrantes en la fila en la que la esposa juega ballet. Las probabilidades de esos dos resultados están dadas por las probabilidades en la estrategia mixta del esposo. Por tanto, 4 1 4 1 U 1 ballet, U 1 ðballet, boxÞ , ¼ U 1 ðballet, balletÞ þ 5 5 5 5 4 1 8 ¼ ð2Þ þ ð0Þ ¼ : 5 5 5 (8.5) Por último calculemos la expresión general para el beneficio esperado de la esposa cuando ejecuta la estrategia mixta (w, 1 w) y el esposo ejecuta (h, 1 h): si la esposa juega ballet con probabilidad w y el esposo con probabilidad h, entonces U 1 ððw, 1 wÞ, ðh, 1 hÞÞ ¼ ðwÞðhÞU 1 ðballet, balletÞ þ ðwÞð1 hÞU 1 ðballet, boxÞ þ ð1 wÞðhÞU 1 ðbox, balletÞ þ ð1 wÞð1 hÞU 1 ðbox, boxÞ ¼ ðwÞðhÞð2Þ þ ðwÞð1 hÞð0Þ þ ð1 wÞðhÞð0Þ þ ð1 wÞð1 hÞð1Þ ¼ 1 h w þ 3hw: (8.6) PREGUNTAS: ¿Cuál es el beneficio esperado del esposo en cada caso? Demuestra que su beneficio esperado es 2 –2h 2w + 3hw en el caso general. Dado que el esposo ejecuta la estrategia mixta (4/5, 1/5), ¿qué estrategia brinda a la esposa el beneficio más alto? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 263 Cálculo de equilibrios de estrategias mixtas Calcular los equilibrios de Nash de un juego cuando están implicadas estrategias estrictamente mixtas es un poco más complicado que cuando están implicadas estrategias puras. Antes de meternos en eso podríamos ahorrarnos mucho trabajo preguntando si el juego tiene siquiera un equilibrio de Nash en estrategias estrictamente mixtas. De no ser así, habiendo encontrado todos los equilibrios de Nash de estrategias puras, se ha terminado de analizar el juego. La clave para suponer que un juego tiene un equilibrio de Nash en estrategias estrictamente mixtas es el sorprendente resultado de que casi todos los juegos tienen un número impar de equilibrios de Nash.5 Apliquemos este discernimiento a algunos de los ejemplos que hemos considerado hasta aquí. Encontramos un número impar (uno) de equilibrios de Nash en estrategias puras en el dilema del prisionero, lo cual sugiere que ya no necesitamos buscar uno en estrategias estrictamente mixtas. En la batalla de los sexos encontramos un número par (dos) de equilibrios de Nash en estrategias puras, lo que sugiere la existencia de un tercero en estrategias estrictamente mixtas. El ejemplo 8.2 —“Piedra, papel o tijeras”— no tiene equilibrios de Nash en estrategias puras. Para llegar a un número impar de equilibrios de Nash, sería de esperar que encontráramos un equilibrio de Nash en estrategias estrictamente mixtas. EJEMPLO 8.4 Equilibrio de Nash en estrategias mixtas en la batalla de los sexos Una estrategia mixta general para la esposa en la batalla de los sexos es (w, 1 w), y para el esposo (h, 1 h), donde w y h son las probabilidades de jugar ballet para la esposa y el esposo, respectivamente. Se calcularán valores para w y h que compongan equilibrios de Nash. Ambos jugadores tienen un continuo de estrategias posibles entre 0 y 1. Así, estas estrategias no pueden escribirse en las filas y columnas de una matriz, y tampoco es posible subrayar beneficios de mejor respuesta para hallar los equilibrios de Nash. En cambio, para despejar los equilibrios de Nash, se usarán métodos gráficos. Dadas las estrategias mixtas generales de los jugadores, en el ejemplo 8.3 se vio que el beneficio esperado de la esposa es U1((w, 1 w), (h, 1 h)) 1 h w 3hw. (8.7) Como indica la ecuación 8.7, la mejor respuesta de la esposa depende de h. Si h 1/3, ella quiere fijar w lo más bajo posible: w 0. Si h 1/3, su mejor respuesta es fijar w lo más alto posible: w 1. Cuando h 1/3, su beneficio esperado es igual a 2/3 más allá de lo que w elija. En este caso hay un empate en la mejor respuesta, que incluye cualquier w de 0 a 1. En el ejemplo 8.3 se estableció que el beneficio esperado del esposo es U2((h, 1 h), (w, 1 w)) 2 2h 2w 3hw. (8.8) Cuando w 2/3, su beneficio esperado es optimizado por h 0; cuando w 2/3, su beneficio esperado es optimizado por h 1; y cuando w 2/3 el esposo es indiferente entre todos los valores de h, obteniendo un beneficio esperado de 2/3. Las mejores respuestas se grafican en la figura 8.7. Los equilibrios de Nash están dados por los puntos de intersección entre las mejores respuestas. En esos puntos de intersección, ambos jugadores se dan mejores respuestas entre sí, lo cual es lo que se requiere para que el resultado sea un equilibrio de Nash. Hay tres equilibrios de Nash. Los puntos E1 y E2 son los equilibrios de Nash en estrategias puras que ya hallamos, correspondiendo E1 al equilibrio de Nash en estrategias puras en el que ambos juegan box y E2 a aquel en el que ambos juegan ballet. El punto E3 es el equilibrio de Nash en estrategias estrictamente mixtas, el cual puede formularse como “la esposa juega ballet con probabilidad de 2/3 y box con probabilidad de 1/3; y el esposo juega ballet con probabilidad de 1/3 y box con probabilidad de 2/3”. Más sucintamente, habiendo definido w y h, podemos escribir este equilibrio como “w* 2/3 y h* 1/3”. 5 John Harsanyi, “Oddness of the Number of Equilibrium Points: A New Proof ”, International Journal of Game Theory, núm. 2 (1973), pp. 235-250. Los juegos en los que hay empates entre beneficios pueden tener un número par o infinito de equilibrios de Nash. El ejemplo 8.1, “El dilema del prisionero”, tiene varios empates de beneficios. Tiene cuatro equilibrios de Nash en estrategias puras y un número infinito de equilibrios en estrategias mixtas. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 264 Parte 3: Incertidumbre y estrategia FIGURA 8.7 Equilibrios de Nash en estrategias mixtas en la batalla de los sexos El ballet es elegido por la esposa con probabilidad w y por el esposo con probabilidad h. La mejores respuestas de los jugadores se grafican en la misma serie de ejes. Los tres puntos de intersección E1, E2 y E3 son equilibrios de Nash. El equilibrio de Nash en estrategias estrictamente mixtas, E3, es w* 2/3 y h* 1/3. h E2 1 Mejor respuesta del esposo, BR 2 2/3 E3 1/3 Mejor respuesta de la esposa, BR1 E1 0 w 1/3 2/3 1 PREGUNTAS: ¿Cuál es el beneficio esperado de un jugador en el equilibrio de Nash en estrategias estrictamente mixtas? ¿Qué resulta de comparar ese beneficio con aquellos en los equilibrios de Nash en estrategias puras? ¿Qué argumentos podrían ofrecerse de que uno u otro de los tres equilibrios de Nash pudieran ser la mejor predicción en este juego? El ejemplo 8.4 hace los extensos cálculos contenidos en la determinación de todos los equilibrios de Nash en la batalla de los sexos, los de estrategias puras y los de estrategias estrictamente mixtas. Un atajo para hallar el equilibrio de Nash en estrategias estrictamente mixtas se basa en el discernimiento de que un jugador estará dispuesto a decidir aleatoriamente entre dos acciones en equilibrio, sólo si obtiene el mismo beneficio esperado de ejecutar cualquiera de ambas acciones o, en otras palabras, si es indiferente entre las dos acciones en equilibrio. De lo contrario, una de las dos acciones brindaría un beneficio esperado más alto, y con seguridad el jugador preferirá ejecutar esa acción. Supongamos que el esposo ejecuta la estrategia mixta (h, 1 h), es decir jugar ballet con probabilidad h y box con probabilidad 1 h. El beneficio esperado de la esposa de jugar ballet es U1(ballet, (h, 1 h)) (h)(2) (1 h)(0) 2h. (8.9) El beneficio esperado de jugar box es U1(box, (h, 1 h)) (h)(0) (1 h)(1) 1 h. (8.10) Para que la esposa sea indiferente entre ballet y box en equilibrio, las ecuaciones 8.9 y 8.10 deben ser iguales: 2h 1 – h, lo cual implica que h* 1/3. Cálculos similares, basados en la indiferencia del esposo entre jugar ballet y box en equilibrio, indican que la probabilidad de que la esposa juegue ballet en el equilibrio de Nash en estrategias estrictamente mixtas es w* 2/3. (Haz estos cálculos como ejercicio.) Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 265 Nótese que la condición de indiferencia de la esposa no “fija” su estrategia mixta de equilibrio. La condición de indiferencia de la esposa no puede fijar su propia estrategia mixta de equilibrio porque, dado que ella es indiferente entre las dos acciones en equilibrio, su beneficio esperado general es el mismo sin importar qué distribución de probabilidad ponga en juego sobre las dos acciones. Más bien, la condición de indiferencia de la esposa fija la estrategia mixta del otro jugador, el esposo. Hay una única distribución de probabilidad que él puede usar para jugar ballet o jugar box que la vuelve a ella indiferente entre las dos acciones, y que por tanto la dispone a decidir aleatoriamente. Dada cualquier probabilidad de que él juegue ballet y box diferente de (1/3, 2/3), este no sería un resultado estable para que ella decidiera aleatoriamente. Por tanto, dos principios deben tenerse en mente al buscar equilibrios de Nash en estrategias estrictamente mixtas. Uno es que un jugador decide al azar sólo aquellas acciones entre las que es indiferente, dadas las estrategias mixtas en equilibrio de otros jugadores. El segundo es que la condición de indiferencia de un jugador fija la estrategia mixta del otro jugador. EXISTENCIA DE EQUILIBRIO Una de las razones por las que el equilibrio de Nash es de uso tan común es que un equilibrio de Nash tiene garantizada su existencia en una amplia clase de juegos. Este no es el caso de otros conceptos de equilibrio. Considérese el concepto de equilibrio de estrategias dominantes. El dilema del prisionero tiene un equilibrio de estrategias dominantes (ambos sospechosos delatan), pero la mayoría de los juegos no. En efecto, hay muchos juegos —como el de la batalla de los sexos— en los que ningún jugador tiene una estrategia dominante, y menos aún todos los jugadores. En tales juegos no es posible hacer predicciones usando el equilibrio de estrategias dominantes, aunque pueden hacerse usando el equilibrio de Nash. La sección de extensiones, al final de este capítulo, ofrece los detalles técnicos detrás de la prueba de John Nash acerca de la existencia de su equilibrio en todos los juegos finitos (juegos con un número finito de jugadores y un número finito de acciones). El teorema de la existencia no garantiza que haya un equilibrio de Nash en estrategias puras. Ya se vio un ejemplo: “Piedra, papel o tijeras” en el ejemplo 8.2. Sin embargo, si un juego finito no tiene un equilibrio de Nash en estrategias puras, ese teorema garantiza que tendrá un equilibrio de Nash en estrategias mixtas. La prueba del teorema de Nash es similar a la prueba en el capítulo 13 de la existencia de precios conducentes a un equilibrio competitivo general. La sección “Extensiones” incluye un teorema de la existencia para juegos con un continuo de acciones, como se estudiará en la sección siguiente. CONTINUO DE ACCIONES La mayoría de los discernimientos procedentes de situaciones económicas puede obtenerse a menudo separando la situación en varias o incluso en dos acciones, como en el caso de todos los juegos estudiados hasta aquí. En otros momentos, los discernimientos adicionales pueden obtenerse permitiendo un continuo de acciones. Para ser claros, ya encontramos un continuo de estrategias —en nuestro análisis de las estrategias mixtas—, pero aun así las distribuciones de probabilidad en estrategias mixtas fueron sobre un número finito de acciones. En esta sección nos concentraremos en un continuo de acciones. Algunas situaciones se modelizan en forma más realista mediante una gama continua de acciones. En el capítulo 15, por ejemplo, se estudiará la competencia entre empresas estratégicas. En un modelo (de Bertrand) las empresas fijan precios; en otro (de Cournot), fijan cantidades. Es natural permitir que las empresas elijan cualquier precio o cantidad no negativos en vez de restringirlas artificialmente a sólo dos precios (digamos 2 o 5 dólares) o dos cantidades (digamos 100 o 1 000 unidades). Las acciones continuas tienen otras ventajas. Los conocidos métodos del cálculo pueden usarse con frecuencia para despejar equilibrios de Nash. También es posible analizar cómo las Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 266 Parte 3: Incertidumbre y estrategia acciones de equilibrio varían con cambios en los parámetros subyacentes. Con el modelo de Cournot, por ejemplo, podríamos querer saber cómo varían las cantidades de equilibrio con un pequeño incremento en los costos marginales o un parámetro de la demanda de una empresa. Tragedia de los comunes El ejemplo 8.5 ilustra cómo despejar el equilibrio de Nash cuando el juego (en este caso la tragedia de los comunes) implica un continuo de acciones. El primer paso es escribir el beneficio de cada jugador como una función de las acciones de todos los jugadores. El paso siguiente es calcular la condición de primer orden, asociada con el beneficio óptimo de cada jugador. Esto dará una ecuación que puede reordenarse para dar lugar a la mejor respuesta de cada jugador como una función de las acciones de todos los demás jugadores. Habrá una ecuación para cada jugador. Con n jugadores el sistema de n ecuaciones para las n acciones de equilibrio desconocidas puede resolverse simultáneamente con métodos algebraicos o gráficos. EJEMPLO 8.5 Tragedia de los comunes El término tragedia de los comunes ha terminado por significar problemas ambientales por abuso que ocurre cuando los recursos escasos se tratan como si fueran propiedad común.6 Una ilustración teórica de juego de este asunto puede desarrollarse suponiendo que dos pastores deciden cuántas ovejas llevar a pastar a los terrenos comunales del pueblo. El problema es que esos bienes comunales son reducidos y pueden sucumbir rápidamente al sobrepastoreo. Para dotar de cierta estructura matemática a este problema, sea qi el número de ovejas que el pastor i 1, 2 lleva a pastar a los terrenos comunales, y que el valor por oveja del pastoreo en esos terrenos (en términos de lana y queso de leche de oveja) es v(q1, q2) 120 (q1 q2). (8.11) Esta función implica que el valor de apacentar un determinado número de ovejas es menor mientras más ovejas compiten por pastos. Para representar la forma normal de este juego de acciones continuas no es posible usar una matriz. En cambio, la forma normal es simplemente una lista de las funciones de beneficio de los pastores u1(q1, q2) q1v(q1, q2) q1(120 q1 q2), u2(q1, q2) q2v(q1, q2) q2(120 q1 q2). (8.12) Para hallar el equilibrio de Nash se resuelve el problema de maximización de valor del pastor 1: max{q1(120 q1 q2)}. q1 (8.13) La condición de primer orden para un máximo es 120 2q1 q2 0 (8.14) o, reordenando, q1 ¼ 60 q2 ¼ BR1 ðq2 Þ: 2 (8.15) Pasos similares muestran que la mejor respuesta del pastor 2 es q2 ¼ 60 q1 ¼ BR2 ðq1 Þ: 2 (8.16) El equilibrio de Nash está dado por el par (q*1, q*2) que satisface las ecuaciones 8.15 y 8.16, simultáneamente. Adoptando un enfoque algebraico de la solución simultánea la ecuación 8.16 puede sustituirse en la ecuación 8.15, lo cual al reordenar produce 6 Este término fue popularizado por G. Hardin en “The Tragedy of the Commons”, Science, núm. 162 (1968), pp. 1243-1248. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos q1 ¼ 60 1 q 60 1 ; 2 2 267 (8.17) esto implica que q*1 40. Sustituir q*1 40 en la ecuación 8.17 implica que también q*2 40. Por tanto, cada pastor apacentará 40 ovejas en los terrenos comunales. Cada cual obtiene un beneficio de 1 600, como puede verse al sustituir q*1 q*2 40 en la función de beneficio de la ecuación 8.13. Las ecuaciones 8.15 y 8.16 también pueden resolverse simultáneamente usando métodos gráficos. La figura 8.8 traza las dos mejores respuestas en una gráfica en que la acción del jugador 1 aparece en el eje horizontal y la del jugador 2, en el eje vertical. Estas mejores respuestas son simplemente líneas, así que es fácil graficarlas en el ejemplo. (Para ser congruentes con las etiquetas de los ejes, lo que realmente se ha graficado es la inversa de la ecuación 8.15.) Las dos mejores respuestas intersecan en el equilibrio de Nash E1. FIGURA 8.8 Diagrama de mejores respuestas para la tragedia de los comunes La intersección E1, entre las mejores respuestas de los dos pastores, es el equilibrio de Nash. Un incremento en el valor por oveja de pastar en la tragedia de los comunes desplaza hacia fuera la mejor respuesta del pastor 1, lo que resulta en un equilibrio de Nash E2, en el cual el pastor 1 apacienta más ovejas (y el pastor 2, menos) que en el equilibrio de Nash original. q2 120 BR1(q2) 60 40 E1 E2 BR 2(q1) 0 40 60 120 q1 El método gráfico es útil para mostrar cómo el equilibrio de Nash se desplaza con variaciones en los parámetros del problema. Supongamos que el valor por oveja del pastoreo se incrementa para el primer pastor mientras que el del segundo permanece como en la ecuación 8.11, quizás porque el primer pastor comienza a criar ovejas merina con lana más valiosa. Este cambio desplazaría hacia fuera la mejor respuesta del pastor 1, dejando sin variación la del pastor 2. El nuevo punto de intersección (E2 en la figura 8.8), el cual es el nuevo equilibrio de Nash, implica más ovejas para 1 y menos para 2. El equilibrio de Nash no es el mejor uso de los bienes comunes. En el problema original, el valor por oveja del pastoreo de ambos pastores está dado por la ecuación 8.11. Si ambos apacentaran sólo 20 ovejas, cada uno obtendría un beneficio de 1 800, como puede verse al sustituir q1 q2 30 en la ecuación 8.13. En realidad, el “problema de optimización del beneficio” max fðq1 þ q2 Þvðq1 , q2 Þg ¼ max fðq1 þ q2 Þð120 q1 q2 Þg q1 , q2 q1 , q2 (8.18) se resuelve con q1 q2 30 o, en general, con cualesquier q1 y q2 que sumen 60. PREGUNTAS: ¿Cómo se desplazaría el equilibrio de Nash si los beneficios de ambos pastores se incrementaran en el mismo monto? ¿Qué podría decirse del decremento en el beneficio del pastoreo para (únicamente) el pastor 2? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 268 Parte 3: Incertidumbre y estrategia Como indica el ejemplo 8.5, los métodos gráficos son especialmente convenientes para determinar rápidamente los desplazamientos del equilibrio con cambios en los parámetros subyacentes. El ejemplo desplazó el beneficio del pastoreo de uno de los pastores. Este ejercicio ilustra claramente la naturaleza de la interacción estratégica. La función de beneficio del pastor 2 no ha cambiado (sólo la del pastor 1), pero su acción de equilibrio cambia. El segundo pastor observa el beneficio más alto del primero, prevé que el primero incrementará el número de ovejas que apacienta y reduce su pastoreo en respuesta. La tragedia de los comunes comparte con el dilema del prisionero el rasgo de que el equilibrio de Nash es menos eficiente para todos los jugadores que cualquier otro resultado. En el dilema del prisionero ambos sospechosos delatan en equilibrio cuando para ambos sería más eficiente callar. En la tragedia de los comunes los pastores apacientan más ovejas en equilibrio de las eficientes. Este discernimiento podría explicar por qué las áreas de pesca océanicas y otros recursos comunes pueden acabar siendo objeto de abusos aun al punto de su agotamiento en ausencia de regulaciones. En el capítulo 19 se darán más detalles sobre estos problemas, que implican lo que llamaremos externalidades negativas. JUEGOS SECUENCIALES En algunos juegos el orden de los movimientos importa. Por ejemplo, en una carrera ciclista con un inicio escalonado, podría ser útil llegar en último lugar y conocer así el tiempo por batir. Por otro lado, la competencia por establecer un nuevo formato de video de alta definición puede ser ganada por la primera empresa en comercializar su tecnología, capturando así una base de clientes cautivos. Los juegos secuenciales difieren de los simultáneos, que hemos considerado hasta aquí, en que un jugador que se mueve después en el juego puede observar cómo han jugado otros hasta ese momento. Este jugador puede usar esa información para elaborar estrategias más sofisticadas que la simple elección de una acción; la estrategia de este jugador podría ser un plan contingente en el que la acción por ejecutar dependa de lo que hayan hecho los demás jugadores. Para ilustrar los nuevos conceptos, planteados por los juegos secuenciales —y, en particular, para hacer un marcado contraste entre juegos simultáneos y secuenciales—, tomaremos un juego simultáneo ya analizado, la batalla de los sexos, y lo convertiremos en un juego secuencial. Batalla de los sexos secuencial Consideremos el juego de la batalla de los sexos que ya hemos analizado, con las mismas acciones y beneficios, pero cambiando ahora el tiempo de los movimientos. En vez de que esposa y esposo tomen una decisión simultánea la esposa se mueve primero, eligiendo ballet o box; el esposo observa esta situación (digamos que la esposa lo llama desde el lugar elegido) y entonces toma su decisión. Las posibles estrategias de la esposa no han cambiado: ella puede elegir las acciones simples ballet o box (o quizá una estrategia mixta que implique ambas acciones, aunque esta no será una consideración relevante en el juego secuencial). La serie de posibles estrategias del esposo se ha ampliado. Por cada una de las dos acciones de la esposa él puede elegir una de las dos acciones; por tanto tiene cuatro estrategias posibles, las que se enlistan en la tabla 8.1. TABLA 8.1 ESTRATEGIAS CONTINGENTES DEL ESPOSO Estrategia contingente Escrita en formato condicional Ir siempre al ballet (ballet | ballet, ballet | box) Seguir a su esposa (ballet | ballet, box | box) Hacer lo contrario (box | ballet, ballet | box) Ir siempre al box (box | ballet, box | box) Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 269 La barra vertical en las estrategias del esposo significa “a condición de que”, así que, por ejemplo, “box | ballet” debe leerse como “el esposo elige box a condición de que la esposa elija ballet”. Dado que el esposo tiene cuatro estrategias puras más que sólo dos, la forma normal (dada en la figura 8.9) debe ampliarse ahora a ocho cuadrantes. En términos generales, la forma normal es dos veces más complicada que la de la versión simultánea del juego en la figura 8.2. Esto motiva una nueva manera de representar juegos, llamada forma extensiva, especialmente conveniente para los juegos secuenciales. Forma extensiva La forma extensiva de un juego muestra el orden de los movimientos como las ramas de un árbol más que colapsar todo en una matriz. La forma extensiva de la batalla de los sexos secuencial aparece en la figura 8.10a. La acción procede de izquierda a derecha. Cada nodo (indicado como un punto en el árbol) representa un punto de decisión para el jugador que se señala ahí. El primer movimiento corresponde a la esposa. Luego de cada acción que ella podría emprender, el esposo se mueve. Los beneficios se enlistan al final del árbol en el mismo orden (del jugador 1, del jugador 2) que en la forma normal. Contrastemos la figura 8.10a con la figura 8.10b, que muestra la forma extensiva de la versión simultánea del juego. Es difícil armonizar una forma extensiva en la que los movimientos ocurren en progresión, con un juego simultáneo, en el que todo sucede al mismo tiempo. El truco es elegir a uno de los dos jugadores para que ocupe el papel de segundo en moverse, pero destacando luego que en realidad no lo es, uniendo sus puntos de decisión en el mismo conjunto de información, el óvalo punteado alrededor de los nodos. El óvalo punteado de la figura 8.10b indica que el esposo no conoce el movimiento de su esposa cuando elige su acción. No importa qué jugador se elige como primero o segundo en moverse en un juego simultáneo; nosotros elegimos al esposo en esta figura para asemejar lo más posible la forma extensiva de la figura 8.10b con la de la figura 8.10a. La semejanza entre estas dos formas extensivas ilustra el hecho de que esa forma no ve aumentada su complejidad para juegos secuenciales como lo hace la forma normal. A continuación trazaremos las formas normal y extensiva en nuestro análisis de la batalla de los sexos secuencial. FIGURA 8.9 Forma normal de la batalla de los sexos secuencial. Esposo (Ballet | Ballet Box| Box) (Box| Ballet Ballet | Box) (Box| Ballet Box| Box) Ballet 2, 1 2, 1 0, 0 0, 0 Box 0, 0 1, 2 0, 0 1, 2 Esposa (Ballet | Ballet Ballet | Box) Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 270 Parte 3: Incertidumbre y estrategia FIGURA 8.10 Forma extensiva de la batalla de los sexos. En la versión secuencial a) el esposo es el segundo en moverse después de observar el movimiento de su esposa. En la versión simultánea b) él no conoce la decisión de ella cuando se mueve, así que sus nodos de decisión deben unirse en un conjunto de información. 2, 1 2, 1 Ballet Ballet 2 2 Box Ballet 0, 0 Ballet Box Box Ballet 0, 0 1 1 0, 0 Box Ballet 0, 0 2 2 Box Box 1, 2 1, 2 b) Versión simultánea a) Versión secuencial Equilibrios de Nash Para despejar los equilibrios de Nash volvamos a la forma normal en la figura 8.9. Aplicar el método de subrayar los beneficios de las mejores respuestas —teniendo cuidado de subrayar ambos beneficios en casos de empate en la mejor respuesta— revela tres equilibrios de Nash en estrategias puras: 1. la esposa juega ballet, el esposo juega (ballet | ballet, ballet | box); 2. la esposa juega ballet, el esposo juega (ballet | ballet, box | box); 3. la esposa juega box, el esposo juega (box | ballet, box | box). Como en el caso de la versión simultánea de la batalla de los sexos, aquí se tienen de nuevo múltiples equilibrios. Pero ahora la teoría de juegos ofrece una buena manera de seleccionar entre los equilibrios. Considérese el tercer equilibrio de Nash. La estrategia del esposo (box | ballet, box | box) involucra la amenaza implícita de que él elegirá box aun si su esposa elige ballet. Esta amenaza es suficiente para disuadirla de elegir ballet. Dado que ella escoge box en equilibrio, la estrategia del esposo le beneficiaría en 2, lo más que puede hacer en cualquier resultado. Por tanto el resultado es un equilibrio de Nash. Pero la amenaza del esposo no es creíble; es decir, es una amenaza vacía. Si la esposa realmente eligiera primero ballet, él renunciaría a un beneficio de 1 eligiendo el box en vez del ballet. Es obvio por qué querría amenazar con elegir box, pero no es tan obvio por qué esa amenaza debería ser creíble. De igual manera, la estrategia del esposo (ballet | ballet, ballet | box) en el primer equilibrio de Nash también implica una amenaza vacía: que él elegirá ballet si su esposa elige box. (Esta es una amenaza extraña porque él no gana nada haciéndola, es una amenaza vacía de todas formas.) Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 271 Otra manera de entender las amenazas vacías versus creíbles es usar el concepto de trayectoria de equilibrio, la senda enlazada en la forma extensiva implicada por las estrategias de equilibrio. En la figura 8.11, la cual reproduce la forma extensiva de la batalla de los sexos secuencial de la figura 8.10, se usa una línea punteada para identificar la trayectoria de equilibrio del tercero de los equilibrios de Nash enlistados. El tercer resultado es un equilibrio de Nash porque las estrategias son racionales a lo largo de la trayectoria de equilibrio. Sin embargo, al seguir la elección de ballet de la esposa —hecho que está fuera de la trayectoria de equilibrio— la estrategia del esposo es irracional. El concepto de equilibrio perfecto de subjuegos en la sección siguiente eliminará el juego irracional, tanto dentro como fuera de la trayectoria de equilibrio. Equilibrio perfecto de subjuegos La teoría de juegos ofrece un modo formal de seleccionar los equilibrios de Nash razonables en los juegos secuenciales, usando el concepto de equilibrio perfecto de subjuegos. El equilibrio perfecto de subjuegos es un refinamiento que elimina amenazas vacías y requiere que las estrategias sean racionales aun para contingencias que no surgen en equilibrio. Antes de definir formalmente el equilibrio perfecto de subjuegos necesitamos algunas definiciones preliminares. Un subjuego es una parte de la forma extensiva que comienza en un nodo de decisión e incluye todo lo que se ramifica a la derecha de éste. Un subjuego apropiado es un subjuego que comienza en un nodo de decisión no unido a otro en un conjunto de información. Conceptualmente esto significa que el primer jugador en moverse en un subjuego apropiado conoce las acciones ejecutadas por otros hasta ese punto. Ver qué es un subjuego apropiado es más fácil que definirlo con palabras. La figura 8.12 muestra las formas extensivas de las versiones simultánea y secuencial de la batalla de los sexos con cuadros trazados alrededor de los subjuegos FIGURA 8.11 Trayectoria de equilibrio. En el tercero de los equilibrios de Nash enlistados para la batalla de los sexos secuencial, la esposa juega box y el esposo (box | ballet, box | box), trazándose las ramas indicadas con líneas gruesas (tanto continuas como punteadas). La línea punteada es la trayectoria de equilibrio; del resto del árbol se dice que está “fuera de la trayectoria de equilibrio”. 2, 1 Ballet 2 Ballet Box Box Ballet 0, 0 1 0, 0 2 Box Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 1, 2 8/23 272 Parte 3: Incertidumbre y estrategia apropiados en cada una. La versión secuencial a) tiene tres subjuegos apropiados: el juego mismo y dos subjuegos inferiores que comienzan en nodos de decisión en los que le corresponde al esposo moverse. La versión simultánea b) sólo tiene un nodo de decisión —el nodo de más arriba— no unido con ningún otro en un conjunto de información. De ahí que esta versión sólo tenga un subjuego: el juego entero mismo. DEFINICIÓN Equilibrio perfecto de subjuegos. Un equilibrio perfecto de subjuegos es un perfil de estrategias (s*1, s*2,…, s*n) que es un equilibrio de Nash en todos los subjuegos apropiados. Un equilibrio perfecto de subjuegos es siempre un equilibrio de Nash. Esto es así porque el juego entero es un subjuego apropiado en sí mismo; por tanto, un equilibrio perfecto de subjuegos debe ser un equilibrio de Nash para todo el juego. En la versión simultánea de la batalla de los sexos no hay más que decir porque no hay más subjuego que el juego entero mismo. En la versión secuencial el equilibrio perfecto de subjuegos tiene más que ofrecer. Las estrategias deben formar no sólo un equilibrio de Nash en todo el juego; también deben formar equilibrios de Nash en los dos subjuegos apropiados que parten de los puntos de decisión en los que el esposo se mueve. Estos subjuegos son problemas de decisión simples, así que es fácil calcu- FIGURA 8.12 Subjuegos apropiados en la batalla de los sexos. La versión secuencial en a) tiene tres subjuegos apropiados, llamados A, B y C. La versión simultánea en b) sólo tiene un subjuego apropiado: el juego entero mismo, llamado D. A 2, 1 B D 2, 1 Ballet Ballet 2 2 Ballet Ballet Box Box 0, 0 0, 0 1 1 C Box Ballet 0, 0 Box Ballet 0, 0 2 2 Box Box 1, 2 a) Secuencial Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. b) Simultánea 23.08.2019 1, 2 8/23 Capítulo 8: Teoría de juegos 273 lar los equilibrios de Nash correspondientes. Para el subjuego B, que comienza en el nodo de decisión del esposo que sigue a la elección de ballet de su esposa, él tiene una decisión simple entre ballet (que le rinde un beneficio de 1) y box (que le rinde un beneficio de 0). El equilibrio de Nash en este subjuego simple de decisión es que el esposo elija ballet. Para el otro subjuego, C, él tiene una decisión simple entre ballet, que le rinde 0, y box, que le rinde 2. El equilibrio de Nash en este subjuego simple de decisión es que él elija box. Por tanto, el esposo sólo tiene una estrategia que puede ser parte de un equilibrio perfecto de subjuegos: (ballet | ballet, box | box). Cualquier otra estrategia le haría jugar algo que no es un equilibrio de Nash para un subjuego apropiado. Para volver a los tres equilibrios de Nash enumerados, sólo el segundo es un subjuego perfecto; el primero y el tercero, no. Por ejemplo, el tercer equilibrio, en el que el esposo siempre va al box, se descarta como un equilibrio perfecto de subjuegos porque la estrategia del esposo (box | box) no es un equilibrio de Nash en el subjuego apropiado B. Por tanto, el equilibrio perfecto de subjuegos elimina la amenaza vacía (de ir siempre al box) que ya nos había incomodado. En general, el equilibrio perfecto de subjuegos descarta cualquier tipo de amenaza vacía en un juego secuencial. En efecto, el equilibrio de Nash requiere que el comportamiento sea racional sólo en la trayectoria de equilibrio. Los jugadores pueden elegir acciones potencialmente irracionales en otras partes de la forma extensiva. En particular, un jugador puede amenazar con dañar a ambos para disuadir al otro de elegir ciertas acciones. El equilibrio perfecto de subjuegos requiere comportamiento racional tanto dentro como fuera de la trayectoria de equilibrio. Las amenazas de jugar irracionalmente —es decir, amenazas de elegir algo diferente de una mejor respuesta propia— se descartan por vacías. Inducción hacia atrás Nuestro método para despejar el equilibrio en la batalla de los sexos secuencial fue hallar todos los equilibrios de Nash, usando la forma normal, y buscar después entre ellos el equilibrio perfecto de subjuegos. Un atajo para encontrar directamente el equilibrio perfecto de subjuegos es usar la inducción hacia atrás, el proceso de despejar el equilibrio trabajando hacia atrás, del final al principio del juego. La inducción hacia atrás opera como sigue. Identifica todos los subjuegos en la parte inferior de la forma extensiva. Encuentra los equilibrios de Nash en esos subjuegos. Reemplaza los (potencialmente complicados) subjuegos por las acciones y beneficios que resultan de jugar el equilibrio de Nash en esos subjuegos. Sube después al siguiente nivel de subjuegos y repite el procedimiento. La figura 8.13 ilustra el uso de la inducción hacia atrás en la batalla de los sexos secuencial. Primero se calculan los equilibrios de Nash de los subjuegos de más abajo en los nodos de decisión del esposo. En el subjuego que sigue a la elección de ballet de su esposa, él escogería el ballet, lo que da beneficios de 2 a ella y de 1 a él. En el subjuego que sigue a la elección de box de su esposa, él elegiría box, lo que da beneficios de 1 a ella y de 2 a él. Luego, sustituye las estrategias de equilibrio del esposo por los subjuegos mismos. El juego resultante es un problema de decisión simple para la esposa (representado en el panel inferior de la figura): una decisión entre ballet, que le daría a ella un beneficio de 2, y box, que le daría un beneficio de 1. El equilibrio de Nash de este juego es que ella elija la acción con el beneficio más alto, ballet. En suma, la inducción hacia atrás nos permite saltar directamente el equilibrio perfecto de subjuegos en el que la esposa elige ballet y el esposo elige (ballet | ballet, box | box), eludiendo los demás equilibrios de Nash. La inducción hacia atrás es particularmente útil en juegos que contienen muchas rondas de juego secuencial. Al añadirse rondas pronto se vuelve demasiado difícil despejar todos los equilibrios de Nash y determinar después cuáles son equilibrios perfectos del subjuego. Con la inducción hacia atrás, una ronda adicional se resuelve añadiendo simplemente otra iteración del procedimiento. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 274 Parte 3: Incertidumbre y estrategia FIGURA 8.13 Aplicación de la inducción hacia atrás. Los últimos subjuegos (donde se mueve el jugador 2) son reemplazados por los equilibrios de Nash en esos subjuegos. En el juego simple que resulta a la derecha es posible despejar la acción de equilibrio del jugador 1. 2, 1 Ballet Juega 2 ballet | ballet beneficio 2, 1 2 Box Ballet Ballet 0, 0 1 1 Ballet Box 0, 0 Box 2 Juega 2 box | box beneficio 1, 2 Box 1, 2 JUEGOS REPETIDOS En los juegos examinados hasta aquí cada jugador toma una decisión y el juego termina. En muchas situaciones reales, sin embargo, los jugadores juegan el mismo juego una y otra vez. Por ejemplo, los jugadores del dilema del prisionero pueden prever cometer crímenes futuros y, por tanto, jugar juntos futuros dilemas del prisionero. Las gasolineras ubicadas una frente a la otra, al fijar sus precios cada mañana, en realidad juegan diariamente un nuevo juego de precios. El juego constitutivo simple (como el dilema del prisionero o el juego de fijación de precio a la gasolina) que se juega repetidamente se llama juego en etapas. Como se vio en el dilema del prisionero, el equilibrio en una jugada del juego en etapas puede ser peor para todos los jugadores que otro resultado más cooperativo. La repetida ejecución del juego en etapas abre la posibilidad de cooperación en equilibrio. Los jugadores pueden adoptar estrategias de gatillo para seguir cooperando mientras lo hayan hecho hasta ese punto, pero también para volver a jugar el equilibrio de Nash si alguien se desvía de la cooperación. Investigaremos las condiciones en las cuales las estrategias de gatillo funcionan para incrementar los beneficios de los jugadores. Como es normal en la teoría de los juegos, nos centraremos en los equilibrios perfectos del subjuego de los juegos repetidos. Juegos de repetición finita En el caso de muchos juegos en etapas, repetirlos un número finito y conocido de veces no incrementa la posibilidad de cooperación. Para ver concretamente esta cuestión supongamos que el dilema del prisionero se jugara repetidamente durante t periodos. Usemos la inducción hacia atrás para despejar el equilibrio perfecto de subjuegos. El subjuego de más abajo es el juego en etapas del Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 275 dilema del prisionero jugado en el periodo t. Independientemente de lo que haya ocurrido antes el equilibrio de Nash en este subjuego es que ambos delaten. Retrocediendo en el juego al periodo t – 1 se descartan las estrategias de gatillo que condicionan la jugada del periodo t a lo que ocurra en el periodo t – 1. Aunque un jugador podría querer prometer que jugará cooperativamente en el periodo t para premiar así al otro por jugar cooperativamente en el periodo t – 1, acabamos de ver que nada de lo ocurrido en el periodo t – 1 afecta lo que ocurre subsecuentemente, porque ambos jugadores delatan en el periodo t pase lo que pase. Es como si el periodo t – 1 fuera el último, y el equilibrio de Nash de este subjuego fuera otra vez que ambos delaten. Trabajando hacia atrás de esta manera vemos que los jugadores delatarán en cada periodo; es decir, los jugadores simplemente repetirán t veces el equilibrio de Nash del juego en etapas. Reinhard Selten, ganador del Premio Nobel de Economía por sus contribuciones a la teoría de juegos, demostró que esta lógica es general: para cualquier juego en etapas con un equilibrio de Nash único, el equilibrio perfecto de subjuegos único del juego de repetición finita supone jugar el equilibrio de Nash en cada periodo.7 Si el juego en etapas tiene múltiples equilibrios de Nash, tal vez sea posible alcanzar cierta cooperación en un juego de repetición finita. Los jugadores pueden usar estrategias de gatillo, manteniendo la cooperación en periodos tempranos en un resultado que no es un equilibrio del juego en etapas con la amenaza de jugar en periodos posteriores el equilibrio de Nash que produce un resultado peor para el jugador que se desvía de la cooperación.8 Pero en lugar de entrar en detalles de los juegos de repetición finita pasemos a los juegos de repetición infinita, que amplían enormemente la posibilidad de cooperación. Juegos de repetición infinita En el caso de los juegos de repetición finita el teorema tradicional se aplica sólo si el juego en etapas tiene múltiples equilibrios. Si, como en el dilema del prisionero, el juego en etapas sólo tiene un equilibrio de Nash el resultado de Selten indica que el juego de repetición finita sólo tiene un equilibrio perfecto de subjuegos: repetir el equilibrio de Nash del juego en etapas en cada periodo. La inducción hacia atrás a patir del último periodo t descarta cualquier otro resultado. Sin embargo, en el caso de los juegos de repetición infinita no hay definido un periodo final t en el cual iniciar la inducción hacia atrás. Los resultados que implican cooperación no necesariamente terminan desvaneciéndose. En algunas condiciones puede ocurrir lo contrario al grado de que, en esencia, cualquier cosa es posible en el equilibrio del juego de repetición infinita. Este resultado también se conoce como teorema tradicional porque formaba parte del “saber tradicional” de la teoría de juegos antes de que alguien se tomara la molestia de demostrarlo formalmente. Una dificultad de los juegos de repetición infinita implica sumar beneficios entre periodos. Un flujo infinito de beneficios bajos se suma hasta el infinito igual que un flujo infinito de beneficios altos. ¿Cómo clasificar ambos flujos? Sortearemos este problema con la ayuda del descuento. Sea el factor de descuento (del que se tratará en el apéndice del capítulo 17) que mide cuánto valdría una unidad de beneficios si se le recibiera en un periodo futuro en lugar de hoy. En el capítulo 17 se demostrará que se relaciona inversamente con la tasa de interés.9 Si la tasa de interés es alta, un individuo recibirá hoy un pago mucho mayor que en el periodo siguiente porque invertir el pago de hoy proporcionaría un rendimiento principal más un gran pago de intereses en el periodo siguiente. Además de la tasa de interés, también puede incorporar incertidumbre acerca de si el juego continuará en periodos futuros. Cuanto mayor sea la probabilidad de que el juego termine 7 R. Selten, “A Simple Model of Imperfect Competition, Where 4 Are Few and 6 Are Many”, International Journal of Game Theory, núm. 2 (1973), pp. 141-201. 8 J. P. Benoit y V. Krishna, “Finitely Repeated Games”, Econometrica, núm. 53 (1985), pp. 890-940. 9 Hay que tener cuidado con la sutil diferencia entre las fórmulas del valor presente del flujo de una anualidad usadas aquí y las del apéndice del capítulo 17. Los pagos llegan al final del periodo y no al principio como se supone aquí. Por tanto, aquí el valor presente de un pago de $1 por periodo a partir de este momento es $1 þ $1 d þ $1 d2 þ $1 d3 þ ::: ¼ Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 $1 : 1d 8/23 276 Parte 3: Incertidumbre y estrategia después del periodo corriente, menor será el rendimiento esperado de juegos en etapas que podrían no jugarse en realidad. Factorizar una probabilidad de que el juego repetido termine después de cada periodo vuelve más creíble el marco de un juego de repetición infinita. El aspecto crucial de un juego de repetición infinita no es que dure para siempre, sino que su final sea indeterminado. Interpretado de esta manera, hay un sentido en el que los juegos de repetición infinita son más realistas que los juegos de repetición finita con t grande. Supongamos que es de esperar que dos gasolineras vecinas jueguen un juego de precios cada día hasta que los automóviles eléctricos reemplacen a los que funcionan con gasolina. Es improbable que las gasolineras sepan que los autos eléctricos llegarán en exactamente t 2 000 días. En términos más realistas, las gasolineras estarán inseguras acerca del fin de los autos que funcionan con gasolina; por tanto, el fin de su juego de precios es indeterminado. Los jugadores pueden tratar de mantener la cooperación usando estrategias de gatillo. Las estrategias de gatillo harán que sigan cooperando mientras nadie se desvíe; la desviación provocará algún tipo de castigo. La cuestión clave para determinar si las estrategias de gatillo “funcionan” es si el castigo puede ser tan severo para disuadir la desviación en primer término. Supongamos que ambos jugadores usan la siguiente estrategia de gatillo específica en el dilema del prisionero: sigue callando si nadie se desvía; delata siempre después si alguien se ha desviado para delatar en el pasado. Para demostrar que esta estrategia de gatillo forma un equilibrio perfecto de subjuegos debemos comprobar que ningún jugador podría beneficiarse de una desviación. A lo largo de la trayectoria de equilibrio ambos jugadores callan en cada periodo; esto proporciona a cada uno un beneficio de 2 en cada periodo, para un valor presente descontado de V eq ¼ 2 þ 2d þ 2d2 þ 2d3 þ ¼ 2ð1 þ d þ d2 þ d3 þ Þ 2 : ¼ 1d (8.19) Un jugador que se desvía delatando obtiene 3 en ese periodo, pero después ambos jugadores delatan en cada periodo subsecuente, obteniendo cada cual 1 por periodo para un beneficio presente descontado total de V dev ¼ 3 þ ð1ÞðdÞ þ ð1Þðd2 Þ þ ð1Þðd3 Þ þ ¼ 3 þ dð1 þ d þ d2 þ Þ d : ¼3þ 1d Las estrategias de gatillo forman un equilibrio perfecto de subjuegos si Veq implica que 2 1d 3þ d : 1d (8.20) Vdev, lo que (8.21) Después de multiplicar por 1 y reordenar, se obtiene 1/2. En otras palabras, los jugadores hallarán deseable el juego cooperativo continuo siempre y cuando no descuenten muy altamente beneficios futuros de esa cooperación. Si 1/2, ninguna cooperación es posible en el dilema del prisionero de repetición infinita; el único equilibrio perfecto de subjuegos implica delatar en cada periodo. La estrategia de gatillo, que ya hemos considerado, hace que los jugadores regresen al equilibrio de Nash del juego en etapas de delatar para siempre en cada periodo. Esta estrategia, que implica el castigo más riguroso posible a la desviación, se llama estrategia siniestra. Castigos menos rigurosos incluyen la así llamada estrategia ojo por ojo que supone una sola ronda de castigo por hacer trampa. Como la estrategia siniestra implica el castigo más riguroso posible induce cooperación para la más grande gama de casos (el menor valor de ) de cualquier estrategia. Los Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 277 castigos severos funcionan bien porque si los jugadores logran cooperar nunca experimentan las pérdidas del castigo en equilibrio.10 El factor de descuento es crucial para determinar si las estrategias de gatillo pueden mantener la cooperación en el dilema del prisionero o, en realidad, en cualquier juego en etapas. Conforme se aproxima a 1 los castigos de la estrategia siniestra se vuelven infinitamente rigurosos porque implican un flujo interminable de pérdidas no descontadas. Los castigos infinitos pueden usarse para sostener una amplia variedad de resultados posibles. Esta es la lógica detrás del teorema tradicional de los juegos de repetición infinita. Tómese cualquier beneficio de un juego en etapas para un jugador entre uno en el equilibrio de Nash y el más alto en cualquier parte de la matriz de beneficios. Sea V el valor presente descontado del flujo infinito de este beneficio. El teorema tradicional establece que el jugador puede obtener V en algún equilibrio perfecto de subjuegos para suficientemente cerca de 1.11 INFORMACIÓN INCOMPLETA En los juegos estudiados hasta aquí los jugadores sabían todo lo que había que saber sobre la organización del juego, incluidas las series de estrategias y beneficios de los demás. Las cosas se complican, y quizá se ponen más interesantes, si algunos jugadores tienen información sobre el juego que otros no. El póquer sería diferente si todas las manos se jugaran exhibiendo las cartas. Pero jugarlo es divertido precisamente porque sabes lo que tienes en la mano, no lo que los demás tienen en las suyas. La información incompleta aparece en muchos otros contextos reales aparte de los juegos de mesa. Un equipo deportivo podría tratar de ocultarles la lesión de una de sus estrellas a sus futuros adversarios para impedirles explotar esa debilidad. Las tecnologías de producción de las empresas pueden ser secretos comerciales, así que las compañías podrían no saber si enfrentan competidores eficientes o débiles. En esta sección (y en las dos siguientes) se presentarán las herramientas necesarias para analizar juegos de información incompleta. El análisis integra el material de la teoría de juegos que hemos desarrollado hasta aquí, en este capítulo, con el material sobre incertidumbre e información del capítulo anterior. Los juegos de información incompleta pueden complicarse rápidamente. Los jugadores que carecen de información completa sobre el juego intentarán usar lo que saben para hacer inferencias sobre lo que no. El proceso de inferencia puede ser complejo. En el póquer, por ejemplo, saber lo que tienes en la mano puede decirte algo sobre lo que está en las de los demás. Un jugador con dos ases sabe que es menos probable que los demás tengan ases, porque dos de los cuatro no están disponibles. Información sobre las manos de los demás también puede proceder de la magnitud de sus apuestas o de sus expresiones faciales (aunque, desde luego, una apuesta grande puede ser un engaño, y una expresión facial puede ser falsa). La teoría de la probabilidad brinda una fórmula, llamada regla de Bayes, para hacer inferencias sobre información oculta. Nos encontraremos con la regla de Bayes en una sección posterior. La relevancia de la regla de Bayes en los juegos de información incompleta ha llevado a llamarlos juegos bayesianos. Para limitar la complejidad del análisis nos concentraremos en el marco más simple posible. Nos ocuparemos de un juego de dos jugadores en el que uno de ellos (jugador 1) tiene información privada y el otro (jugador 2) no. El análisis de los juegos de información incompleta se dividirá en dos secciones. La sección siguiente comienza con el caso simple en el que los jugadores se mueven en 10 El economista ganador del Premio Nobel, Gary Becker, introdujo un punto similar, el principio de la pena máxima al crimen. Este principio sostiene que aun los delitos menores deben recibir castigos draconianos, capaces de disuadir el crimen con un gasto mínimo en vigilancia. Los castigos no cuestan nada a la sociedad porque ningún crimen se comete en equilibrio, así que los castigos nunca tienen que ejecutarse. Véase G. Becker, “Crime and Punishment: An Economic Approach”, Journal of Political Economy, núm. 76 (1968), pp. 169-217. Castigos menos severos pueden ser apropiados en situaciones que implican incertidumbre. Por ejemplo, los ciudadanos podrían no estar seguros del código penal; la policía podría no estar segura de haber arrestado al culpable. 11 Una versión más efectiva del teorema tradicional fue probada por D. Fudenberg y E. Maskin (“The Folk Theorem in Repeated Games with Discounting or with Incomplete Information”, Econometrica, núm. 54 (1986), pp. 533-556). Beneficios por debajo incluso de los del equilibrio de Nash pueden ser generados por un equilibrio perfecto del subjuego, beneficios hasta el nivel minimax de los jugadores (el nivel más bajo al cual un jugador puede ser reducido por los demás jugadores que operan contra él). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 278 Parte 3: Incertidumbre y estrategia forma simultánea. La sección subsiguiente analiza juegos en los que el jugador informado 1 se mueve primero. Esos juegos, llamados juegos de señalamiento, son más complicados que los simultáneos porque la acción del jugador 1 puede señalar algo sobre su información privada al jugador no informado 2. Introduciremos la regla de Bayes en ese momento para analizar la inferencia del jugador 2 sobre la información oculta del jugador 1 con base en las observaciones de la acción del jugador 1. JUEGOS BAYESIANOS SIMULTÁNEOS En esta sección se estudiará un juego de dos jugadores de movimientos simultáneos en el que el jugador 1 tiene información privada, pero el jugador 2 no. (Se usará “él” para el jugador 1 y “ella” para el jugador 2 para facilitar la exposición.) Se comenzará estudiando cómo modelizar la información privada. Tipos de jugadores y creencias John Harsanyi, quien recibió el Premio Nobel de Economía por su trabajo sobre juegos con información incompleta, ofreció una manera simple de modelizar información privada, introduciendo características o tipos de jugadores.12 El jugador 1 puede ser de uno de los diversos tipos posibles, denotado por t. El jugador 1 conoce su tipo. La jugadora 2 ignora t y debe decidir su estrategia con base en creencias sobre t. Formalmente el juego comienza en un nodo inicial, llamado nodo casual, en el que un valor tk particular es extraído al azar para el tipo t del jugador 1 de un conjunto de tipos posibles T {t1,…, tk,…, tk}. Sea Pr(tk) la probabilidad de extraer el tipo particular tk. El jugador 1 ve qué tipo se extrae. La jugadora 2 no ve la extracción y sólo conoce las probabilidades, usándolas para formar sus creencias sobre el tipo del jugador 1. Por tanto la probabilidad de que la jugadora 2 encuentre que el jugador 1 es de tipo tk es Pr(tk). Puesto que el jugador 1 observa su tipo, antes de moverse, su estrategia puede condicionarse a t. Condicionar a esta información puede ser un gran beneficio para un jugador. En el póquer, por ejemplo, cuanto más fuerte sea la mano de un jugador, es más probable que éste gane el pozo y que quiera apostar agresivamente. Sea s1(t) la estrategia del jugador 1 contingente de su tipo. Como la jugadora 2 no observa t, su estrategia es simplemente la incondicional s2. Como en el caso de los juegos de información completa, los beneficios de los jugadores dependen de las estrategias. En los juegos bayesianos los beneficios también pueden depender de los tipos. Por tanto, escribimos el beneficio del jugador 1 como u1(s1(t), s2, t) y el de la jugadora 2 como u2(s2, s1(t), t). Nótese que t aparece en dos lugares en la función de beneficio de la jugadora 2. El tipo del jugador 1 también tiene un efecto indirecto mediante su efecto en la estrategia del jugador 1 s1(t), que a su vez afecta los beneficios de la jugadora 2. Dado que los beneficios de la jugadora 2 dependen de t en estas dos maneras, sus creencias sobre t serán cruciales en el cálculo de su estrategia óptima. La figura 8.14 da un ejemplo simple de un juego bayesiano simultáneo. Cada jugador elige una de dos acciones. Todos los beneficios son conocidos salvo el beneficio del jugador 1 cuando 1 elige U y 2 elige L. El beneficio del jugador 1 en el resultado (U, L) es identificado como su tipo, t. Hay dos valores posibles para el tipo del jugador 1, t 6 y t 0, cada uno de los cuales ocurre con igual probabilidad. El jugador 1 conoce su tipo antes de moverse. Las creencias de la jugadora 2 son que cada tipo tiene una probabilidad de 1/2. La forma extensiva se presenta en la figura 8.15. Equilibrio de Bayes-Nash Extender el equilibrio de Nash a los juegos bayesianos requiere dos pequeñas cuestiones de interpretación. Primero, recuérdese que el jugador 1 puede ejecutar una acción diferente para cada uno de sus tipos. El equilibrio requiere que la estrategia del jugador 1 sea una mejor respuesta 12 J. Harsanyi, “Games with Incomplete Information Played by Bayesian Players”, Management Science, núm. 14 (1967-1968), pp. 159-182, 320-334, 486-502. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos FIGURA 8.14 279 t 6 con probabilidad de 1/2 y t 0 con probabilidad de 1/2. Juego simple de información incompleta. Jugador 1 Jugadora 2 FIGURA 8.15 Forma extensiva del juego simple de información incompleta. L R U t, 2 0, 0 D 2, 0 2, 4 Esta figura traduce la figura 8.14 en un juego de forma extensiva. El nodo casual inicial está indicado por un círculo en blanco. Los nodos de decisión de la jugadora 2 están en el mismo conjunto de información porque ella no observa el tipo o acción del jugador 1 antes de moverse. 2 U 1 t=6 Pr = 1/2 D 2 2 t=0 Pr = 1/2 U 1 D Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 2 23.08.2019 L 6, 2 R 0, 0 L 2, 0 R 2, 4 L 0, 2 R 0, 0 L 2, 0 R 2, 4 8/23 280 Parte 3: Incertidumbre y estrategia para todos y cada uno de sus tipos. Segundo, recuérdese que la jugadora 2 no sabe cuál es el tipo del jugador 1. El equilibrio requiere que la estrategia de la jugadora 2 optimice un beneficio esperado, donde la expectativa se toma respecto a sus creencias sobre el tipo del jugador 1. Encontramos beneficios esperados en nuestro análisis de estrategias mixtas. Los cálculos implicados en la estimación de la mejor respuesta a las estrategias puras de tipos diferentes de rivales en un juego de información incompleta son similares a los implicados en la estimación de la mejor respuesta a la estrategia mixta de un rival en un juego de información completa. Interpretado de esta manera, el equilibrio de Nash en el marco de un juego bayesiano se llama equilibrio de Bayes-Nash. A continuación se dará una definición formal del concepto para su consulta. Dado que la notación es muy densa, quizá sea más fácil pasar primero a los ejemplos 8.6 y 8.7, que ofrecen un esbozo de cómo despejar equilibrios en juegos bayesianos con los que podrías toparte. DEFINICIÓN Equilibrio de Bayes-Nash. En un juego de dos jugadores de movimientos simultáneos en el que el jugador 1 tiene información privada, un equilibrio de Bayes-Nash es un perfil de estrategias (s*1(t), s*2) tal que s*1(t) es una mejor respuesta a s*2 para cada tipo t 僆 T del jugador 1, U1(s*1(t), s*2, t) U1(s1, s*2, t) para todas las s1 僆 S1, (8.22) y tal que s*2 es una mejor respuesta a s*1(t) dadas las creencias del jugador 2 Pr(tk) sobre los tipos del jugador 1: X X Prðt k ÞU 2 ðs2 , s1 ðt k Þ, t k Þ Prðt k ÞU 2 ðs02 , s1 ðt k Þ, t k Þ para todas las s02 2 S2 : (8.23) t k 2T t k 2T Puesto que la diferencia entre el equilibrio de Nash y el equilibrio de Bayes-Nash es sólo cuestión de interpretación, todos nuestros resultados previos para el equilibrio de Nash (incluida la prueba de la existencia) se aplican también al equilibrio de Bayes-Nash. EJEMPLO 8.6 Equilibrio de Bayes-Nash del juego de la figura 8.15 Para despejar el equilibrio de Bayes-Nash del juego de la figura 8.15, primero se despejan las mejores respuestas del jugador informado (el jugador 1) para cada uno de sus tipos. Si el jugador 1 es de tipo t 0, elegiría D en vez de U porque obtiene 0 jugando U y 2 jugando D independientemente de lo que haga la jugadora 2. Si el jugador 1 es de tipo t 6, su mejor respuesta es U a la elección de L por la jugadora 2 y D a su elección de R. Esto deja sólo dos posibles candidatos para un equilibrio en estrategias puras: 1 juega ðUjt ¼ 6, Djt ¼ 0Þ y 2 juega L; 1 juega ðDjt ¼ 6, Djt ¼ 0Þ y 2 juega R: El primer candidato no puede ser un equilibrio porque, dado que el jugador 1 ejecuta (U|t 6, D|t 0), la jugadora 2 obtiene un beneficio esperado de 1 de ejecutar L. La jugadora 2 se beneficiaría de desviarse a R, obteniendo un beneficio esperado de 2. El segundo candidato es un equilibrio de Bayes-Nash. Dado que la jugadora 2 elige R, la mejor respuesta del jugador 1 es elegir D, lo que le brinda un beneficio de 2 en vez de 0 independientemente de su tipo. Puesto que los dos tipos del jugador 1 eligen D, la mejor respuesta de la jugadora 2 es elegir R, lo que le brinda un beneficio de 4 en vez de 0. PREGUNTA: Si la probabilidad de que el jugador 1 sea de tipo t 6 es lo bastante alta, ¿el primer candidato puede ser un equilibrio de Bayes-Nash? De ser así, calcula la probabilidad de umbral. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 281 EJEMPLO 8.7 Tragedia de los comunes como juego bayesiano Para un ejemplo de un juego bayesiano con acciones continuas, considérese la tragedia de los comunes del ejemplo 8.5 pero supongamos ahora que el pastor 1 tiene información privada sobre su valor de pastoreo por oveja: v1 ðq1 , q2 , tÞ ¼ t ðq1 þ q2 Þ, (8.24) donde el tipo del pastor 1 es t 130 (el tipo “alto”) con probabilidad de 2/3 y t 100 (el tipo “bajo”) con probabilidad de 1/3. El valor del pastor 2 sigue siendo el mismo de la ecuación 8.11. Para despejar el equilibrio de Bayes-Nash, primero se despejan las mejores respuestas del jugador informado (pastor 1) para cada uno de sus tipos. Para cualquier tipo t y estrategia del rival q2, el problema de optimización de valor del pastor 1 es maxfq1 v1 ðq1 , q2 , tÞg ¼ maxfq1 ðt q1 q2 Þg: q1 q1 (8.25) La condición de primer orden para un óptimo es t 2q1 q2 ¼ 0: (8.26) Reordenando y sustituyendo después los valores t 130 y t 100 se obtiene q1H ¼ 65 q2 2 y q1L ¼ 50 q2 , 2 (8.27) donde q1H es la cantidad para el tipo “alto” del pastor 1 (es decir, el tipo t 100) y q1L para el tipo “bajo” (el tipo t 100). Luego se despeja la mejor respuesta del pastor 2. El beneficio esperado del pastor 2 es 2 1 ½q ð120 q1H q2 Þ þ ½q2 ð120 q1L q2 Þ ¼ q2 ð120 q1 q2 Þ, 3 2 3 donde 2 1 q1 ¼ q1H þ q1L : 3 3 (8.28) (8.29) Reordenar la condición de primer orden de la optimización de la ecuación 8.28 respecto a q2 da q2 ¼ 60 q1 : 2 (8.30) La sustitución de q1H y q1L de la ecuación 8.27 en la ecuación 8.29 y la posterior sustitución de la expresión resultante de q1 en la ecuación 8.30 produce q2 ¼ 30 þ q2 , 4 (8.31) lo que implica que q*2 40. Sustituir q*2 40 en la ecuación 8.27 implica que q*1H 45 y q*1L 30. La figura 8.16 describe gráficamente el equilibrio de Bayes-Nash. El pastor 2 imagina que juega contra un tipo promedio del pastor 1, cuya mejor respuesta promedio está dada por la línea punteada gruesa. La intersección de esta mejor respuesta y la del pastor 2 en el punto B determinan la cantidad de equilibrio del pastor 2, q*2 40. La mejor respuesta del tipo bajo (respuesta alta) del pastor 1 a q*2 40 está dada por el punto A (respuesta punto C). Para efectos comparativos, se muestran los equilibrios de Nash de información completa cuando se sabe que el pastor 1 es del tipo bajo (punto A' ) o del tipo alto (punto C' ). PREGUNTAS: Supongamos que el pastor 1 es del tipo alto. ¿Cómo cambia el número de ovejas que cada pastor apacienta cuando el juego pasa de información incompleta a completa (desplazándose del punto C' a C)? ¿Qué ocurriría si el pastor 1 fuera del tipo bajo? ¿Qué tipo prefiere información completa y, por tanto, desearía señalar su tipo? ¿Qué tipo prefiere información incompleta y por tanto querría ocultar su tipo? En la siguiente sección se estudiará la posibilidad de que el jugador 1 señale su tipo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 282 Parte 3: Incertidumbre y estrategia FIGURA 8.16 Equilibrio de la tragedia de los comunes bayesiano Mejores respuestas para el pastor 2 y ambos tipos del pastor 1 se presentan como líneas gruesas continuas; la mejor respuesta esperada percibida por 2 se presenta como una línea gruesa punteada. El equilibrio de Bayes-Nash del juego de información incompleta está dado por los puntos A y C; los equilibrios de Nash de los correspondientes juegos de información completa están dados por los puntos A' y C' . q2 Mejor respuesta del tipo alto Mejor respuesta del tipo bajo 40 A′ A B C C′ Mejor respuesta de 2 0 q1 30 40 45 JUEGOS DE SEÑALAMIENTO En esta sección pasaremos de los juegos de movimientos simultáneos de información privada a los juegos secuenciales en los que el jugador informado, el jugador 1, emprende una acción que es observable para la jugadora 2 antes de que la jugadora 2 se mueva. La acción del jugador 1 da información, una señal, que la jugadora 2 puede usar para poner al día sus creencias sobre el tipo del jugador 1, alterando quizá la manera en que la jugadora 2 jugaría sin tener esa información. En el póquer, por ejemplo, la jugadora 2 puede interpretar un gran aumento del jugador 1 como señal de que tiene una buena mano, lo que tal vez conduzca a la jugadora 2 a rendirse. Una empresa que considera si entrar o no a un mercado podría interpretar el bajo precio de la empresa titular como una señal de que ésta es un productor de bajo costo y, por tanto, un competidor fuerte, lo que quizá la disuadiría de entrar en ese mercado. Un título de una universidad prestigiosa podría indicar que un solicitante de un puesto está altamente calificado. El análisis de los juegos de señalamiento es más complicado que el de los juegos simultáneos porque debe modelizarse cómo procesa la jugadora 2 la información contenida en la señal del jugador 1 y cómo actualiza después sus creencias sobre el tipo del jugador 1. Para fijar las ideas nos concentraremos en una aplicación concreta: una versión del modelo de señalamiento en el mercado del empleo de Michael Spence, por el cual ganó el Premio Nobel de Economía.13 13 M. Spence, “Job-Market Signaling”, Quarterly Journal of Economics, núm. 87 (1973), pp. 355-374. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 283 Señalamiento en el mercado de trabajo El jugador 1 es un trabajador que puede ser de uno de dos tipos, altamente calificado (t H) o escasamente calificado (t L). La jugadora 2 es una empresa que considera contratar al solicitante. Un trabajador escasamente calificado es completamente improductivo y no genera ingresos para la empresa; un trabajador altamente calificado genera ingresos . Si el solicitante es contratado, la empresa debe pagar al trabajador w (pensemos que este salario ha sido fijado por la regulación gubernamental). Supongamos que w 0. Por tanto, la empresa desea contratar al solicitante si, y sólo si está altamente calificado. Sin embargo, la empresa no puede observar la calificación del solicitante; sólo puede observar los estudios previos del solicitante. Sea cH el costo del tipo alto de obtener estudios y cL el costo del tipo bajo. Supongamos que cH cL, lo cual implica que los estudios requieren menos esfuerzo para el solicitante altamente calificado que para el escasamente calificado. Adoptamos el supuesto extremo de que los estudios no incrementan directamente la productividad del trabajador. El solicitante aún puede decidir obtener estudios, debido al valor de éstos como señal de aptitud para empleadores futuros. La figura 8.17 muestra la forma extensiva. El jugador 1 observa su tipo al principio; la jugadora 2 sólo observa la acción del jugador 1 (señal de estudios) antes de moverse. Sean Pr(H) y Pr(L) las creencias de la jugadora 2 antes de observar la señal de estudios del jugador 1 de que éste está alta o escasamente calificado. Estas se llaman creencias previas del jugador 1. Observar la acción del jugador 1 llevará a la jugadora 2 a revisar sus creencias para formar las que se llaman creencias posteriores. Por ejemplo, la probabilidad de que el trabajador esté altamente calificado está condi- FIGURA 8.17 Señalamiento en el mercado de trabajo. El jugador 1 (trabajador) observa su propio tipo. Entonces decide educarse (E) o no educarse (NE). Después de observar la acción del jugador 1, la jugadora 2 (empresa) decide hacerle una oferta de trabajo (J) o no (NJ). Los nodos en los conjuntos de información de la jugadora 2 se han etiquetado n1,…, n4 para referencia. 2 1 E Pr(H) E Pr(L) w − cH, π − w n1 NJ 2 NE J n2 2 J NJ J −cH, 0 w − cL, −w −cL, 0 w, π − w n3 NJ 1 NE 2 J 0, 0 w, −w n4 NJ Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 0, 0 8/23 284 Parte 3: Incertidumbre y estrategia cionada a que el trabajador haya obtenido estudios, Pr(H|E), y condicionada a que no los haya obtenido Pr(H|NE). Las creencias posteriores de la jugadora 2 se usan para calcular su mejor respuesta a la decisión de estudios del jugador 1. Supongamos que la jugadora 2 ve que el jugador 1 elige E. Entonces, el beneficio esperado de la jugadora 2 resultante de jugar J es Pr(H|E)( w) Pr(L|E)(w) Pr(H|E) w, (8.32) donde el miembro izquierdo de la ecuación se desprende del hecho de que como L y H son los únicos tipos, Pr(L|E) 1 – Pr(H|E). El beneficio de la jugadora 2 resultante de jugar NJ es 0. Para determinar la mejor respuesta a E, la jugadora 2 compara el beneficio esperado en la ecuación 8.32 con 0. La mejor respuesta de la jugadora 2 es J si, y sólo si, Pr(H|E) w/. La pregunta sigue siendo cómo calcular creencias posteriores como Pr(H|E). Los jugadores racionales usan una fórmula estadística, la regla de Bayes, para revisar sus creencias previas a fin de formar creencias posteriores basadas en la observación de una señal. Regla de Bayes La regla de Bayes da la fórmula siguiente para calcular la creencia posterior de la jugadora 2 Pr(H|E):14 PrðHjEÞ ¼ PrðEjHÞ PrðHÞ : PrðEjHÞ PrðHÞ þ PrðEjLÞ PrðLÞ (8.33) De igual forma, Pr(H|E) está dada por PrðHjNEÞ ¼ PrðNEjHÞ PrðHÞ : PrðNEjHÞ PrðHÞ þ PrðNEjLÞ PrðLÞ (8.34) Dos clases de probabilidades aparecen en el miembro izquierdo de las ecuaciones 8.33 y 8.34: • las creencias previas Pr(H) y Pr(L); • las probabilidades condicionales Pr(E|H), Pr(NE|L)y así sucesivamente. Las creencias previas están dadas en la especificación del juego por las probabilidades de las diferentes ramas del nodo aleatorio inicial. Las probabilidades condicionales Pr(E|H), Pr(NE|L), y así sucesivamente están dadas por la estrategia de equilibrio del jugador 1. Por ejemplo, Pr(E|H) es la probabilidad de que el jugador 1 juegue E, si es de tipo H; Pr(NE|L) es la probabilidad de que el jugador 1 juegue NE, si es de tipo L, y así sucesivamente. Como lo resume el diagrama esquemático de la figura 8.18 la regla de Bayes puede concebirse como una “caja negra” que toma como entradas las creencias previas y las estrategias, y da como salida las creencias que debemos saber y que despejan un equilibrio del juego: las creencias posteriores del jugador 2. 14 La ecuación 8.33 puede derivarse de la definición de probabilidad condicional de la nota 25 del capítulo 2. (La ecuación 8.34 puede derivarse en forma similar.) Por definición, PrðHjEÞ ¼ PrðH y EÞ : PrðEÞ Invertir el orden de los dos eventos en la probabilidad condicional produce PrðEjHÞ ¼ o, después de reordenar, PrðH y EÞ PrðHÞ PrðH y EÞ ¼ PrðEjHÞ PrðHÞ: La sustitución de la ecuación precedente en la primera ecuación incluida en esta nota da el numerador de la ecuación 8.33. El denominador se desprende de él porque los eventos del jugador 1, siendo tipo H o L, son mutuamente excluyentes y conjuntamente exhaustivos, de tal manera que PrðEÞ ¼ PrðE y HÞ þ PrðE y LÞ ¼ PrðEjHÞ PrðHÞ þ PrðEjLÞ PrðLÞ: Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos FIGURA 8.18 La regla de Bayes como una caja negra. 285 La regla de Bayes es una fórmula para calcular las creencias posteriores del jugador 2, a partir de otras piezas de información en el juego. Entradas Creencias previas del jugador 2 Salida Regla de Bayes Creencias posteriores del jugador 2 Estrategia del jugador 1 Cuando el jugador 1 ejecuta una estrategia pura, la regla de Bayes suele dar un resultado simple. Supongamos, por ejemplo, que Pr(E|H) 1 y Pr(E|L) 0 o, en otras palabras, que el jugador 1 obtiene estudios si, y sólo si está altamente calificado. Entonces la ecuación 8.33 implica que PrðHjEÞ ¼ 1 PrðHÞ ¼ 1: 1 PrðHÞ þ 0 PrðLÞ (8.35) Esto es, el jugador 2 cree que el jugador 1 debe estar altamente calificado si ve al jugador 1 elegir E. Por otro lado, supongamos que Pr(E|H) Pr(E|L) 1; es decir, que el jugador 1 obtiene estudios independientemente de su tipo. Entonces, la ecuación 8.33 implica que PrðHjEÞ ¼ 1 PrðHÞ ¼ PrðHÞ, 1 PrðHÞ þ 1 PrðLÞ (8.36) porque Pr(H) + Pr(L) 1. Es decir, ver que el jugador 1 elige E no da información sobre el tipo del jugador 1, así que la creencia posterior del jugador 2 es la misma que la anterior. Más generalmente, si el jugador 2 sigue la estrategia mixta Pr(E|H) p y Pr(E|L) q, la regla de Bayes implica que PrðHjEÞ ¼ p PrðHÞ : p PrðHÞ þ q PrðLÞ (8.37) Equilibrio perfecto bayesiano En los juegos de información completa pasamos del equilibrio de Nash al refinamiento del equilibrio perfecto de subjuegos para descartar amenazas no creíbles en los juegos secuenciales. Por la misma razón en los juegos de información incompleta pasaremos del equilibrio de Bayes-Nash al refinamiento del equilibrio perfecto de Bayes. El requerimiento de que los jugadores jueguen racionalmente en cada conjunto de información es similar al requerimiento del equilibro perfecto del subjuego de que el juego en cada sub- DEFINICIÓN Equilibrio perfecto de Bayes. Un equilibrio perfecto de Bayes consta de un perfil de estrategias y una serie de creencias tales que • en cada conjunto de información la estrategia del jugador que se mueve ahí maximiza su beneficio esperado, donde la expectativa se toma respecto a sus creencias, y • en cada conjunto de información, donde sea posible, las creencias del jugador que se mueve ahí se forman usando la regla de Bayes (basada en las creencias previas y en las estrategias de otros jugadores). Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 286 Parte 3: Incertidumbre y estrategia juego forme un equilibrio de Nash. El requerimiento de que los jugadores usen la regla de Bayes para actualizar sus creencias garantiza que los jugadores incorporen la información obtenida de observar el juego de otros en una forma racional. El truco restante en la definición del equilibrio perfecto de Bayes es que la regla de Bayes sólo debe usarse “donde sea posible”. La regla de Bayes es inútil después de un evento totalmente inesperado; en el contexto de un modelo de señalamiento, una acción que no es ejecutada en equilibrio por ningún tipo del jugador 1. Por ejemplo, si ni el tipo H ni el L eligen E en el juego de señalamiento del mercado de trabajo, los denominadores de las ecuaciones 8.33 y 8.34 son iguales a cero y la fracción es indefinida. Si la regla de Bayes da una respuesta indefinida, el equilibrio perfecto de Bayes no impone restricciones a las creencias posteriores del jugador 2 y, por tanto, pueden suponerse las creencias que se desee. Como se vio en los juegos de información completa, los juegos de señalamiento pueden tener múltiples equilibrios. La libertad para especificar cualesquier creencias cuando la regla de Bayes da una respuesta indefinida puede sostener equilibrios perfectos de Bayes adicionales. Un análisis sistemático de equilibrios múltiples se inicia dividiendo los equilibrios en tres clases: de separación, de unión e híbridos. Luego se buscan los equilibrios perfectos de Bayes dentro de cada clase. En un equilibrio de separación cada tipo del jugador 1 elige una acción diferente. Por tanto, el jugador 2 conoce con seguridad el tipo del jugador 1, después de observar la acción del jugador 1. Las creencias posteriores procedentes de la regla de Bayes son todas ellas ceros y unos. En un equilibrio de unión diferentes tipos del jugador 1 eligen la misma acción. Observar la acción del jugador 1 no le proporciona al jugador 2 información sobre el tipo del jugador 1. Los equilibrios de unión emergen cuando uno de los tipos del jugador 1 elige una acción que, de lo contrario, sería subóptima para ocultar su información privada. En un equilibrio híbrido un tipo del jugador 1 sigue una estrategia estrictamente mixta; este se llama equilibrio híbrido porque la estrategia mixta a veces resulta en que los tipos se separen y, a veces, en que se unan. El jugador 2 conoce un poco sobre el tipo del jugador 1 (la regla de Bayes pule un poco las creencias del jugador 2), pero no conoce con seguridad el tipo del jugador 1. El jugador 2 puede responder a la incertidumbre siguiendo él mismo una estrategia mixta. Los tres ejemplos siguientes despejan las tres clases de equilibrio en el juego de señalamiento del mercado de trabajo. EJEMPLO 8.8 Equilibrio de separación en el juego de señalamiento del mercado de trabajo Una buena suposición para un equilibrio de separación es que el trabajador altamente calificado señala su tipo obteniendo estudios y el trabajador escasamente calificado, no. Dadas estas estrategias las creencias del jugador 2 deben ser Pr(H|E) Pr(L|NE) 1 y Pr(H|NE) Pr(L|E) 0, de acuerdo con la regla de Bayes. Condicionado a estas creencias, si el jugador 2 observa que el jugador 1 obtiene estudios, el jugador 2 sabe que aquél debe estar en el nodo n1, no en el nodo n2 en la figura 8.17. Su mejor respuesta es ofrecer un empleo (J), dado el beneficio de w 0. Si el jugador 2 observa que el jugador 1 no obtiene estudios, el jugador 2 sabe que aquél debe estar en el nodo n4, no en el nodo n3, y su mejor respuesta es no ofrecer un empleo (NJ), porque 0 w. El último paso es retroceder y comprobar que el jugador 1 no querría desviarse de la estrategia de separación (E|H, NE|L), dado que el jugador 2 juega (J|E, NJ|NE). El tipo H del jugador 1 consigue w cH al obtener estudios en equilibrio. Si el tipo H se desvía y no obtiene estudios, consigue 0 porque el jugador 2 cree que el jugador 1 es del tipo L y no le ofrece un empleo. Para que el tipo H no prefiera desviarse, debe ser el caso de que w cH 0. Pasemos ahora al tipo L del jugador 1. El tipo L consigue 0, de no obtener estudios en equilibrio. Si el tipo L se desvía y obtiene estudios, consigue w cL porque el jugador 2 cree que el jugador 1 es de tipo H y le ofrece un empleo. Para que el tipo L no prefiera desviarse, debe tenerse w cL 0. Al juntar estas condiciones hay un equilibrio de separación en el que el trabajador obtiene estudios si, y sólo si está altamente calificado y en el que la empresa ofrece un empleo sólo a solicitantes con estudios si, y sólo si cH w cL. Otro posible equilibrio de separación es que el jugador 1 obtenga estudios si, y sólo si está escasamente calificado. Este es un resultado raro —porque es de esperar que la educación sea una señal de alta Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 287 más que de baja calificación—, y por fortuna podemos descartarlo como un equilibrio perfecto de Bayes. La mejor respuesta del jugador 2 sería ofrecer un empleo si, y sólo si el jugador 1 no obtuviera estudios. El tipo L conseguiría cL por jugar E, y w por jugar NE, así que se desviaría a NE. PREGUNTAS: ¿Por qué el trabajador a veces obtiene estudios aunque no eleve su nivel de calificación? ¿Existiría el equilibrio de separación si un trabajador escasamente calificado pudiera obtener estudios más fácilmente que uno altamente calificado? EJEMPLO 8.9 Equilibrios de unión en el juego de señalamiento del mercado de trabajo Investiguemos un posible equilibrio de unión en el que ambos tipos del jugador 1 eligen E. Para que el jugador 1 no se desvíe de elegir E, la estrategia del jugador 2 debe ser ofrecer un empleo si, y sólo si el trabajador tiene estudios; es decir, (J|E, NJ|NE). Si el jugador 2 no ofrece empleos a trabajadores con estudios, el jugador 1 también podría ahorrar el costo de obtener estudios y elegir NE. Si el jugador 2 ofrece empleos a trabajadores sin estudios, el jugador 1 elegirá de nuevo NE porque se ahorra el costo de obtener estudios y aun así consigue el salario de la oferta de empleo. Ahora investigaremos cuándo (J|E, NJ|NE) es una mejor respuesta para el jugador 2. Las creencias posteriores del jugador 2 después de ver E son iguales a sus creencias previas en este equilibrio de unión. El beneficio esperado del jugador 2 de elegir J es PrðHjEÞðp wÞ þ PrðLjEÞðwÞ ¼ PrðHÞðp wÞ þ PrðLÞðwÞ ¼ PrðHÞp w: (8.38) Para que J sea una mejor respuesta a E, la ecuación 8.38 debe exceder al beneficio cero del jugador 2 de elegir NJ lo cual, al reordenar, implica que Pr(H) w/. Las creencias posteriores del jugador 2 en los nodos n3 y n4 no son precisadas por la regla de Bayes porque NE nunca se juega en equilibrio, así que ver al jugador 1 jugar NE es un evento totalmente inesperado. El equilibrio perfecto de Bayes nos permite especificar cualquier distribución de probabilidad que queramos para las creencias posteriores Pr(H|NE) en el nodo n3 y Pr(L|NE) en el nodo n4. El beneficio del jugador 2 de elegir NJ es 0. Para que NJ sea una mejor respuesta a NE, 0 debe exceder al beneficio esperado del jugador 2 por jugar J: 0 > PrðHjNEÞðp wÞ þ PrðLjNEÞðwÞ ¼ PrðHjNEÞp w, (8.39) donde el miembro derecho se desprende de que Pr(H|NE Pr(L|NE) 1. Reordenar produce Pr(H|NE) w/. En suma, para que haya un equilibrio de unión en el que ambos tipos del jugador 1 obtengan estudios necesitamos Pr(H|NE) w/ Pr(H). La empresa tiene que ser optimista respecto a la proporción de trabajadores calificados en la población: Pr(H) debe ser suficientemente alta; y pesimista respecto al nivel de calificación de los trabajadores sin estudios: Pr(H|NE) debe ser suficientemente baja. En este equilibrio, el tipo L se une con el tipo H para impedir que el jugador 2 sepa algo sobre la calificación del trabajador a partir de la señal de la educación. La otra posibilidad para un equilibrio de unión es que ambos tipos del jugador 1 elijan NE. Varios de esos equilibrios dependen de qué se suponga sobre las creencias posteriores del jugador 2 fuera de equilibrio (es decir, de las creencias del jugador 2 después de observar al jugador 1 elegir E). El equilibrio perfecto bayesiano no impone restricciones a estas creencias posteriores. En el problema 8.12 se te pedirá buscar varios de esos equilibrios y se introducirá un refinamiento adicional del equilibrio perfecto de Bayes (el criterio intuitivo) que ayuda a descartar creencias irrazonables fuera de equilibrio y, por tanto, equilibrios inverosímiles. PREGUNTAS: Vuelve al resultado de unión en el que ambos tipos del jugador 1 obtienen estudios. Considera las creencias posteriores del jugador 2 que se desprenden del evento inesperado de que un trabajador aparezca sin estudios. El equilibrio perfecto de Bayes nos deja en libertad de suponer lo que queramos sobre estas creencias posteriores. Supongamos que asumimos que la empresa no obtiene información de la señal “no estudios”, y que, por tanto, mantiene sus opiniones previas. ¿El resultado de unión propuesto es un equilibrio? ¿Qué pasaría si supusiéramos que la empresa interpreta “no estudios” como una mala señal de calificación, creyendo que el tipo del jugador 1 es seguramente L? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 288 Parte 3: Incertidumbre y estrategia EJEMPLO 8.10 Equilibrios híbridos en el juego de señalamiento del mercado de trabajo Un posible equilibrio híbrido es que el tipo H siempre obtenga estudios y el tipo L quede al azar, pretendiendo a veces ser un tipo alto mediante el hecho de obtener estudios. El tipo L juega al azar entre E y NE con probabilidades de e y 1 – e. La estrategia del jugador 2 es ofrecer un empleo a un solicitante con estudios con probabilidad j y no ofrecer un empleo a un solicitante sin estudios. Debemos despejar los valores de equilibrio de las estrategias mixtas e* y j* y las creencias posteriores Pr(H|E) y Pr(H|NE) que son congruentes con el equilibrio perfecto de Bayes. Las creencias posteriores se calculan usando la regla de Bayes: PrðHjEÞ ¼ PrðHÞ PrðHÞ ¼ PrðHÞ þ ePrðLÞ PrðHÞ þ e½1 PrðHÞ (8.40) y Pr(H|NE) 0. Para que el tipo L del jugador 1 esté dispuesto a seguir una estrategia estrictamente mixta debe recibir el mismo beneficio esperado de jugar E el cual es igual a jw cL dada la estrategia mixta del jugador 2, que de jugar NE el cual es igual a 0 dado que el jugador 2 no ofrece un empleo a solicitantes sin estudios. De ahí que jw cL 0 o, despejando j, j* cL/w. El jugador 2 seguirá una estrategia estrictamente mixta (condicionada a observar E) sólo si obtiene el mismo beneficio esperado de jugar J, el cual es igual a PrðHjEÞðp wÞ þ PrðLjEÞðwÞ ¼ PrðHjEÞp w, (8.41) que de jugar NJ, el cual es igual a 0. Igualar la ecuación 8.41 a 0, sustituir Pr(H|E) de la ecuación 8.40 y despejar e, da e ¼ ðp wÞPrðHÞ : w½1 PrðHÞ (8.42) PREGUNTAS: Para completar nuestro análisis, en este equilibrio el tipo H del jugador 1 no puede preferir desviarse de E, ¿cierto? De ser así, ¿puedes demostrarlo? ¿Cómo varía la probabilidad del tipo L de tratar de “unirse” al tipo alto obteniendo estudios, con la creencia previa del jugador 2 de que el jugador 1 es del tipo alto? JUEGOS EXPERIMENTALES La economía experimental es una rama reciente de investigación que explora lo bien que la teoría económica se ajusta al comportamiento de sujetos experimentales en condiciones de laboratorio. Los métodos son similares a los que se usan en la psicología experimental —a menudo aplicados en campus que usan estudiantes como sujetos—, aunque los experimentos en economía tienden a implicar incentivos en forma de pagos monetarios explícitos realizados a los sujetos. La importancia de la economía experimental fue subrayada en 2002, cuando Vernon Smith recibió el Premio Nobel de Economía por su trabajo precursor en este campo. Un área importante de este terreno es el uso de métodos experimentales para probar la teoría de juegos. Experimentos con el dilema del prisionero Ha habido cientos de pruebas de si los jugadores delatan en el dilema del prisionero, tal como lo predice el equilibrio de Nash, o si producen el resultado cooperativo de callar. En un experimento los sujetos practicaron el juego 20 veces, cada vez enfrentando a un jugador con un adversario anónimo diferente para evitar los efectos de los juegos repetidos. El juego convergió en el equilibrio de Nash a medida que los sujetos obtenían experiencia en él. Los jugadores produjeron la Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 289 acción cooperativa en 43% de los casos en las cinco primeras rondas, proporción que se redujo a sólo 20% en las cinco últimas rondas.15 Como suele suceder en los experimentos el comportamiento de los sujetos tendió a ser bullicioso. Aunque 80% de las decisiones fueron congruentes con el juego del equilibrio de Nash para el final del experimento, 20% de estas fueron anómalas de cualquier manera. Aun si el juego experimental es más o menos congruente con las predicciones de la teoría, es raro que sea enteramente congruente. Experimentos con el juego del ultimátum La economía experimental también ha hecho pruebas para ver si el equilibrio perfecto de subjuegos es una buena predicción del comportamiento en juegos secuenciales. En un juego secuencial ampliamente estudiado, el juego del ultimátum, el experimentador les proporciona un recipiente con dinero a dos jugadores. El primero en moverse (proponedor) sugiere una división de ese recipiente al otro. El segundo en moverse (respondedor) decide si acepta la oferta, por tanto, los jugadores reciben la cantidad de dinero indicado; o rechazarla en cuyo caso ningún jugador recibe nada. En el equilibrio perfecto de subjuegos el proponedor ofrece una parte mínima del recipiente la cual es aceptada por el respondedor. Esto puede verse aplicando inducción hacia atrás: el respondedor debería aceptar cualquier división positiva, por reducida que sea; sabiendo esto el proponedor debería ofrecer al respondedor apenas una mínima parte. En experimentos la división tiende a ser mucho más pareja que en el equilibrio perfecto de subjuegos.16 La oferta más común es una división de 50-50. Los respondedores tienden a rechazar ofertas que les den menos de 30% del recipiente. Este resultado se observa si el recipiente es de hasta 100 dólares, de manera que rechazar una oferta de 30% significa declinar 30 dólares. Algunos economistas han sugerido que el dinero que reciben los jugadores podría no ser una medida verdadera de sus beneficios. Quizá les importen otros factores como la justicia y obtengan, por tanto, un beneficio de una división más equitativa del recipiente. Aun si un proponedor no se interesa directamente en la justicia, el temor de que el respondedor sí lo haga y rechace, por ende, una oferta inequitativa puede llevar al proponedor a sugerir una división pareja. La diferencia del comportamiento experimental respecto a las predicciones de la teoría de juegos fue demasiado sistemática en el juego del ultimátum como para atribuírsele a un juego bullicioso, lo que ha llevado a algunos teóricos de los juegos a replantear la teoría y añadir una consideración explícita de la justicia.17 Experimentos con el juego del dictador Para probar si los jugadores se interesan directamente en la justicia o si actúan por temor al resentimiento del otro jugador los investigadores experimentaron con un juego parecido, el juego del dictador. En el juego del dictador el proponedor decide una división del recipiente, y esta división es implementada sin intervención del respondedor. Los proponedores tienden a ofrecer una división menos pareja que en el juego del ultimátum, pero aun así ofrecen al respondedor parte del recipiente, lo cual sugiere que los primeros tienen algún interés residual en la justicia. Los detalles del diseño experimental son cruciales, sin embargo, como lo demostró un experimento ingenioso.18 Este experimento fue diseñado de tal manera que el experimentador nunca supiera qué 15 R. Cooper, D. V. DeJong, R. Forsythe y T. W. Ross, “Cooperation Without Reputation: Experimental Evidence form Prisoner’s Dilemma Games”, Games and Economic Behavior (febrero de 1996), pp. 187-218. 16 Para una revisión de experimentos del juego del ultimátum y un tratamiento del libro de texto de la economía experimental más en general, véase D. D. Davis y C. A. Holt, Experimental Economics (Princeton University Press, Princeton, 1993). 17 Véase, por ejemplo, E. Fehr y K. M. Schmidt, “A Theory of Fairness, Competition, and Cooperation”, Quarterly Journal of Economics (agosto de 1999), pp. 817-868. 18 E. Hoffman, K. McCabe, K. Shachat y V. Smith, “Preferences, Property Rights, and Anonimity in Bargaining Games”, Games and Economic Behavior (noviembre de 1994), pp. 346-380. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 290 Parte 3: Incertidumbre y estrategia proponedores habían hecho cuáles ofertas. Con este elemento de anonimato los proponedores casi nunca dieron una división equitativa a los respondedores, y en realidad tomaron todo el recipiente para sí mismos en dos tercios de los casos. Los proponedores parecen interesarse más por parecer justos ante el experimentador que en serlo realmente. JUEGOS EVOLUTIVOS Y APRENDIZAJE La frontera de la investigación en la teoría de juegos concierne a si los jugadores terminan por jugar un equilibrio de Nash y cómo. Jugadores hiperracionales pueden deducir las estrategias de los demás y decidirse al instante por el equilibrio de Nash. ¿Cómo pueden coordinar instantáneamente un solo resultado cuando hay múltiples equilibrios de Nash? ¿Qué resultado decidirían jugadores reales para quienes las deducciones hiperracionales podrían ser demasiado complejas? Los teóricos de los juegos han tratado de modelizar el proceso dinámico por el cual emerge un equilibrio a largo plazo del juego de una gran población de agentes que se conocen al azar y que practican un juego en pares. Los teóricos de los juegos analizan si el juego converge en un equilibrio de Nash o en algún otro resultado, y cuánto tiempo tarda esa convergencia. Dos modelos que establecen supuestos variables sobre el nivel de racionalidad de los jugadores han sido los más ampliamente estudiados: un modelo evolutivo y un modelo de aprendizaje. En el modelo evolutivo los jugadores no toman decisiones racionales; en cambio, juegan a la manera en que están genéticamente programados. Cuanto más exitosa es la estrategia de un jugador en la población, más apto es el jugador y más probabilidades tiene de sobrevivir para transmitir sus genes a las generaciones futuras y, por tanto, más probabilidades tiene también de difundirse la estrategia en la población. Los modelos evolutivos fueron inicialmente desarrollados por John Maynard Smith y otros biólogos para explicar la evolución de conductas animales como el coraje con que pelea un león por una pareja, o una hormiga para defender su colonia. Aunque podría ser un poco excesivo aplicar modelos evolutivos a seres humanos, los modelos evolutivos brindan una forma conveniente de analizar la dinámica de la población y pueden tener repercusiones directas en el modo en que se transmiten las convenciones sociales, quizá a través de la cultura. En un modelo de aprendizaje los jugadores nuevamente son reunidos al azar con otros de una población grande. Usan sus experiencias de beneficios de juegos pasados para enseñar cómo juegan los otros y cuál es la mejor forma en que ellos pueden responder. Suele suponerse que los jugadores poseen un grado de racionalidad en cuanto que pueden elegir una mejor respuesta estática dadas sus creencias, pueden hacer alguna experimentación y pondrán al día sus creencias de acuerdo con alguna regla razonable. Los jugadores no son plenamente racionales en cuanto que no distorsionan sus estrategias para afectar el aprendizaje de otros y, por tanto, el juego futuro. Los teóricos de los juegos han investigado si las estrategias de aprendizaje más o menos sofisticadas convergen en forma más o menos rápida en un equilibrio de Nash. La investigación actual intenta integrar la teoría con el estudio experimental, tratando de identificar los algoritmos específicos que usan los sujetos reales cuando aprenden a jugar juegos. Resumen Este capítulo brindó una manera estructurada de pensar en situaciones estratégicas. Nos centramos en el concepto de la solución más importante usado en la teoría de los juegos, el equilibrio de Nash. Luego pasamos a conceptos de solución más refinados de uso estándar en la teoría de los juegos en marcos más compli- cados (con movimientos secuenciales e información incompleta). Algunos de los resultados principales son los siguientes. • Todos los juegos tienen los mismos componentes básicos: jugadores, estrategias, beneficios y una estructura de información. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos cios más altos que si el juego en etapas se jugara una vez. Si los jugadores son lo bastante pacientes en un juego de repetición infinita, se aplica un teorema tradicional, lo cual implica que, en esencia, cualesquier beneficios son posibles en el juego repetido. • Los juegos pueden escribirse en forma normal (proporcionando una matriz de beneficios o funciones de beneficios) o en forma extensiva (proporcionando un árbol del juego). • Las estrategias pueden ser acciones simples, planes más complicados contingentes de acciones de otros o incluso distribuciones de probabilidad sobre acciones simples (estrategias mixtas). • Un equilibrio de Nash es una serie de estrategias, una para cada jugador, que son mejores respuestas mutuas. En otras palabras, la estrategia de un jugador en un equilibrio de Nash es óptima dado que todos los demás juegan sus estrategias de equilibrio. • Un equilibrio de Nash siempre existe en juegos finitos (en estrategias mixtas si no es que puras). • El equilibrio perfecto de subjuego es un refinamiento del equilibrio de Nash que ayuda a descartar equilibrios en juegos secuenciales que implican amenazas no creíbles. • Repetir un juego en etapas gran número de veces introduce la posibilidad de usar estrategias de castigo para alcanzar benefi- 291 • En juegos de información privada un jugador sabe más sobre su “tipo” que otro. Los jugadores maximizan sus beneficios esperados dado el conocimiento de su propio tipo y sus creencias sobre el de los demás. • En un equilibrio perfecto de Bayes de un juego de señalamiento, el segundo en moverse usa la regla de Bayes para poner al día sus creencias sobre el tipo del primero después de observar su acción. • La frontera de la investigación en teoría de los juegos combina teoría con experimentos para determinar si los jugadores que quizá no sean hiperracionales terminan por jugar un equilibrio de Nash, qué equilibrio particular (si hay más de uno) y qué trayectoria conduce al equilibrio. Problemas 8.1 Jugador 1 Considera el juego siguiente: a. b. c. d. D Jugador 2 E F A 7, 6 5, 8 0, 0 B 5, 8 7, 6 1, 1 C 0, 0 1, 1 4, 4 Halla los equilibrios de Nash en estrategias puras (de haberlos). Halla el equilibrio de Nash en estrategias mixtas en el que cada jugador decide al azar sobre apenas las dos primeras acciones. Calcula los beneficios esperados de los jugadores en los equilibrios hallados en los incisos a) y b). Traza la forma extensiva de este juego. 8.2 El equilibrio de Nash en estrategias mixtas en la batalla de los sexos en la figura 8.3 podría depender de los valores numéricos de los beneficios. Para generalizar esta solución supongamos que la matriz de beneficios del juego está dada por Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 292 Parte 3: Incertidumbre y estrategia Jugador 1 (Esposa) Jugador 2 (Esposo) Ballet Box donde K Ballet K, 1 0, 0 Box 0, 0 1, K 1. Muestra cómo el equilibrio de Nash en estrategias mixtas depende del valor de K. 8.3 El juego del pollo es jugado por dos adolescentes que aceleran uno contra otro en una calle de un solo carril. El primero en virar es calificado como el pollo, mientras que el que no vira conquista la estimación de su grupo de amigos. Claro que si ninguno de los dos vira, ambos mueren en el choque resultante. Los beneficios del juego del pollo se ofrecen en la tabla siguiente. Adolescente 1 Adolescente 2 Vira No vira Vira 2, 2 1, 3 No vira 3, 1 0, 0 a. Grafica la forma extensiva. b. Determina el equilibrio o los equilibrios de Nash en estrategias puras. c. Calcula el equilibrio de Nash en estrategias mixtas. Como parte de tu respuesta traza el diagrama de la función de mejor respuesta para las estrategias mixtas. d. Supongamos que el juego se practica secuencialmente, siendo el adolescente 1 el primero en moverse y comprometiéndose en esta acción a tirar el volante. ¿Cuáles son las estrategias contingentes del adolescente 2? Escribe las formas normal y extensiva de la versión secuencial de este juego. e. Usando la forma normal de la versión secuencial del juego despeja los equilibrios de Nash. f. Identifica los subjuegos apropiados en la forma extensiva de la versión secuencial del juego. Usa la inducción hacia atrás para despejar el equilibrio perfecto de subjuegos. Explica por qué los demás equilibrios de Nash del juego secuencial son “irrazonables”. 8.4 Dos dueños de casas vecinas, i 1, 2, eligen simultáneamente cuántas horas li dedicar a mantener hermoso un césped. El beneficio promedio por hora es lj 10 l i þ , 2 y el costo (de oportunidad) por hora para cada uno es de 4. El beneficio promedio del dueño i es creciente en las horas que el vecino j dedica a su césped, porque la apariencia de la propiedad de uno depende en parte de la belleza del vecindario circundante. a. Calcula el equilibrio de Nash. b. Grafica las funciones de mejor respuesta e indica el equilibrio de Nash en la gráfica. c. Muestra en la gráfica cómo el equilibrio cambiaría si la intersección de las funciones de beneficio promedio de uno de los vecinos cayera de 10 a algún número menor. 8.5 La película ganadora del Óscar A Beautiful Mind, sobre la vida de John Nash, dramatiza la contribución académica de Nash en una sola escena: su concepto de equilibrio se le ocurre mientras bromea en un bar con sus compañeros de posgrado. Ven a varias mujeres, una Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 293 de ellas rubia y las demás morenas, y coinciden en que la rubia es más atractiva que las morenas. El personaje de Nash ve la situación como un juego entre los estudiantes de posgrado, en los siguientes términos. Supongamos que hay n varones que se acercan simultáneamente a la rubia o a una de las morenas. Si el varón i se acerca él solo a la rubia logrará conseguir una cita con ella y obtendrá el beneficio a. Si uno o más de los otros varones se acercan a la rubia junto con i, la competencia provocará que todos la pierdan, e i (lo mismo que los demás que se acercaron a ella) obtendrá un beneficio de cero. Por otro lado, el varón i obtiene un beneficio de b 0 de acercarse a una morena, porque hay más morenas que varones; por tanto, conseguirá con seguridad una cita con una morena. El atractivo de la rubia implica que a b. a. Argumenta que este juego no tiene un equilibrio de Nash simétrico en estrategias puras. b. Despeja el equilibrio simétrico en estrategias mixtas. Es decir, siendo p la probabilidad de que un varón se acerque a la rubia, halla p*. c. Demuestra que cuantos más varones hay, menos probable es que en el equilibrio del inciso b) se acerque a la rubia al menos uno de ellos. Nota: Este resultado paradójico fue señalado por S. Anderson y M. Engers en “Participation Games: Market Entry, Coordination, and the Beautiful Blond”, Journal of Economic Behavior and Organization, núm. 63 (2007), pp. 120-137. 8.6 El juego siguiente es una versión del dilema del prisionero, pero los beneficios son ligeramente distintos de los de la figura 8.1. Sospechoso 1 Sospechoso 2 Delata Calla Delata 0, 0 3, −1 Calla −1, 3 1, 1 a. Comprueba que el equilibrio de Nash es el usual para el dilema del prisionero y que ambos jugadores tienen estrategias dominantes. b. Supongamos que el juego en etapas se repite infinitas veces. Calcula el factor de descuento requerido para que los sospechosos sean capaces de cooperar en callar en cada periodo. Esboza las estrategias de gatillo que consideres para ellos. 8.7 Vuelve al juego de los dos vecinos del problema 8.5. Sigue suponiendo que el beneficio promedio del jugador i por hora de trabajo en jardinería es lj 10 l i þ , 2 Continúa suponiendo que el costo de oportunidad para el jugador 2 de una hora de trabajo de jardinería es de 4. Supongamos que el costo de oportunidad del jugador 1 es de 3 o 5 con igual probabilidad y que este costo es información privada del jugador 1. a. Despeja el equilibrio de Bayes-Nash. b. Indica el equilibrio de Bayes-Nash en un diagrama de funciones de mejores respuestas. c. ¿Qué tipo del jugador 1 querría enviar una señal veraz al jugador 2, si pudiera? ¿Qué tipo querría ocultar su información privada? 8.8 En Blind Texan Poker el jugador 2 extrae una carta de un mazo estándar y la pone contra su frente sin mirarla, pero de tal manera que el jugador 1 pueda verla. El jugador 1 se mueve primero, decidiendo si mantenerse o rendirse. Si el jugador 1 se rinde debe pagar 50 dólares al jugador 2. Si el jugador 1 se queda, la acción pasa al jugador 2. El jugador 2 puede rendirse o llamar. Si el jugador 2 se rinde, debe pagar 50 dólares al jugador 1. Si el jugador 2 llama, la carta es examinada. Si es una carta baja (2-8), el jugador 2 paga 100 dólares al jugador 1. Si es una carta alta (9, 10, comodín, reina, rey o as), el jugador 1 paga 100 dólares al jugador 2. a. Grafica la forma extensiva de este juego. b. Despeja el equilibro híbrido. c. Calcula los beneficios esperados de los jugadores. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 294 Parte 3: Incertidumbre y estrategia Problemas analíticos 8.9 Justicia en el juego del ultimátum Considera la versión simple del juego del ultimátum expuesta en el texto. El primero en jugar propone una división de $1. Sea r la parte recibida por el otro jugador en esta propuesta (de manera que el primero en jugar mantiente 1 – r), donde 0 r 1/2. Entonces el otro jugador se mueve, respondiendo con la aceptación o el rechazo de la propuesta. Si el que responde acepta la propuesta, se les paga a los jugadores su parte; si el respondedor la rechaza, ninguno de los jugadores recibe nada. Supongamos que si el respondedor es indiferente entre aceptar o rechazar una propuesta, la aceptará. a. Supongamos que a los jugadores sólo les interesan los beneficios monetarios. Comprueba que el resultado mencionado en el texto ocurre de hecho en el único equilibrio perfecto de subjuego del juego del ultimátum. b. Compara el resultado en el juego del ultimátum con el resultado en el juego del dictador (también expuesto en el texto), en el que la división excedente del proponedor es implementada independientemente de si el segundo en jugar la acepta o rechaza (¡así que este no es precisamente un juego estratégico!). c. Supongamos ahora que a los jugadores les interesa la justicia tanto como el dinero. Siguiendo el artículo de Fehr y Schmidt, citado en el texto, supongamos que estas preferencias están representadas por la función de utilidad U1 ðx1 , x2 Þ ¼ x1 ajx1 x2 j, donde x1 es el beneficio del jugador 1 y x2 el del jugador 2 (una función simétrica se aplica al jugador 2). El primer término refleja el deseo usual de más dinero. El segundo término refleja el justo deseo de que los beneficios de los jugadores no sean tan desiguales. El parámetro a mide cuán intensa es la preferencia por la justicia en relación con el deseo de más dinero. Supongamos que a 1/2. 1. Despeja la estrategia de equilibrio del respondedor en el juego del ultimátum. 2. Tomando en cuenta cómo responderá el segundo en jugar, despeja la estrategia de equilibrio del proponedor r* en el juego del ultimátum. (Pista: r* será una solución de esquina, que depende del valor de a.) 3. Continuando con las preferencias por la justicia, compara el resultado del juego del ultimátum con el del juego del dictador. Halla casos que coincidan con los resultados experimentales descritos en el texto, en particular en los que la división del recipiente de dinero es más equitativa en el juego del ultimátum que en el juego del dictador. ¿Hay un límite a lo equitativa que puede ser la división en el juego del ultimátum? 8.10 Teorema del chico maleado En A Treatise on the Family (Harvard University Press, Cambridge, 1981), Gary Becker, galardonado con el Nobel, propone su famoso teorema del chico maleado, como un juego secuencial entre el chico potencialmente maleado (jugador 1) y su padre (jugador 2). El chico es el primero en jugar, eligiendo una acción r que afecta a su propio ingreso 1 ðrÞ½ 01 ðrÞ > 0 y el ingreso del padre 2 ðrÞ½ 02 ðrÞ < 0 . Luego juega el padre, dejando un legado monetario L al hijo. Al hijo sólo le interesa su utilidad, U1 ð 1 þ LÞ , pero el padre optimiza U2 ð 2 LÞ þ aU1 , donde 0 refleja el altruismo del padre hacia el hijo. Demuestra que, en un equilibrio perfecto de subjuegos, el hijo optará por el valor de r que optimiza 1 þ 2 aunque no tenga intenciones altruistas. Pista: Aplica la inducción hacia atrás al problema del padre primero, lo que dará una condición de primer orden que determinará implícitamente L*; aunque una solución explícita para L* no puede hallarse, la derivada de L* respecto a r —requerida en el problema de optimización de primera etapa del hijo— puede determinarse usando la regla de la función implícita. 8.11 Opciones a la estrategia siniestra Supongamos que el juego del dilema del prisionero en etapas (véase figura 8.1) se repite durante periodos infinitos. a. ¿Los jugadores pueden sostener el resultado cooperativo usando estrategias de ojo por ojo, castigando la desviación en un periodo pasado mediante el hecho de volver al equilibrio de Nash del juego en etapas durante sólo un periodo y retornando después a la cooperación? ¿Serán suficientes dos periodos de castigo? b. Supongamos que los jugadores usan estrategias que castigan la desviación de la cooperación, volviendo al equilibrio de Nash del juego en etapas durante 10 periodos antes de retornar a la cooperación. Calcula el factor de descuento de umbral por encima del cual la cooperación es posible en el resultado que optimiza los beneficios conjuntos. 8.12 Refinamientos del equilibrio perfecto de Bayes Recuerda el juego de señalamiento del mercado de trabajo del ejemplo 8.9. a. Determina las condiciones en las cuales hay un equilibrio de unión en el que ambos tipos de trabajador eligen no obtener estudios (NE) y en el que la empresa ofrece empleo a un trabajador sin estudios. Cerciórate de especificar las creencias tanto como las estrategias. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 8: Teoría de juegos 295 b. Determina las condiciones en las cuales hay un equilibrio de unión en el que ambos tipos de trabajador eligen no obtener estudios (NE) y en el que la empresa no ofrece empleo a un trabajador sin estudios. ¿Cuál es la menor creencia posterior, de que el trabajador está escasamente calificado, condicionada a obtener estudios congruentes con este equilibrio de unión? ¿Por qué es más natural pensar que un trabajador escasamente calificado nunca se desviaría a E y que, por tanto, un trabajador con estudios debe estar altamente calificado? El criterio intuitivo de Cho y Kreps es uno de una serie de complicados refinamientos del equilibrio perfecto de Bayes que descartan equilibrios basados en creencias posteriores irrazonables como se identificaron en esta parte; véase I. K. Cho y D. M. Kreps, “Signalling Games and Stable Criteria”, Quarterly Journal of Economics, núm. 102 (1987), pp. 179-221 Sugerencias de lecturas adicionales Fundenberg, D. y J. Tirole. Game Theory, MIT Press, Cambridge, 1991. Rasmusen, E. Games and Information, 4a. ed., Blackwell, Malden, 2007. Completo estudio de la teoría de los juegos de nivel posgrado; no obstante, las secciones selectas son accesibles para los estudiantes avanzados de licenciatura. Texto avanzado para estudiantes de licenciatura con muchas aplicaciones reales. Holt, C. A. Markets, Games and Strategic Behavior, Pearson, Boston, 2007. Texto para estudiantes de licenciatura con énfasis en juegos experimentales. Watson, Joel. Strategy: An Introduction to Game Theory, Norton, Nueva York, 2002. Texto para estudiantes de licenciatura que equilibra el rigor con ejemplos sencillos (a menudo juegos de 2 × 2). Énfasis en ejemplos de negociación colectiva y contratación. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 296 Parte 3: Incertidumbre y estrategia EXTENSIONES Existencia del equilibrio de Nash En esta sección se esbozará la prueba original de John Nash de que todos los juegos finitos tienen al menos un equilibrio de Nash (en estrategias mixtas, si no es que también en puras). Se darán aquí algunos de los detalles de esa prueba; la prueba original se encuentra en Nash (1950), y una presentación clara del libro de texto de la prueba completa se ofrece en Fudenberg y Tirole (1991). La sección concluirá mencionando un teorema de existencia conexo para juegos con acciones continuas. La prueba de Nash es similar a la prueba de la existencia de un equilibrio competitivo general en el capítulo 13. Ambas pruebas se apoyan en un teorema de punto fijo. La prueba de la existencia del equilibrio de Nash requiere un teorema un poco más eficiente. En vez del teorema de punto fijo de Brouwer que se aplica a funciones, la prueba de Nash se apoya en el teorema de punto fijo de Kakutani que se aplica a correspondencias, más mapas generales que funciones. E8.1 Correspondencias versus funciones Una función traza cada punto en un primer conjunto en relación con un punto en un segundo conjunto. Una correspondencia FIGURA E8.1 Comparación de funciones y correspondencias. traza un punto en el primer conjunto en relación con posiblemente muchos puntos en el segundo. La figura E8.1 ilustra la diferencia. Un ejemplo de una correspondencia que ya vimos es la mejor respuesta, BRi(si). La mejor respuesta no debe trazar las estrategias de otros jugadores si en una sola estrategia que sea una mejor respuesta para el jugador i. Puede haber empates entre varias mejores respuestas. Como se mostró en la figura 8.4, en la batalla de los sexos, la mejor respuesta del esposo al hecho de que la esposa siguiera la estrategia mixta de ir al ballet con una probabilidad de 2/3 y al box con una probabilidad de 1/3 (o sencillamente w 2/3 para abreviar) es no sólo un punto, sino el intervalo completo de posibles estrategias mixtas. Las mejores respuestas tanto del esposo como de la esposa en esta figura son correspondencias, no funciones. La razón de que Nash necesitara un teorema de punto fijo que implicara correspondencias, más que sólo funciones, es precisamente que su prueba opera con mejores respuestas de los jugadores para demostrar su existencia. La función graficada en a) parece una curva conocida. Cada valor de x se traza en relación con un solo valor de y. Con las correspondencias graficadas en b), cada valor de x puede trazarse en relación con muchos valores de y. Así, las correspondencias pueden tener abultamientos como los que muestran las regiones sombreadas en b). y y a) Función x Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. b) Correspondencia 23.08.2019 x 8/23 Capítulo 8: Teoría de juegos FIGURA E8.2 Condiciones de Kakutani a correspondencias. 297 La correspondencia en a) no es convexa porque el segmento vertical punteado entre A y B no está dentro de la correspondencia. La correspondencia en b) no es semicontinua superior porque hay una trayectoria (C) dentro de la correspondencia que conduce a un punto (D) que, como lo indica el círculo en blanco, no está dentro de la correspondencia. Tanto a) como b) no tienen puntos fijos. f(x) f(x) 1 1 45° 45° A D C B x 1 a) Correspondencia que no es convexa E8.2 Teorema de punto fijo de Kakutani He aquí el enunciado del teorema de punto fijo de Kakutani: Toda correspondencia convexa semicontinua superior [f(x)] de un conjunto convexo cerrado y limitado en sí mismo tiene al menos un punto fijo (x*) tal que x* 僆 f(x*). Comparando el enunciado del teorema de punto fijo de Kakutani con el de Brouwer en el capítulo 13, se descubre que son similares salvo por la sustitución de “correspondencia” por “función” y por las condiciones de la correspondencia. El teorema de Brouwer requiere que la función sea continua; el teorema de Kakutani requiere que la correspondencia sea convexa y semicontinua superior. Estas propiedades, que se relacionan con la continuidad, son menos conocidas y vale la pena dedicar un momento a comprenderlas. La figura E8.2 da ejemplos de correspondencias que violan a) la convexidad y b) la semicontinuidad superior. Esa figura muestra por qué esas dos propiedades son necesarias para garantizar un punto fijo. Sin ambas propiedades la correspondencia podría “saltar” a lo largo de la línea de 45° y carecer por tanto de un punto fijo, es decir de un punto para el cual x f(x). E8.3 Prueba de Nash Usaremos R(s) para denotar la correspondencia que subyace en la prueba de existencia de Nash. Esta correspondencia toma cualquier perfil de estrategias de los jugadores s (s1, s2,…, sn) (posiblemente mixtas) y lo traza en otro perfil de estrategias mixtas, el perfil de mejores respuestas: RðsÞ ¼ ðBR1 ðs1 Þ; BR2 ðs2 Þ, . . . , BRn ðsn ÞÞ: (i) x b) Correspondencia que no es semicontinua superior Un punto fijo de la correspondencia es una estrategia para la cual s* 僆 R(s*); éste es un equilibrio de Nash, porque la estrategia de cada jugador es una mejor respuesta a las estrategias de otros. Esta prueba demuestra que todas las condiciones implicadas en el teorema de punto fijo de Kakutani son satisfechas por la correspondencia de mejores respuestas R(s). Primero se debe demostrar que el conjunto de perfiles de estrategias mixtas está cerrado y delimitado y es convexo. Puesto que un perfil de estrategias es sólo una lista de estrategias individuales, el conjunto de perfiles de estrategias será cerrado, delimitado y convexo si el conjunto de estrategias de cada jugador Si tiene estas propiedades individualmente. Como indica la figura E8.3 para el caso de dos y tres acciones, la serie de estrategias mixtas sobre acciones tiene una forma simple.1 La serie es cerrada (contiene su límite), delimitada (no tiende al infinito en ninguna dirección) y convexa (el segmento entre dos puntos cualesquiera en el conjunto también está en el conjunto). Luego debe verificarse que la correspondencia de mejores respuestas R(s) es convexa. Mejores respuestas particulares no pueden parecerse a la figura E8.2a porque si dos estrategias mixtas cualesquiera como A y B son mejores respuestas a estrategias de otros, las estrategias mixtas entre ellas también deben ser mejores respuestas. Por ejemplo, en la batalla de los sexos, si (1/3, 2/3) y (2/3, 1/3) sin mejores respuestas para el esposo contra el hecho de que su esposa juegue (2/1, 1/3) (donde, en cada par, el primer número es la probabilidad de jugar ballet y el segundo de jugar box), las estrategias mixtas entre las dos, tales como (1/2, 1/2), también deben ser mejores respuestas para él. La figura 8.4 mos- 1 Los matemáticos los estudian con tanta frecuencia que tienen un nombre especial para tal conjunto: simplex. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 298 Parte 3: Incertidumbre y estrategia FIGURA E8.3 Conjunto de estrategias mixtas para un individuo. El conjunto de posibles estrategias mixtas del jugador 1 sobre dos acciones está dado por el segmento de línea diagonal en a). El conjunto de tres acciones está dado por el triángulo sombreado en la gráfica tridimensional en b). p31 p21 1 1 0 1 p21 1 0 1 p11 a) Dos acciones tró que, de hecho, todas las posibles estrategias mixtas para el esposo son mejores respuestas al juego de la esposa (2/3, 1/3). Por último debe verificarse que R(s) es semicontinua superior. Mejores respuestas particulares no pueden parecerse a la figura E8.2b. No pueden tener agujeros como el punto D en ellas porque las funciones de beneficio ui(si, si) son continuas. Recuerda que los beneficios, cuando se escriben como funciones de estrategias mixtas, en realidad son valores esperados con probabilidades dadas por las estrategias si y si. Como demostró la ecuación 2.176, los valores esperados son funciones lineales de las probabilidades subyacentes. Las funciones lineales son, desde luego, continuas. E8.4 Juegos con acciones continuas El teorema de existencia de Nash se aplica a juegos finitos; es decir, juegos con un número finito de jugadores y acciones por jugador. p11 b) Tres acciones El teorema de Nash no se aplica a juegos que contienen acciones continuas, como la tragedia de los comunes en el ejemplo 8.5. ¿Un equilibrio de Nash también es de existencia garantizada para estos juegos? Glicksberg (1952) comprobó que la respuesta es “sí” mientras las funciones de beneficios sean continuas. Referencias Fundenberg, D. y J. Tirole. Game Theory, MIT Press, Cambridge, 1991, sección 1.3. Glicksberg, I. L. “A Further Generalization of the Kakutani Fixed Point Theorem with Application to Nash Equilibrium Points”, Proceedings of the National Academy of Sciences, núm. 38 (1952), pp. 170-174. Nash, John. “Equilibrium Points in n-Person Games”, Proceedings of the National Academy of Sciences, núm. 36 (1950), pp. 48-49. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Producción y oferta PARTE CUATRO Capítulo 9 Funciones de producción Capítulo 10 Funciones de costo Capítulo 11 cios En esta parte se examinarán la producción y la oferta de bienes económicos. Las instituciones que coordinan la transformación de insumos en productos se llaman empresas. Pueden ser instituciones grandes (como Google, Sony o el Departamento de Defensa de Estados Unidos) o pequeñas (como las tiendas de propiedad familiar o los individuos que se emplean a sí mismos). Aunque pueden perseguir diferentes objetivos (Google puede buscar beneficios máximos, mientras que un kibbutz israelí puede tratar de hacer que los miembros del mismo estén en las mejores condiciones posibles), todas las empresas deben tomar ciertas decisiones básicas en el proceso de producción. El propósito de la parte 4 es desarrollar algunas herramientas para analizar esas decisiones. En el capítulo 9 se examinarán maneras de modelar la relación física entre insumos y productos. Se introducirá el concepto de función de producción, abstracción útil a partir de las complejidades de los procesos de producción de la realidad. Dos aspectos mensurables de la función de producción se subrayarán: sus rendimientos a escala (es decir, cómo la producción aumenta cuando todos los insumos se incrementan) y su elasticidad de sustitución (es decir, la facilidad con que un insumo puede ser reemplazado por otro, manteniendo el mismo nivel de producción). Asimismo, se describirá brevemente cómo se reflejan las mejoras técnicas en funciones de producción. El concepto de función de producción se usará después en el capítulo 10 para analizar los costos de producción. Supondremos que todas las empresas buscan generar su producción al menor costo posible, supuesto que permite el desarrollo de funciones de costo para la empresa. El capítulo 10 también atenderá cómo los costos pueden diferir entre los plazos corto y largo. En el capítulo 11 se investigará la decisión de oferta de la empresa. Para hacerlo se supondrá que el gerente de la empresa toma decisiones de insumos y productos para maximizar los beneficios. Este capítulo concluirá con el modelo fundamental del comportamiento de la oferta de las empresas que maximizan beneficios, el cual se usará en muchos capítulos subsecuentes. 301 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO NUEVE Funciones de producción La principal actividad de toda empresa es convertir insumos en bienes . Como los economistas se interesan en las decisiones que la empresa toma para cumplir su objetivo, pero quieren evitar analizar muchas de las minucias de ingeniería contenidas en ello, han optado por elaborar un modelo abstracto de producción. En este modelo la relación entre insumos y productos se formaliza mediante una función de producción de la forma q f (k, l, m, . . .), (9.1) donde q representa la producción de la empresa de un bien particular durante un periodo, 1 k representa el uso de maquinaria (es decir, de capital) durante ese periodo, l representa horas de insumo de trabajo, m representa las materias primas utilizadas2 y la notación indica la posibilidad de que otras variables afecten el proceso de producción. Se supone que la ecuación 9.1 da, para cualquier conjunto concebible de insumos, la solución de ingeniería al problema de cuál es la mejor forma de combinar esos insumos para obtener productos. PRODUCTIVIDAD MARGINAL En esta sección se examina la variación en la producción, ocasionado por una variación en uno de los insumos productivos. Para los propósitos de este análisis (y en realidad para la mayoría de cada nida como sigue. DEFINICIÓN Función de producción. La función de producción de la empresa para un bien particular, q, q f(k, l), (9.2) muestra la cantidad máxima del bien que puede producirse usando combinaciones alternas de capital (k) y trabajo (l). Desde luego que la mayor parte de nuestro análisis valdrá para dos insumos cualesquiera del proceso de producción que queramos examinar. Los términos capital y trabajo se usan sólo por 1 Aquí se usará una q minúscula para representar la producción de una empresa. Reservaremos la Q mayúscula para representar la producción total en un mercado. Por lo general se supone que una empresa produce sólo un bien o servicio. Asuntos que surgen en empresas de productos múltiples se analizarán en algunas notas y problemas. 2 En el trabajo empírico los insumos de materias primas suelen desestimarse y la producción, q, se mide en términos de “valor agregado”. 303 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 304 Parte 4: Producción y oferta conveniencia. De igual forma, sería simple generalizar nuestro análisis a casos que implican más de dos insumos; ocasionalmente, lo haremos. En la mayoría de los casos, sin embargo, será útil limitar el análisis a dos insumos porque podremos mostrar esos insumos en gráficas bidimensionales. Producto físico marginal Para estudiar la variación en un insumo definiremos el producto físico marginal como sigue. DEFINICIÓN Producto físico marginal. El producto físico marginal de un insumo es la producción adicional que es posible generar usando una unidad más de ese insumo, manteniendo constantes todos los demás. Matemáticamente, q f k, k q producto físico marginal de trabajo PMg l f l . l producto físico marginal de capital PMgk (9.3) Nótese que las definiciones matemáticas del producto marginal usan derivadas parciales, lo cual refleja propiamente el hecho de que el uso de todos los demás insumos se mantiene constante mientras el insumo de interés varía. Por ejemplo, consideremos a un agricultor que contrata a un trabajador más para cosechar el cultivo, pero que mantiene constantes todos los demás insumos. El producto adicional que este trabajador genera es que el producto físico marginal de este peón, medido en cantidades físicas como bushels de trigo, cajas de naranjas o cabezas de lechuga. Podría observarse, por ejemplo, que 50 trabajadores en una granja pueden producir 100 bushels de trigo al año, mientras que 51 trabajadores, con la misma tierra y equipo, pueden producir 102 bushels. El producto físico marginal del trabajador número 51 es entonces de 2 bushels al año. Productividad marginal decreciente Cabría esperar que el producto físico marginal de un insumo dependa de cuánto de ese insumo se use. El trabajo, por ejemplo, no puede añadirse indefinidamente a un campo dado (manteniendo fija la cantidad de equipo, fertilizante, etcétera) sin exhibir finalmente un deterioro en su productividad. Matemáticamente el supuesto de productividad física marginal decreciente es un supuesto sobre las derivadas parciales de segundo orden de la función de producción: PMgk 2f 2 fkk f11 0, k k PMg l 2 f 2 fll f22 0. l l (9.4) El supuesto de productividad marginal decreciente fue originalmente propuesto por el economista del siglo xix, Thomas Malthus, a quien le preocupaba que los rápidos incrementos en la población resultaran en menor productividad laboral. Sus sombrías predicciones para el futuro de la humanidad llevaron a que la economía fuera llamada la “ciencia deprimente”. Pero las matemáticas de la función de producción sugieren que ese pesimismo podría ser erróneo. Variaciones en la productividad marginal del trabajo a lo largo del tiempo dependen no sólo de cómo crece el insumo trabajo, sino también las variaciones en otros insumos como el capital. Es decir, también debe interesarnos PMgl/k f lk. En la mayoría de los casos, f lk 0, así que la productividad laboral decreciente como el incremento tanto de l como de k no es una conclusión precedente. En realidad, parece que la productividad del trabajo ha aumentado significativamente desde tiempos de Malthus, principalmente porque los incrementos en los insumos de capital (junto con mejoras técnicas) han neutralizado el impacto de la productividad marginal decreciente. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción 305 Productividad física media En el uso común el término productividad del trabajo suele significar productividad media. Cuando se dice que cierta industria ha experimentado incrementos de productividad se entiende que su producción por unidad de insumo trabajo se ha incrementado. Aunque el concepto de productividad media no es tan importante en los análisis económicos teóricos como el de productividad marginal, en los análisis empíricos recibe mucha atención. Dado que la productividad media es fácil de medir (digamos, tantos bushels de trigo por insumo de hora-trabajo), a menudo se le usa como medida de eficiencia. Definiremos el producto medio del trabajo (PMel) como PMe l producción q f (k, l) . insumo trabajo l l (9.5) Nótese que PMel también depende del nivel de capital usado. Esta observación resultará importante al examinar la medición de la variación técnica al final de este capítulo. EJEMPLO 9.1 Función de producción con dos insumos Supongamos que la función de producción de matamoscas durante un periodo particular puede representarse con q f(k, l) 600k2l 2 k3l 3. (9.6) Para elaborar las funciones productividad marginal y media del trabajo (l) para esta función, debemos suponer un valor particular para el otro insumo, capital (k). Supóngase que k 10. Entonces, la función de producción está dada por q 60 000l 2 1 000l 3. (9.7) Producto marginal. La función de productividad marginal k 10 está dada por PMg l q 120 000l l 3 000l2 , (9.8) que disminuye al incrementar l, volviéndose finalmente negativa. Esto implica que q llega a un valor máximo. Igualar PMgl con 0, 120 000l 3 000l2 0 (9.9) 40l l 2 (9.10) l 40 (9.11) produce o como el punto en el que q llega a su valor máximo. El insumo trabajo más allá de 40 unidades por periodo en realidad reduce la producción total. Por ejemplo, cuando l 40, la ecuación 9.7 muestra que q 32 millones de matamoscas, mientras que cuando l 50 la producción de matamoscas asciende a sólo 25 millones. Producto medio. Para determinar la productividad media del trabajo en la producción de matamoscas, se divide q entre l, manteniendo todavía k 10: q PMe l 60 000l l Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 1 000l2 . (9.12) 8/23 306 Parte 4: Producción y oferta Nuevamente, esta es una parábola invertida que alcanza su valor máximo cuando PMe l 60 000 l 2 000l 0, (9.13) lo que ocurre cuando l 30. En este valor para el insumo trabajo, la ecuación 9.12 indica que PMel 900 000, y la ecuación 9.8 indica que PMel es también de 900 000. Cuando PMel está en un máximo, las productividades media y marginal del trabajo son iguales.3 Adviértase la relación entre producción total y productividad media que se ilustra en este ejemplo. Aunque la producción total de matamoscas es mayor con 40 trabajadores (32 millones), que con 30 trabajadores (27 millones), la producción por trabajador es más alta en el segundo caso. Con 40 trabajadores cada trabajador produce 800 000 matamoscas por periodo, mientras que con 30 trabajadores cada trabajador produce 900 000. Como el insumo de capital (prensas de matamoscas) se mantiene constante en esta definición de productividad, la productividad marginal decreciente del trabajo finalmente resulta en un nivel declinante de producción por trabajador. PREGUNTA: ¿Cómo afectaría aquí un incremento de k de 10 a 11 a las funciones PMgl y PMel? Explica intuitivamente tus resultados. GRÁFICAS DE ISOCUANTAS Y TASA DE SUSTITUCIÓN TÉCNICA Para ilustrar la posible sustitución de un insumo por otro en una función de producción se usa su gráfica de isocuantas. Estudiaremos de nueva cuenta una función de producción de la forma q f (k, l), en el entendido de que “capital” y “trabajo” son simplemente ejemplos convenientes de dos insumos cualesquiera que podrían ser de interés. Una isocuanta (de iso, que significa “igual”) registra las combinaciones de k y l capaces de generar una cantidad dada de producción. Por ejemplo, todas las combinaciones de k y l en la curva denominada “q 10” en la figura 9.1 son capaces de producir 10 unidades de producción por periodo. Esta isocuanta registra entonces el hecho de que hay muchas formas alternas de generar 10 unidades de producción. Una forma podría estar representada por el punto A: usaríamos lA y kA para generar 10 unidades de producción. O bien, podríamos preferir usar relativamente menos capital y más trabajo y elegir, por tanto, un punto como B. De ahí que una isocuanta pueda definirse como sigue. DEFINICIÓN Isocuanta. Una isocuanta muestra las combinaciones de k y l que pueden generar un nivel dado de producción (digamos q0. Matemáticamente, una isocuanta registra el conjunto de k y l que satisface f(k, l) q0. (9.14) Igual que en el caso de las curvas de indiferencia, existen infinitas isocuantas en el plano k-l . Cada isocuanta representa un nivel diferente de producción. Las isocuantas registran niveles sucesivamente más altos de producción conforme nos movemos en dirección noreste. Presumiblemente, 3 Este resultado es general. Dado que PMe l l l PMgl l2 q , en un máximo l PMgl q o PMgl PMel. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción FIGURA 9.1 Gráfica de isocuantas. 307 Las isocuantas registran las combinaciones alternas de insumos que pueden usarse para generar un nivel dado de producción. La pendiente de estas curvas indica la tasa en que l puede ser sustituida por k, manteniendo constante la producción. La negativa de esta pendiente se llama tasa marginal de sustitución técnica (TMST). En la figura, la TMST es positiva y decreciente para insumos de trabajo crecientes. k por periodo kA A q = 30 q = 20 kB B lA q = 10 lB l por periodo usar más de cada uno de los insumos permitirá incrementar la producción. Otras dos isocuantas (para q 20 y q 30) se muestran en la figura 9.1. Notarás la semejanza entre una gráfica de isocuantas y el mapa de curvas de indiferencia del individuo analizado en la parte 2. Son, en efecto, conceptos similares porque ambos representan mapas de “líneas de nivel” de una función particular. En el caso de las isocuantas, sin embargo, la denominación de las curvas es mensurable; una producción de 10 unidades por periodo tiene un significado cuantificable. Por tanto a los economistas les interesa más estudiar la forma de las funciones de producción que examinar la forma exacta de las funciones de utilidad. Tasa marginal de sustitución técnica (TMST) La pendiente de una isocuanta muestra cómo un insumo puede cambiarse por otro, manteniendo constante la producción. Examinar la pendiente proporciona información sobre la posibilidad técnica de sustituir trabajo por capital. He aquí una definición formal. DEFINICIÓN Tasa marginal de sustitución técnica. La tasa marginal de sustitución técnica (TMST) muestra la tasa en la cual trabajo puede ser sustituido por capital, manteniendo constante la producción a lo largo de una isocuanta. En términos matemáticos, TMST (l para k) dk dl . (9.15) qq0 En esta definición, la notación pretende ser un recordatorio de que la producción debe mantenerse constante al sustituir l por k. El valor particular de esta tasa dependerá no sólo del nivel de producción, sino también de las cantidades de capital y trabajo en uso. Su valor depende del punto en la gráfica de isocuantas en el cual debe medirse la pendiente. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 308 Parte 4: Producción y oferta TMST y productividades marginales Para examinar la forma de las isocuantas de la función producción es útil comprobar el resultado siguiente: la TMST (de l para k) es igual a la razón de la productividad física marginal del trabajo (PMgl) con la productividad física marginal del capital (PMgk). Imagina usar la ecuación 9.14 para graficar la isocuanta q0. Sustituimos una secuencia de valores crecientes de l y vemos cómo k tiene que ajustarse para mantener constante la producción en q0. La gráfica de la isocuanta es en realidad la gráfica de la función implícita k(l) que satisface q0 f (k(l), l). (9.16) Justo como hicimos en la sección sobre funciones contenidas del capítulo 2 (véase en particular la ecuación 2.22), podemos usar la regla de cadena para diferenciar la ecuación 9.16, lo que resulta en 0 fk dk dk fl PMgk PMg l , dl dl (9.17) donde el 0 inicial aparece porque q0 se mantiene constante; así, la derivada del miembro izquierdo de la ecuación 9.16 respecto a l es igual a 0. Reordenar la ecuación 9.17 da TMST (l para k) dk dl qq0 PMg l . PMgk (9.18) De ahí que la TMST esté dada por la razón de las productividades marginales de los insumos. La ecuación 9.18 indica que las isocuantas que realmente observamos deben ser de pendiente negativa. Dado que tanto PMgl como PMgk son no negativas (ninguna empresa elegiría usar un insumo costoso que redujera la producción), la TMST también será positiva (o quizá de cero). Puesto que la pendiente de una isocuanta es la negativa de la TMST cualquier empresa que observemos no operará en la porción de pendiente positiva de una isocuanta. Aunque es matemáticamente posible idear funciones de producción cuyas isocuantas tengan pendientes positivas en algunos puntos, para una empresa no tendría sentido económico optar por esas alternativas de insumos. Razones de una TMST decreciente Las isocuantas de la figura 9.1 se trazan no sólo con una pendiente negativa (como debe ser), sino también como curvas convexas. A lo largo de cualesquiera de las curvas, la TMST es decreciente. Para razones altas de k para l, la TMST es un número positivo grande, lo cual indica que es posible renunciar a gran cantidad de capital si una unidad más de trabajo se vuelve disponible. Por otro lado, cuando ya se usa mucho trabajo, la TMST es baja, lo que significa que sólo una pequeña cantidad de capital puede intercambiarse por una unidad adicional de trabajo, si ha de mantenerse constante la producción. Este supuesto parecería tener cierta relación con el supuesto de productividad marginal decreciente. Un uso apresurado de la ecuación 9.18 podría llevarnos a concluir que un incremento en l acompañado de un decremento en k resultaría en un decremento en PMgl, un incremento en PMgk y, por tanto, un decremento en la TMST. El problema de esta “prueba” rápida es que la productividad marginal de un insumo depende del nivel de ambos insumos; variaciones en l afectan a PMgk y viceversa. No es posible derivar una TMST decreciente únicamente del supuesto de productividad marginal decreciente. Para ver por qué matemáticamente esto es así, supongamos que q f (k, l) y que f k y f l son positivas (es decir, las productividades marginales son positivas). Supóngase también que f kk 0 y f ll 0 (que las productividades marginales son decrecientes). Para demostrar que las isocuantas son convexas, desearemos demostrar que d(TMST)/dl 0. Puesto que TMST f l/f k, tenemos dTMST d( fl /fk ) . dl dl Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 (9.19) 8/23 Capítulo 9: Funciones de producción 309 Debido a que f l y f k son funciones tanto de k como de l debe tenerse cuidado al tomar la derivada de esta expresión: dTMST fk ( fll f lk dk/dl fl ( fkl fkk dk/dl) . dl ( fk ) 2 (9.20) Usando el hecho de que dk/dl f l/f k a lo largo de una isocuanta y el teorema de Young (f kl f lk), tenemos dTMST fk2 fll dl 2fk fl fkl fl2 fkk . ( fk ) 3 (9.21) Debido a que hemos supuesto f k 0, el denominador de esta función es positivo. De ahí que la fracción entera sea negativa, si el numerador es negativo. Como se supone que tanto f ll como f kk son negativas, el numerador definitivamente será negativo si f kl es positiva. Si podemos suponer esto, hemos demostrado que dTMST/dl 0 (que las isocuantas son convexas).4 Importancia de los efectos de productividad cruzada Intuitivamente parece razonable que la derivada parcial cruzada f kl f lk deba ser positiva. Si los trabajadores tuvieran más capital tendrían productividades marginales más altas. Aunque este es probablemente el caso más frecuente, no necesariamente tiene que serlo. Algunas funciones de producción tienen f kl 0, al menos para una gama de valores de insumos. Cuando suponemos una TMST decreciente (como lo haremos a lo largo de la mayor parte de nuestro análisis), establecemos un supuesto más firme que el de productividades marginales simplemente decrecientes para cada insumo; específicamente, suponemos que las productividades marginales disminuyen “lo bastante rápido” para compensar cualquier posible efecto negativo de productividad cruzada. Desde luego que, como veremos más adelante, con tres o más insumos las cosas se complican un poco más. EJEMPLO 9.2 TMST decreciente En el ejemplo 9.1 la función producción de matamoscas fue dada por q f(k, l) 600k2l 2 k3l3. (9.22) Las funciones generales de productividad marginal para esta función de producción son q 1 200k2 l 3k3 l2 , l q PMg k fk 1 200kl2 3k2 l3 . k PMgl fl (9.23) Nótese que cada una de estas depende de los valores de ambos insumos. Simple factorización indica que estas productividades marginales serán positivas para valores de k y l para los cuales kl 400. Dado que f ll 1 200k2 6k3l y f kk 1 200l 2 6kl3, (9.24) está claro que esta función exhibe productividades marginales decrecientes para valores suficientemente grandes de k y l. En efecto, factorizando de nuevo cada expresión es fácil demostrar que f ll, f kk 0 si 4 Como se señaló en el capítulo 2, las funciones para las cuales el numerador en la ecuación 9.21 es negativo se llaman funciones (estrictamente) cuasi cóncavas. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 310 Parte 4: Producción y oferta kl 200. Sin embargo, aun dentro del rango 200 kl 400 donde las relaciones de productividad marginal para esta función se comportan “normalmente”, esta función de producción podría no tener necesariamente una TMST decreciente. La diferenciación cruzada de cualesquiera de las funciones de productividad marginal (ecuación 9.23) produce f kl f lk 2 400kl 9k2l2, (9.25) la cual es positiva sólo para kl 266. Por tanto el numerador de la ecuación 9.21 definitivamente será negativo para 200 kl 266, pero para fábricas de matamoscas de mayor escala el caso no es tan claro porque f kl es negativa. Cuando f kl es negativa, los incrementos en el insumo de trabajo reducen la productividad marginal del capital. De ahí que sea incorrecto el argumento intuitivo de que el supuesto de productividades marginales decrecientes produce una predicción inequívoca acerca de lo que pasará con la TMST ( f l/f k) al incrementarse l y decrecer k. Todo depende de los efectos relativos en las productividades marginales de las productividades marginales decrecientes (que tienden a reducir f l e incrementar f k) y los efectos contrarios de las productividades marginales cruzadas (que tienden a incrementar f l y a reducir f k). Aun así, para este caso de los matamoscas, es cierto que la TMST es decreciente a todo lo largo de la gama de k y l donde las productividades marginales son positivas. Para casos en los que 266 kl 400, las productividades marginales decrecientes exhibidas por la función son suficientes para superar la influencia de un valor negativo de f kl en la convexidad de las isocuantas. PREGUNTAS: Para casos en los que k l , ¿qué puede decirse de las productividades marginales de esta función de producción? ¿Cómo simplificaría esto el numerador de la ecuación 9.21? ¿Cómo te permite esto evaluar más fácilmente esta expresión para algunos valores más grandes de k y l? RENDIMIENTOS A ESCALA Ahora procederemos a caracterizar las funciones de producción. Una primera pregunta que podría hacerse sobre estas es cómo responde la producción a incrementos en todos los insumos juntos. Por ejemplo, supongamos que todos los insumos se duplican: ¿la producción se duplicaría o la relación no sería tan simple? Esta es una pregunta de los rendimientos a escala exhibidos por la función de producción que han interesado a los economistas desde que Adam Smith estudió intensivamente la producción de alfileres. Smith identificó dos fuerzas que entraban en operación cuando el experimento conceptual de duplicar todos los insumos se llevaba a cabo. Primero, una duplicación de la escala permite una mayor división del trabajo y especialización de funciones. De ahí que haya cierta presunción de que la eficiencia puede aumentar; la producción podría más que duplicarse. Segundo, la duplicación de los insumos también supone cierta pérdida de eficiencia porque la supervisión gerencial puede dificultarse, dada la mayor escala de la empresa. Cuál de estas dos tendencias tendrá mayor efecto, es una importante pregunta empírica. Estos conceptos pueden definirse técnicamente como sigue: DEFINICIÓN Rendimientos a escala. Si la función de producción está dada por q f (k, l)y si todos los insumos se multiplican por la misma constante positiva t (donde t 1), los rendimientos a escala de la función de producción se clasifican como Efecto en la producción Rendimientos a escala f(tk, tl) tf (k, l) tq f(tk, tl) tf (k, l) tq f(tk, tl) tf (k, l) tq Constantes Decrecientes Crecientes Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción 311 En términos intuitivos, si un incremento proporcional en insumos aumenta la producción en la misma proporción la función de producción exhibe rendimientos constantes a escala. Si la producción se incrementa menos que proporcionalmente, la función exhibe rendimientos decrecientes a escala. Y si la producción se incrementa más que proporcionalmente, hay rendimientos crecientes a escala. Como veremos, es teóricamente posible que una función exhiba rendimientos constantes a escala, en algunos niveles de uso de insumos y rendimientos crecientes o decrecientes en otros niveles.5 A menudo, sin embargo, los economistas se refieren a los rendimientos a escala de una función de producción con el entendido implícito de que sólo se toman en cuenta un muy estrecho rango de variación en uso de insumos y el nivel asociado de producción. Rendimientos constantes a escala Existen razones económicas por las cuales la función de producción de una empresa puede exhibir rendimientos constantes a escala. Si la empresa opera muchas plantas idénticas, podría aumentar o disminuir su producción simplemente variando el número de ellas en operación corriente. Es decir, la empresa puede duplicar la producción duplicando el número de plantas que opera, y para eso requerirá emplear precisamente el doble de insumos. Estudios empíricos de funciones de producción suelen determinar que los rendimientos a escala son más o menos constantes para las empresas estudiadas (al menos alrededor de producciones cercanas a los niveles de operación establecidos de las empresas; estas pueden exhibir rendimientos crecientes a escala mientras crecen a su tamaño establecido). Por todas estas razones, el caso de rendimientos constantes a escala es digno de ser examinado con mayor detalle. Cuando una función de producción exhibe rendimientos constantes a escala, satisface la definición de “homogeneidad” que se presenta en el capítulo 2. Es decir, la producción es homogénea de grado 1 en sus insumos porque f (tk, tl) t1f(k, l) tq. (9.26) En el capítulo 2 se demostró que, si una función es homogénea de grado k, sus derivadas son homogéneas de grado k l. En este contexto lo anterior implica que las funciones de productividad marginal derivadas de una función de producción de rendimientos constantes a escala son homogéneas de grado 0. Es decir, f (k, l) f (tk, tl) , k k f (k, l) f (tk, tl) PMg l l l PMg k (9.27) para cualquier t 0. En particular, puede concederse que t 1/l en las ecuaciones 9.27 y obtener f (k/l, 1) , k f (k/l, 1) PMg l . l PMg k (9.28) Esto es, la productividad marginal de cualquier insumo sólo depende de la razón de capital con el insumo de trabajo, no de los niveles absolutos de estos insumos. Este hecho es especialmente importante, por ejemplo, para explicar las diferencias en productividad entre industrias o países. 5 Una medida local de los rendimientos a escala es provista por la elasticidad de escala, definida como eq, t f (tk, tl) t t , f (tk, tl) donde esta expresión se debe evaluar en t 1. En principio este parámetro puede adoptar diferentes valores, dependiendo del nivel de uso de los insumos. Para algunos ejemplos con el uso de este concepto, véase el problema 9.9. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 312 Parte 4: Producción y oferta Funciones de producción homotéticas Una consecuencia de las ecuaciones 9.28 es que la TMST (PMgl/PMgk) de cualquier función de producción con rendimientos constantes a escala sólo dependerá de la razón de los insumos, no de sus niveles absolutos. Es decir, dicha función será homotética (véase el capítulo 2); sus isocuantas serán expansiones radiales unas de otras. Esta situación se muestra en la figura 9.2. A lo largo de cualquier radio a través del origen (donde la razón k/l no cambia), las pendientes de isocuantas sucesivamente más altas son idénticas. Esta propiedad de la gráfica de isocuantas nos será útil en diversas ocasiones. Un simple ejemplo numérico puede brindar cierta intuición sobre este resultado. Supongamos que un gran pedido de pan (consistente en, digamos, 200 hogazas) puede surtirse en un día con tres panaderos trabajando en tres hornos, o con dos panaderos trabajando en cuatro hornos. Por tanto la TMST de los hornos por panaderos es de uno a uno: un horno adicional puede sustituir a un panadero. Si este proceso de producción exhibe rendimientos constantes a escala, dos pedidos grandes de pan (por un total de 400 hogazas) puede surtirse en un día, ya sea con seis panaderos trabajando en seis hornos, o con cuatro panaderos y ocho hornos. En este último caso, dos hornos sustituyen a dos panaderos, así que nuevamente la TMST es de uno a uno. En casos de rendimientos constantes a escala, elevar el nivel de producción no altera las disyuntivas entre insumos; así, las funciones de producción son homotéticas. Una función de producción puede tener un mapa de curvas de indiferencia homotéticas aun si no exhibe rendimientos constantes a escala. Como se mostró en el capítulo 2 esta propiedad de homotecia es retenida por cualquier transformación monótona de una función homogénea. De ahí que los rendimientos crecientes o decrecientes a escala puedan incorporarse en una función de rendimientos constantes a escala mediante una transformación apropiada. Quizá la más FIGURA 9.2 Gráfica de isocuantas de una función de producción de rendimientos constantes a escala. Dado que una función de producción de rendimientos constantes a escala es homotética, la TMST sólo depende de la razón de k con l, no de la escala de producción. En consecuencia, a lo largo de cualquier radio a través del origen (un radio de k/l constante), la TMST será la misma en todas las isocuantas. Un rasgo adicional es que las etiquetas de las isocuantas se incrementan proporcionalmente con los insumos. k por periodo q=3 q=2 q=1 l por periodo Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción 313 común de estas transformaciones sea la exponencial. Por tanto si f (k, l) es una función de producción con rendimientos constantes a escala, puede concederse que F(k, l) = [f(k, l)] , donde es cualquier exponente positivo. Si (9.29) 1, entonces F(tk, tl) [f (tk, tl)] [tf (k, l)] t [f (k, l)] t F(k, l) tF(k, l) (9.30) para cualquier t 1. De ahí que esta función de producción transformada exhiba rendimientos crecientes a escala. El exponente recoge el grado de los rendimientos crecientes a escala. Una duplicación de insumos llevaría a un incremento de cuatro veces en la producción si 2, pero a un incremento de ocho veces si 3. Una prueba idéntica demuestra que la función F exhibe rendimientos decrecientes a escala para 1. Como esta función sigue siendo homotética en todas esas transformaciones, hemos demostrado que hay casos importantes en los que la cuestión de los rendimientos a escala puede separarse de cuestiones contenidas con la forma de una isocuanta. En estos casos, las variaciones en los rendimientos a escala sólo cambiarán las etiquetas de las isocuantas, no su forma. En la sección siguiente se examinará cómo pueden describirse las formas de las isocuantas. El caso de n insumos La definición de los rendimientos a escala puede generalizarse fácilmente a una función de producción con n insumos. Si esa función de producción está dada por q f (x1, x2, . . . , xn) (9.31) y si todos los insumos se multiplican por t 1, tenemos f (tx1, tx2, . . . , txn) tkf(x1, x2, . . . , xn) tkq (9.32) para alguna constante k. Si k 1, la función de producción exhibe rendimientos constantes a escala. Rendimientos decrecientes y crecientes a escala corresponden a los casos k 1 y k 1, respectivamente. La parte crucial de esta definición matemática es el requerimiento de que todos los insumos aumenten en la misma proporción, t. En muchos procesos de producción de la realidad, esta disposición podría tener poco sentido económico. Por ejemplo, una empresa podría tener sólo un “jefe”, y ese número no necesariamente se duplicaría aun si todos los demás insumos lo hicieran. O bien, la producción de una granja podría depender de la fertilidad de la tierra. Podría no ser literalmente posible duplicar los acres sembrados y mantener al mismo tiempo la fertilidad, porque la nueva tierra podría no ser tan buena como la que ya está cultivada. De ahí que algunos insumos tengan que fijarse (o al menos ser imperfectamente variables) para casi todos los efectos prácticos. En esos casos parece probable algún grado de productividad decreciente (resultado del empleo creciente de insumos variables), aunque esto no puede llamarse propiamente “rendimientos decrecientes a escala”, debido a la presencia de insumos que se mantienen fijos. ELASTICIDAD DE SUSTITUCIÓN Otra característica importante de la función de producción es qué tan “fácil” es sustituir un insumo por otro. Esta es una pregunta sobre la forma de una isocuanta, más que sobre la gráfica completa de isocuantas. A lo largo de una isocuanta la tasa marginal de sustitución técnica decrecerá al decrecer la razón capital-trabajo (es decir, al decrecer k/l): ahora deseamos definir algún parámetro que mida este grado de sensibilidad. Si la TMST no varía en absoluto para variaciones en k/l, podría decirse que la sustitución es fácil porque la razón de las productividades marginales de los dos insumos no varía al cambiar la mezcla de insumos. O bien, si la TMST varía rápidamente respecto a pequeñas varaciones en k/l, diríamos que la sustitución es difícil porque las Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 314 Parte 4: Producción y oferta variaciones pequeñas en la mezcla de insumos tendrán un efecto sustancial en las productividades relativas de los insumos. Una medida sin escala de esta sensibilidad es provista por la elasticidad de sustitución, concepto que encontramos informalmente en nuestro análisis de las funciones de utilidad ESC. Aquí trabajaremos en el suministro de una definición más formal. Para variaciones discretas la elasticidad de sustitución está dada por porcentaje de ( k /l) (k/l) porcentaje de TMST k /l TMST TMST (k/l) TMST . TMST (k/l) (9.33) Más a menudo nos interesará considerar pequeñas variaciones; Por tanto una modificación de la ecuación 9.33 será de más interés: d(k/l) TMST d ln(k /l) . d TMST k/l d ln TMST (9.34) La expresión logarítmica se desprende de derivaciones matemáticas a lo largo de las líneas del ejemplo 2.2 del capítulo 2. Todas estas ecuaciones pueden reunirse en la definición formal siguiente. DEFINICIÓN Elasticidad de sustitución. Para la función de producción q f(k, l), la elasticidad de sustitución ( ) mide la variación proporcional en k/l en relación con la variación proporcional en la TMST a lo largo de una isocuanta. Es decir. porcentaje de (k /l) d(k /l) TMST d ln(k /l) d ln(k /l) . porcentaje de TMST d TMST k /l d ln TMST d ln( fl /fk ) (9.35) Puesto que a lo largo de una isocuanta k/l y TMST se mueven en la misma dirección, el valor de siempre es positivo. Gráficamente, este concepto se ilustra en la figura 9.3 como un movimiento del punto A al punto B en una isocuanta. En este movimiento, tanto la TMST como la razón k/l cambiarán; nos interesa la magnitud relativa de estas variaciones. Si es alta, la TMST no variará mucho en relación con k/l y la isocuanta estará cerca de ser lineal. Por otro lado, un bajo valor de implica una isocuanta más bien marcadamente curva; la TMST variará en una cantidad sustancial al cambiar k/l. En general, es posible que la elasticidad de sustitución varíe conforme uno se mueve a lo largo de una isocuanta, y conforme a la variación en la escala de producción. Sin embargo, con frecuencia es conveniente suponer que es constante a lo largo de una isocuanta. Si la función de producción también es homotética, entonces —dado que todas las isocuantas son meramente extensiones radiales— será la misma a lo largo de todas las isocuantas. Encontraremos tales funciones más adelante, y en muchos de los problemas al final de este capítulo.6 El caso de n insumos Generalizar la elasticidad de sustitución al caso de muchos insumos puede plantear varias complicaciones. Un método es adoptar una definición análoga a la ecuación 9.35; es decir, definir la 6 La elasticidad de sustitución puede formularse directamente en términos de la función de producción y sus derivadas en el caso de los rendimientos constantes a escala, como fk fl f fk, l Pero esta forma es complicada. De ahí que por lo general la definición logarítmica de la ecuación 9.35 sea la más fácil de aplicar. Para un breve resumen, véase P. Berck y K. Sydsaeter, Economist’s Mathematical Manual (Springer-Verlag, Berlín, 1999), cap. 5. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción 315 Al pasar del punto A al punto B en la isocuanta q q0, tanto la razón capital-trabajo (k/l) como la TMST cambiarán. La elasticidad de sustitución ( ) se define como la razón de estas variaciones proporcionales; es una medida de cuán curvada es la isocuanta. FIGURA 9.3 Descripción gráfica de la elasticidad de sustitución. k por periodo A TMSTA TMSTB B q = q0 (k /l ) A (k /l ) B l por periodo elasticidad de sustitución entre dos insumos como la variación proporcional en la razón de ambos insumos con la variación proporcional en la TMST entre ellos, manteniendo constante la producción.7 Para completar esta definición es necesario requerir que todos los insumos que no sean los dos bajo examen se mantengan constantes. Sin embargo, este último requisito (que no es relevante cuando hay sólo dos insumos) restringe el valor de esta definición potencial. En procesos de producción de la realidad es probable que cualquier variación en la razón de dos insumos también sea acompañado por variaciones en los niveles de otros insumos. Algunos de estos otros insumos podrían ser complementarios con aquellos que varían, mientras que otros podrían ser sustitutos, y mantenerlos constantes crea una restricción más bien artificial. Por esta razón una definición alterna de la elasticidad de sustitución que permita tal complementariedad y sustitución en la función de costo de la empresa se usa generalmente en el caso de n bienes. Dado que este concepto suele medirse usando funciones de costo, lo describiremos en el capítulo siguiente. 7 Esto es, la elasticidad de sustitución entre el insumo i y el insumo j podría definirse como ij ln(xi /xj ) ln( fj /fi ) para movimientos a lo largo de f(x1, x2, . . ., xn) q0. Nótese que el uso de derivadas parciales en esta definición requiere, en efecto, que todos los insumos que no sean i ni j se mantengan constantes cuando se consideran movimientos a lo largo de la isocuanta q0. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 316 Parte 4: Producción y oferta CUATRO FUNCIONES DE PRODUCCIÓN SIMPLES En esta sección se ilustrarán cuatro funciones de producción simples, cada una de las cuales está caracterizada por una elasticidad de sustitución diferente. Estas se muestran sólo para el caso de dos insumos, pero la generalización a muchos insumos es fácil de hacer (véanse las extensiones de este capítulo). Caso 1: ( ⴝ ⴥ) lineal Supongamos que la función de producción está dada por q f (k, l) k l. (9.36) Es fácil demostrar que esta función de producción exhibe rendimientos constantes a escala. Para cualquier t 1, f(tk, tl) tk tl t( k l) tf (k, l). (9.37) Todas las isocuantas de esta función de producción son líneas rectas paralelas con pendiente / . En la figura 9.4a se muestra una gráfica de isocuantas de este tipo. Puesto que la TMST es constante a lo largo de cualquier isocuanta en línea recta, el denominador en la definición de (ecuación 9.35) es igual a 0, y de ahí que sea infinita. Aunque esta función de producción lineal es un ejemplo útil es raro encontrarla en la práctica porque pocos procesos de producción se caracterizan por tal facilidad de sustitución. En realidad, en este caso, capital y trabajo pueden concebirse como sustitutos perfectos entre sí. Una industria caracterizada por tal función de producción podría usar sólo capital o sólo trabajo, dependiendo de los precios de estos insumos. Es difícil imaginar un proceso de producción así; toda máquina precisa de alguien que apriete sus botones, y todo trabajador requiere algo de equipo de capital, por modesto que sea. Caso 2: ( ⴝ 0) de proporciones fijas Las funciones de producción caracterizadas por 0 tienen isocuantas en forma de L como las que aparecen en la figura 9.4b. En la esquina de una isocuanta en forma de L, un incremento despreciable en k/l causa un incremento infinito en TMST, porque ahí la isocuanta varía repentinamente de horizontal a vertical. Sustituir 0 por la variación en TMST en el numerador de la fórmula para en la ecuación 9.33 y el infinito por la variación en TMST en el denominador contenido que 0. Una empresa operaría siempre en la esquina de una isocuanta. Operar en cualquier otra parte es ineficiente porque la misma producción podría generarse con menos insumos desplazándose a lo largo de la isocuanta hacia la esquina. Como se advierte en la figura 9.4, todas las esquinas de las isocuantas se ubican a lo largo del mismo radio desde el origen. Esto ilustra el importante caso especial de una función de producción de proporciones fijas. Como la empresa opera siempre en la esquina de alguna isocuanta, y como todas las isocuantas están formadas a lo largo del mismo radio, debe ser el caso de que la empresa use insumos en las proporciones fijas dadas por la pendiente de ese rayo independientemente de cuánto produzca.8 Los insumos son complementos perfectos en el sentido de que, a partir de la proporción fija, un incremento en un insumo es inútil a menos que el otro se incremente también. La forma matemática de la función de producción de proporciones fijas está dada por q min( k, l), , 0, (9.38) donde el operador “min” significa que q está dada por el menor de los dos valores entre paréntesis. Por ejemplo, supongamos que k l; entonces q k y podemos decir que el capital es la resFunciones de producción con 0 no necesitan ser de proporciones fijas. La otra posibilidad es que las esquinas de las isocuantas se ubiquen a lo largo de una curva no lineal desde el origen, más que alinearse a lo largo de un radio. 8 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción FIGURA 9.4 Gráficas de isocuantas de funciones de producción simples con varios valores de . 317 En estas figuras se ilustran tres posibles valores de la elasticidad de sustitución. En a) capital y trabajo son sustitutos perfectos. En este caso, la TMST no cambiará al variar la razón capital-trabajo. En b), el caso de proporciones fijas, no es posible ninguna sustitución. La razón capital-trabajo está fija en / . Un caso de sustitución limitada se ilustra en c). k por periodo k por periodo σ=∞ σ=0 −β Pendiente = __ α q__3 α q1 q2 q3 q2 q3 q1 l por periodo (a) (b) q__3 β l por periodo k por periodo σ=1 q3 q2 q1 l por periodo (c) tricción vinculante en este proceso de producción. El empleo de más trabajo no incrementará la producción, y de ahí que el producto marginal del trabajo sea de cero; trabajo adicional es superfluo en este caso. De igual forma, si k l, entonces el trabajo es la restricción vinculante de la producción, y el capital adicional es superfluo. Cuando k l, ambos insumos son completamente utilizados. Cuando esto sucede, k/l / , y la producción tiene lugar en un vértice en la gráfica de isocuantas. Si ambos insumos son costosos, este es el único lugar de minimización de costos en el cual operar. El locus de todos esos vértices es una línea recta a través del origen con pendiente dada por / .9 9 Con la forma reflejada por la ecuación 9.38 la función de producción de proporciones fijas exhibe rendimientos constantes a escala porque f(tk, tl) min( tk, tl) t min( k, l) tf(k, l) para cualquier t 1. Como antes, rendimientos crecientes o decrecientes pueden ser fáciles de incorporar en las funciones, usando una transformación no lineal de esta forma funcional, como [f(k, l)] , donde puede ser mayor o menor que 1. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 318 Parte 4: Producción y oferta La función de producción de proporciones fijas tiene una amplia gama de aplicaciones. Muchas máquinas, por ejemplo, requieren que cierto número de individuos las operen, pero todo trabajo excedente es superfluo. Consideremos la combinación de capital (una podadora de pasto) y trabajo para podar un jardín. Siempre se necesitará un individuo que opere la podadora, y cualquiera de estos insumos sin el otro no podrá producir nada en absoluto. Puede ser que muchas máquinas sean de este tipo y requieran un complemento fijo de trabajadores por máquina.10 Caso 3: ( ⴝ 1) Cobb-Douglas La función de producción para la cual ( 1), llamada función de producción Cobb-Douglas,11 ofrece un punto medio entre los dos casos polares previamente analizados. Las isocuantas para el caso de la función Cobb-Douglas tienen la forma convexa “normal” y se muestran en la figura 9.4c. La forma matemática de la función de producción Cobb-Douglas está dada por q f (k, l) Ak l, (9.39) donde y son todas constantes positivas. La función Cobb-Douglas puede exhibir cualquier grado de rendimientos a escala, dependiendo de los valores de y . Supóngase que todos los insumos aumentaran en un factor de t. Por tanto f (tk, tl ) A(tk) (tl ) At t k l (k, l ). (9.40) De ahí que si 1, la función Cobb-Douglas exhibe rendimientos constantes a escala porque la producción también se incrementa por un factor de t. Si 1, la función exhibe rendimientos crecientes a escala, mientras que 1 corresponde al caso de los rendimientos decrecientes a escala. Todo se reduce a mostrar que la elasticidad de sustitución es de 1 para la función Cobb-Douglas.12 Este hecho ha llevado a los investigadores a usar la versión de rendimientos constantes a escala de esta función para una descripción general de relaciones de producción agregada en muchos países. La función Cobb-Douglas también ha demostrado ser útil en muchas aplicaciones, porque es lineal en logaritmos: ln q ln A ln k ln l. (9.41) La constante es entonces la elasticidad de producción respecto al insumo de capital, y es la elasticidad de producción respecto al insumo de trabajo.13 A veces estas constantes pueden esti10 El ejemplo de la podadora de pasto señala otra posibilidad, sin embargo. Presumiblemente, hay cierto margen al elegir qué tamaño de podadora comprar. De ahí que antes de la compra real, la razón capital-trabajo en el corte de pasto pueda considerarse variable: cualquier dispositivo puede elegirse, desde un par de tijeras hasta una podadora enorme. Una vez adquirida la podadora, sin embargo, la razón capital-trabajo se vuelve fija. 11 Así llamada en honor de C. W. Cobb y P. H. Douglas. Véase P. H. Douglas, The Theory of Wages (Macmillan Co., Nueva York, 1934), pp. 132-135. 12 Para la función Cobb-Douglas, TMST fl Ak l 1 k fk Ak 1 l l o ln TMST ln(/ ) ln(k/l). De ahí que 13 ln k /l 1. ln TMST Véase el problema 9.5. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción 319 marse a partir de datos reales, y tales estimaciones pueden usarse para medir rendimientos a escala (examinando la suma ) y para otros propósitos. Caso 4: Función de producción ESC Una forma funcional que incorpora los tres casos anteriores y permite que adopte también otros valores es la función de producción de elasticidad de sustitución constante (ESC), originalmente presentada por Arrow et al., en 1961.14 Esta función está dada por q f (k, l) [k l] / (9.42) para 1, 0 y 0. Esta función se parece mucho a la función de utilidad esc que se analizó en el capítulo 3, aunque ahora hemos añadido el exponente / para permitir la introducción explícita de factores de rendimientos a escala. Para 1 la función exhibe rendimientos crecientes a escala, mientras que para 1 exhibe rendimientos decrecientes. La aplicación directa de la definición de a esta función15 da el importante resultado de que 1 (9.43) . 1 De ahí que las proporciones lineales fijas y los casos de la función Cobb-Douglas correspondan a 1, y 0, respectivamente. La prueba de este resultado para los casos de proporciones fijas y de la función Cobb-Douglas requiere un argumento límite. A menudo la función ESC se usa con una ponderación distributiva, (0 1), para indicar la significación relativa de los insumos: q f (k, l) [ k (1 )l] /. (9.44) Con rendimientos constantes a escala y 0, esta función converge a la forma de la función Cobb-Douglas q f (k, l) k l1 . (9.45) EJEMPLO 9.3 Función de producción de Leontief generalizada Supóngase que la función de producción de un bien está dada por k . l. q f(k, l) k l 2冑苴 (9.46) 14 K. J. Arrow, H. B, Chenery, B. S. Minhas y R. M. Solow, “Capital-Labor Substitution and Economic Efficiency”, Review of Economics and Statistics (agosto de 1961), pp. 225-250. 15 Para la función ESC tenemos TMST fl ( / fk ( / q( q( )/ )/ l k 1 1 l k 1 k l 1 . Aplicar la definición de la elasticidad de sustitución produce entonces ln (k /l) ln TMST 1 1 . Adviértase en este cálculo que el factor cancela las funciones de productividad marginal, garantizando por tanto que estas productividades marginales sean positivas aun si es negativa (como lo es en muchos casos). Esto explica por qué aparece en dos lugares diferentes en la definición de la función ESC. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 320 Parte 4: Producción y oferta Esta función es un caso especial de una clase de funciones llamada así en honor del economista rusoestadounidense Wassily Leontief.16 La función exhibe claramente rendimientos constantes a escala porque f (tk, tl ) tk tl 2t 冑苴 kl tf (k, l ). (9.47) Las productividades marginales de la función de Leontief son fk 1 (k /l ) 0.5 , (9.48) 0.5 fl 1 (k /l ) . De ahí que las productividades marginales sean positivas y decrecientes. Como era de esperar (ya que su función exhibe rendimientos constantes a escala), la TMST aquí sólo depende de la razón de los dos insumos TMST fl 1 (k /l ) 0.5 . fk 1 (k /l ) 0.5 (9.49) La TMST disminuye al reducirse k/l, así que las isocuantas tienen la forma convexa usual. Hay dos maneras en las que puedes calcular la elasticidad de sustitución para esta función de producción. Primero, puedes advertir que en este caso especial la función puede factorizarse como q k l 2冑苴 kl ( 冑苴k l ) 2 (k0.5 l 0.5 ) 2 , (9.50) lo que deja en claro que esta función tiene una forma ESC con 0.5 y 1. De ahí que la elasticidad de sustitución aquí sea 1/(1 ) 2. Desde luego que en la mayoría de los casos no es posible hacer una factorización tan simple. Un enfoque más exhaustivo es aplicar la definición de la elasticidad de sustitución dada en la nota 6 de este capítulo: fk fl [1 (k /l) 0.5 ][1 (k /l) f fk l q 0.5 /冑苴 kl ) 2 (k /l) 0.5 (k /l) 0.5 1 0.5(k /l) 0.5 0.5(k /l ) 0.5 0.5 ] (9.51) 2. Obsérvese que en este cálculo la razón de insumos (k/l) se elimina, dejando un resultado simple. En otras aplicaciones, uno podría dudar de que ocurra un resultado tan fortuito, y de ahí que se dude de que la elasticidad de sustitución sea constante a lo largo de una isocuanta (véase problema 9.7). Pero aquí el resultado de que 2 es intuitivamente razonable, porque ese valor representa un arreglo entre la elasticidad de sustitución de la parte lineal de esta función de producción (q k l, ) y su parte de la función Cobb-Douglas (q 2k0.5l 0.5, 1). PREGUNTAS: ¿Qué puedes saber de esta función de producción graficando la isocuanta q 4? ¿Por qué esta función generaliza el caso de proporciones fijas? PROGRESO TÉCNICO Los métodos de producción mejoran al paso del tiempo, y es importante poder recoger estas mejoras con el concepto de función de producción. Una visión simplificada de ese progreso se ofrece en la figura 9.5. Inicialmente, la isocuanta q0 registra las combinaciones de capital y trabajo que pueden usarse para generar un nivel de producción de q0. Como resultado del desarrollo de técnicas de producción superiores, esta isocuanta se desplaza a q0. Ahora el mismo nivel de pro16 Leontief fue pionero en el desarrollo del análisis de insumos-productos. En este se supone que la producción tiene lugar con una tecnología de proporciones fijas. La función de producción de Leontief generaliza el caso de las proporciones fijas. Para más detalles véase el análisis de las funciones de producción de Leontief en las extensiones de este capítulo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción FIGURA 9.5 Progreso técnico. 321 El progreso técnico desplaza la isocuanta q0 hacia el origen. La nueva isocuanta q0, q0, indica que un nivel dado de producción puede generarse ahora con menos insumos. Por ejemplo, con k1 unidades de capital ahora sólo se necesitan l1 unidades de trabajo para generar q0, mientras que antes del avance técnico se necesitaban l2 unidades de trabajo. k por periodo k2 k1 q0 q′0 l1 l2 l por periodo ducción puede generarse con menos insumos. Una forma de medir esta mejora es fijarse en que con un nivel de insumo de capital de, digamos, k1, antes se necesitaban l2 unidades de trabajo para producir q0, mientras que ahora sólo se necesita l1. La producción por trabajador ha aumentado de q0/l2 a q0/l1. Pero debe tenerse cuidado en este tipo de cálculo. Un incremento en el insumo de capital a k2 también habría permitido una reducción en el insumo de trabajo a l1 a lo largo de la isocuanta original q0. En este caso, la producción por trabajador se incrementará igualmente, aunque no haya habido ningún progreso técnico verdadero. El uso del concepto de la función de producción puede ayudar a diferenciar entre estos dos conceptos y permitir, por tanto, a los economistas obtener una estimación atinada de la tasa de variación técnica. Medición del progreso técnico La primera observación por hacer acerca del progreso técnico es que, históricamente, la tasa de crecimiento de la producción en el tiempo ha excedido la tasa de crecimiento atribuible al crecimiento en insumos convencionalmente definidos. Supongamos que concedemos que q A(t)f (k, l) (9.52) es la función de producción de un bien (o quizá de la producción de una sociedad en su conjunto). El término A(t) en la función representa todas las influencias que intervienen en la determinación de una q diferente de k (horas-maquinaria) y l (horas-trabajo). Variaciones en A a lo largo del tiempo representan progreso técnico. Por esta razón, A se muestra como una función de tiempo. Presumiblemente, dA/dt 0; niveles particulares de insumos de trabajo y capital se vuelven más productivos con el paso del tiempo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 322 Parte 4: Producción y oferta Contabilidad del crecimiento Diferenciar la ecuación 9.52 respecto al tiempo da dq dA df (k, l) f (k, l) A dt dt dt dA q q f dk f dl . dt A f (k, l) k dt l dt (9.53) dq/dt dA/dt f/ k dk f/ l dl q A f (k, l ) dt f (k, l ) dt (9.54) dq/ dt dA/dt f k dk/dt f l dl /dt . q A k l k f (k, l ) l f (k, l ) (9.55) Dividir entre q da o Ahora, para cualquier variable x, (dx/dt)/x es la tasa proporcional de crecimiento de x por unidad de tiempo. Denotaremos esto con Gx.17 De ahí que la ecuación 9.55 pueda escribirse en términos de tasas de crecimiento como Gq GA f k f l Gk Gt . k f (k, l ) l f (k, l ) (9.56) Pero f k q k elasticidad de producción respecto al capital eq, k k f (k, l ) k q (9.57) f l q l elasticidad de producción respecto al trabajo eq, l . l f (k, l ) l q (9.58) y Así, nuestra ecuación de crecimiento se convierte por fin en Gq GA eq, k Gk eq, l Gl . (9.59) Esto indica que la tasa de crecimiento de la producción puede desintegrarse en la suma de dos componentes: crecimiento atribuido a variaciones en los insumos (k y l) y otro crecimiento “residual” (es decir, variaciones en A) que representa progreso técnico. La ecuación 9.59 brinda una manera de estimar la importancia relativa del progreso técnico (GA) en la determinación del crecimiento de la producción. Por ejemplo, en un estudio pionero de la economía estadounidense en general, entre 1909 y 1949, R. M. Solow registró los valores siguientes para los términos de esa ecuación:18 Gq 2.75 por ciento anual, Gl 1.00 por ciento anual, Gk 1.75 por ciento anual, (9.60) eq, l 0.65, eq, k 0.35. Dos rasgos útiles de esta definición son: 1) Gx y Gx Gy; es decir, la tasa de crecimiento de un producto de dos variables es la suma de las tasas de crecimiento de cada uno; y 2) Gx/y Gx Gy. 17 18 R. M. Solow, “Technical Progress and the Aggregate Production Function”, Review of Economics and Statistics, núm. 39 (agosto de 1959), pp. 312-320. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción 323 En consecuencia, GA Gq eq, l Gl eq, k Gk 2.75 0.65(1.00 0.35(1.75) 2.75 0.65 0.60 (9.61) 1.50. La conclusión a la que llegó Solow fue que la tecnología avanzó a una tasa de 1.5 por ciento al año, de 1909 a 1949. Más de la mitad del crecimiento en producción real podría atribuirse a la variación técnica más que al crecimiento en las cantidades físicas de los factores de producción. Evidencias más recientes han tendido a confirmar las conclusiones de Solow sobre la importancia relativa de la variación técnica. Sin embargo, impera la incertidumbre respecto a las causas precisas de esa variación. EJEMPLO 9.4 Progreso técnico en la función de producción Cobb-Douglas La función de producción Cobb-Douglas brinda una vía especialmente fácil para ilustrar el progreso técnico. Suponiendo rendimientos constantes a escala, dicha función de producción con progreso técnico podría representarse mediante q A(t)f (k, l ) A(t)k l1 . (9.62) Si se supone asimismo que el progreso técnico ocurre a una exponencial constante (), puede escribirse A(t) Aet, y la función de producción se convierte en q Aet k l1 . (9.63) Una forma particularmente fácil de estudiar las propiedades de este tipo de función en el tiempo es usar “diferenciación logarítmica”: ln q ln q q q/ t [ln A t ln k (1 ) ln l Gq t t q t q ln k ln l )Gl . (1 Gk (1 t t (9.64) Por tanto, esta derivación simplemente repite la ecuación 9.59 para el caso de la función Cobb-Douglas. Aquí el factor del variación técnica se modela explícitamente, y las elasticidades de producción están dadas por los valores de los exponentes en la función Cobb-Douglas. La importancia del progreso técnico puede ilustrarse numéricamente con esta función. Supongamos que A 10, 0.03, 0.5 y que una empresa usa una mezcla de insumos de k l 4. Entonces, en t 0, la producción es 40( 10 . 40.5 . 40.5). Después de 20 años (t 20), la función de producción se convierte en q 10e0.03.20 k0.5 l 0.5 10 1.82)k0.5 l 0.5 18.2k0.5 l 0.5 . (9.65) En el año 20, la mezcla de insumos original produce ahora q 72.8. Desde luego que también habría podido producirse q 72.8 en el año 0, pero esto habría absorbido muchos más insumos. Por ejemplo, con k 13.25 y l 4 la producción es, en efecto, de 72.8, pero se usó mucho más capital. La producción por unidad de insumo de trabajo se incrementaría de 10 (q/l 40/4) a 18.2 ( 72.8/4) en cualquier circunstancia, pero sólo el primer caso habría sido verdadero progreso técnico. Progreso técnico de aumento de insumos. Resulta tentador atribuir el incremento en la productividad media del trabajo en este ejemplo a, digamos, mejores habilidades de los trabajadores, pero eso sería engañoso en el caso de la función Cobb-Douglas. Uno podría igualmente haber dicho que la producción por unidad de capital se incrementó de 10 a 18.2 en los 20 años y atribuir este incremento a Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 324 Parte 4: Producción y oferta mejor maquinaria. Un enfoque verosímil de modelización de mejoras en trabajo y capital por separado es suponer que la función de producción es q A(et k) (et l) 1 (9.66) , donde representa la tasa anual de mejora en el insumo de capital y representa la tasa anual de mejora en el insumo de trabajo. Pero debido a la naturaleza exponencial de la función Cobb-Douglas, esto sería indistinguible de nuestro ejemplo original: q Ae[ (1 ) t k l1 Aet k l1 , (9.67) donde (1 ). De ahí que sea necesario estudiar el progreso técnico en los insumos particulares, ya sea para adoptar un modo más complejo de medir los insumos que permita mejorar la calidad o (lo que equivale a lo mismo) para usar una función de producción con insumos múltiples. PREGUNTA: Estudios reales de producción con el uso de la función Cobb-Douglas tienden a hallar ≈ 0.3. Usa este hallazgo junto con la ecuación 9.67 para analizar la importancia relativa de mejorar el capital y la calidad del trabajo para la tasa general de progreso técnico. Resumen En este capítulo se ilustraron las formas en que los economistas conceptualizan el proceso de producción de convertir insumos en productos. La herramienta fundamental es la función de producción, la que —en su forma más simple— supone que la producción por periodo (q) es una función simple de los insumos de capital y trabajo durante ese periodo, q f(k, l). Usando este punto de partida se desarrollaron varios resultados básicos para la teoría de la producción. • Si todos menos uno de los insumos se mantienen constantes puede derivarse una relación entre el insumo de una variable y la producción. De esta relación es posible derivar la productividad física marginal (PM) del insumo como la variación en producción resultante del incremento de una unidad en el uso del insumo. Se supone que la productividad física marginal de un insumo decrece al aumentar el uso del insumo. • La función de producción entera puede ilustrarse mediante su gráfica de isocuantas. La pendiente negativa de una isocuanta se denomina tasa marginal de sustitución técnica (TMST) porque indica cómo un insumo puede ser sustituido por otro manteniendo constante la producción. La TMST es la razón de las productividades físicas marginales de los dos insumos. puede derivarse exclusivamente del supuesto de productividades físicas marginales decrecientes. Uno también debe interesarse en el efecto de variaciones en un insumo sobre la productividad marginal de otros insumos. • Los rendimientos a escala exhibidos por una función de producción registran cómo responde la producción a incrementos proporcionales en todos los insumos. Si la producción aumenta proporcionalmente con el uso de insumos, hay rendimientos constantes a escala. Si hay incrementos más que proporcionales en la producción, hay retornos crecientes a escala, mientras que si hay incrementos menos que proporcionales en producción, hay rendimientos decrecientes a escala. • La elasticidad de sustitución ( ) aporta una medida de qué tan fácil es sustituir un insumo por otro en la producción. Una alta implica isocuantas casi lineales, mientras que una baja implica que las isocuantas son casi en forma de L. • El progreso técnico desplaza la función de producción entera y su gráfica de isocuantas asociada. Mejoras técnicas pueden surgir del uso de insumos mejorados y más productivos o de mejores métodos de organización económica. • Suele suponerse que las isocuantas son convexas, que obedecen el supuesto de una TMST decreciente. Este supuesto no Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción 325 Problemas 9.1 Power Goat Lawn Company usa dos tamaños de podadoras para cortar el pasto. Las podadoras pequeñas tienen una plataforma de 56 centímetros. Las grandes combinan dos plataformas de 56 centímetros en una sola podadora. Para cada tamaño de podadora Power Goat tiene una función de producción diferente, de acuerdo con la tabla siguiente. Podadoras chicas Podadoras grandes Producción por hora (kilometros cuadrados) Insumo de capital (# de podadoras de 56 cm) Insumo de trabajo 1.53 2.44 1 2 1 1 a. Grafica la isocuanta q 12.19 kilómetros cuadrados para la primera función de producción. ¿Cuántas k y l se usarían si estos factores se combinaran sin desperdicio? b. Responde el inciso a) para la segunda función. c. ¿Cuántas k y l se usarían sin desperdicio si la mitad del pasto de 12.19 kilómetros cuadrados se podara con el método de la primera función de producción y la otra mitad con el método de la segunda? ¿Cuántas k y l se usarían si un cuarto del pasto se podara con el primer método y tres cuartos, con el segundo? ¿Qué significa hablar de fracciones de k y l? d. Con base en tus observaciones en el inciso c), traza una isocuanta q 12.19 kilómetros para las funciones de producción combinadas. 9.2 Supón que la función de producción de artefactos está dada por q kl 0.8k2 0.2l2, donde q representa la cantidad anual de artefactos producida, k representa el insumo de capital anual y l representa el insumo de trabajo anual. a. Supón que k 10; grafica la productividad total y media de las curvas de trabajo. ¿En qué nivel del insumo de trabajo esta productividad media alcanza un máximo? ¿Cuántos artefactos se producen en ese punto? b. Suponiendo de nuevo que k 10 grafica la curva PMgl. ¿En qué nivel del insumo de trabajo PMgl 0? c. Supón que los insumos de capital aumentaron a k 20. ¿Cómo cambiarían tus respuestas de los incisos a) y b)? d. ¿La función de producción de artefactos exhibe rendimientos a escala constantes crecientes o decrecientes? 9.3 Sam Malone considera la posibilidad de renovar los bancos de la barra de Cheers. La función de producción para nuevos bancos de barra está dada por q 0.1k0.2l 0.8, donde q es el número de bancos producidos durante la semana de renovación, l representa el número de horas empleadas en tornos para bancos durante la semana y l representa el número de horas utilizadas por los trabajadores durante el periodo. A Sam le gustaría proveer 10 bancos nuevos y ha asignado un presupuesto de $10 000 al proyecto. a. Sam razona que como los tornos para los bancos y los trabajadores calificados en bancos de barra cuestan lo mismo ($50 por hora), bien podría contratar estos dos insumos en cantidades iguales. Si Sam procede de esta manera, ¿cuánto de cada insumo contratará y cuánto costará el proyecto de renovación? b. Norman (que sabe algo acerca de bancos de barra) argumenta que, una vez más, Sam ha olvidado su microeconomía. Afirma que debería elegir cantidades de insumos, de tal manera que sus productividades marginales (no medias) sean iguales. Si Sam opta, en variar, por este plan ¿cuánto de cada insumo contratará y cuánto costará el proyecto de renovación? c. Tras oír que el plan de Norman ahorrará dinero, Claudio sostiene que Sam debería invertir los ahorros en más bancos para que se sentaran más de sus colegas del Servicio Postal de Estados Unidos (USPS, por sus siglas en inglés). ¿Cuántos bancos más puede obtener Sam de su presupuesto si sigue el plan de Claudio? d. A Carla le preocupa que la sugerencia de Claudio signifique sencillamente más trabajo para ella en el servicio de alimentos a los clientes del bar. ¿Cómo podría convencer a Sam de apegarse a su plan original de 10 bancos? Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 326 Parte 4: Producción y oferta 9.4 Supón que la producción de crayones (q) se realiza en dos sitios y usa sólo trabajo como insumo. La función de producción en el sitio 1 está dada por q1 10l 10.5 y en el sitio 2 por q2 50l 20.5. a. Si una sola empresa produce crayones en ambos sitios, obviamente querrá obtener la producción más grande posible dado el insumo de trabajo que usa. ¿Cómo debería asignar trabajo entre los sitios para poder hacer eso? Explica precisamente la relación entre l1 y l2. b. Suponiendo que la empresa opera de la manera eficiente que se describe en el inciso a), ¿cómo depende la producción total (q) de la cantidad total de trabajo contratado (l)? 9.5 Como se ha visto ya en muchas partes, la función de producción general Cobb-Douglas para dos insumos está dada por q f(k, l) Ak l , donde 0 1 y 0 1. Para esta función de producción: a. Demuestra que f k 0, f1 0, f kk 0, f ll 0 y f kl f lk 0. b. Demuestra que eq, k y eq, l . c. En la nota 5, se definió la elasticidad de escala como eq, t f (tk, tl) t t , f (tk, tl) donde la expresión debe evaluarse en t 1. Demuestra que, para esta función Cobb-Douglas, eq, t . De ahí que, en este caso, coincidan la elasticidad de escala y los rendimientos a escala de la función de producción (para más sobre este concepto, véase el problema 9.9). d. Demuestra que esta función es cuasi cóncava. e. Demuestra que la función es cóncava para 1 pero no cóncava para 1. 9.6 Supón que recibimos la función de producción ESC con rendimientos constantes a escala q [k l]1/. a. b. c. d. Demuestra que PMgk (q/k)1– y PMgl (q/l )1–. Demuestra que TMST (k/l)1–; usa esto para demostrar que 1(1 ). Determina las elasticidades de producción para k y l, y demuestra que su suma es igual a 1. Comprueba que q l q l y de ahí que ln q l ln q l . Nota: Esta última igualdad es útil en el trabajo empírico porque podemos aproximar q/l mediante la tasa salarial competitivamente determinada. De ahí que pueda estimarse a partir de una regresión de ln(q/l) sobre ln w. 9.7 Considera una generalización de la función de producción del ejemplo 9.3: kl 2k 3l, q 0 1冑苴 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción 327 donde 0 i 1, i 0, . . . , 3. a. Si esta función debe exhibir rendimientos constantes a escala, ¿qué restricciones deberían imponerse a los parámetros 0, . . . , 3? b. Demuestra que, en el caso de los rendimientos constantes a escala esta función exhibe productividades marginales decrecientes y que las funciones de productividad marginal son homogéneas de grado 0. c. Calcula en este caso. Aunque no es constante en general, ¿para qué valores de las , 0, 1, o ? 9.8 Demuestra que el teorema de Euler implica que, para una función de producción con rendimientos constantes a escala [q f(k, l)], q f k . k f l . l. Usa este resultado para demostrar que, para tal función de producción, si PMgl PMel, entonces PMgk debe ser negativa. ¿Qué implica esto respecto a dónde debe tener lugar la producción? ¿Puede una empresa producir siempre en un punto en el que PMel es creciente? Problemas analíticos 9.9 Rendimientos locales a escala Una medida local de los rendimientos a escala incorporados en una función de producción está dada por la elasticidad de escala eq, f(tk, tl)/t . t/q evaluada en t 1. t a. Demuestra que si la función de producción exhibe rendimientos constantes a escala, entonces eq, t 1. b. Podemos definir las elasticidades de producción de los insumos k y l como eq, k f (k, l) k , q f (k, l) l . eq, l q l k Demuestra que eq, t eq, k eq, l. c. Una función que exhibe elasticidad de escala variable es q (1 k1l1)1. Demuestra que, para esta función, eq, t 1 para q 0.5 y que eq, t 1 para q 0.5. d. Explica intuitivamente tus resultados del inciso c). Pista: ¿Tiene q un límite superior para esta función de producción? 9.10 Rendimientos a escala y sustitución Aunque gran parte de nuestro análisis de la medición de la elasticidad de sustitución para varias funciones de producción ha supuesto rendimientos constantes a escala, a menudo ese supuesto no es necesario. Este problema ilustra algunos de estos casos. a. En la nota 6 se señaló que, en el caso de rendimientos constantes a escala, la elasticidad de sustitución para una función de producción con dos insumos está dada por fk fl . f fkl Supón ahora que definimos la función de producción homotética F como F(k, l) [f(k, l)] , donde f(k, l) es una función de producción con rendimientos constantes a escala y un exponente positivo. Demuestra que la elasticidad de sustitución para esta función de producción es la misma que la elasticidad de sustitución para la función f. b. Muestra cómo se puede aplicar este resultado a las funciones de producción tanto de la función Cobb-Douglas como ESC. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 328 Parte 4: Producción y oferta 9.11 Más sobre el teorema de Euler Supongamos que una función de producción f(x1, x2, . . . xn) es homogénea de grado k. El teorema de Euler demuestra que 冱i xifi kf, y este hecho puede usarse para demostrar que las derivadas parciales de f son homogéneas de grado k 1. a. Comprueba que 冱ni1 冱nj1xixj fij k(k 1)f . b. En el caso de n 2 y k 1, ¿qué tipo de restricciones impone el resultado del inciso a) a la derivada parcial de segundo orden f12? ¿Cómo cambian tus conclusiones cuando k 1 o k 1? c. ¿Cómo se generalizarían los resultados del inciso b) a una función de producción con cualquier número de insumos? d. ¿Cuáles son las implicaciones de este problema para los parámetros de la función de producción mutivariable de la función CobbDouglas f (x1, x2, . . . xn) 兿ni1 xi i para i 0? Sugerencias de lecturas adicionales Clark, J. M. “Diminishing Returns”, Ecyclopaedia of the Social Sciences, vol. 5, Crowell-Collier y Macmillan, Nueva York, 1931, pp. 144-146. El capítulo 5 proporciona un sofisticado, aunque escueto, repaso de la teoría de la producción. El uso de la función de beneficios (véase el capítulo 11) es sofisticado e iluminador. Lúcido análisis del desarrollo histórico del concepto de rendimientos decrecientes. Shephard, R. W. Theory of Cost and Production Funtions, Princeton University Press, Princeton, Nueva Jersey, 1978. Douglas, P. H. “Are There Laws of Production?”, American Economic Review, núm. 38 (marzo de 1948), pp. 1-41. Amplio análisis de la relación dual entre funciones de producción y de costo. Buen análisis metodológico de los usos y abusos de las funciones de producción. Slberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001. Ferguson, C. E. The Neoclassical Theory of Production and Distribution, Cambridge University Press, Nueva York, 1969. Exhaustivo análisis de la dualidad entre funciones de producción y curvas de costos. Da una prueba de que la elasticidad de sustitución puede derivarse como se mostró en la nota 6 de este capítulo. Estudio completo de la teoría de la función de producción (en 1970). Buen uso de gráficas tridimensionales. Fuss, M. y D. McFadden. Production Economics: A Dual Approach to Theory and Application, North-Holland, Amsterdam, 1980. Método con marcado énfasis en el uso de la dualidad. Mas-Collell, A, M. D. Whinston y J. R. Green. Microeconomic Theory, Oxford University Press, Nueva York, 1995. Stigler, G. J. “The Division of Labor Is Limited by the Extent of the Market”, Journal of Political Economy, núm. 59 (junio de 1951), pp. 185-193. Atento rastreo de la evolución de las ideas de Smith sobre economías de escala. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Funciones de producción con muchos insumos La mayoría de las funciones de producción que se ilustran en este capítulo 9 pueden generalizarse fácilmente a casos de muchos insumos. Aquí se demostrará esto para los casos de la función Cobb-Douglas y ESC, y se examinarán después dos formas flexibles que tales funciones de producción podrían adoptar. En todos estos ejemplos, las son parámetros no negativos y los n insumos están representados por x1, . . . xr. E9.1 Función Cobb-Douglas La función de producción Cobb-Douglas con muchos insumos está dada por n q 冲 xi i1 i (i) . EXTENSIONES y ij 1. Debido a que este parámetro está tan restringido en la función Cobb-Douglas, esta función no suele usarse en análisis econométricos de datos microeconómicos sobre empresas. Sin embargo, la función tiene varios usos generales en macroeconomía, como ilustra el ejemplo siguiente. El modelo de crecimiento de Solow La función de producción Cobb-Douglas con muchos insumos es uno de los rasgos primordiales de muchos modelos de crecimiento económico. Por ejemplo, el modelo pionero de crecimiento de equilibrio de Solow (1956) puede derivarse muy fácilmente, usando una función Cobb-Douglas con dos insumos y rendimientos constantes a escala de la forma q Ak l1 , a. Esta función exhibe rendimientos constantes a escala si n 冱 i 1. (ii) donde A es un factor de variación técnica que puede representarse mediante crecimiento exponencial de la forma i1 A eat. b. En la función Cobb-Douglas con rendimientos constantes a escala, i es la elasticidad de q respecto al insumo xi. Dado que 0 i 1, cada insumo exhibe productividad marginal decreciente. c. Cualquier grado de rendimientos crecientes a escala puede incorporarse en esta función, dependiendo de ^ q^ eat k , donde ^ 冱 (iii) i. d. La elasticidad de sustitución entre dos insumos cualesquiera en esta función de producción es de 1. Esto puede demostrarse usando la definición dada en la nota 7 de este capítulo: ln(xi /xj ) . ln( fj /fi ) Aquí fj fi i xj j 1 i xi i 1 冲ij xi 冲ji xj i j j i xi . xj De ahí que ln fj fi ln (vi) q^ q/l y k k/l i1 ij (v) Dividir ambos miembros de la ecuación iv entre l produce n (iv) j i ln xi xj Solow demuestra que las economías evolucionarán hacia un valor ^ de equilibrio de k (la razón capital-trabajo). De ahí que diferencias entre países en tasas de crecimiento puedan tomarse en cuenta sólo mediante diferencias en el factor de variación técnica, a. Dos características de la ecuación vi argumentan en favor de incluir más insumos en el modelo de Solow. Primero, tal como está, esa ecuación es incapaz de explicar las grandes diferencias en producción per cápita (q^) que se observan alrededor del mundo. Suponiendo que 0.3, digamos (cifra congruente con muchos estudios empíricos), se necesitarían diferencias entre los países en k/l de hasta 4 000 000 a 1 para explicar las diferencias 100 a 1 observadas en el ingreso per cápita, magnitud evidentemente irrazonable. Introduciendo insumos adicionales, como capital humano, estas diferencias se vuelven más explicables. Una segunda deficiencia de la formulación simple de la función Cobb-Douglas del modelo de Solow es que no ofrece ninguna explicación del parámetro de la variación técnica, a; su valor está determinado “exógenamente”. Al agregar factores adicionales se vuelve más fácil entender cómo puede responder el parámetro Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 330 Parte 4: Producción y oferta a a incentivos económicos. Este es el discernimiento clave de la bibliografía sobre la teoría del crecimiento “endógeno” (para un resumen, véase Romer, 1996). x4 [ x1 (1 )x2 ]1/ . Entonces, la función de producción final podría adoptar una forma Cobb-Douglas: E9.2 ESC q x3 x4. La función de producción de la elasticidad de sustitución constante (ESC) con muchos insumos está dada por q 冱 i xi / , (vii) 1. a. Sustituyendo txi por cada producción, es fácil demostrar que esta función exhibe rendimientos constantes a escala para 1. Para 1, la función exhibe rendimientos a escala crecientes. b. Esta función de producción exhibe productividades marginales decrecientes para cada insumo, porque 1. c. Como en el caso con dos insumos, la elasticidad de sustitución está dada aquí por 1 1 (viii) , y esta elasticidad se aplica a la sustitución entre cualesquiera dos de los insumos. Comprobación de la función Cobb-Douglas en la Unión Soviética Una forma en la que se usa la función ESC con multiinsumos es para determinar si el parámetro de sustitución estimado () es congruente con el valor implicado por la función Cobb-Douglas ( 0, 1). Por ejemplo, en un estudio de cinco grandes industrias en la antigua Unión Soviética. E. Bairam (1991) determinó que la función Cobb-Douglas brinda una explicación relativamente buena de variaciones en producción en la mayoría de los sectores manufactureros. Sólo para el procesamiento de alimentos parece apropiado un valor bajo de . Los tres ejemplos siguientes ilustran funciones de producción de forma flexible que pueden aproximar cualquier función general de n insumos. En las “Extensiones” del capítulo 10 se examinarán las analogías de la función de costo con algunas de estas funciones, de uso más amplio que las funciones de producción mismas. E9.3 Funciones de producciones anidadas En algunas aplicaciones las funciones de producción Cobb-Douglas y ESC se combinan en una sola función “anidada”. Para hacer esto los n insumos primarios originales se dividen en, digamos, m clases generales de insumos. Los insumos específicos en cada una de estas categorías se agregan después en un solo insumo compuesto y la función de producción final es una función de estos m compuestos. Por ejemplo, supongamos que hay tres insumos primarios, x1, x2, x3. Y supongamos, sin embargo, que x1 y x2 están relacionados en forma relativamente estrecha en su uso por las empresas (por ejemplo, capital y energía), mientras que el tercer insumo (trabajo) es relativamente distinto. Uno podría querer entonces usar una función ESC agregadora para elaborar un insumo compuesto para servicios de capital de la forma (ix) (x) Esta estructura permite que la elasticidad de sustitución entre x1 y x2 adopte cualquier valor [ 1/(1 )], pero restringe que la elasticidad de sustitución entre x3 y x4 sea de uno. Otras opciones están disponibles dependiendo de qué tan precisamente se especifiquen las funciones incrustadas. La dinámica de la sustitución capital/energía Las funciones de producción anidadas se han usado ampliamente en los estudios que intentan medir la naturaleza precisa de la sustitución entre insumos de capital y energía. Por ejemplo, Atkeson y Kehoe (1999) usan un modelo más bien parecido al especificado en las ecuaciones ix y x para tratar de conciliar dos hechos sobre el modo en que los precios de la energía afectan la economía: 1) a lo largo del tiempo, el uso de energía en la producción parece un tanto insensible al precio (al menos a corto plazo), y 2) entre países, los precios de la energía parecen tener gran influencia respecto a cuánta energía se usa. Usando una ecuación de servicio de capital de la forma dada en la ecuación ix con un bajo grado de sustitución ( 2.3) —junto con una función de producción Cobb-Douglas que combina trabajo con servicios de capital—, estos autores lograron reproducir muy bien los hechos sobre los precios de la energía. Concluyeron, sin embargo, que este modelo implica un efecto mucho más negativo de los altos precios de la energía sobre el crecimiento económico del que parece realmente haber sido el caso. De ahí que en última instancia hayan optado por una forma más compleja de modelo de la producción que subraya diferencias en el uso de la energía entre inversiones de capital realizadas en fechas diferentes. E9.4 Leontief generalizado n q n 冱冱 ij 冑苴苴 xi xj , i1 j1 donde ij ji. a. La función considerada en el problema 9.7 es un caso simple de esta función para el caso n 2. Para n 3, esta función tendría términos lineales en los tres insumos junto con tres términos radicales en representación de todos los posibles productos cruzados de los insumos. b. Esta función exhibe rendimientos constantes a escala, como puede demostrarse usando txi. Rendimientos crecientes a escala pueden incorporarse en esta función usando la transformación q q, 1. c. Puesto que cada insumo aparece linealmente así como bajo el radical, esta función exhibe productividades marginales decrecientes en todos los insumos. d. La restricción ij ji se usa para garantizar la simetría de las derivadas parciales de segundo orden. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 9: Funciones de producción A9.5 Translog n ln q 0 冱 n i ln xi 0.5 i1 n 冱冱 ij ln xi ln xj , i1 j1 ij ji . a. Nótese que la función Cobb-Douglas es un caso especial de esta función donde 0 ij 0 para todas las i, j. b. Como en el caso de la función Cobb-Douglas esta función puede asumir cualquier grado de rendimientos a escala. Si n 冱 i1 n i 1 y 冱 ij 0 j1 para todas las i, entonces esta función exhibe rendimientos constantes a escala. La prueba requiere cierto cuidado en el manejo de la doble suma. c. Nuevamente, se requiere la condición ij ji para garantizar la igualdad de las derivadas parciales cruzadas. Inmigración Puesto que la función de producción translog incorpora gran número de posibilidades de sustitución entre varios insumos, se le ha usado ampliamente para estudiar los modos en que los trabajadores recién llegados pueden sustituir a los ya existentes. De particular interés es la forma en que el nivel de habilidad de los inmi- 331 grantes puede conducir a reacciones diferentes en la demanda de trabajadores calificados y no calificados en la economía interna. Estudios de Estados Unidos y muchos otros países (como Canadá, Alemania y Francia) han sugerido que la magnitud general de tales efectos es modesta, en especial dados los flujos de inmigración relativamente reducidos. Pero hay ciertas evidencias de que los trabajadores inmigrantes no calificados sí podrían actuar como sustitutos de los trabajadores nacionales no calificados, pero como complementos de los trabajadores nacionales calificados. De ahí que mayores flujos de inmigración puedan exacerbar tendencias hacia crecientes diferenciales salariales. Para un resumen, véase Borjas (1994). Referencias Atkeson, Andrew y Patrick J. Kehoe. “Models of Energy Use: Putty-Putty versus Putty-Clay”, American Economic Review (septiembre de 1999), pp. 1028-1043. Bairam, Erkin. “Elasticity of Substitution, Technical Progress and Returns to Scale in Branches of Soviet Industry: A New CES Production Function Approach”, Journal of Applied Economics (enero-marzo de 1991), pp. 91-96. Borjas, G. J. “The Economics of Immigration”, Journal of Economic Literature (diciembre de 1994), pp. 1667-1717. Romer, David. Advanced Macroeconomics, McGraw-Hill, Nueva York, 1996. Solow, R. M. “A Contribution to the Theory of Economic Growth”, Quarterly Journal of Economics (febrero de 1956), pp. 65-94. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 CAPÍTULO DIEZ Funciones de costo En este capítulo se ilustran los costos en que incurre la empresa cuando genera productos. En el capítulo 11 se abundará en este tema, mostrando cómo las empresas toman decisiones de insumos cios. DEFINICIONES DE COSTOS cultades sobre la apropiada camente, debe distinguirse entre 1) costo contable y 2) costo económico. La visión de costos del contador subraya los desembolsos, costos históricos, depreciación nición de costo del economista (que en formas obvias se sirve de la noción fundamental de costo de oportunidad) es que el costo de cualquier insumo está dado por la magnitud del pago necesario para mantener el recurso en su empleo presente. O bien, el costo económico de usar un insumo es lo que se le pagaría a ese insumo en su nen en cada sistema los costos de varios insumos (trabajo, capital y servicios empresariales). Costos del trabajo Economistas y contadores consideran los costos del trabajo casi de la misma manera. Para los contadores los gastos en trabajo son gastos corrientes y, por tanto, costos de producción. Para costo explícito. Los servicios de trabajo (horas-trabajo) se contratan a alguna tasa salarial por hora (w), y suele suponerse que eso es también lo que los servicios de trabajo ganarían en su mejor empleo alterno. El salario por hora, desde luego, incluye los costos de las prestaciones ofrecidas a los empleados. Costos de capital En el caso de los servicios del capital (h eren. Al calcular los costos de capital, los contadores usan el precio histórico de la máquina particular bajo investigación y aplican alguna regla de depreciación más o menos arbitraria para determinar cuánto del precio original de esa máquina cargar a los costos corrientes. Los economistas consideran el precio histórico de una máquina como un “costo sumergido”, el cual es irrelevante para las decisiones de producción. Consideran, en cambio, el costo implícito de la máquina como lo que alguien estaría dispuesto a pagar por su uso. Por tanto el costo, de una hora-máquina es la tasa de arrendamiento de esa máquina en su mejor uso alterno. Al seguir usando la máquina, la 333 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 334 Parte 4: Producción y oferta empresa renuncia implícitamente a lo que alguien estaría dispuesto a pagar por usarla. Esta tasa de arrendamiento por hora-máquina se denotará con v.1 Supongamos que una compañía compra una computadora por 2 000 dólares. Un contador que aplique un método de depreciación de “línea recta” de cinco años considerará que esa computadora tiene un costo de 400 dólares anuales. Un economista examinaría el valor de mercado de la computadora. La disponibilidad de computadoras mucho más veloces en años subsecuentes puede causar que el precio de segunda mano de la computadora original se reduzca precipitadamente. Si el precio de segunda mano disminuye hasta, por ejemplo, 200 dólares después del primer año, el costo económico se relacionará con esos 200 dólares; el precio original de $2 000 ya no será relevante. (Todos estos costos anuales pueden convertirse fácilmente en costo por hora-computadora, desde luego.) La distinción entre costos contables y costos económicos de capital desaparece en gran medida si la compañía la renta a un precio de v en cada periodo en vez de adquirirla. Entonces v refleja un gasto corriente de la compañía que aparece directamente como un costo contable; también refleja el valor de mercado del uso del capital durante un periodo y es, por tanto, un costo de oportunidad/económico. Costos de servicios empresariales El dueño de una empresa es un reclamante residual con derecho a cualquier ingreso adicional o pérdidas luego de pagar otros costos de insumos. Para un contador estas se llamarían beneficios (los cuales pueden ser positivos o negativos). Los economistas, en cambio, preguntan si los dueños (o empresarios) también se topan con costos de oportunidad trabajando en una empresa en particular o dedicando parte de sus fondos a su operación. De ser así, estos servicios deberían considerarse un insumo, y algún costo debe imputarse a ellos. Por ejemplo, supongamos que un programador de computadoras altamente calificado abre una empresa de software con la idea de mantener los beneficios (de contabilidad) que puedan generarse. El tiempo del programador es evidentemente un insumo para la empresa, y debe atribuírsele un costo. El salario que el programador exigiera, si trabajara para otro, podría usarse con ese propósito. De ahí que una parte de los beneficios contables generados por la empresa, los economistas los catalogan como costos empresariales. Los beneficios económicos serían menores a los contables y podrían ser negativos si los costos de oportunidad del programador excedieran los beneficios contables obtenidos por el negocio. Argumentos similares se aplican al capital que un emprendedor suministra a la empresa. Costos económicos No es de sorprender que en este libro usemos la definición costo de los economistas. DEFINICIÓN Costo económico. El costo económico de un insumo es el pago requerido para mantener ese insumo en su empleo presente. En forma equivalente, el costo económico de un insumo es la remuneración que el insumo recibiría en su mejor empleo alterno. El uso de esta definición no persigue implicar que los conceptos de los contadores sean irrelevantes para el comportamiento económico. En realidad, los procedimientos contables son integralmente importantes para el proceso de toma de decisiones de cualquier gerente, porque pueden afectar enormemente la tasa tributaria por aplicar a los beneficios. Asimismo, los datos contables son fáciles de conseguir, mientras que los datos sobre costos económicos a menudo deben desarrollarse por separado. Las definiciones de los economistas, sin embargo, tienen las características 1 A veces el símbolo r se elige para representar la tasa de arrendamiento del capital. Como esta variable suele confundirse con el concepto asociado pero distinto de la tasa de interés del mercado, aquí se eligió otro símbolo. La relación exacta entre v y la tasa de interés se examina en el capítulo 17. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 10: Funciones de costo 335 deseables de ser ampliamente aplicables a todas las empresas y de formar un sistema conceptualmente coherente. Por tanto, son ideales para un análisis teórico general. Supuestos simplificadores En un principio haremos dos simplificaciones sobre los insumos que usa una empresa. Primero, supondremos que sólo hay dos insumos: trabajo homogéneo (l, medido en horas-trabajo) y capital homogéneo (k, medido en horas-máquina). Los costos empresariales se incluyen en los costos de capital. Es decir, supondremos que los principales costos de oportunidad que enfrenta el dueño de una empresa son los asociados con el capital que el propio dueño aporta. Segundo, supondremos que los insumos se contratan en mercados perfectamente competitivos. Las empresas pueden comprar (o vender) todos los servicios de trabajo y capital que quieran a las tasas de arrendamiento prevalecientes (w y v). En términos gráficos, la curva de oferta de estos recursos es horizontal en los precios de los factores prevalecientes. Tanto w como v se tratan como “parámetros” en las decisiones de la empresa; no hay nada que la empresa pueda hacer para afectarlos. Estas condiciones se relajarán en capítulos posteriores (principalmente el capítulo 16), pero por el momento es conveniente y útil establecer la hipótesis del tomador de precios. Por tanto, con estas simplificaciones, el costo total C para la empresa durante el periodo está dado por costo total C wl vk (10.1) donde, como ya se dijo, k y l representan uso de insumos durante el periodo. Relación entre maximización de beneficios y minimización de costos Adelantémonos aquí y comparemos el análisis de este capítulo con el del capítulo siguiente sobre maximización de beneficios. Definiremos las beneficios económicos () como la diferencia entre los ingresos totales de la empresa (I) y sus costos totales (C). Supongamos que la empresa toma como establecido el precio del mercado (p) para su producción total (q) y que su función de producción es q f(k, l). Entonces, los beneficios pueden escribirse como I C pq wl vk pf (k, l) wl vk. (10.2) La ecuación 10.2 indica que los beneficios económicos obtenidos por esta empresa son una función de la cantidad de capital y trabajo empleado. Si, como suponemos en muchos segmentos de este libro, esta empresa persigue beneficios máximos, podríamos estudiar su comportamiento examinando cómo se eligen k y l para maximizar la ecuación 10.2. Esto conduciría a su vez a una teoría de la oferta y a una teoría de la “demanda derivada” de insumos de capital y trabajo. En el capítulo siguiente nos ocuparemos en detalle de estos temas. Aquí, en cambio, queremos desarrollar una teoría de los costos un poco más general que se aplique no sólo a empresas tomadoras de precios en sus mercados de productos (competidores perfectos), sino también a aquellas cuya elección de producción afecta al precio de mercado (monopolios y oligopolios). Esa teoría más general se aplicará incluso a organizaciones no lucrativas (mientras se interesen en operar eficientemente). La otra ventaja de estudiar la minimización de costos, aparte de la maximización de los beneficios, es que es más simple analizar esta pequeña “pieza” por separado y sólo después añadir los discernimientos obtenidos al “rompecabezas” general de las operaciones de la empresa. Las condiciones derivadas para decisiones de insumos minimizadoras de costos emergerán de nueva cuenta en este capítulo como un “subproducto” del análisis de la maximización de los beneficios especificado en la ecuación 10.2. De ahí que comencemos el estudio de los costos elaborando, por el momento, un análisis de la decisión de producción. Es decir, supongamos que por alguna razón la empresa ha decidido generar un nivel particular de producción (digamos q0). La empresa obtendrá desde luego ciertos ingresos R de esta decisión de producción, pero ignoraremos los ingresos por ahora. Nos concentraremos solamente en la pregunta de cómo la empresa puede producir q0 a un costo mínimo. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 336 Parte 4: Producción y oferta DECISIONES DE INSUMOS DE MINIMIZACIÓN DE COSTOS Matemáticamente este es un problema de minimización restringida. Pero antes de proceder con una solución rigurosa es útil enunciar el resultado por derivar con un argumento intuitivo. Para minimizar el costo de generar un nivel dado de producción, una empresa debe elegir el punto en la isocuanta q0 en el que la tasa de sustitución técnica de l por k es igual a la razón w/v: esto debería igualar la tasa a la que k puede cambiarse por l en la producción, con la tasa a la que pueden canjearse en el mercado. Supongamos que esto no es cierto; en particular, que la empresa genera un nivel de producción q0 usando k 10, l 10, y que la TMST es de 2 en este punto. Supóngase también que w $1, v $1, y de ahí que w/v 1 (lo que no es igual a 2). En esta combinación de insumos el costo de producir q0 es de 20 dólares. Es fácil demostrar que este no es el costo de insumos mínimo. Por ejemplo, q0 también puede producirse usando k 8 y l 11; podemos renunciar a dos unidades de k y mantener constante la producción en q0, añadiendo una unidad de l. Pero en esta combinación de insumos el costo de producir q0 es de 19 dólares, y de ahí que la combinación de insumos inicial no sea la óptima. Una contradicción similar puede mostrarse cada vez que la TMST y la razón de costos de los insumos difieren. Análisis matemático Matemáticamente se busca minimizar los costos totales dado que q f (k, l) q0. Al establecer la expresión lagrangiana ᏸ wl vk [q0 f (k, l)], (10.3) las condiciones de primer orden para un mínimo restringido son ᏸ f w 0, l l ᏸ f v 0, k k ᏸ q0 f (k, l) 0, (10.4) o, dividiendo las dos primeras ecuaciones, w f / l TMST (de l por k). v f / k (10.5) Esto indica que la empresa minimizadora de costos debe igualar la TMST de los dos insumos con la razón de sus precios. Interpretaciones adicionales Estas condiciones de primer orden para costos mínimos pueden manipularse de varias maneras para rendir resultados interesantes. Por ejemplo, la multiplicación cruzada de la ecuación 10.5 da fk fl . v w (10.6) Es decir, para que los costos sean minimizados la productividad marginal por dólar gastado debe ser la misma para todos los insumos. Si incrementar un insumo ofreciera incrementar la producción en una cantidad mayor por dólar gastado que otro insumo, los costos no serían mínimos; la empresa debería contratar más del insumo que ofrece un mayor “impacto por dólar” y menos del insumo más costoso (en términos de productividad). Cualquier insumo que no pueda satisfacer la razón común de costo-beneficio definida en la ecuación 10.6 no debe ser contratado en absoluto. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 10: Funciones de costo 337 La ecuación 10.6 también puede derivarse, por supuesto, de la ecuación 10.4, pero es más instructivo derivar su inversa: w v . fl fk (10.7) Esta ecuación reporta el costo adicional de obtener una unidad adicional de producción, contratando ya sea trabajo adicional o capital adicional. A causa de la minimización de costos este costo marginal es el mismo sin importar qué insumo se contrate. Este costo marginal común también es medido por el multiplicador de Lagrange del problema de minimización de costos. Lo mismo que para todos los problemas de optimización restringida, aquí el multiplicador de Lagrange indica en cuántos costos adicionales se incurriría en un incremento ligero de la restricción de producción. Puesto que el costo marginal desempeña un papel importante en las decisiones de oferta de una empresa, volveremos con frecuencia a esta característica de la minimización de costos. Análisis gráfico La minimización de costos se muestra gráficamente en la figura 10.1. Dada la isocuanta de producción q0, queremos encontrar el punto menos costoso en la isocuanta. Las líneas que señalan costo igual son líneas rectas paralelas con pendientes –w/v. En la figura 10.1 aparecen tres líneas de costo total igual; C1 C2 C3. De esta figura se deduce claramente que el costo total mínimo para producir q0 está dado por C1, donde la curva de costo total es tangente a la isocuanta. Los insumos asociados son l c y k c, donde los superíndices enfatizan que estos niveles de insumos son una solución a un problema de minimización de costos. Esta combinación será un mínimo verdadero si la isocuanta es convexa (si la TMST decrece al decrecer k/l). Los análisis matemático y gráfico llegan a la misma conclusión, como sigue. FIGURA 10.1 Minimización de costos dada q q0. Se supone que una empresa elige k y l para minimizar sus costos totales. La condición para esta minimización es que la tasa a la que k y l pueden intercambiarse técnicamente (manteniendo q q0 debe ser igual a la tasa a la que estos insumos pueden intercambiarse en el mercado. En otras palabras, la TMST (de k por l) debe igualarse con la razón de precios w/v. Esta tangencia se muestra en la figura; los costos se minimizan en C1 eligiendo los insumos kc y lc. k por periodo C1 C2 C3 kc q0 lc Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. l por periodo 23.08.2019 8/23 338 Parte 4: Producción y oferta PRINCIPIO DE OPTIMIZACIÓN Minimización de costos. Para minimizar el costo de cualquier nivel dado de producción q0, la empresa debe producir en el punto en la isocuanta q0 para el cual la TMST (de l por k) es igual a la razón de los precios de arrendamiento de los insumos (w/v). Demanda contingente de insumos La figura 10.1 exhibe la semejanza formal entre el problema de minimización de costos de la empresa y el problema de minimización de gastos del individuo, que se estudió en el capítulo 4 (véase la figura 4.6). En ambos problemas el actor económico intenta alcanzar su objetivo (producción o utilidad) a un costo mínimo. En el capítulo 5 se mostró cómo se usa este proceso para elaborar una teoría de la demanda compensada de un bien. En el caso presente la minimización de costos conduce a una demanda de capital y trabajo contingente al nivel de producción por generar. Por tanto, esta no es la historia completa de la demanda de los insumos que usa una empresa porque no aborda el asunto de la decisión de producción. Sin embargo, estudiar la demanda contingente de insumos aporta un elemento importante al análisis de la demanda general de insumos de la empresa, y este tema lo abordaremos en detalle más adelante. Trayectoria de expansión de la empresa Una empresa puede seguir el proceso de minimización de costos para cada nivel de producción: para cada q, encuentra la decisión de insumos que minimiza el costo de producirla. Si los costos de los insumos (w y v) se mantienen constantes para todas las cantidades que la empresa pueda demandar, podemos trazar fácilmente este locus de decisiones de minimización de costos. Este procedimiento se advierte en la figura 10.2. La curva 0E registra las tangencias de minimización de costos para niveles de producción sucesivamente más altos. Por ejemplo, el costo mínimo de generar el nivel de producción q1 está dado por C1, y se usan los insumos k1 y l1. Otras tangen- FIGURA 10.2 Trayectoria de expansión de la empresa. La trayectoria de expansión de la empresa es el locus de las tangencias de minimización de costos. Suponiendo precios fijos de los insumos, la curva muestra cómo se incrementan los insumos al aumentar la producción. k por periodo E q3 k1 q2 C1 0 C2 l1 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. C3 q1 l por periodo 23.08.2019 8/23 Capítulo 10: Funciones de costo 339 cias en la figura pueden interpretarse en forma similar. El locus de estas tangencias se llama trayectoria de expansión de la empresa, porque registra cómo crecen los insumos al crecer la producción manteniendo constantes los precios de los insumos. Como muestra la figura 10.2, la trayectoria de expansión no necesita ser una línea recta. El uso de algunos insumos puede aumentar más pronto que el de otros al expandirse la producción. Qué insumos se expanden más rápido dependerá de la forma de las isocuantas de producción. Como la minimización de costos requiere que la TMST se iguale siempre con la razón w/v, y como la razón w/v se supone constante, la forma de la trayectoria de expansión estará determinada por en dónde ocurre una TMST particular en isocuantas sucesivamente más altas. Si la función de producción exhibe rendimientos constantes a escala (o, más generalmente, si es homotética), la trayectoria de expansión será una línea recta porque en ese caso la TMST sólo depende de la razón de k a l. Esa razón sería constante a lo largo de tal trayectoria de expansión lineal. Parecería razonable suponer que la trayectoria de expansión será de pendiente positiva; es decir, que los niveles de producción sucesivamente más altos requerirán más de dos insumos. Este no es necesariamente el caso, sin embargo, como ilustra la figura 10.3. Incrementos de producción más allá de q2 causan que la cantidad de trabajo usada decrezca. En este rango se diría que el trabajo es un insumo inferior. La ocurrencia de insumos inferiores es entonces una posibilidad teórica que puede ocurrir, aun si las isocuantas tienen su forma convexa usual. Mucho del análisis teórico se ha centrado en el estudio de la inferioridad de los factores. Que la inferioridad es probable que ocurra en funciones de producción reales es una pregunta empírica difícil de contestar. Parece improbable que magnitudes tan amplias como “capital” y “trabajo” pudieran ser inferiores, pero una clasificación de insumos más fina puede traer a la luz la inferioridad. Por ejemplo, el uso de palas puede decrecer al incrementarse la producción de cimientos de edificios (y el uso de excavadoras). En este libro no nos interesarán en particular los temas analíticos planteados por esta posibilidad, aunque en algunas secciones se mencionarán las complicaciones representadas por insumos inferiores. FIGURA 10.3 Inferioridad de insumos. Con este conjunto particular de isocuantas el trabajo es un insumo inferior, porque se elige menos de l al expandirse la producción más allá de q2. k por periodo E q4 q3 q2 q1 0 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. l por periodo 23.08.2019 8/23 340 Parte 4: Producción y oferta EJEMPLO 10.1 Minimización de costos El proceso de minimización de costos puede ilustrarse fácilmente con dos de las funciones de producción que encontramos en el capítulo anterior. 1. Función Cobb-Douglas: q f (k, l) k l . Para este caso, la expresión lagrangiana relevante para minimizar el costo de producir, digamos, q0 es ᏸ vk wl (q0 k l ), (10.8) y las condiciones de primer orden para un mínimo son ᏸ v k 1 l 0, k ᏸ w k l 1 0, l ᏸ q0 k l 0. (10.9) Dividir la segunda de estas ecuaciones entre la primera produce w k l 1 k , v l k 1 l (10.10) que otra vez muestra que los costos se minimizan cuando la razón de los precios de los insumos es igual a la TMST. Dado que la función Cobb-Douglas es homotética, la TMST sólo depende de la razón de los dos insumos. Si la razón de costos de los insumos no varía, las empresas usarán la misma razón de insumos sin importar cuánto produzca; es decir, la trayectoria de expansión será una línea recta a través del origen. Como ejemplo numérico, supongamos que 0.5, w 12, v 3 y que la empresa desea producir q0 40. La condición de primer orden para un mínimo requiere que k 4l. Al insertar esto en la función de producción (el requisito final en la ecuación 10.9), tenemos q0 40 k0.5l0.5 2l. Por tanto, la combinación de insumos de minimización de costos es l 20 y k 80, y los costos totales están dados por vk wl 3(80) 12(20) 480. Que este es un verdadero mínimo de costos se sugiere al examinar otras combinaciones de insumos también capaces de generar 40 unidades de producción: k 40, l 40, C 600, k 10, l 160, C 2 220, (10.11) k 160, l 10, C 600. Cualquier otra combinación de insumos capaz de generar 40 unidades de producción también costará más que 480. La minimización de costos es sugerida asimismo al considerar las productividades marginales. En el punto óptimo PMk f k 0.5k 0.5 0.5 PMl f l 0.5k0.5 l l 0.5 0.5(20 /80) 0.5 0.25, 0.5(80 /20) 0.5 1; (10.12) de ahí que, en el margen, el trabajo sea cuatro veces más productivo que el capital, y esta productividad adicional compensa exactamente el precio unitario más alto del insumo de trabajo. 2. ESC: q f (k, l) (k l ) /. Establecemos de nueva cuenta la expresión lagrangiana ᏸ vk wl [q0 (k l ) /], (10.13) y las condiciones de primer orden para un mínimo son ᏸ v ( /)(k l ) ( )/ ()k k ᏸ w ( /)(k l ) ( )/ ()l l ᏸ k l ) ( ) 0. q0 Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 1 0, 1 0, (10.14) 8/23 Capítulo 10: Funciones de costo 341 Dividir las dos primeras de estas ecuaciones causa la eliminación de gran parte de esta masa de símbolos, dejando w l v k 1 k l 1 k l 1/ , o k w l v , (10.15) donde 1/(1 ) es la elasticidad de sustitución. Dado que la función ESC también es homotética, la razón de insumos minimizadores de costos es independiente del nivel absoluto de producción. El resultado en la ecuación 10.15 es una generalización simple del resultado de la función Cobb-Douglas (cuando 1). Con la función Cobb-Douglas la razón capital-trabajo de minimización de costos varía directamente en proporción a las variaciones en la razón de los salarios con las tasas de arrendamiento del capital. En casos con mayor sustituibilidad ( 1), las variaciones en la razón de los salarios con las tasas de arrendamiento causan un incremento más que proporcional en la razón capital-trabajo de minimización de costos. Con menos sustituibilidad ( 1), la respuesta es proporcionalmente menor. PREGUNTAS: En el ejemplo numérico de la función Cobb-Douglas con w/v 4, se determinó que la razón de insumos de minimización de costos para generar 40 unidades de producción era k/l 80/20 4. ¿Cómo variaría este valor para 2 o 0.5? ¿Qué combinaciones de insumos reales se usarían? ¿Cuáles serían los costos totales? FUNCIONES DE COSTO Ahora estamos en posición de examinar la estructura general de costos de la empresa. Para hacerlo será conveniente usar las soluciones de la trayectoria de expansión para derivar la función de costo total. DEFINICIÓN Función de costo total. La función de costo total indica que, para cualquier conjunto de costos de insumos y para cualquier nivel de producción, el costo total mínimo en que incurre la empresa es C C(v, w, q). (10.16) La figura 10.2 deja ver claramente que los costos totales se incrementan al aumentar la producción, q. Comenzaremos analizando esta relación entre costo total y producción, manteniendo fijos los precios de los insumos. Luego se considerará cómo una variación en el precio de un insumo desplaza la trayectoria de expansión y sus funciones de costo asociadas. Funciones de costo medio y marginal Aunque la función de costo total proporciona información completa sobre la relación producción-costo a menudo es conveniente analizar los costos por unidad de producción, porque este método se corresponde más estrechamente con el análisis de la demanda el cual se centró en el precio por unidad de un bien. En economía se usan ampliamente dos diferentes medidas de costo unitario: 1) costo medio, que es el costo por unidad de producción, y 2) costo marginal, el costo de una unidad más de producción. DEFINICIÓN Funciones de costos medio y marginal: La función de costo medio (CMe) se determina calculando los costos totales por unidad de producción: costo medio CMe (v, w, q) Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 C(v, w, q) . q (10.17) 8/23 342 Parte 4: Producción y oferta La función de costo marginal (CMg) se determina calculando la variación en costos totales por una variación en la producción generada: costo marginal CMg (v, w, q) C(v, w, q) . q (10.18) Nótese que en estas definiciones los costos medio y marginal dependen del nivel de producción generado y de los precios de los insumos. En muchas secciones de este libro se graficarán relaciones bidimensionales simples entre costos y producción. Tal como dejan ver claramente las definiciones, todas estas gráficas se trazan con base en el supuesto de que los precios de los insumos permanecen constantes y de que la tecnología no cambia. Si los precios de los insumos varían o si la tecnología avanza, las curvas de costos generalmente se desplazarán a posiciones nuevas. Más adelante se explorarán las probables dirección y magnitud de esos desplazamientos, al estudiar en detalle la función de costo total. Análisis gráfico de los costos totales Las figuras 10.4a y 10.5a ilustran dos formas posibles de la relación entre costo total y nivel de producción de la empresa. En la figura 10.4a, el costo total es simplemente proporcional a la producción. Esta situación surgiría si la función de producción subyacente exhibe rendimientos constantes a escala. En ese caso, supóngase que se requieren k1 unidades de insumo de capital y l1 unidades de insumo de trabajo para generar una unidad de producción. Así pues, C(q 1) vk1 wl1. (10.19) Para generar m unidades de producción se requieren mk1 unidades de capital y ml1 unidades de trabajo, debido al supuesto de rendimientos constantes a escala.2 De ahí que C(q m) vmk1 wml1 m(vk1 wl1 ) m C(q 1), (10.20) y se establece la proporcionalidad entre producción y costo. La situación en la figura 10.5a es más complicada. Ahí se supone que inicialmente la curva de costo total es cóncava; aunque al principio los costos se aumentan rápido para incrementos en la producción, esa tasa de incremento se reduce cuando la producción se expande al rango intermedio de producción. Más allá de este rango medio, sin embargo, la curva de costo total se vuelve convexa, y los costos comienzan a aumentar en forma progresivamente más rápida. Una posible razón de esta forma de la curva de costo total es que hay un tercer factor de producción (digamos, los servicios de un emprendedor) que es fijo mientras el uso de capital y trabajo se expande. En este caso, la sección cóncava inicial de la curva podría explicarse por el uso crecientemente óptimo de los servicios del emprendedor, quien necesita un moderado nivel de producción para usar plenamente sus habilidades. Más allá del punto de inflexión, sin embargo, el emprendedor trabaja en exceso al tratar de coordinar la producción, y aparecen los rendimientos decrecientes. De ahí que los costos totales se incrementen rápidamente. Se ha ofrecido una variedad de otras explicaciones para la curva de costo total de tipo cúbico de la figura 10.5a, pero aquí no las examinaremos. En última instancia, la forma de la curva de costo total es una cuestión empírica que sólo puede determinarse examinando datos de la realidad. En las extensiones de este capítulo se ilustrará parte de la bibliografía sobre funciones de costo. 2 La combinación de insumos (ml1, mk1) minimiza el costo de generar m unidades de producción, porque la razón de los insumos sigue siendo k1/l1 y la TMST para una función de producción con rendimientos constantes a escala sólo depende de esa razón. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 10: Funciones de costo 343 En a) los costos totales son proporcionales al nivel de producción. Los costos medio y marginal, como se advierte en b), son iguales y constantes para todos los niveles de producción. FIGURA 10.4 Curvas de costos total, medio y marginal para el caso de rendimientos constantes a escala. Costos totales C Producción por periodo (a) Costos medio y marginal CMe = CMg Producción por periodo (b) Análisis gráfico de los costos medio y marginal La información de las curvas de costo total puede usarse para elaborar las curvas de costos medio y marginal que aparecen en las figuras 10.4b y 10.5b. Para el caso de rendimientos constantes a escala (figura 10.4), esto es simple. Dado que los costos totales son proporcionales a la producción, los costos medio y marginal son constantes e iguales para todos los niveles de producción.3 Estos costos se muestran en la línea horizontal CMe CMg de la figura 10.4b. Para el caso cúbico de la curva costo total (figura 10.5b), el cálculo de los costos medio y marginal requiere cierta intuición geométrica. Como se desprende claramente de la ecuación 10.18, el costo marginal es simplemente la pendiente de la curva de costo total. De ahí que, a causa de la forma supuesta de la curva, la curva CMg tiene forma en U, con CMg cayendo sobre la porción cóncava de 3 Matemáticamente, dado que C aq (donde a es el costo de una unidad de producción), CMe C C a CMg. q q Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 344 Parte 4: Producción y oferta Si la curva de costo total tiene la forma cúbica que se muestra en a), las curvas de costos medio y marginal tendrán forma de U. En b), la curva de costo marginal pasa por el punto más bajo de la curva de costo medio en el nivel de producción q∗. FIGURA 10.5 Curvas de costos total, medio y marginal para el caso cúbico de la curva de costo total. Costos totales C Producción por periodo (a) Costos medio y marginal CMg CMe q* Producción por periodo (b) la curva de costo total y subiendo más allá del punto de inflexión. Puesto que la pendiente siempre es positiva, sin embargo, CMg siempre es mayor que 0. Los costos medio (CMe) empiezan siendo iguales que el costo marginal para la “primera” unidad de producción.4 Al expandirse la producción, sin embargo, CMe excede a CMg, porque CMe refleja tanto el costo marginal de la última 4 Técnicamente, CMe CMg en q 0. Esto puede demostrarse con la regla de L’Hôpital, que establece que si f(a) g(a) 0, entonces lím f (x) x→ a g(x) lím f (x) x→ a g (x) . En este caso, C 0 en q 0, de modo que lím CMe lím q→ 0 q→ 0 C C/ q lím lím CMg q→ 0 q q→ 0 1 o CMe CMg en q 0, lo que se tenía que demostrar. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V. 23.08.2019 8/23 Capítulo 10: Funciones de costo 345 unidad producida como los costos marginales más altos de las unidades previamente producidas. Mientras CMe CMg, los costos medios deben ser decrecientes. Dado que los costos menores de las unidades recién producidas son inferiores al costo medio, siguen empujando los costos medios hacia bajo. Los costos marginales se incrementan, sin embargo, y finalmente (en q∗) igualan al costo medio. Más allá de este punto CMg CMe y los costos medios aumentarán, porque son impulsados hacia arriba por costos marginales crecientemente más altos. En consecuencia, se ha demostrado que la curva CMe también tiene forma de U y que llega a un punto bajo en q∗, donde CMe y CMg interceptan.5 En estudios empíricos de funciones de costo hay considerable interés en este punto de costo medio mínimo. Refleja la escala mínima eficiente (EME) para el proceso de producción particular bajo examen. Esta cuestión también es teóricamente importante, debido al papel que desempeña en la determinación de precios perfectamente competitiva a largo plazo (véase el capítulo 12). FUNCIONES DE COSTO Y DESPLAZAMIENTOS EN CURVAS DE COSTO Las curvas de costo ilustradas en las figuras 10.4 y 10.5 muestran la relación entre costos y cantidad producida con base en el supuesto de que todos los demás factores se mantienen constantes. Específicamente, la elaboración de las curvas supone que los precios de los insumos y el nivel de tecnología no cambian.6 Si estos factores cambian, las curvas de costo se desplazarán. En esta sección se abundará en las matemáticas de las funciones de costo como una forma de estudiar esos desplazamientos. Comenzaremos con algunos ejemplos. EJEMPLO 10.2 Algunas funciones de costo ilustrativas En este ejemplo se calcularán las funciones de costo asociadas con tres funciones de producción diferentes. Luego se usarán estos ejemplos para ilustrar algunas de las propiedades generales de las funciones de costo. 1. Proporciones fijas: q f (k, l) min( k, l). El cálculo de funciones de costo a partir de sus funciones de producción subyacentes es una de las tareas más frustrantes para los estudiantes de economía. Por tanto comencemos con un ejemplo sencillo. Lo que se quiere hacer es mostrar cómo los costos totales dependen de los costos de los insumos y de la cantidad producida. En el caso de proporciones fijas se sabe que la producción ocurrirá en el vértice de las isocuantas en forma de L donde q k l. De ahí que los costos totales sean C(v, w, q) vk wl v q w q q v w . (10.21) Este es, en efecto, el tipo de función que queremos, porque enuncia los costos totales como una función sólo de v, w y q junto con algunos parámetros de la función de producción subyacente. Debido 5 Matemáticamente puede hallarse el CMe mínimo igualando su derivada con 0: CMe (C/q) q q q C/ q q2 C 1 q CMg q2 C 0, o q . CMg C 0 o CMg C/q CMe. Así, CMg CMe cuando CMe se minimiza. 6 Para empresas multiproductos, debe considerarse una complicación adicional. Para estas, es posible que los costos asociados con generar un producto (digamos q1) también se vean afectados por la cantidad de otro producto por generar (q2). En este caso se dice que la empresa exhibe “economías de alcance”, y la función de costo total será de la forma C(v, w, q1, q2). De ahí que q2 también deba mantenerse constante al elaborar las curvas de costo de q1. Presumiblemente, incrementos en q2 desplazarán hacia abajo las curvas de costo de q1. Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.