Subido por Paulina Hernandez

Teoría Microeconómica. Principios Básicos y Ampliaciones

Anuncio
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
;,69Ð(
40*96,*65Ô40*(
7905*0706:)Í:0*6:@(4730(*065,:
HLKPJP}U
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
;,69Ð(
40*96,*65Ô40*(
7905*0706:)Í:0*6:@(4730(*065,:
HLKPJP}U
>HS[LY5PJOVSZVU
‹
*OYPZ[VWOLY:U`KLY
(TOLYZ[*VSSLNL
+HY[TV\[O*VSSLNL
;YHK\JJP}U
,UYPX\L*4LYJHKV.VUamSLa
;YHK\J[VYWYVMLZPVUHS
9L]PZP}U[tJUPJH
+Y1LZ‚Z(=HSKtZ+xHaKL=PSSLNHZ
<UP]LYZPKHK0ILYVHTLYPJHUH
Argentina • Brasil • Corea • España • Estados Unidos • Japón • México • Reino Unido • Singapur
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Teoría microeconómica. Principios básicos
y ampliaciones, 11a. edición.
Walter Nicholson y Christopher Snyder
Presidente de Cengage Learning
Latinoamérica:
Fernando Valenzuela Migoya
Director Editorial, de Producción y de
Plataformas Digitales para Latinoamérica:
Ricardo H. Rodríguez
Editora de Adquisiciones
para Latinoamérica:
Claudia C. Garay Castro
Gerente de Manufactura
para Latinoamérica:
Raúl D. Zendejas Espejel
Gerente Editorial en Español
para Latinoamérica:
Pilar Hernández Santamarina
Gerente de Proyectos Especiales:
Luciana Rabuffetti
Coordinador de Manufactura:
Rafael Pérez González
Editora:
Abril Vega Orozco
Diseño de portada:
MSDE | MANU SANTOS Design
Imagen de portada:
©Mazzzur/Shutterstock
©Gunnar Pippel/Shutterstock
Composición tipográfica:
José Jaime Gutiérrez Aceves
Mariana Sierra Enríquez
© D.R. 2015 por Cengage Learning Editores, S.A. de C.V.,
una Compañía de Cengage Learning, Inc.
Corporativo Santa Fe
Av. Santa Fe núm. 505, piso 12
Col. Cruz Manca, Santa Fe
C.P. 05349, México, D.F.
Cengage Learning® es una marca registrada
usada bajo permiso.
DERECHOS RESERVADOS. Ninguna parte de
este trabajo amparado por la Ley Federal del
Derecho de Autor podrá ser reproducida,
transmitida, almacenada o utilizada en
cualquier forma o por cualquier medio, ya sea
gráfico, electrónico o mecánico, incluyendo,
pero sin limitarse a lo siguiente: fotocopiado,
reproducción, escaneo, digitalización,
grabación en audio, distribución en Internet,
distribución en redes de información o
almacenamiento y recopilación en sistemas
de información, a excepción de lo permitido
en el Capítulo III, Artículo 27 de la Ley Federal
del Derecho de Autor, sin el consentimiento
por escrito de la Editorial.
Traducido del libro Microeconomic Theory: Basic Principles
and Extensions, Eleventh Edition.
Walter Nicholson and Christopher Snyder.
Publicado en inglés por South-Western, una compañía
de Cengage Learning ©2012.
ISBN: 978-111-1-52553-8
Datos para catalogación bibliográfica:
Nicholson, Walter y Christopher Snyder.
Teoría microeconómica. Principios básicos y ampliaciones,
11a. edición.
ISBN: 978-607-552-029-1
Visite nuestro sitio en:
http://latinoamerica.cengage.com
Impreso en México
1 2 3 4 5 6 7 17 16 15 14
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Dedicatoria
A Beth, Sarah, David, Sophia, Abby, Nate y Christopher
A Maura
v
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Acerca de los autores
Walter Nicholson es titular de la cátedra Ward H. Patton de economía en el Amherst College.
Obtuvo una licenciatura en matemáticas en el Williams College y un doctorado en economía en
el Massachusetts Institute of Technology (MIT). Sus principales intereses de investigación son los
análisis econométricos de problemas del mercado de trabajo como bienestar, desempleo y el
impacto del comercio internacional. Ha sido durante muchos años miembro distinguido de
Mathematica, Inc., y asesor de los gobiernos de Estados Unidos y Canadá. Vive con Susan, su
esposa, en Naples, Florida y en Amherst, Massachusetts.
Christopher M. Snyder es profesor de economía en el Dartmouth College. Obtuvo su licenciatura en economía y matemáticas en la Fordham University y su doctorado en economía en el MIT.
Es investigador de la National Bureau of Economic Research, miembro del consejo de la Industrial Organization Society y director adjunto del International Journal of Industrial Organization
and Review of Industrial Organization. Sus investigaciones cubren diversos temas teóricos y
empíricos acerca de organización industrial, teoría de contratos, derecho y economía.
El profesor Snyder y su esposa, Maura Doyle (también maestra de economía en Dartmouth),
viven muy cerca del campus, en Hanover, New Hampshire, con sus tres hijas de edad escolar.
Los profesores Nicholson y Snyder también son autores de Intermediate Microeconomics and
Its Application (Cengage Learning, 2010).
vii
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Contenido breve
Prefacio
PARTE
UNO
PARTE
DOS
Introducción 1
CAPÍTULO
1
CAPÍTULO
2
PARTE
PARTE
3
4
5
6
7
8
PARTE
PARTE
PARTE
PARTE
El modelo competitivo de equilibrio parcial
Equilibrio general y bienestar 457
409
Monopolio 501
Competencia imperfecta
531
Determinación de precios en mercados de insumos 579
CAPÍTULO 16
CAPÍTULO 17
OCHO
Funciones de producción 303
Funciones de costo 333
Maximización de beneficios 371
Poder de mercado 499
CAPÍTULO 14
CAPÍTULO 15
SIETE
301
Mercados competitivos 407
CAPÍTULO 12
CAPÍTULO 13
SEIS
207
Incertidumbre 209
Teoría de juegos 251
Producción y oferta
CAPÍTULO 9
CAPÍTULO 10
CAPÍTULO 11
CINCO
Preferencias y utilidad 89
Optimización de la utilidad y elección 117
Efectos de ingreso y de sustitución 145
Relaciones de demanda entre bienes 187
Incertidumbre y estrategia
CAPÍTULO
CAPÍTULO
CUATRO
21
Elección y demanda 87
CAPÍTULO
CAPÍTULO
CAPÍTULO
CAPÍTULO
TRES
Modelos económicos 3
Matemáticas para microeconomía
Mercados de trabajo 581
Capital y tiempo 607
Fallas del mercado 639
CAPÍTULO 18
CAPÍTULO 19
Información asimétrica 641
Externalidades y bienes públicos
685
Respuestas breves a las preguntas 717
Soluciones a los problemas de número non 727
Glosario de términos de uso frecuente 739
Índice analítico 747
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
ix
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Contenido detallado
Prefacio ........................................................................................................................................................xix
PARTE
UNO
Introducción 1
CAPÍTULO 1
Modelos económicos ...................................................................................................................................3
Modelos teóricos 3
Comprobación de modelos económicos 4
Características generales de los modelos económicos
Desarrollo de la teoría económica del valor 9
Evolución moderna 17
Resumen 18
Sugerencias de lecturas adicionales 19
CAPÍTULO
5
2
Matemáticas para microeconomía ..........................................................................................................21
Maximización de una función de una variable 21
Funciones de varias variables 26
Maximización de funciones de varias variables 33
Teorema de la envolvente 35
Maximización restringida 39
Teorema de la envolvente en problemas de maximización restringida
Restricciones de desigualdad 46
Condiciones de segundo orden y curvatura 48
Funciones homogéneas 55
Integración 58
Optimización dinámica 63
Estadística matemática 67
Resumen 76
Problemas 77
Sugerencias de lecturas adicionales 82
Extensiones: Condiciones de segundo orden y álgebra matricial 83
PARTE
DOS
45
Elección y demanda 87
CAPÍTULO
3
Preferencias y utilidad ...............................................................................................................................89
Axiomas de la elección racional
89
xi
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
xii
Contenido
Utilidad 90
Intercambios y sustitución 92
Matemática de las curvas de indiferencia 99
Funciones de utilidad para preferencias específicas
El caso de muchos bienes 106
Resumen 106
Problemas 107
Sugerencias de lecturas adicionales 110
Extensiones: Preferencias especiales 112
CAPÍTULO
102
4
Optimización de la utilidad y elección .................................................................................................117
Sondeo inicial 118
El caso de dos bienes: análisis gráfico 119
El caso de n bienes 122
Función de utilidad indirecta 128
Principio de suma global 129
Minimización del gasto 131
Propiedades de las funciones de gasto 134
Resumen 136
Problemas 136
Sugerencias de lecturas adicionales 140
Extensiones: Porciones presupuestales 141
CAPÍTULO 5
Efectos de ingreso y de sustitución .......................................................................................................145
Funciones de demanda 145
Variaciones en el ingreso 147
Variaciones en el precio de un bien 149
Curva de demanda de una persona 152
Curvas y funciones de demanda compensada (de Hicks) 155
Desarrollo matemático de la respuesta a las variaciones de precio 160
Elasticidades de la demanda 163
Superávit del consumidor 169
Preferencia revelada y efecto de sustitución 174
Resumen 176
Problemas 177
Sugerencias de lecturas adicionales 180
Extensiones: Conceptos de demanda y evaluación de índices de precios 181
CAPÍTULO 6
Relaciones de demanda entre bienes ...................................................................................................187
El caso de dos bienes 187
Sustitutos y complementarios 189
Sustitutos y complementarios netos (de Hicks)
191
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Contenido xiii
Sustituibilidad con muchos bienes 193
Bienes compuestos 193
Producción doméstica, atributos de los bienes y precios implícitos 197
Resumen 200
Problemas 200
Sugerencias de lecturas adicionales 203
Extensiones: Simplificación de la demanda y presupuestación en dos etapas
PARTE
TRES
Incertidumbre y estrategia
CAPÍTULO
204
207
7
Incertidumbre ............................................................................................................................................ 209
Estadística matemática 209
Apuestas razonables e hipótesis de la utilidad esperada 210
Utilidad esperada 211
El teorema Von Neumann-Morgenstern 212
Aversión al riesgo 214
Medición de la aversión al riesgo 217
Métodos para reducir la incertidumbre y el riesgo 222
Seguros 222
Diversificación 223
Flexibilidad 224
Información 231
Enfoque de estados de preferencia de la elección en condiciones de incertidumbre
Asimetría de información 238
Resumen 238
Problemas 239
Sugerencias de lecturas adicionales 242
Extensiones: El problema de la cartera 244
232
CAPÍTULO 8
Teoría de juegos ....................................................................................................................................... 251
Conceptos básicos 251
Dilema del prisionero 252
Equilibrio de Nash 254
Estrategias mixtas 260
Existencia de equilibrio 265
Continuo de acciones 265
Juegos secuenciales 268
Juegos repetidos 274
Información incompleta 277
Juegos bayesianos simultáneos
Juegos de señalamiento 282
Juegos experimentales 288
278
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
xiv
Contenido
Juegos evolutivos y aprendizaje 290
Resumen 290
Problemas 291
Sugerencias de lecturas adicionales 295
Extensiones: Existencia del equilibrio de Nash
PARTE
CUATRO
Producción y oferta
296
301
CAPÍTULO 9
Funciones de producción.........................................................................................................................303
Productividad marginal 303
Gráficas de isocuantas y tasa de sustitución técnica 306
Rendimientos a escala 310
Elasticidad de sustitución 313
Cuatro funciones de producción simples 316
Progreso técnico 320
Resumen 324
Problemas 325
Sugerencias de lecturas adicionales 328
Extensiones: Funciones de producción con muchos insumos
329
CAPÍTULO 10
Funciones de costo ...................................................................................................................................333
Definiciones de costos 333
Decisiones de insumos de minimización de costos 336
Funciones de costo 341
Funciones de costo y desplazamientos en curvas de costo
Lema de Shephard y elasticidad de sustitución 355
Distinción corto plazo, largo plazo 355
Resumen 362
Problemas 363
Sugerencias de lecturas adicionales 366
Extensiones: La función de costo translog 367
345
CAPÍTULO 11
Maximización de beneficios ...................................................................................................................371
Naturaleza y comportamiento de las empresas 371
Maximización de beneficios 373
Ingreso marginal 375
Oferta a corto plazo por una empresa fijadora de precios 380
Funciones de beneficios 383
Maximización de beneficios y demanda de insumos 389
Resumen 395
Problemas 396
Sugerencias de lecturas adicionales 400
Extensiones: Límites de la empresa 401
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Contenido xv
PARTE
CINCO
Mercados competitivos 407
CAPÍTULO 12
El modelo competitivo de equilibrio parcial ........................................................................................409
Demanda del mercado 409
Determinación temporal de la respuesta de la oferta 413
Determinación de precios a muy corto plazo 413
Determinación de precios a corto plazo 415
Desplazamientos en curvas de oferta y demanda: análisis gráfico 419
Modelo matemático del equilibrio del mercado 422
Análisis de largo plazo 425
Equilibrio a largo plazo: caso de costo constante 426
Forma de la curva de oferta a largo plazo 428
Elasticidad de la oferta a largo plazo 431
Análisis de estática comparativa del equilibrio a largo plazo 431
Superávit del productor a largo plazo 435
Eficiencia económica y análisis de bienestar 438
Controles de precios y escasez 441
Análisis de la incidencia tributaria 442
Resumen 447
Problemas 447
Sugerencias de lecturas adicionales 451
Extensiones: Agregación y estimación de la demanda 453
CAPÍTULO 13
Equilibrio general y bienestar ................................................................................................................457
Sistema de precios perfectamente competitivo 457
Modelo gráfico de equilibrio general con dos bienes 458
Análisis de estática comparativa 467
Modelización del equilibrio general y precios de factores 469
Modelo matemático de intercambio 471
Modelo matemático de producción e intercambio 482
Modelos calculables de equilibrio general 485
Resumen 489
Problemas 490
Sugerencias de lecturas adicionales 494
Extensiones: Modelos calculables de equilibrio general 495
PARTE
SEIS
Poder de mercado 499
CAPÍTULO 14
Monopolio ...................................................................................................................................................501
Barreras de entrada 501
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
xvi
Contenido
Maximización de beneficios y decisiones de producción 503
Monopolio y asignación de recursos 507
Monopolio y calidad y durabilidad de los productos 510
Discriminación de precios 513
Discriminación de precios de segundo grado mediante programas de precios
Regulación del monopolio 519
Visiones dinámicas del monopolio 523
Resumen 523
Problemas 524
Sugerencias de lecturas adicionales 527
Extensiones: Tarifas lineales óptimas en dos partes 528
517
CAPÍTULO 15
Competencia imperfecta ..........................................................................................................................531
Decisiones a corto plazo: Precios y producción 531
Modelo de Bertrand 533
Modelo de Cournot 534
Restricciones de capacidad 540
Diferenciación de productos 541
Colusión tácita 547
Decisiones a largo plazo: Inversión, entrada y salida 551
Disuasión estratégica de la entrada 557
Señalamiento 559
¿Que entren cuántas empresas? 562
Innovación 566
Resumen 568
Problemas 569
Sugerencias de lecturas adicionales 572
Extensiones: Sustitutos y complementos estratégicos 573
PARTE
SIETE
Determinación de precios en mercados de insumos 579
CAPÍTULO 16
Mercados de trabajo.................................................................................................................................581
Asignación de tiempo 581
Análisis matemático de la oferta de trabajo 584
Curva de oferta de trabajo del mercado 588
Equilibrio del mercado de trabajo 589
Variación salarial 591
Monopsonio en el mercado de trabajo 595
Sindicatos 598
Resumen 601
Problemas 601
Sugerencias de lecturas adicionales 605
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Contenido xvii
CAPÍTULO 17
Capital y tiempo .........................................................................................................................................607
Capital y tasa de rendimiento 607
Determinación de la tasa de rendimiento 609
Demanda de capital de la empresa 616
Enfoque del valor presente descontado de las decisiones de inversión
Determinación de precios de los recursos naturales 623
Resumen 626
Problemas 626
Sugerencias de lecturas adicionales 630
618
APÉNDICE
Matemáticas del interés compuesto
Valor presente descontado
Tiempo continuo 633
PARTE
OCHO
631
631
Fallas del mercado 639
CAPÍTULO 18
Información asimétrica ............................................................................................................................641
Contratos complejos como respuesta a la información asimétrica 641
Modelo principal-agente 642
Acciones ocultas 645
Relación dueño-gerente 646
Riesgo moral en los seguros 650
Tipos ocultos 655
Determinación de precios no lineales 656
Selección adversa en los seguros 663
Señalamiento del mercado 670
Subastas 672
Resumen 676
Problemas 676
Sugerencias de lecturas adicionales 679
Extensiones: Determinación de precios no lineales con un continuo de tipos
680
CAPÍTULO 19
Externalidades y bienes públicos ..........................................................................................................685
Definición de las externalidades 685
Externalidades e ineficiencia de asignación 687
Soluciones al problema de las externalidades 691
Atributos de los bienes públicos 694
Bienes públicos y asignación de recursos 696
Determinación de precios de Lindahl de bienes públicos
El voto y la asignación de recursos 703
Modelo político simple 705
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
700
8/23
xviii
Contenido
Mecanismos de votación 708
Resumen 710
Problemas 710
Sugerencias de lecturas adicionales 713
Extensiones: Reducción de la contaminación 714
Respuestas breves a las preguntas 717
Soluciones a los problemas de número non 727
Glosario de términos de uso frecuente 739
Índice analítico 747
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Prefacio
La decimoprimera edición de Teoría microeconómica. Principios básicos y ampliaciones continúa
la exitosa colaboración entre los autores, iniciada en la décima edición. Esta edición representa
un esfuerzo importante por seguir afinando y modernizando nuestro tratamiento de la microeconomía. Pese a los cambios significativos en prácticamente la totalidad de los capítulos, el texto
conserva todos los elementos que le han merecido éxito en tantas ediciones. El enfoque básico es
enfatizar el desarrollo de la intuición en torno a los modelos económicos, brindando al mismo
tiempo a los alumnos las herramientas matemáticas que necesitan para progresar en sus estudios.
Este texto también busca facilitar ese enlace, proporcionando muchos ejemplos numéricos, problemas avanzados y extensas explicaciones de implementación empírica, todo lo cual persigue
mostrar a los estudiantes cómo se usa hoy la teoría microeconómica. Nuevos adelantos hacen que
este campo siga siendo interesante; esperamos que esta edición haya logrado capturar ese interés.
Novedades de la decimoprimera edición
Hemos examinado de nueva cuenta cada capítulo para confirmar que sigan brindando una
cobertura clara y actualizada de todos los temas tratados. Las principales modificaciones consisten en lo siguiente.
• Muchos temas del capítulo introductorio sobre matemáticas fueron revisados para adecuarlos a los métodos que suelen encontrarse en la nueva bibliografía económica.
• Los capítulos sobre incertidumbre y teoría de juegos se abordan ahora en secciones aparte.
Esto hace de la parte referente a elección y demanda una sección más manejable y enfatiza la
singular naturaleza de los temas de estrategia e incertidumbre.
• El apartado sobre incertidumbre (capítulo 7) se revisó exhaustivamente. Se ampliaron las
secciones sobre opciones reales y el valor de la información. Las aplicaciones a la economía
financiera y el problema del portafolio se aligeraron y reunieron en las extensiones.
• El tratamiento de la teoría de juegos (capítulo 8) se aligeró sustancialmente, brindando el
mismo nivel de rigor con mayor brevedad.
• Un tratamiento moderno de la bibliografía sobre límites y objetivos de las empresas (teoría de
la empresa) se añadió al cuerpo del capítulo 9 y se amplió en las extensiones.
• El apartado sobre el equilibrio general (capítulo 13) cambió por completo. En particular, ahora
lo usamos para ofrecer a los alumnos una introducción elemental a la notación vectorial.
• Añadimos a nuestro análisis de los mercados de trabajo varios temas relacionados, sobre
todo, con el capital humano y la búsqueda de empleo.
• Se amplió la cobertura de la economía conductual, distribuida en varios capítulos relevantes.
Se incluyó también una muestra de problemas de economía conductual.
• El problema de los bienes públicos fue rigurosamente analizado mediante la teoría de juegos
(capítulo 19).
• Se añadieron docenas de problemas.
xix
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
xx
Prefacio
Suplementos del texto*
Los materiales auxiliares de esta edición, totalmente revisados, contemplan los siguientes:
• El Manual de soluciones* y Banco de pruebas* (escritos por los mismos autores de este
libro). El manual de soluciones contiene comentarios y las soluciones a todos los problemas
y el banco de pruebas se modificó para incluir preguntas adicionales. Ambos están disponibles en versión electrónica en la página web de esta obra: www.cengage.com/economics/
nicholson
• Diapositivas en PowerPoint* para las clases. Estas diapositivas brindan una serie de esquemas
muy completos para cada capítulo del texto para su uso en el aula o con el fin de que los alumnos las empleen como recursos de estudio. Estas diapositivas están disponibles en la página en
internet del libro: www.cengage.com/economics/nicholson
Recursos en línea*
South-Western, parte integrante de Cengage Learning, ofrece a estudiantes y profesores una serie
de valiosos recursos en línea que constituyen un complemento efectivo de este texto.
Economic Applications
Al adquirir este nuevo libro de texto se obtiene acceso gratuito a la página InfoApps (InfoTrac y
Economic Applications) de South-Western. Esta página incluye un juego de funciones web para
estudiantes y maestros de economía, las cuales se actualizan con regularidad: EconNews, EconDebates y EconData. Estos recursos pueden ayudar a los alumnos a comprender mejor los conceptos económicos, analizando reportajes, debates políticos y datos económicos de actualidad.
EconApps puede ayudar igualmente a los maestros a diseñar tareas, estudios de caso y ejemplos
basados en temas reales.
EconDebates ofrece cobertura actual de debates de política económica; incluye una introducción a los asuntos de referencia, ligas a información de contexto y comentarios.
EconNews resume artículos recientes de economía y ofrece preguntas para un debate adicional.
EconData presenta datos económicos tanto actuales como históricos, además de comentarios,
análisis y ejercicios.
Los alumnos que adquieran un ejemplar usado podrán conseguir acceso a InfoApps en www.
cengagebrain.com.
InfoTrac College Edition
Al adquirir este nuevo libro de texto también se obtienen cuatro meses de acceso a InfoTrac. Esta
potente y accesible base de datos en línea ofrece acceso a artículos íntegros de más de un millar de
publicaciones, lo mismo de la prensa en general que de revistas académicas. Los maestros pueden
buscar temas y seleccionar lecturas para sus alumnos quienes a su vez pueden encontrar artículos
y lecturas para tareas y proyectos por realizar en casa. Esas publicaciones cubren una amplia
variedad de temas e incluyen artículos que abordan situaciones de actualidad así como nuevas
aportaciones teóricas. InfoTrac College Edition concede a profesores y estudiantes la posibilidad
de integrar erudición y aplicaciones de la economía al proceso de aprendizaje.
*Este material se encuentra disponible sólo en inglés.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Prefacio
xxi
Agradecimientos
Estamos en deuda con el equipo de Cengage, y en especial con Susan Smart por haber invertido
una vez más en esta edición sus habilidades de organización y compromiso. Los editores de Cenveo Publisher Services se esmeraron en dar sentido a nuestros desordenados manuscritos. El
diseño de texto de Juli Cook logró cumplir dos metas aparentemente inconciliables: que el texto
fuera compacto pero fácil de leer. Cliff Kallemeyn llevó por muy buen camino la edición de la
obra; apreciamos en particular la forma en que coordinó los procesos de corrección y producción.
Devanand Srinivasan supervisó el armado de páginas y manejó expertamente la sobreabundancia
de ecuaciones.
Agradecemos a nuestros colegas en Amherst College y Dartmouth College por sus valiosas
conversaciones y comprensión. Varios colegas que usaron este libro en sus cursos nos hicieron
detalladas sugerencias de ajuste. También nos beneficiamos de la reacción de generaciones de
estudiantes que han usado el libro en nuestros propios cursos de microeconomía. A lo largo de los
años los estudiantes de Amherst: Mark Bruni, Eric Budish, Adrian Dillon, David Macoy, Tatyana
Mamut, Anoop Menon, Katie Merrill, Jordan Milev, Doug Norton y Jeff Rodman, y los de Dartmouth: Wills Begor y Glynnis Kearny trabajaron con nosotros en la revisión de diversos capítulos.
Walter agradece en especial a su esposa, Susan; luego de haberle brindado su apoyo tan necesario a lo largo de 22 ediciones de sus textos de microeconomía, ella está satisfecha con su éxito
pero preocupada por su salud mental. Sus hijos (Kate, David, Tory y Paul) parecen seguir viviendo
felices y productivamente a pesar de una severa falta de educación microeconómica. Quizá esto
pueda remediarse conforme crezca la siguiente generación (Beth, Sarah, David, Sophia, Abby,
Nate y Christopher). Walter espera que al menos ellos se pregunten de qué tratan los libros que les
ha dedicado. Esos volúmenes descansan en un librero adecuado en espera de dicha curiosidad.
Chris agradece especialmente a su familia —su esposa, Maura Doyle, y sus hijas, Clare, Tess y
Meg— por su paciencia durante el proceso de revisión. Maura posee enorme experiencia en el uso
de este libro en sus concurridos cursos de microeconomía en Dartmouth College y fue una generosa fuente de sugerencias que se reflejan en esta nueva versión.
Quizá nuestra mayor deuda de gratitud sea con los profesores que eligen este texto y quienes
comparten una visión similar de cómo debe ser enseñada la microeconomía. Gracias por las
sugerencias que maestros y alumnos han compartido con nosotros a lo largo de los años. Los
alentamos a seguir enviándonos mensajes electrónicos con sus comentarios sobre el texto (wenicholson@amherst.edu o Christopher.M.Snyder@darmouth.edu).
Walter Nicholson, Amherst, Massachusetts
Christopher Snyder, Hanover, New Hampshire
Julio de 2011
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
PARTE
Introducción
UNO
Capítulo 1
Modelos económicos
Capítulo 2
Matemáticas para microeconomía
Esta parte contiene dos capítulos. El capítulo 1 examina la filosofía general de la manera en que los economistas elaboran modelos de comportamiento económico. El capítulo 2 estudia algunas de las herramientas matemáticas que se utilizan en la construcción de estos modelos. Las herramientas matemáticas
del capítulo 2 se emplearán a lo largo del libro.
1
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
UNO
Modelos económicos
El objetivo principal de este libro es presentar los modelos más importantes que utilizan los economistas para explicar el comportamiento de consumidores, empresas y mercados. Estos modelos son centrales para el estudio de todas las áreas de la economía. Por consiguiente, es esencial
comprender tanto la necesidad de esos modelos como el marco básico que se utiliza para desarrollarlos. El objetivo de este capítulo es iniciar esbozando algunas de las consideraciones conceptuales que determinan la forma en que los economistas estudian prácticamente todas las interrogantes que les interesan.
MODELOS TEÓRICOS
Una economía moderna es una entidad compleja. Miles de empresas se dedican a la producción
de millones de bienes diferentes. Muchos millones de personas trabajan en todo tipo de ocupaciones y toman decisiones sobre cuáles de estos bienes comprar. Usemos como ejemplo los cacahuates o maníes. Los cacahuates deben ser cosechados en el momento justo y ser enviados a sus
procesadores quienes los convierten en mantequilla, aceite, turrón de cacahuate y muchos otros
manjares. Estos procesadores deben cerciorarse a su vez de que sus productos lleguen a miles de
tiendas minoristas en las cantidades adecuadas para satisfacer la demanda.
Dado que sería imposible describir en detalle las características de los mercados, incluso de los
mercados de cacahuates, los economistas han optado por hacer abstracción de la complejidad de
la realidad y desarrollan modelos simples que captan “la esencia”. Así como un mapa es útil, aunque no registre cada casa o tienda, los modelos económicos de, digamos, el mercado de los cacahuates también son útiles aunque no registren hasta el último rasgo de la economía del cacahuate.
En este libro estudiaremos los modelos económicos usados con mayor frecuencia. Veremos que,
a pesar de que estos modelos hacen abstracciones de las complejidades de la realidad, capturan
características esenciales comunes a todas las actividades económicas.
El uso de modelos está muy extendido en las ciencias físicas y sociales. En física, la noción de
cos estudiar
cadas. En química, la idea de un átomo o una molécula
cado de la estructura de la materia. A los arquitectos, las maquecios. Los diagramas de cableado les sirven a los reparadores de
car problemas. Los modelos de los economistas desempeñan funciones
en que las empresas se comportan, así como de la manera en que esos dos grupos interaccio-
3
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
4
Parte 1: Introducción
COMPROBACIÓN DE MODELOS
ECONÓMICOS
Claro que no todos los modelos son “buenos”. Por ejemplo, el modelo geocéntrico del movimiento planetario ideado por Ptolomeo se desechó después porque resultó incapaz de explicar
con precisión cómo se mueven los planetas alrededor del Sol. Un propósito importante de la
investigación científica es separar los modelos “malos” de los “buenos”. Se han utilizado dos métodos generales para comprobar los modelos económicos: 1) un método directo, que busca establecer la validez de los supuestos básicos en que se funda un modelo, y 2) un método indirecto, que
intenta confirmar la validez del modelo, mostrando que un modelo simplificado predice de
manera correcta sucesos reales. Para ilustrar las diferencias básicas entre estos dos métodos examinemos de forma breve un modelo que usaremos ampliamente en capítulos posteriores: el de
una empresa que intenta maximizar sus beneficios.
Modelo de maximización de beneficios
El modelo de una empresa que intenta maximizar los beneficios es obviamente una simplificación de la realidad. Ignora las motivaciones personales de los administradores de la empresa y no
considera conflictos entre ellos. Supone que los beneficios son el único objetivo relevante de la
empresa; otros objetivos posibles, como obtener poder o prestigio, no se tratan como importantes. Asimismo, supone que la empresa tiene información suficiente sobre los costos y la naturaleza
de su mercado para descubrir sus opciones de maximización de beneficios. En la realidad es obvio
que la mayoría de las empresas no dispone tan fácil de esta información; sin embargo, esas deficiencias del modelo no son necesariamente graves. Ningún modelo puede describir de modo fiel
la realidad. La verdadera pregunta es si ese modelo simple merece que se le considere bueno.
Prueba de supuestos
Una prueba del modelo de una empresa maximizadora de beneficios investiga el supuesto básico
de este modelo: ¿es cierto que las empresas buscan beneficios máximos? Algunos economistas han
examinado esta pregunta enviando cuestionarios a ejecutivos para que especifiquen los objetivos
que persiguen. Los resultados de esos estudios son variados. Las personas de negocios suelen indicar objetivos distintos de los beneficios o afirmar que sólo hacen “lo más que pueden” para aumentar los beneficios, dada su información limitada. Por otra parte, la mayoría de los interrogados
menciona un fuerte “interés” en los beneficios y opina que la maximización de los beneficios es un
objetivo apropiado. Así, la prueba del modelo de optimización de utilidades que consiste en probar
sus supuestos ha proporcionado resultados concluyentes.
Prueba de predicciones
Algunos economistas, Milton Friedman en particular, niegan que un modelo pueda probarse
indagando la “realidad” de sus supuestos.1 Argumentan que todos los modelos teóricos se basan
en supuestos “poco realistas”; la naturaleza misma de la teoria de la demanda exige hacer ciertas
abstracciones. Estos economistas concluyen que la única manera de determinar la validez de un
modelo es ver si es capaz de predecir y explicar sucesos reales. La prueba última de un modelo
económico ocurre cuando se le enfrenta con datos de la economía misma.
Friedman ofrece una ilustración importante de ese principio. Él pregunta qué tipo de teoría
debería usarse para explicar las jugadas que realizarán jugadores expertos de billar. Sostiene que
1
Véase M. Friedman, Essays in Positive Economics (University of Chicago Press, Chicago, 1953), cap. 1. Para una opinión diferente
que subraya la importancia de emplear supuestos “realistas”, véase H. A. Simon, “Rational Decision Making in Business Organizations”, American Economic Review, vol. 69, núm. 4 (septiembre de 1979), pp. 493-513.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 1: Modelos económicos
5
las leyes de la velocidad, el impulso y los ángulos de la física teórica serían un modelo adecuado.
Los jugadores de billar juegan como si siguieran esas leyes. Sin embargo, la mayoría de los jugadores de billar a quienes se les interrogó sobre si comprenden cabalmente los principios físicos en
que se funda el billar sin duda respondieron que no. Aun así, arguye Friedman, las leyes físicas
brindan predicciones atinadas y, por tanto, deberían aceptarse como modelos teóricos apropiados
de cómo juegan billar los expertos.
Por ende, una prueba del modelo de maximización de beneficios se haría prediciendo el comportamiento de empresas reales con base en el supuesto de que estas empresas se comportan como
si maximizaran sus beneficios (véase el ejemplo 1.1, más adelante.) Si estas predicciones son razonablemente acordes con la realidad podemos aceptar la hipótesis de maximización de beneficios.
No obstante, rechazaríamos el modelo si datos reales parecieran incongruentes con él. De ahí que
la prueba última de cualquier teoría sea su capacidad de predecir sucesos reales.
Importancia del análisis empírico
El principal interés de este libro es la elaboración de modelos teóricos. Pero el objetivo de estos
modelos siempre es aprender algo acerca de la realidad. Dado que la inclusión de una larga serie
de ejemplos aplicados ampliaría de modo innecesario un libro ya voluminoso,2 las extensiones al
final de algunos capítulos intentan ofrecer una transición entre la teoría que se presenta aquí y la
forma en que se aplica en estudios empíricos.
CARACTERÍSTICAS GENERALES
DE LOS MODELOS ECONÓMICOS
El número de modelos económicos actualmente en uso es inmenso. Los supuestos específicos
utilizados y el grado de detalle provisto varían demasiado, dependiendo del problema de que se
trate. Los modelos que se usan para explicar el nivel general de la actividad económica en Estados
Unidos, por ejemplo, deben ser mucho más globales y complejos que aquellos que intentan interpretar los precios de las fresas en Arizona. Pese a esta variedad, prácticamente todos los modelos
económicos incorporan tres elementos comunes: 1) el supuesto ceteris paribus (“todo lo demás
igual”); 2) el supuesto de que los tomadores de decisiones económicas buscan optimizar algo, y 3)
una cuidadosa distinción entre cuestiones “positivas” y “normativas”. Puesto que encontraremos
estos elementos a lo largo de este libro, puede ser útil describir de antemano la filosofía en que se
apoyan.
Supuesto ceteris paribus
Como en la mayoría de las ciencias los modelos que se emplean en la economía tratan de describir
relaciones relativamente simples. Un modelo del mercado del trigo, por ejemplo, podría intentar
explicar los precios de ese grano con un número reducido de variables cuantificables como los
salarios de los trabajadores agrícolas, la lluvia o el ingreso de los consumidores. Esta parsimonia
en la especificación del modelo permite estudiar los precios del trigo en un marco simplificado en
el que sea posible saber cómo operan esas fuerzas específicas. Aunque cualquier investigador
admitirá que el precio del trigo se ve afectado por muchas fuerzas “externas” (como presencia de
plagas en el grano, cambios en el precio de los fertilizantes o los tractores, o cambios en el comportamiento de los consumidores respecto a la ingesta de pan), estas otras fuerzas se mantienen
constantes en la construcción del modelo. Es importante advertir que los economistas no suponen
que ningún otro factor afecte los precios del trigo; al contrario, dan por sentado que esas otras
2
Para un texto de nivel intermedio con una amplia serie de aplicaciones reales, véase W. Nicholson y C. Snyder, Intermediate
Microeconomics and Its Application, 11ª ed. (Thomson/Southwestern, Mason OH, 2010).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
6
Parte 1: Introducción
variables se mantienen sin cambios durante el periodo de estudio. Esto permite examinar en un
marco simplificado el efecto de unas cuantas fuerzas. Tales supuestos ceteris paribus (“todo lo
demás igual”) se utilizan en todos los modelos económicos.
El uso del supuesto ceteris paribus plantea algunas dificultades para la comprobación de modelos económicos a partir de datos reales. En otras ciencias estos problemas quizá no sean tan severos, dada la posibilidad de hacer experimentos controlados. Por ejemplo, un físico interesado en
probar un modelo de la fuerza de gravedad tal vez no lo haga arrojando objetos desde el Empire
State. Experimentos realizados de ese modo estarían sujetos a demasiadas fuerzas extrañas (como
corrientes de viento, partículas en el aire y variaciones de temperatura) como para permitir una
prueba precisa de la teoría. Más bien el físico haría experimentos en un laboratorio, utilizando un
vacío parcial en el que la mayoría de las fuerzas adicionales puedan controlarse o eliminarse. De
esta forma, la teoría podría comprobarse en un marco simple sin considerar las demás fuerzas que
en el mundo real afectan la caída de los cuerpos.
Con notables excepciones los economistas no han podido llevar a cabo experimentos controlados para probar sus modelos. En cambio, al verificar sus teorías se han visto obligados a depender de varios métodos estadísticos para controlar otras fuerzas. Aunque en principio estos métodos estadísticos son tan válidos como los métodos de los experimentos controlados que usan
otros científicos, en la práctica plantean varias cuestiones espinosas. Por esta razón las limitaciones y el significado preciso en la economía del supuesto ceteris paribus están sujetos a mayor
controversia que en las ciencias de laboratorio.
Estructura de los modelos económicos
La mayoría de los modelos económicos en este libro tiene una estructura matemática. Destacan
las relaciones entre factores que afectan las decisiones de familias y empresas, y los resultados de
esas decisiones. Los economistas tienden a usar diferentes nombres para estos dos tipos de factores (o en términos matemáticos, variables). Las variables fuera del control de quienes toman las
decisiones se llaman variables exógenas. Estas variables son la entrada de los modelos económicos. Por ejemplo, en la teoría del consumo solemos tratar a los individuos como seguidores de
precios. Los precios de los bienes se determinan fuera de nuestros modelos de comportamiento
del consumidor, y queremos estudiar cómo se ajustan los consumidores a ellos. Los resultados de
esas decisiones (como la cantidad de cada bien que compra un consumidor) son variables endógenas. Estas variables se determinan dentro de nuestros modelos. Esta distinción se representa de
forma esquemática en la figura 1.1. Aunque los modelos desarrollados por los economistas pueden ser complicados, todos tienen esta estructura básica. Una buena manera de comenzar a estudiar un modelo particular es identificando precisamente cómo encaja en este marco.
La distinción entre variables exógenas y endógenas se aclarará a medida que exploremos varios
modelos económicos. Acertar qué variables se determinan fuera de un modelo particular y cuáles
dentro de él puede ser confuso; así, trataremos de recordártelo conforme avancemos. Esta distinción entre variables exógenas y endógenas también es útil para comprender la forma en que el
supuesto ceteris paribus se incorpora a los modelos económicos. En la mayoría de los casos vamos
a querer estudiar cómo cambian los resultados de nuestros modelos cuando una de las variables
exógenas cambia. Es posible, incluso probable, que el cambio en esta variable altere todos los
resultados calculados a partir del modelo. Por ejemplo, como veremos, es probable que el cambio
en el precio de un bien provoque que un individuo modifique las cantidades de prácticamente
todos los bienes que compra. Examinar todas estas respuestas es justo el motivo de que los economistas hagan modelos. El supuesto ceteris paribus se cumple cambiando sólo una variable exógena y manteniendo constantes todas las demás. Si se quieren estudiar los efectos de una modificación en el precio de la gasolina sobre las compras de una familia, en el modelo se cambiará ese
precio pero no los precios de otros bienes (y, en algunos casos, tampoco el ingreso del individuo).
Estudiar el efecto ceteris paribus de un incremento en el precio de la gasolina significa mantener
constantes los demás precios.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 1: Modelos económicos
FIGURA 1.1
Estructura de un modelo
microeconómico
representativo.
7
Los valores de las variables exógenas son las entradas de la mayoría de los modelos económicos. Las salidas
(resultados) del modelo son los valores de las variables endógenas.
VARIABLES EXÓGENAS
Familias: precios de los bienes
Empresas: precios de los insumos
y de producción
MODELO ECONÓMICO
Familias: maximización de la utilidad
Empresas: maximización de los
beneficios
VARIABLES ENDÓGENAS
Familias: cantidades compradas
Empresas: bienes producidos,
insumos contratados
Supuestos de optimización
Muchos modelos económicos parten del supuesto de que los actores económicos estudiados persiguen de modo racional un objetivo. Ya examinamos brevemente un supuesto de esa clase al
investigar la noción de que las empresas maximizan sus beneficios. El ejemplo 1.1 muestra cómo
puede utilizarse ese modelo para hacer predicciones comprobables. Otros ejemplos que se hallarán en este libro incluyen aquellos en que los consumidores maximizan su bienestar (utilidad), las
empresas minimizan costos y los órganos reguladores gubernamentales intentan maximizar el
bienestar público. Aunque todos esos supuestos son poco realistas (como demostraremos) se les
acepta ampliamente como punto de partida para el desarrollo de modelos económicos. Al parecer, esta aceptación tiene dos razones. Primero, los supuestos de optimización son útiles para
generar modelos precisos y con solución, principalmente porque tales modelos pueden valerse de
diversas técnicas matemáticas adecuadas para problemas de optimización. Muchas de estas técnicas, junto con la lógica que las sustenta, se estudiarán en el capítulo 2. Una segunda razón de la
popularidad de los modelos de optimización concierne a su aparente validez empírica. Como
indicarán algunas de nuestras extensiones, dichos modelos parecen ser muy apropiados para
explicar la realidad. En general, entonces, los modelos de optimización han terminado por ocupar
una posición destacada en la teoría económica moderna.
EJEMPLO 1.1 Maximización de beneficios
La hipótesis de maximización de beneficios es una ilustración útil de cómo pueden usarse los supuestos
de optimización para generar proposiciones empíricamente comprobables sobre el comportamiento económico. Supongamos que una empresa puede vender toda la producción que desee a un precio p por
unidad, y que el costo total de producción, C, depende de la cantidad producida, q. Así, los beneficios
están dados por
beneficios pq
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
C(q).
(1.1)
8/23
8
Parte 1: Introducción
La maximización de los beneficios consiste en hallar el valor de q, que maximiza la expresión de los beneficios en la ecuación 1.1. Este es un problema simple de cálculo. Diferenciar la ecuación 1.1 e igualar a 0
esa derivada da la siguiente condición de primer orden para un máximo:
dp
p
dq
C (q) 0 o
p C (q).
(1.2)
Es decir, el nivel de producción de maximización de beneficios (q∗) se determina seleccionando el nivel de
producción en que el precio es igual al costo marginal, C(q). Este resultado debe parecerte conocido
debido al curso de introducción a la economía. Nótese que en esta derivación el precio de producción de
la empresa se trata como una constante porque la empresa es seguidora de precios. Es decir, el precio es
una variable exógena en este modelo.
La ecuación 1.2 es apenas la condición de primer orden para un máximo. Tomar en cuenta la condición de segundo orden puede ayudarnos a derivar una implicación comprobable de este modelo. La
condición de segundo orden para un máximo es que en q∗ debe ocurrir que:
d 2p
dq 2
C (q) < 0
o
C (q ) > 0.
(1.3)
Es decir, el costo marginal debe aumentar en q∗ para que este sea un punto verdadero de beneficios máximos.
Nuestro modelo puede usarse ahora para “predecir” cómo reaccionará una empresa a un cambio de
precio. Para hacerlo, diferenciamos la ecuación 1.2 respecto al precio (p), suponiendo que la empresa
continúa eligiendo un nivel de maximización de beneficios de q:
d[p
C (q ) 0
1
dp
C (q
dq
0.
dp
(1.4)
Al reordenar un poco los términos resulta que:
dq
1
> 0.
dp
C (q )
(1.5)
Aquí la desigualdad final refleja de nuevo el hecho de que el costo marginal debe aumentar en q∗ para que
este punto sea un máximo verdadero. Esta es, así, una de las proposiciones comprobables de la hipótesis
de maximización de los beneficios: si lo demás no cambia, una empresa seguidora de precios debería
responder a un incremento de precio aumentando su producción. Si, por el contrario, las empresas responden a incrementos de precio reduciendo su producción, debe haber un error en nuestro modelo.
Aunque este es un modelo simple, refleja la forma en que procederemos a lo largo de gran parte
de este libro. Específicamente, el hecho de que la implicación primaria del modelo se derive mediante
cálculo y consista en mostrar qué signo debe tener una derivada, es el tipo de resultado que veremos
muchas veces. Adviértase que en este modelo sólo hay una variable endógena: q, la cantidad que la
empresa decide producir. De igual forma, sólo hay una variable exógena: p, el precio del producto que
la empresa da por sentado. Nuestro modelo hace una predicción específica sobre la forma en que los
cambios en esta variable exógena afectan la decisión de producción de la empresa.
PREGUNTAS: En términos generales, ¿cómo cambiarían las implicaciones de este modelo, si el precio
que una empresa obtiene por su producción estuviera en función de cuánto vendió? Es decir, ¿cómo
operaría el modelo si se abandonara el supuesto de seguimiento de precios?
Distinción positivo-normativo
Una última característica de la mayoría de los modelos económicos es el intento de diferenciar
cuidadosamente entre cuestiones “positivas” y “normativas”. Hasta aquí nos hemos ocupado
sobre todo de teorías económicas positivas. Estas teorías toman la realidad como objeto de estudio, tratando de explicar los fenómenos económicos observados. La economía positiva busca
determinar la forma en que los recursos se asignan de hecho en una economía. Un tanto diferente
en el uso de la teoría económica es el análisis normativo, adoptando una postura definida sobre lo
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 1: Modelos económicos
9
que debería hacerse. Bajo el rubro del análisis normativo los economistas tienen mucho que decir
sobre cómo deberían asignarse los recursos. Por ejemplo, un economista dedicado al análisis positivo podría investigar cómo se determinan los precios en la economía de atención a la salud de
Estados Unidos. Asimismo, este economista podría desear medir los costos y beneficios de destinar aun más recursos a la atención de la salud ofreciendo, por ejemplo, seguro médico subsidiado
por el gobierno. Pero cuando argumenta específicamente que debería adoptarse ese plan de seguros, el análisis se vuelve normativo.
Algunos economistas creen que el único análisis propiamente económico es el positivo. Estableciendo una analogía con las ciencias físicas, éstas sostienen que la economía “científica” sólo
debe ocuparse de la descripción (y, quizá, la predicción) de sucesos económicos reales. Adoptar
posiciones políticas y abogar por intereses especiales se juzga ajeno a la competencia de un economista como tal. Claro que, como cualquier otro ciudadano, un economista es libre de expresar
sus opiniones políticas, pero al hacerlo actúa como ciudadano, no como economista. A otros
economistas, sin embargo, la distinción positivo-normativo les parece artificial. Creen que el
estudio de la economía involucra necesariamente las opiniones de los investigadores sobre ética,
moral y justicia. Según estos economistas, en dichas circunstancias es inútil buscar “objetividad”
científica. Pese a cierta ambigüedad este libro intenta adoptar un tono positivo, dejando las consideraciones normativas para decisión de cada quien.
DESARROLLO DE LA TEORÍA ECONÓMICA
DEL VALOR
Puesto que la actividad económica es una característica central de todas las sociedades sorprende
que estas actividades no se hayan estudiado en detalle hasta fecha muy reciente. A los fenómenos
económicos se les trataba casi invariablemente como un aspecto básico de la conducta humana no
lo bastante interesante para merecer atención específica. Es cierto, desde luego, que los individuos
siempre han estudiado las actividades económicas con la mira puesta en la obtención de algún
tipo de beneficio personal. Los comerciantes romanos no eran ajenos a la obtención de beneficios
en sus transacciones. Pero las investigaciones sobre la naturaleza básica de esas actividades no
empezaron en serio hasta el siglo xviii.3 Dado que este libro trata de la teoría económica en su
estado actual más que de la historia del pensamiento económico, nuestro análisis de la evolución
de la teoría económica será breve. Se examinará en su marco histórico sólo un área del estudio
económico: la teoría del valor.
Reflexiones económicas iniciales sobre el valor
La teoría del valor se refiere a los determinantes del “valor” de una mercancía. Este tema está en
el centro de la teoría microeconómica moderna y se vincula de forma estrecha con el problema
económico fundamental de asignar recursos escasos a diferentes usos. El punto de partida lógico
es una definición del término “valor”. Por desgracia, el significado de esta palabra no ha sido sistemático durante el desarrollo de este tema. Hoy “valor” es sinónimo del precio de una mercancía.4 Los primeros filósofos-economistas, sin embargo, hacían una distinción entre el precio de
mercado de una mercancía y su valor. El término valor se concebía entonces, en cierto sentido,
como sinónimo de “importancia”, “esencia” o (a veces) “santidad”. Dado que “precio” y “valor”
eran conceptos aparte, podían diferir, y la mayoría de los primeros análisis económicos se centraron en esas divergencias. Por ejemplo, santo Tomás de Aquino creía que el valor estaba divinamente determinado. Como los precios los fijaban seres humanos, era posible que el precio de una
3
Para un tratamiento detallado del pensamiento económico temprano, véase la obra clásica de J. A. Schumpeter, History of Economic Analysis (Oxford University Press, Nueva York, 1954), parte II, capítulos 1-3.
4
Esto no es del todo cierto cuando implica “externalidades”, caso en que debe hacerse una distinción entre valor privado y social
(véase el capítulo 19).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
10
Parte 1: Introducción
mercancía difiriera de su valor. A una persona acusada de cobrar un precio superior al valor de un
bien se le culpaba de imponer un precio “injusto”. Aquino creía que, en la mayoría de los casos, la
tasa de interés “justa” era cero. Todo prestamista que exigía un pago por el uso de dinero imponía
un precio injusto y podía ser procesado (y en ocasiones así ocurrió) por los funcionarios eclesiásticos.
Fundación de la economía moderna
A fines del siglo xviii los filósofos comenzaron a adoptar un enfoque más científico de los asuntos
económicos. La publicación, en 1776, de The Wealth of Nations (La riqueza de las naciones) de
Adam Smith (1723-1790) es considerada, en general, el inicio de la economía moderna. En esa
vasta y exhaustiva obra Smith sentó las bases de la reflexión sobre las fuerzas del mercado en
forma ordenada y sistemática. Aun así él y sus sucesores inmediatos, como David Ricardo (17721823), siguieron distinguiendo entre valor y precio. Para Smith, por ejemplo, el valor de una
mercancía aludía a su “valor de uso”, mientras que el precio representaba su “valor de cambio”.
Esta distinción entre ambos conceptos se ilustró con la famosa paradoja del agua y el diamante. El
agua, que posee obviamente gran valor de uso, tiene poco valor de cambio (precio bajo); los diamantes son de escasa utilidad práctica, pero tienen gran valor de cambio. Esta paradoja a la que
se enfrentaron los primeros economistas se deriva de la observación de que algunos objetos útiles
tienen un precio bajo, en tanto que ciertos objetos no esenciales tienen un precio alto.
Teoría del valor de cambio del trabajo
Ni Smith ni Ricardo resolvieron de modo satisfactorio la paradoja del agua y el diamante. El concepto de valor de uso se cedió al debate de los filósofos mientras los economistas dirigían su
atención a explicar las determinantes del valor de cambio (es decir, los precios relativos). Una
obvia explicación posible es que el valor de cambio de los bienes está determinado por lo que
cuesta producirlos. El costo de producción está principalmente sujeto a la influencia del costo de
la mano de obra —o al menos así era en tiempos de Smith y Ricardo—, de manera que faltaba un
solo paso para adoptar una teoría del valor-trabajo. Por ejemplo, parafraseando un ejemplo de
Smith, si cazar un venado implica el doble de horas de trabajo que cazar un castor, un venado
debería intercambiarse por dos castores. En otras palabras, el precio de un venado debería ser
el doble del de un castor. De igual manera, los diamantes son relativamente costosos porque su
producción requiere un insumo sustancial de trabajo, mientras que el agua se consigue gratis.
A los estudiantes con un conocimiento incluso superficial de lo que ahora llamamos la ley de
la oferta y la demanda, la explicación de Smith y Ricardo debe parecerles incompleta. ¿Estos autores no reconocieron los efectos de la demanda en el precio? La respuesta a esta pregunta es sí y no.
Observaron periodos de precios relativos que subían y bajaban rápidamente, y atribuyeron esos
cambios a modificaciones en la demanda. Sin embargo, los consideraron anormalidades que sólo
producían una divergencia temporal entre el precio de mercado y el valor del trabajo. Como no
desarrollaron una teoría del valor de uso se resistían a conceder a la demanda algo más que un
papel fugaz en la determinación de los precios relativos. Suponían más bien que el valor de cambio a largo plazo sólo estaba determinado por los costos laborales de producción.
Revolución marginalista
Entre 1850 y 1880 los economistas repararon cada vez más en que para elaborar una alternativa
adecuada de la teoría del valor-trabajo tenían que concebir una teoría del valor de uso. En la
década de 1870 varios de ellos descubrieron que lo que determina el valor de cambio de una mercancía no es su utilidad total, sino la utilidad de la última unidad consumida. Por ejemplo, el agua
es sin duda, útil: es necesaria para todas las formas de vida.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 1: Modelos económicos
FIGURA 1.2
Intersección ofertademanda de Marshall.
11
Marshall mostró que la demanda y la oferta interactúan entre sí para determinar el precio de equilibrio (p*)
y la cantidad (q*) que se comercializará en el mercado. Concluyó que no puede decirse que la demanda o la
oferta determinen por sí solas el precio ni que, por tanto, los costos o la utilidad para los compradores determinen por sí solos el valor de cambio.
Precio
D
S
p*
D
S
q*
Cantidad por periodo
Sin embargo, como el agua es relativamente abundante, consumir medio litro más (ceteris paribus) tiene un valor relativamente bajo para la gente. Estos “marginalistas” redefinieron el concepto de valor de uso desde una idea de utilidad general hasta otra de utilidad marginal o incremental: la utilidad de una unidad adicional de una mercancía. El concepto de demanda de una
unidad incremental de producción se contrastó entonces con el análisis de Smith y Ricardo sobre
los costos de producción para derivar una descripción completa de la determinación de precios.5
Síntesis oferta-demanda de Marshall
La formulación más clara de estos principios marginales fue presentada por el economista inglés
Alfred Marshall (1842-1924) en sus Principles of Economics (Principios de economía), publicados
en 1890. Marshall demostró que demanda y oferta operan simultáneamente para determinar el
precio. Como él mismo señaló, así como no puede decirse cuál de las hojas de unas tijeras hace
el corte, tampoco puede decirse si es la demanda o la oferta la que determina por sí sola el precio.
Este análisis es ilustrado por la famosa intersección de Marshall, que aparece en la figura 1.2. En
este diagrama la cantidad de un bien, adquirida por periodo, se indica en el eje horizontal y su
precio aparece en el eje vertical. La curva DD representa la cantidad demandada del bien por
periodo en cada precio posible. Esta curva es de pendiente negativa para reflejar el principio marginalista de que, al aumentar la cantidad, la gente está dispuesta a pagar menos por la última
unidad comprada. Lo que fija el precio de todas las unidades adquiridas es el valor de esta última
unidad. La curva SS muestra cómo aumenta el costo (marginal) de producción al incrementarse
la producción. Esto refleja el costo creciente de producir una unidad más al aumentar la producción total. En otras palabras, la pendiente ascendente de la curva SS refleja costos marginales
crecientes, así como la pendiente descendente DD refleja un valor marginal decreciente. Estas dos
curvas se cruzan en p∗, q∗. Este es un punto de equilibrio: tanto compradores como vendedores
están satisfechos con la cantidad comerciada y el precio al que se le vende. Si una de las curvas
cambiara, el punto de equilibrio pasaría a una nueva ubicación. Así, precio y cantidad están
simultáneamente determinados por la operación conjunta de la oferta y la demanda.
5
Ricardo ya había dado un importante primer paso en el análisis marginal en su estudio de la renta. Consideró que al aumentar
la producción de maíz se usaría tierra de calidad inferior, lo que causaría un aumento en el precio del maíz. En su argumento
reconoció que lo relevante para la fijación del precio es el costo marginal, el costo de producir una unidad adicional. Nótese que
mantuvo implícitamente otros insumos constantes al tratar la productividad decreciente de la tierra; es decir, usó una versión del
supuesto ceteris paribus.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
12
Parte 1: Introducción
EJEMPLO 1.2 Equilibrio oferta-demanda
Aunque las presentaciones gráficas son adecuadas para algunos propósitos, los economistas suelen usar
representaciones algebraicas de sus modelos tanto para aclarar sus argumentos como para darles más
precisión. Como un ejemplo elemental supongamos que queremos estudiar el mercado de los cacahuates
y que, con base en el análisis estadístico de datos históricos, concluimos que la cantidad de cacahuates demandada cada semana (q, medida en bushels)6 depende del precio de los cacahuates (p, medido en
dólares por bushel), de acuerdo con la ecuación:
cantidad demandada qD 1 000 100p.
(1.6)
Como esta ecuación de qD contiene únicamente la variable independiente p, mantenemos implícitamente
constantes todos los demás factores que podrían afectar la demanda de cacahuates. La ecuación 1.6
indica que, de no cambiar nada más, a un precio de $5 por bushel la gente demandará 500 bushels de
cacahuates, mientras que a un precio de $4 por bushel, demandará 600 bushels. El coeficiente negativo
de p en la ecuación 1.6 refleja el principio marginalista de que un precio menor provocará que la gente
compre más cacahuates.
Para completar este modelo simple de determinación de precios supongamos que la cantidad de
cacahuates ofrecida también depende del precio:
cantidad ofrecida qS 125 125p.
(1.7)
Aquí, el coeficiente positivo del precio refleja asimismo el principio marginal de que un precio más alto ocasionará una oferta mayor, sobre todo porque (como vimos en el ejemplo 1.1) permitirá a las empresas incurrir en costos marginales de producción más altos sin sufrir pérdidas en las unidades adicionales producidas.
Determinación del precio de equilibrio. En consecuencia, las ecuaciones 1.6 y 1.7 reflejan nuestro
modelo de determinación del precio en el mercado de los cacahuates. Un precio de equilibrio puede
hallarse al igualar la cantidad demandada con la cantidad ofrecida:
qD qS
(1.8)
1 000 100p 125 125p
(1.9)
225p 1 125
(1.10)
p∗ 5.
(1.11)
o
o
así,
A un precio de $5 por bushel este mercado está en equilibrio: en ese precio, la gente querrá adquirir 500
bushels, justo lo que los productores de cacahuates están dispuestos a ofrecer. Este equilibrio se representa de manera gráfica como la intersección de D y S en la figura 1.3.
Un modelo más general. Para ilustrar cómo podría usarse este modelo de oferta-demanda, adoptemos
una notación más general. Supongamos ahora que las funciones de demanda y oferta están dadas por:
qD a bp y
qS c dp
(1.12)
donde a y c son constantes que pueden usarse para modificar las curvas de demanda y oferta, respectivamente; y b (0) y d ( 0) representan reacciones de demandantes y ofertantes al precio. El equilibrio en
este mercado requiere:
qD qS o
(1.13)
a bp c dp.
7
Así, el precio de equilibrio está dado por:
a c
.
p (1.14)
d b
6
El bushel es una unidad de medida inglesa de capacidad (masa o volumen) para mercancía sólida. Se utiliza en el comercio de
granos, harinas y otros productos similares. En Reino Unido un bushel tiene 4 pecks o 32 quarts, y equivale a 1.03205 del bushel
de los Estados Unidos, que a su vez equivale a 0.35238 hectolitros.
7
La ecuación 1.14 también se conoce como la “forma reducida” del modelo estructural de oferta-demanda de las ecuaciones 1.12
y 1.13. Indica que el valor de equilibrio de la variable endógena p sólo depende en definitiva de los factores exógenos en el modelo
(a y c) y de los parámetros de comportamiento b y d. Una ecuación similar puede calcularse respecto de la cantidad de equilibrio.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 1: Modelos económicos
FIGURA 1.3 Equilibrios cambiantes de oferta-demanda
El equilibrio de oferta-demanda inicial es ilustrado por la intersección de D y S (p* 5, q* 500). Cuando
la demanda se desplaza a qD 1 450 100p (denotado por D), el equilibrio cambia a p* 7, q* 750.
Precio
($)
D′
14.5
S
D
10
7
5
S
0
500
750
D
D′
1 000
1 450
Cantidad por
periodo (en bushels)
Nótese que en nuestro ejemplo previo a 1 000, b 100, c 125 y d 125; por tanto:
p 1 000 125 1 125
5.
125 100
225
(1.15)
Con esta formulación más general, sin embargo, podemos plantear preguntas sobre cómo podría cambiar el precio de equilibrio si la curva de demanda o de oferta cambiara. Por ejemplo, la diferenciación de
la ecuación 1.14 muestra que:
dp
1
0,
da
d b
dp
1
0.
dc
d b
(1.16)
Es decir, un aumento en la demanda (un aumento en a) incrementa el precio de equilibrio, mientras que
un aumento en la oferta (un aumento en c) reduce el precio. Esto es justo lo que mostraría un análisis
gráfico de curvas de oferta y demanda. Por ejemplo, la figura 1.3 indica que cuando la constante, a, en la
ecuación de demanda aumenta a 1 450, el precio de equilibrio aumenta a p∗ 7 [ (1 450 125)/225].
PREGUNTAS: ¿Cómo podrías usar la ecuación 1.16 para “predecir” en qué forma cada incremento
unitario en la constante exógena a afecta la variable endógena p? ¿Esta ecuación predice correctamente el
incremento en p∗, cuando la constante a aumenta de 1 000 a 1 450?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
13
8/23
14
Parte 1: Introducción
Resolución de la paradoja
El modelo de Marshall resuelve la paradoja del agua y el diamante. Los precios reflejan tanto la
evaluación marginal que los demandantes hacen de los bienes, como el costo marginal de producir esos bienes. Visto de esta manera no hay paradoja. El agua es de bajo precio porque tiene un
valor marginal bajo y un bajo costo marginal de producción. En cambio, los diamantes son de alto
precio porque tienen un valor marginal alto (la gente está dispuesta a pagar mucho por uno más)
y un alto costo marginal de producción. Este modelo básico de oferta y demanda está en la base
de gran parte del análisis que se presentará en este libro.
Modelos de equilibrio general
Aunque el modelo de Marshall es un instrumento sumamente útil y versátil, constituye un modelo
de equilibrio parcial, ya que sólo considera un mercado a la vez. En algunas cuestiones esta reducción de la perspectiva aporta valiosas ideas y sencillez analítica. Pero en cuestiones más amplias
un punto de vista tan estrecho puede impedir que se descubran relaciones importantes entre
mercados. Para responder preguntas más generales debemos disponer de un modelo de toda la
economía que refleje de manera conveniente las relaciones entre varios mercados y agentes económicos. El economista francés Leon Walras (1831-1910), partiendo de una larga tradición europea en dicho análisis, sentó las bases de la investigación moderna en esas grandes preguntas. Su
método de representar la economía con gran número de ecuaciones simultáneas es la base para
comprender las interrelaciones implícitas en el análisis del equilibrio general. Walras reconoció
que no se puede hablar de un mercado en aislamiento; se requiere un modelo que permita que los
efectos del cambio en un mercado sean seguidos en otros.
Supongamos, por ejemplo, que la demanda de cacahuates aumenta. Esto provocaría un incremento en su precio. El análisis marshalliano intentaría conocer la magnitud de este incremento,
examinando las condiciones de oferta y demanda en el mercado de los cacahuates. El análisis del
equilibrio general no sólo examinaría ese mercado, sino también las repercusiones en otros. Un
aumento en el precio de los cacahuates incrementaría los costos para los productores de crema de
cacahuate, lo que a su vez afectaría la curva de oferta de este producto. De igual manera, un precio
más alto de los cacahuates podría significar precios de la tierra más altos para los agricultores, lo
que afectaría las curvas de demanda de todos los productos que estos compran. Las curvas de
demanda de automóviles, muebles y viajes a Europa cambiarían, lo cual podría generar ingresos
adicionales para los proveedores de dichos productos. En consecuencia, los efectos del aumento
inicial en la demanda de cacahuates se extenderían a la larga a toda la economía. El análisis del
equilibrio general trata de desarrollar modelos que nos permitan examinar tales efectos en un
marco simplificado. Varios modelos de este tipo se describirán en el capítulo 13.
Frontera de posibilidades de producción
Aquí presentaremos brevemente algunas ideas del equilibrio general, usando otro gráfico que
debes recordar de tu curso de introducción a la economía: la frontera de posibilidades de producción. Este gráfico muestra las diversas cantidades de dos bienes que una economía puede producir
usando sus recursos disponibles durante cierto periodo (una semana, digamos). Dado que la
frontera de posibilidades de producción muestra dos bienes, no uno solo como el modelo de
Marshall, sirve como componente básico de modelos de equilibrio general.
La figura 1.4 muestra la frontera de posibilidades de producción de dos bienes: alimentos y
ropa; e ilustra la oferta de estos bienes exhibiendo las combinaciones que es posible producir con
los recursos de esa economía. Por ejemplo, podrían producirse 4 kg de alimentos y 3 unidades de
ropa, o 1 kg de alimentos y 12 unidades de ropa, aunque también serían posibles muchas otras
combinaciones de alimentos y ropa. La frontera de posibilidades de producción las muestra todas.
Las combinaciones de alimentos y ropa fuera de esta frontera son imposibles de producir porque
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 1: Modelos económicos
FIGURA 1.4
Frontera de posibilidades
de producción.
15
La frontera de posibilidades de producción muestra las diferentes combinaciones de dos bienes que pueden
producirse a partir de cierta cantidad de recursos escasos. También muestra el costo de oportunidad de producir mayor cantidad de un bien en relación con la cantidad del otro bien que, en consecuencia, no se puede
producir. El costo de oportunidad en dos niveles diferentes de producción de ropa puede verse comparando
los puntos A y B.
Cantidad
de alimentos
por semana
Costo de oportunidad
de la ropa = 14 kg
de alimentos
A
10
9.5
Costo de oportunidad
de la ropa = 1 kg
de alimentos
B
4
2
0
3
4
12 13
Cantidad
de ropa
por semana
no se dispone de recursos suficientes para ello. La frontera de posibilidades de producción nos
recuerda la realidad económica básica de que los recursos son escasos: no hay suficientes recursos
disponibles para producir todo lo que podríamos querer de cada bien.
Esta escasez significa que debemos decidir cuánto producir de cada bien. La figura 1.4 deja en
claro que toda decisión tiene sus costos. Por ejemplo, si esta economía produce 4 kg de alimentos
y 3 unidades de ropa en el punto A, producir 1 unidad más de ropa “costaría” ¼ kg de alimentos;
aumentar la producción de ropa en 1 unidad significa que la producción de alimentos tendría que
reducirse ¼ kg. Así, el costo de oportunidad de 1 unidad de ropa en el punto A es ¼ kg de alimentos. Por otro lado, si la economía produce en un principio 2 kg de alimentos y 12 unidades de ropa
en el punto B, costaría 1 kg de alimentos producir 1 unidad más de ropa. El costo de oportunidad
de 1 unidad más de ropa en el punto B ha aumentado a 1 kg de alimentos. Como en el punto B se
producen más unidades de ropa que en el punto A, las ideas de costos incrementales crecientes de
Ricardo y Marshall sugieren que el costo de oportunidad de una unidad adicional de ropa será
más alto en el punto B que en el punto A. Este efecto se muestra en la figura 1.4.
La frontera de posibilidades de producción brinda dos ideas de equilibrio general que no están
claras en el modelo de oferta y demanda de un solo mercado de Marshall. Primero, el gráfico
indica que producir mayor cantidad de un bien significa producir menos de otro porque los
recursos son escasos. Los economistas emplean a menudo (¡quizá demasiado a menudo!) la
expresión “ninguna comida es gratis” para explicar que cada acción económica tiene costos de
oportunidad. Segundo, la frontera de posibilidades de producción señala que los costos de oportunidad dependen de cuánto se produce de cada bien. Es como una curva de oferta de dos bienes:
muestra el costo de oportunidad de producir mayor cantidad de un bien a partir de la disminución en la cantidad del segundo por la escasez de recursos. Así, la frontera de posibilidades de
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
16
Parte 1: Introducción
producción es un instrumento particularmente útil para estudiar varios mercados al mismo
tiempo.
EJEMPLO 1.3 Frontera de posibilidades de producción e ineficiencia económica
Los modelos de equilibrio general son herramientas útiles para evaluar la eficiencia de diversos sectores
económicos. Como veremos en el capítulo 13 estos modelos se han usado para evaluar una amplia variedad de políticas, como acuerdos comerciales, estructuras tributarias y reglamentos ambientales. En este
ejemplo exploraremos la idea de la eficiencia en su forma más elemental.
Supóngase que una economía produce dos bienes, x y y, usando el trabajo como único insumo.
La función de producción del bien x es x lx0.5 (donde lx es la cantidad de trabajo usada en la producción de x), y la función de producción del bien y es y 2ly0.5. El trabajo total disponible está limitado por
lx ly 200. La elaboración de la frontera de posibilidades de producción en esta economía es muy
simple:
lx ly x2 0.25y2
(1.17)
200
donde la igualdad se mantiene con exactitud si la economía debe producir lo más posible (motivo por el
cual, después de todo, este recurso se llama “frontera”). La ecuación 1.17 indica que, en este caso, la frontera tiene la forma de un cuarto de elipse; su concavidad se deriva de los rendimientos decrecientes
exhibidos por cada función de producción.
Costo de oportunidad. Suponiendo que esta economía está en la frontera, el costo de oportunidad del
bien y en términos del bien x puede derivarse despejando y, en esta forma:
y2 800
4x2
o
y 1800
4x2 [800
4x2]0.5
(1.18)
y diferenciando después esta expresión:
dy
0.5[800
dx
4x2
0.5
8x) 4x
.
y
(1.19)
Supongamos, por ejemplo, que el trabajo se asigna en partes iguales entre los dos bienes. Así, x 10,
y 20 y dy/dx 4(10)/20 2. Con esta asignación de trabajo cada incremento unitario en la producción de x requeriría una reducción de 2 unidades en y. Esto puede comprobarse considerando una
asignación alternativa, lx 101 y ly 99. Ahora la producción es x 10.05 y y 19.9. El traslado a esta
otra asignación resultaría en:
y
(19.9 20)
0.1
x (10.05 10)
0.05
2,
justo lo que se derivó del método de cálculo.
Concavidad. La ecuación 1.19 ilustra claramente la concavidad de la frontera de posibilidades de producción. La pendiente de la frontera se vuelve más pronunciada (más negativa) al aumentar la producción de x y disminuir la de y. Por ejemplo, si el trabajo se asigna de tal manera que lx 144 y ly 56, la
producción es x 12 y y ≈ 15, de modo que dy/dx 4(12)/15 3.2. Al aumentar la producción de
x, el costo de oportunidad de una unidad más de x aumenta de 2 a 3.2 unidades de y.
Ineficiencia. Si una economía opera dentro de su frontera de posibilidades de producción, lo hace en
forma ineficiente. Rebasar la frontera podría incrementar la producción de ambos bienes. En este libro
exploraremos muchas razones de tal ineficiencia. Éstas suelen derivarse de que un mercado no se desempeñe de forma correcta. Para los efectos de nuestro ejemplo supongamos que el mercado de trabajo de
esta economía no funciona bien y que 20 trabajadores están permanentemente desempleados. Ahora la
frontera de posibilidades de producción se vuelve:
x2 0.25y2 180,
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(1.20)
8/23
Capítulo 1: Modelos económicos
17
y las combinaciones de producción previamente descritas ya no son factibles. Por ejemplo, si x 10, la
producción de y es ahora y ≈ 17.9. La pérdida de aproximadamente 2.1 unidades de y es una medida del
costo de la ineficiencia del mercado de trabajo. O bien, si la oferta de trabajo de 180 se asignara en partes
iguales entre la producción de los dos bienes, tendríamos x ≈ 9.5 y y ≈ 19, y la ineficiencia aparecería en
la producción de ambos bienes: se podría producir mayor cantidad de ambos si se resolviera la ineficiencia del mercado de trabajo.
PREGUNTAS: ¿Cómo se mediría el costo de ineficiencia de las imperfecciones del mercado de trabajo
en términos únicamente de la producción de x en este modelo? ¿Cómo se mediría en términos sólo de la
producción de y? ¿Qué tendrías que saber para asignar un solo número al costo de eficiencia de la imperfección cuando el trabajo se asigna de modo equitativo a ambos bienes?
Economía de bienestar
Además de usar modelos económicos para examinar cuestiones positivas sobre cómo opera la
economía, las herramientas usadas en el análisis del equilibrio general también se han aplicado al
estudio de cuestiones normativas sobre las propiedades de bienestar de varios ordenamientos
económicos. Aunque estas cuestiones fueron de enorme interés para los grandes economistas de
los siglos xviii y xix (como Smith, Ricardo, Marx y Marshall), quizá los avances más significativos en estos estudio los han logrado el economista británico Francis Y. Edgeworth (1848-1926) y
el italiano Vilfredo Pareto (1848-1923) a principios del siglo xx. Estos economistas ofrecieron una
definición precisa del concepto de “eficiencia económica” y ayudaron a mostrar las condiciones en
las cuales los mercados podrán alcanzar esa meta. Al esclarecer la relación entre los precios derivados de la asignación de recursos dieron cierto sustento a la idea, originalmente enunciada por
Adam Smith, de que los mercados que funcionan de manera apropiada brindan una “mano invisible” que ayuda a la eficiente asignación de recursos. En secciones posteriores de este libro se
abordan algunas de estas cuestiones de bienestar.
EVOLUCIÓN MODERNA
La investigación económica se extendió rápidamente en los años que siguieron a la segunda Guerra Mundial. Uno de los principales objetivos de este libro es resumir gran parte de dicha investigación. Al ilustrar cómo los economistas han intentado desarrollar modelos para explicar aspectos más complejos del comportamiento de la vida económica, este libro pretende ayudarte a
identificar algunas de las preguntas que aún esperan respuesta.
Fundamentos matemáticos de los modelos económicos
Un avance importante de la teoría microeconómica en la posguerra fue la aclaración y la formalización de los supuestos básicos sobre individuos y empresas. El primer hito en este sentido fue
la publicación, en 1947, de Foundations of Economic Analysis (Fundamentos del análisis económico) de Paul Samuelson (el primer estadounidense en obtener el Premio Nobel de Economía)
quien expone varios modelos de comportamiento optimizador.8 Samuelson demostró la importancia de basar los modelos conductuales en postulados matemáticos detalladamente especificados para que fuera posible aplicar varias técnicas matemáticas de optimización. La eficacia de este
enfoque dejó ver con toda claridad que las matemáticas se habían vuelto parte integral de la economía moderna. En el capítulo 2 de este libro se estudiarán algunos de los conceptos matemáticos
de uso más frecuente en la microeconomía.
8
Paul A. Samuelson, Foundations of Economic Analysis (Harvard University Press, Cambridge, 1947).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
18
Parte 1: Introducción
Nuevas herramientas para el estudio de mercados
Una segunda característica que se ha incorporado en este libro es la presentación de varias nuevas
herramientas para explicar los equilibrios del mercado. Entre ellas están las técnicas para describir la determinación de precios en mercados específicos, como los modelos cada vez más sofisticados de los precios de los monopolios o los de relaciones estratégicas entre empresas que hacen
uso de la teoría de juegos. También están las herramientas de equilibrio general para explorar de
forma simultánea las relaciones entre muchos mercados. Como veremos, todas estas nuevas técnicas contribuyen a ofrecer una representación más completa y realista de cómo operan los mercados.
Economía de la incertidumbre y la información
Un último avance teórico del periodo de la posguerra fue la incorporación de la incertidumbre y
la información imperfecta en los modelos económicos. Algunos de los supuestos básicos para
estudiar el comportamiento de la incertidumbre fueron originalmente desarrollados en la década
de 1940 en relación con la teoría de juegos. Adelantos posteriores muestran cómo podían usarse
estas ideas para explicar por qué los individuos tienden a sentir aversión al riesgo y cómo podrían
reunir información para reducir las incertidumbres que enfrentan. Dentro del análisis en este
libro en muchas ocasiones se introducirán problemas de incertidumbre e información.
Computadoras y análisis empírico
Cabe mencionar un último aspecto de la evolución de la microeconomía en la posguerra: el
uso creciente de computadoras para analizar datos y elaborar modelos económicos. A medida que
las computadoras han adquirido mayor capacidad de manejar grandes cantidades de información
y de ejecutar tratamientos matemáticos complejos, la aptitud de los economistas para probar sus
teorías ha aumentado drásticamente. Mientras que las generaciones anteriores tenían que conformarse con rudimentarios análisis tabulares o gráficos de datos reales, hoy los economistas disponen de una extensa variedad de técnicas sofisticadas, además de amplios datos microeconómicos
con los cuales probar sus modelos. El examen de estas técnicas y de algunas de sus limitaciones
rebasa el alcance y el propósito de este libro; sin embargo, las extensiones al final de la mayoría de
los capítulos fueron pensadas para empezar a documentarse sobre algunas de esas aplicaciones.
Resumen
Este capítulo aporta antecedentes de cómo abordan los economistas el estudio de la asignación de recursos. Seguramente ya se
conoce gran parte del material analizado aquí, propio del curso de
introducción a la economía. En muchos sentidos el estudio de la
economía significa adquirir herramientas cada vez más sofisticadas para tratar los mismos problemas básicos. El propósito de este
libro (y de la mayoría de los de nivel superior sobre economía) es
proporcionar más herramientas de ese tipo. Como punto de partida este capítulo recuerda los siguientes puntos:
• La economía es el estudio de cómo se distribuyen los recursos
escasos entre diferentes usos. Los economistas intentan desarrollar modelos simples para entender ese proceso. Muchos de
estos modelos tienen una base matemática porque el uso de las
matemáticas ofrece una simbología precisa para formular los
modelos y explorar sus consecuencias.
• El modelo económico de uso más común es el de ofertademanda, exhaustivamente desarrollado por Alfred Marshall a
fines del siglo xix. Este modelo muestra que los precios observados pueden entenderse como la representación del equilibrio de los costos de producción en que incurren las empresas
y la disposición de los demandantes a pagar dichos costos.
• El modelo de equilibrio de Marshall es apenas “parcial”; es
decir, considera un mercado por vez. Examinar muchos mercados juntos requiere una serie ampliada de herramientas de
equilibrio general.
• Probar la validez de un modelo económico es quizá la tarea
más difícil que enfrentan los economistas. Ocasionalmente la
validez de un modelo puede estimarse preguntando si este se
basa en supuestos “razonables”. Más a menudo, sin embargo,
los modelos se juzgan por lo bien que pueden explicar sucesos
económicos reales.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 1: Modelos económicos
19
Sugerencias de lecturas adicionales
Sobre metodología
Blaug, Mark y John Pencavel. The Methodology of Economics: Or
How Economists Explain, 2a. ed., Cambridge University
Press, Cambridge, 1992.
Versión corregida y aumentada de un estudio clásico sobre metodología económica. Asocia el análisis con cuestiones más generales de filosofía de la ciencia.
Boland, Lawrence E. “A Critique of Friedman’s Critics”, Journal of
Economic Literature (junio de 1979), pp. 503-522.
Buen resumen de críticas a enfoques positivos de la economía y al
papel de la comprobación empírica de supuestos.
Friedman, Milton. “The Methodology of Positive Economics”,
Essays in Positive Economics, University of Chicago Press,
Chicago, 1953, pp. 3-43.
Formulación básica de los juicios positivos de Friedman.
Harrod, Roy F. “Scope and Method in Economics”, Economic Journal, núm. 48 (1938), pp. 383-412.
Enunciación clásica del papel apropiado de la modelización económica.
Hausman, David M. y Michael S. McPherson. Economic Analysis,
Moral Philosophy, and Public Policy, 2a. ed., Cambridge University Press, Cambridge, 2006.
Los autores subrayan su certeza de que la consideración de cuestiones
de filosofía moral puede mejorar el análisis económico.
McCloskey, Donald N. If You’re So Smart: The Narrative of Economic Expertise, University of Chicago Press, Chicago, 1990.
Exposición del juicio de McCloskey de que la persuasión económica
depende de la retórica tanto como de la ciencia. Para un intercambio
sobre este tema, véanse también los artículos publicados en el Journal
of Economics Literature en junio de 1995.
Sen, Amartya. On Ethics and Economics, Blackwell Reprints,
Oxford, 1989.
Este autor intenta cerrar la brecha entre economía y estudios éticos.
Reimpresión de un estudio clásico sobre el tema.
Fuentes primarias de historia de la economía
Edgeworth, F. Y. Mathematical Psychics, Kegan Paul, Londres, 1881.
Investigaciones iniciales de la economía de bienestar, que incluyen nociones rudimentarias de eficiencia económica y la curva de contrato.
imperfecto) del análisis del equilibrio general. Aporta críticas fundamentales a la institución de la propiedad privada.
Ricardo, D. Principles of Political Economy and Taxation, J. M.
Dent & Sons, Londres, 1911.
Trabajo muy analítico y densamente escrito. Precursor en el desarrollo
del minucioso análisis de asuntos de política pública, en especial de los
relacionados con el comercio. Analiza las primeras nociones básicas
del marginalismo.
Smith, A. The Wealth of Nations, Modern Library, Nueva York,
1937.
Primer gran clásico de la economía. Largo y detallado, pese a lo cual
Smith tuvo la primera palabra en prácticamente todas las materias
económicas. Esta edición contiene útiles notas al margen.
Walras, L. Elements of Pure Economics, traducción de W. Jaffe,
Richard D. Irwin, Homewood, 1954.
Los inicios de la teoría del equilibrio general. De lectura un poco difícil.
Fuentes secundarias de historia
de la economía
Backhouse, Roger E. The Ordinary Business of Life: The History of
Economics from the Ancient World to the 21st Century, Princeton University Press, Princeton, 2002.
Historia iconoclasta. Buen texto (aunque breve) respecto a las primeras ideas económicas, no obstante, con deficiencias en los usos recientes
de las matemáticas y la econometría.
Blaug, Mark. Economic Theory in Retrospect, 5a. ed., Cambridge
University Press, Cambridge, 1997.
Muy completo resumen que subraya cuestiones analíticas. Excelentes
“Reader’s Guides” (Guías del lector) de los clásicos en cada capítulo.
Heilbroner, Robert L. The Worldly Philosophers, 7a. ed., Simon &
Schuster, Nueva York, 1999.
Fascinantes biografías fáciles de leer de economistas distinguidos. Los
capítulos sobre los socialistas utópicos y Thorstein Veblen son muy
recomendables.
Keynes, John M. Essays in Biography, W. W. Norton, Nueva York,
1963.
Marshall, A. Principles of Economics, 8a. ed., Macmillan & Co.,
Londres, 1920.
Ensayos sobre muchos personajes famosos (Lloyd George, Winston
Churchill, León Trotsky) y varios economistas (Malthus, Marshall,
Edgeworth, F. P. Ramsey y Jevons). Demuestra el genuino talento de
Keynes como escritor.
Síntesis completa de la visión neoclásica. Texto de inveterada popularidad. Detallado apéndice matemático.
Schumpeter, J. A. History of Economic Analysis, Oxford University
Press, Nueva York, 1954.
Marx, K. Capital, Modern Library, Nueva York, 1906.
Desarrollo pleno de la teoría del valor-trabajo. El estudio del “problema de la transformación” sirve como punto de partida (quizá
Tratamiento enciclopédico. Abarca a todos los economistas famosos y
los no tanto. También resume brevemente acontecimientos simultáneos en otras ramas de las ciencias sociales.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
DOS
Matemáticas para
microeconomía
Los modelos microeconómicos se elaboran usando una amplia variedad de técnicas matemáticas.
En este capítulo ofrecemos un breve resumen de algunas de las técnicas más importantes que
encontrarás en el presente libro. Un segmento importante del capítulo concierne a procedimientos matemáticos para determinar el valor óptimo de una función. Dado que frecuentemente
adoptaremos el supuesto de que un actor económico busca maximizar o minimizar una función,
nos encontraremos muchas veces con estos procedimientos (la mayoría de los cuales se basan en
el cálculo).
Después de nuestro detallado análisis del cálculo de la optimización pasaremos a cuatro temas
que se cubrirán con menos detalle. Primero examinaremos algunos tipos especiales de funciones
que se presentan en economía. El conocimiento de las propiedades de estas funciones puede ser
útil para resolver problemas. Luego se ofrece un pequeño resumen acerca del cálculo integral.
Aunque en este libro la integración se usa mucho menos que la diferenciación, encontraremos
situaciones en las que se tendrán que usar integrales para medir áreas importantes para la teoría
económica o para sumar resultados que ocurren en el tiempo o entre muchos individuos. Un uso
ujo de
resultados en el tiempo. Nuestro tercer tema adicional se centrará en técnicas por usar para tales
problemas de optimización dinámica. Por último, este capítulo concluirá con un breve resumen
de estadística matemática el cual será particularmente útil en nuestro estudio del comportamiento
económico en situaciones inciertas.
MAXIMIZACIÓN DE UNA FUNCIÓN
DE UNA VARIABLE
Nuestro estudio de la optimización puede motivarse con un ejemplo sencillo. Supongamos que el
gerente de una empresa desea maximizar1
cios por concepto de la venta de un bien parcios ( ) recibidos dependen sólo de la cantidad (q) vendida del
bien. Matemáticamente,
f (q).
(2.1)
gura 2.1 muestra una posible relación entre y q
cios
máximos, el gerente debe generar la producción q∗
cios ∗. Si se dispusiera de
gura 2.1 todo parecería ser cuestión de trazado con una regla.
1
Aquí exploraremos en general problemas de maximización. Un método prácticamente idéntico se tendría que adoptar para
estudiar problemas de minimización porque la maximización de f(x) es equivalente a la minimización de f(x).
21
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
22
Parte 1: Introducción
FIGURA 2.1
Relación hipotética entre
cantidad producida
y beneficios.
Si un gerente desea generar el nivel de producción que maximiza los beneficios, debe producirse q∗.
Nótese que en q∗, d/dq 0.
π
π∗
π2
π = f(q)
π3
π1
q1
q∗
q2
q3
Cantidad
Sin embargo, supóngase que, como es probable, el gerente no tiene una idea tan precisa del
mercado. Entonces puede probar varias q para ver dónde se obtienen beneficios máximos. Por
ejemplo, comenzando en q1, los beneficios por concepto de ventas serían 1. Luego, el gerente
podría probar producir q2 y observar que los beneficios aumentan a 2. La idea de sentido común
de que los beneficios aumentan en respuesta a un aumento en q puede enunciarse formalmente
como
2
q2
1
q1
0
o
q
(2.2)
0,
donde la notación se usa para significar “la variación en” o q. Mientras / q sea positivo los
beneficios aumentarán y el gerente seguirá incrementando la producción. Para los aumentos de
producción a la izquierda de q∗, sin embargo, / q será negativo, y el gerente se percatará de que
se ha cometido un error.
Derivadas
Como probablemente conoces, el límite de / q para pequeñas variaciones en q se llama la
derivada de la función, f (q), y se denota con d/dq o df/dq o df(q). Más formalmente,
la derivada de una función f(q) en el punto q1 se define como
d df
f (q1 h
lím
dq dq h→0
h
f (q1 )
.
(2.3)
Nótese que el valor de esta razón depende obviamente del punto q1 que se elija. La derivada de
una función puede no existir siempre o ser indefinida en ciertos puntos. La mayoría de las funciones que se estudiarán en este libro son totalmente diferenciables, sin embargo.
Valor de la derivada en un punto
Cabe mencionar una convención de notación: a veces se desea indicar explícitamente el punto en
el que se evaluará la derivada. Por ejemplo, la evaluación de la derivada en el punto q q1 podría
denotarse con
d
.
dq qq1
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
(2.4)
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
23
Otras veces nos interesa el valor de d/dq para todos los valores posibles de q, y no se hace mención explícita de un punto de evaluación particular.
En el ejemplo de la figura 2.1,
d
dq qq1
0,
mientras que
d
0.
dq qq3
¿Cuál es el valor de d/dq en q∗? Parecería ser de 0 porque el valor es positivo para valores de q
menores que q∗ y negativo para valores de q mayores que q∗. La derivada es la pendiente de la
curva de la función; esta pendiente es positiva a la izquierda de q∗ y negativa a la derecha de q∗. En
el punto q∗, la pendiente de f(q) es 0.
Condición de primer orden para un máximo
Este resultado es general. Para que una función de una variable alcance su valor máximo en algún
punto la derivada en ese punto (si existe) debe ser igual a 0. De ahí que si un gerente pudiera
estimar la función f (q) con algún tipo de datos reales, sería teóricamente posible hallar el punto
donde df/dq 0. En este punto óptimo (q∗, digamos),
df
dq
0.
(2.5)
qq
Condiciones de segundo orden
Un gerente desprevenido podría ser engañado, sin embargo, por una aplicación ingenua de sólo
esa regla de la primera derivada. Por ejemplo, supóngase que la función de beneficios fuera como
se advierte en las figuras 2.2a o 2.2b. Si la función de beneficios es como se muestra en la figura
2.2a, el gerente, mediante el análisis de la producción en el punto en donde d/dq 0, elegirá el
punto q∗a. Este punto produce de hecho un beneficio mínimo, no máximo, para el gerente. De
igual manera, si la función beneficio es la que se muestra en la figura 2.2b, el gerente elegirá el
punto q∗b, que, aunque rinde beneficios superiores a los de cualquier producción menor que q∗b, es
ciertamente inferior a cualquier producción mayor que q∗b. Estas situaciones ilustran el hecho
matemático de que d/dq 0 es condición necesaria pero no suficiente para un máximo. Con
objeto de garantizar que el punto elegido sea en efecto un punto máximo, debe imponerse una
segunda condición.
Intuitivamente esta condición adicional es clara: los beneficios disponibles al producir un poco
más o un poco menos que q∗ deben ser menores que los disponibles de q∗. De no ser así, al gerente
podría irle mejor que con q∗. Matemáticamente esto significa que d/dq debe ser mayor que 0
para q q∗ y menor que 0 para q q∗. Así, en q∗, d/dq debe ser decreciente. Otra manera de
decir esto es que la derivada de d/dq debe ser negativa en q∗.
Segundas derivadas
La derivada de una derivada se llama segunda derivada y se denota con
d2 dq2
o
d2 f
dq2
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
o
23.08.2019
f (q).
8/23
24
Parte 1: Introducción
FIGURA 2.2
Dos funciones de beneficios con resultados engañosos si la regla de la primera derivada se aplica
de manera indiscriminada.
En a) la aplicación de la regla de la primera derivada resultaría en la elección del punto q∗a. Este punto es de
hecho un punto de beneficios mínimos. De igual forma, en b), el nivel de producción q∗b sería recomendado
por la regla de la primera derivada, pero este punto es inferior a todas las producciones mayores que q∗b.
Esto demuestra gráficamente que hallar un punto en el que la derivada sea igual a 0 es condición necesaria,
pero no suficiente, para que una función alcance su valor máximo.
π
π
π∗b
π∗a
q∗a
q∗b
Cantidad
a)
Cantidad
b)
La condición adicional para que q∗ represente un máximo (local) es, por tanto,
d2
f (q)
dq2 qq
0,
(2.6)
qq
donde la notación es de nuevo un recordatorio de que esta segunda derivada debe evaluarse en q∗.
De ahí que aunque la ecuación 2.5 (d/dq 0) sea condición necesaria para un máximo, deba
combinarse con la ecuación 2.6 (d 2/dq2 0) para garantizar que el punto sea un máximo local
para la función. Juntas, así, las ecuaciones 2.5 y 2.6 son condiciones suficientes para ese máximo.
Desde luego es posible que, mediante una serie de ensayos, el gerente se decida por q∗ dependiendo de la información del mercado más que del razonamiento matemático (recuérdese la analogía del jugador de billar de Friedman). En este libro nos interesa menos cómo se descubre el
punto que sus propiedades y cómo varía el punto cuando las condiciones cambian. Un desarrollo
matemático será útil para resolver estas preguntas.
Reglas para la determinación de derivadas
He aquí algunas reglas conocidas para calcular derivadas de una función de una variable. Las
usaremos en muchos apartados de este libro.
1. Si a es una constante, entonces
da
0.
dx
2. Si a es una constante, entonces
d[af (x
af (x).
dx
3. Si a es una constante, entonces
dxa
axa 1 .
dx
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
4.
5.
6.
7.
8.
9.
10.
11.
12.
25
d ln x 1
dx
x
donde ln significa el logaritmo natural de la base e ( 2.71828).
dax
axlna para cualquier constante a
dx
Un caso particular de esta regla es dex/dx ex.
Supóngase ahora que f(x) y g(x) son dos funciones de x y que f (x) y g(x) existen. Así pues,
d [f (x) g(x)]
f (x) g (x).
dx
d [f (x) · g (x)]
f (x)g (x) f (x)g(x).
dx
d [f (x) /g(x)] f (x)g(x
f (x)g(x)
,
dx
[g(x)]2
siempre y cuando g(x) 0
Finalmente, si y f (x) y x g(z) y si tanto f(x) como g(z) existen, entonces
dy dy dx df dg
.
dz dx dz dx dz
A este resultado se le llama la regla de cadena. Ofrece una manera conveniente de estudiar
cómo una variable (z) afecta a otra (y) sólo mediante su influencia en una variable intermedia
(x). Algunos ejemplos son
deax
deax d(ax)
eax a aeax .
dx
d(ax) dx
d[ln(ax)] d[ln(ax)] d(ax)
1
1
a .
dx
d(ax)
dx
ax
x
d[ln(x2)] d[ln(x2)] d(x2 )
1
2
2 2x .
dx
x
x
dx
d(x2 )
EJEMPLO 2.1 Maximización de beneficios
Supóngase que la relación entre el beneficio () y la cantidad producida (q) está dada por
(q) 1 000q
5q2 .
(2.7)
Una gráfica de esta función se parecería a la parábola que se aprecia en la figura 2.1. El valor de q que
maximiza el beneficio puede determinarse por diferenciación:
d
1 000 10q 0,
(2.8)
dq
así,
q 100.
(2.9)
En q 100, la ecuación 2.7 muestra que el beneficio es de 50 000; el mayor valor posible. Si, por ejemplo,
la empresa optara por producir q 50, el beneficio sería de 37 500. En q 200, el beneficio es precisamente de 0.
Es posible demostrar que q 100 es un máximo “global”, señalando que la segunda derivada de la
función beneficio es 10 (véase la ecuación 2.8). De ahí que la tasa de crecimiento de beneficio sea siempre decreciente hasta q 100 donde la tasa de crecimiento sigue siendo positiva, pero más allá de ese
punto se vuelve negativa. En este ejemplo, q 100 es el único valor máximo local para la función . Con
funciones más complejas, sin embargo, puede haber muchos de esos máximos.
PREGUNTA: Supongamos que la producción (q) de una empresa está determinada por el monto de
trabajo (l) que contrata de acuerdo con la función q 2l. Asimismo, que la empresa puede contratar
todo el trabajo que desee a 10 dólares por unidad y vender su producción a $50 por unidad. Así, el beneficio es una función de l dada por (l) 100l − 10l. ¿Cuánto trabajo debería contratar esta empresa para
maximizar el beneficio, y cuáles serán los beneficios?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
26
Parte 1: Introducción
FUNCIONES DE VARIAS VARIABLES
Los problemas económicos rara vez implican funciones de una variable. La mayoría de las metas
de interés para los agentes económicos depende de varias variables y las opciones que se establecen entre estas variables. Por ejemplo, la utilidad que un individuo recibe de la actividad como
consumidor depende de la cantidad de cada bien consumido. Para la función de producción de
una empresa, la cantidad producida depende de la cantidad de trabajo, capital y tierra dedicada a
la producción. En estas circunstancias esta dependencia de una variable (y) respecto a una serie
de otras (x1, x2, …, xn) se denota con
y f (x1 , x2 , . . . , xn ).
(2.10)
Derivadas parciales
Nos interesan el punto en que y llega a un máximo y las opciones que debemos resolver para llegar
a dicho punto. De nuevo resulta conveniente imaginar que el agente cambia las variables que
tiene a su disposición (las x) para localizar un máximo. Por desgracia, para una función de varias
variables, la idea de la derivada no está claramente definida. Así como lo empinado de una cuesta
para subir por una montaña depende de la dirección que tomes, la pendiente (o derivada) de la
función depende de la dirección en que se le calcule. Usualmente las únicas pendientes direccionales de interés son las que se obtienen incrementando una de las x y manteniendo constantes
todas las demás variables (la analogía del ascenso de una montaña podría ser la medición de
pendientes sólo en dirección Norte-Sur o Este-Oeste). Estas pendientes direccionales se llaman
derivadas parciales. La derivada parcial de y respecto a (es decir, en dirección a) x1 se denota con
y
x1
o
f
x1
o
fx1
o
f1 .
Se entiende que al calcular esta derivada todas las demás x se mantienen constantes. Cabe enfatizar nuevamente que el valor numérico de esta pendiente depende del valor de x1 y de los valores
(preasignados y constantes) de x2, …, xn.
Una definición un poco más formal de la derivada parcial es
f
x1
x2 ,...,xn
lím
h→0
f (x1 h, x2 , . . . , xn
h
f (x1 , x2 , . . . , xn )
,
(2.11)
donde la notación quiere indicar que x2, …, xn se mantienen constantes en los valores preasignados x2, …, xn para que sólo pueda estudiarse el efecto de cambiar x1. Las derivadas parciales respecto a las demás variables x2, …, xn, se calcularían en forma similar.
Cálculo de derivadas parciales
Es fácil calcular derivadas parciales. La estimación procede, en cuanto a la derivada usual, tratando a x2, …, xn como constantes (lo que en realidad son en la definición de una derivada parcial).
Considérense los ejemplos siguientes.
1. Si y f (x1, x2) ax12 bx1x2 cx22, entonces
f
f1 2ax1 bx2
x1
y
f
f2 bx1 2cx2 .
x2
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
27
Obsérvese que f/x1 es en general una función tanto de x1 como de x2; así, su valor dependerá de
los valores particulares asignados a estas variables. También depende de los parámetros a, b y c,
que no varían cuando x1 y x2 sí varían.
2. Si y f (x1, x2) eax1 bx2, entonces
f
f1 aeax1 bx2
x1
y
f
f2 beax1 bx2 .
x2
3. Si y f (x1, x2) a ln x1 b ln x2, entonces
f
a
f1 x1
x1
y
f
b
f2 .
x2
x2
Obsérvese aquí que el tratamiento de x2 como constante en la derivación de f/x1 causa que el
término b ln x2 desaparezca en la diferenciación, porque no varía cuando x1 varía. En este caso, a
diferencia de nuestros ejemplos anteriores, la magnitud del efecto de x1 en y es independiente del
valor de x2. En otros casos, el efecto de x1 en y dependerá del nivel de x2.
Derivadas parciales y el supuesto ceteris paribus
En el capítulo 1 se describió la manera en que los economistas usan en sus modelos el supuesto
ceteris paribus para mantener constantes varias influencias externas, a fin de que la relación particular estudiada pueda explorarse en un marco simplificado. Las derivadas parciales es el modo
matemático preciso de representar dicho método; es decir, muestran cómo las variaciones en una
variable afectan algún resultado cuando otras influencias se mantienen constantes, justo lo que
los economistas necesitan en sus modelos. Por ejemplo, la curva de demanda de Marshall muestra
la relación entre precio (p) y cantidad (q) demandada cuando otros factores se mantienen constantes. Usando derivadas parciales podríamos representar la pendiente de esta curva como q/p
para indicar los supuestos ceteris paribus en vigor. La ley fundamental de la demanda —precio y
cantidad se mueven en direcciones opuestas cuando otros factores no cambian— se refleja, por
tanto, en el enunciado matemático q/p 0. Una vez más el uso de una derivada parcial sirve
como recordatorio de los supuestos ceteris paribus en torno a la ley de la demanda.
Derivadas parciales y unidades de medida
En matemáticas se presta relativamente poca atención a la forma en que se miden las variables. De
hecho, la mayoría de las veces no se hace mención explícita del asunto. Sin embargo, las variables
que se usan en economía suelen referirse a magnitudes reales; por tanto, debemos ocuparnos de
cómo se miden. Quizá la consecuencia más importante de elegir unidades de medida es que las
derivadas parciales suelen usarse para resumir comportamientos económicos que reflejen estas
unidades. Por ejemplo, si q representa la cantidad de gasolina demandada por todos los consumidores estadounidenses durante un determinado año (medida en miles de millones de galones) y
p representa el precio en dólares por galón, entonces q/p medirá la variación en la demanda (en
miles de millones de galones por año) en relación con un cambio de un dólar por galón en el
precio. La dimensión numérica de esta derivada depende de cómo se midan q y p. La decisión de
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
28
Parte 1: Introducción
medir el consumo en millones de galones por año multiplicaría la dimensión de la derivada por
1 000, mientras que una decisión de medir el precio por galón en centavos la reduciría en un factor de 100.
La dependencia de la dimensión numérica de derivadas parciales respecto a las unidades de
medida elegidas plantea problemas para los economistas. Aunque muchas teorías económicas hacen predicciones sobre el signo (dirección) de las derivadas parciales, toda predicción sobre
la magnitud numérica de esas derivadas dependerá de cómo los autores eligen medir sus variables. Hacer comparaciones entre estudios podría resultar prácticamente imposible, en especial
dada la amplia variedad de sistemas de medición en uso en todo el mundo. Por esta razón los
economistas decidieron adoptar un modo diferente, sin uso de unidades, para medir impactos
cuantitativos.
Elasticidad, una definición general
Los economistas usan elasticidades para resumir prácticamente todos los impactos cuantitativos
de su interés. Puesto que tales medidas se centran en el efecto proporcional de las variaciones de
una variable en otra, que no tienen unidades; las unidades “se cancelan” al calcular la elasticidad.
Por ejemplo, supóngase que y es una función de x (que podemos denotar con y(x)). Así, la elasticidad de y respecto de x (que denotaremos con ey, x) se define como
y
y x dy(x) x
y
ey,x x
dx y
x y
x
(2.12)
Si la variable y dependiera de varias variables aparte de x (como sucede a menudo), la derivada
de la ecuación 2.12 sería reemplazada por una derivada parcial. En cualquier caso nótese cómo las
unidades en que se miden y y x se cancelan en la definición de elasticidad; el resultado es una cifra
que es un número puro sin dimensiones. Esto hace posible que los economistas comparen elasticidades entre países diferentes o asimismo entre diferentes bienes. Ya debes conocer las elasticidades del precio de la demanda y la oferta, las cuales suelen tratarse en un primer curso de economía. A lo largo de este libro hallarás muchos de estos conceptos.
EJEMPLO 2.2 Elasticidad y forma funcional
La definición en la ecuación 2.12 deja en claro que la elasticidad debe evaluarse en un punto específico de
una función. En general, se esperaría que el valor de este parámetro varíe en diferentes rangos de la función. Esta observación aparece claramente en el caso en que y es una función lineal de x de la forma
y a bx otros términos.
En este caso,
ey,x dy x
x
x
b b
,
dx y
y
a bx . . .
(2.13)
lo que deja en claro que ey,x no es constante. De ahí que para las funciones lineales sea especialmente
valioso señalar el punto en el que se estima la elasticidad.
Si la relación funcional entre y y x es de la forma exponencial
y axb,
la elasticidad es una constante, independientemente de en qué lugar se mida:
ey,x dy x
abxb
dx y
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
1
x
b.
axb
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
29
Una transformación logarítmica de esta ecuación también brinda una conveniente definición alterna de
elasticidad. Dado que
ln y ln a b ln x,
tenemos
ey,x b d ln y
.
d ln x
(2.14)
De ahí que las elasticidades puedan calcularse mediante “diferenciación logarítmica”. Como veremos,
esta es con frecuencia la forma más fácil de proceder al hacer estos cálculos.
PREGUNTA: ¿Existen modos funcionales, además del exponencial, que tengan una elasticidad constante cuando menos en algún rango?
Derivadas parciales de segundo orden
La derivada parcial de una derivada parcial es directamente análoga a la segunda derivada de la
función de una variable y se llama derivada parcial de segundo orden. Esta puede escribirse como
( f / x i )
xj
o más simplemente como
2f
f ij .
xj xi
En cuanto a los ejemplos ya expuestos:
1. y f (x1, x2) ax12 bx1x2 cx22
f11 2a
f12 b
f21 b
f22 2c
2. y f (x1, x2) eax1bx2
f11 a2eax1bx2
f12 abeax1bx2
f21 abeax1bx2
f22 b2eax1bx2
3. y a lnx1 b lnx2
f11 ax2
1
f12 0
f21 0
f22 bx2
2
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(2.15)
8/23
30
Parte 1: Introducción
Teorema de Young
Estos ejemplos ilustran el resultado matemático de que, en condiciones generales, el orden en que
se hace la diferenciación parcial para evaluar derivadas parciales de segundo orden no importa.
Es decir,
fij fji
(2.16)
para cualquier par de variables xi, xj. Este resultado se conoce como teorema de Young. Para una
explicación intuitiva de este teorema volvamos a la analogía del ascenso de una montaña. En
dicho ejemplo el teorema establece que la ganancia en elevación que experimenta un alpinista
depende de las direcciones que se tomen y de las distancias recorridas, pero no del orden en que
se presenten. Esto es, la ganancia en altitud es independiente de la ruta seguida siempre y cuando
el alpinista proceda de una serie de coordenadas cartográficas a otra. Él puede, por ejemplo, avanzar una milla al Norte y luego una al Este, o proceder en el orden opuesto avanzando primero una
milla al Este y luego una más al Norte. En cualquier caso, la ganancia en elevación es la misma,
porque en ambos casos el alpinista se mueve de un lugar específico a otro. En capítulos posteriores
haremos buen uso de este resultado porque brinda una manera conveniente de mostrar algunas
de las predicciones que los modelos económicos hacen acerca del comportamiento.2
Usos de parciales de segundo orden
Las derivadas parciales de segundo orden desempeñarán un papel importante en muchas teorías
económicas que se desarrollan a lo largo de este libro. Probablemente los ejemplos más relevantes
tengan que ver con la parcial “propia” de segundo orden, fii. Esta función muestra cómo la influencia marginal de xi en y (es decir, y/xi) cambia al incrementarse el valor de xi. Un valor negativo
de fii es la manera matemática de indicar la idea económica de efectividad marginal decreciente.
De igual forma, la parcial cruzada fij indica cómo la efectividad marginal de xi cambia al incrementarse xj. El signo de este efecto podría ser positivo o negativo. El teorema de Young indica que,
en general, esos efectos cruzados son simétricos. Generalmente las derivadas parciales de segundo
orden de una función dan información sobre la curvatura de la función. Más adelante veremos
cómo esa información desempeña un papel importante en la determinación de si se satisfacen
varias condiciones de segundo orden para un máximo. Estas también desempeñan un papel
importante en la determinación de los signos de gran número de derivadas relevantes en la teoría
económica.
La regla de cadena con muchas variables
Calcular derivadas parciales puede ser más bien complicado en casos en los que algunas variables
dependen de otras. Como veremos, en muchos problemas económicos puede ser difícil saber
cómo proceder exactamente en la diferenciación de funciones complejas. En esta sección se ilustran casos simples que te ayudarán a hacerte una idea general. Se empezará examinando cómo la
“regla de cadena” ya explicada en el contexto de una variable puede generalizarse para muchas
variables. Específicamente, supongamos que y es una función de tres variables, y f (x1, x2, x3).
Asimismo, supongamos que cada una de estas x es en sí misma la función de un parámetro, digamos a. De ahí que pueda escribirse y f [(x1(a), x2(a), x3(a)]. Ahora podemos preguntarnos
cómo una variación en a afecta el valor de y, usando la regla de cadena:
dy
f dx1 f dx2 f dx3
da x1 da x2 da x3 da
2
(2.17)
El teorema de Young implica que la matriz de las derivadas parciales de segundo orden de una función es simétrica. Esta simetría
ofrece varios discernimientos económicos. Para una breve introducción a los conceptos matriciales usados en economía, véanse
las extensiones de este capítulo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
31
Es decir, las variaciones en a afectan a cada una de las x, y luego estas variaciones en las x afectan
al valor final de y. Por supuesto que algunos de los términos en esta expresión pueden ser iguales
a cero. Tal sería el caso si una de las x no fuera afectada por a o si una x particular no tuviera ningún efecto en y (en cuyo caso no debería estar en la función). Pero esta versión de la regla de
cadena muestra que a puede influir en y a través de muchas rutas.3 En nuestros modelos económicos desearemos estar seguros de que todas esas rutas se tomen en cuenta.
EJEMPLO 2.3 Uso de la regla de cadena
Como un ejemplo simple (y quizá poco apetitoso) supongamos que cada semana un fanático de la pizza
consume tres tipos de pizza, denotados por x1, x2 y x3. La pizza tipo 1 es una pizza simple de queso que
cuesta p por unidad. La pizza tipo 2 consta de dos ingredientes más y cuesta 2p. La pizza tipo 3 es la
especialidad de la casa, incluye cinco ingredientes y cuesta 3p. Para garantizar un menú (modestamente)
diversificado este fanático decide asignar 30 dólares a la semana para cada tipo de pizza. Aquí desearemos
examinar cómo el número total de pizzas adquiridas se ve afectado por el precio subyacente p. Nótese que
este problema incluye una variable exógena, p, fijada por la pizzería. Las cantidades adquiridas de cada
pizza (y las compras totales) son las variables endógenas en el modelo.
Dada la manera en que este fanático presupuesta sus compras de pizza, la cantidad adquirida de cada
tipo sólo depende del precio p. Específicamente, x1 30/p, x2 30/2p, x3 30/3p. Ahora las compras
totales de pizza (y) están dadas por
y f [x1(p), x2(p), x3(p)] x1(p) x2(p) x3(p)
(2.18)
Aplicar la regla de cadena de la ecuación 2.17 a esta función produce:
dy
dx1
dx2
dx3
f1
f2
f3
dp
dp
dp
dp
30p
2
15p
2
10p
2
55p
2
(2.19)
Podemos interpretar esto con una ilustración numérica. Supongamos que inicialmente p 5. Con este
precio, las compras totales de pizza serán de 11 unidades. La ecuación 2.19 implica que cada incremento
en el precio unitario reducirá las compras en 2.2 ( 55/25) unidades, aunque ese cambio es demasiado
grande para que el cálculo (que supone pequeñas variaciones) opere correctamente. Así, supongamos en
cambio que p aumenta 5 centavos, a p 5.05. La ecuación 2.19 predice ahora que las compras totales de
pizza se reducirán en 0.11 unidades (0.05 55/25). Si calculamos directamente las compras por unidades obtenemos x1 5.94, x2 2.97, x3 1.98. De ahí que las unidades compradas sean 10.89; una
reducción de 0.11 respecto al nivel original, justo lo que predijo la ecuación 2.19.
PREGUNTA: Debe ser obvio que una manera mucho más fácil de resolver este problema sea definir
directamente las compras totales de unidades (y) como una función de p. Aporta una prueba usando este
método y luego describe algunas razones por las que este método más simple no puede implementarse
siempre.
Aquí podemos explicar con claridad un caso especial de esta regla. Supongamos que x3(a) a. Es decir, el parámetro a entra directamente en la determinación de y f [x1(a), x2(a), a]. En
este caso, el efecto de a en y puede escribirse como:4
dy
f dx1 f dx2 f
da x1 da x2 da a
(2.20)
3
Si las x en la ecuación 2.17 dependieran de varios parámetros, todas las derivadas en la ecuación serían derivadas parciales para
indicar que la regla de cadena examina el efecto de sólo un parámetro a la vez, manteniendo constantes los demás.
4
La expresión en la ecuación 2.20 se conoce como derivada total o derivada completa de la función f, aunque su uso no es consistente entre varios campos de las matemáticas aplicadas.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
32
Parte 1: Introducción
Esto indica que el efecto de a en y puede descomponerse en dos tipos de efectos: 1) un efecto
directo (dado por fa); y 2) un efecto indirecto que sólo opera mediante las formas en que a afecta
a las x. En muchos problemas económicos analizar por separado estos dos efectos puede aportar
discernimientos importantes.
Funciones implícitas
Si el valor de una función se mantiene constante se crea una relación implícita entre las variables
independientes que entran en la función. Es decir, las variables independientes ya no pueden
adoptar cualquier valor, sino sólo la serie de valores que resulta de que la función retenga el valor
requerido. El examen de estas relaciones implícitas puede ofrecer a menudo otra herramienta de
análisis para sacar conclusiones de modelos económicos.
Probablemente el resultado más útil provisto por este método sea la posibilidad de cuantificar
las ventajas y desventajas inherentes a la mayoría de los modelos económicos. Aquí trataremos un
caso simple. Considérese la función y f (x1, x2). Si mantenemos constante el valor de y hemos
creado una relación implícita entre las x que muestra cómo las variaciones en ellas deben estar
asociadas con el hecho de mantener constante el valor de la función. De hecho, en condiciones
muy generales5 (la más importante de las cuales es que f2 0) es posible demostrar que el mantener constante a y permite crear una función implícita de la forma x2 g(x1). Aunque a veces
calcular esta función puede ser difícil, la derivada de la función g se relaciona de una manera
específica con las derivadas parciales de la función original f. Para demostrar esto, primero la
función original se iguala con una constante (digamos cero) y se escribe como
y 0 f (x1, x2) f (x1, g(x1))
(2.21)
Usar la regla de cadena para diferenciar esta relación respecto a x1 produce:
0 f1 f2
dg(x1 )
dx1
(2.22)
Reordenar los términos da como resultado final
dg(x1 ) dx2
dx1
dx1
f1
.
f2
(2.23)
Así, hemos demostrado6 que las derivadas parciales de la función f pueden usarse para derivar
una expresión explícita de las disyuntivas entre x1 y x2. El ejemplo siguiente nos muestra cómo
esto puede facilitar los cálculos en ciertas situaciones.
EJEMPLO 2.4 De nuevo una frontera de posibilidades de producción
En el ejemplo 1.3 se examinó una frontera de posibilidades de producción para dos bienes de la forma
x2 0.25y2 200.
(2.24)
Debido a que esta función se iguala con una constante es posible estudiar la relación entre las variables,
usando el resultado de la función implícita:
5
Para un análisis detallado de este teorema de la función implícita y cómo puede extenderse a varias variables véase Carl P. Simon
y Lawrence Blume, Mathematics for Economists (W. W. Norton, Nueva York, 1994), capítulo 15.
Un método alterno para comprobar este resultado emplea la diferencial total de f: dy f1 dx1 f2 dx2. Establecer dy 0 y reordenar los términos da el mismo resultado (suponiendo que pueda darse el paso, matemáticamente cuestionable, de dividir
entre dx1).
6
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
f
dy
2x
4x
x
,
fy
dx
0.5y
y
33
(2.25)
justo el resultado que se obtuvo antes, con mucho menos trabajo.
PREGUNTA: ¿Por qué la opción entre x y y sólo depende aquí de la razón de x respecto a y y no del
tamaño de la fuerza de trabajo reflejado por la constante 200?
MAXIMIZACIÓN DE FUNCIONES
DE VARIAS VARIABLES
Usar derivadas parciales nos permite hallar el valor máximo de una función con distintas variables. Para entender las matemáticas que se utilizan en la resolución de este problema es útil una
analogía con el caso de una variable. En el caso de una variable podemos imaginar un agente que
cambia x por una pequeña cantidad, dx, y observa la variación en y, dy. Este cambio está dado por
dy f (x)dx.
(2.26)
La identidad en la ecuación 2.26 registra el hecho de que la variación en y es igual a la variación
en x multiplicado por la pendiente de la función. Esta fórmula es equivalente a la de punto y pendiente que se usa para ecuaciones lineales en álgebra básica. Como ya se dijo, la condición necesaria para un máximo es que dy 0 para pequeñas variaciones en x alrededor del punto óptimo.
De lo contrario, y podría aumentar por efecto de las variaciones adecuadas en x. Pero como dx no
necesariamente es igual a 0 en la ecuación 2.26, dy 0 debe implicar que en el punto deseado
f(x) 0. Esta es otra manera de obtener la condición de primer orden para un máximo que ya
hemos derivado.
Examinemos mediante esta analogía las decisiones tomadas por un agente económico que
debe elegir los niveles de distintas variables. Supongamos que este agente desea hallar una serie de
x que maximicen el valor de y f (x1, x2, ..., xn). El agente podría considerar cambiar sólo una
de las x, digamos x1, y mantener constantes todas las demás. La variación en y (es decir, dy) que
resultaría de esta variación en x1 está dado por
dy f
dx1 f 1 dx1 .
x1
(2.27)
Esto indica que la variación en y es igual a la variación en x1 multiplicado por la pendiente medida
en la dirección x1. Usando de nuevo la analogía de la montaña, la ganancia en altitud que lograría
un alpinista en dirección Norte está dada por la distancia recorrida al Norte multiplicada por la
pendiente de la montaña medida en dirección Norte.
Condiciones de primer orden para un máximo
Para que un punto específico ofrezca un valor máximo (local) de la función f, ningún movimiento
reducido en ninguna dirección debe poder aumentar su valor. De ahí que ninguno de los términos direccionales similares a la ecuación 2.27 deba incrementar y, y la única manera en la que esto
puede suceder es que todas las derivadas direccionales (parciales) sean iguales a cero (recuerda
que el término dx1 en la ecuación 2.27 puede ser positivo o negativo). Es decir, una condición
necesaria para que un punto sea un máximo local es que en ese punto
f f …f 0
(2.28)
1
2
n
Técnicamente un punto en el que la ecuación 2.25 es válida se llama punto crítico de la función.
No es necesariamente un punto máximo, a menos que sean válidas ciertas condiciones de segundo
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
34
Parte 1: Introducción
orden (que analizaremos más adelante). En la mayoría de nuestros ejemplos económicos, sin
embargo, estas condiciones serán válidas; así, la ecuación 2.28 nos permitirá hallar un máximo.
Las condiciones necesarias “de primer orden” para un máximo descritas en la ecuación 2.28
también tienen una importante interpretación económica. Indican que para que una función
alcance su valor máximo cualquier entrada en ella debe aumentar al punto en que su valor marginal (o incremental) sea de cero. Si, digamos, f1 fuera positiva en un punto este no podría ser un
máximo verdadero ya que un incremento en x1 (manteniendo constantes todas las demás variables) incrementaría f por la ecuación 2.27.
EJEMPLO 2.5 Determinación de un máximo
Supongamos que y es una función de x1 y x2 dada por
y (x1 1)2 (x2 2)2 10
(2.29)
o
y x12 2x1 x22 4x2 5.
Por ejemplo, y podría representar la salud de un individuo (medida en una escala de 0 a 10), y x1 y x2
podrían ser dosis diarias de dos medicinas para el mejoramiento de la salud. Queremos encontrar valores
de x1 y x2 que vuelvan a y lo más grande posible. Tomar las derivadas parciales de y respecto a x1 y x2 y
aplicar las condiciones necesarias dadas por la ecuación 2.28 produce
y
x1
y
x2
2x1 2 0,
(2.30)
2x2 4 0
o
x1 1,
x2 2.
Así, la función está en un punto crítico cuando x1 1 y x2 2. En ese punto, y 10 es el mejor estado
de salud posible. Un poco de experimentación ofrece evidencia convincente de que este es el valor más
grande que y puede tener. Por ejemplo, si x1 x2 0, entonces y 5, o si x1 x2 1, entonces y 9.
Valores de x1 y x2 mayores que 1 y 2, respectivamente, reducen y porque los términos cuadráticos negativos en la ecuación 2.29 se vuelven grandes. En consecuencia el punto hallado, aplicando las condiciones
necesarias es, de hecho, un máximo local (y global).7
PREGUNTA: Supongamos que y adoptó un valor fijo (de 5, digamos). ¿Cómo sería la relación contenida
entre x1 y x2? ¿Qué podría decirse entonces de y 7 o y 10? (Estas gráficas son curvas de nivel de la
función y se examinarán en detalle en capítulos posteriores. Véase también el problema 2.1.)
Condiciones de segundo orden
De nueva cuenta, sin embargo, las condiciones de la ecuación 2.28 no son suficientes para garantizar un máximo. Esto puede ilustrarse volviendo a una ya muy citada analogía: todas las cumbres
son (más o menos) planas, pero no todos los sitios planos son una cumbre. Se necesita una condición de segundo orden para asegurar que el punto hallado, aplicando la ecuación 2.28, sea un
máximo local. Intuitivamente, para un máximo local y debe ser decreciente respecto a cualquier
variación pequeña en las x desde el punto crítico. Igual que en el caso de una variable, esto implica
examinar la curvatura de la función alrededor del punto crítico para garantizar que el valor de la
función realmente decrece en movimientos en cualquier dirección. Para hacer esto debemos con7
Más formalmente, el punto x1 1, x2 2 es un máximo global porque la función descrita en la ecuación 2.29 es cóncava (véase
nuestro análisis más adelante).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
35
siderar las segundas derivadas parciales de la función. Una primera condición (que se desprende
en forma obvia del caso de una variable) es que la segunda derivada parcial propia de cualquier
variable fii debe ser negativa. Si reducimos nuestra atención a movimientos en una sola dirección,
un máximo verdadero debe caracterizarse por un patrón en el que la pendiente de la función va
de positiva (ascendente) a cero (plana) y a negativa (descendente). Esto es lo que significa la condición matemática fii 0. Por desgracia, las condiciones que aseguran el valor de los decrementos
f para movimientos en cualquier dirección arbitraria involucran a todas las segundas derivadas
parciales. Más adelante se analizará un ejemplo de dos variables, pero el caso general se examina
idealmente con álgebra matricial (véanse las extensiones de este capítulo). Para la teoría económica, sin embargo, el hecho de que las segundas derivadas parciales propias deban ser negativas
para un máximo, suele ser lo más importante.
TEOREMA DE LA ENVOLVENTE
Una de las principales aplicaciones de la idea de las funciones implícitas, que se usará muchas
veces en este libro, es el teorema de la envolvente, que concierne la forma en que el valor óptimo
de una función particular varía cuando un parámetro de la función también varía. Dado que
muchos de los problemas económicos que estudiaremos conciernen a los efectos de variar un
parámetro (por ejemplo, el efecto que tendrán las variaciones de precio de mercado de un producto respecto a las compras de un individuo), este es un tipo de cálculo que haremos con frecuencia. El teorema de la envolvente suele brindar un cómodo atajo para resolver el problema.
Un ejemplo específico
Quizá la manera más fácil de entender el teorema de la envolvente sea mediante un ejemplo.
Supóngase que y es la función de una variable (x) y un parámetro (a), dada por
y x2 ax.
(2.31)
Para diferentes valores del parámetro a, esta función representa una familia de parábolas invertidas. Si se le asigna a a un valor específico, la ecuación 2.31 será una función exclusiva de x, y podrá
1
calcularse el valor de x que maximiza a y. Por ejemplo, si a 1, entonces x∗ 2 y, para estos
1
valores de x y a, y 4 (su valor máximo). De igual manera, si a 2, entonces x∗ 1 y y∗ 1. De
3
ahí que un incremento de 1 en el valor del parámetro a aumente el valor máximo de y en 4 . En la
tabla 2.1 se usan valores integrales de a entre 0 y 6 para calcular los valores óptimos de x y los
valores asociados del objetivo, y. Nótese que cuando a aumenta, el valor máximo de y también
aumenta. Esto se ilustra asimismo en la figura 2.3, la cual muestra que la relación entre a y y∗ es
cuadrática. Ahora queremos calcular explícitamente cómo variar y∗ al variar el parámetro a.
TABLA 2.1 VALORES ÓPTIMOS DE y Y x PARA VALORES ALTERNOS DE a EN y ⴝ ⴚx2 ⴙ ax
Valor de a
Valor de x∗
Valor de y∗
0
0
0
1
1
2
1
4
2
1
1
3
3
2
9
4
4
2
4
5
5
2
25
4
6
3
9
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
36
Parte 1: Introducción
FIGURA 2.3
Ilustración del teorema de
la envolvente.
El teorema de la envolvente establece que la pendiente de la relación entre y∗ (el valor máximo de y) y el
parámetro a puede hallarse calculando la pendiente de la relación auxiliar que se determina sustituyendo
los valores óptimos respectivos de x en la función objetivo y calculando y/a.
y∗
10
y ∗ = f(a)
9
8
7
6
5
4
3
2
1
0
1
2
3
4
5
6
a
Un método directo que toma tiempo
El teorema de la envolvente establece que hay dos formas equivalentes en las que podemos hacer
este cálculo. Primero puede calcularse directamente la pendiente de la función en la figura 2.3.
Para ello debe despejarse el valor óptimo de x para cualquier valor de a en la ecuación 2.32:
dy
dx
2x a 0;
de ahí que
a
x .
2
Al sustituir este valor de x∗ en la ecuación 2.32 da
y
x ) 2 a(x )
a 2
a
a
2
2
a2 a2 a2
,
4
2
4
(2.32)
justo la relación que se muestra en la figura 2.3. Con base en la ecuación previa es fácil ver que
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
dy
2a a
4
2
da
37
(2.33)
y, por ejemplo, en a 2, dy∗/da 1. Es decir, cerca de a 2 el impacto marginal del aumento de
a es incrementar y∗en la misma cantidad. Cerca de a 6, todo pequeño aumento en a incrementará y∗ tres veces esa variación. La tabla 2.1 ilustra este resultado.
El atajo de la envolvente
Llegar a esta conclusión fue algo complicado. Tuvimos que hallar el valor óptimo de x para cada
valor de a y luego sustituir este valor de x∗ en la ecuación para y. En casos más generales esto
puede ser oneroso porque requiere maximizar repetidamente la función objetivo. El teorema de
la envolvente, al ofrecer otro método, establece que para pequeñas variaciones en a, dy∗/da puede
estimarse manteniendo x en su valor óptimo y calculando simplemente y/a a partir directamente de la función objetivo.
Proceder de esta manera da
dy
y
da
a
xx (a)
x2 ax)
a
x (a)
(2.34)
xx (a)
La notación aquí es un recordatorio de que la derivada parcial usada en el teorema de la envolvente debe evaluarse en el valor de x el cual es óptimo para el valor particular del parámetro a. En
la ecuación 2.32 demostramos que, para cualquier valor de a, x∗(a)a/2. La sustitución en la
ecuación 2.34 produce ahora:
dy
a
x (a) 2
da
(2.35)
Este es justo el resultado obtenido con anterioridad. La razón de que estos dos métodos den resultados idénticos se ilustra en la figura 2.3. Las tangentes que aparecen en esta figura reportan
valores de y para una x∗ fija. Las pendientes de las tangentes son y/a. Evidentemente en y∗ esta
pendiente proporciona el valor que buscamos.
Este resultado es general y lo usaremos a lo largo de este libro para simplificar nuestro análisis.
En suma, el teorema de la envolvente establece que el cambio en el valor óptimo de una función
respecto a un parámetro de dicha función puede hallarse diferenciando parcialmente la función
objetivo y manteniendo a x en su valor óptimo. Es decir,
dy
y
{ x x (a)} ,
da
a
(2.36)
donde la notación ofrece nuevamente el recordatorio de que y/a debe calcularse en el valor de
x óptimo para el valor específico del parámetro a examinado.
Caso de muchas variables
Un teorema de la envolvente análogo es válido para el caso en que y es una función de diversas
variables. Supóngase que y depende de un conjunto de x (x1, …, xn) y de un parámetro particular
de interés, digamos a:
y f (x1, . . . , xn, a)
(2.37)
Determinar un valor óptimo de y consistiría en resolver n ecuaciones de primer orden de la forma
y
0 (i 1, . . . , n),
xi
(2.38)
y una solución de este proceso daría valores óptimos para esas x (x∗1, x∗2, …, xn∗) que dependerían
implícitamente del parámetro a. Suponiendo que se satisfacen las condiciones de segundo orden,
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
38
Parte 1: Introducción
entonces se aplicaría el teorema de la función implícita el cual garantiza la resolución de cada x∗i
como una función del parámetro a:
x1 x1 (a),
x2 x2 (a),
..
.
xn xn (a).
(2.39)
Sustituir estas funciones en nuestro objetivo original (ecuación 2.37) produce una expresión en la
que el valor óptimo de y (digamos y∗) depende del parámetro a, directa e indirectamente, mediante
el efecto de a en las x∗:
y∗ f [x∗1 (a), x∗2 (a), . . . , xn∗(a), a].
La diferenciación total de esta expresión respecto a a produce
dy
f dx1 f dx2
da
x1 da x2 da
f dxn f
.
xn da a
(2.40)
Pero dadas las condiciones de primer orden todos estos términos, excepto el último, son iguales a
0 si las x están en sus valores óptimos. De ahí que una vez más tengamos el resultado envolvente:
dy
f
,
da
a
(2.41)
donde esta derivada debe evaluarse en los valores óptimos de las x.
EJEMPLO 2.6 Teorema de la envolvente: el estado de salud examinado
En el ejemplo 2.5 se revisaron los valores máximos de la función estado de salud
y (x1 1)2 (x2 2)2 10
(2.42)
x1 1,
x2 2,
(2.43)
y se determinó que
y
y∗ 10.
Supongamos ahora que se usa el parámetro arbitrario a en vez de la constante 10 en la ecuación 2.42.
Aquí a podría representar una medida de la mejor salud posible para una persona, aunque este valor
variaría obviamente de una persona a otra. De ahí que
y f(x1, x2, a) (x1 1)2 (x2 2)2 a
(2.44)
En este caso los valores óptimos de x1 y x2 no dependen de a (siempre son x∗1 1, x∗2 2; por tanto, en
esos valores óptimos tenemos
y∗ a
(2.45)
dy
1.
da
(2.46)
y
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
39
Las personas de “buena salud natural” tendrán concomitantemente valores más altos de y∗, siempre y
cuando elijan óptimamente x1 y x2. Pero esto es justo lo que indica el teorema de la envolvente porque,
con base en la ecuación 2.44
dy
f
1
da
a
(2.47)
Aumentar el parámetro a aumenta simplemente el valor óptimo de y∗ en un monto idéntico (suponiendo
de nuevo que las dosis de x1 y x2 se eligieron correctamente).
PREGUNTA: Supongamos que se atiende, en cambio, la dosis óptima de x1 en la ecuación 2.42; es decir,
que se usa un parámetro general, digamos b, en vez de 1. Explica en palabras y usando matemáticas
por qué, en este caso, y∗/b sería necesariamente igual a 0.
MAXIMIZACIÓN RESTRINGIDA
Hasta aquí hemos puesto nuestra atención en determinar el valor máximo de una función sin
restringir las opciones de las x disponibles. En la mayoría de los problemas económicos,
sin embargo, no todos los valores de las x son factibles. En muchas situaciones, por ejemplo, se
requiere que todas las x sean positivas. Este es el tipo de problema que enfrenta un gerente al
tomar una decisión de producción para maximizar los beneficios; una producción negativa no
tendría sentido. En otros casos las x pueden estar limitadas por consideraciones económicas. Por
ejemplo, al decidir respecto a los artículos que va a consumir, un individuo no puede optar
por cualquier cantidad deseada. Más bien, las opciones están limitadas por el monto del poder de
compra disponible; es decir, por su restricción presupuestal. Estas limitaciones pueden reducir el
valor máximo de la función por maximizar. Puesto que no podemos elegir libremente entre todas
las x, quizá y no sea tan grande como podría. Las restricciones serían “no vinculantes” si pudiéramos obtener el mismo nivel de y con o sin la imposición de la restricción.
Método del multiplicador de Lagrange
Un método para resolver problemas de maximización restringida es el método del multiplicador
de Lagrange el cual involucra un ingenioso truco matemático que resulta de tener también una
útil interpretación económica. La lógica de este método es simple, aunque aquí no intentaremos
una presentación rigurosa.8 En una sección anterior se analizaron las condiciones necesarias
para un máximo local. Se demostró que, en el punto óptimo, todas las derivadas parciales de f
deben ser iguales a 0. Así, hay n ecuaciones (fi 0 para i 1, . . . , n) con n incógnitas (las x). En
general, en estas ecuaciones pueden despejarse las x óptimas. Cuando las x están restringidas, sin
embargo, hay al menos una ecuación adicional (la restricción), pero no variables adicionales. Por
tanto, el conjunto de ecuaciones está sobredeterminado. La técnica de Lagrange introduce una
variable adicional (el multiplicador de Lagrange) que no sólo ayuda a resolver el problema en
cuestión (porque ahora hay n 1 ecuaciones con n 1 incógnitas), sino que además tiene una
interpretación útil en una variedad de circunstancias económicas.
El problema formal
Más específicamente, supongamos que se desea encontrar los valores de x1, x2, …, xn que maximizan
y f (x1, x2, . . . , xn),
8
(2.48)
Para una presentación detallada, véase A. K. Dixit, Optimization in Economic Theory, 2a. ed. (Oxford University Press, Oxford,
1990), capítulo 2.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
40
Parte 1: Introducción
sujeta a una restricción que sólo permite usar ciertos valores de las x. Una manera general de
escribir esa restricción es
g(x1, x2, . . . , xn) 0
(2.49)
donde la función9 g representa la relación que debe mantenerse entre todas las x.
Condiciones de primer orden
El método del multiplicador de Lagrange comienza estableciendo la expresión lagrangiana
ᏸ f (x1, x2, . . . , xn) g(x1, x2, . . . , xn),
(2.50)
donde es una variable adicional llamada multiplicador de Lagrange. Más adelante interpretaremos esta nueva variable. Pero primero adviértase que al sostenerse la restricción, ᏸ y f tienen el
mismo valor [porque g(x1, x2, . . . , xn) 0]. En consecuencia, si limitamos nuestra atención a los
valores de las x que satisfacen la restricción, determinar el valor máximo restringido de f equivale
a determinar un valor crítico de ᏸ. Procedamos a hacerlo, tratando a también como una variable (además de las x). Con base en la ecuación 2.50 las condiciones para un punto crítico son:
ᏸ
f1 g1 0,
x1
ᏸ
f2 g2 0,
x2
..
.
ᏸ
fn gn 0,
xn
ᏸ
g(x1 , x2 , . . . , xn ) 0.
(2.51)
Las ecuaciones comprendidas en la ecuación 2.51 son entonces las condiciones para un punto
crítico de la función ᏸ. Nótese que hay n 1 ecuaciones (una por cada x y una última para ) con
n 1 incógnitas. En general en estas ecuaciones es posible despejar x1, x2, …, xn y . Tal solución
tendrá dos propiedades: 1) las x obedecerán la restricción porque la última ecuación en 2.51
impone esa condición; y 2) entre todos los valores de x que satisfacen la restricción, los que también resuelven la ecuación 2.51 harán a ᏸ (y por tanto a f ) tan grande como sea posible (suponiendo que se satisfacen las condiciones de segundo orden). Así, el método del multiplicador de
Lagrange ofrece un medio para hallar una solución al problema de maximización restringida que
se planteó al principio.10
La solución de la ecuación 2.51 usualmente diferirá de aquella en el caso no restringido (véanse
las ecuaciones 2.28). Más que proceder al punto en el que la contribución marginal de cada x es 0,
la ecuación 2.51 nos obliga a parar en seco debido a la restricción. Sólo si la restricción no fuera
efectiva (en cuyo caso, como se demostrará más adelante, sería igual a 0), las ecuaciones restringida y no restringida (y sus respectivas soluciones) coincidirían. Estas condiciones marginales
que hemos revisado tienen interpretaciones económicas en muchas situaciones diferentes.
9
Como ya hemos señalado, cualquier función de x1, x2, …, xn puede escribirse de esta forma implícita. Por ejemplo, la restricción
x1 x2 10 puede escribirse como 10 − x1 − x2 0. En capítulos posteriores aplicaremos este procedimiento al tratar con restricciones. Las restricciones que examinaremos frecuentemente serán lineales.
10
En estricto sentido, estas son las condiciones necesarias para un máximo local interior. En algunos problemas económicos es
preciso enmendar estas condiciones (en formas muy obvias) para tomar en cuenta la posibilidad de que algunas de las x estén en
el límite de la región de x permisibles. Por ejemplo, si se requiere que todas las x sean no negativas, podría ser que las condiciones
de la ecuación 2.51 no se sostengan del todo, ya que podrían requerir x negativas. Consideraremos esta situación más adelante.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
41
Interpretación del multiplicador de Lagrange
Hasta aquí hemos usado el multiplicador de Lagrange () sólo como un “truco” matemático para
llegar a la solución que deseamos. De hecho, esa variable tiene también una interpretación económica importante que será central para nuestro análisis en muchos puntos de este libro. Para desarrollar esta interpretación, reescribamos la primera de las n ecuaciones de 2.51 como
fn
.
gn
f1
f
2
g1
g2
(2.52)
En otras palabras, en el punto máximo la razón de fi respecto a gi es la misma para todas las x. Los
numeradores en la ecuación 2.52 son las contribuciones marginales de cada x a la función f.
Muestran el beneficio marginal que una unidad más de xi tendrá para la función maximizada (es
decir, para f ).
Quizá sea preferible dejar una interpretación completa de los denominadores en la ecuación
2.52 hasta que nos encontremos estas razones en aplicaciones económicas reales. Ahí veremos
que estas suelen tener una interpretación de “costo marginal”. Es decir, reflejan la carga añadida a
la restricción de usar ligeramente más xi. Como ejemplo, supongamos que la restricción requiere
que el gasto total en x1 y x2 esté dado por una cantidad fija en dólares, F. Por tanto, la restricción
es p1x1 p2x2 F (donde pi es el costo por unidad de xi). Usando nuestra presente terminología
esta restricción se escribirá en forma implícita como
g(x1, x2) F p1x1 p2x2 0.
(2.53)
gi pi
(2.54)
En esta situación, entonces,
y la derivada gi reflejará en efecto el costo marginal por unidad del uso de xi. Prácticamente
todos los problemas de optimización que encontraremos en capítulos posteriores tienen una
interpretación similar respecto a los denominadores en la ecuación 2.52.
El multiplicador de Lagrange como razón costo-beneficio
Ahora se le puede dar una interpretación intuitiva a la ecuación 2.52. Esta indica que en las opciones óptimas de las x, la razón del beneficio marginal de incrementar xi respecto al costo marginal
de incrementar xi debería ser la misma para cada x. Con objeto de ver que esta es una condición
obvia para un máximo supongamos que no es cierta, que la “razón costo-beneficio” es mayor para
x1 que para x2. En este caso, para alcanzar un máximo debería usarse un poco más x1. Considérese
el uso de más x1, pero renunciando lo suficiente a x2 para mantener constante a g (la restricción).
De ahí que el costo marginal de la x1 adicional usada iguale el costo ahorrado usando menos x2.
Pero como la razón costo-beneficio (el monto de beneficio por unidad de costo) es mayor para x1
que para x2, los beneficios adicionales de usar más x1 superarían la pérdida en los beneficios de
usar menos x2. Usar más x1 y propiamente menos x2 incrementaría entonces y, porque x1 ofrece
mayor “impacto”. Sólo si las razones costo marginal-beneficio marginal son iguales para todas las
x habrá un máximo local en el que ninguna variación pequeña en las x podrá incrementar el objetivo. En muchos apartados de este libro se desarrollarán aplicaciones concretas de este principio
básico. El resultado es fundamental para la teoría microeconómica del comportamiento de optimización.
El multiplicador de Lagrange () también puede interpretarse a la luz de este análisis. es la
razón común costo-beneficio de todas las x. Es decir,
beneficio marginal de xi
costo marginal de xi
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(2.55)
8/23
42
Parte 1: Introducción
para cada xi. Si la restricción se relajara un poco no importaría exactamente cuál x variara (en
realidad, todas las x podrían alterarse), porque en el margen cada una promete la misma razón de
beneficios en relación con los costos. El multiplicador de Lagrange proporciona entonces una
medida de cómo una relajación general de la restricción afecta el valor de y. En esencia, asigna
un “precio sombra” a la restricción. Una alta indica que y puede aumentar sustancialmente,
relajando la restricción, porque cada x tiene una alta razón costo-beneficio. Un valor bajo de ,
por otro lado, indica que no hay mucho por ganar relajando la restricción. Si esta no es vinculante
tendrá un valor de 0, indicando por tanto que la restricción no limita el valor de y. En ese caso,
hallar el valor máximo de y sujeto a la restricción sería idéntico a hallar un máximo irrestricto. El
precio sombra de la restricción es 0. Esta interpretación de también puede demostrarse usando
el teorema de la envolvente, como se describirá más adelante.11
Dualidad
Este análisis señala que existe una relación clara entre el problema de maximizar una función
sujeta a restricciones y el de asignar valores a las restricciones. Esto refleja lo que se conoce como
principio matemático de la dualidad: todo problema de maximización restringida tiene un problema dual asociado de minimización restringida, que dirige su atención a las restricciones del
problema original (primordial). Por ejemplo, avanzando un poco en nuestra argumentación, los
economistas suponen que los individuos maximizan su utilidad sujetos a una restricción presupuestal. Este es el problema primordial del consumidor. El problema dual para el consumidor es
minimizar el gasto necesario para alcanzar un nivel dado de utilidad. O bien, el problema primordial de una empresa puede ser minimizar el costo total de los insumos utilizados para generar un
cierto nivel de producción, mientras que el problema dual es maximizar la producción respecto a
un costo total dado de insumos adquiridos. En capítulos posteriores se desarrollarán muchos
ejemplos similares. Cada cual mostrará que siempre hay dos maneras de examinar cualquier problema de optimización restringida. A veces, adoptar un ataque frontal, analizando el problema
primordial, puede llevar a grandes discernimientos. En otros casos el método de “puerta trasera”
de examinar el problema dual puede ser más instructivo. Cualquiera que sea la ruta que se siga los
resultados, por lo general aunque no siempre, serán idénticos; así, la decisión que se tome será
sobre todo cuestión de conveniencia.
EJEMPLO 2.7 Maximización restringida: estado de salud, nuevamente
Volvamos de nuevo a nuestro (quizá tedioso) problema de maximización de la salud. Como ya se dijo, la
meta del individuo es maximizar
y x21 2x1 x22 4x2 5,
pero ahora supongamos que las opciones de x1 y x2 están restringidas por el hecho de que el individuo
sólo puede tolerar una dosis de medicamento al día. Es decir,
x1 x2 1
(2.56)
o
1 x1 x2 0.
11
El análisis en el texto concierne a problemas que involucran una sola restricción. En general, es posible manejar m restricciones
(m n) introduciendo simplemente m nuevas variables (multiplicadores de Lagrange) y procediendo en forma análoga a la ya
explicada.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
Nótese que el punto óptimo original x1 1, x2 2 ya no es alcanzable, debido a la restricción sobre
posibles dosis: hay que hallar otros valores. Para ello primero se establece la expresión lagrangiana:
ᏸ x21 2x1 x22 4x2 5 (1 x1 x2).
(2.57)
La diferenciación de ᏸ respecto a x1, x2 y da la siguiente condición necesaria para un máximo restringido:
ᏸ
2x1 2 0,
x1
ᏸ
2x2 4 0,
x2
ᏸ
1 x1 x2 0.
(2.58)
Ahora, en estas ecuaciones deben despejarse los valores óptimos de x1, x2 y . El uso de las ecuaciones
primera y segunda da
2x1 2 2x2 4
o
x1 x2 1.
(2.59)
Sustituir este valor de x1 en la restricción produce la solución:
x2 1,
x1 0.
(2.60)
Es decir, si esta persona puede tolerar sólo una dosis de medicamento debe optar por tomar únicamente
el segundo medicamento. Usando cualquiera de las dos primeras ecuaciones, es fácil completar nuestra
solución demostrando que
2.
(2.61)
Esta es entonces la solución del problema del máximo restringido. Si x1 0, x2 1, entonces y adopta el
valor 8. Restringir los valores de x1 y x2 para que sumen 1 ha reducido el valor máximo de estado de salud,
y, de 10 a 8.
PREGUNTA: Supongamos que este individuo puede tolerar dos dosis diarias. ¿Sería esperable que y
aumentara? ¿Aumentos en la tolerancia más allá de tres dosis diarias tendrían algún efecto en y?
EJEMPLO 2.8 Cercas óptimas y maximización restringida
Supongamos que un agricultor posee una cerca de cierta extensión, P, y desea rodear la mayor área rectangular posible. ¿Qué forma de área debería elegir? Este es evidentemente un problema de maximización restringida. Para resolverlo, sea x la longitud de un lado del rectángulo y y la longitud del otro. El
problema es entonces elegir x y y de tal manera que maximicen el área del terreno (dada por A x ∙ y),
sujeta a la restricción de que el perímetro está fijo en P 2x 2y.
Al establecer la expresión lagrangiana da
ᏸ x ∙ y (P 2x 2y),
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(2.62)
43
8/23
44
Parte 1: Introducción
donde es un multiplicador de Lagrange desconocido. Las condiciones de primer orden para un
máximo son
ᏸ
y
x
ᏸ
x
y
ᏸ
P
2 0,
2 0,
2x
(2.63)
2y 0.
En las tres ecuaciones 2.63 deben despejarse simultáneamente x, y y . Las dos primeras ecuaciones
señalan que y/2 x/2 , lo cual indica que x debe ser igual a y (el terreno debe ser cuadrado). También
implican que x y y deben seleccionarse de tal forma que la razón de los beneficios marginales en relación
con el costo marginal sea la misma para ambas variables. El beneficio (en términos de área) de una unidad más de x está dado por y (el área aumenta en 1 ∙ y), y el costo marginal (en términos del perímetro)
es de 2 (el perímetro disponible se reduce en 2 por cada unidad en la que aumenta la longitud del lado x).
Las condiciones para un máximo establecen que esta razón debe ser igual para cada una de las variables.
Puesto que ya hemos demostrado que x y, podemos usar la restricción para demostrar que
P
x y ,
4
(2.64)
P
k .
8
(2.65)
y dado que y 2,
Interpretación del multiplicador de Lagrange. Si al agricultor le interesara saber cuánto terreno
más podría rodear añadiendo una yarda de cerca, el multiplicador de Lagrange sugiere que podría saberlo
dividiendo el actual perímetro entre 8. Algunos números específicos podrían aclarar esto. Supongamos
que el terreno tiene un perímetro de 400 yardas. Si el agricultor ha planeado “óptimamente”, este terreno
será un cuadrado de 100 yardas ( P/4) por lado. El área circundada será entonces de 10 000 yardas
cuadradas. Supongamos ahora que el perímetro (es decir, la cerca disponible) se extiende una yarda más.
Así, la ecuación 2.65 “predecirá” que el área total aumentaría en aproximadamente 50 ( P/8) yardas
cuadradas. Que este es el caso en efecto puede demostrarse como sigue: dado que el perímetro es ahora
de 401 yardas, cada lado del cuadrado será de 401/4 yardas. Por tanto, el área total del terreno es (401/4)2,
lo que, según la calculadora de los autores, equivale a 10 050.06 yardas cuadradas. De ahí que la “predicción” de un incremento de 50 yardas cuadradas provista por el multiplicador de Lagrange resulte muy
próxima. Como en todos los problemas de maximización restringida, aquí el multiplicador de Lagrange
ofrece información útil sobre el valor implícito de la restricción.
Dualidad. El dual de este problema de maximización restringida es que, respecto a un área dada de un
terreno rectangular el agricultor desea minimizar la cerca requerida para rodearlo. Matemáticamente, el
problema es minimizar
P 2x 2y,
(2.66)
A x ∙ y.
(2.67)
ᏸD 2x 2y D(A x ∙ y)
(2.68)
sujeta a la restricción de
Establecer la expresión lagrangiana
(donde la D denota el concepto dual) produce las siguientes condiciones de primer orden para un
mínimo:
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
ᏸD
2
x
ᏸD
2
y
45
D y 0,
D x 0,
(2.69)
ᏸD
A x y 0.
D
La resolución de estas ecuaciones como se hizo antes produce el resultado
x y A.
(2.70)
De nueva cuenta, el terreno debe ser cuadrado para minimizar la longitud de la cerca. El valor del multiplicador de Lagrange en este problema es
2 2
2
D .
y x A
(2.71)
Como ya se comentó, este multiplicador de Lagrange indica la relación entre el objetivo (minimizar
la cerca) y la restricción (necesidad de rodear el terreno). Si el terreno fuera de 10 000 yardas cuadradas,
como ya vimos, se necesitarían 400 yardas de cerca. Añadir al terreno una yarda cuadrada requeriría
alrededor de .02 yardas más de cerca (2/
A 2/100). El lector podría sacar su calculadora para demostrar que este es el caso: una cerca de 100.005 yardas por lado rodeará exactamente 10 001 yardas cuadradas. Aquí, como en la mayoría de los problemas de dualidad, el valor del multiplicador de Lagrange en el
dual es el recíproco del valor del multiplicador de Lagrange en el problema original. Ambos dan la misma
información, aunque de manera un poco distinta.
PREGUNTAS: Una restricción implícita aquí es que el terreno del agricultor es rectangular. Si no se impusiera esta restricción, ¿de qué forma sería el terreno que encierra el área máxima? ¿Cómo lo probarías?
TEOREMA DE LA ENVOLVENTE
EN PROBLEMAS DE MAXIMIZACIÓN
RESTRINGIDA
El teorema de la envolvente, ya expuesto en relación con problemas de maximización no restringida, también tiene importantes aplicaciones en problemas de maximización restringida. Aquí se
ofrecerá una breve presentación de ese teorema. En capítulos posteriores examinaremos varias
aplicaciones.
Supongamos que se busca el valor máximo de
y f (x1, . . . , xn; a),
(2.72)
g(x1, . . . , xn; a) 0,
(2.73)
sujeto a la restricción de
donde se ha hecho explícita la dependencia de las funciones f y g respecto a algún parámetro a.
Como ya se demostró, una manera de resolver este problema es establecer la expresión lagrangiana
ᏸ f (x1, . . . , xn; a) g(x1, . . . , xn; a)
(2.74)
y resolver las condiciones de primer orden (véanse las ecuaciones 2.51) para los valores óptimos
restringidos x1∗, …, xn∗. O bien, es posible demostrar que
dy
ᏸ
(x , . . . , xn ; a).
da
a 1
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(2.75)
8/23
46
Parte 1: Introducción
Es decir, la variación en el valor máximo de y que resulta al variar el parámetro a (y volver a calcularse todas las x de acuerdo con nuevos valores óptimos) puede hallarse diferenciando parcialmente
la expresión lagrangiana (ecuación 2.74) y evaluando la derivada parcial resultante en el punto
óptimo. De ahí que en la aplicación del teorema de la envolvente a problemas restringidos la expresión lagrangiana desempeñe el mismo papel que el que desempeña la función objetivo en problemas irrestrictos. Como un ejercicio simple, el lector podría querer demostrar que este resultado es
válido para el problema de cercar el terreno rectangular descrito en el ejemplo 2.7.12 En el problema
2.12 se ofrece un esbozo de la prueba del teorema de la envolvente en problemas restringidos.
RESTRICCIONES DE DESIGUALDAD
En algunos problemas económicos no es necesario mantener con exactitud las restricciones. Por
ejemplo, la restricción presupuestal de un individuo requiere que no gaste más de cierta cantidad
por periodo, no obstante, es posible gastar por debajo de esa cantidad. En los problemas económicos también surgen restricciones de desigualdad en los valores permitidos a algunas variables.
Usualmente, por ejemplo, las variables económicas deben ser positivas (sin embargo, pueden
adoptar el valor de cero). En esta sección se demostrará cómo la técnica de Lagrange puede adaptarse a esas circunstancias. Aunque más adelante sólo encontraremos unos cuantos problemas
que requieren estas matemáticas, el desarrollo aquí ilustrará algunos principios generales congruentes con la intuición económica.
Ejemplo de dos variables
Para evitar un exceso de notaciones engorrosas exploraremos las restricciones de desigualdad sólo
para el caso simple que implica dos variables selectas. Los resultados derivados son fáciles de generalizar. Supongamos que se busca maximizar y f (x1, x2) sujeta a tres restricciones de desigualdad:
1. g(x1 , x2
2. x1
0;
3. x2
0.
0;
y
(2.76)
De ahí que se tome en cuenta la posibilidad de que no sea necesario que la restricción introducida
con anterioridad se mantenga con exactitud (no es necesario que una persona gaste todo su
ingreso) por el hecho de que ambas x deban ser positivas (como en la mayoría de los problemas
económicos).
Variables laxas
Una manera de resolver este problema de optimización es introducir tres nuevas variables (a, b y
c) que conviertan las restricciones de desigualdad de la ecuación 2.76 en igualdades. Para garantizar que las desigualdades sigan siendo válidas elevaremos al cuadrado estas nuevas variables,
asegurando así que los valores resultantes sean positivos. Usando este procedimiento las restricciones de desigualdad se convierten en
1. g(x1 , x2
a2 0;
2. x1
b 0; y
3. x2
c2 0.
2
(2.77)
12
En el problema original el perímetro P es el parámetro de principal interés. Al despejar los valores óptimos de x y y, y sustituirlos en la expresión del área (A) del terreno, es fácil demostrar que dA/dP P/8. La diferenciación de la expresión lagrangiana
(ecuación 2.62) produce ᏸ/P y en los valores óptimos de x y y, dA/dP ᏸ/P P/8. Entonces el teorema de la
envolvente ofrece, en este caso, una prueba adicional de que el multiplicador de Lagrange puede usarse para asignar a la restricción
un valor implícito.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
47
Toda solución que obedezca estas tres restricciones de igualdad obedecerá también las de desigualdad. Resultará, asimismo, que los valores óptimos de a, b y c brindarán varios discernimientos sobre la naturaleza de las soluciones de un problema de este tipo.
Solución usando multiplicadores de Lagrange
Al convertir el problema original que implicaba desigualdades en uno que implica igualdades,
ahora estamos en posición de usar métodos de Lagrange para resolverlo. Dado que hay tres restricciones deben introducirse tres multiplicadores de Lagrange: 1, 2 y 3. La expresión lagrangiana completa es
ᏸ f(x1, x2) 1[g(x1, x2) a2] 2(x1 b2) 3(x2 c2).
(2.78)
Deseamos hallar los valores de x1, x2, a, b, c, 1, 2 y 3 que constituyen un punto crítico de esta
expresión. Esto necesitará ocho condiciones de primer orden:
ᏸ
f1 1 g1 2 0,
x1
ᏸ
f2 1 g2 3 0,
x2
ᏸ
2a1 0,
a
ᏸ
2b2 0,
b
ᏸ
2c3 0,
c
ᏸ
g(x1 , x2
a2 0,
1
ᏸ
x1 b2 0,
2
ᏸ
x2 c2 0,
3
(2.79)
En muchos sentidos estas condiciones se parecen a las derivadas anteriores para el caso de una
restricción de igualdad (véase la ecuación 2.51). Por ejemplo, las tres condiciones finales repiten
solamente las tres restricciones revisadas. Esto garantiza que cualquier solución cumpla estas condiciones. Las dos primeras ecuaciones también se parecen a las condiciones óptimas desarrolladas con anterioridad. Si 2 y 3 fueran iguales a 0 las condiciones serían, de hecho, idénticas. Pero
aquí la presencia de los multiplicadores de Lagrange adicionales en las expresiones señala que las
condiciones óptimas acostumbradas podrían no sostenerse con exactitud.
Lasitud complementaria
Las tres ecuaciones que implican las variables a, b y c ofrecen los discernimientos más importantes sobre la naturaleza de las soluciones de problemas que implican restricciones de desigualdad.
Por ejemplo, la tercera línea de la ecuación 2.79 implica que, en la solución óptima, tanto 1 como
a deben ser iguales a 0.13 En el segundo caso (a 0), la restricción g(x1, x2) 0 se sostiene con
exactitud, y el valor calculado de 1 indica su importancia relativa para la función objetivo f. Por
otro lado, si a 0, entonces 1 0, lo que demuestra que disponer de cierta lasitud en la restricción implica que su valor para el objetivo es de 0. En el contexto del consumo esto significa que si
13
No examinaremos el extraño caso en que estas dos variables son iguales a 0.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
48
Parte 1: Introducción
una persona no gasta todo su ingreso, más ingreso inclusive tampoco haría nada para elevar su
bienestar.
Relaciones similares de lasitud complementaria también son válidas para la selección de variables x1 y x2. Por ejemplo, la cuarta línea de la ecuación 2.79 requiere que la solución óptima con b
o 2 sea 0. Si 2 0, entonces la solución óptima tiene x1 0, y esta variable seleccionada satisface la prueba precisa costo-beneficio de que f1 1g1 0. De manera alterna, las soluciones
donde b 0 tienen x1 0, y también requieren que 2 0. Así, esas soluciones no implican el
uso de x1, porque esa variable no satisface la prueba costo-beneficio que aparece en la primera
línea de la ecuación 2.79, la cual implica que f1 1g1 0. Un resultado idéntico es válido para
la variable selecta x2.
Estos resultados, conocidos como condiciones de Kuhn-Tucker en honor a sus descubridores, demuestran que las soluciones de los problemas de optimización que contienen restricciones
de desigualdad diferirán en formas más bien simples de las de problemas similares que contienen
restricciones de igualdad. De ahí que no podamos equivocarnos demasiado trabajando principalmente con restricciones que implican igualdades y suponiendo que podemos depender de la
intuición para enunciar qué pasaría si los problemas respectivos contuvieran desigualdades. Este
es el método general que adoptaremos en este libro.14
CONDICIONES DE SEGUNDO ORDEN
Y CURVATURA
Hasta aquí nuestro análisis de la optimización se ha centrado principalmente en las condiciones
necesarias (de primer orden) para determinar un máximo. Esa es, en efecto, la práctica que seguiremos en gran parte de este libro porque, como veremos, la mayoría de los problemas económicos
contienen funciones para las cuales también se satisfacen las condiciones de segundo orden para
un máximo. Esto se debe a que esas funciones tienen las propiedades de curvatura correctas
para garantizar, asimismo, la suficiencia de las condiciones necesarias para un óptimo. En esta
sección ofreceremos un tratamiento general de estas condiciones de curvatura y su relación con
las condiciones de segundo orden. Las explicaciones económicas de estas condiciones de curvatura se analizarán a lo largo del texto.
Funciones de una variable
Consideramos primero el caso en el que el objetivo, y, es una función de una variable, x. Es decir,
y f (x).
(2.80)
Una condición necesaria para que esta función alcance su valor máximo en algún punto es que en
ese punto
dy
f (x) 0
dx
(2.81)
Para garantizar que dicho punto es en efecto un máximo debemos tener y decreciente para movimientos desde aquél. Ya sabemos (por la ecuación 2.81) que para pequeñas variaciones en x el
valor de x no cambia; lo que debemos comprobar es si y es creciente antes de llegar a esa “meseta”,
y decreciente después. Ya se ha derivado una expresión para el cambio en y (dy), la cual está dada
por la diferencial total
dy f (x)dx.
(2.82)
14
La situación puede ser mucho más compleja cuando no se puede confiar en este cálculo para dar una solución, quizá porque
algunas de las funciones en un problema no son diferenciables. Para un análisis, véase Avinask K. Dixit, Optimization in Economic
Theory, 2a. ed. (Oxford University Press, Oxford, 1990).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
49
Lo que requerimos ahora es que dy decrezca en relación con los incrementos reducidos en el valor
de x. La diferencial de la ecuación 2.82 está dada por
d(dy) d2 y d [f (x)dx
dx f (x)dx dx f (x)dx2 .
dx
(2.83)
Pero
d2y 0
implica que
f (x)dx2 0,
(2.84)
y debido a que dx2 debe ser positiva (porque todo lo elevado al cuadrado es positivo), tenemos
f (x) 0
(2.85)
como la condición requerida de segundo orden. Es decir, esta condición requiere que la función f
tenga una forma cóncava en el punto crítico (contrástense las figuras 2.1 y 2.2). Las condiciones
de curvatura que encontraremos en este libro representan generalizaciones de esta simple idea.
EJEMPLO 2.9 Maximización de beneficios nuevamente
En el ejemplo 2.1 se consideró el problema de determinar el máximo de la función
1 000q 5q2.
(2.86)
La condición de primer orden para un máximo requiere
d
1 000
dq
10q 0
(2.87)
o
q∗ 100.
(2.88)
La segunda derivada de la función está dada por
d2 dq2
10 0.
(2.89)
y de ahí que el punto q∗ 100 cumpla las condiciones suficientes para un máximo local.
PREGUNTA: Aquí la segunda derivada siempre es negativa y no sólo en el punto óptimo. ¿Qué implica
esto respecto del punto óptimo? ¿Cómo debe interpretarse el hecho de que la segunda derivada sea una
constante?
Funciones de dos variables
Como segundo caso, consideremos y como una función de dos variables independientes:
y f (x1, x2).
(2.90)
Una condición necesaria para que dicha función alcance su valor máximo es que sus derivadas
parciales, tanto en la dirección x1 como en la dirección x2, sean iguales a 0. Es decir,
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
50
Parte 1: Introducción
y
f1 0,
x1
y
f2 0.
x2
(2.91)
Un punto que satisface estas condiciones estará en un sitio “plano” de la función (un punto donde
dy 0) y, por tanto, será candidato a un máximo. A fin de garantizar que ese punto sea un
máximo local y debe disminuir ante movimientos en cualquier dirección desde el punto crítico:
en términos gráficos sólo hay un modo de dejar una cumbre y es bajar.
Un argumento intuitivo
Ya se describió por qué una generalización simple del caso de una variable indica que las dos
segundas derivadas parciales propias f11 y f22 deben ser negativas para un máximo local. En nuestra analogía de la montaña, si la atención se reduce a movimientos Norte-Sur o Este-Oeste, la
pendiente de la montaña debe disminuir al cruzar la cima; la pendiente debe cambiar de positiva a negativa. La complejidad particular que surge en el caso de dos variables implica movimientos a través del punto óptimo que no están solamente en las direcciones x1 o x2 (movimientos,
digamos, de Noreste a Suroeste). En esos casos las derivadas parciales de segundo orden no dan
información completa sobre cómo cambia la pendiente cerca del punto crítico. También deben
ponerse condiciones a la derivada cruzada parcial (f12 f21) para garantizar que dy decrezca en
relación con los movimientos que pasen por el punto crítico en cualquier dirección. Como veremos, estas condiciones equivalen a requerir que las derivadas parciales propias de segundo orden
sean suficientemente negativas para servir de contrapeso a toda posible derivada cruzada parcial
“perversa” o extraña. Por intuición, si la montaña es lo suficientemente empinada en las direcciones Norte-Sur y Este-Oeste, las fallas a este respecto relativamente menores en otras direcciones
pueden ser compensadas.
Un análisis formal
Procedamos ahora a exponer estos puntos más formalmente. Lo que queremos descubrir son las
condiciones que deben imponerse a las segundas derivadas parciales de la función f para garantizar que d2y es negativa para movimientos en cualquier dirección que pasen por el punto crítico.
Recuérdese primero que la diferencial total de la función está dada por
dy f1dx1 f2dx2.
(2.92)
La diferencial de esa función está dada por
d2y ( f11dx1 f12dx2)dx1 ( f21dx1 f22dx2)dx2
(2.93)
d2y f11 dx12 f12dx2dx1 f21dx1dx2 f22 dx22.
(2.94)
o
Debido a que mediante el teorema de Young f12 f21, podemos ordenar los términos para obtener
d2y f11 dx12 2f12dx1dx2 f22 dx22.
(2.95)
A fin de que la ecuación 2.95 sea inequívocamente negativa para cualquier cambio en las x (es
decir, para cualquier opción de dx1 y dx2, obviamente es necesario que f11 y f22 sean negativas. Si,
por ejemplo, dx2 0, entonces
d2y f11 dx12
(2.96)
f11 0.
(2.97)
y d y 0 implica que
2
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
51
Un argumento idéntico vale para f22 estableciendo dx1 0. Si ni dx1 ni dx2 son iguales a 0 debemos considerar la cruzada parcial, f12, al decidir si d2y es inequívocamente negativa. Puede usarse
álgebra relativamente simple para demostrar que la condición requerida es15
2
f11 f22 f 12
0.
(2.98)
Funciones cóncavas
Intuitivamente, lo que la ecuación 2.98 requiere es que las segundas derivadas parciales propias f11
y f22 sean suficientemente negativas para que su producto (que es positivo) sea mayor que todo
posible efecto “perverso” de las derivadas cruzadas parciales f12 f21. Las funciones que obedecen
esta condición se llaman funciones cóncavas. En tres dimensiones esas funciones parecen tazas
invertidas (para una ilustración véase el ejemplo 2.11, pág. 53). Esta imagen deja en claro que un
sitio plano en esa función es, en efecto, un máximo verdadero porque la función desciende siempre desde ese sitio. De modo más general, las funciones cóncavas tienen la propiedad de hallarse
siempre bajo un plano tangente a ellas; el plano definido por el valor máximo de la función es
simplemente un caso especial de esta propiedad.
EJEMPLO 2.10 Condiciones de segundo orden: estado de salud, por última vez
En el ejemplo 2.4 se consideró la función estado de salud
y f(x1, x2) x12 2x1 x22 4x2 5.
(2.99)
Las condiciones de primer orden para un máximo son
f1
f2
2x1 2 0,
2x2 4 0
(2.100)
o
x1 1,
x2 2.
(2.101)
Las derivadas parciales de segundo orden para la ecuación 2.99 son
f 11
2,
f 22
2,
f 12 0.
(2.102)
Estas derivadas obedecen claramente las ecuaciones 2.97 y 2.98, de manera que se satisfacen las condiciones tanto necesarias como suficientes para un máximo local.16
PREGUNTA: Describe la forma cóncava de la función estado de salud e indica por qué tiene un solo
valor máximo global.
15
La prueba procede sumando y restando el término (f12 dx2)2/f11 a la ecuación 2.95 y factorizando. Pero este método sólo es
aplicable a este caso especial. Un método más fácil de generalizar y que usa álgebra matricial reconoce que la ecuación 2.95 es una
“forma cuadrática” en dx1 y dx2, y que las ecuaciones 2.97 y 2.98 equivalen a requerir que la matriz hessiana
f11
f21
f12
f22
sea “definida negativa”. En particular, la ecuación 2.98 requiere que la determinante de esta matriz hessiana sea positiva. Para un
análisis, véanse las extensiones de este capítulo.
16
Nótese que la ecuación 2.102 cumple las condiciones suficientes no sólo en el punto crítico, sino también para todas las posibles
opciones de x1 y x2. Es decir, la función es cóncava. En ejemplos más complejos este no es necesariamente el caso: las condiciones
de segundo orden sólo deben satisfacerse en el punto crítico para que ocurra un máximo local.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
52
Parte 1: Introducción
Maximización restringida
Para otra ilustración de condiciones de segundo orden, considérese el problema de elegir x1 y x2
para maximizar
y f (x1, x2),
(2.103)
c b1x1 b2x2 0
(2.104)
sujeta a la restricción lineal
(donde c, b1 y b2 son parámetros constantes en el problema). En este libro encontrarás con frecuencia este tipo de problemas, que es un caso especial de los problemas de máximo restringido
que ya examinamos y en los cuales se demostró que las condiciones de primer orden para un
máximo pueden derivarse estableciendo la expresión lagrangiana
ᏸ f (x1, x2) (c b1x1 b2x2).
(2.105)
La diferenciación parcial respecto a x1, x2 y produce los resultados ya conocidos:
f1
c
b1 0,
f 2 b2 0,
b1 x1 b2 x2 0.
(2.106)
En general, en estas ecuaciones es posible despejar los valores óptimos de x1, x2 y . Para garantizar que el punto derivado de ese modo sea un máximo local, deben examinarse de nuevo los
movimientos desde los puntos críticos, usando la “segunda” diferencial total:
d2y f11 dx12 2f12dx1dx2 f22 dx22.
(2.107)
En este caso, sin embargo, no todos las posibles pequeñas variaciones en las x son permisibles.
Sólo aquellos valores de x1 y x2 que continúan satisfaciendo la restricción pueden considerarse
opciones válidas del punto crítico. Para examinar estas variaciones debe calcularse el diferencial
total de la restricción:
b1dx1 b2dx2 0
(2.108)
o
b1
(2.109)
dx1 .
b2
Esta ecuación muestra las variaciones relativas en x1 y x2 permisibles al considerar movimientos
desde el punto crítico. Para avanzar en este problema debemos usar las condiciones de primer
orden. Las dos primeras implican
dx2
f 1 b1
,
f 2 b2
(2.110)
y combinar este resultado con la ecuación 2.109 produce
dx2
f1
dx1 .
f2
(2.111)
Ahora sustituimos esta expresión de dx2 en la ecuación 2.107 para mostrar las condiciones que
deben ser válidas para que d2y sea negativa:
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
f1
dx1
f2
d2 y f 11 dx21 2f 12 dx1
f1
dx1
f2
f 22
2
f
f2
2f 12 1 dx21 f 22 12 dx21 .
f2
f2
f 11 dx21
53
(2.112)
La combinación de términos y la colocación de cada uno sobre un denominador común dan
d2 y ( f 11 f 22
2f 12 f 1 f 2 f 22 f 21 )
dx21
.
f 22
(2.113)
En consecuencia, para d2y 0 debe darse el caso de que
f 11 f 22
2f 12 f 1 f 2 f 22 f 21 0.
(2.114)
Funciones cuasi cóncavas
Aunque la ecuación 2.114 parece poco más que una masa excesivamente compleja de símbolos
matemáticos, de hecho la condición es importante. Caracteriza a un conjunto de funciones denominadas funciones cuasi cóncavas. Estas funciones tienen la propiedad de que el conjunto de todos
los puntos para los cuales tal función adopta un valor mayor que cualquier constante específica,
es un conjunto convexo (es decir, dos puntos cualesquiera en el conjunto pueden unirse por una
línea totalmente contenida en el conjunto). Muchos modelos económicos se caracterizan por
dichas funciones y, tal como veremos en mayor detalle en el capítulo 3, en estos casos la condición
de cuasi concavidad tiene una interpretación económica relativamente simple. Los problemas 2.9
y 2.10 examinan dos funciones cuasi cóncavas específicas que encontraremos con frecuencia en
este libro. El ejemplo 2.11 muestra la relación entre funciones cóncavas y cuasi cóncavas.
EJEMPLO 2.11 Funciones cóncavas y cuasi cóncavas
Las diferencias entre funciones cóncavas y cuasi cóncavas pueden ilustrarse con la función17
y f (x1 , x2 ) (x1 x2 ) k ,
(2.115)
donde las x sólo adoptan valores positivos, y el parámetro k puede adoptar varios valores positivos.
Sea cual sea el valor que k adopte, esta función es cuasi cóncava. Una manera de demostrar esto es
examinar las “curvas de nivel” de la función, igualando y con un valor específico, digamos c. En este caso
y c (x1 x2 ) k
o
x1 x2 c1/ k c.
(2.116)
Pero esta es justo la ecuación de una hipérbola rectangular estándar. Evidentemente, el conjunto de puntos para el que y adopta valores mayores que c es convexo porque está limitado por esta hipérbola.
Una forma más matemática de demostrar la cuasi concavidad aplicaría la ecuación 2.114 a esta función. Aunque el álgebra de esto es un poco compleja vale la pena el esfuerzo. Los diversos componentes
de la ecuación 2.114 son:
f 1 kx1k 1 xk2 ,
f 2 kxk1 x2k 1 ,
f 11 k(k
1)x1k 2 xk2 ,
f 22 k(k
1)xk1 x2k 2 ,
(2.117)
f 12 k2 x1k 1 x2k 1 .
17
Esta función es un caso especial de la función de Cobb-Douglas. Para más detalles sobre esta función véanse el problema 2.10 y
las extensiones de este capítulo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
54
Parte 1: Introducción
Así,
f 11 f22
2 f 12 f 1 f 2 f 22 f 21 k3 (k
1)x13k 2 x23k
2
2k4 x13k 2 x23k
2
k (k 1)x13k 2 x23k 2
2k3 x13k 2 x23k 2 1),
3
(2.118)
la cual es evidentemente negativa, como requiere la cuasi concavidad.
Que la función f sea cóncava depende del valor de k. Si k 0.5 la función es en efecto cóncava. Un
modo intuitivo de ver esto es considerar sólo puntos en los que x1 x2. Para estos puntos,
y (x21 ) k x2k
1 ,
la que, para k 0.5, es cóncava. Como alternativa, para k
(2.119)
0.5 esta función es convexa.
FIGURA 2.4 Funciones cóncavas y cuasi cóncavas
En los tres casos estas funciones son cuasi cóncavas. Para una y fija sus curvas de nivel son convexas. Pero
sólo para k 0.2 la función es estrictamente cóncava. El caso k 1.0 muestra evidentemente cuasi concavidad porque la función no está bajo su plano tangente.
(a) k = 0.2
(b) k = 0.5
(c) k = 1.0
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
55
Una prueba más definitiva hace uso de las derivadas parciales de la ecuación 2.117. En este caso la
condición de concavidad puede expresarse como
f 11 f 22
f 212 k2 (k
1) 2 x12k 2 x22k
x12k 2 x22k 2 [k2 (k
x12k 1 x22k 1 [k2
2
1)
2
k4 x12k 2 x22k
2
k4
(2.120)
2k 1 ,
y esta expresión es positiva (como lo requiere la concavidad) para
2k 1)
Por otro lado la función es convexa para k
0
o
k 0.5.
0.5.
Ilustración gráfica. La figura 2.4 ofrece ilustraciones tridimensionales de tres ejemplos específicos de
esta función: para k 0.2, k 0.5 y k 1. Adviértase que en los tres casos las curvas de nivel de la función tienen formas convexas hiperbólicas. Es decir, para cualquier valor fijo de y las funciones son similares. Esto indica la cuasi concavidad de la función. Las principales diferencias entre las funciones están
ilustradas por la forma en que el valor de y aumenta al aumentar ambas x juntas. En la figura 2.4a (cuando
k 0.2), el aumento en y se reduce al incrementarse las x. Esto da a la función una forma redondeada,
como una taza, que indica su concavidad. Para k 0.5, y parece aumentar linealmente con incrementos
en ambas x. Este es el límite entre concavidad y convexidad. Por último, cuando k 1 (como en la figura 2.4c), los aumentos simultáneos en los valores de ambas x incrementan rápidamente y. La columna
vertebral de la función es de forma convexa para reflejar esos rendimientos crecientes.
Un detenido análisis de la figura 2.4a sugiere que toda función cóncava será también cuasi cóncava.
En el problema 2.8 se te pedirá demostrar que este es el caso. Este ejemplo muestra que lo contrario a esta
afirmación no es real; las funciones cuasi cóncavas no necesariamente son cóncavas. La mayoría de las
funciones que encontraremos en este libro ilustrarán asimismo este hecho; la mayoría será cuasi cóncava
pero no forzosamente cóncava.
PREGUNTA: Explica por qué las funciones que se muestran en las figuras 2.4a y 2.4c tendrían valores
máximos si las x estuvieran sujetas a una restricción lineal, pero sólo la gráfica en la figura 2.4a tendría
un máximo restringido.
FUNCIONES HOMOGÉNEAS
Muchas de las funciones que se desprenden naturalmente de la teoría económica tienen propiedades matemáticas adicionales. Un conjunto particularmente importante de propiedades tiene
que ver con el modo en que se comportan las funciones cuando la totalidad (o la mayoría) de sus
argumentos aumentan proporcionalmente. Esas situaciones surgen cuando hacemos preguntas
como qué pasaría si todos los precios aumentaran 10 por ciento, o cómo cambiaría la producción
de una empresa si duplicara todos los insumos que utiliza. Pensar en estas interrogantes conduce
naturalmente al concepto de funciones homogéneas. Específicamente, se dice que una función
f(x1, x2, …, xn) es homogénea de grado k si
f (tx1 , tx2 , . . . , txn ) t k f (x1 , x2 , . . . , xn ).
(2.121)
Los ejemplos más importantes de funciones homogéneas son aquellos para los cuales k 1 o
k 0. Es decir, cuando una función es homogénea de grado uno, una duplicación de todos sus
argumentos duplica el valor de la función. Para funciones que son homogéneas de grado cero, una
duplicación de todos sus argumentos deja sin variaciones el valor de la función. Las funciones
también pueden ser homogéneas para las variaciones en sólo ciertos subconjuntos de sus argumentos; es decir, una duplicación de algunas de las x puede duplicar el valor de la función si los
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
56
Parte 1: Introducción
demás argumentos de la función se mantienen constantes. Usualmente, sin embargo, la homogeneidad se aplica a las variaciones en todos los argumentos de una función.
Homogeneidad y derivadas
Si una función es homogénea de grado k y puede diferenciarse, las derivadas parciales de la función serán homogéneas de grado k 1. Una prueba de esto se desprende directamente de la
definición de homogeneidad. Por ejemplo, diferenciar la ecuación 2.121 respecto a su primer
argumento da
f (tx1 , . . . , txn )
f (x1 , . . . , xn )
t tk
x1
x1
o
f 1 (tx1 , . . . , txn ) t k 1 f 1 (x1 , . . . , xn ),
(2.122)
lo que demuestra que f1 satisface la definición de homogeneidad de grado k 1. Dado que las
ideas marginales son tan frecuentes en la teoría microeconómica, esta propiedad indica que algunas propiedades importantes de efectos marginales pueden inferirse de las propiedades de la función subyacente.
Teorema de Euler
Otra caracterísitca útil de las funciones homogéneas puede demostrarse distinguiendo la definición de homogeneidad respecto al factor de proporcionalidad, t. En este caso, diferenciamos primero el miembro derecho de la ecuación 2.121 y luego el miembro izquierdo:
kt k 1 f 1 (x1 , . . . , xn ) x1 f 1 (tx1 , . . . , txn
xn f n (tx1 , . . . , txn ).
Si concedemos que t 1, esta ecuación se convierte en
kf (x1 , . . . , xn ) x1 f1 (x1 , . . . , xn
xn fn (x1 , . . . , xn ).
(2.123)
Esta ecuación se denomina teorema de Euler (en honor al matemático que también descubrió la
constante e) para funciones homogéneas. Demuestra que para una función homogénea existe una
relación definida entre los valores de la función y los valores de sus derivadas parciales. Varias relaciones económicas importantes entre funciones se basan en esta observación.
Funciones homotéticas
Una función homotética se forma al tomar una transformación monótona de una función homogénea.18 Las transformaciones monótonas, por definición, preservan el orden de la relación entre
los argumentos de una función y el valor de esa función. Si ciertos conjuntos de x producen valores más grandes de f, también producirán valores más grandes para una transformación monótona de f. Puesto que las transformaciones monótonas pueden adoptar muchas formas no es de
esperar, sin embargo, que preserven una relación matemática exacta como la incorporada en
funciones homogéneas. Consideremos, por ejemplo, la función y f(x1, x2) x1x2. Evidentemente, esta función es homogénea de grado 2; una duplicación de sus dos argumentos multiplicará el valor de la función por 4. Sin embargo, la función monótona que simplemente suma 1.0 a
f [es decir, F( f ) f 1 x1x2 1] no es homogénea en absoluto. Así, excepto en casos especiales, las funciones homotéticas no poseen las propiedades de homogeneidad de sus funciones subyacentes. Las funciones homotéticas, sin embargo, preservan una importante característica de las
18
Dado que un caso limitante de una transformación monótona es dejar sin variaciones la función, todas las funciones homogéneas son también homotéticas.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
57
funciones homogéneas: que las opciones contenidas por la función sólo dependen de la razón de
las dos variables en juego, no de sus niveles absolutos. Para demostrar esto, recuérdese que la
ecuación 2.23 señala que para una función de dos variables de la forma y f (x1, x2) la opción
contenida entre las dos variables requeridas para mantener constante el valor de la función está
dada por
dx2
dx1
f1
.
f2
Si suponemos que f es homogénea de grado k, sus derivadas parciales serán homogéneas de grado
k 1; por tanto, podemos escribir esta disyuntiva como:
dx2
dx1
t k 1 f1 (tx1 , tx2 )
t k 1 f2 (tx1 , tx2 )
f1 (tx1 , tx2 )
.
f2 (tx1 , tx2 )
(2.124)
Sea ahora t 1/x2, de modo que la ecuación 2.124 se convierte en
dx2
dx1
f1 (x1 /x2 , 1)
,
f2 (x1 /x2 , 1)
(2.125)
lo que demuestra que las opciones contenidas en f sólo dependen de la razón de x1 a x2. Si aplicamos cualquier transformación monótona F (con F 0 ) a la función homogénea original f, las
opciones contenidas por la nueva función homotética F[ f(x1, x2)] se mantienen sin variaciones:
dx2
dx1
Ff1 (x1 /x2 , 1)
Ff2 (x1 /x2 , 1)
f1 (x1 /x2 , 1)
.
f2 (x1 /x2 , 1)
(2.126)
En muchos apartados de este libro resultará instructivo analizar algunos resultados teóricos con
gráficas bidimensionales y la ecuación 2.126 se puede usar para dirigir nuestra atención a las
razones de las variables clave más que a sus niveles absolutos.
EJEMPLO 2.12 Propiedades cardinales y ordinales
En economía aplicada a veces es importante conocer la relación numérica exacta entre variables. Por
ejemplo, en el estudio de la producción podría desearse conocer precisamente cuánta producción extra
se generaría contratando otro trabajador. Esta es una pregunta acerca de las propiedades “cardinales” (es
decir, numéricas) de la función de producción. En otros casos sólo podría interesar el orden en que se
clasifican varios puntos. En la teoría de la utilidad, por ejemplo, suponemos que la gente puede clasificar paquetes de bienes y que seleccionará aquel con la más alta clasificación, pero que no hay valores
numéricos únicos asignados a esas clasificaciones. Matemáticamente, las propiedades ordinales de las
funciones son preservadas por cualquier transformación monótona porque, por definición, una transformación monótona preserva el orden. Usualmente, sin embargo, las propiedades cardinales no son preservadas por transformaciones monótonas arbitrarias.
Estas distinciones se ilustran con las funciones que se examinaron en el ejemplo 2.11. Ahí se estudiaron transformaciones monótonas de la función
f (x1 , x2 ) (x1 x2 ) k
(2.127)
considerando varios valores del parámetro k. Se demostró que la cuasi concavidad (una propiedad ordinal) fue preservada por todos los valores de k. De ahí que cuando se abordan problemas centrados en
maximizar o minimizar esa función sujeta a restricciones lineales no debe preocupar cuál es precisamente la transformación que se usa. Por otro lado, la función en la ecuación 2.127 es cóncava (una propiedad cardinal) sólo para un rango reducido de valores de k. Muchas transformaciones monótonas
destruyen la concavidad de f.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
58
Parte 1: Introducción
La función en la ecuación 2.127 también puede usarse para ilustrar la diferencia entre funciones
homogéneas y homotéticas. Un incremento proporcional en los dos argumentos de f produciría
f (tx1 , tx2 ) t 2k x1 x2 t 2k f (x1 , x2 ).
(2.128)
De ahí que el grado de homogeneidad para esta función dependa de k; es decir, el grado de homogeneidad no se preserva independientemente de qué transformación monótona se use. O bien, la función en
la ecuación 2.127 es homotética porque
dx2
dx1
f1
f2
kx1k 1 xk2
kxk1 x2k 1
x2
.
x1
(2.129)
Es decir, la disyuntiva entre x1 y x2 sólo depende de la razón de estas dos variables y no se ve afectada por
el valor de k. De ahí que la homoteticidad sea una propiedad ordinal. Como veremos, esta propiedad
resulta conveniente cuando se desarrollan argumentos gráficos sobre proposiciones económicas.
PREGUNTA: ¿Cómo cambiaría el análisis en este ejemplo si consideráramos transformaciones monótonas de la forma f (x1, x2, k) x1x2 k para varios valores de k?
INTEGRACIÓN
La integración es otra de las herramientas de cálculo que halla varias aplicaciones en la teoría
microeconómica. Esta técnica se usa para calcular áreas que miden varios resultados económicos,
así como generalmente para brindar un medio con el cual resumir resultados que ocurren en el
tiempo o entre individuos. Nuestro tratamiento del tema aquí necesariamente ha de ser breve; los
lectores interesados en adquirir bases más completas deberán consultar las referencias al final de
este capítulo.
Antiderivadas
Formalmente la integración es la inversa de la diferenciación. Cuando se te pide calcular la integral de una función, f(x), se te pide encontrar una función que tenga f (x) como su derivada. Si
llamamos a esta “antiderivada” F(x), se supone que esta función tiene la propiedad de que
dF(x)
F(x) f (x).
dx
(2.130)
Si esa función existe, se denota como
F(x) 3f (x) dx.
(2.131)
La razón precisa de esta notación, de apariencia más bien extraña se describirá en detalle más
adelante. Primero examinemos algunos ejemplos. Si fx x, entonces
F(x) 3f (x) dx 3x dx x2
C,
2
(2.132)
donde C es una “constante de integración” arbitraria que desaparece en la diferenciación. La exactitud de este resultado puede comprobarse fácilmente:
F(x) d(x2 / 2 C)
x 0 x.
dx
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(2.133)
8/23
Capítulo 2: Matemáticas para microeconomía
59
Cálculo de antiderivadas
El cálculo de antiderivadas puede ser muy simple, o difícil, o exasperante, o imposible, dependiendo de la f (x) particular especificada. Aquí consideraremos tres métodos simples para
hacer dichos cálculos aunque, como es de esperar, no siempre funcionan.
1. Conjetura creativa. Probablemente el modo más común de determinar integrales (antiderivadas) sea el de trabajar hacia atrás, preguntándonos “¿qué función producirá f (x) como su
derivada?”. He aquí algunos ejemplos obvios:
x3
F(x) 3x2 dx C,
3
xn1
F(x) 3xn dx C,
n 1
ax3 bx2
F(x) 3(ax2 bx c) dx cx C,
3
2
F(x) 3ex dx ex C,
F(x) 3ax dx F(x) 3
(2.134)
ax
C,
ln a
1
dx ln(x) C,
x
F(x) 3(ln x) dx x ln x
x C.
Deberías usar la diferenciación para comprobar que todas estas ecuaciones cumplen la propiedad de que F(x) f(x). Nótese que en cada caso la integral incluye una constante de
integración porque las antiderivadas son únicas sólo hasta una constante aditiva, que se volvería cero en la diferenciación. En muchos sentidos, los resultados de la ecuación 2.134 (o
generalizaciones triviales de ella) serán suficientes para nuestros propósitos en este libro. No
obstante, he aquí dos métodos más que pueden funcionar cuando la intuición falla.
2. Cambio de variable. Una redefinición ingeniosa de variables puede hacer a veces que una
función sea mucho más fácil de integrar. Por ejemplo, no es del todo obvio cuál es la integral
de 2x/(1 x2). Pero si se concede que y 1 x2, entonces dy 2xdx y
2x
1
2
31 x2 dx 3 y dy ln(y) ln(1 x ).
(2.135)
La clave de este procedimiento está en descomponer la función original en un término en y y
un término en dy. Se necesita mucha práctica para distinguir patrones en los que esto funcionará.
3. Integración por partes. Un método similar para determinar integrales hace uso de la identidad duv udv vdu para cualesquiera dos funciones u y v. La integración de esta diferencial
produce
3duv uv 3u dv 3v du
o
3u dv uv
3v du.
(2.136)
Aquí la estrategia es definir funciones u y v de tal modo que la integral desconocida de la
izquierda pueda calcularse mediante la diferencia entre las dos expresiones conocidas de
la derecha. Por ejemplo, de ninguna manera es obvio cuál es la integral de xex. Pero podemos
definir u x (por tanto, du dx) y dv exdx (por tanto, v ex). De ahí que ahora tengamos
x
3xe dx 3u dv uv
x
3v du xe
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
x
3e dx ( x
1)ex C.
(2.137)
8/23
60
Parte 1: Introducción
De nueva cuenta, sólo la práctica puede sugerir patrones útiles en las formas en que u y v
pueden definirse.
Integrales definidas
Las integrales que hemos analizado hasta aquí son integrales “indefinidas”; sólo ofrecen una función general, que es la antiderivada de otra función. Un método algo distinto, aunque conexo, usa
la integración para sumar el área bajo una gráfica de una función en un intervalo definido. La
figura 2.5 ilustra este proceso. Se desea conocer el área bajo la función f(x) de x a a x b. Una
manera de hacer esto sería dividir el intervalo en fragmentos más pequeños de x( x) y sumar las
áreas de los rectángulos que aparecen en la figura. Es decir:
área bajo f (x
f (xi )
(2.138)
xi ,
i
donde la notación indica que la altura de cada rectángulo es aproximada por el valor de f(x) para
un valor de x en el intervalo. Llevar al límite este proceso, contrayendo el tamaño de los intervalos
x, rinde una medida exacta del área deseada y se denota con:
xb
área bajo f (x) 3 f (x) dx.
(2.139)
xa
Esto explica entonces el origen del peculiar signo de la integral, una S estilizada que indica “suma”.
Como veremos, integrar es una manera general de sumar los valores de una función continua en
un intervalo.
FIGURA 2.5
Las integrales definidas
muestran las áreas bajo
la gráfica de una función.
Las integrales definidas miden el área bajo una curva sumando áreas rectangulares, como se advierte en la
gráfica. La dimensión de cada rectángulo es fx(dx).
f(x)
f(x)
a
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
b
23.08.2019
x
8/23
Capítulo 2: Matemáticas para microeconomía
61
Teorema fundamental del cálculo
Evaluar la integral en la ecuación 2.139 es simple si conocemos la antiderivada de f (x), digamos
F(x). En este caso tenemos
xb
área bajo f (x) 3 f (x) dx F(b
(2.140)
F(a).
xa
Es decir, lo único que debemos hacer es calcular la antiderivada de f(x) y restar el valor de esta
función en el límite inferior de la integración a su valor en el límite superior de la integración. Este
resultado se conoce como teorema fundamental del cálculo porque une directamente las dos principales herramientas del cálculo: derivadas e integrales. En el ejemplo 2.13 se demuestra que este
resultado es mucho más general que simplemente una forma de medir áreas. Puede usarse para
ilustrar uno de los principios conceptuales primarios de la economía: la distinción entre “existencias” y “flujos”.
EJEMPLO 2.13 Existencias y flujos
La integral definida proporciona un medio útil para sumar cualquier función que ofrezca un flujo continuo en el tiempo. Por ejemplo, supongamos que el incremento neto de población de un país (nacimientos
menos muertes) puede aproximarse con la función f(t) 1 000e0.02t. De ahí que el cambio neto de población sea creciente, a una tasa de 2 por ciento al año; es decir, 1 000 personas nuevas en el año 0; 1 020
personas nuevas en el primer año, 1 041 en el segundo y así sucesivamente. Supongamos que deseamos
conocer cuánto se incrementará en total la población en 50 años. Esta podría ser una estimación tediosa
sin el cálculo, pero usar el teorema fundamental del cálculo ofrece una respuesta fácil:
t50
t50
50
incremento de la población 3 f (t) dt 3 1 000e0.02t dt F(t)
t0
t0
0.02t 50
1 000e
0.02
0
1 000e
0.02
0
50 000 85 914
(2.141)
[donde la notación ba indica que la expresión debe evaluarse como F(b) − F(a)]. De ahí que la conclusión
sea que la población aumentará en cerca de 86 000 personas en los próximos 50 años. Adviértase cómo
el teorema fundamental del cálculo une un concepto de “flujo”, el incremento neto de la población (el cual
se mide como monto por año), con un concepto de “existencias”, la población total (la cual se mide en una
fecha específica y no tiene una dimensión temporal). Adviértase también que el cálculo de 86 000 se
refiere sólo al incremento total entre el año 0 y el año 50. Para conocer la población total real en cualquier
fecha, tendríamos que sumar el número de personas en la población en el año 0. Esto sería similar a elegir
una constante de integración en este problema específico.
Consideremos ahora una aplicación con más contenido económico. Supongamos que los costos totales de una empresa particular están dados por C(q) 0.1q2 500 (donde q representa la producción en
cierto periodo). Aquí el término 0.1q2 representa costos variables (costos que varían con la producción),
mientras que la cifra de 500 representa costos fijos. Los costos marginales de este proceso de producción
pueden hallarse por diferenciación —MC dC(q)/dq 0.2q—, y de ahí que los costos marginales sean
crecientes con q y los costos fijos se dejen fuera en la diferenciación. ¿Cuáles son los costos totales asociados con producir, digamos, q 100? Una manera de responder esta pregunta es usar directamente la
función de costo total: C(100) 0.1(100)2 500 1 500. Otra sería integrar el costo marginal en el
rango de 0 a 100 para obtener el costo variable total:
q100
100
costo variable 3 0.2q dq 0.1q2
q0
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
1 000
0
23.08.2019
0 1 000,
(2.142)
8/23
62
Parte 1: Introducción
a lo que habría que sumar los costos fijos de 500 (la constante de integración en este problema) para
obtener los costos totales. Claro que este método para arribar al costo total es mucho más laborioso que
sólo usar directamente la ecuación de costo total. Pero la derivación demuestra que el costo variable total
entre dos niveles cualesquiera de producción puede hallarse por integración como el área bajo la curva
de costo marginal, conclusión que nos será útil en algunas aplicaciones prácticas.
PREGUNTA: ¿Cómo calcularías el costo variable total asociado con la expansión de la producción de
100 a 110? Explica por qué los costos fijos no entran en este cálculo.
Diferenciación de una integral definida
Ocasionalmente desearemos diferenciar una integral definida, usualmente en el contexto de
maximizar el valor de dicha integral. Aunque hacer tales diferenciaciones puede ser un poco
complejo a veces, hay algunas reglas que deberían facilitar el proceso.
1. Diferenciación respecto a la variable de integración. Esta cuestión es complicada, pero instructiva. Una integral definida tiene un valor constante; de ahí que su derivada sea igual a
cero. Es decir:
b
d ∫a f (x) dx
0.
dx
(2.143)
El proceso de suma requerido por la integración se ha efectuado ya una vez que hemos escrito
una integral definida. No importa si la variable de integración es x, t o cualquier otra. El valor
de esta suma integrada no cambiará al variar la variable x, sin importar qué sea x (no obstante
véase la regla 3, más adelante).
2. Diferenciación respecto al límite superior de la integración. Cambiar el límite superior de la
integración obviamente cambiará el valor de una integral definida. En este caso debe distinguirse entre la variable determinante del límite superior de la integración (digamos x) y la
variable de integración (digamos t). El resultado es entonces una aplicación simple del teorema fundamental del cálculo. Por ejemplo:
x
d ∫ a f (t)dt d[F(x
F(a
f (x
dx
dx
0 f (x),
(2.144)
donde F(x) es la antiderivada de f(x). Remitiéndonos a la figura 2.5 podemos ver por qué esta
conclusión tiene sentido: la pregunta es cómo variará el valor de la integral definida si x
aumenta ligeramente. La respuesta obvia es que el valor de la integral aumenta en el equivalente a la altura de f(x) (nótese que este valor dependerá en última instancia del valor especificado de x).
Si el límite superior de la integración es una función de x, este resultado puede generalizarse usando la regla de cadena:
g(x)
d ∫a
f (t) dt d[F(g(x
F(a
d[F(g(x
dx
dx
dx
f
dg(x)
f (g(x))g(x),
dx
(2.145)
donde, nuevamente, el valor específico de esta derivada dependerá del valor supuesto de x.
Por último, adviértase que la diferenciación respecto a un límite inferior de la integración
sólo modifica el signo de esta expresión:
b
d ∫ g(x) f (t) dt
dx
d[F(b
F(g(x
dx
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
dF(g(x))
dx
23.08.2019
f (g(x)) g(x).
(2.146)
8/23
Capítulo 2: Matemáticas para microeconomía
63
3. Diferenciación respecto a otra variable relevante. En algunos casos lo que se desee será integrar una expresión que sea una función de varias variables. En general, esto puede implicar
integrales múltiples y la diferenciación podría complicarse. Pero hay un caso simple que cabe
mencionar aquí. Supongamos que tenemos una función de dos variables, f(x, y), y deseamos
integrar esta función respecto a la variable x. El valor específico para esta integral dependerá
obviamente del valor de y, incluso podemos preguntarnos cómo variará ese valor al variar y.
En este caso, para obtener un resultado es posible “diferenciar mediante el signo de la integral”. Es decir:
b
b
d ∫ a f (x, y) dx
3f y (x, y) dx.
dy
(2.147)
a
Esta expresión señala que primero podemos diferenciar parcialmente f(x, y) respecto de y
antes de proceder a calcular el valor de la integral definida. Por supuesto que el valor resultante podría seguir dependiendo del valor específico asignado a y, pero a menudo producirá
más discernimientos económicos que el problema original. En el problema 2.8 encontraremos
algunos ejemplos adicionales del uso de integrales definidas.
OPTIMIZACIÓN DINÁMICA
Algunos problemas de optimización que se presentan en la microeconomía implican periodos
múltiples.19 Nos interesa determinar la trayectoria temporal óptima para que una variable o un
conjunto de variables consigan optimizar alguna meta. Por ejemplo, un individuo podría querer
elegir una trayectoria de consumo de por vida que maximice su utilidad. O una empresa podría
estar buscando una trayectoria de decisiones de insumos y producción que maximice el valor
presente de todos los beneficios futuros. La caracterísitica particular de estos problemas y que los
vuelve difíciles es que las decisiones que se toman en un periodo afectan los resultados en periodos posteriores. De ahí que deba tomarse explícitamente en cuenta esta interrelación al seleccionar trayectorias óptimas. Si las decisiones en un periodo no afectaran periodos posteriores, el
problema no tendría una estructura “dinámica”; se podrían sencillamente optimizar las decisiones en cada periodo sin considerar qué sucederá después. Aquí, sin embargo, deseamos tomar
explícitamente en cuenta consideraciones dinámicas.
El problema del control óptimo
Matemáticos y economistas han desarrollado numerosas técnicas para resolver problemas de
optimización dinámica. Las referencias al final de este capítulo ofrecen amplias introducciones a
esos métodos. Aquí, sin embargo, sólo nos interesará uno de ellos, con muchas semejanzas con las
técnicas de optimización que ya hemos estudiado en este capítulo: el problema del control óptimo.
El marco del problema es relativamente simple. Un tomador de decisiones busca determinar la
trayectoria temporal óptima para alguna variable x(t) en un intervalo específico [t0, t1]. Las variaciones en x son gobernados por una ecuación diferencial:
dx(t)
g[x(t), c(t), t ,
dt
(2.148)
donde la variable c(t) se usa para “controlar” el cambio en x(t). En cada periodo, el tomador
de decisiones deriva valor de x y c de acuerdo con la función f[x(t), c(t), t] y su meta de optimizar
19
En esta sección trataremos los problemas de optimización dinámica como ocurrentes en el tiempo. En otros contextos, las
mismas técnicas pueden usarse para resolver problemas de optimización que ocurren en un continuo de empresas o individuos
cuando las opciones óptimas para un agente afectan lo que es óptimo para otros. El material de esta sección se usará sólo en algunos pocos apartados de este libro, pero se ofrece aquí como una referencia conveniente.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
64
Parte 1: Introducción
tt01 f[x(t), c(t), t] dt. A menudo este problema también estará sujeto a restricciones de “punto final”
sobre la variable x. Estas podrían escribirse como x(t0) x0 y x(t1) x1.
Nótese que este problema es “dinámico”. Cualquier decisión acerca de cuánto variar x en este
periodo afectará no sólo el valor futuro de x, sino también valores futuros de la función resultante
f. El problema es entonces cómo mantener x(t) en su trayectoria óptima.
La intuición económica puede ayudar a resolver este problema. Supongamos que sólo nos
interesa la función f y elegimos x y c para optimizarla en cada instante. Hay dos dificultades en
este enfoque “miope”. Primero, en realidad no estamos en libertad de “elegir” x en ningún
momento. Más bien, el valor de x estará determinado por su valor inicial x0 y su historia de varaciones dadas por la ecuación 2.148. Una segunda dificultad con este enfoque miope es que no
considera la naturaleza dinámica del problema, pues no cuestiona cómo las decisiones de este
periodo afectarán el futuro. Necesitamos una manera de reflejar la dinámica de este problema en
las decisiones de un periodo. Asignar el valor (precio) correcto a x en cada instante hará justo eso.
Como este precio implícito tendrá muchas semejanzas con los multiplicadores de Lagrange, que
ya hemos estudiado en este capítulo, lo llamaremos (t). El valor de es tratado como una función de tiempo pues la importancia de x obviamente puede cambiar en el tiempo.
El principio del óptimo
Examinemos ahora el problema del tomador de decisiones en un punto en el tiempo. Este debe
interesarse tanto en el valor corriente de la función objetivo f[x(t), c(t), t] como en el cambio
implicado en el valor de x(t). Puesto que el valor corriente de x(t) está dado por (t)x(t), el índice
de cambio instantáneo de este valor está dado por:
d[(t)x(t
dx(t)
d(t)
,
(t)
x(t)
dt
dt
dt
(2.149)
así que, en cualquier momento t, una medida completa del valor de interés20 para el tomador de
decisiones es
H f [x(t), c(t), t
(t)g[x(t), c(t), t
x(t)
d(t)
.
dt
(2.150)
Este valor completo representa tanto los beneficios corrientes recibidos como la variación instantánea en el valor de x. Ahora es posible preguntar qué condiciones deben aplicarse a x(t) y c(t)
para optimizar esta expresión.21 Esto es:
H
f c g c 0 o fc
g c ;
c
H
d(t)
f x g x 0 o f x g x
dt
x
d(t)
.
dt
(2.151)
Estas son entonces las dos condiciones óptimas para este problema dinámico. Usualmente se les
llama el principio del óptimo. Esta solución del problema de control óptimo fue propuesta originalmente por el matemático ruso L. S. Pontryagin y sus colegas, a principios de la década de 1960.
Aunque idealmente la lógica del principio del óptimo se puede ilustrar con las aplicaciones
económicas que encontraremos más adelante, un breve resumen de la intuición en su base será
útil. La primera condición inquiere sobre la opción óptima de c. Sugiere que, en el margen, la
ganancia de c en términos de la función f debe ser compensada por las pérdidas de c en términos
20
Denotamos esta expresión de valor corriente con H para indicar su semejanza con la expresión de Hamilton que se usa en la
teoría formal de la optimización dinámica. Sin embargo, generalmente la expresión de Hamilton no tiene el último término de
la ecuación 2.150.
21
Obsérvese que aquí en realidad la variable x no es una variable selecta; su valor está determinado por la historia. La diferenciación respecto a x puede considerarse como esta pregunta implícita: “Si x(t) fuera óptima, ¿qué características tendría?”.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
65
del valor de su capacidad para cambiar x. Es decir, los beneficios presentes deben compararse con
los costos futuros.
La segunda condición tiene que ver con las características que debería tener una trayectoria
temporal óptima de x(t). Implica que, en el margen, todo beneficio neto de una unidad más de x
(ya sea en términos de f o del valor adjunto de variaciones en x) debe ser compensada por variaciones en el valor implicado de x. Es decir, el beneficio neto de una unidad adicional de x debe
compararse con el decreciente valor futuro de x.
EJEMPLO 2.14 Asignación de una oferta fija
Como muy simple ilustración del principio del óptimo supongamos que alguien hereda 1 000 botellas de
vino de un tío rico y planea consumirlas en los próximos 20 años. ¿Cómo debería hacerlo para optimizar
la utilidad?
Supongamos que la función de utilidad de esa persona respecto al vino está dada por u[c(t)] In c(t).
De ahí que la utilidad de beber vino exhiba una utilidad marginal decreciente (u 0, u 0). La meta
de esta persona es optimizar
20
20
3 u[c(t
dt 3 ln c(t) dt.
0
(2.152)
0
Concedamos que x(t) representa el número de botellas de vino que restan en el momento t. Esta serie está
restringida por x(0) 1 000 y x(20) 0. La ecuación diferencial determinante de la evolución de x(t)
adopta la forma simple:22
dx(t)
dt
(2.153)
c(t).
Es decir, el consumo en cada instante reduce las existencias de botellas. La expresión hamiltoniana de
valor corriente para este problema es
H ln c(t) c(t
x(t)
d
,
dt
(2.154)
y las condiciones de primer orden para un óptimo son
H 1
0,
c
c
H d
0.
x
dt
(2.155)
La segunda de estas condiciones requiere que (el valor implícito del vino) sea constante en el tiempo.
Esto tiene sentido intuitivo: puesto que consumir una botella de vino reduce siempre en una botella las
existencias disponibles, cualquier solución en la que el valor del vino difiera en el tiempo ofrecerá un
incentivo para variar de comportamiento consumiendo más botellas cuando es barato y menos cuando
es caro. Combinar esta segunda condición de un óptimo con la primera implica que c(t) debe ser constante en el tiempo. Si c(t) k, el número de botellas restantes en cualquier momento será x(t) 1 000
kt. Si k 50, el sistema cumplirá las restricciones de punto final x(0) 1 000 y x(20) 0. Desde luego
que en este problema se podría suponer que el plan óptimo es consumir el vino a razón de 50 botellas por
22
La forma simple de esta ecuación diferencial (donde dx/dt sólo depende del valor de la variable de control, c) significa que este
problema es idéntico al explorado usando el método de “cálculo de variaciones” de la optimización dinámica. En ese caso, es
posible sustituir dx/dt en la función f y comprimir las condiciones de primer orden de un óptimo en la ecuación fx dfdx/dt/dt,
llamada ecuación de Euler. En el capítulo 17 encontraremos muchas ecuaciones de Euler.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
66
Parte 1: Introducción
año durante 20 años, porque la utilidad marginal decreciente sugiere que uno no desea consumir en
exceso en ningún periodo. El principio del óptimo confirma esta intuición.
Utilidad más complicada. Tomemos ahora una función de utilidad más complicada que puede arrojar resultados más interesantes. Supongamos que la utilidad de consumir vino en cualquier fecha, t, está
dada por
[c(t) / si 0, 1;
ln c(t)
si 0.
u[c(t)]
(2.156)
Supongamos también que el consumidor descuenta el consumo futuro a razón de . De ahí que la meta
de esta persona sea optimizar
20
20
t
3 u[c(t)] dt 3 e
0
0
[c(t)]
dt
(2.157)
sujeta a las restricciones siguientes:
dx(t)
c(t),
dt
x(0) 1 000,
x(20) 0.
(2.158)
Establecer la expresión hamiltoniana de valor corriente produce
H e
t
[c(t
c) x(t)
d(t)
,
dt
(2.159)
y el principio del óptimo requiere que
H
e t [c(t 1 0
c
H
d
0 0 0.
x
dt
y
(2.160)
Por tanto podemos concluir nuevamente que el valor implícito de las existencias de botellas de vino ()
debe ser constante en el tiempo (llamemos a esto constante k) y que
e
t
1
[c(t
k o c (t) k1/(
1) t /( 1)
e
.
(2.161)
Así, el consumo óptimo de botellas debe reducirse en el tiempo para compensar el hecho de que el consumo futuro se descuenta en la mente del consumidor. Si, por ejemplo, concedemos que 0.1 y −1
(valores “razonables”, como se demostrará en capítulos posteriores), entonces
c(t) k
0.5
e
0.05t
(2.162)
Ahora debemos hacer un poco más de labor en la selección de k para satisfacer las restricciones de punto
final. Deseamos
20
20
20
3 c(t) dt 3 k
0
0.5
e
0.05t
dt
20k
0.5
e
0.05t
0
0
20k
0.5
(e
1
1) 12.64k
0.5
(2.163)
1 000.
Así, por último, tenemos el plan óptimo de consumo como
c(t
79e
0.05t
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
.
23.08.2019
(2.164)
8/23
Capítulo 2: Matemáticas para microeconomía
67
Este plan requiere que el consumo de botellas de vino comience en un nivel muy alto y decrezca a un
índice continuo de 5 por ciento anual. Dado que el consumo es continuamente decreciente, debemos
usar integración para calcular el consumo de vino en un año particular (x) como sigue:
x
x
3 c (t) dt 3 79e
consumo en un año x
x 1
x
0.05t
dt
1 580e
0.05t
x 1
x 1
1 580(e
0.05(x 1)
e
0.05x
(2.165)
).
Si x 1, el consumo es aproximadamente de 77 botellas en el primer año. Luego decrece de manera
uniforme, terminando en aproximadamente 30 botellas consumidas en el año 20.
PREGUNTA: Nuestra primera ilustración fue sólo un ejemplo de la segunda en la que 0.
Explica cómo valores alternos de estos parámetros afectarán la trayectoria de consumo óptimo de
vino. Explica tus resultados intuitivamente (para más información sobre consumo óptimo en el tiempo,
véase el capítulo 17).
ESTADÍSTICA MATEMÁTICA
En los últimos años la teoría microeconómica se ha centrado cada vez más en problemas ofrecidos por la incertidumbre y la información imperfecta. Para comprender gran parte de esa bibliografía es importante tener firmes bases de estadística matemática. Así, el propósito de esta sección
es resumir algunos principios estadísticos que encontraremos en distintos apartados de este libro.
Variables aleatorias y funciones de densidad de probabilidad
Una variable aleatoria describe (en forma numérica) los resultados de un experimento sujeto al
azar. Por ejemplo, podríamos lanzar una moneda y observar si sale cara o cruz. Si llamamos a esta
variable aleatoria x, podemos denotar los resultados posibles (“realizaciones”) de la variable
como:
x
1
0
si la moneda es cara,
si la moneda es cruz.
Nótese que antes de lanzar la moneda x puede ser 1 o 0. Sólo después de despejada la incertidumbre (es decir, después de lanzada la moneda) sabremos cuál es el valor de x.23
Variables aleatorias discretas y continuas
Los resultados de un experimento aleatorio pueden ser un número finito de posibilidades o un
continuo de posibilidades. Por ejemplo, el número que resulta de lanzar un dado es una variable
aleatoria con seis resultados posibles. Si se lanzan dos dados podría registrarse la suma de sus
caras (en cuyo caso hay 12 resultados, algunos de los cuales tienen más probabilidades que otros)
o un número de dos dígitos, uno para el valor de cada dado (en cuyo caso habría 36 resultados
igualmente probables). Estos son ejemplos de variables aleatorias discretas.
Por otro lado, una variable aleatoria continua puede adoptar cualquier valor en un rango dado
de números reales. Por ejemplo, la temperatura a la intemperie del día de mañana podría verse
23
A veces las variables aleatorias se denotan con ~
x para distinguir entre variables cuyo resultado está sujeto al azar y variables algebraicas (no aleatorias). Este recurso de notación puede ser útil para seguir la pista de lo que es aleatorio y lo que no en un problema
particular, y lo usaremos en algunos casos. Cuando no haya ambigüedad, sin embargo, no emplearemos esta notación especial.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
68
Parte 1: Introducción
como una variable continua (suponiendo que las temperaturas pueden medirse con precisión)
que va de, digamos, 50 C a 50 C. Desde luego que algunas de estas temperaturas serían de
ocurrencia improbable, pero en principio la temperatura medida de manera precisa podría
estar en cualquier punto entre estos dos límites. De igual forma, el cambio porcentual del día de
mañana en el valor de un índice bursátil particular podría verse como susceptible de adoptar todos
los valores entre 100% y, digamos, 1 000%. De nueva cuenta, por supuesto, serían mucho más
probables de ocurrir las variaciones porcentuales alrededor de 0% que los valores extremos.
Funciones de densidad de probabilidad
La función de densidad de probabilidad (FDP) para cualquier variable aleatoria indica la probabilidad de que ocurra cada resultado específico. Para a una variable aleatoria discreta definir esa
función no plantea ninguna dificultad particular. En el caso del lanzamiento de una moneda, por
ejemplo, la FDP [denotada por f (x)] estaría dada por
f (x 1) 0.5,
f (x 0) 0.5.
(2.166)
Para el caso del lanzamiento de un dado la FDP sería:
f (x 1)
f (x 2)
f (x 3)
f (x 4)
f (x 5)
f (x 6)
1 /6,
1 /6,
1 /6,
1 /6,
1 /6,
1 /6.
(2.167)
Nótese que en ambos casos las probabilidades especificadas por la FDP suman 1.0. Esto se debe a
que, por definición, uno de los resultados del experimento aleatorio debe ocurrir. De modo más
general, si todos los resultados de una variable aleatoria discreta se denotan como xi para i 1, …,
n, debemos tener:
n
f (xi ) 1.
(2.168)
i1
En una variable aleatoria continua debemos tener cuidado al definir el concepto de FDP. Dado
que esa variable aleatoria adopta un continuo de valores, si le asignamos cualquier valor diferente
de cero como la probabilidad de un resultado específico (es decir, una temperatura de
25.53470 C) pronto podríamos tener sumas de probabilidades infinitamente grandes. De ahí
que para una variable aleatoria continua definamos la FDP f (x) como una función con la propiedad de que la probabilidad de que x ocurra en un intervalo reducido particular dx está dada por
el área de f(x)dx. Usando esta convención la propiedad de que las probabilidades de un experimento aleatorio sumen 1.0 se enuncia como sigue:
3 f (x) dx 1.0.
(2.169)
Algunas FDP importantes
La mayoría de las funciones operará como una FDP, siempre y cuando f(x) 0 y la función
sumen (o integren) 1.0. El truco, desde luego, es encontrar funciones que reflejen experimentos
aleatorios que ocurren en la realidad. Aquí nos ocuparemos de cuatro de dichas funciones las
cuales nos serán útiles en varias secciones de este libro. Las gráficas de esas cuatro funciones aparecen en la figura 2.6.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
FIGURA 2.6
Cuatro funciones comunes de densidad de probabilidad.
69
Las variables aleatorias con estas FDP son de amplio uso. Cada gráfica indica el valor esperado de la FDP
mostrada.
f(x)
f (x)
p
1−p
1
b−a
0
p
1
a+b
2
a
x
b
x
(b) Uniforme
(a) Binomial
f (x)
f(x)
λ
⎯
⎯
1/ √2π
1/λ
0
x
(c) Exponencial
x
(d) Normal
1. Distribuición binomial. Esta es la distribución discreta básica. Usualmente se supone que x
adopta sólo dos valores, 1 y 0. La FDP de la binomial está dada por:
f (x 1) p,
f (x 0) 1 p,
donde
(2.170)
0 p 1.
El ejemplo de lanzar una moneda es obviamente un caso especial de la binomial donde p 0.5.
2. Distribución uniforme. Esta es la FDP continua más simple. Supone que los valores posibles
de la variable x ocurren en un intervalo definido y que cada valor es igualmente probable. Es
decir:
f (x) b
f (x) 0
1
a
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
para a
x
b;
para x a o x
23.08.2019
b.
(2.171)
8/23
70
Parte 1: Introducción
Obsérvese aquí que las probabilidades integran 1.0:
b
3 f (x) dx 3b
1
a
b
x
dx b
a
a
a
b
b
a
a
b
a
b
b
a
1.0.
a
(2.172)
3. Distribución exponencial. Esta es una distribución continua para la cual las probabilidades
decrecen a un índice exponencial uniforme al incrementarse x. Formalmente:
f (x) e
0
x
si x
si x
0,
0,
(2.173)
donde es una constante positiva. De nuevo, es fácil demostrar que esta función integra 1.0:
3 f (x) dx 3 e
x
dx
e
x
0
1) 1.0.
(2.174)
0
0
4. Distribución normal. La distribución normal (o de Gauss) es la más importante en la estadística matemática. Su importancia se deriva sobre todo del teorema del límite central el cual
establece que la distribución de cualquier suma de variables aleatorias independientes aproximará cada vez más la distribución normal conforme el número de esas variables aumente.
Dado que los promedios muestrales pueden considerarse sumas de variables aleatorias independientes, este teorema señala que cualquier promedio muestral tendrá una distribución
normal sin importar cuál sea la distribución de la población de la cual se seleccionó la muestra. De ahí que suela ser apropiado suponer que una variable aleatoria tiene una distribución
normal si se le puede concebir como una especie de promedio.
La forma matemática de la FDP normal es
f (x) 1
e
2
x2 /2
,
(2.175)
y esto se define para todos los valores reales de x. Aunque esta función podría parecer complicada, algunas de sus propiedades pueden describirse fácilmente. Primero, esta función es
simétrica en torno a cero (a causa del término x2). Segundo, es asintótica a cero al aumentar o
reducir x. Tercero, alcanza su valor óptimo en x 0. Este valor es 1/
2 ≈ 0.4. Por último, la
gráfica de esta función tiene una “forma de campana” regular de uso común en la estadística.
La integración de esta función es relativamente complicada (aunque fácil en coordenadas
polares). La presencia de la constante 1/
2 es necesaria para que la función integre 1.0.
Valor esperado
El valor esperado de una variable aleatoria es el valor numérico que se puede esperar que tenga en
promedio la variable aleatoria.24 Se trata del “centro de gravedad” de la FDP. Para una variable
aleatoria discreta que adopta los valores x1, x2, …, xn, el valor esperado se define como
n
E(x) xi f (xi )
(2.176)
i1
24
El valor esperado de una variable aleatoria también se conoce como media de esa variable. En ocasiones en el estudio del muestreo esto puede causar confusión entre el valor esperado de una variable aleatoria y el concepto diferente del promedio aritmético
de la muestra.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
71
Es decir, cada resultado es ponderado por la probabilidad de que ocurra, y se suma a todos los
resultados posibles. Para una variable aleatoria continua, la ecuación 2.176 se generaliza fácilmente como
E(x) 3 xf (x) dx.
(2.177)
De nuevo, en esta integración cada valor de x es ponderado por la probabilidad de que ocurra
dicho valor.
El concepto de valor esperado puede generalizarse para incluir el valor esperado de cualquier
función de una variable aleatoria [digamos, g(x)]. En el caso continuo, por ejemplo, escribiríamos
E[g(x
(2.178)
3 g(x)f (x) dx.
Como caso especial, consideremos una función lineal y ax b. Entonces,
E(y) E(ax b) 3 (ax b)f (x) dx
(2.179)
a 3 xf (x) dx b 3 f (x) dx aE (x) b.
A veces los valores esperados se formulan en términos de la función de distribución acumulativa
(FDA) F(x), definida como
x
F(x) 3 f (t) dt.
(2.180)
Es decir, F(x) representa la probabilidad de que la variable aleatoria t sea menor que o igual a x.
Usando esta notación el valor esperado de x puede escribirse como
E(x) 3 xdF(x)
(2.181)
Debido al teorema fundamental del cálculo, la ecuación 2.181 y la ecuación 2.177 significan exactamente lo mismo.
EJEMPLO 2.15 Valores esperados de algunas variables aleatorias
Los valores esperados de cada una de las variables aleatorias con las FDP simples que ya hemos presentado son fáciles de calcular. Todos estos valores esperados están indicados en las gráficas de las FDP de
las funciones en la figura 2.6.
1. Binomial. En este caso:
E(x) 1 f (x 1) 0 f (x 0) 1 p 0
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
1
p) p.
(2.182)
8/23
72
Parte 1: Introducción
Para el caso del lanzamiento de la moneda (donde p 0.5), esto indica que E(x) p 0.5; el valor
esperado de esta variable aleatoria es, como quizá lo supusiste, de una mitad.
2. Uniforme. Para esta variable aleatoria continua,
b
E(x) 3
x
b
a
dx x2
2(b a)
a
b
a
b2
2(b a)
a2
b a
.
2(b a)
2
(2.183)
De nuevo, como quizá conozcas, el valor esperado de la distribución uniforme está a justo medio
camino entre a y b.
3. Exponencial. Para este caso de probabilidades decrecientes:
E(x) 3 xe
x
dx
xe
x
0
1
e
x
0
1
,
(2.184)
donde la integración se desprende del ejemplo de la integración por partes que ya hemos mostrado
(ecuación 2.137). Nótese aquí que cuanto más rápido decrecen las probabilidades, menor es el valor
esperado de x. Por ejemplo, si 0.5 entonces E(x) 2, mientras que si 0.05, entonces E(x) 20.
4. Normal. Dado que la FDP normal es simétrica en torno a cero, parece claro que E(x) 0. Una
prueba formal usa una integración de cambio de variable, concediendo que u x2/2 (du xdx):
1
xe
3 2
x2 /2
1
dx 3 e
2
u
1
du 2
e
x2 /2
1
[0
2
0]
0.
(2.185)
Claro que el valor esperado de una variable aleatoria distribuida normalmente (o de cualquier variable aleatoria) puede ser alterado por una transformación lineal, como se muestra en la ecuación
2.179.
PREGUNTA: Una transformación lineal cambia el valor esperado de una variable aleatoria en forma
predecible; si y ax b, entonces E(y) aE(x) b. De ahí que para esta transformación [digamos,
h(x)] tengamos E[h(x)] h[E(x). Supongamos, en cambio, que x es transformada por una función cóncava, digamos g(x) con g 0 y g 0. ¿Qué resultaría de comparar E[g(x)] con g[E(x)]?
Nota: Esta es una ilustración de la desigualdad de Jensen, concepto que se describirá en detalle en el
capítulo 7. Véase también el problema 2.14.
Varianza y desviación estándar
El valor esperado de una variable aleatoria es una medida de tendencia central. En cambio, la
varianza de una variable aleatoria [denotada por x2 o Var(x)] es una medida de dispersión. Específicamente, la varianza se define como la “desviación cuadrada esperada” de una variable aleatoria respecto de su valor esperado. Formalmente:
Var(x) 2x
E[(x
2
E(x)) ]
3 (x
E(x)) 2 f (x) dx.
(2.186)
Algo imprecisa, la varianza mide la desviación cuadrada “típica” respecto al valor central de una
variable aleatoria. Al hacer este cálculo, las desviaciones respecto al valor esperado se elevan al
cuadrado para que las desviaciones positivas y negativas respecto al valor esperado contribuyan
por igual a esta medida de dispersión. Una vez hecho el cálculo, el proceso de elevación al cuadrado puede revertirse para producir una medida de dispersión que esté en las unidades originales en las que se midió la variable aleatoria. Esta raíz cuadrada de la varianza se llama desviación estándar y se denota con x( x2). El nombre de este término transmite eficazmente su
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
73
significado: x es en efecto la desviación típica (“estándar”) de una variable aleatoria respecto a su
valor esperado.
Cuando una variable aleatoria está sujeta a la transformación lineal, su varianza y desviación
estándar cambiarán en forma muy obvia. Si y ax b, entonces
2y
2
3 [ax b
E(x)]2 f (x)dx a2 2x .
E(ax b)] f (x) dx 3 a2 [x
(2.187)
De ahí que la adición de una constante a una variable aleatoria no cambie su varianza, mientras
que la multiplicación por una constante multiplica la varianza por el cuadrado de la constante.
Así, resulta claro que multiplicar una variable por una constante multiplica su desviación estándar
por esa constante: ax ax.
EJEMPLO 2.16 Varianzas y desviaciones estándar de variables aleatorias simples
En aplicaciones económicas a veces puede ser útil conocer las varianzas y las desviaciones estándar de las
cuatro variables aleatorias simples que hemos venido analizando.
1. Binomial. La varianza de la binomial puede calcularse aplicando la definición en su análoga discreta:
n
2x (xi
E(x)) 2 f (xi ) (1
p) 2 p (0
p) 2 (1
p)
(2.188)
i1
(1
p)(p
p2 p2 ) p(1
p).
p(1 p). Una implicación de este resultado es que una variable binomial alcanza
De ahí que x su más grande varianza y desviación estándar cuando p 0.5, en cuyo caso x2 0.25 y x 0.5.
Dada la forma parabólica relativamente plana de p(1 p), las desviaciones modestas de p respecto a
0.5 no cambian sustancialmente esta varianza.
2. Uniforme. Calcular la varianza de la distribución uniforme produce un resultado algo interesante:
b
2
a b
2
2x 3 x
1
b
a
a b
2
dx x
3
.
3(b
a
1
a)
3(b
a) 3
(b
b) 3
(a
8
8
(b
b
1
a) 2
.
12
a)
a
(2.189)
Este es uno de los pocos casos en los que el número 12 tiene un uso en matemáticas, aparte del de
medir cantidades de naranjas o donas.
3. Exponencial. Integrar la fórmula de la varianza para la exponencial es relativamente laborioso. Por
fortuna, el resultado es simple; para la exponencial, resulta que x2 1/2 y x 1/. De ahí que la
media y la desviación estándar sean iguales para la distribución exponencial; esta es una “distribución de un parámetro”.
4. Normal. La integración también puede ser difícil en este caso. Pero, de nuevo, el resultado es simple:
para la distribución normal, x2 x 1. Las áreas bajo la curva normal pueden calcularse fácilmente, y las tablas de estas pueden consultarse en cualquier texto de estadística. Dos hechos útiles
acerca de la FDP normal son:
1
3 f (x) dx
2
0.68
y
1
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
3 f (x) dx
2
23.08.2019
0.95.
(2.190)
8/23
74
Parte 1: Introducción
Es decir, existe una probabilidad de aproximadamente dos tercios de que una variable normal esté a
1 desviación estándar del valor esperado, aunque “las más de las veces” (es decir, con una probabilidad de 0.95) estará a 2 desviaciones estándar.
Estandarización de la normal. Si la variable aleatoria x tiene una FDP normal estándar, tendrá un
valor esperado de 0 y una desviación estándar de 1. Sin embargo, una transformación lineal simple puede
usarse para darle a esta variable aleatoria el valor esperado () y la desviación estándar () deseados.
Considérese la transformación y x . Ahora,
E( y) E(x) Var ( y) 2y 2 Var(x) 2 .
y
(2.191)
Revertir este proceso puede servir para “estandarizar” una variable aleatoria normalmente distribuida (y)
con un valor esperado () y desviación estándar () arbitrarios (lo que a veces se denota como y ~ N(,
) usando z (y )/. Por ejemplo, los resultados del Scholastic Aptitude Test (SAT) (y) están normalmente distribuidos con un valor esperado de 500 puntos y una desviación estándar de 100 puntos (es
decir, y ~ N(500, 100)). De ahí que z (y − 500)/100 tenga una distribución normal estándar con valor
esperado de 0 y desviación estándar de 1. La ecuación 2.190 señala que aproximadamente 68 por ciento
de los resultados se ubica entre los 400 y los 600 puntos, mientras que 95 por ciento de ellos se ubica entre
los 300 y los 700 puntos.
PREGUNTA: Supongamos que la variable aleatoria x está uniformemente distribuida en el intervalo [0,
12]. ¿Cuáles son la media y desviación estándar de x? ¿Qué fracción de la distribución de x está a 1
desviación estándar de la media? ¿Qué fracción de la distribución está a ±2 desviaciones estándar del
valor esperado? Explica por qué esto difiere de las fracciones estimadas para la distribución normal.
Covarianza
Algunos problemas económicos implican dos o más variables aleatorias. Por ejemplo, un inversionista podría considerar repartir su patrimonio entre varios activos, los rendimientos de los
cuales se dan como aleatorios. Aunque los conceptos de valor esperado, varianza, etcétera, se
aplican en forma más o menos directa al analizar una variable aleatoria en estos casos, también es
necesario considerar la relación entre las variables para obtener un cuadro completo. El concepto
de covarianza se usa para cuantificar esta relación. Pero antes de ofrecer una definición debemos
desarrollar algunas bases.
Consideremos un caso con dos variables aleatorias continuas, x y y. La FDP de estas dos variables, denotada por f (x, y), tiene la propiedad de que la probabilidad asociada con un conjunto de
resultados en un área reducida (con dimensiones dxdy) está dada por f (x, y)dxdy. Para ser una
FDP apropiada debe darse el caso de que:
f x, y 0 y
3 3 f ( x, y) dx dy 1.
(2.192)
Las medidas de una sola variable que ya hemos presentado pueden desarrollarse en este contexto
de dos variables “desintegrando” la otra variable. Es decir,
E(x) 3 3 xf (x, y) dy dx y
(2.193)
Var(x) 3 3 x
2
E(x)] f (x, y)dy dx.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
75
De esta manera, los parámetros que describen la variable aleatoria x se miden en todos los resultados posibles de y después de tomar en cuenta la probabilidad de esos diversos resultados.
En este contexto, la covarianza entre x y y busca medir la dirección de asociación entre las
variables. Específicamente, la covarianza entre x y y [que denota Cov(x, y)] se define como
Cov(x, y) 3 3 [x
E(x)][y
(2.194)
E(y)] f (x, y) dx dy.
La covarianza entre dos variables aleatorias puede ser positiva, negativa o cero. Si valores de x
mayores que E(x) tienden a ocurrir relativamente a menudo con valores de y mayores que E(y) (y,
de igual forma, si valores bajos de x tienden a ocurrir junto con valores bajos de y), la covarianza
será positiva. En este caso los valores de x y y tienden a moverse en la misma dirección. O bien, si
valores altos de x tienden a asociarse con valores bajos de y (y viceversa), la covarianza será negativa.
Dos variables aleatorias se definen como independientes si la probabilidad de cualquier valor
particular de, digamos, x no se ve afectada por el valor particular que podría ocurrir de y (y
viceversa).25 En términos matemáticos esto significa que la FDP debe tener la propiedad de que
f(x, y) g(x)h(y); es decir, la FDP conjunta puede expresarse como el producto de las FDP de dos
variables. Si x y y son independientes, su covarianza será cero:
Cov(x, y) 3 3 [x
E(x)][y
3 [x
E( y)]g(x) h(y) dx dy
E(x)]g(x) dx
3 [y
E( y)]h( y) dy 0
0 0.
(2.195)
Sin embargo, lo opuesto de este enunciado no es necesariamente cierto. Una covarianza de cero
no necesariamente implica independencia estadística.
Por último, el concepto de covarianza es crucial para comprender la varianza de sumas o diferencias de variables aleatorias. Aunque el valor esperado de una suma de variables aleatorias es
(como cabría suponer) la suma de sus valores esperados:
E(x y) 3 3 ( x y) f ( x, y) dx dy
3 xf ( x, y) dy dx 3 yf ( x, y) dx dy E(x) E( y) ,
(2.196)
la relación para la varianza de esa suma es más complicada. Usar las definiciones que hemos desarrollado produce
25
Una definición formal se apoya en el concepto de probabilidad condicional. La probabilidad condicional de un evento B dada
la ocurrencia de A (lo cual se escribe P(B|A) se define como P(B|A) P(A y B) P(A); B y A se definen como independientes si
P(B|A) P(B). En este caso, P(A y B) P(A) ∙ P(B).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
76
Parte 1: Introducción
Var(x y) 3 3 x y
E( x y) 2 f ( x, y) dx dy
3 3 x
E( y) 2 f ( x, y) dx dy
E (x) y
3 3 x
E( x) 2 y
E ( y)
2
2x
E( x) y
E ( y) f ( x, y) dx dy
(2.197)
Var( x) Var( y) 2Cov( x, y).
De ahí que si x y y son independientes, entonces Var(x y) Var(x) Var(y). La varianza de la
suma será mayor que la suma de las varianzas si las dos variables aleatorias tienen una covarianza
positiva, y será menor que la suma de las varianzas si tienen una covarianza negativa. Los problemas 2.14-2.16 dan más detalles sobre algunos de los resultados estadísticos que se usan en la
teoría microeconómica.
Resumen
Pese a la formidable apariencia de algunas secciones de este capítulo, este no es un libro de matemáticas. Más bien, la intención
aquí ha sido la de reunir varias herramientas que servirán para
desarrollar modelos económicos a lo largo de este texto. El material en este capítulo será útil entonces como referencia práctica.
Una manera de sintetizar las herramientas matemáticas que se
han presentado en este capítulo es subrayar de nueva cuenta las
lecciones económicas que dichas herramientas ilustran:
• El uso de las matemáticas ofrece a los economistas un medio
conveniente y abreviado para desarrollar modelos. Gracias al
uso de estas herramientas matemáticas se pueden estudiar en
un marco simplificado las implicaciones de varios supuestos
económicos.
• El concepto matemático de las derivadas de una función es de
amplio uso en los modelos económicos porque a los economistas suele interesarles la forma en que las variaciones marginales en una variable afectan a otra. Las derivadas parciales
son especialmente útiles para este propósito porque están definidas para representar dichas variaciones marginales cuando
todos los demás factores se mantienen constantes.
• Las matemáticas de la optimización son una herramienta
importante para el desarrollo de modelos que asumen que los
agentes económicos persiguen racionalmente una meta. En el
caso irrestricto las condiciones de primer orden establecen que
cualquier actividad que contribuya a la meta del agente debe
expandirse hasta el punto en que la contribución marginal de
una expansión adicional sea de cero. En términos matemáticos, la condición de primer orden para un óptimo requiere que
todas las derivadas parciales sean iguales a cero.
• La mayoría de los problemas de optimización económica
implican restricciones a las decisiones que los agentes pueden
tomar. En este caso las condiciones de primer orden para un
máximo sugieren que cada actividad es operada en un nivel en
el cual la razón del beneficio marginal de la actividad con su
costo marginal es la misma para todas las actividades utilizadas. Esta razón común de costo marginal-beneficio marginal
es igual también al multiplicador de Lagrange, el cual suele
introducirse para ayudar a resolver problemas de optimización
restringida. El multiplicador de Lagrange puede interpretarse
asimismo como el valor implícito (o precio sombra) de la restricción.
• El teorema de la función implícita es un recurso matemático
útil para ilustrar la dependencia de las opciones que resultan
de un problema de optimización respecto a los parámetros de
ese problema (precios de mercado, por ejemplo). El teorema
de la envolvente es útil para examinar cómo cambian esas
opciones óptimas cuando los parámetros del problema (precios) cambian.
• Algunos problemas de optimización pueden implicar restricciones que son desigualdades más que igualdades. Las soluciones de estos problemas ilustran a menudo la “lasitud complementaria”. Es decir, las restricciones se mantienen con la
igualdad y sus multiplicadores de Lagrange asociados son diferentes de cero, o las restricciones son desigualdades estrictas y
sus multiplicadores de Lagrange asociados son iguales a cero.
De nuevo esto ilustra cómo el multiplicador de Lagrange
implica algo sobre la “importancia” de las restricciones.
• Las condiciones de primer orden expuestas en este capítulo
son sólo las condiciones necesarias para un máximo o mínimo
local. También deben comprobarse las condiciones de segundo
orden, que requieren la satisfacción de ciertas condiciones de
curvatura.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
• Ciertos tipos de funciones ocurren en muchos problemas económicos. Las funciones cuasi cóncavas (aquellas para las cuales las curvas de nivel forman conjuntos convexos) cumplen
las condiciones de segundo orden de los problemas de máximo
o mínimo restringido cuando las restricciones son lineales.
Las funciones homotéticas poseen la útil propiedad de que las
disyuntivas implícitas entre las variables de la función sólo
dependen de las razones de dichas variables.
• El cálculo integral suele usarse en economía lo mismo como
una manera de describir áreas por debajo de las gráficas que
como una forma de sumar resultados en el tiempo. Técnicas
que implican varios modos de diferenciar integrales desempe-
77
ñan un papel importante en la teoría del comportamiento de
optimización.
• Muchos problemas económicos son dinámicos en cuanto que
las decisiones en una fecha afectan a decisiones y resultados en
fechas posteriores. Las matemáticas para resolver estos problemas de optimización dinámica suelen ser una generalización
simple de los métodos lagrangianos.
• En el estudio de la economía de la incertidumbre y la información suelen usarse conceptos de estadística matemática. El
concepto fundamental es la noción de variable aleatoria y su
FDP asociada. Parámetros de esta distribución, como su valor
esperado o su varianza, también desempeñan papeles importantes en muchos modelos económicos.
Problemas
2.1
Supón que U(x, y) 4x2 3y2.
a.
b.
c.
d.
e.
f.
g.
Calcula U/x, U/y.
Evalúa estas derivadas parciales en x 1, y 2.
Escribe la diferencial total para U.
Calcula dy/dx para dU 0; es decir, ¿cuál es la la opción contenida entre x y y manteniendo constante U?
Demuestra que U 16 cuando x 1, y 2.
¿En qué proporción deben cambiar x y y para mantener a U constante en 16 para movimientos respecto a x 1, y 2?
De modo más general, ¿cuál es la forma de la curva de nivel U 16 para esta función? ¿Cuál es la pendiente de esa línea?
2.2
Supón que los ingresos totales de una empresa dependen de la cantidad producida (q) de acuerdo con la función
R 70q q2.
Los costos totales también dependen de q:
C q2 30q 100.
a. ¿Qué nivel de producción debe generar la empresa para maximizar sus beneficios (R C)? ¿Cuáles serán esos beneficios?
b. Demuestra que las condiciones de segundo orden para un máximo se satisfacen en el nivel de producción determinado en el inciso a).
c. ¿La solución calculada aquí cumple la regla de “ingreso marginal es igual a costo marginal”? Explica.
2.3
Supón que f (x, y) xy. Halla el valor máximo de f si x y y están restringidas a sumar 1. Resuelve este problema de dos maneras: por sustitución y con el método del multiplicador de Lagrange.
2.4
El problema dual descrito en el problema 2.3 es
minimiza
xy
sujeta a
xy 0.25.
Resuelve este problema usando la técnica de Lagrange. Luego compara el valor que obtuviste para el multiplicador de Lagrange con
aquel que obtuviste en el problema 2.3. Explica la relación entre ambas soluciones.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
78
Parte 1: Introducción
2.5
La altura desde la cual es lanzada una pelota en línea recta con cierta fuerza es una función del momento (t) a partir del cual se le suelta,
dado por f (t) 0.5gt2 40t (donde g es una constante determinada por la gravedad).
a.
b.
c.
d.
¿Cómo depende del parámetro g el valor de t en el que la altura desde la cual se lanza la pelota está en un máximo?
Usa tu respuesta del inciso a) para describir cómo la altura máxima cambia al cambiar el parámetro g.
Usa el teorema de la envolvente para contestar directamente el inciso b).
En la Tierra g 32, aunque este valor varía un poco alrededor del globo. Si dos lugares tuvieran constantes gravitacionales que difirieran en 0.1, ¿cuál sería la diferencia en la altura máxima desde la que se lanza una pelota en ambos lugares?
2.6
Una forma simple de modelar la construcción de un buque petrolero es partir de una hoja de acero grande de forma rectangular de x pies
de ancho y 3x pies de largo. Corta ahora un pequeño cuadrado de t pies por lado de cada esquina de la hoja; dobla y suelda los lados de la
hoja de acero para producir una estructura semejante a una bandeja sin tapa.
a. Demuestra que el volumen de petróleo que esta bandeja puede contener está dado por
V t(x 2t)(3x 2t) 3tx2 8t2x 4t3.
b. ¿Cómo debería elegirse t para maximizar V para cualquier valor dado de x?
c. ¿Existe un valor de x que maximice el volumen de petróleo que se puede transportar?
d. Supón que un constructor naval está obligado a usar únicamente 1 000 000 de pies cuadrados de hoja de acero para fabricar el buque
petrolero. Esta restricción puede representarse con la ecuación 3x2 – 4t2 1 000 000 (porque el constructor puede intercambiar los
cuadrados recortados por crédito). ¿Qué resultaría de comparar la solución de este problema de máximo restringido con las soluciones
descritas en los incisos b) y c)?
2.7
Considera el siguiente problema de maximización restringida:
maximiza
y x1 5lnx2
sujeta a
k x1 x2 0,
donde k es una constante a la que se le puede asignar cualquier valor específico.
a. Demuestra que si k 10, este problema puede resolverse como uno que sólo implica restricciones de igualdad.
b. Demuestra que resolver este problema para k 4 requiere que x1 −1.
c. Si las x en este problema deben ser no negativas, ¿cuál es la solución óptima cuando k 4? (Este problema puede resolverse intuitivamente o usando los métodos que hemos descrito en este capítulo.)
d. ¿Cuál es la solución de este problema cuando k 20? ¿Qué concluyes al comparar esta solución con la del inciso a)?
Nota: Este problema implica lo que se conoce como función cuasi lineal. Este tipo de funciones da ejemplos importantes de ciertos tipos de
comportamiento en la teoría del consumo tal como veremos.
2.8
Supón que una empresa tiene una función de costo marginal dada por MC(q) q 1.
a. ¿Cuál es la función de costo total de esta empresa? Explica por qué los costos totales sólo se conocen hasta una constante de integración,
la cual representa costos fijos.
b. Como has de saber, gracias a un curso previo de economía, si una empresa toma el precio (p) como dado en sus decisiones, entonces
generará la producción para la cual p MC(q). Si la empresa sigue esta regla de maximización de beneficios, ¿cuánto producirá cuando
p 15? Suponiendo que en ese precio alcanza el punto de equilibrio, ¿cuáles serán los costos fijos?
c. ¿Cuánto aumentarán los beneficios de esta empresa si el precio aumenta a 20?
d. Suponiendo aún la maximización de beneficios, demuestra que las de esta empresa sólo pueden expresarse como una función del precio que recibe por su producto.
e. Demuestra que el aumento en beneficios de p 15 a p 20 puede calcularse de dos maneras: i) directamente a partir de la ecuación
derivada en el inciso d) y ii) integrando la función inversa de costo marginal [MC1 (p) p – 1] de p 15 a p 20. Explica intuitivamente este resultado usando el teorema de la envolvente.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
79
Problemas analíticos
2.9 Funciones cóncavas y cuasi cóncavas
Demuestra que, si f (x1, x2) es una función cóncava, también es una función cuasi cóncava. Hazlo comparando la ecuación 2.114 (definición
de cuasi concavidad) con la ecuación 2.98 (definición de concavidad). ¿Puedes dar una razón intuitiva de este resultado? ¿Lo opuesto del
enunciado es cierto? ¿Las funciones cuasi cóncavas son necesariamente cóncavas? De no ser así, da un contraejemplo.
2.10 Función de Cobb-Douglas
Una de las funciones más importantes que encontraremos en este libro es la función de Cobb-Douglas:
y (x1)(x2),
donde y son constantes positivas, cada cual menor que 1.
a. Demuestra que esta función es cuasi cóncava, usando el método de “fuerza bruta” de aplicar la ecuación 2.114.
b. Demuestra que la función de Cobb-Douglas es cuasi cóncava mostrando que cada curva de nivel de la forma y c (donde c es cualquier
constante positiva) es convexa y, por tanto, que el conjunto de puntos para los cuales y c es un conjunto convexo.
c. Demuestra que si 1, la función de Cobb-Douglas no es cóncava (ilustrando otra vez, por tanto, que no todas las funciones
cuasi cóncavas son cóncavas).
Nota: En las extensiones de este capítulo se trata nuevamente la función de Cobb-Douglas.
2.11 La función de potencia
Otra función que encontraremos a menudo en este libro es la función de potencia:
y x,
donde 0 1 (a veces también examinaremos esta función para casos en los que también puede ser negativa, en cuyo caso usaremos
la forma y x/ para garantizar que las derivadas tengan el signo adecuado).
a. Demuestra que esta función es cóncava (y, por tanto, también cuasi cóncava, por el resultado del problema 2.9). Nótese que 1 es un
caso especial y que la función es “estrictamente” cóncava sólo para 1.
b. Demuestra que la forma multivariada de la función de potencia
y f(x1, x2) (x1) (x2)
también es cóncava (y cuasi cóncava). Explica por qué, en este caso, el hecho de que f12 f21 0 vuelve especialmente simple determinar la concavidad.
c. Una manera de incorporar efectos de “escala” en la función descrita en el inciso b) es usar la transformación monótona
g(x1, x2) y [(x1) (x2)],
donde es una constante positiva. ¿Esta transformación preserva la concavidad de la función? ¿Es g cuasi cóncava?
2.12 Prueba del teorema de la envolvente en problemas de optimización restringida
Puesto que en este libro se usará con frecuencia el teorema de la envolvente en los problemas de optimización restringida, probar este
teorema en un caso simple ayudará a desarrollar cierta intuición. Así, supongamos que se desea maximizar una función de dos variables y
que el valor de esta función también depende de un parámetro, a: f(x1, x2, a). Este problema de maximización está sujeto a una restricción que puede escribirse como g(x1, x2, a) 0.
a. Escribe la expresión lagrangiana y las condiciones de primer orden de este problema.
b. Suma las dos condiciones de primer orden que implican las x.
c. Diferencia ahora la suma anterior respecto a a; esto muestra cómo deben cambiar las x al cambiar a, al mismo tiempo que se requiere
que las condiciones de primer orden sigan siendo válidas.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
80
Parte 1: Introducción
d. Como ya se indicó en este capítulo tanto la función objetivo como la restricción de este problema pueden enunciarse como funciones
de a: f(x1(a), x2(a), a), g(x1(a), x2(a), a) 0. Diferencia la primera de estas respecto a a. Esto muestra cómo cambia el valor del objetivo
al cambiar a mientras las x se mantienen en sus valores óptimos. Deberás tener términos que impliquen las x y un término en f/a.
e. Diferencia ahora la restricción formulada en el inciso d) respecto a a. Deberás tener términos en las x y un término en g/a.
f. Multiplica los resultados del inciso e) por (el multiplicador de Lagrange), y usa esto junto con las condiciones de primer orden del
inciso c) para sustituir en la derivada del inciso d). Deberás poder demostrar que
df (x1 (a), x2 (a), a) f
g
,
da
a
a
justo la derivada parcial de la expresión lagrangiana cuando todas las x están en sus valores óptimos. Esto prueba el teorema de la
envolvente. Explica intuitivamente cómo las diversas partes de esta prueba imponen la condición de que las x se ajusten de manera
constante para permanecer en sus valores óptimos.
g. Vuelve al ejemplo 2.8 y explica cómo se puede aplicar el teorema de la envolvente a las variaciones en el perímetro de una cerca P; es
decir, ¿cómo afectan las variaciones en P a las dimensiones del área que se puede cercar? Demuestra que en este caso el teorema de la
envolvente ilustra cómo el multiplicador de Lagrange asigna un valor a la restricción.
2.13 Aproximaciones de Taylor
El teorema de Taylor demuestra que cualquier función puede acercarse a cualquier punto conveniente mediante una serie de términos que
involucran a la función y sus derivadas. Aquí examinaremos algunas aplicaciones de este teorema a funciones de una y dos variables.
a. Cualquier función continua y diferenciable de una variable, f(x), puede acercarse al punto a mediante la fórmula
f (x) f(a) f (a)(x a) 0.5f (a)(x a)2 términos en f , f , . . . .
El uso de únicamente los tres primeros términos resulta en una aproximación cuadrática de Taylor. Emplea esta aproximación junto
con la definición de concavidad dada en la ecuación 2.85 para demostrar que toda función cóncava debe estar en o por debajo de la
tangente de la función en el punto a.
b. La aproximación cuadrática de Taylor para cualquier función de dos variables, f(x, y), cerca del punto (a, b) está dada por
f (x, y) f (a, b) f 1 (a, b)(x
0.5[ f 11 (a, b)(x
a) f 2 (a, b)( y
b)
2
a)( y
a) 2f 12 (a, b)(x
b) f 22 ( y
b) 2 .
Usa esta aproximación para demostrar que toda función cóncava (definida por la ecuación 2.98) debe estar en o por debajo de su
plano tangente en (a, b).
2.14 Más sobre valor esperado
Puesto que el concepto de valor esperado desempeña un papel importante en muchas teorías económicas, quizá sea útil resumir algunas
propiedades más de esta medida estadística. En este problema se supone que x es una variable aleatoria continua con la FDP f(x).
a. (Desigualdad de Jensen) Supón que g(x) es una función cóncava. Demuestra que E[g(x)] g[E(x)]. Pista: Construye la tangente de g(x)
en el punto E(x). Esta tangente tendrá la forma c dx g(x) para todos los valores de x y c dE(x) g[E(x)] donde c y d son constantes.
b. Usa el procedimiento del inciso a) para demostrar que si g(x) es una función convexa, entonces E[g(x)] g[E(x)].
c. Supón que x adopta sólo valores no negativos; es decir, 0 x . Usa la integración por partes para demostrar que
E(x) 3 [1
F(x)] dx,
0
donde F(x) es la función de distribución acumulativa para x [es decir, F(x) 0x f(t)dt].
d. (Desigualdad de Markov) Demuestra que si x sólo adopta valores positivos, se mantiene la desigualdad siguiente:
P(x t
E(x)
.
t
Pista: E(x) 0 xf (x) dx 0t x f (x) dx t x f (x) dx.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
81
e. Considera la FDP f(x) 2x–3 para x 1.
1. Demuestra que esta es una FDP apropiada.
2. Calcula la F(x) de esta FDP.
3. Usa los resultados del inciso c) para calcular la E(x) de esta FDP.
4. Demuestra que la desigualdad de Markov es válida para esta función.
f. El concepto de valor esperado condicional es útil en algunos problemas económicos. Denotamos el valor esperado de x condicionado
la ocurrencia de un evento, A, como E(xA). Para calcular este valor debemos conocer la FDP de x dada la ocurrencia de A [denotada
por f (xA)]. Con esta notación, E(xA) x f (xA)dx. Tal vez la manera más fácil de comprender estas relaciones sea mediante un
ejemplo. Sea
f (x) x2
3
para
1
x
2.
1. Demuestra que esta es una FDP apropiada.
2. Calcula E(x).
3. Calcula la probabilidad de que 1 x 0.
4. Considera el evento 0 x 2, y llama a este evento A. ¿Qué es f(xA)?
5. Calcula E(xA).
6. Explica intuitivamente tus resultados.
2.15 Más sobre varianzas
La definición de la varianza de una variable aleatoria puede usarse para demostrar varios resultados adicionales.
a. Demuestra que Var(x) E(x2) [E(x)]2.
b. Usa la desigualdad de Markov (problema 2.14d) para demostrar que si x sólo puede adoptar valores no negativos,
P [(x
x k]
2x
.
k2
Este resultado muestra que existen límites a qué tan a menudo una variable aleatoria puede alejarse de su valor esperado. Si kh,
este resultado también indica que
P [(x
x h]
1
.
h2
Así, por ejemplo, la probabilidad de que una variable aleatoria esté a más de dos desviaciones estándar de su valor esperado siempre
es menor que 0.25. Este resultado teórico se conoce como desigualdad de Chebyshev.
c. La ecuación 2.197 demostró que si dos (o más) variables aleatorias son independientes, la varianza de su suma es igual a la suma de sus
varianzas. Usa este resultado para demostrar que la suma de n variables aleatorias independientes, cada una de las cuales tiene valor
esperado y varianza 2, posee valor esperado n y varianza n2. Demuestra también que el promedio de estas n variables aleatorias
(que también es una variable aleatoria) tendrá valor esperado y varianza 2/n. Esto se conoce como la ley de los números grandes; es
decir, la varianza de un promedio se contrae conforme se incluyen más variables independientes.
d. Usa el resultado del inciso c) para demostrar que si x1 y x2 son variables aleatorias independientes, cada cual con el mismo valor esperado y varianza, la varianza de un promedio ponderado de ambas X kx1 (1 k)x2, 0 k 1 se minimiza cuando k 0.5. ¿Cuánto
se reduce la varianza de esta suma estableciendo apropiadamente k en relación con otros valores posibles de k?
e. ¿Cómo cambiaría el resultado del inciso d) si las dos variables tuvieran varianzas desiguales?
2.16 Más sobre covarianzas
He aquí algunas relaciones útiles asociadas con la covarianza de dos variables aleatorias, x1 y x2.
a. Demuestra que Cov(x1, x2) E(x1x2) E(x1)E(x2). Una implicación importante de esto es que si Cov(x1, x2) 0, E(x1x2) E(x1)E(x2).
Es decir, el valor esperado de un producto de dos variables aleatorias es el producto de los valores esperados de estas variables.
b. Demuestra que Var(ax1 bx2) a2Var(x1) b2Var(x2) 2abCov(x1, x2).
c. En el problema 2.15d se analizó la varianza de X kx1 (1 k)x2 0 k 1. ¿Cambia la conclusión de que esta varianza se minimiza
para k 0.5 al considerar casos en los que Cov(x1, x2) 0?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
82
Parte 1: Introducción
d. El coeficiente de correlación entre dos variables aleatorias se define como
Corr(x1 , x2 ) Cov(x1 , x2 )
Var(x1 )Var(x2 )
.
Explica por qué 1 Corr(x1, x2) 1 y procura cierta intuición para este resultado.
e. Supón que la variable aleatoria y está relacionada con la variable aleatoria x por la ecuación lineal y x. Demuestra que
Cov(y, x)
.
Var(x)
Aquí, se conoce como el coeficiente (teórico) de regresión de y sobre x. Con datos reales, la muestra análoga de esta expresión es el
coeficiente de regresión de mínimos cuadrados ordinarios (MCO).
Sugerencias de lecturas adicionales
Dadkhan, Kamran. Foundations of Mathematical and Computational Economics, Thomson/SouthWestern, Mason, OH: 2007.
De consulta básica. El apéndice matemático A ofrece un tratamiento
avanzado de condiciones necesarias y suficientes para un máximo.
Buena introducción a muchas técnicas de cálculo. Demuestra que
numerosas cuestiones matemáticas pueden abordarse usando populares programas de software como Matlab o Excel.
Silberberg, E. y W. Suen. The Stractare of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001.
Dixit, A. K. Optimization in Economic Theory, 2a. ed., Oxford University Press, Nueva York, 1990.
Texto de microeconomía matemática que subraya las predicciones
observables de la teoría económica. Hace amplio uso del teorema de la
envolvente.
Tratamiento completo y moderno de técnicas de optimización. Usa
métodos analíticos relativamente avanzados.
Simon, Carl P. y Lawrence Blume. Mathematics for Economists, W.
W. Norton, Nueva York, 1994.
Hoy, Michael, John Livernois, Chris McKenna, Ray Rees y Thanasis Stengos. Mathematics for Economists, 2a. ed., MIT Press, Cambridge, 2001.
Útil texto que cubre la mayoría de las áreas matemáticas relevantes
para los economistas. El tratamiento es de nivel relativamente alto. Dos
temas que se explican aquí mejor que en cualquier otra parte son las
ecuaciones diferenciales y la topología básica de fijación de puntos.
Completa introducción a la mayor parte de las matemáticas cubiertas
en cursos de microeconomía. La fuerza de este libro es que presenta
muchos ejemplos resueltos, la mayoría de los cuales se basan en la teoría microeconómica.
Luenberger, David G. Microeconomic Theory, McGraw Hill, Nueva
York, 1995.
Texto avanzado con varios conceptos microeconómicos novedosos.
Tiene también cinco breves pero útiles apéndices matemáticos.
Mas-Colell, Andreu, Michael D. Whinston y Jerry R. Green.
Microeconomic Theory, Oxford University Press, Nueva York,
1995.
Tratamiento enciclopédico de microeconomía matemática. Amplios
apéndices matemáticos que cubren temas de análisis de nivel relativamente alto.
Samuelson, Paul A. Foundations of Economic Analysis, Harvard
University Press, Cambridge, MA: 1947, Mathematical Appendix A.
Sydsaeter, K., A. Strom y P. Berck. Economists’ Mathematical
Manual, 4a. ed., Springer-Verlag, Berlín, 2005.
Herramienta indispensable para el repaso matemático. Contiene 35
capítulos que cubren la mayoría de las herramientas matemáticas que
usan los economistas. Las explicaciones son breves, así que no es la
fuente indicada para adquirir conceptos nuevos por primera vez.
Taylor, Angus E. y W. Robert Mann. Advanced Calculus, 3a. ed.,
John Wiley, Nueva York, 1983, pp. 183-195.
Un texto de cálculo completo con un buen análisis de la técnica de
Lagrange.
Thomas, George B. y Ross L. Finney, Calculus and Analytic Geometry, 8a. ed., Addison-Wesley, Reading, 1992.
Texto básico de cálculo con excelente cobertura de técnicas de diferenciación.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Condiciones de segundo orden
y álgebra matricial
A, donde p 1, n. Si A es de 2 2, el primer menor principal
es a11 y el segundo es a11a22 a21a12.
6. Una matriz cuadrada n n, A, es definida positiva si todos sus
menores principales son positivos. Es definida negativa si
sus menores principales alternan en signo, comenzando por
uno de resta.126
7. Una matriz simétrica particularmente útil es la matriz de
Hesse, formada por todas las derivadas parciales de segundo
orden de una función. Si f es una función continua y dos veces
diferenciable de n variables, su matriz de Hesse está dada por
Las condiciones de segundo orden descritas en el capítulo 2 pueden escribirse en formas compactas usando álgebra matricial. En
esta extensión se examinará brevemente dicha notación. Volveremos a esta en otras partes de las extensiones y en problemas de
capítulos posteriores.
Fundamentos de álgebra matricial
Las extensiones presentadas aquí suponen cierto conocimiento
general del álgebra matricial. Un recordatorio sucinto de estos
principios podría incluir:
1. Una matriz n k, A, es un arreglo rectangular de términos de
la forma
A aij a11
a21
..
.
a12
a22
a1k
a2k
an1
an2
ank
H( f ) .
Aquí, i 1, n; j 1, k. Las matrices pueden sumarse, restarse
o multiplicarse siempre que sus dimensiones sean acordes.
2. Si n k, A es una matriz cuadrada. Una matriz cuadrada es
simétrica si aij aji. La matriz de identidad, In, es una matriz
cuadrada n n donde aij 1 si i j y aij 0 si i j.
3. La determinante de una matriz cuadrada (denotada por |A|)
es un escalar (es decir, un término simple) hallado al multiplicar entre sí todos los términos de la matriz. Si A es de 2 2,
|A| a11 a22
Ejemplo: Si A 1
5
a21 a12 .
15
f11
f21
..
.
f12
f22
f1n
f2n
fn1
fn2
fnn
.
Usando estas ideas de notación ahora podemos volver a
examinar algunas de las condiciones de segundo orden derivadas en el capítulo 2.
E2.1 Funciones cóncavas y convexas
Una función cóncava es la que siempre está por debajo de (o en)
cualquier tangente a ella. A su vez, una función convexa siempre
está sobre (o en) cualquier tangente. La concavidad o convexidad
de una función es determinada por su o sus segundas derivadas.
Para una función de una variable, f (x), este requisito es simple.
Usando la aproximación de Taylor en cualquier punto (x0).
dx2
2
términos de orden superior
3
entonces
2
|A| 2
EXTENSIONES
f (x0 dx) f (x0 ) f(x0 )dx f ( x0 )
13.
4. La inversa de una matriz cuadrada n n, A, es otra matriz
n n, A−1, de tal manera que
Suponiendo que los términos de orden superior son iguales a 0,
tenemos
f(x0 dx)
f(x0) f(x0)dx
A . A–1 In.
si f(x0)
No todas las matrices cuadradas tienen inversa. Una condición necesaria y suficiente para la existencia de A−1 es que |A|
0.
5. Los menores principales de una matriz cuadrada n n A son
la serie de determinantes de las primeras filas y columnas p de
0y
f(x0 dx) f(x0) f(x0)dx
1
Si algunas de las determinantes en esta definición son de 0, se dice que la
matriz es semidefinida positiva o semidefinida negativa.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
84
Parte 1: Introducción
si f(x0) 0. Puesto que las expresiones de la derecha de estas
desigualdades son, de hecho, la ecuación de la tangente de la función en x0, resulta claro que la función es (localmente) cóncava si
f (x0) 0 y (localmente) convexa si f (x0) 0.
Extender esta idea intuitiva a muchas dimensiones es laborioso en términos de notación funcional, pero relativamente simple cuando se usa álgebra matricial. La concavidad requiere que la
matriz de Hesse sea definida negativa, mientras que la convexidad
requiere que esa matriz sea definida positiva. Al igual que en el
caso de una variable, estas condiciones equivalen a requerir que la
función se aleje sistemáticamente de cualquier tangente a ella sin
importar qué dirección adopte.227
Si f(x1, x2) es una función de dos variables, la matriz de Hesse
está dada por
H
f11
f21
f12
.
f22
Esta es definida negativa si
f11 0
y
f11 f12 f21 f12
0,
justo la condición descrita en la ecuación 2.98. Las generalizaciones a funciones de tres o más variables siguen el mismo patrón
matricial.
Ejemplo 1
Para la función estado de salud del capítulo 2 (ecuación 2.29) la
matriz de Hesse está dada por
H
2
0
0
,
2
así que la función será cóncava, siempre y cuando
H2 a( a
1) ( b) ( b
ab( 1
a
b) x2a 2 y2b
2
0.
E2.2 Maximización
Como vimos en el capítulo 2 las condiciones de primer orden para
un máximo restringido de una función de muchas variables
requiere hallar un punto en el que las derivadas parciales sean
iguales a cero. Si la función es cóncava estará bajo su plano tangente en este punto; así, el punto será un máximo verdadero.3
Puesto que la función estado de salud es cóncava, por ejemplo, las
condiciones de primer orden para un máximo también son suficientes.28
E2.3 Máximos restringidos
Cuando en un problema de maximización o minimización las x
están sujetas a restricciones, estas tienen que tomarse en cuenta al
enunciar las condiciones de segundo orden. También en este caso
el álgebra matricial ofrece un medio compacto (si no es que intuitivo) para denotar estas condiciones. Esta notación implica sumar
filas y columnas de la matriz de Hesse en el problema irrestricto y
comprobar después las propiedades de esta matriz aumentada.
Específicamente, se quiere maximizar
sujeta a la restricción429
0.
g(x1, . . . , xn) 0.
En el capítulo 2 vimos que las condiciones de primer orden para
un máximo son de la forma
Ejemplo 2
La función de Cobb-Douglas xayb, donde a, b ∈ (0, 1), se usa para
ilustrar funciones de utilidad y funciones de producción en
muchas partes de este texto. Las derivadas de primer y segundo
orden de la función son
fi gi 0,
donde λ es el multiplicador de Lagrange de este problema. Las
condiciones de segundo orden para un máximo se basan en la
matriz de Hesse aumentada (“limitada”)530
fx axa 1 yb ,
fy bxa yb 1 ,
fxx a( a 1) xa 2 yb ,
fyy b( b 1) xa yb 2 .
Hb De ahí que la matriz de Hesse de esta función sea
abxa 1 yb 1
b( b 1) xa yb
2
0
g1
g2
..
.
g1
f11
f21
g2
f12
f22
...
gn
f1n
f2n .
gn
fn1
fn2
. . . fnn
.
El primer menor principal de esta matriz es
3
Este será un máximo “local” si la función es cóncava sólo en una región, o
“global” si lo es en todas partes.
4
Aquí sólo se considera el caso de una restricción. La generalización a muchas
restricciones es conceptualmente simple pero compleja respecto a la notación.
Para una formulación concisa véase Sydsaeter, Strom y Berck (2005), p. 103.
H1 a(a 1)xa2yb 0,
Nótese que si gij 0 para todas las i y j, entonces Hb puede considerarse la
matriz de Hesse simple asociada con la expresión lagrangiana dada en la ecuación 2.50, la cual es una función de las n 1 variables λ, x1, …, xn.
5
2
a2 b2 x2a 2 y2b
f (x1, . . . , xn)
De ahí que la función sea cóncava.
a( a 1) xa 2 yb
H
abxa 1 yb 1
2
2
Esta condición es evidentemente válida si a b 1. Es decir, en
términos de la función de producción, la función debe exhibir
rendimientos decrecientes a escala para ser cóncava. Geométricamente, la función debe descender cuando ambos insumos aumentan juntos.
y el primer y segundo menores principales son
H1 2 0 y
H2 (2)(2) 0 4
1) x2a 2 y2b
En el capítulo 21 de Simon y Blume (1994) se muestra una prueba con la versión multivariable de la aproximación de Taylor.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 2: Matemáticas para microeconomía
Para un máximo, (1)Hb debe ser definida negativa; es decir, los
menores principales de Hb deben seguir el patrón y
así sucesivamente, a partir del segundo de esos menores.631
Las condiciones de segundo orden para un mínimo requieren
que (1)Hb sea definida positiva; es decir, que todos los menores
principales de Hb (excepto el primero) sean negativos.
y las condiciones de primer orden para un máximo son
fi bi,
H La expresión lagrangiana para el problema de estado de salud restringido (ejemplo 2.6) es
y la matriz de Hesse limitada para este problema es
Hb 0
1
1
1
2
0
1
0 .
2
El segundo menor principal es aquí
Hb2 1
2
0
1
1,
0
f1
f2
fn
f1
f11
f21
fn1
f2
f12
f22
fn2
fn
f1n
f2n
fnn
tienen los mismos menores principales excepto por una constante de proporcionalidad (positiva).7 Las condiciones para un
máximo de f, sujeta a una restricción lineal, serán satisfechas
siempre que H siga las mismas convenciones de signo que Hb; es
decir, (1)H debe ser definida negativa. Una función f para la
cual H sigue este patrón se llama cuasi cóncava. Como veremos,
f tiene la propiedad de que el conjunto de puntos x para el cual
f(x) c (donde c es cualquier constante) es convexo. Para esa
función las condiciones necesarias para un máximo también son
suficientes.32
Ejemplo
y el tercero
Hb3
0
1
1
2
1 0
0 0 0
1
0
2
2
Para el problema de la cerca, f(x, y) xy y H está dada por
H ( 2) 4,
0
así que los menores principales de Hb tienen el patrón requerido y
el punto
es un máximo limitado.
0
y
x
y
0
1
x
1 .
0
Así,
y2 0,
H 2
H 3 2xy 0,
x2 1, x1 0,
y la función es cuasi cóncava.833
Ejemplo
Ejemplo
En el problema de la cerca óptima (ejemplo 2.7), la matriz de
Hesse limitada es
0
2
2
Hb 2
0
1
Más generalmente, si f es una función de sólo dos variables, la
cuasi concavidad requiere que
2
1
0
y
así que también en este caso los menores principales tienen el
patrón de signo requerido para un máximo.
E2.4 Cuasi concavidad
Si la restricción g es lineal las condiciones de segundo orden
exploradas en la extensión 2.3 sólo pueden relacionarse con la
forma de la función por optimizar, f. En este caso la restricción
puede escribirse como
g(x1, . . . , xn) c b1x1 b2x2 … bnxn 0,
Nótese que el primer menor principal de Hb es 0.
H 2
( f1 ) 2 0 y
H 3
f11 f22
f22 f12 2f1 f2 f12
0,
justo la condición enunciada en la ecuación 2.114. De ahí que tengamos una forma muy simple de determinar la cuasi concavidad.
4,
Hb2
Hb3 8,
6
i 1, . . . , n.
Usando estas condiciones resulta claro que la matriz de Hesse
limitada Hb y la matriz
Ejemplo
ᏸ x12 2x1 x22 4x2 5 (1 x1 x2),
85
Referencias
Simon, C. P. y L. Blume. Mathematics for Economists, W. W. Norton, Nueva York, 1994.
Sydsaeter, R., A. Strom y P. Berck. Economists’ Mathematical
Manual, 3a. ed., Springer-Verlag, Berlín, 2000.
7
Esto puede demostrarse señalando que multiplicar una fila (o columna) de
una matriz por una constante, multiplica la determinante por esa constante.
Puesto que f(x, y) xy es una forma de una función de Cobb-Douglas no
cóncava, demuestra que no toda función cuasi cóncava es cóncava. Adviértase
que una función monótona de f (como f 1/3) podría, sin embargo, ser cóncava.
8
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Elección y demanda
PARTE
DOS
Capítulo 3
Preferencias y utilidad
Capítulo 4
Optimización de la utilidad y elección
Capítulo 5
Efectos de ingreso y de sustitución
Capítulo 6
Relaciones de demanda entre bienes
En la parte 2 investigaremos la teoría económica de la elección. Una meta de este examen es desarrollar
la noción de demanda de manera formal para que pueda usarse en secciones posteriores del texto cuando
pasemos al estudio de los mercados. Una meta más general de esta parte es ilustrar el método que usan
los economistas para explicar cómo toman decisiones los individuos en una amplia variedad de contextos.
La parte 2 comienza con una descripción de la forma en que los economistas realizan modelos teóricos
de las preferencias individuales, usualmente conocidas con el término formal de utilidad. El capítulo 3
muestra cómo los economistas conceptualizan la utilidad de forma matemática. Esto permite un examen de
los diversos intercambios que los individuos están dispuestos a hacer voluntariamente.
En el capítulo 4 se usa el concepto de utilidad para ilustrar la teoría de la elección. La hipótesis fundamental de este capítulo es que las personas que enfrentan ingresos limitados tomarán decisiones económicas de tal manera que puedan alcanzar la mayor utilidad posible. El capítulo 4 usa los análisis matemático
e intuitivo para indicar los discernimientos que esta hipótesis aporta al comportamiento económico.
Los capítulos 5 y 6 usan el modelo de optimización de la utilidad para investigar cómo responderán los
individuos a los cambios en sus circunstancias. El capítulo 5 se ocupa principalmente de las respuestas a
los cambios en el precio de una mercancía, análisis que conduce directamente al concepto de la curva
capítulo 6 aplica este tipo de análisis al desarrollo de una comprensión de las relacio-
87
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
TRES
Preferencias y utilidad
En este capítulo examinaremos la manera en que los economistas caracterizan las preferencias de los
individuos. Comenzaremos con un análisis muy abstracto sobre la “relación de preferencia”, pero pasaremos rápidamente a la principal herramienta de los economistas para estudiar las decisiones individuales: la función de utilidad. Estudiaremos algunas características generales de estas funciones y algucas que encontraremos a lo largo de este libro.
AXIOMAS DE LA ELECCIÓN RACIONAL
Una forma de iniciar un análisis de las decisiones de los individuos es enunciar una serie básica
de postulados o axiomas que caracterizan el comportamiento “racional”. Estos empiezan con el
concepto de “preferencia”: se entiende que un individuo que reporta que “A es preferible a B”
quiere decir que, habiendo considerado todas las cosas, se siente en mejores condiciones en la
situación A que en la situación B. Se supone que la relación de preferencia tiene las tres propiedades básicas siguientes.
I. Integridad. Si A y B son dos situaciones cualesquiera
car
exactamente una de las tres posibilidades siguientes:
1. “A es preferible que B”,
2. “B es preferible que A”, o
3. “A y B son indiferentes”.
En consecuencia se supone que los individuos no se paralizan por la indecisión: entienden
por completo y siempre pueden hacerse una opinión sobre el atractivo de dos opciones cualesquiera. Este supuesto también descarta la posibilidad de que un individuo pueda reportar
tanto que A es preferible a B como que B es preferible a A.
II. Transitividad. Si un individuo reporta que “A es preferible a B” y “B es preferible a C”, también
debe reportar que “A es preferible a C”.
Este supuesto establece que las decisiones del individuo son internamente coherentes. Tal
supuesto puede someterse a un estudio empírico. En general, este tipo de estudios concluye
carse en
que las decisiones de una persona son tran
casos en los que el individuo probablemente no comprende completamente las consecuencias
de sus decisiones. Dado que en la mayoría de los casos supondremos que las decisiones son
totalmente informadas (véase, sin embargo, el análisis de la incertidumbre en el capítulo 7 y
en algunas partes más), la propiedad de la transitividad parece ser un supuesto apropiado a
establecer sobre las preferencias.
III. Continuidad. Si un individuo reporta que “A es preferible a B” las situaciones adecuadamente
“cercanas a” A deben ser preferibles a B.
Este supuesto más bien técnico se requiere si deseamos analizar las respuestas de los individuos a cambios relativamente reducidos en ingreso y precios. El propósito de este supuesto
89
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
90
Parte 2: Elección y demanda
es descartar ciertos tipos de filosas preferencias discontinuas que plantean problemas a un
desarrollo matemático de la teoría de la elección. Suponer continuidad no parece implicar el
riesgo de pasar por alto tipos de comportamiento económico que son importantes en la realidad (véase el problema 3.14 para algunos contraejemplos).
UTILIDAD
Dados los supuestos de integridad, transitividad y continuidad, es posible demostrar formalmente que las personas pueden clasificar todas las situaciones posibles entre la menos y la más
deseable.1 Siguiendo la terminología introducida por el teórico político del siglo xix, Jeremy
Bentham, los economistas llaman a esta clasificación utilidad.2 Nosotros también seguiremos
a Bentham al decir que las situaciones más deseables ofrecen más utilidad que las menos deseables. Es decir, si una persona prefiere la situación A a la situación B, diríamos que la utilidad
asignada a la opción A, denotada por U(A), excede a la utilidad asignada a B, U(B).
No singularidad de las medidas de utilidad
Incluso podríamos atribuir números a esas clasificaciones de utilidad; sin embargo, esos números
no serán únicos. Cualquier conjunto de números que asignemos arbitrariamente y que refleje
con exactitud el orden de las preferencias originales implicará el mismo conjunto de decisiones.
No hay ninguna diferencia entre decir que U(A) 5 y U(B) 4, y decir que U(A) 1 000 000 y
U(B) 0.5. En ambos casos los números implican que A es preferible a B. En términos técnicos,
nuestra noción de utilidad sólo se define hasta una transformación preservadora del orden
(“monótona”).3 Cualquier conjunto de números que refleje con exactitud el orden de preferencias
de una persona será suficiente. En consecuencia, no tiene sentido preguntar cuánto más es preferible A que B porque esta pregunta no tiene una sola respuesta. Estudios en los que se le pide a los
individuos clasificar su “felicidad” en una escala de 1 a 10 bien podrían usar una escala de 7
a 1 000 000. Sólo cabe esperar que una persona que reporte estar en “6” en la escala cierto día y en
“7” al día siguiente sea realmente más feliz el segundo día. Así, las clasificaciones de utilidad son
como las clasificaciones ordinales para los restaurantes o las películas en las que se usan una, dos,
tres o cuatro estrellas; simplemente registran la atracción relativa de conjuntos de mercancías.
Esta falta de singularidad en la asignación de números de utilidad también implica que no es
posible comparar utilidades de personas diferentes. Si una persona reporta que cenar un bistec
brinda una utilidad de “5” y otra reporta que la misma cena ofrece una utilidad de “100”, no puede
decirse cuál de ellas valora más esa cena, porque quizá hayan usado escalas diferentes. De igual
manera, no se puede medir si un desplazamiento de la situación A a la situación B brinda más
utilidad a una persona u otra. No obstante, como veremos, los economistas pueden decir mucho
sobre clasificaciones de utilidad, examinando qué deciden hacer las personas en forma voluntaria.
El supuesto ceteris paribus
Dado que utilidad se refiere a la satisfacción general tal medida se ve claramente afectada por
varios factores. La utilidad de una persona se ve afectada no sólo por su consumo de mercancías
físicas, sino también por actitudes psicológicas, presiones de grupos de amigos, experiencias personales y el entorno cultural general. Aunque los economistas tienen un interés general en exami1
Estas propiedades y su relación con la representación de las preferencias mediante una función de utilidad se exponen en detalle
en Andreu Mas-Colell, Michael D. Whinston y Jerry R. Green, Microeconomic Theory (Oxford University Press, Nueva York,
1995).
2
J. Bentham, Introduction to the Principles of Morals and Legislation (Hafner, Londres, 1848).
3
Podemos denotar matemáticamente esta idea diciendo que cualquier clasificación numérica de utilidad (U) puede ser transformada en otro conjunto de números por la función F siempre y cuando F(U) preserve el orden. Esto puede garantizarse si F(U)
0. Por ejemplo, la transformación F(U) U2 preserva el orden, lo mismo que la transformación F(U) ln U. Para facilitar el
análisis de una clasificación de utilidad particular en algunas secciones del libro y los problemas será conveniente hacer esta clase
de transformaciones.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
91
nar esas influencias, suele ser necesario restarle atención. En consecuencia, una práctica común
es atender exclusivamente decisiones entre opciones cuantificables (por ejemplo, las cantidades
relativas de alimento y techo comprados, el número de horas trabajadas por semana o los votos
entre fórmulas tributarias específicas) manteniendo constantes al mismo tiempo las demás cosas
que afectan el comportamiento. Este supuesto ceteris paribus (“todo lo demás igual”) se invoca en
todos los análisis económicos de decisiones de optimización de la utilidad para volver manejable
el análisis de las decisiones en un marco simplificado.
Utilidad del consumo de bienes
Como un ejemplo importante del supuesto ceteris paribus considérese el problema de elección de
un individuo, en un punto en el tiempo, entre n bienes de consumo x1, x2, …, xn. Supondremos
que la clasificación de estos bienes por el individuo puede ser representada por una función de
utilidad de la forma
utilidad U(x1, x2, …, xn; todo lo demás),
(3.1)
donde las x se refieren a las cantidades de los bienes que podrían elegirse, y la notación “todo lo
demás” se usa como recordatorio de que muchos aspectos del bienestar individual se mantienen
constantes en el análisis.
A menudo es más fácil escribir la ecuación 3.1 como
utilidad U(x1, x2, …, xn)
(3.2)
O, si sólo se consideran dos bienes, como
utilidad U(x, y)
(3.2’)
donde es evidente que todo se mantiene constante (es decir, fuera del marco de análisis) excepto
los bienes referidos en la función de utilidad. Sería tedioso recordarte a cada paso qué se mantiene
constante en el análisis, pero deberás recordar que alguna forma del supuesto ceteris paribus siempre estará vigente.
Argumentos de funciones de utilidad
La notación de la función de utilidad se usa para indicar cómo un individuo clasifica los argumentos particulares de la función considerada. En el caso más común, la función de utilidad
(ecuación 3.2) se utilizará para representar cómo un individuo clasifica ciertos conjuntos de bienes que podrían ser adquiridos en un cierto momento. En ocasiones se usarán otros argumentos
en la función de utilidad, y es mejor aclarar ciertas convenciones desde el principio. Por ejemplo,
podría ser útil hablar de la utilidad que recibe una persona de su patrimonio real (W). Así, usaremos la notación
utilidad U(W).
(3.3)
A menos que el individuo sea más bien peculiar, alguien como Scrooge, el patrimonio en sí mismo
no ofrece ninguna utilidad directa. Más bien, sólo cuando el patrimonio se gasta en bienes de
consumo es que resulta alguna utilidad. Por esta razón se entenderá que la ecuación 3.3 significa
que la utilidad del patrimonio se deriva, de hecho, gastando ese patrimonio de tal manera que
produzca la mayor utilidad posible.
Otros dos argumentos de funciones de utilidad se usarán en capítulos posteriores. En el capítulo 16 será importante la decisión trabajo-ocio del individuo y, por tanto, habrá que considerar
la presencia del ocio en la función de utilidad. La función que utilizaremos será una de la forma
utilidad U(c, h)
(3.4)
Aquí, c representa el consumo y h las horas sin trabajar (es decir, el ocio) durante un periodo
particular.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
92
Parte 2: Elección y demanda
En el capítulo 17 nos interesarán las decisiones de consumo del individuo en periodos diferentes. En ese capítulo se usará una función de utilidad de la forma
utilidad U(c1, c2)
(3.5)
donde c1 es consumo en este periodo y c2 es consumo en el periodo siguiente. Así, al cambiar los
argumentos de la función de utilidad podremos concentrarnos en aspectos específicos de las decisiones de un individuo en varios marcos simplificados.
En suma, iniciaremos nuestro examen del comportamiento individual con la definición
siguiente.
DEFINICIÓN
Utilidad. Se supone que las preferencias de las personas están representadas por una función de utilidad
de la forma
U(x1, x2, …, xn),
(3.6)
donde x1, x2, …, xn son las cantidades de cada uno de los n bienes que podrían consumirse en un periodo.
Esta función es única sólo hasta una transformación preservadora del orden.
Bienes económicos
En esta representación se entiende que las variables son “bienes”; es decir, cualesquiera que sean
las cantidades económicas que representen, suponemos que se prefiere más que menos de cualquier
xi particular durante cierto periodo. Suponemos que esto se aplica a todo bien, sea un artículo
simple de consumo como un hot dog o un agregado complejo como patrimonio u ocio. Hemos
descrito esta convención para una función de utilidad de dos bienes en la figura 3.1. Ahí, todos los
conjuntos de bienes de consumo en el área sombreada son preferibles al conjunto x∗, y∗ porque
cualquier paquete en el área sombreada brinda más de al menos uno de los bienes. De acuerdo
con nuestra definición de “bienes”, los conjuntos de bienes en el área sombreada ocupan una clasificación más alta que x∗, y∗. De igual manera, los conjuntos en el área marcada como “peor” son
evidentemente inferiores a x∗, y∗ porque contienen menos de al menos uno de los bienes y no más
del otro. Los conjuntos en las dos áreas indicadas por signos de interrogación son difíciles de
comparar con x∗, y∗, porque contienen más de uno de los bienes y menos del otro. Desplazamientos dentro de estas áreas implican opciones entre ambos bienes.
INTERCAMBIOS Y SUSTITUCIÓN
La mayor parte de la actividad económica implica el intercambio voluntario entre individuos.
Cuando una persona compra, digamos, una hogaza de pan, renuncia voluntariamente a una cosa
(dinero) a cambio de otra (pan) de mayor valor para ella. Para examinar este tipo de transacción
voluntaria debemos desarrollar un aparato formal para ilustrar intercambios en el contexto de la
función de utilidad. Motivaremos inicialmente nuestro análisis con una presentación gráfica y
después pasaremos a matemáticas más formales.
Curvas de indiferencia y la tasa marginal de sustitución
Los intercambios voluntarios pueden estudiarse mucho mejor usando el recurso gráfico de una
curva de indiferencia. En la figura 3.2 la curva U1 representa todas las combinaciones alternativas
de x y y para las cuales un individuo está igualmente en buenas condiciones (recuerda que todos
los demás argumentos de la función de utilidad se mantienen constantes). Esta persona está igualmente satisfecha consumiendo, por ejemplo, la combinación de bienes x1, y1 o la combinación x2,
y2. Esta curva que representa todos los conjuntos de bienes de consumo que el individuo clasifica
para el mismo nivel de utilidad se llama curva de indiferencia.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
FIGURA 3.1
Es preferible más que
menos de un bien.
93
El área sombreada representa las combinaciones de x y y inequívocamente preferibles a la combinación x∗,
y∗. Ceteris paribus, los individuos prefieren más que menos de cualquier bien. Las combinaciones identificadas con “?” implican cambios ambiguos en el bienestar porque contienen más de un bien y menos de otro.
Cantidad
de y
?
Preferible
a
x*, y*
y*
Peor
que
x*, y*
?
Cantidad de x
x*
DEFINICIÓN
Curva de indiferencia. Una curva de indiferencia (o, en muchas dimensiones, una superficie de indiferencia) muestra una serie de conjuntos de bienes de consumo acerca de los cuales el individuo es indiferente. Es decir, todos los conjuntos brindan el mismo nivel de utilidad.
La pendiente de la curva de indiferencia en la figura 3.2 es negativa, lo cual indica que si el
individuo es obligado a renunciar a una parte de y, debe ser compensado por una cantidad adicional de x para mantenerse indiferente entre los dos conjuntos de bienes. Esta curva también está
trazada de tal modo que la pendiente aumenta al aumentar x (es decir, la pendiente comienza en
infinito negativo y aumenta hacia cero). Esta es una representación gráfica del supuesto de que las
personas están progresivamente menos dispuestas a ceder y para obtener más x. En términos
matemáticos el valor absoluto de esta pendiente disminuye al aumentar x. De ahí que se tenga la
definición siguiente.
DEFINICIÓN
Tasa marginal de sustitución. La pendiente negativa de una curva de indiferencia (U1) en algún punto
se denomina tasa marginal de sustitución (TMS) en ese punto. Es decir,
TMS
dy
,
dx UU1
donde la notación indica que la pendiente debe calcularse a lo largo de la curva de indiferencia U1.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(3.7)
8/23
94
Parte 2: Elección y demanda
FIGURA 3.2
Curva de indiferencia.
La curva U1 representa aquellas combinaciones de x y y de las cuales el individuo deriva la misma utilidad. La pendiente de esta curva representa la tasa en la que el individuo está dispuesto a intercambiar x por
y mientras permanezca en condiciones igualmente buenas. La pendiente (o, más propiamente, la pendiente
negativa se denomina tasa marginal de sustitución. En la figura la curva de indiferencia se traza con base en
el supuesto de una tasa marginal de sustitución decreciente.
Cantidad
de y
U1
y1
y2
U1
x1
x2
Cantidad de x
Así, la pendiente de U1 y la TMS nos dicen algo sobre los intercambios que esta persona hará
en forma voluntaria. En un punto como x1, y1, la persona tiene mucho de y y está dispuesta a
intercambiar una cantidad significativa de ella para obtener más x. Por tanto, la curva de indiferencia en x1, y1 es más bien empinada. Esta es una situación en la que la persona tiene, digamos,
muchas hamburguesas (y) y poco que beber para acompañarlas (x). Esta persona renunciaría
gustosamente a algunas hamburguesas (digamos 5) para saciar su sed con una bebida más.
En x2, y2, por otro lado, la curva de indiferencia es más plana. Aquí, esta persona tiene algunas
bebidas y está dispuesta a renunciar a relativamente pocas hamburguesas (digamos 1) para obtener otra bebida. En consecuencia, la TMS disminuye entre, x1, y1 y x2, y2. La inestable pendiente
de U1 muestra cómo el particular conjunto de bienes de consumo disponible influye en los intercambios que esta persona hará libremente.
Mapa de curvas de indiferencia
En la figura 3.2 sólo se trazó una curva de indiferencia. El cuadrante x, y, sin embargo, está densamente ocupado por curvas de ese tipo, cada una de las cuales corresponde a un nivel de utilidad
diferente. Dado que cada conjunto de bienes puede clasificarse y produce cierto nivel de utilidad,
cada punto de la figura 3.2 debe tener una curva de indiferencia que pase por él. Las curvas de
indiferencia son similares a las curvas de nivel en un mapa, en el sentido de que representan líneas
de igual “altitud” de utilidad. En la figura 3.3 se advierten varias curvas de indiferencia para indicar que en el plano hay un número infinito de estas. El nivel de utilidad representado por dichas
curvas aumenta conforme nos movemos hacia el noreste; la utilidad de la curva U1 es menor que
la de U2, la cual es menor que la de U3. Esto se debe al supuesto que se establece en la figura 3.1:
es preferible más que menos de un bien. Como ya se dijo, no existe una manera única de asignar
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
FIGURA 3.3
Hay infinitas curvas de
indiferencia en el plano
x-y.
95
Hay una curva de indiferencia que pasa por cada punto en el plano x-y. Cada una de esas curvas registra
combinaciones de x y y de las cuales el individuo recibe cierto nivel de satisfacción. Desplazamientos en una
dirección noreste representan movimientos a mayores niveles de satisfacción.
Cantidad
de y
U1 U2 U3
Utilidad creciente
U3
U2
U1
Cantidad de x
números a estos niveles de utilidad. Las curvas sólo muestran que las combinaciones de bienes en
U3 son preferibles a aquellas en U2, las cuales son preferibles a aquellas en U1.
Curvas de indiferencia y transitividad
Como ejercicio de examen de la relación entre preferencias sistemáticas y la representación de
preferencias por funciones de utilidad, consideremos la siguiente pregunta: ¿dos curvas de indiferencia cualesquiera de un individuo pueden interceptarse? Dos de tales curvas cruzadas aparecen en la figura 3.4. Queremos saber si estas violan nuestros axiomas básicos de racionalidad.
Usando nuestra analogía del mapa parecería haber algo erróneo en el punto E donde la “altitud”
es igual a dos números diferentes, U1 y U2. Pero ningún punto puede estar a la vez a 100 y a 200
pies sobre el nivel del mar.
Para proceder formalmente analicemos los conjuntos de bienes representados por los puntos
A, B, C y D. Por efecto del supuesto de no saciedad (es decir, de que más de un bien siempre incrementa la utilidad) “A es preferible a B” y “C es preferible a D”. Pero esta persona está igualmente
satisfecha con B y C (que están en la misma curva de indiferencia), así que el axioma de transitividad implica que A debe preferirse a D. Sin embargo, esto no puede ser cierto, porque A y D están
en la misma curva de indiferencia y se consideran por definición indiferentes. Esta contradicción
demuestra que las curvas de indiferencia no se pueden interceptar. Así, siempre debemos trazar
mapas de curvas de indiferencia como los que aparecen en la figura 3.3.
Convexidad de curvas de indiferencia
Otra manera de enunciar el principio de tasa marginal de sustitución decreciente usa la noción
matemática de conjunto convexo. Se dice que un conjunto de puntos es convexo si dos puntos
cualesquiera en él pueden unirse por una línea recta completamente contenida en el conjunto. El
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
96
Parte 2: Elección y demanda
Las combinaciones A y D están en la misma curva de indiferencia y, por tanto, son igualmente deseables.
Pero el axioma de transitividad puede usarse para demostrar que A es preferible a D. De ahí que curvas de
indiferencia interceptadas no son congruentes con las preferencias racionales.
FIGURA 3.4
La intersección de
curvas de indiferencia
implica preferencias
asistemáticas.
Cantidad
de y
C
D
E
A
U1
B
U2
Cantidad de x
supuesto de una TMS decreciente es equivalente al de que todas las combinaciones de x y y preferibles o indiferentes a una combinación particular x∗, y∗ forman un conjunto convexo.4 Esto se
ilustra en la figura 3.5a, donde todas las combinaciones preferibles o indiferentes a x∗, y∗ están en
el área sombreada. Dos combinaciones cualesquiera entre estas —digamos x1, y1 y x2, y2— pueden
unirse por una línea recta también contenida en el área sombreada. En la figura 3.5b esto no es
cierto. Una línea que une a x1, y1 y x2, y2 pasa fuera del área sombreada. Así, la curva de indiferencia a través de x∗, y∗ en la figura 3.5b no cumple el supuesto de la TMS decreciente porque el
conjunto de puntos preferible o indiferente a x∗, y∗ no es convexo.
Convexidad y equilibrio en el consumo
Usando la noción de convexidad puede demostrarse que los individuos prefieren cierto equilibrio
en su consumo. Supongamos que un individuo es indiferente entre las combinaciones x1, y1 y x2,
y2. Si la curva de indiferencia es estrictamente convexa la combinación (x1 x2)/2, (y1 y2)/2 será
preferible a cualquiera de las combinaciones iniciales.5 Intuitivamente, los conjuntos de bienes
“debidamente equilibrados” son preferibles a los conjuntos muy inclinados a un solo bien. Esto se
ilustra en la figura 3.6. Dado que la curva de indiferencia se supone convexa, todos los puntos en
la línea recta que une a (x1, y1) y a (x2, y2) son preferibles a esos puntos iniciales. En consecuencia,
este será el caso del punto (x1 x2)/2, (y1 y2)/2, que está en el punto medio de esa línea. En
4
Esta definición es equivalente a suponer que la función de utilidad es cuasi cóncava. Tales funciones se estudiaron en el capítulo 2
y volveremos a examinarlas en la siguiente sección. A veces se usa el término cuasi concavidad estricta para descartar la posibilidad
de curvas de indiferencia que tengan segmentos lineales. En general supondremos cuasi concavidad estricta, pero en algunas
secciones ilustraremos las complicaciones planteadas por porciones lineales de curvas de indiferencia.
5
En el caso en que la curva de indiferencia tenga un segmento lineal el individuo será indiferente entre las tres combinaciones.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
FIGURA 3.5
Noción de convexidad
como definición alterna
de la TMS decreciente.
En a), la curva de indiferencia es convexa (toda línea que una dos puntos arriba de U1 también estará arriba
de U1). En b) tal no es el caso y la curva mostrada ahí no tiene en todas partes una TMS decreciente.
Cantidad
de y
Cantidad
de y
U1
U1
y1
y1
y*
y*
y2
U1
x1
x*
x2
Cantidad
de x
(a)
FIGURA 3.6
Son preferibles los
conjuntos equilibrados
de bienes a los conjuntos
extremos.
y2
U1
x1
x*
x2
Cantidad
de x
(b)
Si las curvas de indiferencia son convexas (si cumplen el supuesto de la TMS decreciente) la línea que una
dos puntos cualesquiera que sean indiferentes contendrán puntos preferibles a cualesquiera de las combinaciones iniciales. Intuitivamente, los conjuntos equilibrados son preferibles a los no equilibrados.
Cantidad
de y
U1
y1
y1 + y 2
2
y2
U1
x1
x1 + x 2
2
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
x2
23.08.2019
Cantidad de x
97
8/23
98
Parte 2: Elección y demanda
efecto, cualquier combinación proporcional de los dos conjuntos indiferentes de bienes será preferible a los conjuntos iniciales porque representará una combinación más equilibrada. Así, la
convexidad estricta es equivalente al supuesto de la TMS decreciente. Ambos supuestos descartan
la posibilidad de que una curva de indiferencia sea recta en cualquier porción de su longitud.
EJEMPLO 3.1 Utilidad y TMS
Supongamos que la clasificación que una persona haga de las hamburguesas (y) y los refrescos (x) pudiera
representarse con la función de utilidad
utilidad x . y.
(3.8)
Una curva de indiferencia de esta función se puede hallar identificando el conjunto de combinaciones de
x y y para el cual la utilidad tiene el mismo valor. Supóngase que, arbitrariamente, igualamos la utilidad
a 10. Entonces, la ecuación de esta curva de indiferencia es
utilidad 10 x . y.
(3.9)
Puesto que elevar al cuadrado esta función preserva el orden, esta curva de indiferencia también es representada por
100 x . y,
(3.10)
que es más fácil de graficar. En la figura 3.7 aparece esta curva de indiferencia; se trata de una conocida
hipérbola rectangular. Una manera de calcular la TMS es despejar y en la ecuación 3.10,
y 100/x,
(3.11)
FIGURA 3.7 Curva de indiferencia de utilidad ⴝ x·y
Esta curva de indiferencia ilustra la función 10 U x · y. En el punto A(5, 20), la TMS es 4, lo que
implica que esta persona está dispuesta a intercambiar 4y por una x adicional. En el punto B(20, 5), sin
embargo, la TMS es 0.25, lo cual implica una muy reducida disposición a intercambiar.
Cantidad
de y
A
20
C
12.5
B
5
U = 10
0
5
12.5
Cantidad de x
20
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
99
Se usa entonces la definición (ecuación 3.7):
TMS dy/dx (a lo largo de U1) 100/x2.
(3.12)
Evidentemente, esta TMS decrece al incrementarse x. En un punto como A en la curva de indiferencia
con muchas hamburguesas (digamos x 5, y 20), la pendiente es empinada, así que la TMS es alta:
TMS en (5, 20) 100/x2 100/25 4.
(3.13)
Aquí la persona está dispuesta a renunciar a 4 hamburguesas para obtener 1 refresco más. Por otro lado
en B, donde hay relativamente pocas hamburguesas (aquí x 20, y 5), la pendiente es plana y la TMS
baja:
TMS en (20, 5) 100/x2 100/400 0.25.
(3.14)
Ahora esta persona sólo renunciará a un cuarto de hamburguesa por otro refresco. Nótese también cómo
la convexidad de la curva de indiferencia U1 es ilustrada por este ejemplo numérico. El punto C está a
medio camino entre los puntos A y B; en C esta persona tiene 12.5 hamburguesas y 12.5 refrescos. Aquí
la utilidad está dada por
utilidad x . y (12.5)2 12.5,
(3.15)
que obviamente excede la utilidad a lo largo de U1 (la cual fue supuesta como 10).
PREGUNTA: Aquí, con base en nuestra derivación, parece que la TMS depende sólo de la cantidad de x
consumida. ¿Por qué es engañoso esto? ¿Cómo entra implícitamente la cantidad de y en las ecuaciones
3.13 y 3.14?
MATEMÁTICA DE LAS CURVAS
DE INDIFERENCIA
Una derivación matemática del concepto de curva de indiferencia brinda discernimientos adicionales sobre la naturaleza de las preferencias. En esta sección se examinará un ejemplo de dos
bienes directamente relacionados con el tratamiento gráfico que ya hemos provisto. Más adelante
se estudiará el caso de muchos bienes, aunque se concluirá que este caso más complicado sólo
añade unos cuantos discernimientos.
Tasa marginal de sustitución
Supongamos que un individuo recibe la utilidad de consumir dos bienes cuyas cantidades están
dadas por x y y. La clasificación que esta persona hace de los conjuntos de estos bienes puede
representarse con una función de utilidad de la forma U(x, y). Estas combinaciones de los dos
bienes que producen un nivel específico de utilidad, digamos k, son representadas por las soluciones de la ecuación implícita U(x, y) k. En el capítulo 2 (véase ecuación 2.23) se demostró que
las opciones contenidas por tal ecuación están dadas por:
dy
dx U ( x,
Umgx
.
Umgy
y) k
(3.16)
Es decir, la tasa a la que x puede intercambiarse por y está dada por la razón negativa de la “utilidad marginal” del bien x con aquella del bien y. Suponiendo que las cantidades adicionales de
ambos bienes aportan utilidad agregada, la tasa de esta opción será negativa lo que implica que los
incrementos en la cantidad del bien x deben coincidir con los decrementos en la cantidad del bien
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
100
Parte 2: Elección y demanda
y para mantener constante la utilidad. Ya se definió la tasa marginal de sustitución como el valor
negativo (o el valor absoluto) de estas opciones, así que ahora se tiene:
dy
dx U ( x,
TMS
y) k
Umgx
.
Umgy
(3.17)
Esta derivación ayuda a comprender por qué la TMS no depende específicamente de cómo
se mida la utilidad. Dado que la TMS es una razón de dos medidas de utilidad, las unidades “se
eliminan” en el cálculo. Por ejemplo, supongamos que el bien x representa los alimentos y que
se ha elegido una función de utilidad para la cual una unidad extra de alimentos produce 6 unidades extra de utilidad (unidades también conocidas como útiles). Supongamos también que y
representa prendas de vestir y que con esta función de utilidad cada unidad extra de ropa brinda
2 unidades extra de utilidad. En este caso resulta claro que esta persona está dispuesta a renunciar
a 3 unidades de ropa (y a perder, por tanto, 6 útiles) a cambio de una unidad extra de alimentos
(y a ganar, por tanto, 6 útiles):
TMS
dy Umgx 6 útiles por unidad x
3 unidades y por unidad x
dx Umgy
2 útiles por unidad y
(3.18)
Obsérvese que la medida de utilidad usada aquí (útiles) se elimina al hacer el cálculo, y lo que
resta está puramente en términos de las unidades de los dos bienes. Esto demuestra que la TMS se
mantendrá sin cambios, cualquiera que sea la clasificación de utilidad específica utilizada.6
Convexidad de curvas de indiferencia
En el capítulo 1 se describió cómo los economistas fueron capaces de resolver la paradoja del agua
y el diamante, proponiendo que el precio del agua es bajo porque un galón más ofrece relativamente poco en términos de utilidad creciente. El agua es (en la mayoría de los casos) abundante; así, su utilidad marginal es baja. Claro que en un desierto el agua sería escasa y su utilidad
marginal (precio) podría ser alta. Así, puede concluirse que la utilidad marginal asociada con el
consumo de agua disminuye al consumir más agua; en términos formales, la segunda derivada
(parcial) de la función de utilidad (es decir, Umgxx = 2U/x2) deberá ser negativa.
Intuitivamente parece que esta idea de sentido común también debería explicar por qué las
curvas de indiferencia son convexas. El hecho de que las personas estén cada vez menos dispuestas a compartir el bien y para obtener más x (manteniendo constante la utilidad) parece remitir al
mismo fenómeno: no quieren demasiado de ningún bien. Lamentablemente la relación precisa
entre la utilidad marginal decreciente y la TMS decreciente es compleja, aun en el caso de dos
bienes. Como se demostró en el capítulo 2, una función tendrá (por definición) curvas de indiferencia convexas, siempre y cuando sea cuasi cóncava. Pero las condiciones requeridas para la
cuasi concavidad son caóticas y el supuesto de utilidad marginal decreciente (es decir, de derivadas parciales de segundo orden negativas) no garantiza que se mantendrán.7 Aun así, como veremos, existen buenas razones para suponer que las funciones de utilidad (y muchas otras funciones
usadas en microeconomía) son cuasi cóncavas; así, no nos interesaremos demasiado en las situaciones en que no lo son.
6
Más formalmente, sea F[U(x, y)] cualquier transformación monótona de la función de utilidad con F(U)
clasificación de utilidad, la TMS está dada por
TMS 0. Con esta nueva
F/x F(U)·Umg x Umg x
,
F/y F(U)·Umg y Umg y
que es igual a la TMS de la función de utilidad original.
7
Específicamente, para que la función U(x, y) sea cuasi cóncava debe mantenerse la condición siguiente (véase ecuación 2.114):
UxxUx2 2UxyUxUy UyyUy2 0.
Los supuestos de que Uxx, Uyy 0 no garantizan esto. También hay que fijarse en el signo de la derivada cruzada parcial Uxy.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
101
EJEMPLO 3.2 Demostración de la convexidad de curvas de indiferencia
El cálculo de la TMS de las funciones de utilidad específicas es frecuentemente un buen atajo para demostrar la convexidad de curvas de indiferencia. En particular, el proceso puede ser mucho más simple que
aplicar la definición de cuasi concavidad, aunque es más difícil de generalizar a más de dos bienes. Aquí
se examinará cómo puede usarse la ecuación 3.17 para tres diferentes funciones de utilidad (para más
práctica, véase el problema 3.1).
1. U(x, y) x . y.
Este ejemplo repite sencillamente el caso ilustrado en el ejemplo 3.1. Un atajo para aplicar la ecuación
3.17 y que puede simplificar el álgebra es tomar el logaritmo de esta función de utilidad. Dado que
tomar logaritmos preserva el orden, esto no alterará la TMS por calcular. Así, sea
U∗(x, y) ln[U(x, y)] 0.5 ln x 0.5 ln y.
(3.19)
Aplicar la ecuación 3.17 produce
TMS U / x 0.5/x y
,
U / y 0.5/y x
(3.20)
lo cual parece un método mucho más simple que el que usamos previamente.8 Es evidente que esta
TMS es decreciente al incrementar x y disminuir y. Así, las curvas de indiferencia son convexas.
2. U(x, y) x xy y.
En este caso no hay ninguna ventaja en transformar esta función de utilidad. Aplicar la ecuación 3.17
produce
TMS U/ x 1 y
.
U/ y 1 x
(3.21)
Nuevamente, esta razón decrece visiblemente al incrementar x y disminuir y; así, las curvas de indiferencia de esta función son convexas.
3. U(x, y) x2 y2
En este ejemplo es más fácil usar la transformación
U∗(x, y) [U(x, y)]2 x2 y2.
(3.22)
Debido a que esta es la ecuación de un cuarto de círculo, deberíamos comenzar por sospechar que
puede haber algunos problemas con las curvas de indiferencia de esta función de utilidad. Dichas
sospechas se confirman aplicando otra vez la definición de la TMS para producir
TMS U / x 2x x
.
U y
2y y
(3.23)
Para esta función está claro que al incrementar x y disminuir y la TMS se incrementa. De ahí que las
curvas de indiferencia sean cóncavas, no convexas; así que evidentemente esta no es una función
cuasi cóncava.
PREGUNTAS: ¿La duplicación de x y y cambia la TMS en alguno de estos tres ejemplos? Es decir, ¿la
TMS depende sólo de la razón de x con y, y no de la escala absoluta de compras? (Véase también el ejemplo 3.3.)
En el ejemplo 3.1 se examinó la curva de indiferencia U 10. Así, para esta curva, y 100/x y la TMS en la ecuación 3.20 sería
TMS 100/x2, como se calculó antes.
8
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
102
Parte 2: Elección y demanda
FUNCIONES DE UTILIDAD PARA
PREFERENCIAS ESPECÍFICAS
Las clasificaciones que los individuos hacen de los conjuntos de mercancías y las funciones de
utilidad implicadas no son observables. Todo lo que podemos saber de las preferencias de las
personas debe proceder del comportamiento que observamos cuando responden a cambios en
ingreso, precios y otros factores. No obstante, es útil examinar algunas de las formas que las funciones de utilidad particulares podrían adoptar. Tal examen puede ofrecer discernimientos de la
conducta observada y (más específicamente) la comprensión de las propiedades de esas funciones
puede ser de utilidad para resolver problemas. Aquí se examinarán cuatro ejemplos específicos de
funciones de utilidad de dos bienes. Los mapas de curvas de indiferencia de estas funciones se
ilustran en los cuatro paneles de la figura 3.8. Como debería ser evidente, estas cubren unas cuantas formas posibles. Incluso es posible mayor variedad una vez que pasemos a las funciones de tres
o más bienes, y algunas de esas posibilidades se mencionarán en capítulos posteriores.
FIGURA 3.8
Ejemplos de funciones
de utilidad.
Estos cuatro mapas de curvas de indiferencia ilustran grados alternos de sustitución de x por y. Las funciones Cobb-Douglas y de elasticidad de sustitución constante (ESC) (trazadas aquí para relativamente baja
sustitución) caen entre los extremos de sustitución perfecta (b) y no sustitución (c).
Cantidad
de y
Cantidad
de y
U2
U1
U2
U1
U0
U0
Cantidad de x
(a) Cobb-Douglas
Cantidad de x
(b) Sustitutos perfectos
Cantidad
de y
Cantidad
de y
U2
U1
U2
U1
U0
U0
Cantidad de x
(c) Complementos perfectos
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
Cantidad de x
(d) ESC
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
103
Utilidad de la función Cobb-Douglas
La figura 3.8a muestra la conocida figura de una curva de indiferencia. Una función de utilidad
de uso común que genera este tipo de curvas tiene la forma
utilidad U(x, y) xy,
(3.24)
donde y son constantes positivas.
En los ejemplos 3.1 y 3.2 se estudió un caso particular de esta función, para el cual 0.5. El caso más general, que se presenta en la ecuación 3.24, se denomina función Cobb-Douglas en honor de los dos investigadores que usaron esta función en un estudio detallado de
las relaciones de producción en la economía estadounidense (véase el capítulo 9). En general, las
magnitudes relativas de y indican la relativa importancia de los dos bienes para este individuo. Como la utilidad es única sólo hasta una transformación monótona, a menudo resulta conveniente normalizar estos parámetros de tal manera que 1. En este caso la utilidad
estaría dada por
U(x, y) xy1 (3.25)
donde /( ), 1 /( ).
Sustitutos perfectos
Las curvas de indiferencia lineales de la figura 3.8b son generadas por una función de utilidad de
la forma
utilidad U(x, y) x y,
(3.26)
donde, nuevamente, y son constantes positivas. Que las curvas de indiferencia de esta función
sean líneas rectas debería ser de inmediato evidente: cualquier curva de nivel particular puede
calcularse igualando U(x, y) con una constante que especifique una línea recta. La naturaleza
lineal de estas curvas de indiferencia da origen al término de sustitutos perfectos para describir la
relación implicada entre x y y. Puesto que la TMS es constante (e igual a /) a lo largo de la curva
de indiferencia entera, nuestras nociones previas de la TMS decreciente no se aplican en este caso.
Una persona con estas preferencias estaría dispuesta a renunciar a la misma cantidad de y para
obtener una x más sin importar cuánta x se haya consumido. Tal situación podría describir la
relación entre diferentes marcas de lo que es en esencia el mismo producto. Por ejemplo, a muchas
personas (incluidos los autores) no les importa dónde compran gasolina. Un galón de gasolina es
un galón de gasolina pese a los mejores esfuerzos de los departamentos de publicidad de Exxon y
Shell por convencernos de lo contrario. Dado este hecho, siempre estamos dispuestos a renunciar
a 10 galones de Exxon a cambio de 10 galones de Shell porque no nos importa cuál usamos ni
dónde llenamos el tanque la última vez. En efecto, como se verá en el capítulo siguiente, una
implicación de esa relación es que compraremos toda nuestra gasolina con el distribuidor de
menor costo. Como no experimentamos una TMS de Exxon por Shell, no hay razón para buscar
un equilibrio entre los tipos de gasolina que utilizamos.
Complementos perfectos
Las curvas de indiferencia en forma de L de la figura 3.8c ilustran una situación directamente
opuesta al caso de sustitutos perfectos. Estas preferencias se aplicarían a bienes complementarios:
café y crema, crema de cacahuate y mermelada, queso crema y salmón ahumado son algunos
ejemplos conocidos. Las curvas de indiferencia que se advierten en la figura 3.8c implican que
esos pares de bienes serán usados en la relación proporcional fija que representan los vértices de
las curvas. Una persona que prefiere 1 onza de crema con 8 onzas de café querrá 2 onzas de crema
con 16 onzas de café. Café extra sin crema no es de valor para esa persona, así como crema extra
tampoco sería de valor sin café. Sólo eligiendo los bienes juntos la utilidad puede aumentar.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
104
Parte 2: Elección y demanda
Estos conceptos pueden formalizarse examinando la forma matemática de la función de utilidad que genera dichas curvas de indiferencia en forma de L:
utilidad U(x, y) min(x, y).
(3.27)
Aquí y son parámetros positivos, y el operador “min” significa que la utilidad está dada por el
menor de los términos entre paréntesis. En el ejemplo del café-crema, si se concede que las onzas
de café están representadas por x y las onzas de crema por y, la utilidad estaría dada por
utilidad U(x, y) min(x, 8y).
(3.28)
Ahora, 8 onzas de café y 1 onza de crema proporcionan 8 unidades de utilidad. Pero 16 onzas de
café y 1 onza de crema siguen proporcionando sólo 8 unidades de utilidad porque min(16, 8) 8.
El café extra sin crema no es de valor, como lo muestra la sección horizontal de las curvas de
indiferencia respecto al desplazamiento desde un vértice; la utilidad no se incrementa cuando
sólo se incrementa x (con y constante). Sólo si el café y la crema se duplican por igual (a 16 y 2,
respectivamente) la utilidad se incrementará a 16.
En general, ninguno de los dos bienes especificados en la función de utilidad dada por la ecuación 3.27 se consumirá en cantidades superfluas si x y. En este caso, la razón de la cantidad
del bien x consumida con la del bien y será una constante, dada por
y .
x (3.29)
El consumo ocurrirá en los vértices de las curvas de indiferencia que se muestran en la figura 3.8c.
Utilidad ESC
Las tres funciones de utilidad específicas ilustradas hasta ahora son casos especiales de la función
más general ESC, que adopta la forma
x y
,
(3.30)
utilidad U(x, y) ln x ln y
(3.31)
utilidad U ( x, y) donde 1, 0, y
cuando 0. Es obvio que el caso de sustitutos perfectos corresponde al caso límite, 1, en la
ecuación 3.30 y que el caso de Cobb-Douglas9 corresponde a 0 en la ecuación 3.31. Es menos
obvio que el caso de proporciones fijas corresponde a en la ecuación 3.30, pero ese resultado también puede mostrarse usando un argumento de límites.
El uso del término elasticidad de sustitución para esta función se deriva de la noción de que las
posibilidades que se ilustran en la figura 3.8 corresponden a varios valores del parámetro de sustitución, , que para esta función está dado por 1/(1 ). En cuanto a los sustitutos perfectos
entonces , y el caso de proporciones fijas tiene 0.10 Debido a que la función ESC nos
permite explorar todos estos casos, y muchos intermedios, resultará útil para ilustrar el grado de
sustitución presente en varias relaciones económicas.
La forma específica de la función ESC que se ilustra en la figura 3.8a es para el caso 1.
Esto es,
utilidad
x
1
y
1
1
x
1
.
y
(3.32)
9
La función ESC puede generalizarse fácilmente para tomar en cuenta diferentes ponderaciones por atribuir a los dos bienes.
Como el principal uso de esta función es examinar cuestiones de sustitución, usualmente no haremos esa generalización. En
algunas aplicaciones de la función ESC también omitiremos los denominadores de la función, porque sólo constituyen un factor
de escala cuando es positiva. Para valores negativos de , sin embargo, el denominador es necesario para garantizar que la utilidad marginal es positiva.
10
El concepto de elasticidad de sustitución será explicado en detalle en relación con las funciones de producción en el capítulo 9.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
105
Para esta situación 1/(1 ) 1/2 y, como muestra la gráfica, estas curvas de indiferencia
marcadamente curvas evidentemente caen entre los casos de Cobb-Douglas y de proporciones
fijas. Los signos negativos en esta función de utilidad podrían parecer extraños, pero las utilidades
marginales tanto de x como de y son positivas y decrecientes, como era de esperar. Esto explica
por qué debe aparecer en los denominadores de la ecuación 3.30. En el caso particular de la
ecuación 3.32 la utilidad se incrementa de (cuando x y 0) hacia 0 al incrementarse x y y.
Esta es una escala de utilidad extraña, quizá, pero perfectamente aceptable y con frecuencia útil.
EJEMPLO 3.3 Preferencias homotéticas
Todas las funciones de utilidad descritas en la figura 3.8 son homotéticas (véase el capítulo 2). Es decir, la
tasa marginal de sustitución de esas funciones depende sólo de la razón de las cantidades de ambos bienes, no de las cantidades totales de los bienes. Este hecho es obvio para los casos de sustitutos perfectos
(cuando la TMS es la misma en cada punto) y de complementos perfectos (donde la TMS es infinita para
y/x /, indefinida cuando y/x / y de cero cuando y/x /). Para la función general CobbDouglas, la TMS puede encontrarse como
TMS U/x x 1 y y
,
U/y x y 1 x
(3.33)
la cual claramente depende de la razón y/x. Demostrar que la función ESC también es homotética se deja
como ejercicio (véase el problema 3.12).
La importancia de las funciones homotéticas es que una curva de indiferencia es muy parecida a otra.
Las pendientes de las curvas dependen sólo de la razón y/x, no de lo distante de la curva desde el origen. Las curvas de indiferencia para mayor utilidad son simples copias de aquellas para menor utilidad.
De ahí que se pueda estudiar el comportamiento de un individuo con preferencias homotéticas, analizando únicamente una curva de indiferencia o unas cuantas curvas cercanas sin temer que nuestros
resultados cambien drásticamente en diferentes niveles de utilidad.
PREGUNTA: ¿Cómo podrías definir geométricamente las funciones homotéticas? ¿Cómo sería el locus
de todos los puntos con TMS particular en el mapa de curvas de indiferencia de un individuo?
EJEMPLO 3.4 Preferencias no homotéticas
Aunque todos los mapas de curvas de indiferencia de la figura 3.8 exhiben preferencias homotéticas, esta
necesidad no siempre es cierta. Considérese la función de utilidad cuasi lineal
utilidad U(x, y) x ln y.
(3.34)
Para esta función una buena y exhibe utilidad marginal decreciente, pero una buena x no. La TMS puede
calcularse como
TMS U/x
1
y
U/y 1/y
(3.35)
La TMS disminuye al decrecer la cantidad elegida de y, pero es independiente de la cantidad consumida
de x. Como x tiene una utilidad marginal constante, la disposición de una persona a renunciar a y para
obtener una unidad más de x sólo depende de cuánto tenga de y. A diferencia del caso homotético, la
duplicación tanto de x como de y duplica la TMS en vez de dejarla sin cambios.
PREGUNTAS: ¿Cómo es el mapa de curvas de indiferencia de la función de utilidad de la ecuación 3.34?
¿Por qué esto podría aproximar una situación en la que y es un bien específico y x representa todos los
demás?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
106
Parte 2: Elección y demanda
EL CASO DE MUCHOS BIENES
Todos los conceptos que hasta aquí hemos estudiado para el caso de dos bienes pueden generalizarse a situaciones en que la utilidad es una función arbitraria de muchos bienes. En esta sección
se explorarán brevemente esas generalizaciones. Aunque este examen no añadirá mucho a lo ya
demostrado, en la economía aplicada puede ser importante considerar las preferencias de las
personas por muchos bienes como se verá en capítulos posteriores.
Si la utilidad es una función de n bienes de la forma U(x1, x2, . . ., xn), entonces la ecuación
U(x1, x2, . . ., xn) k
(3.36)
define una superficie de indiferencia en n dimensiones. Esta superficie muestra todas las combinaciones de los n bienes que producen el mismo nivel de utilidad. Aunque probablemente sea
imposible imaginar cómo sería esa superficie, seguiremos suponiendo que es convexa. Es decir,
los conjuntos balanceados de bienes serán preferibles a los desbalanceados. De ahí que la función
de utilidad, aun en muchas dimensiones, se suponga cuasi cóncava.
TMS con muchos bienes
Es posible estudiar los intercambios que una persona podría hacer voluntariamente entre dos
bienes cualesquiera (digamos x1 y x2), usando de nuevo el teorema de la función implícita:
TMS
dx2
dx1
U ( x1 , x2 , ..., xn) k
Ux1 ( x1 , x2 , . . . , xn)
.
Ux2 ( x1 , x2 , . . . , xn)
(3.37)
La notación aquí destaca el hecho importante de que la disposición de un individuo a intercambiar x1 por x2 dependerá no sólo de las cantidades de ambos bienes, sino también de las cantidades de todos los demás bienes. La disposición de un individuo a intercambiar alimentos por ropa
dependerá no sólo de las cantidades de alimentos y ropa que tenga, sino también de cuánto
“techo” tenga. En general, sería de esperar que las variaciones en las cantidades de cualquiera de
esos otros bienes afecten la opción representada por la ecuación 3.37. Esta posibilidad es la que a
veces puede complicar el generalizar los hallazgos de modelos simples de dos bienes al caso de
muchos bienes. Se debe tener cuidado de especificar qué se supone acerca de las cantidades de los
demás bienes. En capítulos posteriores se examinan ocasionalmente tales complejidades. Sin
embargo, en la mayoría de los casos el modelo de dos bienes será suficiente para desarrollar intuición sobre relaciones económicas.
Resumen
En este capítulo se describió la manera en que los economistas
formalizan las preferencias de los individuos acerca de los bienes
que eligen. Se llegó a varias conclusiones sobre esas preferencias que, en los capítulos siguientes, desempeñarán un papel central en nuestro análisis de la teoría de la elección:
• La pendiente negativa de una curva de indiferencia se define
como tasa marginal de sustitución (TMS). Esta muestra la tasa
en que un individuo renunciaría voluntariamente a una cantidad de un bien (y) si fuera compensado con la recepción de
una unidad más de otro bien (x).
• Si los individuos obedecen ciertos postulados conductuales
básicos respecto a sus preferencias entre bienes, podrán clasificar todos los conjuntos de mercancías y esa clasificación puede
representarse con una función de utilidad. Al tomar decisiones los individuos se comportarán como si optimizara esa función.
• El supuesto de que la TMS decrece al sustituir x por y en el
consumo es congruente con la noción de que los individuos
prefieren cierto equilibrio en sus decisiones de consumo. Si la
TMS es siempre decreciente, los individuos tendrán curvas
de indiferencia estrictamente convexas. Es decir, su función de
utilidad será estrictamente cuasi cóncava.
• Las funciones de utilidad para dos bienes pueden ilustrarse
con un mapa de curvas de indiferencia. Cada curva de nivel de
las curvas de indiferencia de este mapa muestra todos los conjuntos de bienes que producen un nivel de utilidad dado.
• Algunas formas funcionales simples pueden recoger diferencias importantes respecto a las preferencias de los individuos
por dos (o más) bienes. Aquí se examinaron la función CobbDouglas, la función lineal (de sustitutos perfectos), la función
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
de proporciones fijas (de complementos perfectos) y la función ESC (que incluye los otros tres casos especiales).
• Matemáticamente es muy simple generalizar a partir de ejemplos de dos bienes a ejemplos de muchos bienes. Y, como vere-
107
mos, estudiar las decisiones de las personas entre muchos bienes puede arrojar cantidad de discernimientos. Pero las
matemáticas de muchos bienes no son especialmente intuitivas; así, para reforzar tal intuición nos apoyaremos principalmente en casos de dos bienes.
Problemas
3.1
Grafica una curva de indiferencia típica para las siguientes funciones de utilidad y determina si tienen curvas de indiferencia convexas (es
decir, si la TMS declina al incrementarse x).
a. U(x, y) 3x y.
b. U ( x, y) x y.
c. U ( x, y) x y.
d. U ( x, y) x2 y2 .
xy
.
e. U ( x, y) x y
3.2
En el pie de nota 7 se demuestra que para que una función de utilidad de dos bienes tenga una TMS estrictamente decreciente (es decir,
para que sea estrictamente cuasi cóncava) debe mantenerse la condición siguiente:
Uxx Ux2
2Uxy Ux Uy Uyy Uy2 0
Usa esta condición para comprobar la convexidad de las curvas de indiferencia de cada una de las funciones de utilidad del problema 3.1.
Describe la relación precisa entre utilidad marginal decreciente y cuasi concavidad en cada caso.
3.3
Considera las funciones de utilidad siguientes:
a. U(x, y) xy.
b. U(x, y) x2y2.
c. U(x, y) ln x ln y.
Demuestra que cada una de ellas tiene TMS decreciente pero exhiben utilidad marginal constante, creciente y decreciente, respectivamente. ¿Cuál es tu conclusión?
3.4
Como se vio en la figura 3.5, una manera de demostrar la convexidad de las curvas de indiferencia es demostrar que, respecto a dos puntos
x x2 y1 y2
es al
cualesquiera (x1, y1) y (x2, y2) en una curva de indiferencia que ofrece U k, la utilidad asociada con el punto 1
,
2
2
menos tan grande como k. Usa este método para analizar la convexidad de las curvas de indiferencia de las tres funciones siguientes. No
olvides graficar tus resultados.
a. U(x, y) min(x, y).
b. U(x, y) max(x, y).
c. U(x, y) x y.
3.5
El fanático de los Phillies (FP) siempre come sus bocadillos en el estadio en forma especial; consume un hot dog de un pie de largo con
exactamente la mitad de una medianoche, 1 onza de mostaza y 2 onzas de pepinillos. Su utilidad es una función de sólo esos cuatro artículos, y cualquier cantidad extra de cualquiera de ellos sin los demás ingredientes carece de valor.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
108
Parte 2: Elección y demanda
a. ¿Qué forma tiene la función de utilidad del FP para esos cuatro bienes?
b. ¿Cómo podrían simplificarse las cosas, considerando la utilidad del FP como una función de sólo un bien? ¿Cuál sería ese bien?
c. Supón que los hot dogs de un pie de largo cuestan un dólar cada uno, las medianoches $0.50 de dólar cada una, la mostaza $0.05 de dólar
por onza y los pepinillos $0.15 de dólar por onza. ¿Cuánto costaría el bien definido en el inciso b)?
d. Si el precio de los hot dogs de un pie de largo aumentara 50 por ciento (a $1.50 dólares cada uno), ¿cuál sería el incremento porcentual
en el precio del bien?
e. ¿Cómo afectaría un aumento de 50 por ciento en el precio de una medianoche el precio del bien? ¿Por qué tu respuesta es diferente de
la del inciso d)?
f. Si el gobierno quisiera recaudar un dólar, gravando los bienes que el FP compra, ¿cómo debería distribuir este impuesto entre los cuatro
bienes para minimizar el costo de utilidad para el FP?
3.6
Muchos lemas publicitarios parecen señalar algo sobre las preferencias de las personas. ¿Cómo recogerías los siguientes lemas con una
función de utilidad matemática?
a.
b.
c.
d.
e.
La margarina Promise es tan buena como la mantequilla.
Las cosas van mejor con Coca-Cola.
No puedes comer sólo una papa frita Pringle.
Las donas glaseadas Krispy Kreme son mejores que las Dunkin’ Donuts.
Miller Brewing nos recomienda beber (cerveza) “responsablemente”. [¿Cuál sería un consumo “irresponsable”?]
3.7
a. Un consumidor está dispuesto a intercambiar 3 unidades de x por 1 unidad de y cuando tiene 6 unidades de x y 5 de y. También está
dispuesto a intercambiar 6 unidades de x por 2 unidades de y cuando tiene 12 de x y 3 de y. Es indiferente entre el paquete (6, 5) y el
conjunto (12, 3). ¿Cuál es la función de utilidad para los bienes x y y? Pista: ¿cuál es la forma de la curva de indiferencia?
b. Una consumidora está dispuesta a intercambiar 4 unidades de x por 1 unidad de y cuando consume el paquete (8, 1). También está
dispuesta a intercambiar 1 unidad de x por 2 unidades de y cuando consume el conjunto (4, 4). De hecho, le son indiferentes ambos
conjuntos. Suponiendo que la función de utilidad es Cobb-Douglas de la forma U(k, y) xy, donde y son constantes positivas,
¿cuál es la función de utilidad de esta consumidora?
c. ¿Hubo redundancia de información en el inciso b)? De ser así, ¿cuál es cantidad mínima de información requerida en esa pregunta para
derivar la función de utilidad?
3.8
Halla funciones de utilidad, dada cada una de las curvas de indiferencia siguientes [definidas por U(.) k]:
a. z k1/
x/ y/
.
b. y 0.5 x2 4( x2 k)
c. z y4 4x( x2 y k)
2x
0.5x.
y2
.
2x
Problemas analíticos
3.9 Dotaciones iniciales
Supón que una persona tiene cantidades iniciales de los dos bienes que le brindan utilidad. Estas cantidades iniciales están dadas por x y y.
a. Grafica estas cantidades iniciales en el mapa de curvas de indiferencia de esa persona.
b. Si esta persona puede intercambiar x por y (o viceversa) con otras personas, ¿qué tipos de intercambios haría en forma voluntaria? ¿Qué
tipos de intercambios no haría? ¿Cómo se relacionan esos intercambios con la TMS de esta persona en el punto (x, y)?
c. Supón que esta persona está relativamente satisfecha con las cantidades iniciales en su poder y que sólo considerará intercambios que
incrementen su utilidad en al menos la cantidad k. ¿Cómo ilustrarías esto en el mapa de curvas de indiferencia?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
109
3.10 Utilidad de función Cobb-Douglas
El ejemplo 3.3 demuestra que la TMS de la función Cobb-Douglas
U ( x, y) x y
está dada por
TMS y
.
x
a. ¿Acaso este resultado depende de si 1? ¿Esta suma tiene alguna relevancia para la teoría de la elección?
b. Para conjuntos de bienes para los cuales y x, ¿cómo depende la TMS de los valores de y ? Desarrolla una explicación intuitiva de
por qué, si , TMS 1. Ilustra tu argumento con una gráfica.
c. Supón que un individuo obtiene utilidad sólo de cantidades de x y y que exceden los niveles de subsistencia mínima, dados por x0, y0.
En este caso,
U ( x, y) ( x
x0) ( y
y0) ¿Esta función es homotética? (Para un análisis adicional, véanse las extensiones del capítulo 4.)
3.11 Utilidades marginales independientes
Dos bienes tienen utilidades marginales independientes si
2 U
2 U
0.
yx xy
Demuestra que, si se supone una utilidad marginal decreciente para cada bien, cualquier función de utilidad con utilidades marginales
independientes tendrá una TMS decreciente. Da un ejemplo para demostrar que la inversa de este enunciado no es cierta.
3.12 Utilidad ESC
a. Demuestra que la función ESC
x
y
es homotética. ¿Cómo depende la TMS de la razón y/x?
b. Demuestra que tus resultados del inciso a) coinciden con nuestro análisis de los casos 1 (sustitutos perfectos) y 0 (CobbDouglas).
c. Demuestra que la TMS es estrictamente decreciente para todos los valores de 1.
d. Demuestra que si x y, la TMS de esta función sólo depende de las magnitudes relativas de y .
e. Calcula la TMS de esta función cuando y/x 0.9 y y/x 1.1 para los dos casos 0.5 y 1. ¿Qué concluyes sobre la medida en
que la TMS cambia en las cercanías de x y? ¿Cómo interpretarías esto geométricamente?
3.13 La función cuasi lineal
Considera la función U(x, y) x ln y. Esta es una función de uso relativamente frecuente en los modelos económicos, ya que tiene
algunas propiedades útiles.
a.
b.
c.
d.
Halla la TMS de la función. Ahora, interpreta el resultado.
Confirma que la función es cuasi cóncava.
Halla la ecuación de una curva de indiferencia de esta función.
Compara la utilidad marginal de x y y. ¿Cómo interpretas estas funciones? ¿Cómo podrían elegir los consumidores entre x y y, al tratar
de incrementar su utilidad mediante, por ejemplo, consumir más cuando su ingreso aumenta? (Estudiaremos en detalle este “efecto
ingreso” en los problemas del capítulo 5.)
e. Describe algunas situaciones en las que esta función podría ser útil, considerando cómo cambia la utilidad al incrementar las cantidades de los dos bienes.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
110 Parte 2: Elección y demanda
3.14 Relaciones de preferencia
El estudio formal de las preferencias usa una notación vectorial general. Un paquete de n mercancías es denotado por el vector x (x1,
x2, . . . , xn), y una relación de preferencia (Ɑ) se define sobre todos los conjuntos posibles. El enunciado x1 Ɑ x2 significa que el conjunto
x1 es preferible al paquete x2. La indiferencia entre ambos es denotada por x1 ≈ x2.
La relación de preferencia es “completa” si respecto a dos conjuntos cualesquiera el individuo puede afirmar ya sea x1 Ɑ x2, x2 Ɑ x1 o
x1 ≈ x2. La relación es “transitiva” si x1 Ɑ x2 y x2 Ɑ x3 implica que x1 Ɑ x3. Finalmente, una relación de preferencia es “continua” si respecto
a cualquier conjunto y como, por ejemplo, y Ɑ x, cualquier conjunto adecuadamente próximo a y también sea preferible a x. Usando estas
definiciones analiza si cada una de las relaciones de preferencia siguientes es completa, transitiva o continua.
a. Preferencias de suma: esta relación de preferencia supone que efectivamente pueden sumarse manzanas y naranjas. Específicamente,
n
que x1 Ɑ x2 si y sólo si xi1
i1
n
n
n
i1
i1
i1
xi2 . Si xi1 xi2 , x1
x2.
b. Preferencias lexicográficas: en este caso la relación de preferencia se organiza como un diccionario: si x11 x12, x1 Ɑ x2 (independientemente de las cantidades de los demás n – 1 bienes). Si x11 x12 y x21 x22, x1 Ɑ x2 (independientemente de las cantidades de los demás
n 2 bienes). La relación de preferencia lexicográfica continúa luego de esta manera en toda la lista de bienes.
c. Preferencias con saciedad: para esta relación de preferencias se supone que hay un paquete de consumo (x∗) que brinda completa
“dicha”. La clasificación de todos los demás conjuntos está determinada por lo cerca que están de x∗. Es decir, x1 Ɑ x2 si y sólo si
( x1i x1 ) x2i xx . . . xni xn .
x1 x∗ x2 x∗ donde xi x∗ 2
2
2
3.15 La función de beneficio
En un artículo publicado en 1992 David G. Luenberger presentó la que denominó la función de beneficio, como una manera de incorporar
cierto grado de medición cardinal en la teoría de la utilidad.11 El autor nos pide especificar cierto conjunto de bienes básicos y medir después cuántas repeticiones de este conjunto tendrían que ser proporcionadas a un individuo para aumentar el nivel de utilidad a un objetivo
particular. Supón que sólo hay dos bienes y que el objetivo de utilidad está dado por U∗(x, y). Supón también que el paquete de consumo
básico está dado por (x0, y0). Entonces el valor de la función de beneficio, b(U∗), es el valor de para el cual U(x0, y0) U∗.
a. Supón que la utilidad está dada por U(x, y) xy1. Calcule la función de beneficio para x0 y0 1.
b. Usando la función de utilidad del inciso a) calcula la función de beneficio para x0 1, y0 0. Explica por qué tus resultados difieren
de los del inciso a).
c. La función de beneficio también puede definirse cuando un individuo tiene dotaciones iniciales de ambos bienes. Si estas dotaciones
iniciales están dadas por x, y entonces b(U∗, x, y) está dada por el valor de que satisface la ecuación U(x x0, y y0) U∗. En esta
situación el “beneficio” puede ser positivo (cuando U(x, y) U∗) o negativo (cuando U(x, y) U∗). Desarrolla una descripción gráfica
de estas dos posibilidades y explica cómo la naturaleza del conjunto básico podría afectar el cálculo del beneficio.
d. Considera dos posibles dotaciones iniciales, x1, y1 y x2, y2. Explica gráficamente e intuitivamente por qué
x1 x 2 y 1 y2
,
) 0.5b U , x1 , y1 0.5b U , x2 , y2 . (Nota: esto demuestra que la función de beneficio es cóncava en las
b(U ,
2
2
dotaciones iniciales.)
Sugerencias de lecturas adicionales
Aleskerov, Fuad y Bernard Monjardet. Utility Maximization,
Choice, and Preference, Springer-Verlag, Berlín, 2002.
Kreps, David M. A Course in Microeconomic Theory, Princeton
University Press, Princeton, 1990.
Completo estudio de la teoría de la preferencia. Cubre varios modelos
de umbral y modelos de toma de decisiones “dependiente del contexto”.
El capítulo 1 cubre la teoría de la preferencia con cierto detalle. Buen
análisis de la cuasi concavidad.
Jehle, G. R. y P. J. Reny. Advanced Microeconomic Theory, 2a. ed.,
Addison Wesley/Longman, Boston, 2001.
Kreps, David M. Notes on the Theory of Choice, Westview Press,
Londres, 1988.
El capítulo 2 contiene una buena prueba de la existencia de funciones
de utilidad cuando se sostienen axiomas básicos de racionalidad.
Buen análisis de los fundamentos de la teoría de la preferencia. Mayormente la atención de este libro se dirige a la utilidad en situaciones
inciertas.
11
Luenberger, David G., “Benefit Functions and Duality”, Journal of Mathematical Economics, núm. 21, pp. 461-481. La presentación aquí se ha simplificado considerablemente en comparación con la presentada originalmente por el autor, sobre todo se cambió la dirección en la que se miden los “beneficios”.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
111
Mas-Colell, Andrea, Michael D. Whinston y Jerry R. Green.
Microeconomic Theory, Oxford University Press, Nueva York,
1995.
Stigler, G. “The Development of Utility Theory”, en Journal of Political Economy, núm. 59, pts. 1-2 (agosto/octubre de 1950),
pp. 307-327, 373-396.
Los capítulos 2 y 3 proporcionan un desarrollo detallado de relaciones
de preferencia y su representación con funciones de utilidad.
Estudio lúcido y completo de la historia de la teoría de la utilidad.
Contiene muchos discernimientos y complementos interesantes.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
EXTENSIONES
Preferencias especiales
El concepto de función de utilidad es general y puede adaptarse a
gran número de circunstancias especiales. El descubrimiento de
ingeniosas formas funcionales que reflejan los aspectos esenciales
de algún problema puede brindar varios discernimientos no evidentes de inmediato en un enfoque más literario. Aquí se estudiarán cuatro aspectos de las preferencias que los economistas han
tratado mediante el uso de modelos: a) efectos de umbral, 2) calidad, 3) hábitos y adicción y 4) preferencias de segunda parte. En
los capítulos 7 y 17 se ilustran maneras adicionales de recoger
aspectos de las preferencias.
A3.1 Efectos de umbral
El modelo de utilidad que se desarrolló en este capítulo implica que
un individuo siempre preferirá el conjunto de bienes A al conjunto
B, siempre y cuando U(A) U(B). Hay muchas situaciones que
harán que los individuos pasen rápidamente de consumir el conjunto A a consumir el B. En muchos casos, sin embargo, tal respuesta relámpago parece improbable. De hecho, los individuos
pueden “ser fieles a sus costumbres” y requerir un cambio más de
peso en las circunstancias para alterar lo que hacen. Por ejemplo,
los individuos pueden no tener una opinión muy firme sobre la
marca de pasta dental que eligen, y aferrarse a lo que conocen pese
a la proliferación de marcas nuevas (quizá mejores). De igual
modo, los individuos podrían aferrarse a su programa de televisión
favorito aun si este ha perdido calidad. Una forma de recoger ese
comportamiento es suponer que los individuos toman decisiones
como si enfrentaran principios de preferencia. En tal situación el
conjunto de mercancías A podría ser elegido sobre el B sólo cuando
U(A)
U(B) ,
(i)
donde es el principio de indiferencia por vencer. Con esta especificación las curvas de indiferencia pueden ser más bien gruesas
y hasta difusas, más que poseer las claras curvas de nivel que se
muestran en este capítulo. Los modelos del principio de indiferencia son de amplio uso en mercadotecnia. La teoría detrás de estos
modelos se presenta detalladamente en Aleskerov y Monjardet
(2002). Estos autores consideran varios modos de especificar el
principio de indiferencia para que pueda depender de las características de los conjuntos considerados o de otras variables contextuales.
Combustibles alternativos
Vedenov, Duffield y Wetzstein (2006) usan la idea del principio de
indiferencia para examinar las condiciones en las cuales los
individuos pasarán del uso de la gasolina al de otro tipo de com-
bustibles (principalmente etanol) para impulsar sus automóviles.
Estos autores señalan que en años recientes la desventaja más
importante de usar gasolina ha sido la excesiva volatilidad del precio del producto en relación con otros combustibles. Concluyen
que optar por mezclas con etanol es eficiente (en especial en
periodos de mayor volatilidad del precio de la gasolina), siempre
y cuando esas mezclas no hagan decrecer la eficiencia del combustible.
E3.2 Calidad
Puesto que muchos bienes de consumo difieren ampliamente en
calidad a los economistas les interesa incorporar esas diferencias
en los modelos de elección. Un método consiste simplemente en
considerar artículos de diferente calidad como bienes que son sustitutos relativamente cercanos. Sin embargo, este método puede
ser poco práctico a causa del gran número de bienes contenidos.
Otro método se centra en la calidad como elemento directo de
elección. La utilidad podría reflejarse en este caso por
utilidad U(q, Q),
(ii)
donde q es la cantidad consumida y Q la calidad de dicho consumo. Aunque este método permite cierto examen de la opción
calidad-cantidad, presenta dificultades cuando la cantidad consumida de una mercancía (vino, por ejemplo) consta de varias
calidades. La calidad podría definirse entonces como un promedio (véase Theil,1 1952), pero este enfoque quizá no sea apropiado cuando la calidad de bienes nuevos cambia rápidamente
(como en el caso de las computadoras personales). Un método
más general (originalmente propuesto por Lancaster, 1971) se
centra en un conjunto claramente definido de atributos de bienes
y supone que dichos atributos brindan utilidad. Si un bien q
brinda dos de esos atributos, a1 y a2, la utilidad podría escribirse
como 12
utilidad U[q, a1(q), a2(q)],
(iii)
y podrían emerger mejoras de utilidad, sea porque la persona
elige una mayor cantidad del bien o porque una cantidad dada
rinde un nivel mayor de atributos valiosos.
Computadoras personales
Esta es la práctica que siguen los economistas que estudian la
demanda en industrias tan rápidamente cambiantes como la de
1
Theil sugiere asimismo medir la calidad considerando correlaciones entre
cambios en el consumo y las elasticidades de ingreso de varios bienes.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 3: Preferencias y utilidad
las computadoras personales. En este caso sería evidentemente
incorrecto centrarse sólo en la cantidad de computadoras personales adquiridas cada año porque las máquinas nuevas son mucho
mejores que las viejas (y, presumiblemente, ofrecen más utilidad).
Por ejemplo, Berndt, Griliches y Rappaport (1995) descubrieron
que la calidad de las computadoras personales ha aumentado
anualmente 30 por ciento en un periodo relativamente largo, a
causa sobre todo de atributos perfeccionados, como procesadores
más rápidos o mejores discos duros. Un consumidor que hoy gasta,
digamos, 2 000 dólares en una computadora personal compra
mucho más utilidad que un consumidor semejante 5 años atrás.
(2001) indican que el tabaquismo puede abordarse como una
elección racional, aunque inconsistente en el tiempo.2 13
E3.4 Preferencias de segundas partes
Es obvio que a los individuos les importa el bienestar de los demás.
Fenómenos como hacer contribuciones de beneficencia o dejar
herencias a los niños no pueden entenderse sin reconocer la interdependencia que existe entre las personas. Las preferencias de
segundas partes pueden incorporarse a la función de utilidad de la
persona i, digamos, con
utilidad Ui(xi, yi, Uj),
E3.3 Hábitos y adicción
Dado que el consumo ocurre en el tiempo, existe la posibilidad de
que las decisiones tomadas en un periodo afecten la utilidad en
periodos posteriores. Los hábitos se forman cuando los individuos descubren que les gusta usar una mercancía durante un
periodo, lo cual aumenta su consumo en periodos subsecuentes.
Un caso extremo es la adicción (a las drogas, los cigarros o las
películas de los hermanos Marx), donde el consumo pasado
aumenta significativamente la utilidad del consumo presente. Una
manera de describir matemáticamente estas ideas es suponer que
la utilidad en el periodo t depende del consumo en el periodo t y
del total del consumo previo del bien que ha formado el hábito
(digamos X):
utilidad Ut(xt, yt, st),
(iv)
113
(vi)
donde Uj es la utilidad de otro.
Si Ui/Uj 0 entonces esta persona adoptará una conducta
altruista, mientras que si Ui/Uj 0, mostrará el comportamiento malévolo asociado a la envidia. El caso usual de Ui/Uj 0
es simplemente un punto medio entre las alternativas en las preferencias. Gary Becker es pionero en el estudio de estas posibilidades y ha escrito sobre varios temas, tales como la teoría general de
las interacciones sociales (1976) y la importancia del altruismo en
la teoría de la familia (1981).
Biología evolutiva y genética
Los biólogos han sugerido una forma particular de la función de
utilidad en la ecuación vi, extraída de la teoría de la genética. En
este caso
donde
utilidad Ui ( xi , yi) rj Uj ,
(vii)
j
st xt i .
i1
En aplicaciones empíricas, sin embargo, usualmente no existen
datos sobre todos los niveles de consumo anteriores. Así, es
común elaborar modelos sobre los hábitos usando sólo datos del
consumo corriente (xt) y del consumo en el periodo previo (xt1).
Una forma común de proceder es suponer que la utilidad está
dada por
utilidad Ut(x∗t , yt),
(v)
donde x∗t es una función simple de xt y xt1, como en x∗t xt xt1 o x∗t xt/xt1. Estas funciones implican que, ceteris paribus, cuanto mayor sea xt1, se elegirá más xt en el periodo
corriente.
Modelización de hábitos
Estos enfoques de la modelización de hábitos se han aplicado a
una amplia variedad de temas. Stigler y Becker (1977) usan modelos de ese tipo para explicar por qué las personas desarrollan un
“gusto” por ir a la ópera o por jugar golf. Becker, Grossman y Murphy (1994) adaptan esos modelos al estudio del consumo de cigarros y otras conductas adictivas. Ellos han demostrado que la disminución en el consumo de tabaco a temprana edad puede tener
grandes efectos sobre el consumo final de cigarrillos debido a la
dinámica de las funciones de utilidad de los individuos. Si el comportamiento adictivo es “racional” o no, es un tema ampliamente
estudiado por los economistas. Por ejemplo, Gruber y Koszegi
donde rj mide la cercanía de la relación genética entre la persona i
y la persona j. En cuanto a padres e hijos, por ejemplo, rj 0.5,
mientras que en cuanto a primos rj 0.125. Bergstrom (1996)
describe algunas de las conclusiones de la conducta evolutiva a las
cuales han llegado los biólogos mediante esta forma funcional
particular.
Referencias
Aleskerov, Fuad y Bernard Monjardet. Utility Maximization,
Choice, and Preference, Springer-Verlag, Berlín, 2002.
Becker, Gary S. The Economic Approach to Human Behavior, University of Chicago Press, Chicago, 1976.
Becker, Gary S., Michael Grossman y Kevin M. Murphy. “An
Empirical Analysis of Cigarette Addiction”, American Economic Review (junio de 1994), pp. 396-418.
Bergstrom Theodore C. “Economics in a Family Way”, Journal of
Economic Literature (diciembre de 1994), pp. 1903-1934.
Berndt, Ernst R., Zvi Griliches y Neal J. Rappaport. “Econometric
Estimates of Price Indexes for Personal Computers in the
1990s”, Journal of Econometrics (julio de 1995), pp. 243-268.
Gruber, Jonathan y Botond Koszegi. “Is Addiction ‘Rational’?
Theory and Evidence”, Quarterly Journal of Economics
(noviembre de 2001), pp. 1261-1303.
2
Para más información sobre la inconsistencia en el tiempo, véase el capítulo 17.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
114
Parte 2: Elección y demanda
Lancaster, Kelvin J. Consumer Demand: A New Approach, Columbia University Press, Nueva York, 1971.
Stigler, George J. y Gary S. Becker. “De Gustibus Non Est Disputandum”, American Economic Review (marzo de 1977), pp.
76-90.
Theil, Henri. “Qualities, Prices, and Budget Enquiries”, Review of
Economic Studies (abril de 1952), pp. 129-147.
Vedenov, Dmitry V., James A. Duffield y Michael E. Wetzstein.
“Entry of Alternative Fuels in a Volatile U. S. Gasoline Market”, Journal of Agricultural and Resource Economics (abril de
2006), pp. 1-13.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
CUATRO
Optimización de la utilidad
y elección
En este capítulo se examinará el modelo básico de elección que usan los economistas para explicar
el comportamiento de los individuos. Este modelo supone que los individuos se ven restringidos
por lo limitado de sus ingresos usando su capacidad de poder de compra para alcanzar la máxima
utilidad posible. Es decir, se supone que los individuos actúan como si maximizaran la utilidad
sujetos a una restricción presupues
cas de este modelo son
variadas, como lo demostraremos, todas se basan en el mismo modelo matemático fundamental
y todas llegan a la misma conclusión general: para optimizar la utilidad los individuos elegirán
conjuntos de bienes cuya tasa marginal de sustitución (TMS) es igual a la razón de precios en el
mercado de bienes. Los precios de mercado dan información a los individuos sobre costos de
oportunidad y esta información desempeña un papel importante en el sentido de que afecta las
decisiones realmente tomadas.
Optimización de la utilidad y cálculos relámpago
Antes de iniciar el estudio formal de la teoría de la elección sería apropiado eliminar dos quejas
que los no economistas suelen plantear sobre el enfoque que adoptaremos. Primero está el reclamo
de que ninguna persona real puede hacer la clase de “cálculos relámpago” que requiere la maximización de la utilidad. De acuerdo con esta queja, al recorrer el pasillo de un supermercado la gente
sencillamente toma lo que está disponible sin ningún patrón o propósito real en sus acciones.
toria (cada persona, después de todo, está sujeta a algún tipo de restricción presupuestal) y consideran equivocada la acusación sobre los cálculos relámpago. Recordemos de nueva cuenta al
jugador de billar de Friedman que se menciona en el capítulo 1. Tampoco este jugador puede
hacer los cálculos relámpago que se requieren para planear un tiro de acuerdo con las leyes de la
física, pese a lo cual dichas leyes no dejan de predecir el comportamiento del jugador. De igual
forma, como veremos, el modelo de optimización de la utilidad predice muchos aspectos del
comportamiento aunque nadie lleve integrada una computadora ni tenga programada en ella su
función de utilidad. Para ser precisos, los economistas suponen que los individuos se comportan
como si hicieran tales cálculos; así, el argumento de que es imposible realizar esos cálculos es en
gran medida irrelevante. De cualquier modo, en tiempos recientes los economistas han tratado
cada vez más de modelizar algunas de las complicaciones conductuales que surgen en las decisiones reales que toman los individuos. Estudiaremos algunas de esas complejidades en diversos
problemas de este libro.
Altruismo y egoísmo
El segundo reclamo en contra de nuestro modelo de elección es que parece extremadamente
egoísta; nadie, según esta queja, tiene objetivos tan exclusivamente egocéntricos. Pese a que pro117
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
118 Parte 2: Elección y demanda
bablemente los economistas están dispuestos a aceptar el interés propio como una fuerza motivadora más que otros pensadores más utópicos (Adam Smith observó: “No nos inclinamos a sospechar que alguien padezca deficiencia de egoísmo”),1 esta acusación también es errónea. Nada en
el modelo de optimización de la utilidad impide a los individuos derivar satisfacción de la filantropía, o de “hacer el bien” en general. También es posible suponer que estas actividades ofrecen
utilidad. En efecto, los economistas han aplicado extensamente el modelo de optimización de
la utilidad para estudiar asuntos como las donaciones de tiempo y dinero a la beneficencia, dejar
legados a niños o, incluso, donar sangre. Uno no necesita asumir una posición acerca de si tales
actividades son egoístas o desinteresadas, porque los economistas dudan de que los individuos las
emprenderían si fueran contrarias a sus mejores intereses, ampliamente concebidos.
SONDEO INICIAL
Los resultados generales de nuestro examen de la optimización de la utilidad pueden enunciarse
sucintamente como sigue.
PRINCIPIO DE
OPTIMIZACIÓN
Optimización de la utilidad. Para optimizar la utilidad, dado un ingreso fijo para gastar, un individuo
comprará las cantidades de bienes que agoten su ingreso total y para las cuales la tasa marginal de sustitución entre dos bienes cualesquiera (TMS) es igual a la tasa en la cual los bienes pueden intercambiarse
entre sí en el mercado.
Obviamente, para la optimización de la utilidad se requiere gastar todo el ingreso individual.
Dado que los bienes adicionales brindan utilidad adicional (no hay saciedad), y dado que no
existe ningún otro uso para el ingreso, dejar una parte sin gastar impide optimizar la utilidad. Sin
embargo, derrochar el dinero no es una actividad optimizadora de la utilidad.
La condición que especifica la igualdad de la tasa marginal de sustitución requiere un poco
más de explicación. Puesto que la tasa a la que un bien puede ser intercambiado por otro en el
mercado está dada por la razón de los precios de ambos; este resultado puede reformularse
diciendo que el individuo igualará la TMS (de x por y) con la razón del precio de x respecto al
precio de y (px /py). Esta igualación de una tasa marginal de sustitución personal con una razón de
precio determinada por el mercado es un resultado común a todos los problemas de optimización
de la utilidad individual (y a muchos otros tipos de problemas de optimización). Lo cual ocurrirá
una y otra vez en este texto.
Ilustración numérica
Para ver el razonamiento intuitivo detrás de este resultado supongamos que no es real que un
individuo iguala la TMS con la razón de los precios de los bienes; específicamente, que la TMS
del individuo es igual a 1 y que está dispuesto a intercambiar 1 unidad de x por 1 unidad de y, y
permanecer en condiciones igualmente buenas. Supongamos, asimismo, que el precio de x es de
2 dólares por unidad y el de y de 1 dólar por unidad. Es fácil demostrar que esta persona podría
estar en mejores condiciones. Supongamos que reduce el consumo de x en 1 unidad y que la intercambia en el mercado por 2 unidades de y. Sólo 1 unidad adicional de y sería necesaria para
mantener a esta persona tan satisfecha como antes del intercambio; la segunda unidad de y es una
adición neta al bienestar. Así, el gasto de este individuo no podría haberse distribuido óptimamente en primer término. Cada vez que la TMS y la razón de precio px /py difieran puede usarse
un método similar de razonamiento. La condición para una utilidad óptima debe ser la igualdad
de estas dos magnitudes.
1
Adam Smith, The Theory of Moral Sentiments (1759, reimpresión, Arlington House, New Rochelle, Nueva York, 1969), p. 446.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
119
EL CASO DE DOS BIENES:
ANÁLISIS GRÁFICO
Esta argumentación parece eminentemente razonable, pero apenas si podría llamársele prueba.
Más bien, ahora debemos demostrar el resultado en forma rigurosa y, al mismo tiempo, ilustrar
otros importantes atributos del proceso de optimización. Primero realizaremos un análisis gráfico; luego adoptaremos un enfoque más matemático.
Restricción presupuestal
Supongamos que el individuo tiene I dólares por distribuir entre el bien x y el bien y. Si px es el
precio del bien x y py el precio del bien y, el individuo está restringido por
px x pyy
(4.1)
I.
Es decir, en los dos bienes en cuestión no es posible gastar más de I. Esta restricción presupuestal
se muestra gráficamente en la figura 4.1. Esta persona sólo puede permitirse elegir combinaciones
de x y y en el triángulo sombreado de la figura. Si todo I se gasta en el bien x, esto comprará I/px
unidades de x. De igual manera, si todo se gasta en y, esto comprará I/py unidades de y. Es fácil
ver que la pendiente de la restricción es px /py. Esta pendiente muestra cómo puede intercambiarse y por x en el mercado. Si px 2 y py 1, entonces 2 unidades de y se intercambiarán por 1
unidad de x.
FIGURA 4.1
Restricción presupuestal
del individuo para dos
bienes.
Las combinaciones de x y y que el individuo se puede permitir aparecen dentro del triángulo sombreado. Si,
como suele suponerse, el individuo prefiere más que menos de cada bien, el límite exterior de este triángulo
es la restricción relevante donde todos los fondos disponibles se gastan en x o y. La pendiente de este límite
en línea recta está dada por px/py.
Cantidad
de y
I
py
I = px x + p y y
0
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
I
px
23.08.2019
Cantidad de x
8/23
120
Parte 2: Elección y demanda
Condiciones de primer orden para un óptimo
Esta restricción presupuestal puede imponerse al mapa de curvas de indiferencia del individuo
para mostrar el proceso de optimización de la utilidad. La figura 4.2 ilustra este procedimiento. El
individuo sería irracional si eligiera un punto como A; con sólo gastar más de su ingreso puede
llegar a un nivel de utilidad más alto. El supuesto de no saciedad implica que una persona debe
gastar la totalidad de su ingreso para recibir una utilidad máxima. De igual forma, reasignando
los gastos el individuo puede estar mejor que en el punto B. El punto D está fuera de cuestión
porque el ingreso no es lo bastante grande para adquirir D. Resulta claro que la posición de óptima
utilidad es el punto C, donde se elige la combinación x∗, y∗. Este es el único punto en la curva de
indiferencia U2 que puede comprarse con I dólares; no es posible comprar ningún nivel de utilidad más alto. C es un punto de tangencia entre la restricción presupuestal y la curva de indiferencia. Así, en C tenemos
p
pendiente de la restricción presupuestal p x pendiente de la curva de indiferencia
y
dy
dx
(4.2)
U constante
o
px
py
FIGURA 4.2
Demostración gráfica de
la optimización de la
utilidad.
dy
dx
U constante
TMS (de x por y)
(4.3)
Dada la restricción presupuestal el punto C representa el nivel de utilidad más alto que el individuo puede
alcanzar. Así, la combinación x∗, y∗ es la forma racional en la cual el individuo debe asignar su poder
de compra. Sólo para esta combinación de bienes se mantendrán dos condiciones: todos los fondos disponibles se gastarán y la la tasa marginal de sustitución (TMS) será igual a la razón de precios a la cual los
bienes pueden intercambiarse en el mercado (px /py).
Cantidad
de y
U1 U2 U3
B
D
C
y*
I = px x + p y y
A
U3
U1
0
x*
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
U2
Cantidad de x
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
FIGURA 4.3
Ejemplo de mapa de
curvas de indiferencia en
el que la condición de
tangencia no garantiza
un óptimo.
121
Si las curvas de indiferencia no obedecen el supuesto de la TMS decreciente, no todos los puntos de tangencia
(puntos para los que TMS px /py) pueden ser verdaderamente puntos de óptima utilidad En este ejemplo
el punto de tangencia C es inferior a muchos otros puntos que también pueden adquirirse con los fondos
disponibles. A fin de que las condiciones necesarias para un óptimo (es decir, las condiciones de tangencia)
sean también suficientes, suele suponerse que la TMS es decreciente; esto es, que la función de utilidad es
estrictamente cuasi cóncava.
Cantidad
de y
U1
U2
U3
A
I = px x + p y y
C
U3
B
U2
U1
Cantidad de x
Nuestro resultado intuitivo ha quedado comprobado: para un óptimo de utilidad todo el ingreso
debe gastarse, y la TMS debe ser igual a la razón de los precios de los bienes. Del diagrama se
desprende claramente que, si esta condición no se cumple, el individuo podría estar mejor reasignando sus gastos.
Condiciones de segundo orden para un óptimo
La regla de tangencia es sólo una condición necesaria para un óptimo. Para ver que no es una
condición suficiente, consideremos el mapa de curvas de indiferencia que aparece en la figura 4.3.
Aquí, un punto de tangencia (C) es inferior a un punto de no tangencia (B). En efecto, el óptimo
verdadero está en otro punto de tangencia (A). El hecho de que la condición de tangencia no
produzca un óptimo inequívoco puede atribuirse a la forma de las curvas de indiferencia en la
figura 4.3. Si las curvas de indiferencia tuvieran la forma de aquellas de la figura 4.2, este problema
no emergería. Pero ya se ha demostrado que las curvas de indiferencia de forma “normal” resultan del supuesto de la TMS decreciente. Así, si se supone que la TMS siempre es decreciente, la
condición de tangencia es tanto necesaria como suficiente para un óptimo.2 Sin este supuesto
habría que tener cuidado al aplicar la regla de tangencia.
2
Como se vio en los capítulos 2 y 3, esto equivale a suponer que la función de utilidad es cuasi cóncava. Puesto que usualmente
supondremos cuasi concavidad, las condiciones necesarias para un óptimo de utilidad restringida también serán suficientes.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
122
Parte 2: Elección y demanda
FIGURA 4.4
Solución de esquina de
optimización de la utilidad.
Con las preferencias que muestra este conjunto de curvas de indiferencia, la optimización de utilidad ocurre
en E, donde se consumen 0 cantidades del bien y. Las condiciones de primer orden para un óptimo deben
modificarse un poco para dar cabida a esta posibilidad.
Cantidad
de y
U1
U2
U3
E
x*
Cantidad de x
Soluciones de esquina
El problema de optimización de utilidad que se ilustra en la figura 4.2 resulta en un óptimo “interior”, en el que se consumen cantidades positivas de ambos bienes. En algunas situaciones las
preferencias de los individuos pueden ser tales que logran obtener un óptimo de utilidad decidiendo no consumir ninguna cantidad de ninguno de los bienes. Si a alguien no le gustan las
hamburguesas, no hay razón para asignar ningún ingreso a su compra. Esta posibilidad se refleja
en la figura 4.4. Aquí la utilidad se maximiza en E, donde x x∗ y y 0; así, cualquier punto en
la restricción presupuestal en el que se consumen cantidades positivas de y produce menor utilidad que el punto E. Nótese que en E la restricción presupuestal no es precisamente tangente a la
curva de indiferencia U2. En cambio, en el punto óptimo la restricción presupuestal es más plana
que U2, lo que indica que la tasa a la que x puede intercambiarse por y en el mercado es menor que
la tasa marginal de sustitución del individuo (la TMS). A los precios de mercado prevalecientes,
el individuo está más que dispuesto a intercambiar y para obtener x extra. Como en este problema
es imposible consumir cantidades negativas de y, sin embargo, el límite físico de este proceso es el
eje X, a lo largo del cual las compras de y son 0. De ahí que, como se desprende claramente de este
análisis, sea necesario enmendar un poco las condiciones de primer orden para un óptimo de
utilidad a fin de permitir soluciones de esquina del tipo que se muestra en la figura 4.4. Al continuar con nuestro estudio del caso general de n bienes usaremos las matemáticas del capítulo 2
para mostrar cómo puede cumplirse esto.
EL CASO DE n BIENES
Los resultados gráficamente derivados en el caso de dos bienes se trasladan directamente al caso
de n bienes. De nueva cuenta es posible demostrar que para un óptimo interior de utilidad, la
TMS entre dos bienes cualesquiera debe ser igual a la razón de los precios de estos bienes. Para
estudiar este caso más general, sin embargo, es mejor usar algunas matemáticas.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
123
Condiciones de primer orden
Con n bienes el objetivo del individuo es optimizar la utilidad de los mismos:
utilidad U(x1, x2, . . . , xn),
(4.4)
sujeta a la restricción presupuestal3
I p1x1 p2x2 . . . pnxn
(4.5)
I p1x1 p2x2 . . . pnxn 0.
(4.6)
o
Siguiendo las técnicas que se desarrollan en el capítulo 2 para optimizar una función sujeta a una
restricción establecemos la expresión de Lagrange
ᏸ U(x1, x2, . . . , xn) (I p1x1 p2x2 . . . pnxn).
(4.7)
Igualar a 0 las derivadas parciales de ᏸ (respecto a x1, x2, . . . , xn y ) produce n 1 ecuaciones
que representan las condiciones necesarias para un óptimo interior:
ᏸ U
p1 0,
x1 x1
ᏸ U
p2 0,
x2 x2
..
.
ᏸ U
pn 0,
xn xn
ᏸ
I p1 x1 p2 x2
(4.8)
pn xn 0.
En estas n 1 ecuaciones es posible, en principio, despejar las x1, x2, . . . , xn óptimas y (véanse
los ejemplos 4.1 y 4.2 para comprobar que tal solución es posible).
Las ecuaciones 4.8 son necesarias pero no suficientes para un óptimo. Las condiciones de
segundo orden que garantizan un óptimo son relativamente complejas y deben enunciarse en
términos matriciales (véanse las extensiones del capítulo 2). Sin embargo, el supuesto de estricta
cuasi concavidad (TMS decreciente en el caso de dos bienes) es suficiente para garantizar que
cualquier punto que obedezca la ecuación 4.8 es, de hecho, un óptimo verdadero.
Implicaciones de las condiciones de primer orden
Las condiciones de primer orden representadas por la ecuación 4.8 pueden reescribirse en varias
formas instructivas. Por ejemplo, para dos bienes cualesquiera xi y xj tenemos
U/ xi pi
.
U/ xj pj
(4.9)
En el capítulo 3 se demostró que la razón de las utilidades marginales de dos bienes es igual a la
tasa marginal de sustitución entre ellos. Así, las condiciones para una distribución óptima del
ingreso se convierten en
TMS (xi por xj) 3
pi
.
pj
(4.10)
De nuevo, la restricción presupuestal se ha escrito en una igualdad, ya que dado el supuesto de no saciedad resulta claro que el
individuo gastará todo el ingreso disponible.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
124
Parte 2: Elección y demanda
Este es justo el resultado ya gráficamente derivado en este capítulo; para optimizar la utilidad el
individuo debe igualar la tasa marginal de sustitución con la razón de precios del mercado.
Interpretación del multiplicador de Lagrange
Otro resultado puede derivarse despejando en las ecuaciones 4.8:
U/ x1 U/ x2
p1
p2
U/ xn
pn
(4.11)
Estas ecuaciones establecen que en el punto de optimización de la utilidad cada bien adquirido
debe producir la misma utilidad marginal por cada dólar que se haya gastado en el mismo. Así,
cada bien debe tener una razón costo (marginal)-beneficio (marginal) idéntica. De no ser así un
bien prometería más “disfrute marginal por dólar” que cualquier otro y los fondos no se distribuirían óptimamente.
Aunque se le advierte nuevamente al lector en contra de hablar confiadamente de utilidad
marginal, lo que la ecuación 4.11 indica es que un dólar extra debe producir la misma “utilidad adicional” sea cual sea el bien en que se gaste. El valor común de esta utilidad adicional
está dado por el multiplicador de Lagrange para la restricción presupuestal del consumidor (es
decir, por ). En consecuencia, puede considerarse como la utilidad marginal de un dólar adicional de gasto de consumo (la utilidad marginal del “ingreso”).
Una última manera de reescribir las condiciones necesarias para un óptimo es
pi U/ xi
(4.12)
para cada bien i adquirido. Para interpretar esta expresión, recordemos (de la ecuación 4.11) que
el multiplicador de Lagrange, , representa el valor de la utilidad marginal de un dólar adicional
de ingreso, sin importar dónde se gaste. Así, la razón en la ecuación 4.12 compara el valor de la
utilidad adicional de una unidad más del bien i con este valor común de un dólar marginal en el
gasto. Para ser adquirido, el valor de la utilidad de una unidad adicional de un bien debe ser equivalente en términos de dólares al precio que la persona debe pagar por él. Por ejemplo, un precio
alto del bien i sólo puede justificarse si también brinda gran cantidad de utilidad adicional. En el
margen, por tanto, el precio de un bien refleja la disposición de un individuo a pagar una unidad
más. Este es un resultado de importancia en la economía aplicada del bienestar porque la disposición a pagar puede inferirse de las reacciones del mercado ante los precios. En el capítulo 5 se
verá cómo este discernimiento puede usarse para evaluar los efectos de bienestar de los cambios
de precio, y en capítulos posteriores se usará esta idea para analizar diversas cuestiones sobre la
eficiencia de la asignación de recursos.
Soluciones de esquina
Las condiciones de primer orden de las ecuaciones 4.8 se mantienen exactamente sólo para los
óptimos interiores para los cuales se adquiere alguna cantidad positiva de cada bien. Como se
explicó en el capítulo 2, cuando aparecen soluciones de esquina (como las ilustradas en la figura
4.4), las condiciones deben modificarse ligeramente.4 En este caso, las ecuaciones 4.8 se convierten en
ᏸ U
xi xi
4
pi
0 (i 1, . . . , n)
Formalmente, estas condiciones se llaman condiciones de Kuhn-Tucker para programación no lineal.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(4.13)
8/23
Capítulo 4: Optimización de la utilidad y elección
125
y si
ᏸ U
xi xi
pi 0,
(4.14)
entonces
xi 0.
(4.15)
Para interpretar estas condiciones la ecuación 4.14 puede reescribirse como
U/ xi
.
pi
(4.16)
De ahí que las condiciones óptimas sean las que ya hemos señalado, excepto que cualquier bien
cuyo precio (pi) exceda su valor marginal para el consumidor no será adquirido (xi 0). Así, los
resultados matemáticos se ajustan a la idea común de que los individuos no adquirirán bienes por
los cuales no creen que valga su dinero. Aunque el análisis en este libro no se concentra en las
soluciones de esquina, el lector debe considerar tanto las posibilidades de que tales soluciones
emerjan como la interpretación económica que puede hacerse de las condiciones óptimas en esos
casos.
EJEMPLO 4.1 Funciones de demanda Cobb-Douglas
Como se demostró en el capítulo 3, la función Cobb-Douglas está dada por
U(x, y) xy,
(4.17)
donde, por conveniencia,5 se supone que 1. Ahora es posible despejar los valores de optimización de utilidad de x y y para cualquier precio (px, py) e ingreso (I). Establecer la expresión lagrangiana
ᏸ xy (I pxx pyy)
(4.18)
produce las condiciones de primer orden
ᏸ
x 1 y px 0,
x
ᏸ
x y 1 py 0,
y
ᏸ
I px x py y 0.
(4.19)
Tomar la razón de los dos primeros términos indica que
y px
,
x py
(4.20)
1 py y px x p x,
x
(4.21)
o
de donde se desprende la última ecuación, ya que 1. La sustitución de esta condición de primer
orden de la ecuación 4.21 en la restricción presupuestal da
I px x py y px x 1
px x px x 1 1
1
p x;
x
(4.22)
5
Como se explicó en el capítulo 3, los exponentes en la función de utilidad Cobb-Douglas siempre pueden normalizarse para que
sumen 1 porque U1/( ) es una transformación monótona.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
126
Parte 2: Elección y demanda
despejar x produce
x∗ I
,
px
(4.23)
y∗ I
.
py
(4.24)
y una serie similar de manipulaciones daría
Estos resultados indican que un individuo cuya función de utilidad está dada por la ecuación 4.17, optará
siempre por distribuir proporción de su ingreso a comprar el bien x (es decir, px x/I ) y proporción
a comprar el bien y (pyy/I ). Aunque esta característica de la función Cobb-Douglas suele facilitar la
resolución de problemas simples, sugiere que esta función tiene límites en su capacidad para explicar el
comportamiento real de consumo. Como la parte del ingreso dedicada a bienes particulares suele cambiar significativamente en respuesta a las condiciones económicas cambiantes, un modo funcional más
general puede ofrecer discernimientos no aportados por la función Cobb-Douglas. Ilustraremos algunas
posibilidades en el ejemplo 4.2, mientras que el tema general de las porciones presupuestales se abordará
con mayor detalle en las extensiones de este capítulo.
Ejemplo numérico. Primero, sin embargo, examinemos un ejemplo numérico específico del caso
Cobb-Douglas. Supongamos que x se vende a 1 dólar y y a 4 dólares, y que el ingreso total es de 8 dólares.
Supongamos entonces, sucintamente, que px 1, py 4, I 8; asimismo, que 0.5, de tal manera
que esta persona divide su ingreso equitativamente entre estos dos bienes. Ahora, las ecuaciones de
demanda 4.23 y 4.24 implican que
x∗ I/px 0.5I/px 0.5(8)/1 4,
y∗ I/py 0.5I/py 0.5(8)/4 1.
(4.25)
y, en estas elecciones óptimas,
utilidad x0.5y0.5 (4)0.5(1)0.5 2.
(4.26)
Obsérvese asimismo que se puede calcular el valor del multiplicador de Lagrange asociado con esta asignación del ingreso, usando la ecuación 4.19:
x1y/px 0.5(4)0.5(1)0.5/1 0.25.
(4.27)
Este valor implica que cada variación en el ingreso incrementará la utilidad en aproximadamente
un cuarto de esa cantidad. Supongamos, por ejemplo, que esta persona 1 por ciento más ingreso ($8.08).
En este caso elegiría x 4.04 y y 1.01, y la utilidad sería 4.040.5 . 1.010.5 2.02. De ahí que un incremento de $0.08 en el ingreso aumente la utilidad en 0.02, tal como lo predijo el hecho de que 0.25.
PREGUNTA: ¿Afectaría un cambio en py en la cantidad de x demandada en la ecuación 4.23? Explica tu
respuesta matemáticamente. Desarrolla también una explicación intuitiva basada en la noción de que la
parte del ingreso dedicada al bien y está dada por el parámetro de la función de utilidad, .
EJEMPLO 4.2 Demanda ESC
Examinemos tres ejemplos específicos de la función ESC para ilustrar casos en los que las porciones
presupuestales responden a las circunstancias económicas.
Caso 1: ␦ ⴝ 0.5. En este caso, la utilidad es
U(x, y) x0.5 y0.5.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(4.28)
8/23
Capítulo 4: Optimización de la utilidad y elección
127
Establecer la expresión lagrangiana
ᏸ x0.5 y0.5 (I px x pyy)
(4.29)
produce las siguientes condiciones de primer orden para un óptimo:
ᏸ/x 0.5x0.5 px 0,
ᏸ/y 0.5y0.5 py 0,
(4.30)
ᏸ/ I px x pyy 0.
La división de las dos primeras muestra que
(y/x)0.5 px /py.
(4.31)
Al sustituir esto en la restricción presupuestal y mediante una manipulación algebraica un poco complicada podemos derivar las funciones de demanda asociadas con esta función de utilidad:
x∗ I/px [1 (px /py)],
(4.32)
y∗ I/py [1 (px /py)].
(4.33)
Sensibilidad ante la variación en los precios. En estas funciones de demanda nótese que la parte
del ingreso gastada en, digamos, el bien x —es decir, px x/I 1/[1 (px/py)]— no es una constante;
depende de la razón del precio px /py. Cuanto mayor sea el precio relativo de x menor será la parte del
ingreso gastada en ese bien. En otras palabras, la demanda de x es tan sensible a su propio precio que un
aumento en este reduce el gasto total en x. También puede ilustrarse que la demanda de x es sensible al
precio, comparando el exponente contenido en px en la función de demanda dada por la ecuación 4.32
(2) con el exponente de la ecuación 4.23 (1). En el capítulo 5 se analizará con mayor profundidad esta
observación al examinar en detalle el concepto de elasticidad.
Caso 2: ␦ ⴝ ⴚ1. Examinemos de manera alterna una función de demanda con menos sustituibilidad6
que la Cobb-Douglas. Si 1, la función de utilidad está dada por
U(x, y) x1 y1,
(4.34)
y es fácil demostrar que las condiciones de primer orden para un óptimo requieren
y/x (px /py)0.5.
(4.35)
Nuevamente, la sustitución de esta condición en la restricción presupuestal, junto con un poco de álgebra
algo complicada, produce las funciones de demanda
x∗ I/px [1 (py /px)0.5],
y∗ I/py [1 (px /py)0.5].
(4.36)
Que estas funciones de demanda son menos sensibles al precio puede verse de dos maneras. Primero:
ahora la parte del ingreso que se gastó en el bien x —esto es, px x/I 1/[1 (py /px)0.5]— responde positivamente a incrementos en px. Al aumentar el precio de x este individuo reduce sólo modestamente su
consumo del bien x; así, el gasto total en ese bien se incrementa. Que las funciones de demanda en la
ecuación 4.36 son menos sensibles al precio que las de la función Cobb-Douglas también se ilustra
mediante los relativamente reducidos exponentes implicados del precio de cada bien (0.5).
6
Una manera de medir la sustituibilidad es con la elasticidad de sustitución, la cual para la función ESC está dada por 1/
(1 ). Aquí, 0.5 implica que 2, 0 (la función Cobb-Douglas) implica que 1, y 1 implica que 0.5.
Véase también el análisis de la función ESC en relación con la teoría de la producción en el capítulo 9.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
128
Parte 2: Elección y demanda
Caso 3: ␦ ⴝ ⴚⴥ. Este es el importante caso en el que x y y deben consumirse en proporciones fijas.
Supongamos, por ejemplo, que cada unidad de y debe ser consumida junto con exactamente 4 unidades
de x. La función de utilidad que representa esta situación es
U(x, y) min (x, 4y).
(4.37)
En esta situación para optimizar la utilidad un individuo sólo elegirá combinaciones de ambos bienes para
las cuales x 4y; es decir, la optimización de utilidad implica que esta persona elegirá estar en un vértice
de sus curvas de indiferencia en forma de L. Debido a la forma de estas curvas de indiferencia para resolver este problema no se puede usar el cálculo. En cambio, sí es posible adoptar el procedimiento simple
de sustituir directamente la condición de optimización de la utilidad en la restricción presupuestal:
I px x py y px x py
x
( px 0.25py )x.
4
(4.38)
De ahí que
x I
,
px 0.25py
(4.39)
I
.
4px py
(4.40)
y sustituciones similares, producen
y En este caso la porción del presupuesto de una persona dedicada a, digamos, el bien x aumenta rápidamente al incrementarse el precio de x porque x y y deben consumirse en proporciones fijas. Por ejemplo,
si se usan los valores supuestos en el ejemplo 4.1 (px 1, py 4, I 8), las ecuaciones 4.39 y 4.40 predecirían x∗ 4, y∗ 1 y, como antes, la mitad del ingreso del individuo se gastará en cada bien. Si usamos,
en cambio, px 2, py 4 e I 8, entonces x∗ 8/3, y∗ 2/3 y esta persona gasta dos tercios [px x/I (2 . 8/3)/8 2/3] de su ingreso en el bien x. Probar otros números sugiere que la parte del ingreso dedicada al bien x se aproxima a 1 al aumentar el precio de x.7
PREGUNTA: ¿Los cambios en el ingreso afectan las porciones de gasto en alguna de las funciones ESC
que hemos analizado aquí? ¿Qué relación existe entre el comportamiento de las porciones de gasto y la
naturaleza homotética de esta función?
FUNCIÓN DE UTILIDAD INDIRECTA
Los ejemplos 4.1 y 4.2 ilustran el principio de que a menudo es posible manipular las condiciones
de primer orden para un problema de optimización de utilidad restringida a fin de despejar los
valores óptimos de x1, x2, . . . , xn. Estos valores óptimos dependerán en general de los precios de
todos los bienes y del ingreso del individuo. Esto es,
x1 x1 ( p1 , p2 , . . . , pn , I),
x2 x2 ( p1 , p2 , . . . , pn , I),
..
.
(4.41)
xn xn ( p1 , p2 , . . . , pn , I):
En el capítulo siguiente se analiza con mayor detalle este conjunto de funciones de demanda que
muestra la dependencia de la cantidad de cada xi demandada respecto a p1, p2, . . . , pn e I. Aquí se
7
Estas relaciones para la función ESC se detallan en el problema 4.9 y en la extensión E4.3.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
129
usan los valores óptimos de las x de la ecuación 4.42 para sustituirlos en la función de utilidad
original, lo cual produce
utilidad máxima U[x1 ( p1 , . . . pn , I), x2 ( p1 , . . . pn , I), . . . , xn ( p1 , . . . pn , I)]
V( p1 , p2 , . . . , pn , I).
(4.42)
(4.43)
Es decir, debido al deseo del individuo de optimizar su utilidad, dada una restricción presupuestal, el nivel óptimo de utilidad obtenible dependerá indirectamente de los precios de los bienes
comprados y de su ingreso. Esta dependencia se refleja en la función de utilidad indirecta V. Si los
precios o el ingreso cambiaran, el nivel de utilidad que podría alcanzarse también se vería afectado. Tanto en la teoría del consumo como en muchos otros contextos, a veces es posible usar este
método indirecto para estudiar cómo los cambios en las circunstancias económicas afectan diversos tipos de resultados como la utilidad o (más adelante) los costos de las empresas.
PRINCIPIO DE SUMA GLOBAL
Muchos discernimientos económicos se desprenden del reconocimiento de que la utilidad
depende, en última instancia, del ingreso y de los precios que enfrentan los individuos. Uno de los
discernimientos más importantes es el llamado principio de suma global el cual ilustra la superioridad de los impuestos ante la capacidad del poder de compra de un individuo en relación con los
impuestos a determinados bienes. Un discernimiento conexo es que las subvenciones al ingreso
general para las personas de bajos ingresos elevarán la utilidad en mayor medida que una cantidad similar de dinero gastado en subsidiar bienes específicos. La intuición detrás de estos resultados se deriva directamente de la hipótesis de optimización de la utilidad; un impuesto o subsidio
al ingreso deja al individuo en libertad de decidir cómo distribuir su ingreso final. Por otro lado,
los impuestos o subsidios a bienes específicos cambian el poder de compra de una persona y distorsionan sus decisiones debido a los precios artificiales que se incorporan en esos esquemas. De
ahí que sean preferibles los impuestos y subsidios al ingreso general, si la eficiencia es un criterio
importante en la política social.
En la figura 4.5. se ilustra el principio de la suma global tal como se aplica a la tributación.
Inicialmente, esta persona tiene un ingreso de I y elige consumir la combinación x∗, y∗. Un
impuesto al bien x elevaría su precio, y la decisión de optimización de la utilidad pasaría a la combinación x1, y1. La recaudación de impuestos sería t . x1 (donde t es la tasa tributaria impuesta al
bien x). O bien, un impuesto al ingreso que desplazara hacia dentro la restricción presupuestal a
I recaudaría esta misma cantidad de ingresos tributarios.8 Sin embargo, la utilidad provista por
el impuesto al ingreso (U2) excede la provista por el impuesto a x solamente (U1). Por tanto,
hemos demostrado que la carga para la utilidad del impuesto al ingreso es menor. Un argumento
similar puede usarse para ilustrar la superioridad de subvenciones al ingreso sobre subsidios a
bienes específicos.
EJEMPLO 4.3 Utilidad indirecta y principio de suma global
En este ejemplo se usará la noción de una función de utilidad indirecta para ilustrar el principio de suma
global tal como se aplica a la tributación. Primero debemos derivar las funciones de utilidad indirecta de
dos casos ilustrativos.
Caso 1: Cobb-Douglas. En el ejemplo 4.1 se demostró que para la función Cobb-Douglas con 0.5, las compras óptimas son
8
Dado que I (px + t)x1 + pyy1, tenemos que I I tx1 px x1 + pyy1, lo cual demuestra que la restricción presupuestal con un
impuesto al ingreso de igual magnitud también pasa por el punto x1, y1.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
130
Parte 2: Elección y demanda
I
,
2px
I
y .
2py
x (4.44)
Así, la función de utilidad indirecta es, en este caso,
V( px , py , I) U(x , y ) (x ) 0.5 ( y ) 0.5 I
.
0.5
2p0.5
x py
(4.45)
Adviértase que cuando px 1, py 4 y I 8, tenemos V 8/(2 . 1 . 2) 2, es decir, la utilidad que calculamos con anterioridad para esta situación.
Caso 2: Proporciones fijas. En el tercer caso del ejemplo 4.2 se determinó que
I
,
px 0.25py
I
y .
4px py
x (4.46)
Así, en este caso la utilidad indirecta está dada por
I
px 0.25py
4
I
4y ;
4px py px 0.25py
V( px , py ,.I) min(x , 4y ) x (4.47)
con px 1, py 4 e I 8, la utilidad indirecta está dada por V 4, lo que calculamos antes.
El principio de suma global. Consideremos primeramente el uso del caso de de la función CobbDouglas para ilustrar el principio de suma global. Supongamos que se aplica un impuesto de 1 dólar al
bien x. La ecuación 4.45 muestra que en este caso la utilidad indirecta pasaría de 2 a 1.41 [ 8/(2 . 20.5 . 2)].
Puesto que esta persona elige x∗ 2 con el impuesto, la recaudación tributaria total será de 2 dólares. Así,
un impuesto al ingreso reducirá el ingreso neto a 6 dólares y la utilidad indirecta será de 1.5 [ 6/(2 . 1 . 2)].
Por tanto, el impuesto al ingreso es una evidente mejora en la utilidad en el caso en el que sólo se grava x.
El impuesto al bien x reduce la utilidad por dos razones: reduce el poder de compra de una persona y
sesga sus decisiones alejándolas del bien x. Con el impuesto sobre la renta, sólo se percibe el primer
efecto, por lo que el impuesto es más eficiente.9
El caso de las proporciones fijas confirma dicha percepción. En este caso, un impuesto de 1 dólar al
bien x reduciría la utilidad indirecta de 4 a 8/3 [ 8/(2 1)]. En esta situación x∗ 8/3 y la recaudación
tributaria sería de $8/3. Un impuesto al ingreso que recaudara $8/3 dejaría a este consumidor con $16/3
de ingreso neto, y este ingreso produciría una utilidad indirecta de V 8/3 [ (16/3)/(1 1)]. De ahí
que después de impuestos la utilidad sea la misma, tanto en el caso de los impuestos internos como en el
de los impuestos al ingreso. La razón por la cual el principio de suma global no se sostiene en este caso es
que con la utilidad de las proporciones fijas los impuestos internos no distorsionan las decisiones porque
las preferencias son muy rígidas.
PREGUNTA: Las dos funciones de utilidad indirecta que hemos ilustrado aquí demuestran que la duplicación del ingreso y de todos los precios dejaría sin cambio a la utilidad indirecta. Explica por qué podemos esperar que esta sea una propiedad de todas las funciones de utilidad indirecta. Es decir, explica por
qué la función de utilidad indirecta es homogénea de grado cero en todos los precios e ingresos.
9
Este análisis supone que no hay efectos incentivadores del impuesto sobre la renta, lo cual quizá no es un buen supuesto.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
FIGURA 4.5
El principio de suma
global de la tributación.
131
Un impuesto al bien x desplazaría la decisión de optimización de la utilidad de x∗, y∗ a x1, y1. Un impuesto
al ingreso que recaudara el mismo monto desplazaría la restricción presupuestal a I. La utilidad sería más
alta (U2) con el impuesto al ingreso que con el impuesto a x solamente (U1).
Cantidad
de y
y1
I′
y*
y2
U3
U2
I
U1
x1
x2
x*
Cantidad de x
MINIMIZACIÓN DEL GASTO
En el capítulo 2 se señaló que muchos problemas de máximo restringido tienen problemas asociados de mínimo restringido “duales”. Para el caso de la optimización de la utilidad el problema
asociado dual de minimización concierne a distribuir el ingreso de tal manera que sea posible
alcanzar un nivel de utilidad dado con el gasto mínimo. Este problema es evidentemente similar
al problema original de optimización de la utilidad, pero los objetivos y restricciones de los problemas se han invertido. La figura 4.6 ilustra este problema dual de minimización del gasto. Ahí,
el individuo debe alcanzar el nivel de utilidad U2; esta es ahora la restricción del problema. Tres
posibles montos de gasto (E1, E2 y E3) aparecen en la figura como tres líneas de “restricción presupuestal”. El nivel de gasto E1 es obviamente demasiado reducido para alcanzar U2; de ahí que no
pueda resolverse el problema dual. Con los gastos dados por E3 el individuo puede llegar a U2 (en
cualesquiera de los dos puntos B o C), pero este no es el nivel de gasto mínimo requerido. En
cambio, E2 ofrece evidentemente los gastos totales suficientes para llegar a U2 (en el punto A), y
esta es de hecho la solución del problema dual. Al comparar las figuras 4.2 y 4.6 resulta obvio que
tanto el método primario de optimización de la utilidad como el método dual de minimización
del gasto producen la misma solución (x∗, y∗); son simplemente modos alternos de ver el mismo
proceso. El método de minimización del gasto suele ser más útil, sin embargo, porque los gastos
son directamente observables, mientras que la utilidad no.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
132
Parte 2: Elección y demanda
FIGURA 4.6
El problema dual de
minimización del gasto.
El problema dual de la optimización de la utilidad es alcanzar un nivel de utilidad dado (U2) con gastos
mínimos. Un nivel de gasto de E1 no permite alcanzar U2, mientras que E3 brinda más poder de gasto del
estrictamente necesario. Con el gasto E2, esta persona puede llegar a U2 consumiendo x∗ y y∗.
Cantidad
de y
B
E3
E2
E1
A
y*
C
U2
Cantidad de x
x*
Enunciación matemática
Más formalmente, el problema dual de minimización del gasto del individuo es elegir x1, x2, . . . ,
xn para minimizar
gastos totales E p1x1 p2x2 . . . pnxn,
(4.48)
utilidad U U(x1, x2, . . . , xn).
(4.49)
sujetos a la restricción
Las cantidades óptimas de x1, x2, . . . , xn elegidos en este problema dependerán de los precios de
los diversos bienes (p1, p2, . . . , pn) y del nivel de utilidad requerido U. Si alguno de los precios
cambiara o si el individuo tuviera un “objetivo” de utilidad diferente, otro conjunto de bienes sería
el óptimo. Esta dependencia puede resumirse como una función de gasto.
DEFINICIÓN
Función de gasto. La función de gasto del individuo muestra los gastos mínimos necesarios para alcanzar un nivel de utilidad dado para una serie particular de precios. Es decir,
gastos mínimos E(p1, p2, . . . , pn, U).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(4.50)
8/23
Capítulo 4: Optimización de la utilidad y elección
133
Esta definición indica que la función de gasto y la función de utilidad indirecta son funciones
inversas entre sí (compárense las ecuaciones 4.43 y 4.50). Ambas dependen de los precios del
mercado, pero implican diferentes restricciones (ingreso o utilidad). En el capítulo siguiente se
verá que esta relación es útil al permitirnos examinar la teoría de cómo reaccionan los individuos
a cambios de precio. No obstante, consideremos primero dos funciones de gasto.
EJEMPLO 4.4 Dos funciones de gasto
Hay dos maneras de calcular una función de gasto. El primer método, más sencillo, sería formular directamente el problema de minimización del gasto y aplicar la técnica de Lagrange. Algunos de los problemas al final de este capítulo te pedirán hacer eso precisamente. Aquí, sin embargo, adoptaremos un procedimiento más ágil, aprovechando la relación entre funciones de gasto y funciones de utilidad indirecta.
Dado que estos dos tipos de funciones son inversos entre sí, el cálculo de uno facilita enormemente el del
otro. Ya se calcularon las funciones de utilidad indirecta de dos casos importantes en el ejemplo 4.3.
Recuperar las funciones de gasto asociadas es cuestión de simple álgebra.
Caso 1: Utilidad Cobb-Douglas. La ecuación 4.45 muestra que la función de utilidad indirecta en el
caso de la función Cobb-Douglas de dos bienes es
V( px , py , I) I
.
0.5
2p0.5
x py
(4.51)
Si ahora se intercambia el rol de la utilidad (que ahora trataremos como el “objetivo” de utilidad denotado
por U) y del ingreso (que ahora denominaremos “gastos”, E, y lo trataremos como una función de los
parámetros de este problema), tenemos la función de gasto
E(px, py, U) 2px0.5p0.5
y U.
(4.52)
Comparando esto con nuestros resultados anteriores, usaremos un objetivo de utilidad de U 2 con,
nuevamente, px 1 y py 4. Con estos parámetros la ecuación 4.52 indica que los gastos mínimos
requeridos son de 8 dólares ( 2 . 10.5 . 40.5 . 2). No es de sorprender que tanto el problema primordial
de optimización de la utilidad como el problema dual de minimización del gasto sean formalmente idénticos.
Caso 2: Proporciones fijas. Para el caso de las proporciones fijas, la ecuación 4.47 dio la función de
utilidad indirecta como
V( px , py , I) I
.
px 0.25py
(4.53)
Si intercambiamos nuevamente el rol de la utilidad y los gastos, derivamos rápidamente la función de
gasto:
E(px, py, U) (px 0.25py)U.
(4.54)
Una comprobación de los valores hipotéticos usados en el ejemplo 4.3 (px 1, py 4, U 4) demuestra
nuevamente que llegar al objetivo de utilidad de 4 costaría 8 dólares [(1 0.25 . 4) . 4].
Compensación de un cambio de precio. Estas funciones de gasto nos permiten investigar cómo
podría ser compensada una persona por un cambio de precio. En específico supongamos que el precio
del bien y aumenta de 4 a 5 dólares. Obviamente esto reduciría la utilidad de una persona, así que
podría preguntarse qué monto de compensación monetaria mitigaría el daño. Puesto que la función de
gasto permite mantener constante la utilidad, esto ofrece una estimación directa de ese monto. Específicamente, en el caso de la función Cobb-Douglas, los gastos tendrían que aumentar de 8 a 8.94 dólares
( 2 . 1 . 50.5 . 2) para brindar suficiente poder de compra adicional a fin de compensar precisamente
dicho aumento de precio. Con proporciones fijas los gastos tendrían que aumentar de 8 a 9 dólares
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
134
Parte 2: Elección y demanda
para compensar el aumento de precio. De ahí que las compensaciones sean casi iguales en estos casos
simples.
Hay, sin embargo, una diferencia importante entre ambos ejemplos. En el caso de proporciones fijas,
el dólar de compensación adicional permite sencillamente a esta persona volver a su paquete de consumo
previo (x 4, y 1). Esta es la única manera de devolver la utilidad a U 4 para esta rígida persona. En
el caso de la función Cobb-Douglas, en cambio, esta persona no usará la compensación adicional para
retornar a su conjunto de consumo previo. En lugar de ello la optimización de la utilidad requerirá que
los 8.94 dólares se distribuyan de tal manera que x 4.47 y y 0.894. Esto seguirá brindando un nivel
de utilidad de U 2, pero la persona economizará en el ahora más costoso bien y. En el capítulo siguiente
se detalla este análisis de los efectos de bienestar de los cambios de precio.
PREGUNTAS: ¿Cómo debería ser compensada una persona por una reducción de precios? ¿Qué tipo de
compensación requerirá, si el precio del bien y disminuye de 4 a 3 dólares?
PROPIEDADES DE LAS FUNCIONES
DE GASTO
Puesto que las funciones de gasto son ampliamente usadas en la economía aplicada, es importante
entender algunas de las propiedades compartidas por todas esas funciones. Aquí se estudiarán
tres propiedades. Todas ellas se desprenden directamente del hecho de que las funciones de gasto
se basan en la optimización de la utilidad individual.
1. Homogeneidad. Para las dos funciones ilustradas en el ejemplo 4.4 la duplicación de todos los
precios duplicará precisamente el valor de los gastos requeridos. Técnicamente, estas funciones de gasto son “homogéneas de grado uno” en todos los precios.10 Esta es una propiedad
general de las funciones de gasto. Debido a que la restricción presupuestal del individuo es
lineal en precios, todo aumento proporcional tanto en precios como en poder de compra le
permitirá adquirir el mismo conjunto de bienes elegido que optimice la utilidad antes del
aumento de precio. En el capítulo 5 se verá que, por esta razón, las funciones de demanda son
homogéneas de grado cero en todos los precios e ingresos.
2. Las funciones de gasto son no decrecientes en precios. Esta propiedad puede resumirse sucintamente con el enunciado matemático
E
0
pi
para cada bien i.
(4.55)
Esto parece intuitivamente obvio. Puesto que la función de gasto reporta el gasto mínimo
necesario para llegar a un nivel de utilidad dado, un aumento en cualquier precio debe incrementar ese mínimo. Más formalmente, supongamos que el precio de un bien aumenta y que
todos los demás precios se mantienen iguales. Sea que A represente el conjunto de bienes
adquirido antes del aumento de precio y B el conjunto adquirido después del aumento de
precio. Evidentemente, el conjunto B cuesta más que antes luego del aumento de precio. El
único cambio entre ambas situaciones es el aumento en uno de los precios; así, el gasto en ese
bien se incrementa y todos los demás gastos permanecen iguales. Sin embargo, también sabemos que antes del aumento de precio el conjunto A costaba menos que el conjunto B, porque
A era el conjunto minimizador del gasto. De ahí que los gastos reales, cuando se elige B desComo se describió en el capítulo 2, se dice que la función f(x1, x2, . . . , xn) es homogénea de grado k si f(tx1, tx2, . . . , txn) tk f (x1, x2, . . . , xn). En este caso, k 1.
10
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
135
En p1∗ esta persona gasta E(p1∗, ...). Si sigue comprando la misma serie de bienes al cambiar p1 los gastos
estarán dados por Eseudo. Como es probable que sus patrones de consumo se modifiquen al cambiar p1, los
gastos reales serán menores que este.
FIGURA 4.7
Las funciones de gasto
son cóncavas en los
precios.
E( p1, . . .)
E seudo
E( p1, . . .)
E( p1*, . . .)
E( p1*, . . .)
p1
pués del aumento de precio, excedan los gastos en A antes del aumento de precio. Una cadena
lógica similar podría usarse para demostrar que una reducción de precio debería causar una
reducción de gastos (o posiblemente una permanencia en su mismo nivel).
3. Las funciones de gasto son cóncavas en los precios. En el capítulo 2 se analizaron las funciones
cóncavas las cuales se definen como funciones que siempre se ubican abajo, tangentes a ellas.
Aunque las condiciones matemáticas técnicas que describen estas funciones son complicadas,
es relativamente simple mostrar cómo se aplica este concepto a las funciones de gasto, considerando la variación en un solo precio. La figura 4.7 muestra los gastos de un individuo como
una función del precio p1. En el precio inicial, p1∗, los gastos de esta persona están dados por
E(p1∗, . . .). Considérense ahora precios más altos o más bajos que p1∗. Si esta persona continuara comprando el mismo conjunto de bienes, los gastos aumentarían o disminuirían linealmente al cambiar el precio. Esto daría origen a la función de seudogasto Eseudo en la figura.
Esta línea señala un nivel de gastos que permitiría a la persona comprar el conjunto original
de bienes, pese al valor cambiante de p1. Si, como parece más probable, esta persona ajustara
sus compras al cambiar p1, sabemos (a causa de la minimización del gasto) que los gastos
reales serían menores que esos seudomontos. De ahí que la función de gasto real, E, se ubique
en cualquier punto bajo Eseudo y que la función sea cóncava.11 La concavidad de la función de
gasto es una propiedad útil para varias aplicaciones, en especial aquellas relacionadas con el
efecto de sustitución de cambios de precio (véase capítulo 5).
11
Un resultado de la concavidad es que fii 2E/p2i
0. Esto es precisamente lo que muestra la figura 4.7.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
136
Parte 2: Elección y demanda
Resumen
En este capítulo se exploró el modelo económico básico de la
optimización de la utilidad sujeta a una restricción presupuestal.
Aunque este problema se abordó de distintas maneras todos los
enfoques condujeron al mismo resultado básico.
óptimo de consumo de algunos bienes es de cero. En este caso,
la razón de la utilidad marginal con el precio de ese bien estará
bajo la razón común de costo marginal-beneficio marginal de
los bienes efectivamente adquiridos.
• Para alcanzar un óptimo restringido un individuo debe gastar
todo el ingreso disponible y elegir un conjunto de bienes tal
que la TMS entre dos bienes cualesquiera sea igual a la razón
de los precios de mercado de dichos bienes. Esta tangencia
básica resultará en que el individuo iguale las razones de la
utilidad marginal con el precio de mercado de cada bien efectivamente consumido. Este resultado es común a la mayoría de
los problemas de optimización restringida.
• Una consecuencia del supuesto de optimización de utilidad
restringida es que las decisiones óptimas del individuo dependerán implícitamente de los parámetros de su restricción presupuestal. Es decir, las decisiones observadas serán funciones
implícitas de todos los precios e ingresos. Así, la utilidad también será una función indirecta de dichos parámetros.
• Las condiciones de tangencia, sin embargo, son sólo las condiciones de primer orden para un óptimo restringido. Para
garantizar que estas condiciones también sean suficientes el
mapa de curvas de indiferencia del individuo debe exhibir una
TMS decreciente. En términos formales, la función de utilidad
debe ser estrictamente cuasi cóncava.
• Las condiciones de tangencia también deben modificarse para
tomar en cuenta soluciones de esquina en las cuales el nivel
• El problema dual de optimización de utilidad restringida es
minimizar el gasto requerido para llegar a un nivel de utilidad
dado. Aunque este enfoque dual produce la misma solución
óptima que el problema primordial de óptimo restringido,
también arroja discernimientos adicionales sobre la teoría de
la elección. Específicamente, este enfoque conduce a funciones
de gasto en las que el gasto requerido para alcanzar un objetivo de utilidad dado depende de los precios de mercado de los
bienes. Así, las funciones de gasto son en principio mensurables.
Problemas
4.1
Cada día Paul, quien está en tercer grado, almuerza en la escuela. Sólo le gustan los pastelillos (t) y la soda (s), los cuales le brindan una
utilidad de
ts.
utilidad U(t, s) a. Si los pastelillos cuestan $0.10 cada uno y el vaso con soda, $0.25 ¿cómo debería gastar Paul el dólar que su madre le da, a fin de optimizar su utilidad?
b. Si la escuela intenta desalentar el consumo de pastelillos, aumentando su precio a $0.40, ¿cuánto tendría que incrementar la madre de
Paul la cantidad de dinero para el almuerzo y proporcionarle el mismo nivel de utilidad que recibía en el inciso a)?
4.2
a. Una joven conocedora de vinos tiene $600 para gastar en la construcción de una pequeña cava. Le gustan dos cosechas en particular:
la del Bordeaux francés de 2001 (wF), a $40 por botella, y un vino californiano menos costoso de 2005 (wC) a un precio de $8. Si su
utilidad es
U(wF, wC) wF2/3wC2/3,
¿cuánto debería comprar de cada vino?
b. Cuando llegó a la vinatería, nuestra joven enóloga descubrió que el precio del Bordeaux francés había bajado a $20 la botella, debido a
una reducción en el valor del euro. Si el precio del vino californiano se mantiene estable en $8 por botella, ¿cuánto de cada vino debería
comprar nuestra amiga para optimizar su utilidad en estas condiciones alteradas?
c. Explica por qué esta aficionada al vino estaría en mejores condiciones en el inciso b) que en el a). ¿Cómo asignarías un valor monetario
a este aumento de utilidad?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
137
4.3
a. En una determinada noche, J. P. disfruta el consumo de puros (c) y brandy (b) de acuerdo con la función
U(c, b) 20c c2 18b 3b2.
¿Cuántos puros y copas de brandy consume en una noche? (El costo no es problema para J. P.)
b. Últimamente, sin embargo, sus médicos le han recomendado a J. P. limitar a 5 el total de copas de brandy y puros consumidos. ¿Cuántas copas de brandy y puros consumirá en estas circunstancias?
4.4
a. El señor Omar Excéntrico disfruta los productos x y y de acuerdo con la función de utilidad
x2 y2.
U(x, y) La utilidad del señor Excéntrico se optimiza si px $3, py $4 y tiene $50 para gastar. Pista: Aquí podría ser más fácil optimizar U2 en
lugar de U. ¿Por qué esto no alterará tus resultados?
b. Grafica la curva de indiferencia del señor Excéntrico y su punto de tangencia con su restricción presupuestal. ¿Qué indica esta gráfica
sobre el comportamiento del señor Excéntrico? ¿Encontraste un óptimo verdadero?
4.5
El señor A deriva utilidad de martinis (m) en proporción con la cantidad que bebe:
U(m) m.
El señor A, sin embargo, es muy especial con los martinis: sólo le gustan preparados con una proporción exacta de dos partes de ginebra
(g) por una de vermut (v). De ahí que la función de utilidad del señor A pueda reescribirse como
g
U(m) U(g, v) min 2 , v .
a. Grafica la curva de indiferencia del señor A en términos de g y v para varios niveles de utilidad. Demuestra que, independientemente
de los precios de ambos ingredientes, el señor A nunca alterará la forma en que prepara los martinis.
b. Calcula las funciones de demanda de g y v.
c. Usando los resultados del inciso b), ¿cuál es la función de utilidad indirecta del señor A?
d. Calcula la función de gasto del señor A; para cada nivel de utilidad muestra el gasto como una función de pg y pv. Pista: Dado que este
problema implica una función de utilidad de proporciones fijas, no es posible despejar las decisiones optimizadoras de utilidad usando
el cálculo.
4.6
Supón que un fanático de la comida rápida deriva utilidad de tres bienes —refrescos (x), hamburguesas (y) y helados (z)— de acuerdo con
la función de utilidad de función Cobb-Douglas
U(x, y, z) x0.5y0.5(1 z)0.5.
Supón también que los precios de estos bienes están dados por px 1, py 4 y pz 8 y que el ingreso de este consumidor está dado por
I 8.
a. Demuestra que, para z 0 la optimización de la utilidad resulta en las mismas decisiones óptimas que en el ejemplo 4.1. Demuestra,
asimismo, que toda decisión que resulte en z 0 (aun para una z fraccionaria) reduce la utilidad desde ese óptimo.
b. ¿Cómo explicas el hecho de que z 0 sea óptimo aquí?
c. ¿Qué tan alto tendría que ser el ingreso de este individuo para poder comprar todas las z?
4.7
El principio de suma global que se ilustra en la figura 4.5 se aplica a la política de transferencias y a la tributación. En este problema se
examinará la aplicación de ese principio.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
138
Parte 2: Elección y demanda
a. Usa una gráfica similar a la de la figura 4.5 para demostrar que una subvención al ingreso para una persona brinda más utilidad que un
subsidio al bien x el cual le cuesta la misma cantidad al gobierno.
b. Usa la función de gasto Cobb-Douglas que se presenta en la ecuación 4.52 para calcular el poder de compra adicional necesario para
incrementar la utilidad de esta persona de U 2 a U 3.
c. Usa de nuevo la ecuación 4.52 para estimar el grado en el cual el bien x debe subsidiarse para incrementar la utilidad de esta persona
de U 2 a U 3. ¿Cuánto le costaría este subsidio al gobierno? ¿Qué resulta de comparar este costo con el calculado en el inciso b)?
d. En el problema 4.10 se te pedirá calcular una función de gasto para una función Cobb-Douglas más general que la que se usa en el
ejemplo 4.4. Aplica aquí esa función de gasto para volver a resolver los incisos b) y c) para el caso 0.3, cifra cercana a la fracción del
ingreso que las personas de bajos ingresos gastan en alimentos.
e. ¿Cómo habrían cambiado tus cálculos en este problema si hubiéramos utilizado la función de gasto para el caso de proporciones fijas
(ecuación 4.54)?
4.8
Dos de las funciones de utilidad más simples son:
1. Proporciones fijas: U(x, y) min[x, y].
2. Sustitutos perfectos: U(x, y) x y
a. Para cada una de estas funciones de utilidad, calcula lo siguiente:
• Funciones de demanda de x y y
• Función de utilidad indirecta
• Función de gasto
b. Analiza las formas particulares de las funciones que calculaste; ¿por qué adoptan esas formas específicas?
4.9
Supón que se tiene una función de utilidad que implica dos bienes y que es lineal de la forma U(x, y) ax by. Calcula la función de gasto
de esta función de utilidad. Pista: La función de gasto tendrá problemas en varias razones de precio.
Problemas analíticos
4.10 Utilidad Cobb-Douglas
En el ejemplo 4.1 se examinó la función Cobb-Douglas U(x, y) xy1, donde 0
de esa función.
1. Este problema ilustra algunos atributos más
a. Calcula la función de utilidad indirecta para este caso de la función Cobb-Douglas.
b. Calcula la función de gasto de este caso.
c. Demuestra explícitamente cómo la compensación requerida para neutralizar el efecto de un aumento en el precio de x se relaciona con
la magnitud del exponente .
4.11 Utilidad ESC
La función de utilidad ESC que se utilizó en este capítulo está dada por
U(x, y) x y
.
a. Demuestra que las condiciones de primer orden para un máximo de utilidad restringida con esta función requiere que los individuos
elijan bienes en la proporción
x
y
px
py
1/( 1)
.
b. Demuestra que el resultado del inciso a) implica que los individuos distribuirán sus fondos en partes iguales entre x y y para el caso
Cobb-Douglas ( 0), como se demostró anteriormente en varios problemas.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
139
c. ¿Cómo depende la razón pxx/pyy del valor de ? Explica intuitivamente tus resultados. (Para más detalles sobre esta función, véase la
extensión E4.3.)
d. Deriva las funciones de utilidad indirecta y gasto de este caso y comprueba tus resultados describiendo las propiedades de homogeneidad de las funciones que calculaste.
4.12 Utilidad de Stone-Geary
Supón que los individuos requieren cierto nivel de alimentos (x) para mantenerse vivos. Concedamos que esta cantidad está dada por x0.
Una vez adquirido x0 los individuos obtienen la utilidad de los alimentos y otros bienes (y) de la forma
U(x, y) (x x0)y,
donde 1.
a. Demuestra que si I pxx0, el individuo maximizará su utilidad gastando (I pxx0) pxx0 en el bien x y (I pxx0) en el bien y.
Interpreta este resultado.
b. ¿Cómo cambian las razones pxx/I y pyy/I al aumentar el ingreso en este problema? (Véase también la extensión E4.2 para más detalles
sobre esta función de utilidad.)
4.13 Funciones de utilidad indirecta ESC y de gasto
En este problema se usará una forma más estándar de la función de utilidad ESC para derivar funciones de utilidad indirecta y de gasto.
Supón que la utilidad está dada por
U(x, y) (x y)1/
[en esta función la elasticidad de sustitución 1/(1 )].
a. Demuestra que la función de utilidad indirecta de la función de utilidad que acaba de darse es
V I(pxr pyr)1/r,
b.
c.
d.
e.
donde r /( 1) 1 .
Demuestra que la función derivada en el inciso a) es homogénea de grado cero en precios e ingreso.
Demuestra que esta función es estrictamente creciente en ingreso.
Demuestra que esta función es estrictamente decreciente en cualquier precio.
Demuestra que la función de gasto para este caso de utilidad ESC está dada por
E V(pxr pyr)1/r.
f. Demuestra que la función derivada en el inciso e) es homogénea de grado uno en los precios de los bienes.
g. Demuestra que esta función de gasto es creciente en cada uno de los precios.
h. Demuestra que la función es cóncava en cada precio.
4.14 Altruismo
Michele quien tiene un ingreso relativamente alto I demuestra altruismo hacia Sofía quien vive en una pobreza tal que en esencia no tiene
ningún ingreso. Supongamos que las preferencias de Michele están representadas por la función de utilidad
U1(c1, c2) c11ac2a,
donde c1 y c2 son los niveles de consumo de Michele y Sofía los cuales aparecen como bienes en una función Cobb-Douglas. Supón que
Michele puede gastar su ingreso en su propio consumo, o en el de Sofía (mediante donativos de beneficencia), y que $1 compra una unidad
de consumo para cualquiera de las dos (así, los “precios” de consumo son p1 p2 1).
a. Argumenta que el exponente a puede tomarse como una medida del grado del altruismo de Michele, ofreciendo una interpretación de
los valores extremos a 0 y a 1. ¿Qué valor la convertiría en una perfecta altruista (considerando a los demás igual que a sí misma)?
b. Despeja las decisiones óptimas de Michele y muestra cómo cambian con a.
c. Despeja las decisiones óptimas de Michele bajo un impuesto al ingreso con tasa t. ¿Cómo cambian sus decisiones si hay una deducción
a la beneficencia (de manera que el ingreso que se gastó en donativos no es gravado)? ¿La deducción a la beneficencia tiene mayor efecto
de incentivo en las personas más altruistas o en las menos altruistas?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
140
Parte 2: Elección y demanda
d. Para mayor simplicidad vuelve al caso sin impuestos. Supón ahora que el altruismo de Michele está representado por la función de
utilidad
U1(c1, U2) c11aU2a,
la cual es similar a la representación del altruismo en la extensión E3.4 del capítulo anterior. De acuerdo con esta especificación,
Michele se ocupa directamente del nivel de utilidad de Sofía y sólo indirectamente de su nivel de consumo.
1. Despeja las decisiones óptimas de Michele, si la función de utilidad de Sofía es simétrica respecto a la de Michele: U2(c2, U1)
c21aU1a. Compara tu respuesta con el inciso b). ¿Michele es más o menos caritativa bajo la nueva especificación? Explica tu respuesta.
2. Repite el análisis previo suponiendo que la función de utilidad de Sofía es U2(c2) c2.
Sugerencias de lecturas adicionales
Barten, A. P. y Volker Böhm. “Consumer Theory”, en K. J. Arrow
y M. D. Intriligator, eds., Handbook of Mathematical Economics,
vol. II, North-Holland, Ámsterdam, 1982.
Las secciones 10 y 11 tienen resúmenes compactos de muchos de los
conceptos cubiertos en este capítulo.
Deaton, A. y J. Muelbauer. Economics and Consumer Behavior,
Cambridge University Press, Cambridge, 1980.
La sección 2.5 ofrece un buen tratamiento geométrico de conceptos de
dualidad.
Dixit, A. K. Optimization in Economic Theory, Oxford University
Press, Oxford, 1990.
El capítulo 2 brinda varios análisis lagrangianos centrados en la función de utilidad Cobb-Douglas.
Hicks, J. R. Value and Capital, Clarendon Press, Oxford, 1946.
gasto, más estándar. Ese capítulo también ofrece ideas sobre varias
estructuras inusuales de preferencias.
Mas-Colell, A., M. D. Whinston y J. R. Green. Microeconomic
Theory, Oxford University Press, Oxford, 1995.
El capítulo 3 contiene un completo análisis de funciones de utilidad y
de gasto.
Samuelson, Paul A. Foundations of Economic Analysis, Harvard
University Press, Cambridge, 1947.
El capítulo V y el apéndice A ofrecen un sucinto análisis de las condiciones de primer orden para un óptimo de utilidad. Tal apéndice
brinda asimismo una buena cobertura de condiciones de segundo
orden.
Silberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwing/McGraw-Hill, Boston, 2001.
El capítulo II y el apéndice matemático proporcionan algunas sugerencias tempranas acerca de la importancia de la función de gasto.
Útil aunque muy difícil tratamiento de la dualidad en la teoría del
consumo.
Luenberger, D. G. Microeconomic Theory, McGraw Hill, Nueva
York, 1992.
Theil, H., Theory and Measurement of Consumer Demand, NorthHolland, Ámsterdam, 1975.
En el capítulo 4 este autor muestra varias relaciones interesantes entre
su “función de beneficio” (véase el problema 3.15) y la función de
Buen resumen de teoría básica de la demanda junto con implicaciones
para la estimación empírica.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
EXTENSIONES
Porciones presupuestales
El economista del siglo xix Ernst Engel fue uno de los primeros
científicos sociales en estudiar a fondo los patrones de gasto reales
de los individuos. Se concentró específicamente en el consumo de
alimentos. Su hallazgo de que la fracción del ingreso que se gasta
en alimentos disminuye al aumentar el ingreso llegó a conocerse
como ley de Engel y se ha confirmado en muchos estudios. La ley
de Engel es de tal regularidad empírica que algunos economistas
han propuesto medir la pobreza por la fracción del ingreso que se
gasta en alimentos. Hay otras dos aplicaciones interesantes: 1) el
estudio de Hayashi (1995) el cual demuestra que la porción del
ingreso dedicada a los alimentos que prefieren los ancianos es
mucho más alta en familias de dos generaciones que en familias
de una sola generación, y 2) los hallazgos de Behrman (1989),
procedentes de países menos desarrollados, que demuestran que
los deseos de la gente de llevar una dieta más variada, al aumentar
sus ingresos, pueden resultar de hecho en una reducción de la
fracción del ingreso que se gasta en nutrientes particulares. En el
resto de esta extensión se examinarán algunas evidencias sobre las
porciones presupuestales (denotadas por si pixi/I) junto con
algo más de teoría sobre el tema.
dente: al aumentar el ingreso las familias gastan en alimentos una
menor proporción de sus fondos. Otras variaciones importantes
en la tabla incluyen la porción decreciente del ingreso que se gasta en
cubrir necesidades de atención a la salud y una mayor porción del
ingreso que los individuos de ingresos más altos dedican a planes
de retiro. Curiosamente, las porciones del ingreso dedicadas a
vivienda y transporte son relativamente constantes en el rango de
ingreso que se muestra en la tabla; al parecer, individuos de altos
ingresos compran casas y automóviles más grandes.
Las porciones variables del ingreso, en la tabla E4.1 ilustran
por qué la función Cobb-Douglas no es útil para estudios empíricos detallados respecto al comportamiento de las familias. Cuando
la utilidad está dada por U(x, y) xy (donde 1), las
ecuaciones de demanda implicadas son x I/px y y I/py. Así,
sx pxx/I y
sy pyy/I ,
(i)
y las porciones presupuestales son constantes para todos los niveles de ingreso y precios relativos observados. Debido a esta deficiencia los economistas han investigado otras formas posibles de
la función de utilidad que permitan mayor flexibilidad.
E4.1 La variabilidad de las porciones
presupuestales
E4.2 Sistema de gasto lineal
En la tabla E4.1 aparecen datos actualizados de las porciones presupuestales de Estados Unidos. En esta tabla la ley de Engel es evi-
Una generalización de la función Cobb-Douglas que incorpora la idea de que ciertos montos mínimos de cada bien deben
TABLA E4.1 PORCIONES PRESUPUESTALES DE FAMILIAS ESTADOUNIDENSES, 2008
Ingreso anual
$10 000-$14 999
$40 000-$49 999
Más de $70 000
Concepto de gastos
Alimentos
15.7
13.4
11.8
Vivienda
23.1
21.2
19.3
Servicios públicos y combustible
11.2
8.6
5.8
Transporte
14.1
17.8
16.8
5.3
4.0
2.6
Seguro médico
Otros gastos de atención a la salud
2.6
2.8
2.3
Entretenimiento (bebidas alcohólicas incluidas)
4.6
5.2
5.8
Educación
2.3
1.2
2.6
Seguro y pensiones
Otros (electrodomésticos, aseo personal,
otros gastos de vivienda y varios)
2.2
8.5
14.6
18.9
17.3
18.4
Consumer Expenditure Report, 2008, página en internet de la Bureau of Labor Statistics, http://www.bls.gov.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
142
Parte 2: Elección y demanda
ser comprados por un individuo (x0, y0) es la función de utilidad
U(x, y) (x x0)(y y0)
(ii)
para x x0 y y y0 donde, nuevamente, 1.
Las funciones de demanda pueden derivarse de esta función
de utilidad en forma similar al caso de la función Cobb-Douglas,
introduciendo el concepto de ingreso supernumerario (I∗) el cual
representa el monto de poder de compra restante después de
adquirir el paquete mínimo
I∗ I pxx0 pyy0.
(iii)
Usando esta notación las funciones de demanda son
x (px x0 I )/px ,
y (py y0 I )/py .
(iv)
En este caso el individuo gasta entonces una fracción constante de
ingreso supernumerario en cada bien, una vez adquirido el conjunto mínimo. La manipulación de la ecuación iv produce las
ecuaciones de porciones
sx (px x0
sy (py y0
py y0 )/I,
px x0 )/I,
(v)
que muestran que este sistema de demanda no es homotético. La
revisión de la ecuación v exhibe el previsible resultado de que
la porción presupuestal de un bien se relaciona positivamente
con la cantidad mínima necesaria de dicho bien, y negativamente con la cantidad mínima del otro bien requerido. Puesto que
la noción de compras necesarias parece estar acorde con la observación de la realidad, este sistema de gasto lineal (SGL), inicialmente desarrollado por Stone (1954), es de uso muy común en
estudios empíricos. La función de utilidad en la ecuación ii también se conoce como función de utilidad de Stone-Geary.
Compras tradicionales
Uno de los usos más interesantes del SGL es examinar cómo cambia esta noción de compras necesarias al cambiar también las condiciones. Por ejemplo, Oczkowski y Philip (1994) estudian cómo
el acceso a bienes de consumo modernos puede afectar la parte
del ingreso que los individuos en economías de transición dedican a los artículos locales tradicionales. Estos autores demuestran
que los lugareños de Papúa, Nueva Guinea, reducen significativamente esas porciones al acceder cada vez más a bienes del exterior.
De ahí que adelantos, como mejores carreteras para el transporte
de bienes, sean una de las formas en las que se socavan las prácticas culturales tradicionales.
E4.3 Utilidad ESC
En el capítulo 3 se presentó la función de utilidad ESC
U(x, y) x y
(vi)
para 1, 0. El principal uso de esta función es ilustrar posibilidades alternas de sustitución (que se reflejan en el valor del
parámetro . Las porciones presupuestales implicadas por esta
función de utilidad aportan variados discernimientos de este tipo.
La manipulación de las condiciones de primer orden para un
óptimo de utilidad restringida con la función ESC rinde las ecuaciones de porciones
sx 1/[1 ( py /px ) K ,
sy 1/[1 ( px /py ) K ,
(vii)
donde K /( 1).
La naturaleza homotética de la función ESC se demuestra por
el hecho de que estas expresiones de porciones sólo dependen de
la razón de precio, px/py. El comportamiento de estas porciones en
respuesta a los cambios en precios relativos depende del valor del
parámetro K. Para el caso Cobb-Douglas, 0, así que K 0 y sx
sy 1/2. Cuando 0 las posibilidades de sustitución son
grandes y K 0. En este caso, la ecuación vii demuestra que sx y
px/py se mueven en direcciones opuestas. Si px/py aumenta, la persona sustituye y por x en tal grado que sx disminuye. O bien, si 0, entonces las posibilidades de sustitución son limitadas, K
0, y sx y px/py se mueven en la misma dirección. En este caso, un
incremento en px/py sólo causa una sustitución menor de y por x,
y sx en realidad se incrementa debido al precio relativamente más
alto del bien x.
Libre comercio en América del Norte
Las funciones de demanda ESC se usan, la mayoría de las veces, en
modelos por computadora a gran escala de equilibrio general
(véase el capítulo 13), mismos que los economistas usan para evaluar el impacto de importantes cambios económicos. Puesto que
el modelo ESC subraya que las porciones responden a cambios en
los precios relativos, tal modelo es particularmente apropiado
para examinar innovaciones como cambios en política tributaria
o en restricciones al comercio internacional, donde los cambios
en precios relativos son probables. Un área importante de tal
investigación ha sido el impacto del Tratado de Libre Comercio de
América del Norte para Canadá, México y Estados Unidos. En
general, estos modelos determinan que es de esperar que todos los
países involucrados se beneficien con ese tratado, pero que los
beneficios para México podrían ser los mayores, ya que este país
está experimentando el mayor cambio en los precios relativos.
Kehoe y Kehoe (1995) presentan varios modelos de equilibrio
computables que los economistas han usado en estos exámenes.1
E4.4 El sistema de demanda casi ideal
Otra manera de estudiar las porciones presupuestales es a partir
de una función de gasto específica. Este método es especialmente
conveniente porque el teorema de la envolvente demuestra que
las porciones presupuestales pueden derivarse directamente de las
funciones de gasto a través de la diferenciación logarítmica (para
más detalles véase el capítulo 5): 12
ln E(px , py , V)
1
E px
ln px
E(px , py , V) px ln px
xpx
sx .
E
(viii)
1
En las extensiones del capítulo 13 se analiza con más detalle la investigación
sobre el Tratado de Libre Comercio de América del Norte.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 4: Optimización de la utilidad y elección
Deaton y Muellbauer (1980) hacen amplio uso de esta relación
para estudiar las características de una clase particular de funciones de gasto que denominan sistema de demanda casi ideal
(SDCI). Su función de gasto adopta la forma
ln E( px , py , V) a0 a1 ln px a2 ln py
0.5b1 (ln px ) 2 b2 ln px ln py
0.5b3 (ln py )
2
Vc 0 pcx1
(ix)
pcy 2 .
Esta forma aproxima cualquier función de gasto. Para que la función sea homogénea de grado uno en los precios sus parámetros deben cumplir las restricciones a1 a2 1, b1 b2 0,
b2 b3 0 y c1 c2 0. El uso de los resultados de la ecuación
viii muestra que para esta función
sx a1 b1 ln px b2 ln py c1 Vc0 pcx1 pcy 2 ,
sy a2 b2 ln px b3 ln py c2 Vc0 pcx1 pcy 2 .
(x)
Nótese que, dadas las restricciones de los parámetros, sx sy 1.
Hacer uso de la relación inversa entre las funciones de utilidad
indirecta y de gasto, así como de cierta manipulación algebraica
adicional, simplifica estas ecuaciones de porciones presupuestales
de una manera adecuada para la estimación econométrica:
sx a1 b1 ln px b2 ln py c1 (E/p),
sy a2 b2 ln px b3 ln py c2 (E/p),
(xi)
donde p es un índice de precios definido por
ln p a0 a1 ln px a2 ln py 0.5b1 (ln px ) 2
b2 ln px ln py 0.5b3 (ln py ) 2 .
(xii)
En otras palabras, las ecuaciones de porciones del SDCI establecen que las porciones presupuestales son lineales en los logaritmos de precios y en los gastos totales reales. En la práctica, los
índices de precios más simples suelen sustituirse por el más
bien complejo índice dado en la ecuación xii, aunque existe cierta
controversia sobre esta práctica (véanse las extensiones del capítulo 5).
143
Patrones de gasto británicos
Entre 1954 y 1974, Deaton y Muellbauer aplican este sistema de
demanda al estudio de los patrones de gasto británicos. Determinan que los alimentos y la vivienda tienen coeficientes negativos
de gastos reales, lo que implica que la porción del ingreso que se
dedica a esos conceptos disminuye (al menos en Gran Bretaña)
a medida que la gente enriquece. Estos autores detectan asimismo
efectos significativos de los precios relativos en muchas de sus
ecuaciones de porciones, además de que los precios tienen efectos especialmente grandes en la explicación de la parte de los gastos que se asignan a transporte y comunicación. Al aplicar el
modelo del SDCI a datos reales, estos autores también encuentran
varias dificultades econométricas, la más importante de las cuales
es que muchas de las ecuaciones no parecen cumplir las restricciones necesarias para la homogeneidad. Abordar este tipo de
asuntos ha sido un tema relevante en investigaciones adicionales
sobre este sistema de demanda.
Referencias
Behrman, Jere R. “Is Variety the Spice of Life? Implications for
Caloric Intake”, Review of Economics and Statistics (noviembre de 1989), pp. 666-672.
Deaton, Angus y John Muellbauer. “An Almost Ideal Demand System”, American Economic Review (junio de 1980), pp. 312326.
Hyashi, Fumio. “Is the Japanese Extended Family Altruistically
Linked? A Test Based on Engel Curves”, Journal of Political
Economy (junio de 1995), pp. 661-674.
Kehoe, Patrick J. y Timothy J. Kehoe. Modeling North American
Economic Integration, Kluwer Academic Publishers, Londres, 1995.
Oczkowski, E. y N. E. Philip. “Household Expenditure Patterns
and Access to Consumer Goods in a Transitional Economy”,
Journal of Economic Development (junio de 1994), pp. 165183.
Stone, R. “Linear Expenditure Systems and Demand Analysis”,
Economic Journal (septiembre de 1954), pp. 511-527.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
CINCO
Efectos de ingreso
y de sustitución
En este capítulo se usará el modelo de optimización de la utilidad para estudiar cómo la cantidad
de un bien que un individuo elige se ve afectada por un cambio en el precio del mismo. Este examen nos permitirá elaborar la curva de demanda del individuo relativa a dicho bien. Entre tanto
se proporcionarán varios discernimientos sobre la naturaleza de la respuesta al precio y sobre los
tipos de supuestos en que se basa la mayoría de los análisis de la demanda.
FUNCIONES DE DEMANDA
Como se señaló en el capítulo 4, en principio es usualmente posible establecer las condiciones
necesarias de un máximo de utilidad para los niveles óptimos de x1, x2, . . . xn (y , el multiplicador
de Lagrange) como funciones de todos los precios y el ingreso. Matemáticamente, esto puede
expresarse como n funciones de demanda1 de la forma
x1 ( p1 , p2 , . . . , pn , I),
x1
x2
x2 ( p1 , p2 , . . . , pn , I),
..
.
(5.1)
xn ( p1 , p2 , . . . , pn , I).
xn
Si sólo hay dos bienes, x y y (el caso que por lo general nos interesará), esta notación puede simcarse un poco como
x
x( px , py , I),
y
y( px , py , I).
(5.2)
Una vez que se conoce la forma de las funciones de demanda, así como los valores de todos los
precios y el ingreso, se puede “predecir” cuánto de cada bien decidirá comprar un individuo. La
notación subraya el hecho de que precios e ingreso son “exógenos” a este proceso; es decir, son
parámetros sobre los cuales el individuo no tiene control en esta etapa del análisis. Los cambios
en esos parámetros alterarán, desde luego, la restricción presupuestal y causarán que un individuo
tome decisiones diferentes. Este cuestionamiento es el tema central de este y del siguiente capícamente, en este capítulo se considerarán las derivadas parciales x/ I y x/ px para
1
Las funciones de demanda en la ecuación 5.1 se conocen como funciones de demanda de Marshall (así llamadas en honor a Alfred
Marshall) para diferenciarlas de las funciones de demanda de Hicks (en honor a John Hicks), que abordaremos más adelante. La
diferencia entre estos dos conceptos se deriva de si el ingreso o la utilidad entra en las funciones. Para mayor simplicidad, a lo largo
de este texto el término funciones de demanda o curvas de demanda remitirá al concepto marshalliano, mientras que las referencias
a funciones de demanda y curvas de demanda hicksianas (o “compensadas”) se señalarán explícitamente.
145
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
146
Parte 2: Elección y demanda
cualquier bien x. En el capítulo 6 se abundará en este análisis al examinar los efectos de “precio
cruzado” de la forma x/py para cualquier par de bienes x y y.
Homogeneidad
Una primera propiedad de las funciones de demanda requiere un poco de matemáticas. Si se
duplicaran todos los precios y el ingreso (si, en realidad, se les multiplicara por cualquier constante positiva), las cantidades óptimas demandadas se mantendrían sin cambios. Duplicar todos
los precios y el ingreso sólo cambia las unidades con las que contamos, no la cantidad “real” de
bienes demandados. Este resultado puede verse de diversas formas, aunque quizá la más fácil
de ellas sea mediante gráficas. En referencia a las figuras 4.1 y 4.2 resulta claro que duplicar px, py
e I no afecta la gráfica de la restricción presupuestal. De ahí que x∗, y∗ siga siendo la combinación
elegida. En términos algebraicos, pxx pyy I es la misma restricción que 2pxx 2pyy 2I. Un
poco más técnicamente, este resultado puede escribirse diciendo que para cualquier bien xi,
xi∗ xi(p1, p2, . . . , pn, I) xi(tp1, tp2, . . . , tpn, tI)
(5.3)
para cualquier t 0. Se dice que las funciones que cumplen la propiedad ilustrada en la ecuación
5.3 son homogéneas de grado 0.2 De ahí que se haya demostrado que las funciones de demanda
individual son homogéneas de grado 0 en todos los precios y en el ingreso. Cambiar todos los precios
y el ingreso en las mismas proporciones no afectará las cantidades físicas de los bienes demandados. Este resultado indica que (en teoría) las demandas de los individuos no se verán afectadas
por una inflación “pura” durante la cual todos los precios e ingresos aumentan proporcionalmente. Estos seguirán demandando el mismo conjunto de bienes. Claro que si una inflación no
fuera pura (es decir, si algunos precios aumentaran más rápido que otros), no sería éste el caso.
EJEMPLO 5.1 Homogeneidad
La homogeneidad de la demanda es el resultado directo del supuesto de optimización de la utilidad. Las
funciones de demanda derivadas de la optimización de la utilidad serán homogéneas y a la inversa:
las funciones de demanda no homogéneas no pueden reflejar optimización de la demanda (a menos que
los precios entren directamente en la función de utilidad misma, como podría ocurrir para los bienes con
algún atractivo para los esnobs). Si, por ejemplo, la utilidad de un individuo respecto a alimentos (x) y
vivienda (y) está dada por
utilidad U(x, y) x0.3y0.7,
(5.4)
todo se reduce entonces (siguiendo el mismo procedimiento que en el ejemplo 4.1) a derivar las funciones de demanda
0.3I
,
px
0.7I
.
y py
x (5.5)
Estas funciones obviamente exhiben homogeneidad porque una duplicación de todos los precios y el
ingreso no afectarían a x∗ ni a y∗.
Si las preferencias de un individuo por x y y se reflejaran, en cambio, en la función ESC
U(x, y) x0.5 y0.5,
2
(5.6)
Más generalmente, como se vio en los capítulos 2 y 4, de una función f(x1, x2, . . . , xn) se dice que es homogénea de grado k si
f (tx1, tx2, . . . , txn) tkf(x1, x2, . . . , xn) para cualquier t 0. Los casos más comunes de funciones homogéneas son k 0 y k 1.
Si f es homogénea de grado 0, duplicar todos sus argumentos la deja sin cambios en valor. Si f es homogénea de grado 1, duplicar
todos sus argumentos duplicará su valor.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
147
entonces (como se mostró en el ejemplo 4.2) las funciones de demanda estarían dadas por
1
1 px /py
I
,
px
1
y 1 py /px
I
.
py
x (5.7)
Como ya vimos, estas dos funciones de demanda son homogéneas de grado 0; una duplicación de px, py
e I no afectaría a x∗ ni a y∗.
PREGUNTA: Las funciones de demanda derivadas en este ejemplo, ¿garantizan que el gasto total en x y
y agote el ingreso de un individuo para cualquier combinación de px, py e I? ¿Puedes demostrar que es éste
el caso?
VARIACIONES EN EL INGRESO
Al aumentar el poder de compra de una persona es natural esperar que la cantidad de cada bien
comprado también aumente. Esta situación se ilustra en la figura 5.1. Al incrementarse los gastos
de I1 a I2 a I3, la cantidad de x demandada aumenta de x1 a x2 a x3. Asimismo, la cantidad de y
aumenta de y1 a y2 a y3. Nótese que las líneas presupuestales I1, I2 e I3 son paralelas, en reflejo de
FIGURA 5.1
Efecto de un incremento
en el ingreso sobre las
cantidades de x y y
elegidas.
Al incrementarse el ingreso de I1 a I2 a I3 las opciones óptimas (de optimización de la utilidad) de x y y se
indican mediante los puntos sucesivamente más altos de la tangencia. Obsérvese que la restricción presupuestal se desplaza en forma paralela porque su pendiente (dada por px/py) no cambia.
Cantidad
de y
U1
U2
U3
y3
y2
U3
I3
y1
U2
I2
I1
x1
x2
U1
x3
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
Cantidad de x
23.08.2019
8/23
148
Parte 2: Elección y demanda
FIGURA 5.2
Mapa de curvas de
indiferencia que exhibe
inferioridad.
En este diagrama el bien z es inferior porque la cantidad adquirida decrece al incrementar el ingreso. Aquí,
y es un bien normal (como debe de ser si sólo hay dos bienes disponibles), y las compras de y aumentan al
aumentar los gastos totales.
Cantidad
de y
y3
U3
y2
U2
y1
I1
I2
I3
U1
Cantidad de z
z3 z2 z1
que lo único que cambia es el ingreso, no los precios relativos de x y y. Como la razón px /py se
mantiene constante, las condiciones de optimización de la utilidad también requieren que la TMS
se mantenga constante conforme el individuo se desplaza a mayores niveles de satisfacción. Así,
la TMS es igual en el punto (x3, y3) y en (x1, y1).
Bienes normales e inferiores
En la figura 5.1 tanto x como y se incrementan al crecer el ingreso; tanto x/I como y/I son
positivas. Esta podría considerarse la situación común, y los bienes que tienen esta propiedad se
llaman bienes normales en el rango de cambio de ingreso observado.
Para algunos bienes, sin embargo, la cantidad elegida puede decrecer al incrementar el ingreso
en algunos rangos. Ejemplos de tales bienes son la garrafa de whisky, las papas y la ropa de segunda
mano. Un bien z para el cual z/I es negativo se llama bien inferior. Este fenómeno se ilustra en
la figura 5.2. En ese diagrama el bien z es inferior porque para los incrementos en el ingreso en el
rango mostrado se elige menos de z. Nótese que las curvas de indiferencia no tienen que ser de
formas “raras” para exhibir inferioridad; las curvas correspondientes a los bienes y y z en la figura
5.2 siguen cumpliendo el supuesto de la TMS decreciente. El bien z es inferior dada la manera en
que se relaciona con los demás bienes disponibles (aquí el bien y), no a causa de una peculiaridad
exclusiva del mismo. De ahí que se desarrollen las siguientes definiciones.
DEFINICIÓN
Bienes normales e inferiores. Un bien xi para el cual xi /I 0 en algún rango de variaciones en el
ingreso es un bien inferior en ese rango. Si xi /I 0 en algún rango de variación en el ingreso, el bien es
un bien normal (o “no inferior”) en ese rango.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
149
VARIACIONES EN EL PRECIO DE UN BIEN
El efecto de un cambio de precio sobre la cantidad demandada de un bien es más complejo de
analizar que el efecto de un cambio en el ingreso. Geométricamente, esto se debe a que cambiar
un precio implica cambiar no sólo una de las intercepciones de la restricción presupuestal, sino
también su pendiente. En consecuencia, el desplazamiento a la nueva opción de optimización de
la utilidad supone no sólo pasar a otra curva de indiferencia, sino también cambiar la TMS. Así,
cuando un precio cambia entran en juego dos efectos analíticamente diferentes. Uno de ellos es el
efecto de sustitución: aun si el individuo permaneciera en la misma curva de indiferencia se asignarían patrones de consumo que igualarían la TMS con la nueva razón de precio. Emerge un
segundo efecto, el efecto de ingreso, porque un cambio de precio cambia necesariamente el ingreso
“real” de un individuo. Una persona no puede permanecer en la curva de indiferencia inicial y
debe transitar a una nueva. Analicemos estos efectos gráficamente. Luego ofreceremos un desarrollo matemático.
Análisis gráfico de un decremento en el precio
En la figura 5.3 se ilustran los efectos de ingreso y de sustitución. Una persona optimiza inicialmente su utilidad (sujeta a gastos totales, I), consumiendo la combinación x∗, y∗. La restricción
presupuestal inicial es I px1x pyy. Supongamos ahora que el precio de x decrece a px2. La nueva
restricción presupuestal está dada por la ecuación I px2x pyy en la figura 5.3.
Resulta claro que la nueva posición de utilidad óptima es x∗∗, y∗∗, donde la nueva línea presupuestal es tangente a la curva de indiferencia U2. El desplazamiento a este nuevo punto puede
verse compuesto por dos efectos. Primero, el cambio en la pendiente de la restricción presupuestal motiva un desplazamiento al punto B, aun si las opciones se hubieran limitado a la curva de
indiferencia original U1. La línea punteada en la figura 5.3 tiene la misma pendiente que la nueva
restricción presupuestal (I px2x pyy), pero sigue un trazo tangente a U1 porque conceptualmente se mantiene constante el ingreso “real” (es decir, la utilidad). Un precio relativamente menor
para x causará un movimiento de x∗, y∗ a B si no permitimos que este individuo esté en mejores
condiciones a raíz del precio menor. Este desplazamiento es una demostración gráfica del efecto
de sustitución. El movimiento adicional de B al punto óptimo x∗∗, y∗∗ es analíticamente idéntico a
la clase de cambio exhibido por variaciones en el ingreso. Como el precio de x ha decrecido, esta
persona tiene un mayor ingreso “real” y puede permitirse un nivel de utilidad (U2) mayor que el
que antes podía alcanzar. Si x es un bien normal se elegirá más del mismo en respuesta a este
incremento en el poder de compra. Esta observación explica el origen del término efecto de ingreso
para ese desplazamiento. En general, entonces, el resultado del decremento de precio es que causa
que se demande más x.
Es importante reconocer que en realidad esta persona no toma una serie de decisiones de x∗, y∗
a B y luego a x∗∗, y∗∗. Jamás observamos el punto B; sólo se reflejan las dos posiciones óptimas en
el comportamiento observado. Sin embargo, la noción de los efectos de ingreso y de sustitución
son analíticamente valiosos porque muestra que un cambio de precio afecta la cantidad demandada de x en dos formas conceptualmente distintas. Veremos cómo esta separación ofrece importantes discernimientos en la teoría de la demanda.
Análisis gráfico de un incremento en el precio
Si el precio del bien x se incrementara se usaría un análisis similar. En la figura 5.4 la línea presupuestal se ha desplazado hacia dentro debido a un incremento en el precio de x de px1 a px2. El
desplazamiento desde el punto inicial de optimización de la utilidad (x∗, y∗) al nuevo punto (x∗∗,
y∗∗) puede descomponerse en dos efectos. Primero, aun si esta persona pudiera permanecer en la
curva de indiferencia inicial (U2), habría un incentivo para sustituir y por x y transitar a lo largo
de U2 al punto B. Sin embargo, puesto que el poder de compra se ha reducido, debido al incre-
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
150
Parte 2: Elección y demanda
FIGURA 5.3
Demostración de los
efectos de ingreso y de
sustitución de un
decremento en el precio
de x.
Cuando el precio de x decrece de px1 a px2, la opción de optimización de la utilidad pasa de x∗, y∗ a x∗∗, y∗∗.
Este desplazamiento puede desglosarse en dos efectos analíticamente distintos: primero, el efecto de sustitución, que implica un desplazamiento a lo largo de la curva de indiferencia inicial al punto B, donde la TMS
es igual a la nueva razón de precio; y segundo, el efecto de ingreso, que supone un desplazamiento a un nivel
de utilidad más alto porque el ingreso real se ha incrementado. En el diagrama los efectos tanto de sustitución como de ingreso provocan que se compre más x cuando su precio decrece. Nótese que el punto I/py es
el mismo que antes del cambio de precio; esto se debe a que py no ha cambiado. Así, el punto I/py aparece
tanto en las antiguas como en las nuevas restricciones presupuestales.
Cantidad
de y
U1
U2
I
py
I = px1x + pyy
y**
y*
I = p2x x + pyy
B
U2
U1
x*
xB
Cantidad de x
x**
Efecto
Efecto de
sustitución de ingreso
Incremento total
en x
mento en el precio de x, debe desplazarse a un nivel de utilidad más bajo. Este desplazamiento se
llama, como ya se dijo, efecto de ingreso. Adviértase en la figura 5.4 que los efectos tanto de ingreso
como de sustitución operan en la misma dirección y provocan que la cantidad demandada de x se
reduzca, en respuesta a un incremento en su precio.
Efectos de las variaciones de precio para bienes inferiores
Hasta aquí se ha demostrado que los efectos de sustitución y de ingreso tienden a reforzarse entre
sí. Para un decremento de precio ambos provocan que se demande más del bien, mientras que
para un incremento de precio, ambos propician que se demande menos. Aunque este análisis es
atinado para el caso de los bienes normales (no inferiores), la posibilidad de bienes inferiores
complica la historia. En este caso, los efectos de ingreso y de sustitución operan en direcciones opuestas, y el resultado combinado de un cambio de precio es indeterminado. Un decremento
en el precio, por ejemplo, siempre hará que un individuo tienda a consumir más de un bien a
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
FIGURA 5.4
Demostración de los
efectos de ingreso y de
sustitución de un incremento en el precio de x.
151
Cuando el precio de x se incrementa la restricción presupuestal se desplaza hacia dentro. El desplazamiento desde el punto inicial de optimización de la utilidad (x∗, y∗) al nuevo punto (x∗∗, y∗∗) puede analizarse como dos efectos aparte. El efecto de sustitución se describiría como un desplazamiento al punto B
sobre la curva de indiferencia inicial (U2). El incremento en el precio, sin embargo, creará una pérdida de
poder de compra y un desplazamiento consecuente a una curva de indiferencia más baja. Este es el efecto
de ingreso. En el diagrama los efectos tanto de ingreso como de sustitución causan que la cantidad de x
decrezca a raíz del incremento en su precio. También en este caso el punto I/py no se ve afectado por el
cambio en el precio de x.
Cantidad
de y
I
py
U1
U2
B
y**
I = p x2 x + p y y
y*
I = p x1 x + p y y
U2
U1
x**
xB
x*
Cantidad de x
Efecto de Efecto de
ingreso sustitución
Reducción total
en x
causa del efecto de sustitución. Pero si el bien es inferior el incremento en el poder de compra causado por el decremento de precio puede provocar que se compre menos del bien. Así, el resultado
es indeterminado: el efecto de sustitución tiende a incrementar la cantidad del bien inferior comprado, mientras que el (perverso) efecto de ingreso tiende a reducir esa cantidad. A diferencia de
la situación para los bienes normales, aquí no es posible predecir siquiera la dirección del efecto
de un cambio en px sobre la cantidad consumida de x.
Paradoja de Giffen
Si el efecto de ingreso de un cambio de precio es lo bastante fuerte, el cambio en el precio y el
cambio resultante en la cantidad demandada podrían moverse en realidad en la misma dirección.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
152
Parte 2: Elección y demanda
Cuenta la leyenda que el economista inglés Robert Giffen observó esta paradoja en la Irlanda del
siglo xix: supuestamente, cuando el precio de las papas subía la gente consumía más papas. Este
resultado peculiar puede explicarse estudiando la magnitud del efecto de ingreso de un cambio en
el precio de las papas. Las papas no sólo eran bienes inferiores, sino que también absorbían una
gran porción del ingreso del pueblo irlandés. Así, un incremento en el precio de las mismas reducía sustancialmente el ingreso real. Los irlandeses se veían obligados a reducir el consumo de
otros alimentos suntuarios para comprar más papas. Aunque esta versión de los hechos es históricamente inverosímil, la posibilidad de un incremento en la cantidad demandada, en respuesta a
un incremento en el precio de un bien, ha dado en llamarse paradoja de Giffen.3 Más adelante se
proporcionará un análisis matemático de cómo puede presentarse esta paradoja.
Sinopsis
De ahí que nuestro análisis gráfico nos lleve a las conclusiones siguientes.
PRINCIPIO DE
OPTIMIZACIÓN
Efectos de ingreso y de sustitución. La hipótesis de optimización de la utilidad sugiere que para bienes
normales un decremento en el precio de un bien conduce a un incremento en la cantidad adquirida,
debido a que 1) el efecto de sustitución provoca que se compre más a medida que la persona se desplaza a
lo largo de una curva de indiferencia, y 2) el efecto de ingreso hace que se compre más porque el decremento en el precio ha incrementado el poder de compra, permitiendo así un desplazamiento a una curva
de indiferencia más alta. Cuando el precio de un bien normal se incrementa, un razonamiento similar
predice un decremento en la cantidad adquirida. Para bienes inferiores los efectos de sustitución y de
ingreso operan en direcciones opuestas y no es posible hacer predicciones definidas.
CURVA DE DEMANDA DE UNA PERSONA
Con frecuencia los economistas desean graficar funciones de demanda. Sin duda no te sorprenderá saber que esas gráficas se llaman “curvas de demanda”. Comprender cómo se relacionan esas
curvas de uso muy común con las funciones de demanda subyacentes brinda discernimientos
adicionales incluso sobre los argumentos económicos fundamentales. Para simplificar el desarrollo supongamos que sólo hay dos bienes y que, como antes, la función de demanda para el bien x
está dada por
x∗ x(px, py, I).
La curva de demanda derivada de esta función examina la relación entre x y px, manteniendo
constantes py, I y las preferencias. Es decir, muestra la relación
x∗ x(px, py, I).
(5.8)
donde las barras sobre py e I indican que estos determinantes de la demanda se mantienen constantes. Esta construcción se advierte en la figura 5.5. La gráfica muestra opciones de optimización
de la utilidad de x y y conforme se le presentan a este individuo precios sucesivamente más bajos
del bien x (manteniendo constantes py e I). Suponemos que las cantidades de x elegidas aumentan
de x a x y x al decrecer el precio de ese bien de px a p a px. Tal supuesto concuerda con nuestra
3
Un problema importante de esta explicación es que desestima la observación de Marshall en el sentido de que factores tanto de
oferta como de demanda deben tomarse en cuenta al analizar las variaciones de precio. Si el precio de las papas hubiera aumentado
a causa de una plaga en Irlanda, la oferta se habría reducido; por tanto, ¿cómo es posible que se hayan consumido más papas?
Asimismo, dado que muchos irlandeses cultivaban papas, el incremento en el precio de estas habría incrementado el ingreso real
por ellas. Para un análisis detallado de estos y otros interesantes aspectos del saber popular sobre las papas, véase G. P. Dwyer y C.
M. Lindsey, “Robert Giffen and the Irish Potato”, American Economic Review (marzo de 1984), pp. 188-192.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
FIGURA 5.5
Construcción de la curva
de demanda de una
persona.
153
En a) se muestran las opciones de optimización de la utilidad del individuo de x y y para tres diferentes
precios de x(px, px y px). En b), esta relación entre px y x se usa para elaborar la curva de demanda de x. Esta
curva de demanda se traza con base en el supuesto de que py, I y las preferencias se mantienen constantes
conforme px varía.
Cantidad
de y por
periodo
I /py
I = p x′ x + p y y
I = p x″ x + p y y
I = p x′′′ x + p y y
U3
U2
U1
x′
x″
x′′′
Cantidad de x por periodo
a) Mapa de curvas de indiferencia del individuo
px
p x′
p x″
p ′′′
x
x( p x , p y, I)
x′
x″
Cantidad de x por periodo
x′′′
(b) Curva de demanda
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
154
Parte 2: Elección y demanda
conclusión general de que, salvo en el caso inusual de la paradoja de Giffen, x/px la pendiente
es negativa.
En la figura 5.5b la información sobre las opciones de optimización de la utilidad del bien x se
transfiere a una curva de demanda con px en el eje vertical y compartiendo el mismo eje horizontal de la figura 5.5a. La pendiente negativa de la curva refleja de nuevo el supuesto de que x/px
es negativa. De ahí que la curva de demanda individual pueda definirse como sigue.
DEFINICIÓN
Curva de demanda de una persona. Una curva de demanda de una persona muestra la relación entre el
precio de un bien y la cantidad de ese bien adquirida por un individuo, suponiendo que todos los demás
determinantes de la demanda se mantienen constantes.
La curva de demanda que se ilustra en la figura 5.5 permanece en una posición fija sólo mientras todos los demás determinantes de la demanda se mantengan sin cambios. Si uno de estos
otros factores cambiara la curva podría desplazarse a una nueva posición, como describiremos en
seguida.
Desplazamientos en la curva de demanda
Tres factores se mantuvieron constantes al derivar esta curva de demanda: 1) ingreso, 2) precios
de otros bienes (digamos, py) y 3) las preferencias del individuo. Si alguno de ellos cambiara, la
curva de demanda entera podría desplazarse a una nueva posición. Por ejemplo, si I se incrementara, la curva se desplazaría hacia fuera (siempre y cuando x/I 0; es decir, que el bien sea un
bien “normal” en este rango de ingreso). Para cada menor precio se demandaría más cantidad de
x. Si otro precio cambiara (digamos, py) la curva se desplazaría hacia dentro o hacia fuera, dependiendo justamente de cómo se relacionen x y y. En el capítulo siguiente se examinará en detalle
esa relación. Por último, si las preferencias del individuo por el bien x cambiaran, la curva se
desplazaría. Una súbita campaña publicitaria de la McDonald’s Corporation podría desplazar la
demanda de hamburguesas hacia fuera, por ejemplo.
Como obviamente deja ver este análisis debemos recordar que la curva de demanda es sólo
una representación bidimensional de la verdadera función de demanda (ecuación 5.8) y que sólo
es estable si lo demás se mantiene constante. Es importante tener en claro la diferencia entre un
movimiento a lo largo de una curva de demanda dada, causado por un cambio en px y un desplazamiento de la curva entera motivado por un cambio en el ingreso, en uno de los demás precios
o en las preferencias. Tradicionalmente, el término un incremento en la demanda se reserva para
un desplazamiento hacia fuera en la curva de demanda, mientras que el término un incremento en
la cantidad demandada se refiere a un movimiento a lo largo de una curva dada, causado por una
caída en px.
EJEMPLO 5.2 Funciones de demanda y curvas de demanda
Para poder graficar una curva de demanda a partir de una función de demanda dada debemos suponer
que las preferencias que generaron la función permanecen estables y que se conocen los valores del
ingreso y de otros precios relevantes. En el primer caso que se estudió en el ejemplo 5.1 se determinó que
x
0.3I
px
y
0.7I
.
py
(5.9)
y
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
155
Si las preferencias no cambian y si el ingreso de una persona es de 100 dólares, estas funciones se convierten en
30
,
px
70
y ,
py
x
(5.10)
o
px x 30,
py y 70,
lo cual deja en claro que las curvas de demanda para esos dos bienes son hipérbolas simples. Un incremento en el ingreso desplazaría hacia fuera las dos curvas de demanda. Nótese también, en este caso, que
la curva de demanda para x no es desplazada por variaciones en py y viceversa.
Para el segundo caso que se examinó en el ejemplo 5.1 el análisis es más complejo. Respecto al bien x,
sabemos que
x
1
1 px /py
I
,
px
(5.11)
así que para graficar esto en el plano px x debemos conocer tanto I como py. Si suponemos también que
I 100 y concedemos que py 1, entonces la ecuación 5.11 se convierte en
x
100
,
p2x px
(5.12)
la que, al graficarse, también exhibirá una relación hiperbólica general entre precio y cantidad consumida. En este caso la curva será relativamente más plana porque los efectos de sustitución son mayores
que en el caso de la función Cobb-Douglas. Por la ecuación 5.11 también sabemos que
x
1
I
1 px /py
1
px
0
(5.13)
y
x
I
py ( px py ) 2
0,
de manera que los incrementos en I o py desplazarían hacia fuera la curva de demanda del bien x.
PREGUNTA: ¿Cómo cambiarían las funciones de demanda en las ecuaciones 5.10 si una persona gastara
la mitad de su ingreso en cada bien? Demuestra que estas funciones de demanda predicen el mismo
consumo de x en el punto px 1, py 1, I 100 que la ecuación 5.11. Usa un ejemplo numérico
para demostrar que la función de demanda ESC es más sensible a un incremento en px que la función de
demanda Cobb-Douglas.
CURVAS Y FUNCIONES DE DEMANDA
COMPENSADA (DE HICKS)
En la figura 5.5 el nivel de utilidad que una persona obtiene varía a lo largo de la curva de demanda.
Al decrecer px, la persona se encuentra en condiciones cada vez mejores, como lo indica el incremento en utilidad de U1 a U2 a U3. La razón de que esto ocurra es que la curva de demanda se
traza con base en el supuesto de que el ingreso nominal y otros precios se mantienen constantes;
de ahí que una reducción en px deje en mejores condiciones a esta persona al incrementar su
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
156
Parte 2: Elección y demanda
capacidad de poder de compra real. Aunque esta es la forma más común de imponer el supuesto
ceteris paribus al desarrollar una curva de demanda, no es la única. Otro método mantiene constante el ingreso real (o utilidad) al examinar reacciones a las variaciones en px. La derivación se
ilustra en la figura 5.6, donde se mantiene constante la utilidad (en U2) al tiempo que se reduce
sucesivamente px. Al decrecer px el ingreso nominal del individuo se reduce de manera efectiva,
impidiendo así todo incremento en utilidad. En otras palabras, los efectos de la variación de precio en el poder de compra son “compensados” para obligar al individuo a permanecer en U2. Las
reacciones a los precios cambiantes sólo incluyen efectos de sustitución. Si, en cambio, se examinaran los efectos de los incrementos en px la compensación del ingreso sería positiva: el ingreso
de la persona tendría que incrementarse para permitirle permanecer en la curva de indiferencia
U2 en respuesta a los incrementos de precio. Estos resultados pueden resumirse como sigue.
FIGURA 5.6
Elaboración de una curva
de demanda compensada.
La curva xc muestra cómo la cantidad demandada de x cambia cuando px cambia, manteniendo constantes
py y la utilidad. Es decir, el ingreso del individuo es “compensado” para mantener constante la utilidad. De
ahí que xc sólo refleje efectos de sustitución de precios cambiantes.
Cantidad
de y
Pendiente =
p x′
py
Pendiente =
p x″
py
Pendiente =
p′′′
x
py
U2
x′
x″
x ′′′
Cantidad de x
(a) Mapa de curvas de indiferencia de un individuo
px
p x′
p x″
p ′′′
x
x c ( p x , p y, U)
x′
x″
x″
(b) Curva de demanda compensada
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
Cantidad de x
8/23
Capítulo 5: Efectos de ingreso y de sustitución
DEFINICIÓN
157
Curva de demanda compensada. Una curva de demanda compensada muestra la relación entre el precio
de un bien y la cantidad adquirida con base en el supuesto de que los demás precios y la utilidad se mantienen constantes. Así, esta curva (también llamada curva de demanda de Hicks en honor al economista
británico John Hicks) sólo ilustra efectos de sustitución. Matemáticamente, la curva es una representación bidimensional de la función de demanda compensada
xc xc(px, py, U).
(5.14)
Adviértase que la única diferencia entre la función de demanda compensada en la ecuación 5.14 y las
funciones de demanda no compensada en las ecuaciones 5.1 o 5.2 es si la utilidad o el ingreso entran en
las funciones. De ahí que la principal diferencia entre las curvas de demanda compensada y no compensada es si la utilidad o el ingreso se mantienen constantes en la elaboración de las curvas.
Lema de Shephard
Muchos hechos sobre las funciones de demanda compensada pueden comprobarse fácilmente
usando un resultado notorio de la teoría de la dualidad llamada lema de Shephard (la cual debe su
nombre a R. W. Shephard, pionero en el uso de la teoría de la dualidad en funciones de producción y costo; véanse los capítulos 9 y 10). Consideremos el problema dual de minimización del
gasto, expuesto en el capítulo 4. La expresión lagrangiana para ese problema fue
].
ᏸ pxx pyy [U(x, y) U
(5.15)
La solución de este problema produce la función de gasto E(px, py, U). Es posible aplicar el teorema de la envolvente a esta función advirtiendo que su derivada respecto a los precios de uno de
los bienes puede interpretarse diferenciando la expresión lagrangiana en la ecuación 5.15:
E( px , py , U) ᏸ
xc ( px , py , U).
px
px
(5.16)
Es decir, la función de demanda compensada de un bien siempre puede hallarse a partir de la
función de gasto por diferenciación respecto al precio de ese bien. Para ver intuitivamente por qué
esa derivada es una función de demanda compensada nótese primero que tanto la función de
gasto como la función de demanda compensada dependen de las mismas variables (px, py y U); el
valor de una derivada siempre dependerá de las mismas variables que intervienen en la función
original. Segundo, puesto que se diferencia una función minimizada se tiene la seguridad de que
a cualquier cambio en precios le corresponderá una serie de ajustes en cantidades compradas
que seguirá minimizando los gastos necesarios para llegar a un nivel de utilidad dado. Por último,
variaciones en el precio de un bien afectarán los gastos en relativa proporción con la cantidad
comprada de ese bien, justo lo que indica la ecuación 5.16.
Uno de los muchos discernimientos que pueden derivarse del lema de Shephard concierne a la
pendiente de la curva de demanda compensada. En el capítulo 4 se demostró que la función de
gasto debe ser cóncava en precios. En términos matemáticos, 2E(px, py, V)/px2 0. Tomar en
cuenta el lema de Shephard, sin embargo, implica que:
2 E( px , py , V) [E( px , py , V)/ px] x c ( px , py , V)
0.
px2
px
px
(5.17)
De ahí que la curva de demanda compensada deba tener pendiente negativa. La ambigüedad
que surge cuando los efectos de sustitución y de ingreso operan en direcciones opuestas para las
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
158
Parte 2: Elección y demanda
curvas de demanda de Marshall no emerge en el caso de las curvas de demanda compensada
porque estas sólo implican efectos de sustitución.
Relación entre curvas de demanda compensada
y no compensada
Esta relación entre los dos conceptos de curva de demanda se ilustra en la figura 5.7. En px las
curvas se interceptan porque a ese precio el ingreso del individuo es suficiente para alcanzar el
nivel de utilidad U2 (compárense las figuras 5.5 y 5.6). De ahí que x se demande en cualquier
concepto de demanda. Para precios inferiores a px, sin embargo, el individuo sufre una reducción compensatoria en el ingreso sobre la curva xc que impide que un incremento en utilidad
surja del precio más bajo. De la suposición de que x es un bien normal se desprende que se
demanda menos x en px a lo largo de xc que a lo largo de la curva no compensada x. O bien, para
un precio superior a px (como px), la compensación del ingreso es positiva porque el individuo
necesita cierta ayuda para permanecer en U2. Suponiendo nuevamente que x es un bien normal,
en px se demanda más x a lo largo de xc que de x. En general, entonces, para un bien normal la
curva de demanda compensada es un poco menos sensible a variaciones de precio que la curva
no compensada. Esto se debe a que esta última refleja efectos de las variaciones de precio, tanto
de sustitución como de ingreso, mientras que la curva compensada sólo refleja efectos de sustitución.
La decisión entre usar curvas de demanda compensada o no compensada en el análisis económico, es en gran medida, cuestión de conveniencia. En casi todos los trabajos empíricos se usan
las curvas de demanda no compensada (o de Marshall) por los datos sobre precios e ingresos
FIGURA 5.7
Comparación de curvas
de demanda compensada
y no compensada.
Las curvas de demanda compensada (xc) y no compensada (x) se interceptan en px porque x es demandado
en cada concepto. Para precios por encima de px el poder de compra del individuo debe incrementarse con
la curva de demanda compensada; por tanto, se demanda más x que con la curva no compensada. Para
precios por debajo de px el poder de compra debe reducirse para la curva compensada; de este modo, se
demanda menos x que con la curva no compensada. La curva de demanda estándar es más sensible al precio
porque incorpora efectos tanto de sustitución como de ingreso, mientras que la curva xc sólo refleja efectos
de sustitución.
px
p x′
p x″
p ′′′
x
x( p x , p y, I)
x c ( p x , p y, U)
x′
x∗
x″
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
x ∗∗
x′′′
23.08.2019
Cantidad de x
8/23
Capítulo 5: Efectos de ingreso y de sustitución
159
nominales necesarios para estimarlas son fáciles de conseguir. En las extensiones del capítulo 12
se describen algunas de estas estimaciones y se muestra cómo podrían usarse para propósitos
políticos prácticos. Para algunos propósitos teóricos, sin embargo, las curvas de demanda compensada son un concepto más apropiado, ya que la posibilidad de mantener constante la utilidad
ofrece ciertas ventajas. Nuestro análisis del “superávit del consumidor”, que aparecerá más adelante, aporta una ilustración de dichas ventajas.
EJEMPLO 5.3 Funciones de demanda compensada
En el ejemplo 3.1 se supuso que la función de utilidad para hamburguesas (y) y refrescos (x) estaba dada
por
utilidad U(x, y) x0.5y0.5,
(5.18)
y en el ejemplo 4.1 se mostró que las funciones de demanda de Marshall pueden calcularse para esas
funciones de utilidad como
0.5I
px
0.5I
y( px , py , I) .
py
x( px , py , I) (5.19)
En el ejemplo 4.4 se estableció que la función de gasto en este caso está dada por E(px, py, U) 2px0.5py0.5U.
Así, ahora podemos usar el lema de Shephard para calcular las funciones de demanda compensada como:
E( px , py , U)
px 0.5 p0.5
y U
px
E( px , py , U)
0.5
yc ( px , py , U) p0.5
U.
x py
py
xc ( px , py , U) (5.20)
A veces se emplea la utilidad indirecta, V, en estas funciones de demanda compensada en vez de U, pero
esto no cambia el significado de las expresiones; estas funciones de demanda muestran cómo reacciona
un individuo a las variaciones de precio, manteniendo constante la utilidad.
Aunque py no interviene en la función de demanda no compensada para x, sí lo hace en la función
compensada: incrementos en py desplazan hacia fuera la curva de demanda compensada para x. Los dos
conceptos de demanda coinciden en el punto inicial supuesto px 1, py 4, I 8 y U 2; las ecuaciones
5.19 predicen x 4, y 1 en este punto, igual que las ecuaciones 5.20. Sin embargo, para px 1 o px 1
las demandas difieren en ambos conceptos. Si, por decir algo, px 4, las funciones no compensadas
predicen x 1, y 1, mientras que las funciones compensadas predicen x 2, y 2. La reducción en
x resultante del incremento en su precio es menor con la función de demanda compensada que con la
función no compensada porque el primer concepto ajusta el efecto negativo sobre el poder de compra
ocasionado por el incremento de precio.
Este ejemplo deja en claro los diferentes supuestos ceteris paribus inherentes a los dos conceptos de
demanda. Con la demanda no compensada los gastos se mantienen constantes en I 2, de modo que el
incremento en px de 1 a 4 resulta en una pérdida de utilidad; en este caso, la utilidad decrece de 2 a 1. En
el caso de la demanda compensada, la utilidad se mantiene constante en U 2. Para mantener constante
la utilidad los gastos deben aumentar a E 4(2) 4(2) 16 para neutralizar los efectos del incremento
de precio.
PREGUNTAS: ¿Las funciones de demanda compensada dadas en las ecuaciones 5.20 son homogéneas
de grado 0 en px y py, si la utilidad se mantiene constante? ¿Esperarías que esto fuera cierto para todas las
funciones de demanda compensada?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
160
Parte 2: Elección y demanda
DESARROLLO MATEMÁTICO DE LA RESPUESTA
A LAS VARIACIONES DE PRECIO
Hasta este punto nos hemos apoyado en gran medida en recursos gráficos para describir la
manera en que los individuos responden a las variaciones de precio. Discernimientos adicionales
son provistos por un enfoque más matemático. Nuestro objetivo básico es examinar la derivada
parcial x/px; es decir, cómo un cambio en el precio de un bien afecta su compra, ceteris paribus
para la curva de demanda usual de Marshall. En el capítulo siguiente se aborda el tema de cómo
las variaciones en el precio de una mercancía afectan las compras de otra.
Método directo
Nuestro objetivo es usar el modelo de optimización de la utilidad para saber algo sobre la forma
en que cambia la demanda del bien x cuando px cambia; esto es, queremos calcular x/px. El
método directo para resolver este problema hace uso de las condiciones de primer orden para la
optimización de la utilidad. La diferenciación de esas n 1 ecuaciones produce un nuevo sistema
de n 1 ecuaciones, que eventualmente pueden despejar la derivada que buscamos.4 Lamentablemente, obtener esta solución es muy laborioso y los pasos requeridos para hacerlo aportan
pocos discernimientos económicos. De ahí que, en cambio, adoptemos un método indirecto fundado en el concepto de la dualidad. Al final, ambos métodos arrojan la misma conclusión, pero el
indirecto es mucho más rico para la economía por los términos que contiene.
Método indirecto
Para iniciar nuestro método indirecto5 supondremos (una vez más) que sólo hay dos bienes
(x y y) y nos centraremos en la función de demanda compensada, xc(px, py, U), y su relación con
la función de demanda ordinaria, x(px, py, I).
Por definición sabemos que
xc(px, py, U) x[px, py, E(px, py, U)].
(5.21)
Esta conclusión ya fue introducida en relación con la figura 5.7, que mostró que la cantidad
demandada es idéntica para las funciones de demanda compensada y no compensada cuando el
ingreso es justo el necesario para alcanzar el nivel de utilidad requerido. La ecuación 5.21 se
obtiene insertando ese nivel de gasto en la función de demanda, x(px, py, I). Ahora podemos proceder diferenciando parcialmente la ecuación 5.21 respecto a px y reconociendo que esta variable
interviene en la función de demanda ordinaria en dos lugares. De ahí que
xc
x x E
,
px px E px
(5.22)
x
xc
px px
(5.23)
y reordenar los términos produce
x E
.
E px
4
Véase, por ejemplo, Paul A. Samuelson, Foundations of Economic Analysis (Harvard University Press, Cambridge, 1947), pp. 101103.
5
La prueba siguiente fue originalmente popularizada por Phillip J. Cook en “A ‘One Line’ Proof of the Slutsky Equation”, American
Economic Review, núm. 62 (marzo de 1972), p. 139.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
161
Efecto de sustitución
En consecuencia, la derivada que buscamos tiene dos términos. La interpretación del primero es
simple: es la pendiente de la curva de demanda compensada. Pero esa pendiente representa movimiento a lo largo de una sola curva de indiferencia; es, de hecho, lo que hemos llamado el efecto
de sustitución. El primer término de la derecha de la ecuación 5.23 es una representación matemática de dicho efecto.
Efecto de ingreso
El segundo término de la ecuación 5.23 refleja la manera en que las variaciones en px afectan la
demanda de x a través de las variaciones en los niveles de gastos necesarios (es decir, cambios en
la capacidad de poder de compra ). Por tanto, este término refleja el efecto de ingreso. El signo
negativo en la ecuación 5.23 señala la dirección del efecto. Por ejemplo, un incremento en px
incrementa a su vez el nivel de gasto que habría sido necesario para mantener constante la utilidad (matemáticamente, E/px 0). Pero como el ingreso nominal se mantiene constante en la
demanda de Marshall, estos gastos adicionales no están disponibles. De ahí que x (y y) deben reducirse para enfrentar esta deficiencia. La medida de la reducción en x está dada por x/E. Por otro
lado, si px decrece, el nivel de gasto requerido para alcanzar una utilidad determinada también
decrece. La reducción en x que acompañaría normalmente dicho decremento en gastos es justo el
monto que debe reponerse mediante el efecto de ingreso. Nótese que en este caso el efecto de
ingreso opera para incrementar el monto de x.
La ecuación de Slutsky
Las relaciones incorporadas en la ecuación 5.23 fueron descubiertas por el economista ruso
Eugen Slutsky, a fines del siglo xix. Para enunciar el resultado como Slutsky lo hizo se requiere un
ligero cambio en la notación. Escribamos primero el efecto de sustitución como
efecto de sustitución xc
x
px px
(5.24)
Uconstante
para indicar movimiento a lo largo de una sola curva de indiferencia. En cuanto al efecto de
ingreso tenemos
efecto de ingreso x E
E px
x E
,
I px
(5.25)
porque las variaciones en el ingreso o los gastos equivalen a lo mismo en la función x(px, py, I).
El segundo término del efecto de ingreso puede interpretarse usando el lema de Shephard.
Esto es, E/px xc. En consecuencia, el efecto de ingreso total está dado por
efecto de ingreso xc
x
.
I
(5.26)
Forma final de la ecuación de Slutsky
Unir las ecuaciones 5.24-5.26 nos permite ensamblar la ecuación de Slutsky en la forma en que se
le derivó originalmente:
x
x( px , py , I)
efecto de sustitución efecto de ingreso px
px
x
Uconstante
x
(5.27)
I
en donde hemos considerado el hecho de que en el punto de optimización de la utilidad x(px, py, I)
xc(px, py, V).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
162
Parte 2: Elección y demanda
Esta ecuación permite un tratamiento más definido de la dirección y la magnitud de los efectos
de sustitución e ingreso del que fue posible con el análisis gráfico. Primero, como se ha demostrado, el efecto de sustitución (y la pendiente de la curva de demanda compensada) siempre es
negativo. Este resultado se deriva lo mismo de la cuasi concavidad de las funciones de utilidad
(TMS decreciente), que de la concavidad de la función de gasto. En la última sección de este capítulo se mostrará la negatividad del efecto de sustitución en una forma algo diferente.
El signo del efecto de ingreso (xx/I) depende del signo de x/I. Si x es un bien normal,
entonces x/I es positiva y el efecto de ingreso total, al igual que el de efecto sustitución, es negativo. Por tanto, para bienes normales, precio y cantidad siempre se mueven en direcciones opuestas. Por ejemplo, un decremento en px incrementa el ingreso real, y como x es un bien normal, las
compras de x se incrementan. De igual modo, un incremento en px reduce el ingreso real y por
tanto, las compras de x decrecen. En general, entonces, como ya se describió al usar el análisis
gráfico, los efectos de sustitución e ingreso operan en la misma dirección para producir una curva
de demanda de pendiente negativa. En el caso de un bien inferior, x/I 0 y los dos términos de
la ecuación 5.27 tienen signos diferentes. De ahí que el impacto general de un cambio en el precio
de un bien sea ambiguo; todo depende de las magnitudes relativas de los efectos. Al menos teóricamente es posible que, en el caso de los bienes inferiores, el segundo término domine al primero
lo cual conduce a la paradoja de Giffen (x/px 0).
EJEMPLO 5.4 Una descomposición de Slutsky
La descomposición de un efecto de precio, descubierto por Slutsky, puede ilustrarse convenientemente
con el ejemplo de la función Cobb-Douglas que ya hemos estudiado. En el ejemplo 5.3 se estableció que
la función de demanda de Marshall para el bien x es
x(px , py , I) 0.5I
px
(5.28)
y que la función de demanda compensada para este bien es
xc(px, py, U) px0.5py0.5U.
(5.29)
De ahí que el efecto total de un cambio de precio sobre la demanda de Marshall pueda determinarse
diferenciando la ecuación 5.28:
x(px , py , I)
0.5I
2 .
px
px
(5.30)
Deseamos demostrar que esta es la suma de los dos efectos identificados por Slutsky. Para derivar el
efecto de sustitución primero se debe diferenciar la función de demanda compensada de la ecuación 5.29:
efecto de sustitución xc (px , py , U)
px
0.5px 1.5 py U.
(5.31)
Ahora, en vez de U se usa la utilidad indirecta: V(px, py, I) 0.5Ipx0.5py0.5:
efecto de sustitución 0.5px1.5py0.5V 0.25px2I
(5.32)
En este ejemplo el cálculo del efecto de ingreso es considerablemente más fácil. Aplicando los resultados
de la ecuación 5.27, tenemos
efecto de ingreso x
x
I
0.5I
px
0.5
px
0.25I
.
p2x
(5.33)
Una comparación entre la ecuación 5.30 y las ecuaciones 5.32 y 5.33 indica que en realidad hemos descompuesto la derivada del precio de esta función de demanda en sus componentes de sustitución e
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
163
ingreso. Curiosamente, los efectos de sustitución e ingreso son justo de la misma magnitud. Esta, como
se verá en ejemplos posteriores, es una de las razones por las cuales el caso de la función Cobb-Douglas
es un caso especial.
El trillado ejemplo numérico que hemos usado muestra también esta descomposición. Cuando el
precio de x se incrementa de 1 a 4 dólares la demanda (no compensada) de x decrece de x 4 a x 1,
pero la demanda compensada de x sólo decrece de x 4 a x 2. Esta reducción de 50 por ciento es el
efecto de sustitución. El decremento adicional de 50 por ciento de x 2 a x 1 representa reacciones a
la reducción del poder de compra, incorporada en la función de demanda de Marshall. Este efecto de
ingreso no ocurre cuando se utiliza la noción de demanda compensada.
PREGUNTA: En este ejemplo una persona gasta la mitad de su ingreso en el bien x y la otra mitad en el
bien y. ¿Cómo se alterarían las magnitudes relativas de los efectos de sustitución e ingreso si los exponentes de la función de utilidad Cobb-Douglas no fueran iguales?
ELASTICIDADES DE LA DEMANDA
Hasta aquí, en este capítulo, hemos examinado cómo responden los individuos a las variaciones
de precio e ingreso estudiando las derivadas de la función de demanda. Para muchas cuestiones
analíticas esta es una buena manera de proceder porque se pueden aplicar directamente métodos
de cálculo. Sin embargo, como se señala en el capítulo 2, concentrarse en las derivadas tiene una
desventaja importante para el trabajo empírico: las magnitudes de las derivadas dependen directamente de cómo se miden las variables. Esto puede dificultar la comparación entre bienes, o a
través de países y periodos. Por esta razón en casi todos los trabajos empíricos en microeconomía
se usa alguna forma de la medida de elasticidad. En esta sección se presentarán los tres tipos más
comunes de elasticidades de la demanda y se explorarán algunas de las relaciones matemáticas
entre ellas. Una vez más, para mayor simplicidad, analizaremos una situación en la cual una persona elige únicamente entre dos bienes, aunque estas ideas son fáciles de generalizar.
Elasticidades de la demanda de Marshall
La mayoría de las elasticidades de demanda de uso más común se deriva de la función de demanda
de Marshall x(px, py, I). Específicamente se usan las definiciones siguientes.
DEFINICIÓN
1. Elasticidad precio de la demanda (ex, px). Mide la variación proporcional en la cantidad demandada en
respuesta a una variación proporcional en el precio de un bien. Matemáticamente,
ex, px x/ x
x px x px , py , I
px
px / px
px x
px
.
x
(5.34)
2. Elasticidad ingreso de la demanda (ex, I). Mide la variación proporcional en la cantidad demandada en
respuesta a una variación proporcional en el ingreso. En términos matemáticos,
ex, I x/ x
x I x px , py , I
I/ I
I x
I
I
.
x
(5.35)
3. Elasticidad cruzada de la demanda (ex, py). Mide la variación proporcional en la cantidad demandada
de x en respuesta a una variación proporcional en el precio de otro bien (y):
ex, py x/ x
x py x px , py , I
py
py / py
py x
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
py
.
x
(5.36)
8/23
164
Parte 2: Elección y demanda
Obsérvese que todas estas definiciones usan derivadas parciales lo cual significa que todas los
demás determinantes de la demanda deben mantenerse constantes al examinar el impacto de una
variable específica. En el resto de esta sección se explorará en mayor detalle la definición de la
elasticidad precio. El examen de la elasticidad cruzada de la demanda es el tema principal del
capítulo 6.
Elasticidad precio de la demanda
La elasticidad precio de la demanda es quizá el concepto de elasticidad más importante de toda la
microeconomía. No sólo brinda una manera conveniente de resumir cómo responden los individuos a las variaciones de precio en una amplia variedad de bienes económicos, sino que también
es un concepto central en la teoría de cómo reaccionan las empresas a las curvas de demanda que
enfrentan. Como tal vez conoces de cursos previos de economía, suele distinguirse entre los casos
de demanda elástica (en los que el precio afecta significativamente la cantidad) y los de demanda
inelástica (en los que el efecto del precio es reducido). Una complicación matemática en la precisión de estas ideas es que la elasticidad precio de la demanda es en sí misma negativa6 porque,
salvo en el improbable caso de la paradoja de Griffen, x/px es negativa. La línea divisoria entre
reacciones grandes y pequeñas generalmente se fija en 1. Si ex, px 1, los cambios en x y px son
de la misma magnitud proporcional. Es decir, un incremento de 1 por ciento en el precio conduce
a un decremento de 1 por ciento en la cantidad demandada. En este caso, se dice que la demanda
es “elástica y unitaria”. O bien, si ex, px 1, entonces los cambios en cantidad son proporcionalmente mayores que las variaciones de precio, y se dice que la demanda es “elástica”. Por ejemplo,
si ex, px 3, cada incremento de 1 por ciento en el precio conduce a un decremento de 3 por
ciento en la cantidad demandada. Finalmente, si ex, px 1, la demanda es inelástica y los cambios en cantidad son proporcionalmente menores que las variaciones de precio. Un valor de ex, px
0.3, por ejemplo, significa que un incremento de 1 por ciento en el precio conduce a un
decremento en la cantidad demandada de 0.3 por ciento. En el capítulo 12 se verá cómo se usan
los datos agregados para estimar la elasticidad precio de la demanda del individuo típico para un
bien, y cómo esas estimaciones se usan en varias cuestiones de microeconomía aplicada.
Elasticidad precio y gasto total
La elasticidad precio de la demanda determina el modo en que una variación de precio, ceteris
paribus, afecta el gasto total en un bien. Esta relación es fácil de demostrar mediante el cálculo:
( px x)
x
px
x x(ex,
px
px
px
1).
(5.37)
Así, el signo de esta derivada depende de si ex, px es mayor o menor que 1. Si la demanda es
inelástica (0 ex, px 1), la derivada es positiva y el precio y el gasto total se mueven en la
misma dirección. Intuitivamente, si el precio no afecta mucho la cantidad demandada, la cantidad
se mantiene relativamente constante al cambiar el precio, y el gasto total refleja principalmente
esos movimientos de precio. Este es el caso, por ejemplo, de la demanda de la mayoría de los productos agrícolas. Las variaciones de precio inducidas por el clima para cultivos específicos suelen
provocar que el gasto total en esos cultivos se mueva en la misma dirección. Por otro lado, si la
demanda es elástica (ex, px 1), las reacciones a una variación de precio son tan grandes que el
efecto en el gasto total se invierte: un incremento en el precio causa que el gasto total decrezca
(porque la cantidad decrece mucho), y un decremento en el precio provoca que el gasto total se
incremente (la cantidad se incrementa en forma significativa). Para el caso elástico igual a la unidad (ex, px 1), el gasto total es constante sin importar cómo varíe el precio.
6
A veces, en sus análisis, los economistas usan el valor absoluto de la elasticidad precio de la demanda. Aunque esto es matemáticamente incorrecto, dicho uso es común. Por ejemplo, un estudio que encuentra que ex, px 1.2 en ocasiones podría reportar la
elasticidad precio de la demanda como “1.2”. Sin embargo, nosotros no lo haremos aquí.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
165
Elasticidades precio compensadas
Dado que algunos análisis microeconómicos se centran en la función de demanda compensada,
también es útil definir elasticidades basadas en dicho concepto. Esas definiciones se desprenden
directamente de sus contrapartes de Marshall.
DEFINICIÓN
Concedamos que la función de demanda compensada está dada por xc(px, py, U). Tenemos entonces las
definiciones siguientes.
1. Elasticidad precio compensada de la demanda (exc, px). Esta elasticidad mide la variación compensada
proporcional en la cantidad demandada, en respuesta a una variación proporcional en el precio de un
bien:
exc , px xc /xc
xc px xc px , py , U
px /px
px xc
px
px
.
xc
(5.38)
2. Elasticidad cruzada compensada de la demanda (exc, py). Mide la variación compensada proporcional en
la cantidad demandada en respuesta a una variación proporcional en el precio de otro bien:
exc , py xc /xc
xc py xc px , py , U
py
py /py
py xc
py
.
xc
(5.39)
Que estas elasticidades precio difieran mucho de sus contrapartes de la demanda de Marshall
depende de la importancia de los efectos ingreso en la demanda general del bien x. La relación
precisa entre ambos tipos de elasticidad puede demostrarse multiplicando el resultado de Slutsky
de la ecuación 5.27 por el factor px /x:
px x
ex,
x px
px
px xc
x px
px
x
x
exc ,
x
I
px
sx ex, I ,
(5.40)
donde sx px x/I es la parte del ingreso total dedicada a la compra del bien x.
La ecuación 5.40 señala que las elasticidades precio compensada y no compensada de la
demanda serán similares, si se cumple una de dos condiciones: 1) la parte del ingreso dedicada al
bien x(sx) es reducida, o 2) la elasticidad ingreso de la demanda para el bien x(ex, I) es reducida.
Cualquiera de estas condiciones sirve para reducir la importancia de la compensación del ingreso
que se usa en la elaboración de la función de demanda compensada. Si el bien x no es importante
en el presupuesto de una persona, la cantidad de compensación del ingreso requerido para neutralizar una variación de precio será reducida. Aun cuando un bien tiene una porción presupuestal grande, si la demanda no reacciona intensamente a las variaciones en el ingreso, los resultados
de ambos conceptos de demanda serán similares. De ahí que haya muchas circunstancias en las
que pueden usarse los dos conceptos de elasticidad precio en forma más o menos indistinta. Para
decirlo de otra manera, existen muchas circunstancias económicas en las cuales los efectos de
sustitución constituyen el componente más importante de las respuestas al precio.
Relaciones entre elasticidades de la demanda
En esta sección se han desarrollado varias relaciones entre los conceptos de elasticidad. Todas
estas se derivan del modelo subyacente de optimización de la utilidad. Aquí se estudiarán tres de
esas relaciones las cuales proporcionan discernimientos adicionales sobre la naturaleza de la
demanda individual.
Homogeneidad. La homogeneidad de las funciones de demanda también puede expresarse
en términos de elasticidad. Dado que cualquier incremento proporcional en todos los precios y el
ingreso deja sin cambios a la cantidad demandada, la suma neta de todas las elasticidades precio,
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
166
Parte 2: Elección y demanda
junto con la elasticidad ingreso de un bien particular, debe ser de cero. Una comprobación formal
de esta propiedad se vale del teorema de Euler (véase el capítulo 2). La aplicación de ese teorema
a la función de demanda x(px, py, I), recordando que esta función es homogénea de grado 0, produce
0 px
x
x
x
py
I
px
py
I
(5.41)
Si la ecuación 5.41 se divide entre x obtenemos
0 ex, px ex, py ex, I,
(5.42)
como sugiere la intuición. Este resultado indica que las elasticidades de la demanda de cualquier
bien no pueden seguir un patrón totalmente flexible. Deben exhibir algún tipo de coherencia
interna que refleje el enfoque básico de optimización de la utilidad en que se funda la teoría de la
demanda.
Agregación de Engel. En las extensiones del capítulo 4 se expone el análisis empírico de porciones del mercado y se tomó especial nota de la ley de Engel en la cual la parte del ingreso dedicada a alimentos decrece al incrementar el ingreso. Desde la perspectiva de la elasticidad la ley de
Engel es una formulación de la regularidad empírica de que la elasticidad ingreso de la demanda
de alimentos suele determinarse como considerablemente menor que 1. Dado lo anterior, debe ser
el caso de que la elasticidad ingreso de todos los productos no alimentarios tiene que ser mayor
que 1. Si una persona experimenta un incremento en su ingreso se espera que sus gastos en alimentos aumenten en un monto proporcional menor, pese a lo cual el ingreso debe gastarse en algo. En
el agregado estos otros gastos deben incrementarse proporcionalmente más rápido que el ingreso.
Una enunciación formal de esta propiedad de las elasticidades ingreso puede derivarse diferenciando la restricción presupuestal del individuo (I pxx pyy) respecto al ingreso, al tiempo
que los precios se tratan como constantes:
1 px
x
y
py
.
I
I
(5.43)
Un poco de manipulación algebraica de esta expresión produce
1 px
x xI
y yI
py
sx ex, I sy ey, I ;
I xI
I yI
(5.44)
aquí, nuevamente, si representa la parte del ingreso gastada en el bien i. La ecuación 5.44 indica
que el promedio ponderado de las elasticidades de ingreso de todos los bienes que compra una
persona debe ser de 1. Si supiéramos, por decir algo, que una persona gastó un cuarto de su
ingreso en alimentos y que la elasticidad ingreso de la demanda de alimentos era de 0.5, la elasticidad ingreso de la demanda de todo lo demás debe ser aproximadamente de 1.17 [ (1 0.25
. 0.5)/0.75]. Puesto que los alimentos son una “necesidad” importante todo lo demás es, en cierto
sentido, un “lujo”.
Agregación de Cournot. El economista francés del siglo xviii, Antoine Cournot, aportó uno
de los primeros análisis matemáticos respecto a las variaciones de precio mediante el cálculo. Su
descubrimiento más importante fue el concepto de ingreso marginal, concepto central en la hipótesis de maximización de los beneficios para las empresas. A Cournot también le interesó cómo la
variación en un precio afecta la demanda de todos los bienes. Nuestra relación final señala que, en
efecto, existen conexiones entre todas las reacciones a las variaciones en un solo precio. Comenzaremos diferenciando la restricción presupuestal una vez más, ahora respecto a px:
I
x
y
0 px
x py
.
px
px
px
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
167
La multiplicación de esta ecuación por px /I produce
p
x px x
y px y
,
x x py
I
px I x
px I y
0 px
0 sx ex,
px
sx sy ey,
(5.45)
px ,
por tanto el resultado final de Cournot es
sxex, px syey, px sx.
(5.46)
Esta ecuación indica que la magnitud del efecto cruzado de una variación en el precio de x sobre
la cantidad de y consumida es limitada debido a la restricción presupuestal. Los efectos precio
directos no pueden ser totalmente abrumados por los efectos cruzados. Esta es la primera de
muchas relaciones entre las demandas de bienes que estudiaremos más intensivamente en el capítulo siguiente.
Generalizaciones. Aunque sólo se han demostrado estos resultados de agregación para el
caso de dos bienes, es fácil generalizarlos al caso de muchos bienes. En el problema 5.11 se te
pedirá hacer justamente eso. Un asunto más difícil es si debe esperarse que estos resultados se
sostengan respecto a los datos económicos típicos en los cuales se combinan las demandas de
muchas personas. Con frecuencia los economistas tratan las relaciones de demanda agregada
como descriptivas del comportamiento de una “persona representativa”, y de hecho estas relaciones deberían aplicarse a esta persona. Pero la situación quizá no sea tan simple, como se demostrará al analizar más adelante la agregación.
EJEMPLO 5.5 Elasticidades de la demanda: importancia de los efectos de sustitución
En este ejemplo se calculan las elasticidades de la demanda contenidas por tres de las funciones de utilidad que hemos usado. Aunque son demasiado simples para reflejar cómo los economistas estudian empíricamente la demanda, las posibilidades incorporadas en estas funciones señalan que en última instancia
las elasticidades reflejan las preferencias de las personas. Una lección especialmente importante es mostrar por qué la variación en las elasticidades de la demanda entre bienes surge, probablemente, en su
mayor parte a causa de las diferencias en la magnitud de los efectos de sustitución.
Caso 1: Cobb-Douglas (␴ ⴝ 1). U(x, y) xy, donde 1.
Las funciones de demanda derivadas de esta función de utilidad son
I
,
px
I (1 )I
y( px , py , I) .
py
py
x( px , py , I) La aplicación de las definiciones de elasticidad indica que
ex,
px
ex,
py
x
px
x
py
ex, I px
px
I
2
x
px I/px
py
py
0
0,
x
x
1,
(5.47)
x I
I
1.
I x px I/px
Las elasticidades para el bien y adoptan valores similares. De ahí que las elasticidades asociadas con la
función Cobb-Douglas sean constantes en todos los rangos de precios e ingreso y adopten valores espe-
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
168
Parte 2: Elección y demanda
cialmente simples. Se puede demostrar fácilmente que estos obedecen las tres relaciones expuestas en la
sección anterior, usando el hecho de que aquí sx y sy .
Homogeneidad: ex, px ex, py ex, I 1 0 1 0.
Agregación de Engel: sxex, I syey, I . 1 . 1 1.
Agregación de Cournot: sxex, px syey, sxex, px (1) . 0 sx.
También se puede usar la ecuación de Slutsky en forma de elasticidad (ecuación 5.40) para derivar la
elasticidad precio compensada en este ejemplo:
exc, px ex, px sxex, I 1 (1) 1 .
(5.48)
Aquí la elasticidad precio compensada para x depende de la importancia de otros bienes (y) en la función
de utilidad.
Caso 2: ESC (␴ ⴝ 2; ␦ ⴝ 0.5). U(x, y) x0.5 y0.5.
En el ejemplo 4.2 se demostró que las funciones de demanda que pueden derivarse de esta función de
utilidad son
I
,
px (1 px py 1 )
I
y( px , py , I) .
py (1 px 1 py )
x( px , py , I) Como es lógico imaginar, calcular elasticidades directamente de estas funciones puede llevar algo de
tiempo. Aquí nos ocuparemos sólo de la elasticidad precio y haremos uso del resultado (del problema
5.6) de que la “porción de elasticidad” de cualquier bien está dada por
esx ,
sx px
1 ex,
px sx
sx px x
1
,
I
1 px py 1
px
(5.49)
px .
En este caso,
por tanto que la elasticidad de porción es más fácil de calcular y está dada por
esx,
px
py 1
sx px
px
px sx (1 px py 1 ) 2 (1 px py 1 )
1
px py 1
1 px py 1
.
(5.50)
Debido a que las unidades en que se miden los bienes son, de hecho, arbitrarias en la teoría de la utilidad,
también podríamos definirlas para que inicialmente px py, en cuyo caso7 obtenemos
ex,
px
esx ,
px
1
1
1 1
1
1.5.
(5.51)
De ahí que la demanda sea más elástica en este caso que en el ejemplo de la función Cobb-Douglas. La
razón de lo anterior es que el efecto de sustitución es mayor para esta versión de la función de utilidad
ESC. Esto puede demostrarse aplicando nuevamente la ecuación de Slutsky (y usando los hechos de que
ex,I 1 y sx 0.5):
exc, px ex, px sxex, I 1.5 0.5(1) 1,
(5.52)
una magnitud del doble de la del efecto de sustitución para el caso de la función Cobb-Douglas.
Caso 3: ESC (␴ ⴝ 0.5; ␦ ⴝ ⴚ1). U(x, y) x1 y1.
En referencia al ejemplo 4.2 puede verse que la parte del bien x implicada por esta función de utilidad
está dada por
7
Nótese que esta sustitución debe realizarse después de la diferenciación porque la definición de elasticidad requiere que cambiemos únicamente px mientras mantenemos constante py.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
sx 169
1
,
0:5
1 p0.5
y px
de modo que la elasticidad de porción está dada por
esx ,
px
1.5
0.5p0.5
px
sx px
y px
2
0.5
0.5
px sx (1 p0.5
) (1 py px 0.5 )
y px
1
0.5
0.5p0.5
y px
0.5
1 p0.5
y px
.
(5.53)
Si se adopta de nuevo la simplificación de precios iguales, la elasticidad precio puede calcularse como
ex,
px
esx ,
px
1
0.5
2
1
0.75
(5.54)
y la elasticidad precio compensada como
exc, px ex, px sxex, I 0.75 0.5(1) 0.25.
(5.55)
Por tanto, para esta versión de la función de utilidad ESC, la elasticidad precio es menor que en los casos
1 y 2 porque el efecto de sustitución es menor. De ahí que la variación principal entre los casos sea provocada en realidad por diferencias en la magnitud del efecto de sustitución.
Si quisieras no tener que resolver nuevamente este tipo de elasticidad podrías hacer uso del resultado
general de que
exc, px (1 sx).
(5.56)
Puedes querer comprobar que esta fórmula funciona en estos tres ejemplos (con sx 0.5 y 1, 2, 0.5,
respectivamente), mientras que en el problema 5.9 se te pedirá demostrar que este resultado es por lo
general cierto. Puesto que todos estos casos basados en la función de utilidad ESC tienen una elasticidad
ingreso igual a la unidad, la elasticidad precio puede calcularse a partir de la elasticidad precio compensada, añadiendo simplemente sx a la cifra calculada en la ecuación 5.56.
PREGUNTA: ¿A qué se debe que la porción presupuestal para bienes distintos de x (es decir, 1 sx)
interviene, en este ejemplo, en las elasticidades precio compensadas?
SUPERÁVIT DEL CONSUMIDOR
Un problema importante de la economía del bienestar aplicada es el de idear una medida monetaria de los beneficios y pérdidas de utilidad que los individuos experimentan cuando varían los
precios. Un uso para este tipo de medida es asignar un valor en dólares a la pérdida de bienestar
que las personas experimentan cuando un mercado es monopolizado con precios que exceden los
costos marginales. Otra aplicación consiste en medir los beneficios de bienestar que la gente experimenta cuando el progreso técnico reduce los precios que paga por los bienes. Aplicaciones similares se producen en la economía ambiental (para medir los costos de bienestar de los recursos a
los cuales se les ha fijado un precio incorrecto), en leyes y economía (para evaluar los costos de
bienestar de protecciones excesivas adoptadas por temor a juicios) y en la economía pública (para
medir la carga excesiva de un impuesto). Con objeto de realizar estos cálculos los economistas
usan datos empíricos de estudios de la demanda del mercado en combinación con la teoría que
subyace en dicha demanda. En esta sección se examinarán las herramientas principales utilizadas
en ese proceso.
Bienestar del consumidor y función de gasto
La función de gasto aporta el primer componente para el estudio de la relación precio/bienestar.
Supongamos que se desea medir la variación en bienestar que experimenta un individuo, si el
precio del bien x se incrementa de px0 a px1. Inicialmente, se requieren gastos de E(px0, py, U0) para
alcanzar una utilidad de U0. Para alcanzar esa misma utilidad, una vez que el precio de x increReg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
170 Parte 2: Elección y demanda
menta, esta persona requiere gastar al menos E(px1, py, U0). Por tanto, para compensar el incremento de precio se necesitará una compensación (formalmente llamada variación compensatoria8
o VC) de
VC E(px1, py, U0) E(px0, py, U0).
(5.57)
Esta situación se muestra gráficamente en el panel superior de la figura 5.8. Esta figura indica la
cantidad del bien cuyo precio ha variado en el eje horizontal y el gasto en todos los demás bienes
(en dólares) en el eje vertical. Inicialmente, un individuo consume la combinación x0, y0 y obtiene
una utilidad de U0. Cuando el precio de x se incrementa, se verá obligada a moverse a la combinación x2, y2 y sufrir una pérdida en utilidad. Si esta persona fuera compensada con poder de
compra adicional de la cantidad VC, podría permitirse permanecer en la curva de indiferencia
U0, pese al incremento de precio, eligiendo la combinación x1, y1. La distancia VC, en consecuencia, proporciona una medida monetaria de cuánto debe ser compensada esta persona por el incremento de precio.
Uso de la curva de demanda compensada para mostrar la VC
Lamentablemente, las funciones de utilidad de los individuos y sus mapas de curvas de indiferencia asociados no son directamente observables. Pero podemos avanzar en la medición empírica,
determinando cómo la cantidad de VC puede mostrarse en la curva de demanda compensada en
el panel inferior de la figura 5.8. El lema de Shephard indica que la función de demanda compensada de un bien se puede determinar directamente de la función de gasto por diferenciación:
xc ( px , py , U) E( px , py , U)
px
.
(5.58)
De ahí que la compensación descrita en la ecuación 5.57 pueda determinarse, integrando en una
secuencia de incrementos reducidos de precio de px0 a px1:
p1x
p1x
p0x
p0x
E( px , py , U0 )
VC 3
dpx 3 xc ( px , py , U0 ) dpx
px
(5.59)
al tiempo que se mantienen constantes py y la utilidad. La integral que se define en la ecuación
5.59 tiene una interpretación geométrica, la cual se muestra en el panel inferior de la figura 5.8: se
trata del área sombreada a la izquierda de la curva de demanda compensada y delimitada por px0
y px1. Por tanto, el costo de bienestar de este incremento de precio también puede ilustrarse usando
cambios en el área bajo la curva de demanda compensada.
Concepto de superávit del consumidor
Existe otra manera de examinar este asunto. Es posible preguntarse cuánto estaría dispuesta a
pagar una persona por el derecho a consumir todo el bien que quiera al precio de mercado de px0
en lugar de quedarse por completo sin el bien. La curva de demanda compensada en el panel
inferior de la figura 5.8 indica que si el precio de x se incrementara a px2 el consumo de esta persona decrecería a cero y requeriría una cantidad de compensación igual al área px2Apx0 para aceptar
voluntariamente la variación. De este modo, el derecho a consumir x0 a un precio de px0 vale esta
8
Algunos autores definen la variación compensatoria como la cantidad de ingreso que se le debe dar a una persona para permitirle
incrementar su utilidad de U1 a U0 dado el nuevo precio del bien x, esto es, VC E(px1, py, U0) E(px1, py, U1). Esta expresión es
equivalente a la proporcionada en la ecuación 5.57 porque mediante supuestos E(px0, py, U0) E(px1, py, U1). Algunos autores
también examinan la VC desde el punto de vista del presupuesto de un “planificador social”, que debe hacer estas compensaciones,
más que desde el punto de vista del consumidor que las recibe. En este caso, la VC que se ilustra sería negativa.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
FIGURA 5.8
Demostración de la
variación compensatoria.
171
Si el precio de x se incrementara de px0 a px1, una persona necesitaría gastos adicionales de VC para permanecer en la curva de indiferencia U0. La integración indica que VC también puede ser representada por el
área sombreada bajo la curva de demanda compensada en el panel b).
Gasto en otros
bienes ($)
E( px1, . . . ,U0)
VC
E( px1, . . . ,U0)
E(px0, . . . ,U0)
y1
y2
y0
U0
U1
x2
x1
x0
E( px0, . . . ,U0)
Cantidad de x
(a) Mapa de curvas de indiferencia
Precio
p x2
p x1
B
p x0
A
xc( px , . . . ,U0)
x1
x0
(b) Curva de demanda compensada
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
Cantidad de x
8/23
172 Parte 2: Elección y demanda
FIGURA 5.9
Efectos de bienestar de
las variaciones de precio
y curva de demanda de
Marshall.
La curva de demanda de Marshall (ingreso nominal constante) para el bien x es x(px, . . .). Además,
xc(. . . , U0) y xc(. . . ,U1) denotan las curvas de demanda compensada asociadas con los niveles de utilidad
experimentados cuando prevalecen, respectivamente, px0 y px1. El área a la izquierda de x(px, . . .) entre px0 y
px1 está delimitada por las áreas similares a la izquierda de las curvas de demanda compensada. De ahí que
para variaciones pequeñas de precio, el área a la izquierda de la curva de demanda de Marshall sea una
buena medida de pérdida de bienestar.
px
p x1
C
B
A
p x0
D
x(px , . . . )
xc( . . . ,U0)
. . ,U1)
x c( .
x1
x0
Cantidad de x por periodo
cantidad para este individuo. Éste es el beneficio adicional que una persona recibe por ser capaz
de hacer transacciones de mercado al precio de mercado prevaleciente. Este valor, dado por el
área bajo la curva de demanda compensada y sobre el precio de mercado se denomina superávit
del consumidor. Visto de esta manera, el problema de bienestar causado por un incremento en el
precio de x puede describirse como una pérdida en el superávit del consumidor. Cuando el precio
se incrementa de px0 a px1 el “triángulo” del superávit del consumidor decrece en magnitud de
px2Apx0 a px2Bpx1. Como lo aclara la figura, esta es simplemente otra forma de describir la pérdida
de bienestar representada en la ecuación 5.59.
Cambios de bienestar y curva de demanda de Marshall
Hasta aquí nuestro análisis de los efectos de bienestar respecto a las variaciones de precio se ha
centrado en la curva de demanda compensada. Esto es lamentable en cierto sentido porque la
mayor parte del trabajo empírico sobre la demanda estima en realidad curvas de demanda ordinaria (de Marshall). En esta sección se demostrará que estudiar los cambios en el área bajo una
curva de demanda de Marshall puede ser, de hecho, una buena manera de medir pérdidas de
bienestar.
Consideremos la curva de demanda de Marshall x(px, . . .) que se ilustra en la figura 5.9. Inicialmente, este consumidor enfrenta el precio px0 y decide consumir x0. Este consumo produce un
nivel de utilidad de U0, y la curva de demanda compensada inicial para x [es decir, xc(px, py, U0)]
también pasa por el punto x0, px0 (el cual hemos denominado punto A). Cuando el precio se incrementa a px1 la demanda de Marshall del bien x decrece a x1 (punto C en la curva de demanda) y la
utilidad de la persona también decrece a, digamos, U1. Hay otra curva de demanda compensada
asociada con este nivel de utilidad más bajo, que igualmente se muestra en la figura 5.9. Tanto la
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
173
curva de demanda de Marshall como esta nueva curva de demanda compensada pasan por el
punto C.
La presencia de una segunda curva de demanda compensada en la figura 5.9 plantea una interesante pregunta conceptual. ¿Deberíamos medir la pérdida de bienestar causada por el incremento de precio, como lo hicimos en la figura 5.8, usando la variación compensatoria (VC) asociada con la curva de demanda compensada inicial (área px1BApx0), o quizá debemos usar esta
nueva curva de demanda compensada y medir la pérdida de bienestar, como el área px1CDpx0? Una
posible razón para usar el área bajo la segunda curva sería centrarnos en la situación de este individuo después del incremento de precio (con nivel de utilidad U1). Podríamos preguntarnos
cuánto estaría dispuesto a pagar para ver que el precio regresa a sus antiguos niveles inferiores.9
La respuesta a lo anterior estaría dada por el área px1CDpx0. Por tanto, la decisión entre qué curva
de demanda compensada utilizar se reduce a decidir qué nivel de utilidad se considera el objetivo
apropiado de análisis.
Por fortuna, la curva de demanda de Marshall proporciona un arreglo conveniente entre estas
dos medidas. Dado que la magnitud del área entre ambos precios y bajo la curva de demanda de
Marshall (área px1CApx0) es menor que la que se encuentra bajo la curva de demanda compensada
basada en U0, pero mayor que la que se encuentra bajo la curva basada en U1, aquélla parece un
punto medio atractivo. Por lo anterior esta será la medida de pérdidas de bienestar que usaremos
principalmente en este libro.
DEFINICIÓN
Superávit del consumidor. El superávit del consumidor es el área bajo la curva de demanda de Marshall
y sobre el precio de mercado. Muestra lo que un individuo pagaría por el derecho a hacer transacciones
voluntarias a dicho precio. Se pueden usar las variaciones en el superávit del consumidor para medir los
efectos de bienestar de las variaciones de precio.
Debemos señalar que algunos economistas emplean VC o VE para calcular los efectos de bienestar de las variaciones de precio. En efecto, los economistas no siempre tienen claro qué medida
de cambio de bienestar están usando. Nuestro análisis de la sección anterior demuestra que en
realidad no hace mucha diferencia si los efectos de ingreso son reducidos en cualquier caso.
EJEMPLO 5.6 Pérdida de bienestar causada por un incremento de precio
Estas ideas pueden ilustrarse numéricamente volviendo a nuestro viejo ejemplo de hamburguesas/refrescos. Examinemos las consecuencias de bienestar de un incremento desmesurado del precio de los refrescos (bien x) de 1 a 4 dólares. En el ejemplo 5.3 se determinó que la demanda compensada del bien x
estaba dada por
xc ( px , py , V) Vp0.5
y
p0.5
x
(5.60)
.
Por tanto, el costo de bienestar del incremento de precio está dado por
4
4
0.5
0.5
VC 3xc ( px , py , V) dpx 3Vp0.5
dpx 2Vp0.5
y px
y px
1
1
px 4
.
(5.61)
px 1
Esta medida alterna se denomina variación equivalente (VE). Más formalmente, VE E(px1, py, U1) E(px0, py, U1). Nuevamente, algunos autores usan una definición diferente de VE como el ingreso necesario para restaurar la utilidad, dados los precios
antiguos, es decir VE E(px0, py, U0) E(px0, py, U1). Pero debido a que E(px0, py, U0) E(px1, py, U1) estas definiciones son equivalentes.
9
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
174
Parte 2: Elección y demanda
Si se usan los valores que hemos asumido a lo largo de este festín gastronómico (V 2, py 4), entonces
VC 2 . 2 . 2 . (4)0.5 2 . 2 . 2 . (1)0.5 8.
(5.62)
Esta cifra se reduciría a la mitad (4) si creyéramos que el nivel de utilidad después del incremento de
precio (V 1) fuera el objetivo de utilidad más apropiado para medir la compensación. Si, en cambio,
hubiéramos usado la función de demanda de Marshall
x(px, py, I) 0.5Ipx1 ,
(5.63)
la pérdida se calcularía como
4
4
4
pérdida 3x( px , py , I) dpx 30.5Ipx 1 dpx 0.5I ln px .
1
(5.64)
1
1
Así, con I 8, esta pérdida es
pérdida 4 ln(4) 4 ln(1) 4 ln(4) 4 (1.39) 5.55,
(5.65)
lo que parece un arreglo razonable entre las dos medidas alternas basadas en funciones de demanda
compensada.
PREGUNTAS: En este problema, ninguna de las curvas de demanda tiene un precio finito en el que la
demanda se dirija precisamente a cero. ¿Cómo afecta esto en el cálculo del superávit total del consumidor? ¿Afecta los tipos de cálculos de bienestar que hemos hecho aquí?
PREFERENCIA REVELADA Y EFECTO
DE SUSTITUCIÓN
La principal predicción inequívoca que se puede derivar del modelo de optimización de la utilidad es que la pendiente (o elasticidad precio) de la curva de demanda compensada es negativa.
Hemos demostrado este resultado de dos maneras. La primera prueba se basó en la cuasi concavidad de las funciones de utilidad; es decir, puesto que toda curva de indiferencia debe exhibir
una TMS decreciente, cualquier cambio en un precio inducirá un cambio de cantidad en la dirección opuesta a lo largo de esa curva de indiferencia. Una segunda prueba se deriva del lema de
Shephard: dado que la función de gasto es cóncava en los precios, la función de demanda compensada (la cual es la derivada de la función de gasto) debe tener una pendiente negativa. Nuevamente, la utilidad se mantiene constante en este cálculo como un argumento de la función de
gasto. Para algunos economistas depender de una hipótesis sobre una función de utilidad no
observable representaba un fundamento débil en el cual basar una teoría de la demanda. Un enfoque alterno que conduce al mismo resultado fue propuesto originalmente por Paul Samuelson, a
fines de la década de 1940.10 Este enfoque, que Samuelson llamó teoría de la preferencia revelada,
define un principio de racionalidad basado en el comportamiento observado y usa después este
principio para aproximar una función de utilidad de un individuo. En este sentido, una persona
que sigue el principio de racionalidad de Samuelson se comporta como si optimizara una función
de utilidad apropiada y exhibiera un efecto de sustitución negativo. Puesto que el enfoque de
Samuelson brinda discernimientos adicionales a nuestro modelo de decisiones de consumo, lo
examinaremos brevemente.
10
Paul A. Samuelson, Foundations of Economic Analysis (Harvard University Press, Cambridge, 1947).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
FIGURA 5.10
Demostración del
principio de racionalidad
de la teoría de la
preferencia revelada.
175
Con un ingreso I1 un individuo puede permitirse los puntos A y B. Si se selecciona A, entonces A es la preferencia revelada sobre B. Sería irracional que B fuera la preferencia revelada sobre A en otra configuración
precio-ingreso.
Cantidad
de y
ya
A C
B
yb
I2
I3
xa
I1
xb
Cantidad de x
Enfoque gráfico
El principio de racionalidad de la teoría de la preferencia revelada es tal como sigue: considérense
dos conjuntos de bienes, A y B. Si, a ciertos precios y nivel de ingreso un individuo puede permitirse A y B pero elige A, se dice que A es la “preferencia revelada” sobre B. El principio de racionalidad establece que en cualquier disposición distinta precio-ingreso, B nunca puede ser la preferencia revelada sobre A. Si, de hecho, B es elegida en otra configuración precio-ingreso ha de
deberse a que no pudo permitirse A. Este principio es ilustrado en la figura 5.10. Supongamos
que, cuando la restricción presupuestal está dada por I1 se elige el punto A, aunque B también
podía haberse comprado. Entonces, A es la preferencia revelada sobre B. Si para otra restricción
presupuestal, de hecho, se elige B este debe ser un caso como el representado por I2, donde A no
pudo comprarse. Si se eligiera B cuando la restricción presupuestal es I3, sería una violación del
principio de racionalidad porque con I3 pueden comprarse A y B. Con la restricción presupuestal
I3 es probable que algún punto diferente de A o B (digamos C) sea comprado. Nótese cómo este
principio usa reacciones observables a las restricciones presupuestales alternativas para clasificar
mercancías en vez de suponer la existencia de una función de utilidad. Nótese, asimismo, cómo
este principio ofrece un atisbo de por qué las curvas de indiferencia son convexas. Pasemos ahora
a una comprobación formal.
Negatividad del efecto de sustitución
Supongamos que un individuo es indiferente entre dos paquetes, C (compuesto por xC y yC) y D
(compuesto por xD y yD). Sean pxC, pCy los precios en los que se elige el paquete C, y pxD, pDy los precios en los que se elige el paquete D.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
176
Parte 2: Elección y demanda
Puesto que el individuo es indiferente entre C y D, debe ser el caso de que cuando se elige C, D
cuesta al menos tanto como C:
pxCxC pCy yC
pxCxD pCy yD.
(5.66)
Un enunciado similar es válido cuando se elige D:
pxDxD pDy yD
pxDxC pDy yC.
(5.67)
Reescribir estas ecuaciones da
pxC(xC xD) pCy (yC yD)
0,
(5.68)
pxD(xD xC) pDy (yD yC)
0.
(5.69)
Sumar estas produce
(pxC pxD)(xC xD) (pCy pDy )(yC yD)
Supongamos ahora que lo único que cambia es el precio de x, y que
(pxC pxD)(xC xD)
(5.70)
0.
pCy
pDy .
Entonces,
(5.71)
0.
Pero la ecuación 5.71 indica que precio y cantidad se mueven en la dirección opuesta cuando la
utilidad se mantiene constante (recuérdese que los paquetes C y D son igualmente atractivos).
Este es justamente el enunciado sobre la naturaleza no positiva del efecto de sustitución:
xc ( px , py , V)
px
x
px
0.
(5.72)
Uconstante
Hemos llegado al resultado mediante un método que no requiere la existencia de una función de
utilidad cuasi cóncava.
Resumen
En este capítulo se usó el modelo de optimización de la utilidad
para estudiar cómo la cantidad de un bien que un individuo elige
responde a variaciones en el ingreso o en el precio de ese bien. El
resultado final de este examen es la derivación de la conocida
curva de demanda de pendiente negativa. Para llegar a este resultado, sin embargo, extrajimos una amplia variedad de discernimientos de la teoría económica general de la elección.
• Variaciones proporcionales en todos los precios y el ingreso no
hacen que se desplace la restricción presupuestal de una persona y, por tanto, no varían las cantidades de bienes elegidas.
En términos formales, las funciones de demanda son homogéneas de grado 0 en todos los precios y el ingreso.
• Cuando la capacidad del poder de compra varía (es decir,
cuando el ingreso se incrementa con precios que se mantienen
sin cambios) las restricciones presupuestales se desplazan y los
individuos elegirán nuevos conjuntos de bienes. Para bienes
normales un incremento en el poder de compra provoca que
se elija más. En el caso de los bienes inferiores, en cambio, un
incremento en el poder de compra propicia que se adquiera
menos. De ahí que el signo de xi/I puede ser positivo o negativo, aunque xi/I 0 es el caso más común.
• Un decremento en el precio de un bien produce efectos de sustitución y de ingreso que, para un bien normal, hacen que se
compre más del bien. Para los bienes inferiores, sin embargo,
los efectos de sustitución e ingreso operan en direcciones
opuestas, y no es posible hacer predicciones inequívocas.
• De igual forma, un incremento en el precio induce efectos
tanto de sustitución como de ingreso que, en el caso normal,
generan que se demande menos. Para los bienes inferiores el
resultado neto es, nuevamente, ambiguo.
• Las curvas de demanda de Marshall representan descripciones bidimensionales de funciones de demanda para las cuales
sólo el propio precio varía; los demás precios y el ingreso se
mantienen constantes. Variaciones en estas otras variables
usualmente harán que se desplace la posición de la curva
de demanda. El signo de la pendiente de la curva de demanda de
x( px , py , I)
Marshall
es teóricamente ambiguo porque los
px
efectos de sustitución e ingreso pueden operar en direcciones
opuestas. La ecuación de Slutsky permite un estudio formal de
esta ambigüedad.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
• Las funciones de demanda compensada (o de Hicks) muestran
cómo las cantidades demandadas son funciones de todos los
precios y de la utilidad. La función de demanda compensada
para un bien puede generarse diferenciando parcialmente la
función de gasto respecto al precio de ese bien (lema de
Shephard).
• Las curvas de demanda compensada (o de Hicks) representan
descripciones bidimensionales de funciones de demanda compensada para las cuales sólo el propio precio varía; los demás
precios y la utilidad se mantienen constantes. El signo de la
xc ( px , py , U)
pendiente de la curva de demanda compensada
px
es inequívocamente negativo, debido a la cuasi concavidad de
las funciones de utilidad o a la concavidad conexa de la función de gasto.
• Las elasticidades de la demanda suelen usarse en el trabajo
empírico para sintetizar cómo reaccionan los individuos a las
variaciones en precios e ingreso. La más importante de estas
elasticidades es la elasticidad precio de la demanda, ex, px. Esta
mide la variación proporcional en cantidad en respuesta a un
cambio de 1 por ciento en precio. Una elasticidad similar
177
puede definirse para los movimientos a lo largo de la curva de
demanda compensada.
• Existen muchas relaciones entre las elasticidades de la demanda.
Algunas de las más importantes son: 1) las elasticidades precio
determinan cómo un cambio de precio afecta el gasto total en
un bien, 2) los efectos de sustitución e ingreso pueden compendiarse en la ecuación de Slutsky en forma elástica, y 3)
varias relaciones de agregación privan entre elasticidades y
muestran cómo se relacionan entre sí las demandas de bienes
diferentes.
• Con las áreas cambiantes bajo las curvas de demanda compensada o de la demanda de Marshall pueden medirse los efectos
de bienestar de las variaciones de precio. Tales variaciones
afectan la magnitud del superávit del consumidor que los individuos reciben si tienen la capacidad de hacer transacciones de
mercado.
• La negatividad del efecto de sustitución es la conclusión básica
de la teoría de la demanda. Este resultado puede demostrarse
usando la teoría de la preferencia revelada, así que no requiere
suponer la existencia de ninguna función de utilidad.
Problemas
5.1
El sediento Ed sólo bebe agua pura de manantial, pero puede adquirirla en dos envases de diferente tamaño: de 0.75 y de 2 litros. Como el
agua en sí misma es idéntica, considera estos dos “bienes” como sustitutos perfectos.
a. Supón que la utilidad de Ed sólo depende de la cantidad de agua consumida y que los envases mismos no ofrecen ninguna utilidad.
Expresa esta función de utilidad en términos de cantidades de envases de 0.75 litros (x) y de envases de 2 litros (y).
b. Formula la función de demanda de Ed para x en términos de px , py e I.
c. Grafica la curva de demanda de x, manteniendo constantes I y py.
d. Las variaciones en I y py ¿cómo hacen que se desplace la curva de demanda de x?
e. ¿Cómo sería la curva de demanda compensada de x en esta situación?
5.2
A David N. se le asignan $3 a la semana para gastar como le plazca. Dado que sólo le gustan los emparedados de crema de cacahuate y
mermelada, gasta la cantidad entera en crema de cacahuate (a $0.05 la onza) y mermelada (a $0.10 la onza). El pan es provisto sin costo por
un vecino muy considerado. David es un consumidor especial y hace sus emparedados con exactamente 1 onza de mermelada y 2 de crema
de cacahuate. Es de hábitos firmes por lo que nunca varía estas proporciones.
a.
b.
c.
d.
e.
¿Cuánta crema de cacahuate y mermelada comprará David en una semana con su asignación de $3?
Supón que el precio de la mermelada aumenta a $0.15 la onza. ¿Cuánto comprará de cada mercancía?
¿Cuánto debería aumentar la asignación de David para compensar el incremento en el precio de la mermelada del inciso b)?
Grafica tus resultados de los incisos a) a c).
¿En qué sentido este problema implica únicamente un solo producto: emparedados de crema de cacahuate y mermelada? Grafica la
curva de demanda de este producto único.
f. Analiza los resultados de este problema en términos de los efectos de ingreso y de sustitución implicados en la demanda de mermelada.
5.3
Como se definió en el capítulo 3, una función de utilidad es homotética si cualquier línea recta a través del origen cruza todas las curvas de
indiferencia en puntos de igual pendiente: la TMS depende de la razón y/x.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
178 Parte 2: Elección y demanda
a. Comprueba que, en este caso, x/I es constante.
b. Comprueba que, si los gustos de un individuo pueden representarse mediante un mapa de indiferencia homotética, precio y cantidad
deben moverse en direcciones opuestas; es decir, comprueba que no puede ocurrir la paradoja de Giffen.
5.4
Igual que en el ejemplo, 5.1, supón que la utilidad está dada por
utilidad U(x, y) x0.3y0.7.
a. Usa las funciones de demanda no compensada que aporta el ejemplo 5.1 para calcular la función de utilidad indirecta y la función de
gasto de este caso.
b. Usa la función de gasto calculada en el inciso a) junto con el lema de Shephard para calcular la función de demanda compensada del
bien x.
c. Usa los resultados del inciso b) junto con la función de demanda no compensada del bien x para demostrar que la ecuación de Slutsky
es válida para este caso.
5.5
Supón que la función de utilidad de los bienes x y y está dada por
utilidad U(x, y) xy y.
a. Calcula las funciones de demanda no compensada (de Marshall) de x y y, y describe cómo las curvas de demanda de x y y son desplazadas por las variaciones en I o en el precio de otro bien.
b. Calcula la función de gasto de x y y.
c. Usa la función de gasto calculada en el inciso b) para calcular las funciones de demanda compensada de los bienes x y y. Describe cómo
las curvas de demanda compensada de x y y son desplazadas por las variaciones en el ingreso o por las variaciones en el precio del otro
bien.
5.6
A lo largo de un periodo de tres años un individuo exhibe el comportamiento de consumo siguiente:
px
py
x
y
Año 1
3
3
7
4
Año 2
4
2
6
6
Año 3
5
1
7
3
¿Es congruente este comportamiento con los axiomas de la preferencia revelada?
5.7
Supón que una persona considera complementarios puros el jamón y el queso; siempre usará una rebanada de jamón con una rebanada de
queso para hacer un emparedado. Supón también que el jamón y el queso son los únicos bienes que esta persona compra, pues el pan es
gratis.
a. Si el precio del jamón es igual al del queso demuestra que la elasticidad precio de la demanda de jamón es de 0.5 y que la elasticidad
cruzada de la demanda de jamón respecto al precio del queso también es de 0.5.
b. Explica por qué los resultados del inciso a) sólo reflejan efectos de ingreso y no efectos de sustitución. ¿Cuáles son las elasticidades
precio compensadas en este problema?
c. Usa los resultados del inciso b) para mostrar cómo cambiarían tus respuestas del inciso a) si el costo de una rebanada de jamón fuera
del doble del precio de una rebanada de queso.
d. Explica cómo podría resolverse intuitivamente este problema, suponiendo que la persona consume sólo un bien: un emparedado de
jamón y queso.
5.8
d ln E
Demuestra que la parte del ingreso que se gasta en un bien x es sx d ln px, donde E es el gasto total.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
179
Problemas analíticos
5.9 Porción de elastidades
En las extensiones del capítulo 4 se demostró que casi todo el trabajo empírico en la teoría de la demanda se centra en porciones del ingreso.
Para cualquier bien, x, la porción del ingreso se define como sx pxx/I. En este problema se demostrará que la mayoría de las elasticidades
de la demanda pueden derivarse de porciones de elasticidades correspondientes.
a. Demuestra que la elasticidad de la porción presupuestal de un bien respecto al ingreso (esx, I sx /I . I/sx) es igual a ex, I 1. Interpreta
esta conclusión con algunos ejemplos numéricos.
b. Demuestra que la porción de elasticidad presupuestal de un bien respecto a su precio (esx, px sx /px . px/sx) es igual a ex, px 1. Nuevamente, interpreta este hallazgo con algunos ejemplos numéricos.
c. Usa tus resultados en el inciso b) para demostrar que la “elasticidad gasto” del bien x respecto a su precio [ex . px, px (px . x)/px . 1/x]
también es igual a ex, px 1.
d. Demuestra que la porción de elasticidad presupuestal de un bien respecto a una variación en el precio de otro (esx, py sx /py . py/sx)
es igual a ex, py.
e. En las extensiones del capítulo 4 se demostró que con una función de utilidad ESC, la parte del ingreso dedicada al bien x está dada por
sx 1/(1 pykpxk), donde k /( 1) 1 . Usa esta ecuación de porción para comprobar la ecuación 5.56: exc, px (1 sx).
Pista: Este problema puede simplificarse suponiendo que px py, en cuyo caso sx 0.5.
5.10 Más sobre elasticidades
El inciso e) del problema 5.9 tiene un número de aplicaciones útiles porque demuestra cómo las respuestas al precio dependen, en última
instancia, de los parámetros subyacentes de la función de utilidad. Usa, específicamente, ese resultado junto con la ecuación de Slutsky en
términos de elasticidad para demostrar que:
a. En el caso de la función Cobb-Douglas ( 1), la relación siguiente es válida entre las elasticidades precio de x y y: ex, px ey, py 2.
b. Si 1, entonces ex, px ey, py 2, y si 1, entonces ex, px ey, py 2. Ofrece una explicación intuitiva de este resultado.
c. ¿Cómo generalizarías este resultado a casos de más de dos bienes? Analiza si esa generalización será especialmente significativa.
5.11 Agregación de elasticidades de muchos bienes
Las tres relaciones de agregación que se presentaron en este capítulo pueden generalizarse a cualquier número de bienes. En este problema
se te pedirá hacer eso. Supón que hay n bienes y que la parte del ingreso dedicada al bien i está denotada por si. Definimos asimismo las
elasticidades siguientes:
ei, I ei, j xi
I
I xi
xi pj
pj xi
,
.
Utilice esta notación para demostrar:
n
a. Homogeneidad: j1 ei, j ei, I 0.
n
b. Agregación de Engel: i1 si ei, I 1.
n
c. Agregación de Cournot: i1 si ei, j sj.
5.12 Utilidad cuasi lineal (revisitada)
Considera una función de utilidad cuasi lineal simple de la forma U(x, y) x ln y.
a.
b.
c.
d.
Calcula el efecto de ingreso para cada bien. Calcula igualmente la elasticidad de ingreso de la demanda de cada bien.
Calcula el efecto de sustitución para cada bien. Calcula también la elasticidad de precio compensada de la demanda de cada bien.
Demuestra que la ecuación de Slutsky se aplica a esta función.
Demuestra que la forma de elasticidad de la ecuación de Slutsky también se aplica a esta función. Describe las características especiales
que observes.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
180
Parte 2: Elección y demanda
5.13 Sistema de demanda casi ideal
La forma general para la función de gasto del sistema de demanda casi ideal (SDCI) está dada por
n
ln E( p1 , . . . , pn , U) a0 i1
i
ln pi 1
2
n
n
k
ij
i1 j1
ln pi ln pj U 0
i 1
pk k ,
Por facilidad analítica supón que se aplican las restricciones siguientes:
n
ij ji ,
n
i 1,
i1
y
j1
n
ij k
0.
k1
a. Deriva la forma funcional SDCI para un caso de dos bienes.
b. Dadas las restricciones previas demuestra que esta función de gasto es homogénea de grado 1 en todos los precios. Esto, junto con el
hecho de que esta función se parece mucho a los datos reales, la convierte en una función “ideal”.
d ln E
c. Usando el hecho de que sx d ln px (véase el problema 5.8) calcula la parte del ingreso de cada uno de los dos bienes.
5.14 Curvas de indiferencia al precio
Las curvas de indiferencia al precio son curvas de isoutilidad con los precios de dos bienes en los ejes X y Y, respectivamente. Así, tienen
la forma general siguiente: (p1, p2) v(p1, p2, I) v0.
a. Deriva la fórmula para las curvas de indiferencia al precio del caso de función Cobb-Douglas con 0.5. Traza una de ellas.
b. ¿Qué demuestra la pendiente de esa curva?
c. ¿Cuál es la dirección de utilidad creciente en tu gráfica?
Sugerencias de lecturas adicionales
Cook, P. J. “A ‘One Line’ Proof of the Slutsky Equation”, American
Economic Review, núm. 62 (marzo de 1972), p. 139.
Samuelson, Paul A. Foundations of Economic Analysis, Harvard
University Press, Cambridge, 1947, capítulo 5.
Ingenioso uso de la dualidad para derivar la ecuación de Slutsky; usa
el mismo método que en el capítulo 5, pero con notación algo compleja.
Brinda un completo análisis de los efectos de sustitución e ingreso.
Desarrolla asimismo la noción de preferencia revelada.
Fisher, F. M. y K. Shell. The Economic Theory of Price Indices, Academic Press, Nueva York, 1972.
Silberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001.
Análisis técnico completo de las propiedades económicas de varios
índices de precios; describe en detalle índices “ideales” basados en
modelos de maximización de la utilidad.
Aporta una derivación amplia de la ecuación de Slutsky y una extensa
presentación de conceptos de elasticidad.
Luenberger, D. G. Microeconomic Theory, McGraw Hill, Nueva
York, 1992.
Sydsaetter, K., A. Strom y P. Berck. Economist’s Mathematical
Manual, Springer-Verlag, Berlín, 2003.
Las páginas 147-151 ofrecen un conciso resumen de cómo formular la
ecuación de Slutsky en notación matricial.
Ofrece una síntesis compacta de los conceptos de elasticidad. La cobertura de nociones de elasticidad de sustitución es especialmente completa.
Mas-Colell, Andreu, Michael D. Whinston y Jerry R. Green.
Microeconomic Theory, Oxford University Press, 1995.
Varian, H. Microeconomic Analysis, 3a. ed., W. W. Norton, Nueva
York, 1992.
El capítulo 3 cubre gran parte del material de este capítulo en un nivel
un poco elevado. La sección I sobre la medición de los efectos de bienestar de las variaciones de precio es especialmente recomendable.
Desarrollo formal de nociones de preferencia. Amplio uso de funciones
de gasto y su relación con la ecuación de Slutsky. También contiene
una buena prueba de la identidad de Roy.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Conceptos de demanda y evaluación
de índices de precios
En los capítulos 4 y 5 se presentaron diversos conceptos de
demanda relacionados entre sí, todos los cuales se derivaron del
modelo subyacente de maximización de la utilidad. Las relaciones
entre esos diversos conceptos se resumen en la figura E5.1. En esta
tabla se examina formalmente la mayoría de esos vínculos, pero
aún no se ha analizado la relación matemática entre funciones de
utilidad indirecta y funciones de demanda de Marshall (identidad
de Roy), lo que se hará a continuación. Todas las entradas de la
tabla dejan en claro que existen muchas maneras de saber algo
sobre la relación entre el bienestar de los individuos y los precios que enfrentan. En esta extensión se exploran algunos de esos
enfoques. Específicamente, se considera la forma en que estos conceptos pueden arrojar luz sobre la precisión del índice de precios
EXTENSIONES
al consumidor (IPC), la principal medida de la inflación en Estados Unidos. Se examinarán asimismo otros conceptos de índice
de precios.
El IPC es un índice de “canasta básica” del costo de la vida. Los
investigadores miden los montos que las personas consumen de
una serie de bienes en un periodo base (en el caso de dos bienes,
estos niveles de consumo en el periodo base podrían denotarse
con x0 y y0) y después usan datos de precios corrientes para calcular las variaciones de precio en esa canasta básica. Usando este
procedimiento, el costo de la canasta básica sería inicialmente I0
px0x0 py0y0 y el costo en el periodo 1 sería I1 px1x0 py1y0. El
cambio en el costo de la vida entre estos dos periodos se mediría
entonces con I1/I0. Aunque este procedimiento es una manera
FIGURA E5.1
Relaciones entre
conceptos de demanda.
Primordial
Dual
Maximizar U(x, y)
s.t. I = px x + pyy
Minimizar E(x, y)
s.t. U = U(x, y)
Función de utilidad indirecta
U′ = V(px, py, I)
Inversas
Identidad de Roy
Lema de Shephard
Demanda de Marshall
∂V
∂px
x(px, py, I) = −
∂V
∂I
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
Función de gasto
E′ = E(px, py, U)
Demanda compensada
xc(px, py, U) =
23.08.2019
∂E
∂px
8/23
182
Parte 2: Elección y demanda
intuitivamente verosímil de medir la inflación y aunque los índices de precios de la canasta básica son de uso muy frecuente, tales
índices presentan muchas deficiencias.
E5.1 Funciones de gasto
y sesgo de sustitución
Los índices de precios de la canasta básica sufren de “sesgo de
sustitución”. Puesto que los índices no permiten a los individuos
hacer sustituciones en la canasta básica, en respuesta a las variaciones en precios relativos, tienden a exagerar las pérdidas de
bienestar de la gente a causa del aumento de precios. Esta exageración se muestra en la figura E5.2. Alcanzar el nivel de utilidad U0
requiere, inicialmente, gastos de E0, lo que resulta en una compra
de la canasta x0, y0. Si px/py decrece el nivel de utilidad inicial
puede obtenerse ahora con gastos de E1, alterando el paquete de
consumo por x1, y1. Al calcular el nivel de gasto necesario para
continuar consumiendo x0, y0 se exagera cuánto poder de compra
extra necesita una persona para restaurar su nivel de bienestar.
Los economistas han estudiado extensamente el grado de este
FIGURA E5.2
Sesgo de sustitución
en el IPC.
sesgo de sustitución. Aizcorbe y Jackman (1993), por ejemplo,
determinan que esta dificultad con el índice de la canasta básica
puede exagerar el nivel de inflación mostrado por el IPC en
aproximadamente 0.2 por ciento al año.
E5.2 Identidad de Roy
y sesgo de bienes nuevos
Cuando se introducen bienes nuevos pasa un poco de tiempo
antes de ser integrados en el IPC. Por ejemplo, Hausman (1999,
2003) afirma que los teléfonos celulares tardaron más de 15 años
en aparecer en el índice. El problema de esta demora es que los
índices de canasta básica no reflejarán las ganancias de bienestar
que experimentan las personas por el uso de bienes nuevos. Para
medir estos costos, Hausman intentó medir un precio “virtual” (p∗)
en el que la demanda de, digamos, teléfonos celulares fuera de
cero y después argumentó que la introducción de ese bien a su
precio de mercado representaba un cambio en el superávit del
consumidor, susceptible de ser medido. De ahí que este autor haya
enfrentado el problema de cómo pasar de la función de demanda
Inicialmente los gastos están dados por E0, y la persona compra x0, y0. Si px/py decrece, el nivel de utilidad
U0 puede alcanzarse a menor costo consumiendo x1, y1 y gastando E1. Comprar x0, y0 a los nuevos precios
costaría más que E1. Por tanto, mantener constante el paquete de consumo impone un sesgo ascendente a
los cálculos tipo IPC.
Cantidad
de y
E0
y0
E1
U0
x0
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
x1
Cantidad de x
23.08.2019
8/23
Capítulo 5: Efectos de ingreso y de sustitución
de Marshall de los teléfonos celulares (la cual estimó econométricamente) a la función de gasto. Para hacerlo usó la identidad de
Roy (véase Roy, 1942). Recuérdese que el problema de maximización de la utilidad del consumidor puede representarse con la
expresión lagrangiana ᏸ U(x, y) (I pxx pyy). Si se aplica
a esta expresión el teorema de la envolvente, se sabe que
U
ᏸ
x px , py , I ,
px
px
U
ᏸ
.
I
I
(i)
Por tanto, la función de demanda de Marshall está dada por
x( px , py , I) U /px
.
U /I
(ii)
Usando estas estimaciones de la función de demanda de Marshall,
Hausman integró la ecuación ii para obtener la función de utilidad indirecta implicada y después calculó su inversa, la función
de gasto (consúltese la figura E5.1 para ver la lógica de este proceso).
Aunque éste es, sin duda, un procedimiento indirecto produjo
grandes estimaciones de la ganancia en bienestar del consumidor
procedente de los teléfonos celulares, un valor presente en 1999 de
más de 100 mil millones de dólares. Entonces las demoras en la
inclusión de esos bienes en el IPC pueden resultar en una medida
engañosa del bienestar del consumidor.
E5.3 Otras quejas sobre el IPC
Los investigadores han descubierto también otras fallas del IPC en
su versión actual. La mayoría de ellas se centra en las consecuencias de usar precios incorrectos para calcular el índice. Por ejemplo, cuando la calidad de un bien aumenta, la gente se halla en
mejores condiciones aun cuando esto no aparece en el precio del
bien. En las décadas de 1970 y 1980 la confiabilidad de los televisores a color mejoró drásticamente, pero su precio no cambió
mucho. Una canasta básica que incluyera “un televisor a color”
habría dejado de lado esta fuente de mayor bienestar. De igual
modo la inauguración de grandes almacenes como Costco y
Home Depot, durante la década de 1990, redujo indudablemente
los precios que los consumidores pagaban por diversos bienes. Sin
embargo, la inclusión de estos nuevos establecimientos en el
esquema muestral del IPC tardó varios años, así que el índice tergiversó lo que la gente pagaba en realidad. La evaluación de la
magnitud del error introducido por estos casos en los que se usan
precios incorrectos en el IPC también puede hacerse usando los
diversos conceptos de demanda de la figura E5.1. Para un resumen de estas investigaciones véase Moulton (1996).
E5.4 Índices de precios exactos
En principio es posible que algunas de las deficiencias de los índices de precios como el IPC se superen con una atención más cuidadosa a la teoría de la demanda. Si se conociera la función de
gasto del consumidor representativo, por ejemplo, podría elaborarse un índice “exacto” de los cambios en el poder de compra que
tomara en cuenta la sustitución de mercancías. Para ilustrar esto,
supongamos que sólo hay dos bienes y que se desea saber cómo ha
183
cambiado el poder de compra entre el periodo 1 y el periodo 2. Si
la función de gasto está dada por E(px, py, U), entonces la razón
I1,2 E( p2x , p2y , U)
(iii)
E( p1x , p1y , U)
muestra cómo el costo de alcanzar el nivel de utilidad objetivo U
ha cambiado entre los dos periodos. Si, por ejemplo, I1,2 1.04 se
diría que el costo de alcanzar el objetivo de utilidad aumentó 4 por
ciento. Desde luego que esta respuesta es únicamente conceptual.
Sin conocer la función de utilidad de la persona representativa,
ignoraríamos la forma específica de la función de gasto. Pero en
algunos casos la ecuación iii puede sugerir cómo proceder en la
elaboración del índice. Supongamos, por ejemplo, que las preferencias de la persona típica pudieran representarse con la función
de utilidad Cobb-Douglas U(x, y) xy1. En este caso es fácil
demostrar que la función de gasto es una generalización de la que
ofrece el ejemplo 4.4: E(px, py, U) pxpy1 U/(1 )1 kpxpy1 U. Insertar esta función en la ecuación iii produce
I 1,2 k(p2x ) (p2y )
1 k(p1x ) (p1y ) 1
U
U
(p2x ) (p2y )
1 (p1x ) (p1y ) 1
.
(iv)
Así, en este caso, el índice de precios exacto es una función relativamente simple de los precios observados. La característica particularmente útil de este ejemplo es que el objetivo de utilidad se
elimina en la elaboración del índice del costo de la vida (como
ocurrirá siempre que la función de gasto sea homogénea en la utilidad). Nótese también que las porciones de gasto ( y 1 )
desempeñan un papel importante en el índice: cuanto mayor sea
la porción de un bien, más importantes serán las variaciones de
precio de dicho bien en el índice final.
E5.5 Desarrollo de índices de precios exactos
La función de utilidad Cobb-Douglas es, por supuesto, muy simple. Muchas investigaciones recientes sobre los índices de precios
se han centrado en tipos más generales de funciones de utilidad y
en el descubrimiento de los índices de precios exactos que implican. Por ejemplo, Feenstra y Reinsdorf (2000) señalan que el sistema de demanda casi ideal, descrito en las extensiones del capítulo 4, implica un índice de precios exacto (I) que adopta una
forma “Divisia”:
n
ln(I) wi
ln pi
(v)
i1
(aquí wi son ponderaciones por atribuir al cambio en el logaritmo
del precio de cada bien). A menudo, las ponderaciones en la ecuación v se interpretan como las porciones presupuestales de los bienes. Curiosamente, éste es justo el índice de precios implicado por
la función de utilidad Cobb-Douglas en la ecuación iv, porque
ln(I 1, 2 ) ln p2x (1
ln
p1x
) ln p2y
1
ln px (1
)ln p1y
(vi)
) ln py .
En aplicaciones reales las ponderaciones cambiarían de un periodo
a otro en reflejo de las porciones presupuestales cambiantes. De
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
184
Parte 2: Elección y demanda
igual forma, los cambios a lo largo de varios periodos se “encadenarían” a partir de distintos índices de cambio de precios de un
solo periodo.
Cambios en la demanda de alimentos en China
China tiene una de las economías de más rápido crecimiento del
mundo: actualmente su PIB per capita crece a una tasa de aproximadamente 8 por ciento al año. Los consumidores chinos gastan,
asimismo, una gran fracción de su ingreso en alimentos, aproximadamente 38 por ciento del gasto total, según datos recientes.
Una implicación del rápido crecimiento del ingreso en China, sin
embargo, es que los patrones de consumo de alimentos están cambiando aceleradamente. Las compras de productos básicos como
arroz o trigo han reducido su importancia relativa, mientras que
las compras de aves, pescado y alimentos procesados aumentan
rápidamente. En un artículo de Gould y Villarreal (2006) se estudian en detalle esos patrones, usando el modelo SDCI. Estos autores identifican diversos efectos de sustitución en categorías específicas de alimentos, en respuesta a las variaciones en sus precios
relativos. Estos patrones cambiantes implican que un índice fijo
de precios de la canasta básica (como el índice de precios al consumidor de Estados Unidos) sería particularmente inadecuado
para medir cambios en el costo de la vida en China y que deberían
examinarse otros métodos.
Referencias
Aizcorbe, Ana M. y Patrick C. Jackman. “The Commodity Substitution Effect in CPI Data, 1982-91”, Monthly Labor Review
(diciembre de 1993), pp. 25-33.
Feenstra, Robert C. y Marshall B. Reinsdorf. “An Exact Price
Index for the Almost Ideal Demand System”, Economics Letters (febrero de 2000), pp. 159-162.
Gould, Brain W. y Héctor J. Villarreal. “An Assessment of the
Current Structure of Food Demand in Urban China”, Agricultural Economics (enero de 2006), pp. 1-6.
Hausman, Jerry. “Cellular Telephone, New Products, and the CPI”,
Journal of Business and Economic Statistics (abril de 1999),
pp. 188-194.
Hausman, Jerry. “Sources of Bias and Solutions to Bias in the Consumer Price Index”, Journal of Economics Perspectives
(invierno de 2003), pp. 23-44.
Moulton, Brent R. “Bias in the Consumer Price Index: What Is the
Evidence?”, Journal of Economics Perspectives (otoño de
1996), pp. 159-177.
Roy, R. De l’utilité, contribution á la théorie des choix, Hermann,
París, 1942.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
SEIS
Relaciones de demanda
entre bienes
En el capítulo 5 se examinó cómo las variaciones de precio de un bien particular (digamos el bien
x) afectan la cantidad elegida de ese bien. En el análisis se mantuvieron constantes los precios de
todos los demás bienes. Debería quedar claro, sin embargo, que una variación en uno de esos
otros precios también podría afectar la cantidad elegida de x. Por ejemplo, si se entiende que x
representa la cantidad de millas que un individuo recorre en automóvil, es de esperar que esta
cantidad decrezca cuando el precio de la gasolina se incrementa, o aumente cuando el precio de
viajar en avión o autobús se incrementa. En este capítulo se usará el modelo de optimización de la
utilidad para estudiar dichas relaciones.
EL CASO DE DOS BIENES
Iniciaremos nuestro estudio de las relaciones de demanda entre bienes con el caso de dos bienes.
Lamentablemente, este caso resulta ser poco interesante porque los tipos de relaciones que pueden
ocurrir cuando sólo hay dos bienes son limitados. Aun así, el caso de dos bienes es útil, ya que
dos ejemplos de cómo la cantidad elegida de x podría verse afectada mediante un cambio en el
precio de y
py ha decrecido. Esto desplaza la restricción presupuestal hacia fuera, de I0 a I1. En ambos casos la cantidad elegida del bien y también se ha incrementado de y0 a y1 a raíz del decremento en py, como sería de esperar si y es un bien normal. En
cuanto al bien x
de indiferencia tienen casi forma de L, lo cual implica un efecto de sustitución muy pequeño. Un
decremento en py no induce un movimiento grande a lo largo de U0 cuando y es sustituida por x.
Es decir, x se reduce relativamente poco a raíz de la sustitución. El efecto de ingreso, sin embargo,
x
se incremente. De ahí que x/ py sea negativa (x y py se mueven en direcciones opuestas).
x/ py es positiva. Las curvas de indiferencia relatipy. La
cantidad de x decrece marcadamente cuando y es sustituida por x a lo largo de U0. Tal como en la
py provoca que se compre más
de x, pero ahora el efecto de sustitución predomina y la cantidad de x decrece a x1. En este caso, x
y py se mueven entonces en la misma dirección.
Tratamiento matemático
La ambigüedad en el efecto de las variaciones en py puede ilustrarse adicionalmente con una ecuación tipo Slutsky. Usando procedimientos similares a los del capítulo 5 es muy simple demostrar que
187
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
188
Parte 2: Elección y demanda
FIGURA 6.1
Diferentes direcciones
de efectos cruzados.
En ambos paneles, el precio de y ha decrecido. En a) los efectos de sustitución son pequeños; así, la cantidad
consumida de x se incrementa junto con y. Puesto que x/py 0, x y y son complementarios brutos. En b)
los efectos de sustitución son grandes; así, la cantidad elegida de x decrece. Dado que x/py 0, x y y se
denominan sustitutos brutos.
Cantidad de y
Cantidad de y
I1
I1
I0
I0
y1
y1
y0
U1
U0
y0
U1
U0
x 0 x1
Cantidad
de x
x1 x 0
a) Complementarios brutos
Cantidad
de x
b) Sustitutos brutos
x(px , py , I) efecto de sustitución efecto de ingreso
py
x
py
y
Uconstante
(6.1)
x
,
I
o, en términos de elasticidad,
ex,
py
exc ,
py
sy ex, I .
(6.2)
Nótese que la magnitud del efecto de ingreso está determinada por la porción del bien y en las
compras de una persona. El impacto de una variación en py sobre el poder de compra está determinado por lo importante que es y para este individuo.
Para el caso de dos bienes, los términos del miembro derecho de las ecuaciones 6.1 y 6.2 tienen
diferentes signos. Suponiendo que las curvas de indiferencia son convexas, el efecto de sustitución
x/py|U constante es positivo. Si nos limitamos a movimientos a lo largo de una curva de indiferencia, incrementos en py incrementan x y decrementos en py hacen decrecer la cantidad de x elegida.
Sin embargo, suponiendo que x es un bien normal, el efecto de ingreso (yx/I o syex, I) es
claramente negativo. De ahí que el efecto combinado sea ambiguo; x/py podría ser positiva o
negativa. Aun en el caso de dos bienes la relación de demanda entre x y py es algo compleja.
EJEMPLO 6.1 Otra descomposición de Slutsky para efectos cruzados
En el ejemplo 5.4 se examinó la descomposición de Slutsky para el efecto de una variación en el precio de
x. Ahora se considerará el efecto cruzado de una variación en los precios de y sobre las compras de x.
Recuérdese que las funciones de demanda no compensada y compensada para x están dadas por
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 6: Relaciones de demanda entre bienes
x (px , py , I ) 0:5I
px
189
(6.3)
y
0.5
xc ( px , py , V) Vp0.5
.
y px
(6.4)
Como ya se señaló, la función de demanda de Marshall en este caso produce x/py 0; es decir, las
variaciones en el precio de y no afectan las compras de x. Ahora se demostrará que esto ocurre porque los
efectos de sustitución y de ingreso de una variación de precio están equilibrados. El efecto de sustitución
en este caso está dado por
x
py
Uconstante
xc
0.5Vpy 0.5 px 0.5 .
py
(6.5)
Al sustituir V a partir de la función de utilidad indirecta (V 0.5Ipy0.5px0.5) se obtiene un enunciado
final para el efecto de sustitución:
x
py
0.25Ipy 1 px 1 .
(6.6)
U constante
Volviendo a la función de demanda de Marshall para y(y 0.5Ipy1), calcular el efecto de ingreso produce
y
x
I
0.5Ipy 1
0.5px 1
0.25Ipy 1 px 1 ,
(6.7)
y combinar las ecuaciones 6.6 y 6.7 da el efecto total de variación en el precio de y como
x
0.25Ipy 1 px 1
py
0.25Ipy 1 px 1 0.
(6.8)
Esto deja en claro que la razón de que las variaciones en el precio de y no tengan ningún efecto en las
compras de x en el caso de la función Cobb-Douglas, es porque los efectos de sustitución e ingreso de esa
variación se neutralizan con exactitud; ninguno de los efectos en particular, sin embargo, es de cero.
Para volver a nuestro ejemplo numérico (px 1, py 4, I 8, V 2), supóngase ahora que py disminuye a 2. Esto no debería tener ningún efecto en la demanda de Marshall del bien x. La función de
demanda compensada en la ecuación 6.4 indica que la variación de precio provocaría que la cantidad
demandada de x decreciera de 4 a 2.83 ( 22) cuando y es sustituida por x con la utilidad sin cambios.
No obstante, el poder de compra aumentado debido al decremento en el precio invierte este efecto con
toda precisión.
PREGUNTAS: ¿Por qué sería incorrecto argüir que si x/py 0, entonces x y y no tienen posibilidades
de sustitución (es decir, deben consumirse en proporciones fijas)? ¿Existe algún caso en el cual se podría
llegar a esta conclusión?
SUSTITUTOS Y COMPLEMENTARIOS
En el caso de una gran cantidad de bienes hay mucho mayor margen para relaciones interesantes
entre ellos. Es relativamente fácil generalizar la ecuación de Slutsky para dos bienes cualesquiera
xi, xj como
xi ( p1 , . . . , pn , I ) xi
pj
pj
xj
U constante
xi
,
I
(6.9)
y, nuevamente, esto puede traducirse fácilmente en una relación de elasticidad:
ei, j eci, j
sj ei, I .
(6.10)
Lo anterior indica que el cambio en el precio de cualquier bien (el bien j en este caso) induce
efectos de ingreso y de sustitución que pueden cambiar la cantidad demandada de cada bien. Las
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
190
Parte 2: Elección y demanda
ecuaciones 6.9 y 6.10 pueden usarse para analizar la idea de sustitutos y complementarios. Intuitivamente, estas ideas son más bien simples. Dos bienes son sustitutos si, a raíz de un cambio en
las condiciones, uno de ellos puede reemplazar en uso al otro. Algunos ejemplos son té y café,
hamburguesas y hot dogs, mantequilla y margarina. Los complementarios, por otro lado, son bienes que “van juntos”, como café y crema, pescado y papas fritas o brandy y puros. En cierto sentido, los “sustitutos” se reemplazan entre sí en la función de utilidad, mientras que los “complementarios” se complementan entre sí.
Hay dos maneras de precisar estas ideas intuitivas. Una se centra en los efectos “brutos” de las
variaciones de precio, incluyendo los efectos tanto de ingreso como de sustitución; la otra atiende
sólo los efectos de sustitución. Dado que usaremos ambas definiciones, examinemos en detalle
cada una de ellas.
Sustitutos y complementarios brutos (de Marshall)
Que dos bienes sean sustitutos o complementarios puede establecerse en referencia a las reacciones observadas respecto al precio, como sigue.
DEFINICIÓN
Sustitutos y complementarios brutos. Se dice que dos bienes, xi y xj, son sustitutos brutos si
xi
0
pj
(6.11)
xi
0
pj
(6.12)
y complementarios brutos si
Es decir, dos bienes son sustitutos brutos si un incremento en el precio de uno de ellos provoca
que se compre más del otro bien. Los bienes son complementarios brutos si un incremento en el
precio de uno de ellos hace que se adquiera menos del otro bien. Por ejemplo, si el precio del café
se incrementa, es de esperar que la demanda de té aumente (son sustitutos), en tanto que la
demanda de crema podría decrecer (café y crema son complementarios). La ecuación 6.9 deja en
claro que es una definición “bruta” en cuanto que incluye los efectos tanto de ingreso como de
sustitución, procedentes de las variaciones de precio. Puesto que estos efectos, de hecho, están
combinados en cualquier observación de la realidad que podamos hacer, sería razonable siempre
hablar sólo de sustitutos “brutos” y complementarios “brutos”.
Asimetría de las definiciones brutas
Sin embargo, hay varios detalles indeseables en las definiciones brutas de sustitutos y complementarios. El más importante es que las definiciones no son simétricas. Es posible, por efecto de las
definiciones, que x1 sea un sustituto de x2 y que al mismo tiempo x2 sea un complementario de x1.
La presencia de efectos de ingreso puede producir resultados paradójicos. Veamos un ejemplo
específico.
EJEMPLO 6.2 Asimetría en efectos cruzados
Supongamos que la función de utilidad para dos bienes (x y y) tiene la forma cuasi lineal
U(x, y) ln x y.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(6.13)
8/23
Capítulo 6: Relaciones de demanda entre bienes
191
Establecer la expresión lagrangiana
ᏸ ln x y (I
px x
py y)
(6.14)
genera las siguientes condiciones de primer orden:
ᏸ 1
x x
ᏸ
1
y
ᏸ
I
px 0,
py 0,
(6.15)
py y 0.
px x
El traslado de los términos en a la derecha y la división de la primera ecuación entre la segunda produce
1 px
,
x py
(6.16)
px x py .
(6.17)
La sustitución en la restricción presupuestal permite ahora despejar y en la función de demanda de
Marshall:
I px x py y py py y.
(6.18)
De ahí que
y
I
py
py
.
(6.19)
Esta ecuación indica que un incremento en py debe hacer decrecer el gasto en el bien y (es decir, pyy). Así,
debido a que px e I se mantienen sin variación, el gasto en x debe incrementarse. Por tanto,
x
0,
py
(6.20)
y denominaríamos a x y y sustitutos brutos. Por otro lado, la ecuación 6.19 muestra que el gasto en y es
independiente de px. En consecuencia,
y
0
px
(6.21)
y, visto de esta manera, se diría que x y y son independientes entre sí; no son ni sustitutos brutos ni complementarios brutos. Basarse en las respuestas brutas a las variaciones de precio para definir la relación
entre x y y nos llevaría a la ambigüedad.
PREGUNTA: En el ejemplo 3.4 se demostró que una función de utilidad de la forma dada por la ecuación 6.13 no es homotética. La TMS no depende sólo de la razón de x con y. ¿Puede surgir asimetría en
el caso homotético?
SUSTITUTOS Y COMPLEMENTARIOS NETOS
(DE HICKS)
Debido a las posibles asimetrías implicadas en la definición de sustitutos y complementarios
netos, suele usarse una definición alterna centrada exclusivamente en los efectos de sustitución.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
192
Parte 2: Elección y demanda
DEFINICIÓN
Sustitutos y complementarios netos. Se dice que los bienes xi y xj son sustitutos netos si
xi
pj
U constante
xi
pj
U constante
0
(6.22)
0.
(6.23)
y complementarios netos si
Estas definiciones1 entonces sólo consideran los términos de sustitución para determinar si dos
bienes son sustitutos y complementarios. Esta definición es intuitivamente atractiva (porque sólo
considera la forma de una curva de indiferencia) y teóricamente deseable (porque es inequívoca).
Una vez que se ha descubierto que xi y xj son sustitutos, permanecen como tales, sin importar en
qué dirección se aplique la definición. En la práctica las definiciones son simétricas:
xi
pj
U constante
xj
pi
.
(6.24)
U constante
El efecto de sustitución de una variación en pi sobre el bien xj es idéntico al efecto de sustitución
de una variación en pj sobre la cantidad de xi elegida. Esta simetría es importante en el trabajo
teórico y empírico.2
Las diferencias entre las definiciones de sustitutos y complementarios son fáciles de demostrar
en la figura 6.1a. En esa figura, x y y son complementarios brutos pero sustitutos netos. La derivada x/py resulta ser negativa (x y y son complementarios brutos) porque el efecto de sustitución (positivo) es rebasado por el efecto de ingreso (negativo) (un decremento en el precio de y
causa que el ingreso real se incremente en alto grado y que, en consecuencia, las compras reales
de x se incrementen también). Sin embargo, como lo deja ver claramente la figura, si sólo hay dos
bienes entre los cuales elegir deben ser sustitutos netos, aunque puedan ser sustitutos brutos o
complementarios brutos. Debido a que se ha supuesto una TMS decreciente, el efecto de sustitución del precio debe ser negativo y, en consecuencia, el efecto de sustitución cruzado debe ser
positivo.
1
También se les llama sustitutos y complementarios de Hicks, en honor al economista británico John Hicks quien desarrolló originalmente las definiciones.
2
Esta simetría es fácil de demostrar usando el lema de Shephard. Las funciones de demanda compensada pueden calcularse a
partir de las funciones de gasto por diferenciación:
xic (p1 , . . . , pn , V)
E(p1 , . . . , pn , V)
.
pi
De ahí que el efecto de sustitución esté dado por
xi
pj
U constante
xci
2E
Eij .
pj pj pi
Pero ahora podemos aplicar el teorema de Young a la función de gasto:
Eij Eji xjc
pi
xj
pi
,
U constante
lo que comprueba la simetría.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 6: Relaciones de demanda entre bienes
193
SUSTITUIBILIDAD CON MUCHOS BIENES
Una vez que el modelo de optimización de la utilidad se extiende a muchos bienes, se vuelve posible una amplia variedad de patrones de demanda. Que un par de bienes en particular sean sustitutos netos o complementarios netos depende básicamente de las preferencias de una persona;
así, podrían observarse toda suerte de relaciones. Un importante dato teórico de interés para los
economistas es saber cuál es más frecuente, si la sustitución o la complementariedad. En la mayoría de los análisis se tiende a considerar los bienes como sustitutos (un incremento de precio en
un mercado tiende a incrementar la demanda en la mayoría de los demás mercados). Sería conveniente saber si esta intuición se justifica.
El economista británico John Hicks estudió este tema con cierto detalle hace más de 70 años
y llegó a la conclusión de que en su “mayoría” los bienes deben ser sustitutos. Este resultado se
resume en lo que se conoce como segunda ley de la demanda de Hicks.3 Una comprobación
moderna comienza con la función de demanda compensada para un bien particular: xci(p1,…,
pn, V). Esta función es homogénea de grado 0 en todos los precios (si la utilidad se mantiene
constante y los precios se duplican, las cantidades demandadas no varían porque las tangencias
de optimización de la utilidad tampoco lo hacen). Aplicar el teorema de Euler a esa función
produce
p1
xci
xci
p2
p1
p2
pn
xci
0.
pn
(6.25)
Este resultado puede formularse en términos de elasticidad dividiendo la ecuación 6.25 entre xi:
eci1 eci2
Pero sabemos que ecii
caso de que
ecin 0.
(6.26)
0 debido a la negatividad del efecto de sustitución. De ahí que deba ser el
ecij
0.
(6.27)
j i
Es decir, la suma de todas las elasticidades cruzadas, compensadas para un bien particular, debe
ser positiva (o de cero). Es en este sentido que la “mayoría” de los bienes son sustitutos. La evidencia empírica parece, en general, congruente con este hallazgo teórico: en los estudios empíricos de
la demanda se encuentran relativamente con menos frecuencia casos de complementariedad neta
entre bienes.
BIENES COMPUESTOS
Nuestro análisis en la sección anterior demostró que las relaciones de demanda entre bienes pueden ser complicadas. En el caso más general, un individuo que consume n bienes tendrá funciones de demanda que reflejen n(n 1)/2 efectos de sustitución diferentes.4 Cuando n es grande
(como lo es sin duda para todos los bienes específicos que realmente consumen las personas) este
caso general puede ser inmanejable. A menudo es mucho más conveniente agrupar los bienes en
agregados más extensos como alimentos, ropa, vivienda, etcétera. En el nivel extremo de agregados se podría querer examinar un bien específico (digamos gasolina), que puede llamarse x, y su
3
Véase John Hicks, Value and Capital (Oxford University Press, Oxford, 1939), apéndices matemáticos. Existe cierto debate acerca
de si este resultado debería llamarse segunda o tercera ley de Hicks. De hecho, otras dos leyes, que ya hemos visto, son enlistadas
por Hicks: 1) xci /pi 0 (negatividad del efecto de sustitución) y 2) xci /pj xcj/pi (simetría de efectos de sustitución cruzados).
Sin embargo, en el resumen por escrito de sus resultados, él mismo se refiere explícitamente a sólo dos “propiedades”.
4
Para ver esto nótese que todos los efectos de sustitución, sij, podrían registrarse en una matriz n n. Sin embargo, la simetría de
los efectos (sij sji) implica que sólo los términos sobre y bajo la diagonal principal de esta matriz pueden ser diferentes entre sí.
Esto equivale a la mitad de los términos de la matriz (n2/2) más la mitad restante de los términos en la diagonal principal de la
matriz (n/2).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
194
Parte 2: Elección y demanda
relación con “todos los demás bienes”, que pueden llamarse y. Este es el procedimiento que hemos
usado en algunas de nuestras gráficas bidimensionales, y seguiremos haciéndolo así en muchos
otros apartados de este libro. En esta sección se mostrarán las condiciones en las cuales este procedimiento puede defenderse. En las extensiones de este capítulo se exploran cuestiones más
generales que tienen que ver con la agregación de bienes en grupos más extensos.
Teorema de los bienes compuestos
Supóngase que los consumidores eligen entre n bienes pero sólo nos interesa específicamente uno
de ellos, digamos x1. En general, la demanda de x1 dependerá de los precios particulares de los
otros n 1 bienes. Pero si todos estos precios se mueven juntos, podría tener sentido agruparlos
en un solo “bien compuesto”, y. Formalmente, si se concede que p02,…, p0n representan los precios
iniciales de estos bienes, entonces suponemos que dichos precios sólo pueden variar juntos.
Podrán duplicarse todos, o decrecer todos 50 por ciento, pero los precios relativos de x2,…, xn no
variarán. Definamos ahora el bien compuesto y como los gastos totales en x2,…, xn, usando los
precios iniciales p02,…, p0n:
y p02x2 p03x3 … p0nxn.
(6.28)
La restricción presupuestal inicial de esta persona está dada por
I p1x1 p02x2 … p0nxn p1x1 y.
(6.29)
Por efecto de nuestra suposición, todos los precios p2,…, pn varían al mismo tiempo. Supóngase
que todos estos precios varían por un factor de t(t 0). Ahora la restricción presupuestal es
I p1x1 tp02x2 … tp0nxn p1x1 ty.
(6.30)
En consecuencia, el factor de proporcionalidad, t, desempeña en la restricción presupuestal de
este individuo la misma función que el precio de y (py) en nuestro análisis anterior de dos bienes.
Variaciones en p1 o en t promueven los mismos tipos de efectos de sustitución que hemos analizado. Mientras p2,…, pn se muevan juntos, podemos limitar nuestro examen de la demanda a
decisiones entre comprar x1 o comprar “todo lo demás”.5 Así, las gráficas simplificadas que presentan estos dos bienes en sus ejes pueden defenderse rigurosamente, siempre y cuando se satisfagan las condiciones del “teorema de bienes compuestos” (es decir, que todos los demás precios
se mueven juntos). Adviértase, sin embargo, que este teorema no hace predicciones sobre el comportamiento de las decisiones de x2,…, xn; estas no necesitan moverse al mismo tiempo. El teorema se centra únicamente en el gasto total en x2,…, xn, no en la forma en que se distribuye este
gasto entre artículos específicos (aunque se supone que dicha distribución se hace a modo de
optimizar la utilidad).
Generalizaciones y limitaciones
El teorema de los bienes compuestos se aplica a cualquier grupo de bienes cuyos precios relativos
se mueven juntos. Es posible tener más de uno de esos bienes si hay varios grupos que obedecen
este teorema (es decir, gastos en “alimentos”, “ropa”, etcétera). De ahí que hayamos desarrollado la
definición siguiente.
Esta definición y el teorema asociado son resultados eficaces. Ayudan a simplificar muchos
problemas que, de otra forma, serían irresolubles. Aun así, se debe tener cuidado al aplicar este
5
La idea de un bien compuesto también fue presentada por J. R. Hicks en Value and Capital, 2a. ed. (Oxford University Press,
Óxford, 1946), pp. 312-313. La prueba de este teorema se basa en la noción de que para alcanzar una utilidad óptima la razón de
las utilidades marginales para x2, . . . , xn debe permanecer sin cambios cuando todos los p2, . . . , pn se mueven juntos. De ahí que
el problema de n bienes pueda reducirse al problema bidimensional de igualar la razón de la utilidad marginal de x con la de y a
la “razón de precio” p1/t.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 6: Relaciones de demanda entre bienes
DEFINICIÓN
195
Bien compuesto. Un bien compuesto es un grupo de bienes, cuyos precios en su totalidad se mueven
juntos. Estos bienes pueden tratarse como un solo “bien” en cuanto que el individuo se comporta como
si eligiera entre otros bienes y el gasto total en el grupo compuesto entero.
teorema en la realidad porque sus condiciones son muy estrictas. Hallar una serie de bienes cuyos
precios se mueven juntos es raro. Ligeras desviaciones de la estricta proporcionalidad pueden
negar el teorema de los bienes compuestos, si los efectos de sustitución cruzada son grandes. En
las extensiones de este capítulo se examinan formas de simplificar situaciones en las que los precios se mueven independientemente.
EJEMPLO 6.3 Costos de vivienda como bien compuesto
Supongamos que un individuo recibe utilidad de tres bienes: alimentos (x), servicios de vivienda (y)
medidos en cientos de pies cuadrados y operaciones domésticas (z) medidas por uso de electricidad.
Si su utilidad está dada por la función ESC de tres bienes
1
x
utilidad U(x, y, z
1
y
1
,
z
(6.31)
se puede usar la técnica de Lagrange para calcular las funciones de demanda de Marshall para estos bienes como
x
I
,
px px py px pz
y
I
,
py py px py pz
z
I
.
pz pz px pz py
(6.32)
Si inicialmente I 100, px 1, py 4 y pz 1, entonces las funciones de demanda predicen
x 25,
y 12.5,
z 25.
(6.33)
De ahí que 25 se gaste en alimentos y 75 en necesidades relacionadas con la vivienda. Si suponemos
que los precios de los servicios de vivienda (py) y los precios de las operaciones domésticas (pz) siempre
se mueven juntos, podemos usar los precios iniciales para definir el “bien compuesto” vivienda (h)
como
h 4y 1z.
(6.34)
Aquí también definimos (arbitrariamente) como 1 el precio inicial de vivienda (ph). La cantidad inicial
de vivienda es simplemente el total de dólares gastados en h:
h 4(12.5) 1(25) 75.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(6.35)
8/23
196
Parte 2: Elección y demanda
Además, debido a que py y pz siempre se mueven juntos, ph siempre estará relacionado con estos precios por
ph pz 0.25py .
(6.36)
Usando esta información puede recalcularse la función de demanda para x como función de I, px, y ph:
I
px 4px ph px ph
I
.
py 3 px ph
x
(6.37)
De nueva cuenta, inicialmente I 100, px 1 y ph 1; por tanto, x* 25. El gasto en vivienda puede
calcularse más fácil a partir de la restricción presupuestal como h* 75 porque el gasto en vivienda
representa “todo” lo que no es alimentos.
Incremento en los costos de vivienda. Si los precios de y y z se incrementaran proporcionalmente a
py 16, pz 4 (con px sin variar en 1), entonces ph también se incrementaría a 4. La ecuación 6.37
predice ahora que la demanda de x decrecería a
x 100
100
7
1 3 4
(6.38)
y que las compras por concepto de vivienda estarían dadas por
ph h 100
100 600
,
7
7
(6.39)
o, debido a que ph 4,
h 150
.
7
(6.40)
Adviértase que este es justo el nivel de compras por concepto de vivienda predicho por las funciones de
demanda originales para los tres bienes en la ecuación 6.32. Con I 100, px 1, py 16 y pz 4, estas
ecuaciones pueden resolverse como
100
,
7
100
,
y 28
100
z ,
14
x (6.41)
así que la cantidad total consumida del bien compuesto “vivienda” (de acuerdo con la ecuación 6.34) está
dada por
h 4y 1z 150
.
7
(6.42)
De ahí que obtengamos las mismas respuestas a variaciones de precio independientemente de si elegimos
examinar la demanda de los tres bienes x, y y z o considerar sólo las decisiones entre x y el bien compuesto h.
PREGUNTAS: ¿Cómo saber que la función de demanda de x en la ecuación 6.37 continúa garantizando
la optimización de la utilidad? ¿Por qué el problema lagrangiano de optimización restringida se mantiene
sin variación al hacer las sustituciones representadas por la ecuación 6.36?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 6: Relaciones de demanda entre bienes
197
PRODUCCIÓN DOMÉSTICA, ATRIBUTOS
DE LOS BIENES Y PRECIOS IMPLÍCITOS
Hasta aquí, en este capítulo, nos hemos concentrado en lo que los economistas pueden saber
sobre las relaciones entre bienes, observando el cambiante consumo de los individuos de estos
bienes en reacción a las variaciones de los precios en el mercado. En cierto sentido este análisis
elude la pregunta central de por qué el café y la crema van juntos o por qué el pescado y el pollo
pueden sustituirse entre sí en la dieta de una persona. Para desarrollar una comprensión más
profunda de estas cuestiones los economistas han tratado de explorar actividades dentro de los
hogares de los individuos. Es decir, han ideado modelos no mercantiles de tipos de actividades
como la atención de los hijos por parte de los padres, la preparación de alimentos, o el bricolaje o
“hágalo usted mismo” para entender cómo estas actividades resultan, en última instancia, en
demandas de bienes en el mercado. En esta sección se revisarán brevemente algunos de dichos
modelos. El objetivo principal es ilustrar algunas de las implicaciones de este enfoque para la
teoría tradicional de la elección.
Modelo de producción doméstica
El punto de partida para la mayoría de los modelos de producción doméstica es suponer que los
individuos no reciben utilidad directamente de los bienes que adquieren en el mercado (como
hemos supuesto hasta aquí). En cambio, sólo cuando la gente combina los bienes del mercado con
aportaciones de tiempo es que se generan productos generadores de utilidad. Desde este punto de
vista la carne cruda de res y las papas sin cocer no rinden ninguna utilidad hasta que se cocinan
juntas para preparar un guiso. De igual forma, las adquisiciones mercantiles de carne de res y
papas sólo pueden entenderse examinando las preferencias de guisos de una persona y la tecnología subyacente para su preparación.
En términos formales, supongamos nuevamente que hay tres bienes que un individuo podría
adquirir en el mercado: x, y y z. Adquirir estos bienes no brinda ninguna utilidad directa, pero
pueden ser combinados para generar uno de dos bienes de producción doméstica: a1 o a2. La tecnología de esta producción doméstica puede ser representada por las funciones de producción f1 y
f1 (véase el capítulo 9 para un análisis más completo del concepto de función de producción). Así,
a1 f1 (x, y, z),
a2 f2 (x, y, z),
(6.43)
utilidad U(a1, a2)
(6.44)
y
El objetivo de un individuo es elegir x, y, z para optimizar su utilidad sujeta a las restricciones de
producción y a una restricción presupuestal financiera:6
pxx pyy pzz I.
(6.45)
Aunque no examinaremos en detalle los resultados que pueden derivarse de este modelo general,
cabe mencionar dos discernimientos que pueden extraerse de él. Primero, este modelo puede
ayudar a esclarecer la naturaleza de las relaciones de mercado entre los bienes. Puesto que las
funciones de producción en las ecuaciones 6.43 son, en principio, mensurables usando datos
detallados sobre las operaciones domésticas, las familias pueden ser tratadas como empresas
“multiproductos” y ser estudiadas usando muchas de las técnicas que emplean los economistas
para analizar la producción.
Un segundo discernimiento provisto por el enfoque de producción doméstica es la noción de
los precios “implícitos” o “sombra” asociados a los bienes de producción doméstica a1 y a2. Debido
6
A menudo, la teoría de la producción doméstica también se centra en la asignación de tiempo que hace una persona para
producir a1 y a2 o para trabajar en el mercado. En el capítulo 16 se analizan algunos modelos simples de este tipo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
198
Parte 2: Elección y demanda
a que consumir más de a1, por decir algo, requiere el uso de más de los “ingredientes” x, y y z, esta
actividad tiene obviamente un costo de oportunidad en términos de la cantidad de a2 que se
puede producir. Para producir más pan, por ejemplo, una persona no sólo debe disponer de algo
de harina, leche y huevos para preparar pastelillos, sino que también tiene que alterar las cantidades relativas de adquisición de estos bienes porque está limitada por una restricción presupuestal
general. De ahí que el pan tenga un precio implícito en términos del número de pastelillos a los
que se debe renunciar para poder consumir una hogaza más. Ese precio implícito se reflejará no
sólo en los precios de mercado de los ingredientes del pan, sino también en la tecnología disponible para la producción doméstica y, en modelos más complejos, en las aportaciones relativas de
tiempo requeridas para producir ambos bienes. Como punto de partida, sin embargo, la noción
de precios implícitos puede ilustrarse inmejorablemente con un modelo simple.
Modelo de atributos lineales
Una forma particularmente simple del modelo de producción doméstica fue desarrollada originalmente por K. J. Lancaster para examinar los “atributos” subyacentes de los bienes.7 En este
modelo son los atributos de los bienes los que brindan utilidad a los individuos, y cada bien específico contiene un conjunto fijo de atributos. Si, por ejemplo, nos fijamos únicamente en las calorías (a1) y vitaminas (a2) que aportan diversos alimentos, el modelo de Lancaster supone que la
utilidad es una función de estos atributos y que los individuos adquieren diversidad de alimentos
sólo con el propósito de obtener las calorías y vitaminas que estos ofrecen. En términos matemáticos, este modelo supone que las ecuaciones de “producción” tienen la forma simple
a1 a1x x a1y y a1z z,
a2 a2x x a2y y a2z z,
(6.46)
donde a1x representa el número de calorías por unidad del alimento x, a2x representa el número de
vitaminas por unidad del alimento x, y así sucesivamente. En esta forma del modelo no hay ninguna “producción” real en el hogar. Más bien, el problema de decisión es cómo elegir una dieta
que provea la combinación óptima de calorías y vitaminas, dado el presupuesto alimentario disponible.
Ilustración de las restricciones presupuestales
Para iniciar nuestro examen de la teoría de la elección conforme al modelo de atributos, ilustraremos primero la restricción presupuestal. En la figura 6.2 el radio 0x registra las diversas combinaciones de a1 y a2 disponibles de cantidades sucesivamente mayores del bien x. Debido a la tecnología de producción lineal supuesta en el modelo de los atributos estas combinaciones de a1 y a2
se tienden a lo largo de una línea recta, aunque en modelos más complejos de producción doméstica ése podría no ser el caso. De igual forma, los radios de 0y y 0z muestran las cantidades de los
atributos a1 y a2 provistas por diversas cantidades de los bienes y y z que podrían adquirirse.
Si esta persona gasta todo su ingreso en el bien x, la restricción presupuestal (ecuación 6.45)
permite la adquisición de
I
(6.47)
x ,
px
y esto producirá
a1 I
a1 a1x x x ,
px
(6.48)
2
a
I
a2 a2x x x .
px
7
Véase K. J. Lancaster, “A New Approach to Consumer Theory”, Journal of Political Economy, núm. 74 (abril de 1966), pp. 132-157.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 6: Relaciones de demanda entre bienes
199
Los puntos x*, y* y z* indican las cantidades de los atributos a1 y a2 que es posible adquirir comprando sólo
x, y o z, respectivamente. El área sombreada muestra todas las combinaciones que se pueden comprar con
conjuntos mixtos. Algunos individuos pueden optimizar su utilidad en E, y otros en E'.
FIGURA 6.2
Optimización de la utilidad
en el modelo de atributos.
a2
x
U′0
a*2
y
x*
E′
y*
z
E
U0
z*
0
a*1
a1
Este punto se registra como punto x* en el radio 0x de la figura 6.2. De igual manera, los puntos
y* y z* representan las combinaciones de a1 y a2 que se obtendrían si todo el ingreso se gastara en
el bien y o en el bien z, respectivamente.
Conjuntos obtenibles de a1 y a2 adquiriendo tanto x como y (con un presupuesto fijo) son
representados por la línea que une a x* y y* en la figura 6.2.8 De igual modo, la línea x* z* representa las combinaciones de a1 y a2 disponibles de x y z, y la línea y* z* muestra las combinaciones
disponibles de la mezcla de y y z. Todas las combinaciones posibles de la mezcla de los tres bienes
del mercado están representadas por el área triangular sombreada x* y* z*.
Soluciones de esquina
Un hecho salta inmediatamente a la vista en la figura 6.2: un individuo optimizador de su utilidad
nunca consumiría cantidades positivas de los tres bienes. Sólo el perímetro noreste del triángulo
x* y* z* representa las cantidades máximas de a1 y a2 a disposición de este individuo, dados su
ingreso y los precios de los bienes del mercado. Individuos con una preferencia por a1 tendrán
curvas de indiferencia similares a U0 y optimizarán su utilidad eligiendo un punto como E. La
combinación de a1 y a2 especificada por ese punto puede obtenerse consumiendo sólo los bienes
y y z. De la misma manera, una persona con preferencias representadas por la curva de indiferencia U0ʹ elegirá el punto Eʹ y consumirá sólo los bienes x y y. Así, el modelo de atributos predice que
las soluciones de esquina en las cuales los individuos consumen cero cantidades de algunos bienes
8
Matemáticamente, supongamos que una fracción
del presupuesto se gasta en x y (1 ) en y; entonces,
a1 a1xx* (1 )a1yy*,
a1 a2xx* (1 )a2yy*.
La línea x*y* se traza permitiendo que
triangular x*y*z*.
varíe entre 0 y 1. Las líneas x*z* y y*z* se trazan en forma similar, lo mismo que el área
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
200
Parte 2: Elección y demanda
relativamente comunes, especialmente en casos en que los individuos adjudican valor a menos
atributos (dos aquí) que a los bienes del mercado entre los cuales elegir (tres). Si el ingreso, los
precios o las preferencias varían, los patrones de consumo también podrían variar abruptamente.
Los bienes previamente consumidos podrían dejar de comprarse y bienes previamente omitidos
podrían experimentar un incremento significativo en adquisiciones. Esto es resultado directo de
los supuestos lineales inherentes a las funciones de producción que hemos asumido aquí. En los
modelos de producción doméstica con supuestos de mayor sustitución, esas reacciones discontinuas son menos probables.
Resumen
En este capítulo se usó el modelo de elección de optimización de
la utilidad para estudiar relaciones entre bienes de consumo.
Aunque estas relaciones pueden ser complejas, el análisis que
presentamos aquí ofrece varias maneras de clasificarlas y simplificarlas.
• Cuando hay sólo dos bienes los efectos de ingreso y de sustitución de la variación en el precio de un bien (digamos py) sobre
la demanda de otro bien (x) suelen operar en direcciones
opuestas. Así, el signo de x/py es ambiguo: su efecto de sustitución es positivo pero su efecto de ingreso, negativo.
• En casos de más de dos bienes las relaciones de demanda
pueden especificarse de dos maneras. Dos bienes xi y xj son
“sustitutos brutos” si xi/pj 0 y “complementarios brutos”
si xi/pj 0. Lamentablemente, y debido a que estos efectos de precio incluyen efectos de ingreso, no tienen que ser
simétricos. Es decir, xi/pj no necesariamente es igual a
xj/pi.
• Atender únicamente los efectos de sustitución de variaciones de precio elimina esta ambigüedad porque los efectos de
sustitución son simétricos; esto es, xci/pj xcj/pi. Ahora,
dos bienes se definen como sustitutos netos (o de Hicks) si
xci/pj 0 y como complementarios netos si xci/pj 0. La
“segunda ley de la demanda” de Hicks demuestra que los
sustitutos netos son más frecuentes.
• Si un grupo de bienes tiene precios que siempre se mueven al
mismo tiempo, los gastos en esos bienes pueden tratarse como
un bien “compuesto” cuyo “precio” está dado por la magnitud
de la variación proporcional en los precios de los bienes compuestos.
• Otra forma de desarrollar la teoría de la elección entre bienes
de mercado es atender los modos en que estos se usan en la
producción doméstica para ofrecer atributos aportadores de
utilidad lo cual puede brindar discernimientos adicionales
sobre las relaciones entre bienes.
Problemas
6.1
Heidi recibe utilidad de dos bienes: leche de cabra (m) y strudel (s), de acuerdo con la función de utilidad
U(m, s) m . s.
a. Demuestra qué incrementos en el precio de la leche de cabra no afectarán la cantidad de strudel que Heidi compra; es decir, que
s/pm 0.
b. Demuestra asimismo que m/ps 0.
c. Usa la ecuación de Slutsky y la simetría de los efectos de sustitución neta para comprobar que los efectos de ingreso implicados en las
derivadas de los incisos a) y b) son idénticos.
d. Comprueba el inciso c), usando explícitamente las funciones de demanda de Marshall para m y s.
6.2
Burt el Correoso compra únicamente whisky de garrafa y donas con mermelada para mantenerse. Para él, el whisky de garrafa es un bien
inferior que exhibe la paradoja de Giffen; aunque ese tipo de whisky y las donas con mermelada son sustitutos de Hicks en el sentido tradicional. Desarrolla una explicación intuitiva para sugerir por qué un incremento en el precio del whisky de garrafa debe generar que se
compren menos donas con mermelada. Es decir, estos bienes deben ser complementarios brutos.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 6: Relaciones de demanda entre bienes
201
6.3
Donaldo, un frugal estudiante de posgrado, sólo consume café (c) y pan tostado con mantequilla (bt). Compra estos productos en la cafetería de la universidad y siempre usa dos porciones de mantequilla por cada rebanada de pan. Donaldo gasta exactamente la mitad de su
magro estipendio en café y la otra mitad en pan tostado con mantequilla.
a. En este problema el pan tostado con mantequilla puede tratarse como un bien compuesto. ¿Cuál es su precio en términos de los precios
de la mantequilla (pb) y el pan tostado (pt)?
b. Explica por qué c/pbt 0.
c. Asimismo, ¿es cierto aquí que c/pb y c/pt son iguales a 0?
6.4
La señorita Sarah Viajera no tiene automóvil y sólo viaja en autobús, tren o avión. Su función de utilidad está dada por
utilidad b . t . p,
donde cada letra significa millas recorridas por modo de transporte específico. Supón que la razón del precio del boleto de tren con el del
autobús (pt/pb) no varía nunca.
a.
b.
c.
d.
¿Cómo podría definirse un bien compuesto para el transporte terrestre?
Formula el problema de optimización de Sarah como un problema de elección entre transporte terrestre (g) y aéreo (p).
¿Cuáles son las funciones de demanda de Sarah para g y p?
Una vez que Sarah decide cuánto gastar en g, ¿cómo distribuirá esos gastos entre b y t?
6.5
Supón que un individuo consume tres bienes, x1, x2 y x3, y que x1 y x2 son bienes similares (es decir, comidas en restaurante baratas y caras),
con p2 kp3, donde k 1; es decir, los precios de los bienes tienen una relación constante entre sí.
a. Demuestra que x2 y x3 pueden tratarse como un bien compuesto.
b. Supón que x2 y x3 están sujetos a un costo de transacción de t por unidad (para algunos ejemplos, véase el problema 6.6). ¿Cómo afectará este costo de transacción el precio de x2 en relación con el de x3? ¿Cómo variará este efecto con el valor de t?
c. ¿Puedes predecir cómo un incremento de ingreso compensado en t afecta los gastos en el bien compuesto x2 y x3? ¿El teorema de bienes
compuestos se aplica estrictamente a este caso?
d. ¿Cómo afectará el incremento de ingreso compensado en t, la forma de asignar el gasto total en el bien compuesto entre x2 y x3?
6.6
Aplica los resultados del problema 6.5 para explicar las observaciones siguientes:
a. Es difícil hallar manzanas de alta calidad por comprar en el estado de Washington o buenas naranjas frescas en Florida.
b. Los individuos con gastos significativos en la contratación de niñeras tienen más probabilidades de comer en restaurantes caros (antes
que hacerlo en sitios baratos) que aquellas sin ese tipo de gastos.
c. Los individuos con alto valor de tiempo son más proclives a viajar en el Concorde que aquellos con un bajo valor de tiempo.
d. Es más probable que los individuos obtengan gangas de artículos caros que de artículos baratos. Nota: Las observaciones b) y d) componen la base de, quizá, los dos únicos casos de homicidio en los que un economista resuelve el crimen; véase Marshall Jevons, Murder
at the Margin (Asesinato marginal) y The Fatal Equilibrium (El equilibrio fatal).
6.7
En general, los efectos cruzados no compensados no son iguales, es decir,
xi
pj
xj
.
pi
Usa la ecuación de Slutsky para demostrar que estos efectos son iguales si una persona gasta una fracción constante de su ingreso en cada
bien, sin considerar los precios relativos. (Esta es una generalización del problema 6.1.)
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
202
Parte 2: Elección y demanda
6.8
En el ejemplo 6.3 se calcularon las funciones de demanda implicadas por la función de utilidad ESC de tres bienes
U( x, y, z )
1
x
1
y
1
.
z
a. Usa la función de demanda de x en la ecuación 6.32 para determinar si x y y o x y z son sustitutos brutos o complementarios brutos.
b. ¿Cómo determinarías si x y y o x y z son sustitutos netos o complementarios netos?
Problemas analíticos
6.9 Superávit del consumidor con muchos bienes
En el capítulo 5 se demostró cómo los costos de bienestar de las variaciones en un precio pueden medirse usando funciones de gasto y
curvas de demanda compensada. En este problema se te pedirá generalizar estas variaciones de precio en dos (o muchos) bienes.
a. Supón que un individuo consume n bienes y que los precios de dos de ellos (digamos p1 y p2) se incrementan. ¿Cómo usarías la función
de gasto para medir la variación compensatoria (VC) para este individuo como resultado del aumento de precio?
b. Una forma de mostrar gráficamente estos costos de bienestar sería usar curvas de demanda compensada para los bienes x1 y x2, suponiendo que un precio aumentó antes que el otro. Ilustra este enfoque.
c. En tu respuesta al inciso b), ¿es relevante en qué orden consideras las variaciones de precio? Explica tu respuesta.
d. En general, ¿crees que la VC para un aumento de precio de estos dos bienes sea mayor si los bienes son sustitutos netos o complementarios netos?, ¿o la relación entre los bienes no tiene ninguna consecuencia en los costos de bienestar?
6.10 Utilidad separable
Una función de utilidad se llama separable si puede escribirse como
U(x, y) U1(x) U2(y),
donde Uʹi 0, Uʹʹi 0 y U1, U2 no son necesariamente la misma función.
a. ¿Qué supone la separabilidad sobre la derivada parcial cruzada Uxy? Aporta un análisis intuitivo de lo que significa esta condición y en
qué situaciones podría ser verosímil.
b. Demuestra que si la utilidad es separable, ningún bien puede ser inferior.
c. ¿El supuesto de separabilidad te permite concluir definitivamente si x y y son sustitutos netos o complementarios netos? Explica tu
respuesta.
d. Usa la función de Cobb-Douglas para demostrar que la separabilidad no es invariante respecto a las transformaciones monótonas.
Nota: Las funciones separables se examinarán con mayor detalle en las extensiones de este capítulo.
6.11 Graficar complementarios
Graficar complementarios es complicado porque una relación de complementariedad entre bienes (conforme a la definición de Hicks)
no puede ocurrir con únicamente dos bienes. Más bien, la complementariedad implica necesariamente las relaciones de demanda
entre tres (o más) bienes. En su revisión de la complementariedad Samuelson ofrece una manera de ilustrar el concepto con un
diagrama de curva de indiferencia bidimensional (véase “Sugerencias de lecturas adicionales”). Para examinar este diagrama supón
que hay tres bienes entre los cuales puede escoger un consumidor. Las cantidades de estos se denotan con x1, x2 y x3. Ahora procede
como sigue.
a. Traza una curva de indiferencia para x2 y x3, manteniendo constante la cantidad de x1, en x01. Esta curva de indiferencia tendrá la forma
convexa acostumbrada.
b. Traza ahora una segunda curva de indiferencia (más alta) para x2, x3 manteniendo x1 constante en x01 h. Para esta nueva curva de
indiferencia muestra la cantidad de x2 extra que compensaría a esta persona por la pérdida de x1; designa a este monto j. De igual
manera, muestra la cantidad de x3 adicional que compensaría la pérdida de x1, y llama a esta cantidad k.
c. Supón ahora que un individuo recibe las cantidades j y k, lo que le permite moverse a una curva de indiferencia más alta x2, x3. Muestra
este movimiento en tu gráfica y traza esta nueva curva de indiferencia.
d. Samuelson sugiere ahora las definiciones siguientes:
• Si la nueva curva de indiferencia corresponde a la curva de indiferencia cuando x1 x01 2h, los bienes 2 y 3 son independientes.
• Si la nueva curva de indiferencia brinda más utilidad que cuando x1 x01 2h, los bienes 2 y 3 son complementarios.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 6: Relaciones de demanda entre bienes
203
• Si la nueva curva de indiferencia brinda menos utilidad que cuando x1 x01 2h, los bienes 2 y 3 son sustitutos. Demuestra que estas
definiciones gráficas son simétricas.
e. Analiza cómo es que estas definiciones gráficas se corresponden con las definiciones más matemáticas de Hicks dadas en el texto.
f. Al examinar tu gráfica final, ¿crees que este enfoque explica por completo los tipos de relaciones que podrían existir entre x2 y x3?
6.12 Embarque de las manzanas buenas
Los detalles del análisis sugerido en los problemas 6.5 y 6.6 fueron originalmente resueltos por Borcherding y Silberberg (véase “Sugerencias de lecturas adicionales”) con base en una suposición inicialmente propuesta por Alchian y Allen. Estos autores analizan cómo un cargo
de transacción afecta la demanda relativa de dos artículos cercanamente sustituibles. Supón que los bienes x2 y x3 son sustitutos cercanos y
están sujetos a un cargo de transacción de t por unidad. Supón, asimismo, que el bien 2 es el más costoso de ambos (es decir, “manzanas
buenas” en oposición a “manzanas preparadas”). De ahí que el cargo de transacción disminuya el precio relativo del bien más costoso [esto
es, (p2 t)/(p3 t) decrece al incrementar t]. Esto a su vez incrementará la demanda relativa del bien costoso, si (xc2/xc3)/t 0 (donde se
usan funciones de demanda compensada para eliminar incómodos efectos de ingreso). Borcherding y Silberberg demuestran que este
resultado probablemente sería válido, siguiendo estos pasos.
a. Usa la derivada de una regla del cociente para desarrollar (xc2/xc3)/t.
b. Usa tu resultado del inciso a), junto con el hecho de que en este problema xci/t xci/p2 xci/p3 para i 2, 3, para demostrar que
la derivada que buscamos puede escribirse como
(xc2 / xc3 ) xc2 s22 s23
c
x3 x 2 x 2
t
s32
x3
s33
,
x3
donde sij xci/pj.
c. Reescribe el resultado del inciso b) en términos de elasticidades de precio compensadas:
ecij xci pj
.
pj xci
d. Usa la tercera ley de Hicks (ecuación 2.26) para demostrar que el término entre corchetes en los incisos b) y c) puede escribirse ahora
como [(e22 e23)(1/p2 1/p3) (e21 e31)/p3].
e. Desarrolla un argumento intuitivo de por qué es probable que la expresión del inciso d) sea positiva en las condiciones de este problema. Pistas: ¿Por qué el primer producto entre corchetes es positivo? ¿Por qué es probable que el segundo término entre corchetes sea
reducido?
f. Vuelve al problema 6.6 y ofrece explicaciones más completas de estos diversos hallazgos.
Sugerencias de lecturas adicionales
Borcherdin, T. E. y E. Silberberg. “Shipping the Good Apples
Out—The Alchian-Allen Theorem Reconsidered”, Journal of Political Economy (febrero de 1978), pp. 131-138.
Buen análisis de las relaciones entre tres bienes en la teoría de la
demanda. Véanse también los problemas 6.5 y 6.6.
Hicks, J. R. Value and Capital, 2a. ed., Oxford University Press,
Oxford, 1946. Véanse los capítulos I-III y apéndices asociados.
Prueba del teorema de los bienes compuestos. Ofrece también uno de
los primeros tratamientos de sustitutos y complementarios netos.
Mas-Colell, A., M. D. Whinston y J. R. Green. Microeconomic
Theory, Oxford University Press, Nueva York, 1995.
Explora las consecuencias de la simetría de los efectos cruzados compensados para varios aspectos de la teoría de la demanda.
Adecuado tratamiento gráfico y matemático del enfoque de atributos
de la teoría del consumo y del concepto de “mercados” de atributos.
Samuelson, P. A. “Complementarity—An Essay on the 40th Anniversary of the Hicks-Allen Revolution in Demand Theory”, Journal
of Economic Literature (diciembre de 1977), pp. 1255-1289.
Revisa varias definiciones de complementariedad y muestra las relaciones entre ellas. Contiene un intuitivo análisis gráfico y un apéndice
matemático detallado.
Silberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001.
Buen análisis de funciones de gasto y el uso de funciones de utilidad
indirecta para ilustrar el teorema de bienes compuestos y otros resultados.
Rosen, S. “Hedonic Prices and Implicit Markets”, Journal of Political Economy (enero/febrero de 1974), pp. 34-55.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
204
Parte 2: Elección y demanda
EXTENSIONES
Simplificación de la demanda
y presupuestación en dos etapas
En el capítulo 6 se vio que la teoría de la optimización de la utilidad impone, en su generalidad, pocas restricciones a lo que
podría ocurrir. Aparte del hecho de que los efectos netos de sustitución cruzada son simétricos, prácticamente cualquier tipo de
relación entre bienes es congruente con la teoría subyacente.
Esta situación plantea problemas para los economistas que
desean estudiar el comportamiento de consumo en la realidad;
la teoría sencillamente no da mucha orientación cuando hay
muchos miles de bienes potencialmente disponibles para su
estudio.
Existen dos maneras generales de hacer simplificaciones.
La primera se sirve del teorema de los bienes compuestos del
capítulo 6 para agregar bienes en categorías en las que los precios relativos se mueven juntos. Para situaciones en que los
economistas están específicamente interesados en las variaciones en los precios relativos dentro de una categoría de gasto
(como variaciones en los precios relativos de varias formas de
energía), sin embargo, este proceso no bastará. Una opción es
suponer que los consumidores siguen un proceso de dos etapas en sus decisiones de consumo. Primero distribuyen su
ingreso a diversos y amplios grupos de bienes (alimentos y
ropa, por ejemplo) y luego, dadas estas restricciones de gasto,
optimizan su utilidad en cada una de las subcategorías de bienes, usando sólo información sobre los precios relativos de
dichos bienes. De esta forma, las decisiones pueden estudiarse
en un marco simplificado, considerando únicamente una categoría por cada vez. Este proceso se llama presupuesto en dos
etapas. En estas extensiones se examina primero la teoría
general del presupuesto en dos etapas para luego analizar
algunos ejemplos empíricos.
E6.1 Teoría de la presupuestación en dos etapas
La cuestión que surge en el presupuesto en dos etapas puede
enunciarse sucintamente: ¿existe una división de bienes en m
grupos no empalmados (denotados por r 1, m) y un presupuesto aparte (lr) dedicado a cada categoría, de tal manera que
las funciones de demanda de los bienes en una categoría sólo
dependan de los precios de los bienes de esa categoría y de la
asignación presupuestal a esa misma categoría? Es decir, ¿los
bienes pueden dividirse de tal forma que la demanda esté dada
por
xi(p1, . . . , pn, I) xi∈r (pi∈r, Ir)
(i)
para r 1, m? Que esto se puede hacer es algo que se sugiere al
comparar el siguiente problema de optimización en dos etapas,
V ð p1 , . . . , pn , I 1 , . . . , I m Þ
"
¼ max Uðx1 , . . . , xn Þ s.t.
x1 , ... , xn
X
#
pi xi I r , r ¼ 1, m
(ii)
i2r
y
max V s.t.
I 1 , ... , I m
M
X
I r ¼ I,
r¼1
con el problema de optimización de la utilidad que hemos estudiado,
max Uðx1 , . . . , xn Þ
xi
s.t.
n
X
pi xi I:
(iii)
i¼1
Sin restricciones adicionales estos dos procesos de optimización
producirán el mismo resultado; esto es, la ecuación ii es sencillamente una manera más complicada de formular la ecuación iii.
Así, ciertas restricciones deben imponerse a la función de utilidad
para garantizar que las funciones de demanda que resultan de
resolver el proceso en dos etapas sean de la forma en que se especifica en la ecuación i. Intuitivamente, parece que tal clasificación
de bienes debería funcionar siempre y cuando las variaciones en el
precio de un bien en una categoría no afecten la asignación de
gasto a bienes en cualquier otra categoría que no sea la propia. En
el problema 6.9 se mostró un caso en el que esto es cierto para una
función de utilidad “aditivamente separable”. Lamentablemente,
este resulta ser un caso especial. Las más generales restricciones
matemáticas que deben imponerse a la función de utilidad para
justificar el presupuesto en dos etapas se han derivado ya (véase
Blackorby, Primont y Russell, 1978), pero no son especialmente
intuitivas. Claro que los economistas que desean estudiar las decisiones descentralizadas por consumidores (o, quizá sobre todo,
por empresas que operan muchas divisiones) deben hacer algo
para simplificar las cosas. Estudiemos ahora algunos ejemplos
aplicados.
E6.2 Relación con el teorema
de los bienes compuestos
Por desgracia, ninguno de los dos enfoques teóricos disponibles
de la simplificación de la demanda es completamente satisfactorio. El teorema de los bienes compuestos requiere que los precios
relativos de los bienes de un grupo se mantengan constantes en el
tiempo, supuesto que ha sido rechazado durante muy diferentes
periodos históricos.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 6: Relaciones de demanda entre bienes
Por otro lado, el tipo de separabilidad y presupuesto en dos
etapas, indicado por la función de utilidad en la ecuación i también requiere supuestos firmes sobre cómo las variaciones en los
precios de un bien en un grupo afectan el gasto en bienes de cualquier otro grupo. Estos supuestos parecen ser rechazados por los
datos (véase Diewert y Wales, 1995).
Los economistas han tratado de idear métodos híbridos aún
más elaborados para la agregación entre bienes. Por ejemplo,
Lewbel (1996) muestra cómo el teorema de los bienes compuestos
podría generalizarse a casos en que los precios relativos en un
grupo exhiben variabilidad considerable. Usa esta generalización
para agregar gastos de consumo estadounidenses en seis grandes
grupos (alimentos, ropa, operación doméstica, atención médica,
transporte y recreación). Usando estos agregados concluye que su
procedimiento es mucho más acertado que suponer un presupuesto en dos etapas entre esas categorías de gasto.
E6.3 Funciones homotéticas
y demanda de energía
Un modo de simplificar el estudio de la demanda cuando hay
muchos bienes es suponer que la utilidad de ciertas subcategorías
de bienes es homotética y puede separarse de la demanda de otros
bienes. Este procedimiento fue seguido por Jorgenson, Slesnick y
Stoker (1997) en su estudio de la demanda de energía por consu-
205
midores estadounidenses. Suponiendo que las funciones de
demanda de tipos específicos de energía son proporcionales al
gasto total en energía, los autores pudieron concentrar su estudio
empírico en el tema que más les interesaba: estimar las elasticidades precio de la demanda de varios tipos de energía. Llegan a la
conclusión de que la mayoría de los tipos de energía (electricidad,
gas natural, gasolina) tienen funciones de demanda muy elásticas.
La demanda parece ser muy sensible al precio de la electricidad.
Referencias
Blackorby, Charles, Daniel Primont y R. Robert Russell. Duality,
Separability and Functional Structure: Theory and Economic
Applications, North Holland, Nueva York, 1978.
Diewert, W. Erwin y Terrence J. Wales. “Flexible Functional Forms
and Tests of Homogeneous Separability”, Journal of Econometrics (junio de 1995), pp. 259-302.
Jorgenson, Dale W., Daniel T. Slesnick y Thomas M. Stoker. “TwoStage Budgeting and Consumer Demand for Energy”, en
Dale W. Jorgerson, ed., Welfare, vol. 1: Aggregate Consumer
Behavior, MIT Press, Cambridge, 1997, pp. 475-510.
Lewbel, Arthur. “Aggregation without Separability: A Standardized Composite Commodity Theorem”, American Economic
Review (junio de 1996), pp. 524-543.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Incertidumbre
y estrategia
PARTE
TRES
Capítulo 7
Incertidumbre
Capítulo 8
Teoría de juegos
Esta tercera parte extiende el análisis de la elección individual a marcos más complicados. En el capítulo 7
se examina el comportamiento individual en situaciones inciertas. Una decisión ya no se asocia con un resultado único, sino con varios de ellos más o menos probables. Se describirá por qué a los individuos suele
desagradarles el riesgo implicado en esas situaciones. Trataremos de entender los pasos que dan para mitigar el riesgo que incluyen compra de seguros, adquisición de más información y preservación de opciones.
El capítulo 8 atenderá decisiones tomadas en situaciones estratégicas en las que el bienestar de un
individuo depende no sólo de sus propias acciones, sino también de las acciones de otros y viceversa. Esto
conduce a cierta circularidad en el análisis de decisiones estratégicas, la cual se resolverá usando las
herramientas de la teoría de los juegos. Las nociones de equilibrio que se desarrollarán en el estudio de
tales situaciones son de amplio uso en economía.
Aunque esta parte puede considerarse la extensión natural del análisis de las elecciones del consumidor
de la parte 2 a marcos más complicados, se aplica a una serie mucho más amplia de tomadores de decisiones
como empresas u otras organizaciones, incluso países enteros. Por ejemplo, la teoría de los juegos proporcionará un marco para el estudio de la competencia imperfecta entre unas cuantas empresas en el capítulo 15.
207
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
SIETE
Incertidumbre
En este capítulo se exploran algunos de los elementos básicos de la teoría del comportamiento
individual en situaciones inciertas. Se analizará por qué a los individuos no les agrada el riesgo,
así como los diversos métodos (compra de seguros, adquisición de más información y preservación de opciones) que pueden adoptar para reducirlo. De manera más general, este capítulo pretende ofrecer una breve introducción a asuntos planteados por la posibilidad de que la información sea imperfecta cuando los individuos toman decisiones de optimización de su utilidad. La
sección “Extensiones” brinda una aplicación detallada de los conceptos de este capítulo al prohasta el capítulo 18 es aquella referente a cuando un individuo bien informado puede tomar ventaja de otro que esté mal informado en una transacción de mercado (información asimétrica).
ESTADÍSTICA MATEMÁTICA
Muchas de las herramientas formales para modelizar la incertidumbre en situaciones económicas
fueron originalmente desarrolladas en el campo de la estadística matemática. Algunas de estas herramientas se repasaron en el capítulo 2, y en este capítulo se hará amplio uso de los conceptos present Variablealeatoria:Una variable aleatoria es aquella que registra, en forma numérica, los
posibles resultados de un evento aleatorio.1
t Funcióndedensidaddeprobabilidad (FDP): Función f(x) que muestra las probabilidades
asociadas con los posibles resultados de una variable aleatoria.
t Valoresperadodeunavariablealeatoria: Resultado de una variable aleatoria que ocurrirá
“en promedio”. El valor esperado se denota con E(x). Si x es una variable aleatoria discreta con
n
n resultados, entonces E(x)
i 1 xif (xi). Si x es una variable aleatoria continua, entonces
E(x)
xf(x) dx.
t Varianzaydesviaciónestándardeunavariablealeatoria: Estos conceptos miden la
dispersión de una variable aleatoria respecto a su valor esperado. En el caso discreto, Var(x)
2
n
2
E(x) 2f(xi); en el caso continuo, Var(x)
x E(x) 2f(x) dx. La
x
i 1 xi
x
desviación estándar es la raíz cuadrada de la varianza.
Como veremos, todos estos conceptos entrarán en juego cuando iniciemos nuestro examen del
proceso de toma de decisiones de una persona que enfrenta varios resultados inciertos que pueden ser conceptualmente representados por una variable aleatoria.
1
Cuando sea necesario distinguir entre variables aleatorias y variables no aleatorias se usará la notación x̃ para denotar el hecho
de que la variable x es aleatoria en cuanto que adopta un número de resultados posibles aleatoriamente determinados. A menudo,
sin embargo, no será necesario hacer esa distinción porque la aleatoriedad será evidente en el contexto del problema.
209
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
210
Parte 3: Incertidumbre y estrategia
APUESTAS RAZONABLES E HIPÓTESIS
DE LA UTILIDAD ESPERADA
Una apuesta “razonable” es una serie especificada de premios y probabilidades asociadas con un
valor esperado de cero. Por ejemplo, si lanzas al aire una moneda con un amigo para ganar un dólar,
el valor esperado de esta apuesta es igual a cero porque
E(x) 0.5($1) 0.5($1) 0,
(7.1)
donde los beneficios se registran con un signo de suma y las pérdidas con un signo de resta. De
igual forma un juego que prometía hacerte ganar 10 dólares, si el resultado del lanzamiento de
una moneda era cara, pero que sólo te costaría 1 dólar, si el resultado era cruz, sería “no razonable” porque
E(x) 0.5($10) 0.5($1) $4.50.
(7.2)
Sin embargo, este puede convertirse fácilmente en un juego razonable, aportando simplemente
una cuota de entrada de 4.50 dólares por el derecho a jugar.
Desde hace mucho se ha reconocido que la mayoría de los individuos preferirían no hacer
apuestas razonables.2 Con fines de entretenimiento las personas pueden apostar unos dólares al
lanzar una moneda al aire, pero en general evitarían participar en un juego similar cuyo resultado
fuera de $1 millón o $1 millón. Uno de los primeros matemáticos en estudiar los motivos de
esta renuencia a incurrir en apuestas razonables fue Daniel Bernoulli, en el siglo xviii.3 Su examen de la famosa paradoja de San Petersburgo fue el punto de partida para prácticamente todos
los estudios del comportamiento de los individuos en situaciones inciertas.
Paradoja de San Petersburgo
En la paradoja de San Petersburgo se propuso la apuesta siguiente: se lanza al aire una moneda
hasta que caiga cara. Si cae cara por primera vez en el enésimo lanzamiento, el jugador recibe $2n.
Esta apuesta tiene un número infinito de resultados (una moneda podría ser lanzada al aire constantemente hasta el día del juicio final sin que cayera cara nunca, aunque la probabilidad de esto
es reducida), pero los primeros pueden consignarse fácilmente. Si xi representa el premio concedido cuando cae cara en el intento de orden i, entonces
x1 $2, x2 $4, x3 $8, …, xn $2n.
(7.3)
1
( 2 )i;
La probabilidad de que caiga cara por primera vez en el intento de orden i es de
esta es la
probabilidad de que caigan (i 1) cruces y luego cara. De ahí que las probabilidades de los premios dadas en la ecuación 7.3 sean
1
1
1
1
p1 ¼ , p2 ¼ , p3 ¼ , . . . , pn ¼ n :
2
4
8
2
(7.4)
Así, el valor esperado de la apuesta es infinito:
EðxÞ ¼
1
X
i¼1
pi xi ¼
1
X
2i ð1=2i Þ
i¼1
¼ 1 þ 1 þ 1 þ þ 1 þ ¼ 1.
(7.5)
2
Se supone que las apuestas analizadas aquí no producen en el juego más utilidad que la de los precios; de ahí que la observación
de que muchas personas apuestan de manera “no razonable” no es necesariamente una refutación de este enunciado. Más bien, de
esos individuos puede suponerse, razonablemente, que derivan cierta utilidad de las circunstancias asociadas con la ejecución del
juego. Por tanto, es posible diferenciar el aspecto de consumo de apostar del aspecto de riesgo puro.
3
Esta paradoja debe su nombre a la ciudad en la que se publicó el manuscrito original de Bernoulli. Reimpresión en D. Bernoulli,
“Exposition of a New Theory on the Measurement of Risk”, Econometrica, núm. 22 (enero de 1954), pp. 23-36.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
211
Cierta introspección, sin embargo, debería convencer a cualquiera de que ningún jugador
pagaría mucho (y menos aún el infinito) por hacer esta apuesta. Si se cobraran 1 000 millones
de dólares por entrar al juego, indudablemente que no habría jugadores, pese al hecho de que
1 000 millones de dólares es una cantidad considerablemente menor que el valor esperado del
juego. Esta es entonces la paradoja: la apuesta de Bernoulli no vale en cierto sentido su (infinito) valor esperado en dólares.
UTILIDAD ESPERADA
La solución de Bernoulli a esta paradoja fue argüir que los individuos no se interesan directamente en los premios en dinero de una apuesta; más bien, responden a la utilidad que el dinero
proporciona. Si suponemos que la utilidad marginal de la riqueza decrece al incrementar la
riqueza, la apuesta de San Petersburgo puede converger con un valor finito de utilidad esperada,
aunque su valor monetario esperado sea infinito. Puesto que la apuesta sólo brinda una utilidad
esperada finita, los individuos estarían dispuestos a pagar una cantidad finita por hacerla. El
ejemplo 7.1 examina algunos asuntos relacionados con la solución de Bernoulli.
EJEMPLO 7.1 Solución de Bernoulli a la paradoja y sus deficiencias
Supón, como hizo Bernoulli, que la utilidad de cada premio en la paradoja de San Petersburgo está dada por
U(xi) 1n(xi).
(7.6)
Esta función de utilidad logarítmica exhibe una utilidad marginal decreciente (es decir, U' 0 pero U'' 0),
y el valor de la utilidad esperada de este juego converge en un número finito:
1
X
utilidad esperada ¼
i¼1
1
X
¼
i¼1
pi Uðxi Þ
1
lnð2i Þ:
2i
(7.7)
Cierta manipulación de esta expresión resulta4 en que la utilidad esperada de esta apuesta es 1.39. Por
tanto un individuo con este tipo de función de utilidad podría estar dispuesto a invertir recursos que, de
lo contrario, producirían hasta 1.39 unidades de utilidad (cierta riqueza de aproximadamente 4 dólares
proporciona esta utilidad) comprando el derecho a ejecutar este juego. En consecuencia, la suposición de
que los grandes premios prometidos por la paradoja de San Petersburgo encontrarían una utilidad marginal decreciente permitió a Bernoulli ofrecer una solución a la paradoja.
Utilidad ilimitada. Lamentablemente, la solución de Bernoulli a la paradoja de San Petersburgo no
resuelve por completo el problema. Mientras no haya un límite superior a la función de utilidad la paradoja puede regenerarse redefiniendo los premios de la apuesta. Por ejemplo, con la función de utilidad
i
logarítmica los premios pueden fijarse como xi e2 , en cuyo caso
i
U(xi) lne2 2i
(7.8)
y la utilidad esperada de la apuesta sería nuevamente infinita. Desde luego que los premios en esta apuesta
redefinida son grandes. Por ejemplo, si en el quinto lanzamiento cayera cara por primera vez, una per5
sona ganaría e2 79 billones de dólares, aunque la probabilidad de ganar esto sería de sólo 1/25 0.031.
4
Prueba:
utilidad esperada ¼
1
1
X
X
i
i
ln 2 ¼ ln 2
.
2i
2i
i¼1
i¼1
Pero es posible demostrar que el valor de esta serie infinita final es de 2. De ahí que la utilidad esperada 2 ln 2 1.39.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
212
Parte 3: Incertidumbre y estrategia
A muchos observadores les parece improbable la idea de que los individuos pagarían mucho (digamos
billones de dólares) para participar en juegos con pocas probabilidades de obtener premios tan grandes. De
ahí que, en muchos sentidos, el juego de San Petersburgo siga siendo una paradoja.
PREGUNTA: He aquí dos soluciones alternas a la paradoja de San Petersburgo. Calcula, para cada una,
el valor esperado del juego original.
1. Supón que los individuos asumen que cualquier probabilidad menor que 0.01 es de hecho cero.
2. Supón que la función de utilidad de los premios de San Petersburgo está dada por
Uðxi Þ ¼
xi
1 000 000
si
si
xi 1 000 000,
xi 1 000 000.
EL TEOREMA VON NEUMANNMORGENSTERN
Una de las muchas contribuciones importantes a la parte 3 de nuestro texto es el libro de John von
Neumann y Oscar Morgenstern, The Theory of Games and Economic Behavior (Teoría de los juegos y comportamiento económico), quienes desarrollaron un fundamento matemático para la
solución de Bernoulli a la paradoja de San Petersburgo.5 En particular, elaboraron axiomas básicos de racionalidad y demostraron que cualquier individuo racional, en ese sentido, tomaría decisiones en condiciones de incertidumbre, aunque tuviera una función de utilidad sobre el dinero
de U(x) y optimizara el valor esperado de U(x) (más que el valor esperado del mismo beneficio
monetario x). Aunque la mayoría de estos axiomas parece eminentemente razonable a primera
vista, se han planteado muchas preguntas importantes sobre su sustentabilidad.6 Sin embargo,
aquí no nos ocuparemos de estas cuestiones.
Índice de utilidad Von Neumann-Morgenstern
Para comenzar, supongamos que hay n premios posibles que una persona podría ganar participando en una lotería. Concedamos que los premios se denotan con x1, x2, …, xn, y supongamos
que estos han sido dispuestos en atractivo orden ascendente. Por tanto, x1 es el premio con menos
preferencia y xn el más preferible. Ahora asignemos números de utilidad arbitrarios a estos premios extremos. Por ejemplo, es conveniente asignar
Uðx1 Þ ¼ 0,
Uðxn Þ ¼ 1,
(7.9)
pero cualquier otro par de números lo haría igualmente bien.7 Usando estos dos valores de utilidad, el propósito del teorema Von Neumann-Morgenstern es demostrar que existe una forma
razonable de asignar números específicos de utilidad a los demás premios disponibles. Supongamos que elegimos otro premio, digamos xi. Considérese el experimento siguiente. Le pedimos a
un individuo enunciar la probabilidad, digamos i, en la cual se muestre indiferente entre xi con
certidumbre y una apuesta que ofreciera premios de xn con probabilidad de i y de x1 con proba5
J. von Neumann y O. Morgenstern, The Theory of Games and Economic Behavior (Princeton University Press, Princeton, 1944).
Los axiomas de racionalidad en situaciones inciertas se analizan en el apéndice de este libro.
6
Para un estudio de algunas de las cuestiones planteadas en el debate sobre los axiomas de Von Neumann-Morgenstern, especialmente el supuesto de independencia, veáse C. Gollier, The Economics of Risk and Time (MIT Press, Cambridge, M.A., 2001), cap. 1.
7
Técnicamente, un índice de utilidad de Von Neumann-Morgenstern es único sólo hasta una opción de escala y origen; es decir,
hasta una “transformación lineal”. Este requisito es más estricto que el de que una función de utilidad sea única hasta una transformación monótona.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
213
bilidad (1 i). Parece razonable (aunque este es el supuesto más problemático en el enfoque de
Von Neumann-Morgenstern) que tal probabilidad exista: un individuo siempre será indiferente
entre una apuesta y algo seguro, siempre y cuando se ofrezca una probabilidad lo bastante alta de
obtener el mejor premio. También parece probable que i será mayor que el xi más deseable;
cuanto mejor sea xi, mejor debería ser la posibilidad de obtener xn para inducir al individuo a
apostar. Por tanto, la probabilidad de i mide cuán deseable es el premio xi. De hecho, la técnica
de Von Neumann-Morgenstern define la utilidad de xi como la utilidad esperada de la apuesta
que el individuo considera igualmente deseable xi:
U(xi) iU(xn) (1 i)U(x1).
(7.10)
Debido a nuestra elección de escala en la ecuación 7.9, tenemos
U(xi) i . 1 (1 i) . 0 i.
(7.11)
Al elegir con criterio las cifras de utilidad que se asignarán a los mejores y peores premios, hemos
podido idear una escala conforme a la cual el índice de utilidad atribuido a cualquier otro premio,
es simplemente la probabilidad de obtener el mayor en una apuesta que se considera equivalente
al premio en cuestión. Esta elección de índices de utilidad es arbitraria. Otros dos números cualesquiera podrían haberse usado para elaborar esta escala de utilidad, aunque nuestra elección
inicial (ecuación 7.9) es particularmente conveniente.
Optimización de la utilidad esperada
En consonancia con la elección de escala y origen, representada por la ecuación 7.9, supongamos
que a cada premio xi se le ha asignado un índice de utilidad i. Nótese en particular que 1 0,
n 1, y que los demás índices de utilidad se ubican entre estos extremos. Al usar estos índices
de utilidad es posible demostrar que un individuo “racional” elegirá entre apuestas con base en
sus “utilidades” esperadas (es decir, con base en el valor esperado de estos números del índice de
utilidad Von Neumann-Morgenstern).
Como ejemplo, considérense dos apuestas. La apuesta A ofrece x2 con probabilidad a y x3 con
probabilidad (1 a). La apuesta B ofrece x4 con probabilidad b y x5 con probabilidad (1 b). Se
quiere demostrar que una persona elegirá la apuesta A si y sólo si la utilidad esperada de la apuesta
A excede la de la apuesta B. Ahora, para las apuestas:
utilidad esperada de A aU(x2) (1 a)U(x3),
utilidad esperada de B bU(x4) (1 b)U(x5).
(7.12)
Sustituir los números del índice de utilidad (es decir, 2 es la “utilidad” de x2, y así sucesivamente) da
utilidad esperada de A a2 (1 a)3,
utilidad esperada de B b4 (1 b)5.
(7.13)
Se desea demostrar que un individuo preferirá la apuesta A a la apuesta B si y sólo si
a2 (1 a)3 b4 (1 b)5.
(7.14)
Para demostrar esto recuérdense las definiciones del índice de utilidad. El individuo es indiferente
entre x2 y una apuesta que ofrece x1 con probabilidad (1 2) y xn con probabilidad 2. Podemos
usar este hecho para sustituir las apuestas que sólo implican a x1 y xn por todas las utilidades en la
ecuación 7.13 (aun cuando el individuo sea indiferente respecto a ellas, el supuesto que esta sustitución puede establecer asume implícitamente que los individuos pueden ver a través de complejas combinaciones de lotería). Luego de un poco de complicada álgebra puede concluirse que
la apuesta A es equivalente a una apuesta que promete xn con probabilidad a2 (1 a) 3, y
que la apuesta B es equivalente a una apuesta que promete xn con probabilidad b4 (1 b) 5.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
214
Parte 3: Incertidumbre y estrategia
Presumiblemente, un individuo preferirá la apuesta con la mayor probabilidad de obtener el
mejor premio. En consecuencia, elegirá la apuesta A si y sólo si
a2 (1 a)3 b4 (1 b)5.
(7.15)
Pero esto es exactamente lo que queríamos demostrar. Por consiguiente, hemos probado que un
individuo elegirá la apuesta que proporcione el nivel más alto de utilidad esperada (Von Neumann-Morgenstern). Ahora haremos un uso considerable de este resultado, que puede resumirse
como sigue.
PRINCIPIO DE
OPTIMIZACIÓN
Optimización de la utilidad esperada. Si los individuos obedecen los axiomas de comportamiento Von
Neumann-Morgenstern en situaciones inciertas, entonces actuarán como si eligieran la opción que optimiza el valor esperado de su utilidad Von Neumann-Morgenstern.
AVERSIÓN AL RIESGO
Los economistas han descubierto que los individuos tienden a evitar situaciones riesgosas, aun si
la situación equivale a una apuesta razonable. Por ejemplo, pocos individuos considerarían apostar 10 000 dólares por el resultado de lanzar una moneda al aire, aun cuando el beneficio promedio fuera de 0. Lo anterior es debido a que los premios en dinero de la apuesta no reflejan completamente la utilidad provista por los premios. La utilidad que los individuos obtienen de un
incremento en el precio del dinero puede incrementar con menos rapidez que el valor en dólares
de dichos premios. Una apuesta razonable en términos monetarios puede ser irrazonable en términos de utilidad y, por tanto, será rechazada.
En términos más técnicos, dinero adicional puede brindar a los individuos una utilidad marginal decreciente. Un ejemplo sencillo puede ayudar a explicar por qué. Un aumento en el ingreso,
digamos, de 40 000 a 50 000 dólares puede incrementar sustancialmente el bienestar de un individuo, garantizándole que no se quedará sin bienes esenciales como alimento y vivienda. Un incremento adicional de 50 000 a 60 000 dólares le permitiría un estilo de vida aún más confortable,
quizá al proveerlo de alimentos más sabrosos y una casa más grande, pero la mejora probablemente no sería tan grande como la inicial.
A partir de un patrimonio de 50 000 dólares el individuo sería resistente a apostar 10 000 dólares por el resultado de lanzar una moneda al aire. La posibilidad de 50 por ciento de las mayores
comodidades que podría tener con 60 000 dólares no compensa la posibilidad de 50 por ciento de
terminar con 40 000 y quizá tenga que privarse de algunas cosas esenciales.
Estos efectos sólo se magnifican con apuestas más arriesgadas, es decir con apuestas con resultados incluso de mayor variabilidad.8 El individuo con un patrimonio inicial de 50 000 dólares
probablemente sería aún más resistente a hacer una apuesta de 20 000 sobre el lanzamiento de una
moneda porque enfrentaría la perspectiva de terminar con sólo 30 000 dólares si el lanzamiento le
resultara desfavorable, reduciendo severamente los bienes esenciales para vivir. La igual posibilidad de terminar con 70 000 dólares no es compensación suficiente. Por otro lado, una apuesta de
sólo 1 dólar sobre el lanzamiento de una moneda es relativamente irrelevante. Aunque de todas
maneras uno podría rechazar la apuesta, no se empeñaría mucho en ello, pues su patrimonio
último apenas si variaría con el resultado del lanzamiento de la moneda.
Aversión al riesgo y apuestas razonables
Este argumento se ilustra en la figura 7.1. Aquí W0 representa el patrimonio corriente de un individuo y U(W) es un índice de utilidad de Von Neumann-Morgenstern (que en adelante llamare8
Con frecuencia los conceptos estadísticos de varianza y desviación estándar se usan para medir. Lo haremos así en varias partes
posteriores de este capítulo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
215
Si la función de utilidad patrimonial es cóncava (es decir, si exhibe una utilidad patrimonial marginal decreciente), un individuo rechazará apuestas razonables. Una posibilidad de 50-50 de ganar o perder h dólares,
por ejemplo, produce menos utilidad esperada [EU(A)] que rechazar la apuesta. La razón de esto es que
ganar h dólares significa menos para este individuo que perder h dólares.
FIGURA 7.1
Utilidad patrimonial de
dos apuestas razonables
de diferente variabilidad.
Utilidad
U(W)
U(W0)
EU(A) = U(CEA)
EU(B)
W0 – 2h
W0 + h
W0
W0 + h
W0 + 2h Patrimonio (W)
CEA
mos una función de utilidad) que refleja cómo se siente un individuo respecto a varios niveles de
patrimonio.9 En la figura, U(W) se traza como una función cóncava de W para reflejar el supuesto
de una utilidad marginal decreciente. Supongamos ahora que a este individuo se le ofrecen dos
apuestas razonables: la apuesta A, que es una posibilidad 50-50 de ganar o perder $h, y la apuesta
B, que es una posibilidad 50-50 de ganar o perder $2h. La utilidad del patrimonio corriente es
U(W0), el cual es también el valor esperado del patrimonio corriente porque este es seguro. La
utilidad esperada si el individuo participa en la apuesta A está dada por EU(A):
1
1
EUðAÞ ¼ UðW0 þ hÞ þ UðW0 hÞ,
2
2
(7.16)
y la utilidad esperada de la apuesta B está dada por EU(B):
1
1
EUðBÞ ¼ UðW0 þ 2hÞ þ UðW0 2hÞ.
2
2
(7.17)
La ecuación 7.16 indica que la utilidad esperada de la apuesta A está a medio camino entre la
utilidad del resultado desfavorable W0 h y la utilidad del resultado favorable W0 h. De igual
manera, la utilidad esperada de la apuesta B está a medio camino entre las utilidades de los resultados desfavorable y favorable, aunque los beneficios de estos resultados varían más que con la
apuesta A.
9
Técnicamente U(W) es una función de utilidad indirecta porque es el consumo permitido por el patrimonio que brinda utilidad
directa. En el capítulo 17 se retomará la relación entre funciones de utilidad, basadas en el consumo y su utilidad indirecta implicada de funciones de patrimonio.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
216
Parte 3: Incertidumbre y estrategia
De la figura se desprende claramente que, en términos geométricos,10
U(W0) EU(A) EU(B)
(7.18)
Por tanto, este individuo preferirá mantener su patrimonio corriente que hacer cualquiera de las
apuestas razonables. Forzada a elegir una apuesta, preferirá la menor (A) a la mayor (B). La razón
de esto es que ganar una apuesta razonable es menos disfrutable de lo que duele perder.
Aversión al riesgo y seguros
En la práctica un individuo podría estar dispuesto a pagar una cantidad para no participar en
ninguna apuesta. Nótese que cierto patrimonio de CEA brinda la misma utilidad esperada que
participar en la apuesta A. CEA se denomina equivalente de certidumbre de la apuesta A.
El individuo estaría dispuesto a pagar hasta W0 CEA para no participar en la apuesta. Esto
explica por qué los individuos compran seguros. Renuncia a un pequeña cantidad segura (la
prima del seguro) para evitar el resultado riesgoso contra el que se asegura. La prima que paga un
individuo por un seguro contra accidentes automovilísticos, por ejemplo, brinda una póliza en la
que se acuerda que en caso de ocurrir un accidente su auto será reparado. El extendido uso de los
seguros parecería implicar que la aversión al riesgo es frecuente.
De hecho, el individuo en la figura 7.1 pagaría aún más para no hacer la apuesta mayor, B.
Como ejercicio, intenta identificar el equivalente de certidumbre CEB de la apuesta B y la cantidad
que el individuo pagaría para evitar la apuesta B en la figura. El análisis en esta sección puede
sintetizarse en la definición siguiente.
DEFINICIÓN
Aversión al riesgo. De un individuo que siempre rechaza apuestas razonables se dice que tiene aversión
al riesgo. Si los individuos exhiben una utilidad marginal decreciente de su patrimonio, presentarán
aversión al riesgo. En consecuencia, estarán dispuestos a pagar algo para no hacer apuestas razonables.
EJEMPLO 7.2 Disposición a pagar seguros
Para ilustrar la relación entre la aversión al riesgo y los seguros, consideremos a un individuo con un
patrimonio corriente de 100 000 dólares que enfrenta la perspectiva de una posibilidad de 25 por ciento
de perder su automóvil, con valor de 20 000 dólares, por robo el próximo año. Supongamos también que
la función de utilidad Von Neumann-Morgenstern de este individuo es logarítmica; esto es, U(W)
ln (W).
Si este individuo afronta el año próximo sin seguro, su utilidad esperada será
EU(sin seguro) 0.75U(100 000) 0.25U(80 000)
0.75 ln 100 000 0.25 ln 80 000
11.45714
(7.19)
En esta situación, una prima de seguro razonable sería de 5 000 dólares (25 por ciento de $20 000,
suponiendo que la aseguradora sólo tiene costos de reclamación y que los costos administrativos son
de 0 dólares).
10
Técnicamente, este resultado es consecuencia directa de la desigualdad de Jensen en la estadística matemática. Esta desigualdad
establece que si x es una variable aleatoria y f(x) es una función estrictamente cóncava de esa variable, entonces E f(x) f E(x).
En el contexto de la utilidad esto significa que si esta es cóncava en una variable aleatoria que mide el patrimonio (es decir, si
U'(W) 0 y U''(W) 0), la utilidad esperada del patrimonio será menor que la asociada con el valor esperado de W. Con la
apuesta A, por ejemplo, EU(A) U(W0) porque, como apuesta razonable, A brinda un patrimonio esperado de W0.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
217
En consecuencia, si este individuo asegura por completo su automóvil, su patrimonio será de 95 000
dólares, independientemente de si se lo roban. En este caso, entonces,
EU (seguro razonable) U(95 000)
ln (95 000)
11.46163
(7.20)
Este individuo está en mejor situación adquiriendo un seguro razonable. En realidad, estaría dispuesto a
pagar por el seguro más que la prima razonable. La prima máxima del seguro (x) puede determinarse
estableciendo
EU (prima máxima del seguro) U(100 000 x)
ln(100 000 x)
11.45714
(7.21)
Despejar x en esta ecuación produce
100 000 x e11.45714
(7.22)
x 5 426.
(7.23)
o
Este individuo estaría dispuesto a pagar hasta 426 dólares en costos administrativos a una aseguradora
(además de la prima de 5 000 dólares para cubrir el valor esperado de la pérdida). Aun si se pagaran esos
costos este individuo estaría en mejores condiciones que si enfrentara el mundo no asegurado.
PREGUNTAS: Supóngase que la utilidad del patrimonio fuera lineal. ¿Este individuo estaría dispuesto a
pagar por el seguro algo más que la cantidad actuarialmente razonable? ¿Qué podría decirse del caso en
que la utilidad es una función convexa del patrimonio?
MEDICIÓN DE LA AVERSIÓN AL RIESGO
En el estudio de las decisiones económicas en situaciones de riesgo a veces es conveniente tener
una medida cuantitativa de qué tan reacio al riesgo es un individuo. La medida de uso más común
de aversión al riesgo fue inicialmente desarrollada por J. W. Pratt en la década de 1960.11 Esta
medida de aversión al riesgo, r(W), se define como
rðWÞ ¼ U 00 ðWÞ
:
U 0 ðWÞ
(7.24)
Dado que el rasgo distintivo de los individuos con aversión al riesgo es una utilidad marginal
decreciente de su patrimonio U''(W) 0, la medida de Pratt es positiva en esos casos. Esta
medida es invariante respecto a las transformaciones lineales de la función de utilidad y, por
tanto, no se ve afectada por la ordenación particular Von Neumann-Morgenstern que se use.
Aversión al riesgo y primas de seguros
Un rasgo útil de la medida de aversión al riesgo de Pratt es que es proporcional a la cantidad que
un individuo pagará por el seguro contra la realización de una apuesta razonable. Supongamos
que los beneficios de esa apuesta razonable se denotan con la variable aleatoria h (la cual adopta
11
J. W. Pratt, “Risk Aversion in the Small and in the Large”, Econometrica (enero-abril 1964), pp. 122-136.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
218
Parte 3: Incertidumbre y estrategia
valores tanto positivos como negativos). Dado que la apuesta es razonable, E(h) 0. Sea ahora
p la magnitud de la prima de seguros que volvería al individuo exactamente indiferente entre
hacer la apuesta razonable h y pagar p con certidumbre para evitar la apuesta:
E U(W h) U(W p),
(7.25)
donde W es el patrimonio corriente del individuo. Desarrollemos ahora ambas partes de la ecuación 7.25 usando la serie de Taylor.12 Puesto que p es una cantidad fija, bastará con una aproximación lineal de la expresión del lado derecho de la ecuación:
U(W p) U(W) pU(W) términos de orden superior
(7.26)
En cuanto a la expresión del lado izquierdo necesitamos una aproximación cuadrática que tome
en cuenta la variabilidad en la apuesta, h:
h2 00
0
E½UðW þ hÞ ¼ E UðWÞ þ hU ðWÞ þ U ðWÞ þ términos de orden superior (7.27)
2
¼ UðWÞ þ EðhÞU 0 ðWÞ þ
Eðh2 Þ 00
U ðWÞ þ términos de orden superior
2
(7.28)
Si se recuerda que E(h) 0, se eliminan los términos de orden superior y se usa la constante k en
representación de E(h2)/2, las ecuaciones 7.26 y 7.28 pueden igualarse como
U(W) pU(W) U(W) kU(W)
(7.29)
o
p
kU 00 ðWÞ
¼ krðWÞ:
U 0 ðWÞ
(7.30)
Es decir, la cantidad que un individuo renuente al riesgo está dispuesto a pagar para evitar una
apuesta razonable es aproximadamente proporcional a la medida de aversión al riesgo de Pratt.13
Puesto que las primas de seguros pagadas son observables en la realidad, a menudo se les usa para
estimar los coeficientes de aversión al riesgo o para comparar dichos coeficientes entre grupos de
individuos. Por tanto, es posible usar información del mercado para saber un poco sobre las actitudes ante situaciones riesgosas.
Aversión al riesgo y patrimonio
Una cuestión importante es si la aversión al riesgo incrementa o disminuye con la riqueza. Intuitivamente podría pensarse que la disposición a pagar para evitar una apuesta razonable dada
disminuye al incrementarse la riqueza, ya que la utilidad marginal decreciente volvería menos
serias las pérdidas potenciales para los individuos muy ricos. Sin embargo, esta respuesta intuitiva
no es necesariamente correcta porque la utilidad marginal decreciente también vuelve menos
atractivos los beneficios de ganar apuestas. Por tanto, el resultado neto es indeterminado; todo
depende de la forma precisa de la función de utilidad. En efecto, si la utilidad es cuadrática en el
patrimonio,
U(W) a bW cW2,
(7.31)
12
La serie de Taylor brinda una manera de aproximar cualquier función diferenciable alrededor de algún punto. Si f(x) tiene
derivadas de todos los órdenes, es posible demostrar que f (x h) f (x) hf '(x) (h2/2)f ''(x) términos de orden superior.
La fórmula de punto y pendiente en álgebra es un ejemplo simple de la serie de Taylor.
En este caso el factor de proporcionalidad también es proporcional a la varianza de h porque Var(h) E h E(h)2 E(h2).
Para una ilustración en la que esta ecuación se ajusta exactamente, véase el ejemplo 7.3.
13
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
219
donde b 0 y c 0, así que la medida de aversión al riesgo de Pratt es
rðWÞ ¼ U 00 ðWÞ
2c
,
¼
U 0 ðWÞ b þ 2cW
(7.32)
lo cual, contra lo que indica la intuición, se incrementa al aumentar el patrimonio.
Por otro lado, si la utilidad es logarítmica en el patrimonio,
U(W) ln(W),
(7.33)
entonces tenemos
rðWÞ ¼ U 00 ðWÞ
1
¼ ,
0
U ðWÞ W
(7.34)
que decrece al incrementarse el patrimonio.
La función exponencial de utilidad
U(W) eAW exp(AW)
(7.35)
(donde A es una constante positiva) exhibe aversión al riesgo constante absoluta en todos los
rangos patrimoniales, porque ahora
rðWÞ ¼ U 00 ðWÞ A2 eAW
¼
¼ A:
U 0 ðWÞ
AeAW
(7.36)
Este rasgo de la función exponencial de utilidad14 puede usarse para ofrecer algunas estimaciones numéricas de la disposición a pagar para evitar apuestas, como lo muestra el ejemplo siguiente.
EJEMPLO 7.3 Aversión al riesgo constante
Supongamos que un individuo cuyo patrimonio inicial es W0 y cuya función de utilidad muestra aversión al riesgo constante absoluta enfrenta una posibilidad de 50-50 de ganar o perder 1 000 dólares.
¿Cuánta (f ) pagaría para evitar el riesgo? Para determinar este valor la utilidad de W0 f se iguala con la
utilidad esperada de la apuesta:
exp½AðW 0 f Þ ¼ 0:5 exp½AðW 0 þ 1000Þ
0:5 exp½AðW 0 1 000Þ
(7.37)
Debido a que el factor exp(AW0) está contenido en todos los términos de la ecuación 7.37 ésta puede
dividirse, mostrando así que (para la función exponencial de utilidad) la disposición a pagar para evitar
una apuesta dada es independiente del patrimonio inicial. Los términos restantes
expðAf Þ ¼ 0:5 expð1 000AÞ þ 0:5 expð1 000AÞ
(7.38)
pueden usarse ahora para despejar f en busca de varios valores de A. Si A 0.0001, entonces f 49.9; un
individuo con este grado de aversión al riesgo pagaría aproximadamente 50 dólares para evitar una
apuesta razonable de 1 000. O bien, si A 0.0003, este individuo resistente al riesgo pagaría f 147.8 por
evitar la apuesta. Como la intuición sugiere que estos valores no son irrazonables, los valores del parámetro de aversión al riesgo A en estos rangos se usan a veces para investigaciones empíricas.
Riesgo normalmente distribuido. La función de utilidad de aversión al riesgo constante puede combinarse con el supuesto de que un individuo enfrenta un impacto aleatorio a su patrimonio, el cual sigue
14
Dado que la función exponencial de utilidad exhibe aversión al riesgo constante (absoluta), esto suele abreviarse con el término
utilidad ARCA.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
220
Parte 3: Incertidumbre y estrategia
una distribución normal (véase el capítulo 2) para llegar a un resultado particularmente simple. Específicamente, si el patrimonio en riesgo de un individuo sigue una distribución normal con media y varianza
2
2, la función de densidad de probabilidad del patrimonio está dada por f (W) (1/
2)ez /2, donde
z (W )/. Si este individuo tiene una función de utilidad de su patrimonio dada por U(W) eAW, la utilidad esperada de su patrimonio en riesgo es
1
ð
E½UðWÞ ¼
1
ð
2
1
UðWÞf ðWÞ dW ¼ pffiffiffiffiffi eAW e½ðWlÞ=r =2 dW:
2p
(7.39)
Quizá, sorpresivamente, esta integración no sea demasiado difícil de hacer, aunque requiere paciencia.
Realizar esta integración y tomar una variedad de transformaciones monótonas de la expresión resultante produce el resultado final de que
E½UðW Þ ffi l Ar2
:
2
(7.40)
De ahí que la utilidad esperada sea una función lineal de los dos parámetros de la función de densidad de
probabilidad del patrimonio, y que el parámetro de aversión al riesgo del individuo (A) determine la
magnitud del efecto negativo de variabilidad en la utilidad esperada. Por ejemplo, supongamos que un
individuo ha invertido sus fondos de tal manera que su patrimonio tiene un valor esperado de 100 000
dólares pero una desviación estándar () de $10 000. Por tanto, con la distribución normal, este individuo podría esperar que su patrimonio decreciera por debajo de los 83 500 dólares en alrededor de 5 por
ciento de los casos, y que se incrementara por encima de los 116 500 dólares en una fracción similar de
los casos. Con estos parámetros la utilidad esperada está dada por E[U(W)] 100 000 (A/2)(10 000)2.
Si A 0.0001 104, la utilidad esperada está dada por 100 000 0.5 ∙ 104 ∙ (104)2 95 000. De ahí
que este individuo reciba la misma utilidad de su patrimonio en riesgo que la que obtendría de un patrimonio seguro de 95 000 dólares. Un individuo con mayor aversión al riesgo podría tener A 0.0003, y
en este caso el equivalente de certidumbre de su patrimonio sería de 85 000 dólares.
PREGUNTA: Supongamos que un individuo tiene dos formas de invertir su patrimonio: asignación 1,
1 107 000 y 1 10 000; asignación 2, 2 102 000 y 2 2 000. ¿Cómo afectaría su actitud ante el
riesgo, su decisión entre estas asignaciones?15
Aversión al riesgo relativa
Parece improbable que la disposición a pagar para evitar una apuesta dada sea independiente del
patrimonio de un individuo. Un supuesto más atractivo podría ser que esa disposición a pagar es
inversamente proporcional al patrimonio y que la expresión
rrðWÞ ¼ WrðWÞ ¼ W
U 00 ðWÞ
U 0 ðWÞ
(7.41)
es aproximadamente constante. Siguiendo la terminología propuesta por J. W. Pratt,16 la función
rr(W) definida en la ecuación 7.41 es una medida de aversión al riesgo relativa. La función de
potencias de utilidad
UðW, RÞ ¼
W R =R
ln W
si R < 1, R 6¼ 0
si R ¼ 0
(7.42)
15
Este ejemplo numérico aproxima (más o menos) datos históricos de rendimientos reales de acciones y bonos, respectivamente,
aunque los cálculos son meramente ilustrativos.
16
Pratt, “Aversión al riesgo”.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
221
muestra una aversión al riesgo absoluta decreciente,
rðWÞ ¼ U 00 ðWÞ
ðR 1ÞW R2 1 R
,
¼
¼
0
U ðWÞ
W
W R1
(7.43)
pero aversión al riesgo constante relativa:17
rr(W) Wr(W) 1 R.
(7.44)
La evidencia empírica es generalmente congruente con valores de R en el rango de 3 a 1. De
ahí que los individuos parezcan algo más renuentes al riesgo de lo que implica la función logarítmica de utilidad, aunque en muchas aplicaciones esta función brinda una aproximación razonable. Cabe señalar que la función de utilidad de aversión al riesgo constante relativa en la ecuación
7.42 tiene la misma forma que la función de utilidad ESC general, descrita en el capítulo 3. Esto
brinda cierta intuición geométrica sobre la naturaleza de la aversión al riesgo que se explorará
más adelante.
EJEMPLO 7.4 Aversión relativa al riesgo constante
Un individuo cuyo comportamiento se caracteriza por una función de utilidad de aversión relativa al
riesgo constante se interesará en beneficio o pérdidas proporcionales de la riqueza. Por tanto, podemos
preguntarnos a qué fracción de su patrimonio inicial (f ) estaría dispuesto a renunciar para evitar una
apuesta razonable de, digamos, 10 por ciento de dicho patrimonio. Primero suponemos I 0, por tanto,
la función logarítmica de utilidad es apropiada. Igualar la utilidad del patrimonio restante seguro de este
individuo con la utilidad esperada de la apuesta de 10% produce
ln½ð1 f ÞW0 ¼ 0:5 ln ð1:1W0 Þ þ 0:5 ln ð0:9W0 Þ:
(7.45)
Puesto que cada término contiene W0, el patrimonio inicial puede eliminarse de esta expresión:
lnð1 f Þ ¼ 0:5½lnð1:1Þ þ lnð0:9Þ ¼ ln ð0:99Þ0:5 ;
de ahí que
ð1 f Þ ¼ ð0:99Þ0:5 ¼ 0:995
y
f 0.005.
(7.46)
Por tanto, este individuo sacrificará hasta 0.5% de su patrimonio para evitar la apuesta de 10%. Un cálculo similar puede usarse para el caso R 2, lo que produce
f 0.015.
(7.47)
De ahí que este individuo más renuente al riesgo esté dispuesto a renunciar a 1.5% de su patrimonio
inicial para evitar una apuesta de 10 por ciento.
PREGUNTA: Con la función de aversión relativa al riesgo constante ¿cómo depende la disposición de
este individuo a pagar para evitar una apuesta absoluta dada (de 1 000, por decir algo) de su patrimonio
inicial?
17
Algunos autores escriben la función de utilidad en la ecuación 7.42 como U(W) W1a/(1 a) e intentan medir a 1 I.
En este caso, a es la medida de aversión al riesgo relativa. La función de aversión al riesgo constante relativa suele abreviarse como
utilidad ARCR.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
222
Parte 3: Incertidumbre y estrategia
MÉTODOS PARA REDUCIR
LA INCERTIDUMBRE Y EL RIESGO
Hemos visto que los individuos con aversión al riesgo evitarán las posibles apuestas y otras situaciones arriesgadas. Pero a menudo es imposible evitar el riesgo por completo. Cruzar la calle
implica cierto riesgo de daños. Enterrar el patrimonio propio en el patio trasero no es una estrategia de inversión perfectamente segura, ya que aún existe cierto riesgo de robo (para no hablar
de la inflación). Nuestro análisis hasta ahora implica que los individuos estarían dispuestos a
pagar algo por reducir al menos esos riesgos si no los puede evitar por entero. En las cuatro secciones siguientes se estudiarán por separado cuatro métodos que pueden seguir los individuos
para mitigar el problema del riesgo y la incertidumbre: seguros, diversificación, flexibilidad e
información.
SEGUROS
Ya hemos analizado una de estas estrategias: comprar un seguro. Los individuos con aversión al
riesgo pagarían una prima para que la aseguradora cubra el riesgo de pérdida. Cada año los estadounidenses gastan más de medio billón de dólares en seguros de todo tipo. Más comúnmente,
compran cobertura para su vida, su hogar y sus automóviles y para sus costos de atención a la
salud. No obstante es posible comprar un seguro (quizá a un precio alto) para cubrir prácticamente cualquier riesgo imaginable; seguros que van desde aquellos contra sismos para una casa
que esté construida sobre una falla tectónica, hasta los de cobertura especial como, por ejemplo,
un seguro que cubra a un cirujano contra la posibilidad de lesionarse una o las dos manos.
Un individuo con aversión al riesgo querría comprar siempre seguros razonables para cubrir
cualquier riesgo que enfrente. Ninguna aseguradora podría subsistir si ofreciera seguros razonables (en el sentido de que la prima equivalga exactamente al pago esperado por las reclamaciones). Además de cubrir reclamaciones las aseguradoras también deben mantener registros,
cobrar primas, investigar fraudes y tal vez devolver beneficios a los accionistas. De ahí que el
cliente de seguros siempre pueda esperar pagar más que una prima actuarialmente razonable.
Si los individuos son muy resistentes al riesgo, comprarán incluso seguros irrazonables, como
se mostró en el ejemplo 7.2; cuanto más resistente al riesgo sea, mayor será la prima que esté
dispuesta a pagar.
Varios factores dificultan o imposibilitan proporcionar seguros. Desastres a gran escala, como
huracanes y guerras, pueden resultar en pérdidas tan grandes que las aseguradoras quebrarían
antes de poder pagar todas las reclamaciones. Sucesos raros e impredecibles (como guerras o
accidentes en plantas nucleares) ofrecen a las aseguradoras antecedentes confiables para establecer primas. Otras dos razones de la ausencia de cobertura de seguros tienen que ver con la desventaja informativa que una compañía puede tener en relación con el cliente. En algunos casos un
individuo puede saber sobre la probabilidad de sufrir una pérdida más que la aseguradora. Sólo
los “peores” clientes (quienes esperan pérdidas mayores o más probables) podrían terminar comprando una póliza de seguros. Este problema de selección adversa puede trastornar todo el mercado de los seguros a menos que la compañía encuentre la manera de controlar quién compra
(mediante algún tipo de filtramiento o coacción). Otro problema es que tener seguro puede volver
menos dispuestos a los clientes a dar los pasos necesarios para evitar pérdidas, conduciendo, por
ejemplo, de manera más temeraria al tener un seguro de automóvil o consumiendo alimentos
grasosos o fumando al poseer un seguro médico. Ese, así llamado, problema de riesgo moral también puede perjudicar al mercado de los seguros, si las aseguradoras no hallan la manera de
monitorear a bajo costo el comportamiento de sus clientes. Analizaremos en más detalle los problemas de selección adversa y riesgo moral en el capítulo 18, así como las formas en que las aseguradoras pueden combatirlos, las que además de las estrategias anteriores también incluyen
ofrecer sólo un seguro parcial y requerir el pago de deducibles y copagos.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
223
DIVERSIFICACIÓN
Un segundo modo en que los individuos con aversión al riesgo pueden reducir el riesgo es la
diversificación. Este es el principio económico detrás del adagio “No pongas todos los huevos en
una sola canasta”. Disipando convenientemente el riesgo es posible reducir la variabilidad de un
resultado sin aminorar el beneficio esperado.
El marco más conocido para la diversificación es la inversión. A los inversionistas se les aconseja rutinariamente “diversificar su cartera”. Para comprender lo atinado de este consejo, consideremos un ejemplo en el que un individuo tiene un patrimonio W para invertir. Este dinero puede
invertirse en dos activos riesgosos independientes, 1 y 2, con igual valor esperado (los rendimientos medios son 1 2) e igual varianza (las varianzas son 12 22). Un individuo cuya cartera
no diversificada, CND, incluye sólo uno de esos activos (poniendo así todos los “huevos” en esa
“canasta”) obtendría un rendimiento esperado de UP 1 2 y enfrentaría una varianza de
2
12 22.
CND
Supongamos, en cambio, que este individuo elige una cartera diversificada, CD. Sea 1 la fracción invertida en el primer activo y 2 1 1 en el segundo. Veremos que a este individuo puede
irle mejor que con la cartera no diversificada en el sentido de que obtiene una varianza menor sin
variar el rendimiento esperado. El rendimiento esperado de la cartera diversificada no depende de
la asignación entre activos y es el mismo que para cualquiera de estos activos en particular:
CD 11
(1 1)2
1 2.
(7.48)
Para analizar esto remitámonos a las reglas para el cálculo de valores esperados del capítulo 2. La
varianza dependerá de la asignación entre los dos activos:
2CD 2 2
11
(1 2 2
1) 2
(1 2
1
2 12)12.
(7.49)
También este cálculo puede entenderse repasando la sección sobre varianzas del capítulo 2. Ahí
podrás estudiar los dos “hechos” que se usan en este cálculo: primero, que la varianza de una
constante multiplicada por una variable aleatoria es esa constante al cuadrado por la varianza de
una variable aleatoria; segundo, que la varianza de variables aleatorias independientes, debido a
que su covarianza es de 0, es igual a la suma de las varianzas.
r2
1
Elegir 1 para minimizar la ecuación 7.49 produce 1 2 y r2CD ¼ 21 . Por tanto la cartera
óptima divide el patrimonio en partes iguales entre los dos activos, manteniendo el mismo rendimiento esperado que una cartera no diversificada pero reduciendo la varianza a la mitad. La
diversificación funciona aquí porque los rendimientos de los activos son independientes. Cuando
un rendimiento es bajo existe la posibilidad de que el otro sea alto, y viceversa. De este modo los
rendimientos extremos se equilibran en al menos parte del tiempo, reduciendo la varianza general. La diversificación operará de esta manera mientras no haya una correlación perfecta en los
rendimientos de los activos de tal manera que, en efecto, no sean el mismo activo. Cuanto menos
correlacionados estén los activos mejor funcionará la diversificación para reducir la varianza de la
cartera general.
Este ejemplo, elaborado para destacar los beneficios de la diversificación en la forma más simple
posible, tiene el elemento artificial de que los rendimientos de los activos se suponen iguales. La
diversificación fue en este caso una “comida gratis”, en el sentido de que la varianza de la cartera
podría reducirse sin reducir el rendimiento esperado en comparación con una cartera no diversificada. Si el rendimiento esperado de uno de los activos (el activo 1, por ejemplo) es más alto que
el otro la diversificación dejará de ser, en el otro activo, una “comida gratis” y resultaría en un
menor rendimiento esperado. Aun así, los beneficios de reducción del riesgo pueden ser tan grandes como para que un inversionista resistente al riesgo esté dispuesto a poner parte de su patrimonio en el activo con menor rendimiento esperado. Un ejemplo práctico de esta idea se relaciona
con el consejo que se le daría al empleado de una empresa con un plan de adquisición de acciones.
Aun si el plan permite que los empleados compren títulos de las acciones de capital de la compañía
con un generoso descuento en comparación con el mercado, tal vez fuera conveniente recomen-
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
224
Parte 3: Incertidumbre y estrategia
darles a los empleados no invertir todos sus ahorros en esas acciones, pues de lo contrario sus
ahorros completos —para no hablar de su sueldo e incluso del valor de su casa (en la medida en que
el valor de las residencias depende de la solidez de los negocios en la economía local)— estarían
atados a la suerte de una sola compañía, lo que generaría un enorme grado de riesgo.
En las extensiones de este capítulo se ofrece un análisis mucho más general del problema de elegir
la cartera óptima. Sin embargo, el principio de diversificación se aplica a una gama mucho más
amplia de situaciones que los mercados financieros. Por ejemplo, los estudiantes indecisos acerca de
sus intereses o respecto a cuáles de sus habilidades les serán útiles en el mercado del empleo harían
bien en inscribirse en muy diversos cursos más que en cursos exclusivamente técnicos o artísticos.
FLEXIBILIDAD
La diversificación es un método útil para reducir el riesgo de una persona que puede dividir una
decisión, asignando cantidades reducidas de una suma mayor entre varias opciones. En algunas
situaciones, sin embargo, una decisión no puede dividirse: es todo o nada. Por ejemplo, al comprar
un automóvil, el consumidor no puede combinar los atributos que le agradan de un modelo (digamos eficiencia de combustible) con los de otro (digamos caballos de fuerza o ventanillas eléctricas)
comprando la mitad de cada cual; los autos se venden como una unidad. En el caso de decisiones
de todo o nada, el tomador de decisiones puede obtener parte del beneficio de la diversificación
tomando decisiones flexibles. La flexibilidad permite al individuo ajustar la decisión inicial, dependiendo de cómo se desenvuelva el futuro. Cuanto más incierto es el futuro, más valiosa es la flexibilidad. Esta impide que el consumidor se ate un solo curso de acción y ofrece, en cambio, varias acciones. El consumidor puede elegir la opción que mejor se acomode a las circunstancias posteriores.
Un buen ejemplo del valor de la flexibilidad es considerar los combustibles con que operan los
automóviles. Hasta ahora la mayoría de los autos estaban limitados en lo que se refiere a cuánto
biocombustible (como el etanol de origen vegetal) podía combinarse con productos (como la gasolina o el diésel). El comprador de un vehículo de ese tipo tendría dificultades si el gobierno aprobara
reglamentos que incrementaran el índice de etanol en los combustibles para autos o si prohibieran
por entero los productos derivados del petróleo. Ya se han diseñado automóviles capaces de quemar
exclusivamente etanol, pero no son útiles en caso de que prevalezcan las condiciones actuales porque en la mayoría de las gasolineras no se vende combustible con altas concentraciones de etanol.
Un tercer tipo de vehículos tiene componentes internos que pueden funcionar con varios tipos de
combustible, tanto derivados del petróleo como etanol, y en cualquier proporción. Estos autos son
costosos de fabricar debido a los componentes especializados implicados, pero un consumidor
podría pagar de todas maneras el costo adicional pues el auto sería útil aun si los biocombustibles
no se volvieran más importantes durante su periodo de vida útil.18
Tipos de opciones
La posibilidad de que los automóviles de “combustible flexible” quemen cualquier combinación
de combustibles derivados del petróleo y biocombustibles es valiosa porque brinda a los dueños
más opciones en relación con un auto que sólo puede operar con un tipo de combustible. Es probable que ya conozcas la noción de que las opciones son valiosas gracias a otro contexto en el que
este término se usa con frecuencia —el de los mercados financieros—, donde se oye hablar de
opciones sobre acciones y otras formas de contratos de opciones. Existe una estrecha relación
entre la opción contenida en los autos de combustible flexible y estos contratos de opciones que
investigaremos con más detalle. Pero antes de analizar las semejanzas entre las opciones surgidas
de diferentes contextos, presentaremos algunos términos para distinguirlas.
18
Aunque la actual generación de automóviles de combustible flexible implica tecnología de punta, el primer coche de esa clase,
producido en 1908, fue el Modelo T de Henry Ford, uno de los autos más vendidos de todos los tiempos. La disponibilidad de
gasolina de bajo costo quizá haya inclinado el mercado hacia los autos de la competencia, de un solo tipo de combustible lo cual
significó la ruina del Modelo T. Para más información sobre la historia de este modelo, véase L. Brooke, Ford Model T: The Car
That Put the World on Wheels (Motorbooks, Mineápolis, 2008).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
DEFINICIÓN
DEFINICIÓN
225
Contrato de opciones financieras. Un contrato de opciones financieras ofrece el derecho, aunque no la
obligación, de comprar o vender un activo (como un título de acciones de capital) en un periodo futuro
a determinado precio.
Opción real. Una opción real es una opción surgida en un marco ajeno a los mercados financieros.
El automóvil de combustible flexible puede verse como un auto ordinario combinado con una
opción real adicional de quemar biocombustibles, si estos se vuelven más importantes en el futuro.
Los contratos de opciones financieras se presentan en varias formas, algunas de las cuales pueden ser complejas. También existen muchos tipos de opciones reales, surgidas en diversos ámbitos, lo que a veces dificulta determinar con exactitud qué tipo de opción está inserta en la situación. Aun así, todas las opciones comparten tres atributos fundamentales. Primero, especifican la
transacción subyacente, trátese de una acción por negociar, o de un automóvil o combustible por
adquirir. Segundo, especifican un periodo en el que la opción puede ejercerse. Una opción sobre
acciones puede especificar un periodo de 1 año, por ejemplo. La opción inserta en un auto de
combustible flexible preserva la opción del dueño durante la vida operativa del vehículo. Mientras
más largo es el periodo cubierto por la opción, más valiosa es ésta, porque mayor es también la
incertidumbre que puede resolverse durante ese periodo. Tercero, el contrato de opciones especifica un precio. Una opción sobre acciones podría venderse a un precio de 70 dólares. Si esta se
comercia más tarde en una bolsa de valores su precio podría variar de un momento a otro, según
el movimiento de los mercados. Las opciones reales no suelen tener precios explícitos, pero a
veces pueden calcularse precios implícitos. Por ejemplo, si un auto de combustible flexible cuesta
5 000 dólares más que un auto, por lo demás equivalente, que sólo quema un tipo de combustible,
estos 5 000 dólares podrían verse como el precio de la opción.
Modelo de opciones reales
Concedamos que x incorpora toda la incertidumbre en el entorno económico. En el caso del auto
de combustible flexible, x podría reflejar el precio de los combustibles fósiles en relación con los
biocombustibles o con el rigor de la regulación gubernamental de combustibles fósiles. En términos de la sección sobre estadística del capítulo 2, x es una variable aleatoria (también conocida
como “englobadora de cada elemento del espacio muestral”) que puede adoptar muchos valores
diferentes. Un individuo tiene cierto número, I 1, … , n, de opciones a su disposición. Sea Ai(x)
los beneficios provistos por la opción i, donde el argumento (x) permite a cada opción brindar un
patrón distinto de rendimientos dependiendo de cómo resulte el futuro.
La figura 7.2a ilustra el caso de dos opciones. La primera opción ofrece un beneficio decreciente al incrementarse x, indicado por la pendiente descendente de A1. Esto podría corresponder
a la propiedad de un auto que sólo opera con combustibles fósiles; al volverse más importantes los
biocombustibles que los combustibles fósiles, el valor de un vehículo que sólo quema combustibles fósiles decrece. La segunda opción brinda un beneficio creciente, correspondiente tal vez a la
propiedad de un auto que sólo opera con biocombustibles. La figura 7.2b traduce los beneficios en
utilidades (de Von Neumann-Morgenstern) que el individuo obtiene de los beneficios graficando
U(Ai) más que Ai. La inclinación introducida al pasar de beneficios a utilidades refleja la utilidad
marginal decreciente de beneficios más altos para un individuo con aversión al riesgo.
Si un individuo no tiene la flexibilidad provista por una opción real debe tomar la decisión
antes de observar cómo resulta el estado x. Este individuo debe elegir la mejor alternativa en promedio. Su utilidad esperada de esta decisión es
maxfE½UðA1 Þ, . . . , E½UðAn Þg:
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(7.50)
8/23
226
Parte 3: Incertidumbre y estrategia
FIGURA 7.2
Naturaleza de una opción
real.
El panel a) muestra los beneficios y el panel b) las utilidades provistas por dos alternativas a través de las
situaciones del mundo (x). Si la decisión debe ser tomada al principio, se elige la curva con la más alta utilidad esperada. Si la opción real de tomar cualquier decisión puede preservarse hasta después, se puede
obtener la utilidad esperada de la envolvente superior de las curvas, el cual aparece resaltado.
Beneficio
Utilidad
A2
U(A2)
U(A1)
A1
x′
x′
Estado x
a) Beneficios de alternativas
Estado x
b) Utilidades de alternativas
La figura 7.2 no proporciona información suficiente para juzgar cuál utilidad esperada es más alta
porque no conocemos las probabilidades de las diferentes x, pero si las x son más o menos igualmente probables, todo indica que el individuo elegiría la segunda alternativa, la cual brinda una
utilidad más alta en un rango mayor. La utilidad esperada del individuo procedente de esta decisión es E[U(A2)].
Si, por otro lado, la opción real puede preservarse para tomar una decisión que indique el
espacio muestral en que x ha ocurrido, el individuo estará en mejores condiciones. En la aplicación del automóvil la opción real podría corresponder a comprar un auto de combustible flexible,
lo cual no ata al comprador a un solo combustible, sino que permite optar por el combustible que
resulte más común o menos costoso en el periodo de vida útil del vehículo. En la figura 7.2, en vez
de elegir una sola alternativa, el individuo elegiría la primera opción si x x, y la segunda si x x'. La utilidad provista por esta estrategia está dada por la curva resaltada, la cual es la “envolvente
superior” de las curvas de las opciones particulares. Con un número general (n) de opciones, la
utilidad esperada de esta envolvente superior de opciones particulares es
Efmax½UðA1 Þ, . . . , UðA1 Þg:
(7.51)
La utilidad esperada en la ecuación 7.51 es más alta que en la 7.50. Esto podría no ser obvio a
primera vista, pues parecería que el simple intercambio del orden de las expectativas y los operadores “max” no debería hacer ninguna diferencia. Pero sí la hace. Mientras que la ecuación 7.50
es la utilidad esperada, asociada con la mejor curva de utilidad, la ecuación 7.51 es la utilidad
esperada asociada con la envolvente superior de todas las curvas de utilidad.19
19
Este resultado puede comprobarse formalmente usando la desigualdad de Jensen, presentada en la nota 10. En esta última se
analizaron las implicaciones de la desigualdad de Jensen para las funciones cóncavas: E[ f (x)] f [E(x)]. La desigualdad de Jensen
tiene la implicación inversa para las funciones convexas: E[ f (x)] f [E(x)]. En otras palabras, para funciones convexas, el resultado es mayor si el operador de expectativas se aplica fuera de la función que si el orden de ambas se invierte. En el contexto de las
opciones el operador “max” tiene las propiedades de una función convexa. Esto puede verse en la figura 7.2b donde tomar la
envolvente superior “convexifica” las curvas particulares dándoles más forma de V.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
FIGURA 7.3
Más opciones no pueden
dejar en peores
condiciones al tomador
de decisiones.
227
La adición de una tercera alternativa a las dos representadas en la figura 7.2 es valiosa en a) porque desplaza
hacia arriba la envolvente superior (resaltada) de las utilidades. La nueva alternativa es despreciable en b)
porque no desplaza la superior, pero el individuo no está en peores condiciones por tenerla.
Utilidad
Utilidad
U(A3)
U(A2)
U(A2)
U(A3)
U(A1)
U(A1)
Estado x
Estado x
a) Opción adicional valiosa
b) Opción adicional despreciable
Más opciones son mejores (por lo general)
Añadir opciones nunca puede hacer daño a un tomador de decisiones individual (mientras no se
le cobre por ellas), porque las opciones adicionales siempre pueden ser ignoradas. Esta es la esencia de las opciones: dan al tenedor el derecho —pero no la obligación— de elegirlas. La figura 7.3
ilustra este punto, mostrando el efecto de añadir una tercera opción a las dos representadas en la
figura 7.2. En el primer panel el individuo se beneficia estrictamente de la tercera opción porque
hay algunos espacios muestrales (los valores más altos de x en la figura) para los cuales es mejor
que cualquier otra alternativa, desplazando hacia arriba la envolvente superior de las utilidades (la
curva resaltada). La tercera opción es despreciable en el segundo panel. Aunque la tercera opción
no es la peor para muchos estados o situaciones del espacio muestral, nunca es la mejor, así que
tampoco mejora la envolvente superior de las utilidades en relación con la figura 7.2. Aun así la
adición de la tercera opción no es perjudicial.
Este discernimiento podría no sostenerse en un marco estratégico con múltiples tomadores de
decisiones. En un marco estratégico los actores económicos podrían beneficiarse de la eliminación de algunas de sus opciones. Esto quizá le permita a un actor comprometerse con un curso de
acción más estrecho que el que hubiera elegido de otra manera, y este compromiso podría afectar
las acciones de otras partes, posiblemente en beneficio de la parte que asumió el compromiso.
Una ilustración famosa de este punto es provista en uno de los tratados de estrategia militar más
antiguos, cuyo autor es Sun Tzu, general chino que escribió en el año 400 a.C. Parece insensato
que un ejército destruya todos los medios de repliegue, quemando puentes tras de sí y hundiendo
sus naves, entre otras medidas. Pero esto es lo que Sun Tzu recomendaba como táctica militar. Si
el segundo ejército observa que el primero no podrá retirarse y que combatirá a muerte, podría
retirarse él mismo antes de trabar combate con el primero. Analizaremos más formalmente cuestiones estratégicas como ésta en el capítulo siguiente que se refiere a la teoría del juego.
Cálculo del valor de las opciones
Podemos llevar más lejos el análisis para derivar una expresión matemática para el valor de una
opción real. Sea F la cuota por pagar por la posibilidad de elegir la mejor alternativa después de
realizada x en vez de antes. Un individuo estaría dispuesto a pagar esa cuota siempre y cuando
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
228
Parte 3: Incertidumbre y estrategia
Efmax ½UðA1 ðxÞ FÞ, . . . , ½UðAn ðxÞ FÞg maxfE½UðA1 ðxÞÞ, . . . , E½UðAn ðxÞÞg: (7.52)
La expresión de la derecha es la utilidad esperada de tomar la decisión de antemano, repetida
de la ecuación 7.50. La expresión de la izquierda permite que la decisión se tome después de
ocurrir x, un beneficio, pero se resta la cuota de la opción a cada beneficio. Naturalmente se
supone que la cuota se paga por adelantado, lo que reduce el patrimonio en F sea cual sea la
opción que se elija después. El valor de la opción real es la F más alta para la cual la ecuación
7.52 sigue satisfaciéndose, misma que, desde luego, es la F para la cual la condición se mantiene
con la igualdad.
EJEMPLO 7.5 Valor de un automóvil de combustible flexible
Determinemos el valor de la opción provista por un automóvil de combustible flexible en un ejemplo
numérico. Sea A1(x) 1 x el beneficio de un auto que sólo opera con combustibles fósiles y A2(x)
x el beneficio de un auto que opera únicamente con biocombustibles. El espacio muestral, x, refleja
la relativa importancia de los biocombustibles en comparación con los combustibles fósiles durante el
periodo de vida útil del automóvil. Supongamos que x es una variable aleatoria uniformemente distribuida entre 0 y 1 (la variable aleatoria continua más simple con la cual trabajar aquí). La sección sobre
estadística del capítulo 2 brinda ciertos detalles sobre la distribución uniforme, mostrando que la función de densidad de probabilidad (FDP) es f (x) 1 en el caso especial en que la variable aleatoria
uniforme va de 0 a 1.
Neutralidad al riesgo. Para facilitar lo más posible los cálculos en un principio, supongamos primero
que el comprador del auto es neutral al riesgo, obteniendo un nivel de utilidad igual al nivel de beneficio.
Supongamos que el comprador se ve obligado a elegir un auto para biocombustible. Esto ofrece una utilidad esperada de
x¼1
ð1
ð1
x2 1
E½A2 ¼ A2 ðxÞf ðxÞ dx ¼ x dx ¼ ¼ ,
(7.53)
2
2
0
0
x¼0
donde la integral se simplifica gracias a que f (x) 1. Cálculos similares muestran que la utilidad esperada de la compra de un automóvil para combustibles fósiles también es de 1/2. Así, si sólo se dispone de
autos para un solo tipo de combustible, el individuo será indiferente entre ellos, obteniendo una utilidad
esperada de 1/2 de cualquiera.
Supongamos ahora que es posible disponer de un auto de combustible flexible, lo cual permite obtener A1(x) o A2(x), la que sea más alta en las circunstancias más actuales. La utilidad esperada por el
comprador de este auto es
ð1
ð1
ð1
2
E½maxðA1 , A2 Þ ¼ maxð1 x, xÞ f ðxÞ dx ¼ ð1 xÞ dx þ x dx
0
0
¼2
ð1
1
2
x¼1 3
x dx ¼ x2 x¼1 ¼ .
2
4
1
2
(7.54)
La segunda línea de la ecuación 7.54 se desprende del hecho de que las dos integrales en la expresión
precedente son simétricas. Como la utilidad del comprador es exactamente igual a los beneficios,
podemos calcular directamente el valor de la opción del auto de combustible flexible, tomando la
diferencia entre los beneficios esperados en las ecuaciones 7.53 y 7.54, que es igual a 1/4. Este es el
recargo máximo que un individuo pagaría por el auto de combustible flexible, sobre un auto para un
solo tipo de combustible. Si se escalan los beneficios a niveles más realistas multiplicando por, digamos, 10 000 dólares, el recargo sobre el precio (y el valor de la opción) del auto de combustible flexible
sería de 2 500 dólares.
Este cálculo muestra el discernimiento general de que las opciones son una manera de enfrentar la
incertidumbre que posee valor, aun para individuos neutrales al riesgo. En la parte siguiente de este ejemplo se investigará si la aversión al riesgo vuelve más o menos valiosas las opciones.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
229
Aversión al riesgo. Supongamos ahora que el comprador es resistente al riesgo, con la función de utilidad
de Von Neumann-Morgenstern U(x) x. La utilidad esperada del comprador de un auto para biocombustible es
x¼1
ð 1 pffiffiffiffiffiffiffiffiffiffiffiffi
ð1
2 3 2
1
2
2
¼ ,
A2 ðxÞ f ðxÞ dx ¼ x dx ¼ x E½UðA2 Þ ¼
3
3
0
0
x¼0
(7.55)
la misma que la de un auto para combustibles fósiles, como demuestran cálculos similares. Por tanto, un
auto para un solo tipo de combustible brinda una utilidad esperada de 2/3.
La utilidad esperada de un auto de combustible flexible que cuesta F más que un auto para un solo
tipo de combustible es
Efmax½UðA1 ðxÞ FÞ, UðA2 ðxÞ FÞg ¼
ð1
pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi pffiffiffiffiffiffiffiffiffiffiffi
maxð 1 x F , x F Þf ðxÞ dx
0
ð 1 pffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffiffi
ð 1 pffiffiffiffiffiffiffiffiffiffiffi
ð 1 pffiffiffiffiffiffiffiffiffiffiffi
2
¼
1 x F dx þ
x F dx ¼ 2
x F dx
1
2
0
1
2
4 3 u¼1F
1
¼2
u2 du ¼ u2 1
3 u¼1F
2F
2
"
32 #
3
4
1
F
.
¼ ð1 FÞ2 3
2
ð 1F
(7.56)
FIGURA 7.4 Método gráfico para calcular el recargo para un auto de combustible flexible
Para determinar el recargo máximo F que el comprador resistente al riesgo estaría dispuesto a pagar por el
auto de combustible flexible se traza la utilidad esperada de un auto para un solo tipo de combustible de la
ecuación 7.55 y del auto de combustible flexible de la ecuación 7.56 y se ve el valor de F donde las curvas
se cruzan.
Utilidad
esperada
1.0
0.9
0.8
0.7
Un solo tipo de combustible
0.6
0.5
Combustible flexible
0.4
0.3
0.2
0.1
0.0
0.00
0.10
0.20
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
0.30
23.08.2019
0.40
0.50
F
8/23
230
Parte 3: Incertidumbre y estrategia
Los cálculos implicados en la ecuación 7.56 son algo complejos y requieren, por tanto, cierto análisis. La
segunda línea se apoya en la simetría de las dos integrales que aparecen ahí, lo que nos permite colapsarlas en dos veces el valor de una de ellas, y nosotros elegimos la más simple de las dos con estos propósitos.
La tercera línea usa el cambio de variables u x F para simplificar la integral. (Véase la ecuación 2.135
del capítulo 2 para otro ejemplo del truco de cambio de variables y análisis adicionales.)
Para hallar el recargo máximo que el comprador pagaría por un auto de combustible flexible podemos
igualar las ecuaciones 7.55 y 7.56 y despejar F. Lamentablemente, la ecuación resultante es demasiado
complicada para resolverla en forma analítica. Un método simple consiste en graficar la última línea de
la ecuación 7.56 para un rango de valores de F y mirar de arriba abajo para determinar dónde ofrece la
gráfica el valor requerido de 2/3 de la ecuación 7.55. Esto se hace en la figura 7.4, donde vemos que este
valor de F es ligeramente menor que 0.3 (0.294 para ser más precisos). Así, el comprador resistente al
riesgo está dispuesto a pagar un recargo de 0.294 por el auto de combustible flexible, lo cual es también
el valor de la opción de este tipo de automóvil. Al escalar, multiplicando por 10 000 dólares, en busca de
valores monetarios más realistas el recargo sobre el precio sería de 2 940 dólares. Esta cifra es superior en
440 dólares a lo que el comprador neutral al riesgo estuvo dispuesto a pagar. En consecuencia, el valor de
la opción es mayor en este caso para el comprador resistente al riesgo.
PREGUNTA: ¿La aversión al riesgo incrementa siempre el valor de las opciones? De ser así, explica por
qué. De no ser así, modifica el ejemplo con diferentes formas de las funciones de beneficios para ofrecer
un ejemplo en el que el comprador neutral al riesgo pagaría más.
Valor de demora de las opciones
La sociedad parece ver con malos ojos a quienes dejan las cosas para después. “No dejes para mañana
lo que puedas hacer hoy” es una conocida máxima. Pero la existencia de opciones reales sugiere un
posible valor del hecho de posponer. Quizá haya un valor en aplazar grandes decisiones —como la
adquisición de un carro— difíciles de revertir después. Aplazar estas grandes decisiones permite
al tomador de decisiones preservar el valor de las opciones y reunir más información sobre el futuro.
Para el observador externo, quien quizá no entienda todas las incertidumbres implicadas en la situación, podría parecer que el tomador de decisiones es demasiado inerte, por no optar la que parece
la decisión correcta en ese momento. De hecho, aplazar puede ser exactamente la decisión correcta
frente a la incertidumbre. Elegir un curso de acción descarta cursos posteriores. La demora preserva
las opciones. Si las circunstancias siguen siendo favorables, o se vuelven más favorables todavía, la
acción puede emprenderse después. Pero si el futuro cambia y la acción es inadecuada, el tomador
de decisiones puede haberse ahorrado muchas dificultades gracias a no haber decidido.
El valor de la demora puede verse volviendo a la aplicación del automóvil. Pongamos por caso
que en el mercado se dispone únicamente de automóviles para un solo tipo de combustible (sean
combustibles fósiles o biocombustible); los autos de combustible flexible no se han inventado aún.
Aun si las circunstancias empiezan a favorecer al auto para biocombustible, dado que el número de
gasolineras que ofrecen biocombustibles parece descollar, el comprador podría preferir aplazar la
compra de un vehículo hasta estar más seguro. Esto puede ser cierto incluso si el comprador renuncia por este motivo a un considerable superávit del consumidor procedente del uso de un auto
nuevo durante el periodo de la demora. El problema es que si los biocombustibles no terminan por
apoderarse del mercado, el comprador podría quedar en poder de un auto difícil de abastecer de
combustible y de reemplazar por uno que queme el otro tipo de combustible. El comprador, así,
estaría dispuesto a experimentar costos de demora de hasta F para preservar su flexibilidad.
El valor de la demora gira en torno a la irreversibilidad de la decisión subyacente. Si, en el
ejemplo del auto, el fabricante del comprador pudiera recuperar casi el precio de venta, vendiendo
el vehículo en el mercado de automóviles usados, no habría razón de demorar la compra. Pero es
bien sabido que el valor de un auto nuevo decrece precipitadamente una vez salido de la agencia
distribuidora (analizaremos las razones de esto, incluido el “efecto limones” en el capítulo 18); por
tanto, podría no ser tan fácil revertir la adquisición de un coche.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
231
Implicaciones para el análisis de costo-beneficio
Para un observador externo la demora podría parecer un síntoma de irracionalidad o ignorancia.
¿Por qué el tomador de decisiones deja pasar la oportunidad de emprender una acción beneficiosa? En este capítulo se han provisto ya varias razones de que un tomador de decisiones racional
pueda no querer emprender una acción pese a que los beneficios esperados de la acción excedan
los costos esperados. Primero, un individuo con aversión al riesgo podría evitar una apuesta aun
si ésta ofreciera un beneficio monetario esperado positivo (a causa de la utilidad marginal decreciente del dinero); y el valor de la opción brinda una razón adicional de que la acción no se lleve
a cabo: el tomador de decisiones podría esperar a tener mayor certidumbre sobre los posibles
resultados de la decisión.
Muchos de nosotros nos hemos topado con la regla de costo-beneficio la cual establece que una
acción debe emprenderse si los costos previstos son menores que los beneficios. Esta es una regla
generalmente sensata, ya que indica el curso de acción correcto en ámbitos simples sin incertidumbre. Pero debe tenerse cuidado al aplicar esta regla en condiciones que implican incertidumbre. La regla de decisión correcta es más complicada entonces porque se deben tomar en cuenta
las preferencias de riesgo (convirtiendo beneficios en utilidades) y el valor de demora de la opción,
de estar presente. No aplicar la regla simple de costo-beneficio en condiciones de incertidumbre
puede indicar sofisticación antes que irracionalidad.20
INFORMACIÓN
El cuarto método para reducir la incertidumbre implicada en una situación es adquirir mejor
información sobre el resultado probable. Ya se consideró una versión de esto en la sección anterior, donde se evaluó la estrategia de preservar opciones al tiempo que se aplaza una decisión
hasta recibir mejor información. La demora implicó algunos costos, que pueden concebirse como
una suerte de “precio de compra” de la información adquirida. Aquí seremos más directos en la
consideración de la información como un bien que puede adquirirse directamente y analizaremos
en gran detalle por qué y cuánto están dispuestos a pagar los individuos por ella.
La información como un bien
Para este momento ya debería estar claro para el lector que la información es un valioso recurso
económico. Ya vimos un ejemplo: un comprador puede tomar una mejor decisión sobre qué tipo
de automóvil adquirir si tiene mejor información sobre la clase de combustibles que estarán fácilmente disponibles durante el periodo de vida útil del auto. Pero los ejemplos no terminan ahí. Los
compradores que saben dónde adquirir bienes de alta calidad a bajo costo pueden estirar más su
presupuesto que aquellos que no tienen este conocimiento; los médicos, por ejemplo, pueden
brindar mejor atención si están al día en las investigaciones científicas más recientes.
El estudio de la economía de la información se ha vuelto una de las principales áreas de investigación en la actualidad. Esto implica varios retos. A diferencia de los bienes de consumo que
hemos estudiado hasta ahora, la información es difícil de cuantificar. Y aun si se pudiera cuantificar, tiene algunas propiedades técnicas que la vuelven un bien de un tipo inusual. La mayor parte
de la información es durable y mantiene su valor después de haber sido usada. A diferencia de un
hot dog, el cual se consume una sola vez, el conocimiento de una venta especial puede ser usado
no sólo por el individuo que la descubre, sino también por cualquier otro con quien se comparta
20
A los economistas les intriga la renuencia de los consumidores a instalar electrodomésticos eficientes pese a que es probable que
los ahorros en energía sufraguen en poco tiempo el precio de compra de esos aparatos. Una explicación procedente de la economía
del comportamiento es que los consumidores son demasiado ignorantes para realizar cálculos de costo-beneficio, o demasiado
impacientes para esperar a que se acumulen los ahorros de energía. K. Hassett y G. Metcalf, en “Energy Conservation Investment:
Do Consumers Discount the Future Correctly?” (Energy Policy, junio de 1993, pp. 710-716), sugieren que la inercia de los consumidores puede ser una demora racional ante la fluctuación de los precios de la energía. Véase el problema 7.9 para un ejemplo
numérico conexo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
232
Parte 3: Incertidumbre y estrategia
la información. Los amigos pueden beneficiarse entonces de la información aunque no hayan
tenido que gastar nada para obtenerla. En efecto, en un caso especial de esta situación, la información tiene la característica de un bien público puro (véase el capítulo 19). Es decir, la información
es no rival en cuanto que otros pueden usarla con cero costos, y no exclusiva en cuanto que ningún
individuo puede impedir a otros que la usen. El ejemplo clásico de estas propiedades es un descubrimiento científico. Cuando individuos prehistóricos inventaron la rueda, otros pudieron usarla
sin demérito del valor del descubrimiento, y todos los que veían la rueda podían copiarla libremente. La información es, asimismo, difícil de vender porque el acto de describir el bien ofrecido
a un posible consumidor supone entregárselo.
Estas propiedades técnicas de la información implican que los mecanismos del mercado podrían
operar a menudo imperfectamente en la asignación de recursos a la provisión y adquisición de
información. Después de todo, ¿para qué invertir en la producción de información cuando es posible adquirirla de otros sin costo alguno? Por tanto los modelos estándar de oferta y demanda
podrían ser de uso relativamente limitado para comprender tales actividades. Como mínimo,
deben desarrollarse modelos que reflejen atinadamente las propiedades supuestas respecto al
entorno informativo. En secciones posteriores de este libro se describirán algunas de las situaciones
que requieren esos modelos. Aquí, sin embargo, prestaremos relativamente poca atención a los
equilibrios oferta-demanda y nos centraremos en cambio en un ejemplo que ilustra el valor de la
información al ayudar a los individuos a tomar decisiones en condiciones de incertidumbre.
Cuantificación del valor de la información
Ya tenemos todas las herramientas necesarias para cuantificar el valor de la información a partir
de la sección sobre el valor de las opciones. Supongamos de nueva cuenta que el individuo está
inseguro respecto a cuál será el espacio muestral (x) en el futuro. Debe tomar una de n decisiones
hoy (lo que nos permite dejar de lado el valor de demora de las opciones y otras cuestiones que ya
estudiamos). Como antes, Ai(x) representa los beneficios provistos por la opción i. Ahora reinterpretemos F como la cuota cobrada por el dato acerca del valor preciso que x adoptará en el futuro
(quizá esto sea el sueldo del economista contratado para hacer tales pronósticos).
Los mismos cálculos de la sección sobre las opciones pueden usarse aquí para demostrar que el
máximo de F es, nuevamente, el valor con el cual la ecuación 7.52 se mantiene con la igualdad. Así
como este fue el valor de la opción real en aquella sección, aquí es el valor de la información. El
valor de la información sería menor que esta F si el pronóstico de las condiciones futuras fuera
imperfecto más que perfecto, como se supone aquí. Otros factores que afectan el valor de la información para un individuo incluyen el grado de incertidumbre antes de adquirir la información, el
número de opciones entre las cuales puede elegir y sus preferencias de riesgo. Cuanta más incertidumbre resuelva la nueva información, más valiosa será esta, desde luego. Si el individuo no tiene
mucho margen para responder a la información por tener sólo una gama limitada de decisiones
por tomar, la información no será valiosa. El grado de aversión al riesgo tiene efectos ambiguos en
el valor de la información (contestar la pregunta del ejemplo 7.5 te dará idea de por qué).
ENFOQUE DE ESTADOS DE PREFERENCIA
DE LA ELECCIÓN EN CONDICIONES DE
INCERTIDUMBRE
Aunque nuestro análisis en este capítulo ha ofrecido discernimientos sobre varios asuntos,
parece algo distinto del enfoque que hemos adoptado en otros capítulos. El modelo básico de la
optimización de la utilidad sujeta a una restricción presupuestal parece haberse perdido. Para
avanzar en el estudio del comportamiento en condiciones de incertidumbre, desarrollaremos
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
233
nuevas técnicas que nos permitirán reinsertar el análisis de esa conducta en el marco teórico
estándar de la elección.
Espacios muestrales y mercancías contingentes
Comenzaremos insistiendo en una idea que ya hemos mencionado: pensar en un futuro incierto
en términos de espacios muestrales. No podemos predecir exactamente qué sucederá mañana,
aunque suponemos que es posible clasificar todas las cosas que podrían suceder en un número
fijo de espacios claramente definidos. Por ejemplo, podría hacerse la burda aproximación de decir
que mañana la muestra estará en sólo una de dos situaciones posibles: en un “buen momento” o
en un “mal momento”. Podría hacerse una gradación mucho más fina del espacio muestral (que
implicara incluso millones de espacios posibles), pero casi todo lo esencial de la teoría puede
desarrollarse usando sólo dos estados.
Una idea conceptual que puede desarrollarse concurrentemente con la noción de espacio
muestral es la de bienes contigentes. Se trata de bienes que sólo se proporcionan si ocurre un espacio muestral particular. Como ejemplo, “1 dólar en un buen momento” es un bien contingente
que promete al individuo 1 dólar en un buen momento, pero nada si el día de mañana resultara
ser un mal momento. Incluso es factible, extendiendo un poco la capacidad intuitiva propia, concebir la posibilidad de adquirir el bien: yo podría comprarle a alguien la promesa de 1 dólar si
mañana resultara ser un buen momento. Pero como mañana podría ser un mal momento, este
bien probablemente se venda por menos de 1 dólar. Si alguien también estuviera dispuesto a venderme el bien contingente “1 dólar en un mal momento”, yo podría cerciorarme de tener 1 dólar
mañana, comprando los dos bienes contingentes “1 dólar en un buen momento” y “1 dólar en un
mal momento”.
Análisis de utilidad
El examen de decisiones de optimización de la utilidad entre bienes contingentes procede formalmente casi de la misma forma en que ya hemos analizado las decisiones. La principal diferencia
es que, a posteriori, un individuo sólo habrá obtenido un bien contingente (dependiendo de si el
momento resulta ser bueno o malo). Antes de resolver la incertidumbre, sin embargo, el individuo tiene dos bienes contingentes entre los cuales elegir y probablemente compre algo de cada
uno, porque no sabe qué estado ocurrirá. Denotaremos estos dos bienes contingentes con Wg
(patrimonio en un buen momento) y Wb (patrimonio en un mal momento). Suponiendo que la
utilidad es independiente del estado que se presente21 y que la persona cree que probablemente
ocurrirá un buen momento , la utilidad esperada asociada con estos dos bienes contingentes es
V(Wg, Wb) U(Wg) (1 )U(Wb).
(7.57)
Esta es la magnitud que el individuo quiere optimizar dado su patrimonio inicial, W.
Precios de mercancías contingentes
Suponiendo que un individuo puede adquirir 1 dólar de patrimonio en un buen momento para
pg y 1 dólar de patrimonio en un mal momento para Pb, su restricción presupuestal es entonces
W pgWg pbWb.
(7.58)
La razón de precio pg/pb muestra cómo este individuo puede cambiar dólares de patrimonio en un
buen momento por dólares en uno malo. Si, por ejemplo, pg 0.80 y pb 0.20, el sacrificio de 1
dólar de patrimonio en un buen momento le permitiría comprar derechos contingentes que pro21
Este supuesto es insostenible en circunstancias en las que la utilidad del patrimonio depende del espacio muestral. Por ejemplo,
la utilidad provista por un nivel dado de patrimonio puede diferir dependiendo de si un individuo está “enfermo” o “sano”. Sin
embargo, no nos ocuparemos de esas complicaciones aquí. En la mayor parte de nuestro análisis se supone que la utilidad es
cóncava en el patrimonio: U(W) 0, U(W) 0.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
234
Parte 3: Incertidumbre y estrategia
dujeran 4 dólares de patrimonio si el momento resultara ser malo. Que ese canje mejore la utilidad dependerá, desde luego, de los detalles de la situación. Pero estudiar problemas que implican
incertidumbre como situaciones en las que se intercambian varios derechos contingentes es el
discernimiento clave que ofrece el modelo de estado de preferencia.
Mercados justos de bienes contingentes
Si los mercados de derechos patrimoniales contingentes están firmemente desarrollados y existe
un acuerdo general sobre la probabilidad de un buen momento (), los precios de esos derechos
serán actuarialmente justos; es decir, iguales a la probabilidades subyacentes:
pg ¼ p,
pb ¼ 1 p:
(7.59)
De ahí que la razón de precio pg/pb refleje simplemente las posibilidades en favor de un buen
momento:
pg
p
:
¼
pb 1 p
(7.60)
En nuestro ejemplo anterior, si pg 0.8 y pb (1 ) 0.2, entonces /(1 ) 4.
En este caso, las posibilidades en favor de un buen momento se enunciarían como “4 a 1”. Los
mercados justos de derechos contingentes (como los mercados de los seguros) también reflejarán
esas posibilidades. Una analogía es provista por las “posibilidades” en las carreras de caballos.
Estas posibilidades son “razonables” cuando reflejan las verdaderas probabilidades de que diversos caballos ganen.
Aversión al riesgo
Ahora estamos en posición de mostrar cómo se manifiesta la aversión al riesgo en el modelo de
estado de preferencia. Específicamente, es posible demostrar que, si los mercados de derechos
contingentes son justos, un individuo optimizador de su utilidad optará por una situación en la
que Wg Wb; es decir, dispondrá las cosas de tal manera que el patrimonio finalmente obtenido
sea el mismo, sea cual sea el espacio que se presente.
Como en capítulos anteriores, la optimización de la utilidad sujeta a una restricción presupuestal requiere que este individuo iguale la TMS de Wg para Wb con la razón de los precios de
estos “bienes”:
TMS ¼
@V=@Wg
pU 0 ðWg Þ
pg
¼ :
¼
@V=@Wb ð1 pÞU 0 ðWb Þ pb
(7.61)
En vista del supuesto de que los mercados de derechos contingentes son justos (ecuación 7.60),
esta condición de primer orden se reduce a
o22
U 0 ðWg Þ
¼1
U 0 ðWb Þ
Wg Wb.
(7.62)
De ahí que un individuo, al enfrentar mercados justos de derechos contigentes sobre el patrimonio, sea resistente al riesgo y elija cerciorarse de que tendrá el mismo nivel de patrimonio independientemente del espacio que ocurra.
22
Este paso requiere que la utilidad sea independiente del espacio y que U(W) 0.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
FIGURA 7.5
Aversiones al riesgo en el
modelo de estado de
preferencia.
235
La línea I representa la restricción presupuestal del individuo para derechos patrimoniales contingentes:
W pgWg pbWb. Si el mercado de derechos contingentes es actuarialmente justo [pg/pb /(1 )],
la optimización de la utilidad ocurrirá en la línea de certidumbre donde Wg Wb W*. Si los precios no
son actuarialmente justos, la restricción presupuestal podría parecerse a I, y la optimización de la utilidad
ocurrirá en un punto donde Wg Wb.
Wb
Línea de
certidumbre
W*
I
I′
U1
W*
Wg
Análisis gráfico
La figura 7.5 ilustra la aversión al riesgo con una gráfica. Está demostrado que la restricción presupuestal de un individuo (I) es tangente a la curva de indiferencia U1 donde Wg Wb; un punto
en la “línea de certidumbre” en el que el patrimonio (W*) es independiente del espacio muestral
que se presente. En W* la pendiente de la curva de indiferencia [/(1 )] es exactamente igual
a la razón de precios pg/pb.
Si el mercado de derechos patrimoniales contingentes no fuera justo, la optimización de la utilidad podría no ocurrir en la línea de certidumbre. Supongamos, por ejemplo, que /(1 ) 4,
pero que pg/pb 2, porque asegurar el patrimonio en un mal momento resulta costoso. En este
caso la restricción presupuestal se asemejaría a la línea I en la figura 7.5, y la optimización de la
utilidad ocurriría bajo la línea de certidumbre.23 En este caso el individuo apostaría un poco
optando por Wg Wb porque los derechos sobre Wb son relativamente costosos. El ejemplo 7.6
muestra la utilidad de este enfoque para evaluar algunas de las alternativas que podrían estar disponibles.
EJEMPLO 7.6 Seguros en el modelo de estados de preferencia
El enfoque de estado de preferencia puede ilustrarse reformulando la ilustración del seguro de automóvil
del ejemplo 7.2 como un problema que implica los dos bienes contingentes, “patrimonio sin robo” (Wg)
y “patrimonio con robo” (Wb). Si, nuevamente, se supone utilidad logarítmica y que la probabilidad de
un robo (es decir, 1 ) es de 0.25, entonces
23
Dado que (como demuestra la ecuación 7.61) la TMS en la línea de certidumbre siempre es /(1 ), tangencias con una
pendiente más plana que esta deben ocurrir bajo esa línea.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
236
Parte 3: Incertidumbre y estrategia
utilidad esperada 0.75U(Wg) 0.25U(Wb)
0.75 ln Wg 0.25 ln Wb.
(7.63)
Si el individuo no emprende ninguna acción, la utilidad está determinada por la dotación patrimonial
inicial, W*g 100 000 y W*h 80 000, de modo que
utilidad esperada 0.75 ln 100 000 0.25 ln 80 000
11.45714
(7.64)
Para estudiar intercambios a partir de estas dotaciones iniciales la restricción presupuestal se escribe en
términos de los precios de los bienes contingentes, pg y pb:
pgWg* pbWb* pgWg pbWb.
(7.65)
Suponiendo que estos precios igualan las probabilidades de los dos estados (pg 0.75, pb 0.25), esta
restricción puede escribirse como
0.75(100 000) 0.25(80 000) 95 000 0.75Wg 0.25Wb;
(7.66)
es decir, el valor esperado del patrimonio es de 95 000 dólares, y un individuo puede asignar esta cantidad
entre Wg y Wb. Ahora, la optimización de la utilidad respecto a esta restricción presupuestal produce Wg
Wb 95 000. En consecuencia, el individuo se moverá hacia la línea de certidumbre y recibirá una
utilidad esperada de
utilidad esperada ln 95 000 11.46163,
(7.67)
una mejora evidente respecto a no haber hecho nada. Para obtener esta mejora se deben poder transferir
5 000 dólares de patrimonio en un buen momento (sin robo) a 15 000 de patrimonio adicional en un mal
momento (robo). Un contrato de seguros razonable permitiría esto porque costaría 5 000 dólares pero
devolvería 20 000 si ocurriera un robo (aunque nada si no ocurriera un robo). Nótese aquí que los cambios patrimoniales prometidos por el seguro —dWb/dWg 15 000/5 000 3— son exactamente
iguales a la negativa de la razón de posibilidades /(1 ) 0.75/0.25 3.
Póliza con cláusula de deducible. Otros contratos de seguros podrían mejorar la utilidad en esta situación, aunque no todos ellos llevarían a opciones en la línea de certidumbre. Por ejemplo, una póliza que
costara 5 200 dólares y devolviera 20 000 en caso de robo permitiría a un individuo llegar a la línea de
certidumbre con Wg Wb 94 800 y
utilidad esperada ln 94 800 11.45953,
(7.68)
lo que también excede la utilidad obtenible de la dotación inicial. Una póliza que cuesta 4 900 dólares y
requiere que el individuo incurra en los primeros 1 000 dólares de una pérdida por robo produciría
Wg 100 000 4 900 95 100,
Wb 80 000 4 900 19 000 94 100;
(7.69)
entonces,
utilidad esperada 0.75 ln 95 100 0.25 ln 94 100
11.46004.
(7.70)
Esta póliza mejora la utilidad aunque no permite arribar a la línea de certidumbre. El seguro no necesariamente debe ser completo para ofrecer la promesa de mayor utilidad.
PREGUNTA: ¿Cuál es la cantidad máxima que un individuo estaría dispuesto a pagar por una póliza de
seguros en la que tuviera que absorber los primeros 1 000 dólares de una pérdida?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
237
Aversión al riesgo y primas de riesgo
El modelo de estado de preferencia también es especialmente útil para analizar la relación entre la
aversión al riesgo y la disposición de los individuos a pagar por riesgos. Consideremos a dos individuos, cada uno de los cuales comienza con cierto patrimonio, W*. Cada individuo busca optimizar una función de utilidad esperada de la forma
VðWg , Wb Þ ¼ p
WgR
R
þ ð1 pÞ
WbR
:
R
(7.71)
Aquí la función de utilidad exhibe aversión al riesgo constante relativa (véase el ejemplo 7.4).
Nótese también que esta función se parece mucho a la función de utilidad ESC que se examinó en
el capítulo 3 y otras partes. El parámetro R determina tanto el grado de aversión al riesgo como el
grado de curvatura de las curvas de indiferencia implicadas por la función. Un individuo con
aversión al riesgo tendrá un gran valor negativo de R y marcadas curvas de indiferencia, como U1
en la figura 7.6. Un individuo con más tolerancia al riesgo tendrá un valor más alto de R y curvas
de indiferencia más planas (como U2).24
Supongamos ahora que estos individuos enfrentan la perspectiva de perder h dólares de patrimonio en un mal momento. Ese riesgo sería aceptable para el individuo 2 si el patrimonio en un
buen momento se incrementara de W* a W2. Para el individuo 1 resistente al riesgo, sin embargo,
el patrimonio tendría que incrementar a W1 para volver aceptable el riesgo. Por tanto, la diferencia
entre W1 y W2 indica el efecto de la aversión al riesgo respecto a la disposición a asumir riesgos.
La curva de indiferencia U1 representa las preferencias de un individuo con aversión al riesgo, mientras que
el individuo con preferencias representadas por U2 está dispuesto a asumir más riesgo. Frente al riesgo de
perder h en un mal momento, la persona 2 requerirá una compensación de W2 W* en un buen momento,
mientras que la persona 1 requerirá una mayor cantidad dada por W1 W*.
FIGURA 7.6
Aversión al riesgo y
primas de riesgo.
Wb
Línea de
certidumbre
W*
W* − h
U1
U2
W*
W2 W1
Wg
La tangencia de U1 y U2 en W* está asegurada porque la TMS a lo largo de la línea de certidumbre está dada por /(1 )
independientemente del valor de R.
24
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
238
Parte 3: Incertidumbre y estrategia
Algunos de los problemas de este capítulo hacen uso de este recurso gráfico para mostrar la relación entre preferencias (reflejadas por la función de utilidad en la ecuación 7.71) y el comportamiento en situaciones arriesgadas.
ASIMETRÍA DE INFORMACIÓN
Una implicación obvia del estudio de la adquisición de informativa es que el nivel de información que un individuo compra depende del precio por unidad de los mensajes. A diferencia del
precio de mercado de la mayoría de los bienes (que suele suponerse el mismo para todos ellos),
hay muchas razones para creer que los costos de la información pueden diferir significativamente entre los individuos. Algunos tendrán habilidades específicas relevantes para la adquisición de información (por ejemplo, podrían ser mecánicos calificados), mientras que otros pueden no poseer dichas habilidades. Habrá quienes tengan otros tipos de experiencias que
produzcan información valiosa, mientras que otros podrían carecer de esa experiencia. Por
ejemplo, el vendedor de un producto usualmente sabrá más sobre las limitaciones del mismo
que un comprador, porque el primero sabe exactamente cómo fue hecho el bien y dónde podrían
aparecer los problemas. De igual forma, compradores frecuentes a gran escala de un bien
podrían tener mayor acceso a información respecto a los compradores primerizos. Por último,
algunos individuos pueden haber invertido en algún tipo de servicio de información (por ejemplo, una liga de computación con una casa de bolsa o mediante una suscripción a Consumer
Reports) lo cual reduce el costo marginal de obtener información adicional en comparación con
alguien sin ese tipo de inversión.
Todos estos factores sugieren que el nivel de información difiere en ocasiones entre los participantes en transacciones en el mercado. Desde luego que en muchos casos los costos de información pueden ser bajos y tales diferencias, menores. La mayoría de los individuos puede evaluar muy bien la calidad de las verduras frescas con sólo mirarlas, por ejemplo. Pero cuando los
costos de información son altos y variables entre individuos, es de esperar que resulte ventajoso
adquirir diferentes cantidades de información. Pospondremos al capítulo 18 un estudio detallado de estas situaciones.
Resumen
El objetivo de este capítulo es proporcionar material básico para
el estudio del comportamiento individual en situaciones inciertas. Los conceptos clave cubiertos se enlistan en seguida.
• La forma más común de modelizar el comportamiento en condiciones de incertidumbre es suponer que los individuos tratan de optimizar la utilidad esperada de sus acciones.
• Los individuos que exhiben una utilidad marginal decreciente
de su patrimonio presentan aversión al riesgo. Es decir, por lo
general rechazan apuestas razonables.
• Los individuos con aversión al riesgo querrán asegurarse por
completo contra sucesos inciertos, si las primas de seguros
son actuarialmente razonables. Podrían estar dispuestos a
pagar primas más que actuarialmente razonables para no
correr riesgos.
• Dos funciones de utilidad se han usado ampliamente en el
estudio del comportamiento en condiciones de incertidum-
bre: la función de aversión al riesgo constante absoluta
(ARCA) y la función de aversión al riesgo constante relativa
(ARCR). Ninguna de éstas es completamente satisfactoria en
terrenos teóricos.
• Entre los métodos para reducir el riesgo implicado en una
situación se incluyen: transferir el riesgo a quienes pueden
soportarlo más eficazmente mediante seguros; dispersar el
riesgo entre varias actividades a través de la diversificación,
preservar las opciones para hacer frente a los diversos resultados que surjan y adquirir información para determinar qué
resultados son más probables.
• Uno de los temas más estudiados en la economía de la incertidumbre es el “problema de cartera”, que cuestiona en qué
forma dividirá un inversionista su patrimonio entre activos
disponibles. Una versión simple de este problema se usa para
ilustrar el valor de la diversificación en el texto; las extensiones
ofrecen un análisis detallado.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
• La información es valiosa porque permite a los individuos
tomar mejores decisiones en situaciones inciertas. La información puede ser óptimamente valiosa cuando los individuos
tienen cierta flexibilidad en su toma de decisiones.
239
• El enfoque de estado de preferencia permite abordar la toma
de decisiones en condiciones de incertidumbre en un conocido marco teórico de la elección.
Problemas
7.1
Se ve a Jorge hacer una apuesta de 100 000 dólares en favor de los Bulls en la final de la NBA. Si Jorge tiene una función logarítmica de
utilidad patrimonial y su patrimonio corriente es de 1 000 000 de dólares, ¿cuál considera que es la mínima probabilidad de que ganen
los Bulls?
7.2
Demuestra lo siguiente: si la función de utilidad patrimonial de un individuo es convexa preferirá apuestas razonables a la certeza del
ingreso, incluso podría estar dispuesto a aceptar apuestas un tanto irrazonables. ¿Crees que este tipo de comportamiento de asumir riesgos
es común? ¿Qué factores podrían tender a limitar su ocurrencia?
7.3
Un individuo adquiere una docena de huevos y debe llevarla a casa. Aunque hacer viajes a casa no tiene costo alguno, hay 50% de posibilidades de que todos los huevos transportados en un viaje se rompan durante el trayecto. El individuo considera dos estrategias: 1) llevar
los 12 huevos en un solo viaje o 2) hacer dos viajes con seis huevos cada uno.
a. Enlista los posibles resultados de cada estrategia y las probabilidades de esos resultados. Demuestra que, en promedio, seis huevos
permanecerán sin romperse después del viaje a casa en cualquier estrategia.
b. Desarrolla una gráfica para mostrar la utilidad obtenible en cada estrategia. ¿Cuál estrategia será preferible?
c. ¿La utilidad podría mejorar haciendo más de dos viajes? ¿Cómo se vería afectada esta posibilidad, si los viajes adicionales implicaran
un costo?
7.4
Supón que hay una posibilidad de 50-50 de que un individuo resistente al riesgo con patrimonio corriente de 20 000 dólares contraiga una
enfermedad debilitante y sufra una pérdida de $10 000.
a. Calcula el costo de un seguro actuarialmente razonable en esta situación y usa una gráfica de utilidad patrimonial (como la de la
figura 7.1) para mostrar que el individuo preferirá un seguro razonable contra esta pérdida a aceptar la apuesta sin haberse asegurado.
b. Supón que se dispone de dos tipos de pólizas de seguros:
1) una póliza razonable que cubra la pérdida total y
2) una póliza razonable que sólo cubra la mitad de cualquier pérdida incurrida.
Calcula el costo del segundo tipo de póliza y demuestra que, en general, el individuo la considerará inferior a la primera.
7.5
La señorita Fogg planea hacer un viaje alrededor del mundo en el que piensa gastar 10 000 dólares. La utilidad del viaje es una función de
cuánto gastará realmente (Y), dada por
U(Y) ln Y.
a. Si hay 25 por ciento de probabilidad de que la señorita Fuentes pierda 1 000 dólares de su dinero en efectivo durante el viaje, ¿cuál es la
utilidad esperada de éste?
b. Supón que la señorita Fuentes puede comprar un seguro contra la pérdida de esos 1 000 dólares (comprando, digamos, cheques de
viajero) a una prima “actuarialmente razonable” de 250 dólares. Demuestra que su utilidad esperada es más alta si adquiere este
seguro, que si enfrenta el riesgo de perder los 1 000 dólares sin seguro.
c. ¿Cuál es la cantidad máxima que la señorita Fuentes estaría dispuesta a pagar para asegurar sus 1 000 dólares?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
240
Parte 3: Incertidumbre y estrategia
7.6
Al decidir estacionarse en un sitio prohibido, un individuo sabe que la probabilidad de recibir una infracción es p y que la multa por esa
infracción es f. Supón que todos los individuos son resistentes al riesgo (es decir, U(W) 0 donde W es el patrimonio del individuo).
Un incremento proporcional en la probabilidad de ser sorprendido o un incremento proporcional en la multa ¿será un elemento
disuasorio más eficaz para impedir el estacionamiento? Pista: Usa la aproximación de la serie de Taylor U(W f) U(W) f U'(W)
(f 2/2)U(W).
7.7
Un agricultor cree que hay una posibilidad de 50-50 de que la siguiente temporada de cultivo sea especialmente lluviosa. Su función de
utilidad esperada tiene la forma
1
1
utilidad esperada 2 ln YNR 2 ln YR,
donde YNR y YR representan el ingreso del agricultor en situaciones de “lluvia normal” y “muy lluvioso”, respectivamente.
a. Supón que el agricultor debe elegir entre dos cultivos que prometen las siguientes perspectivas de ingresos:
Cultivo
YNR
YR
Trigo
$28 000
$10 000
Maíz
$19 000
$15 000
¿Cuál de estos cultivos sembrará?
b. Supón que el agricultor puede sembrar la mitad de su campo con cada cultivo. ¿Elegiría hacerlo? Explica tu resultado.
c. ¿Qué mezcla de trigo y maíz le ofrecería al agricultor el óptimo de utilidad esperada?
d. ¿Asegurar el trigo —algo que está a disposición de los agricultores que sólo siembran trigo y que cuesta 4 000 dólares y rinde 8 000 en
caso de una temporada agrícola lluviosa— lo haría cambiar su siembra?
7.8
En la ecuación 7.30 se mostró que la cantidad que un individuo está dispuesto a pagar para evitar una apuesta razonable (h) está dada por
p 0.5E(h2)r(W), donde r(W) es la medida de aversión al riesgo absoluta en el nivel patrimonial inicial de este individuo. En este problema
se analizará la magnitud de dicho pago como una función de la magnitud del riesgo enfrentado y del nivel patrimonial de este individuo.
a. Considera una apuesta razonable (v) de ganar o perder $1. Para esta apuesta, ¿cuál es E(v2)?
b. Considera ahora variar la apuesta del inciso a), multiplicando cada premio por una constante positiva k. Considera que h kv. ¿Cuál
es el valor de E(h2)?
c. Supón que este individuo tiene una función logarítmica de utilidad U(W) ln W. ¿Cuál es la expresión general para r(W)?
d. Calcula la prima de riesgo (p) para k 0.5, 1 y 2 y para W 10 y 100. ¿Qué concluyes de comparar los seis valores?
7.9
Vuelve al ejemplo 7.5, en el que se calculó el valor de la opción real provista por un automóvil de combustible flexible. Sigue suponiendo
que el beneficio de un auto que quema combustibles fósiles es A1(x) 1 x. Supón ahora que el beneficio del auto para biocombustible
es más alto, A2(x) 2x. Nuevamente, x es una variable aleatoria uniformemente distribuida entre 0 y 1, lo que recoge la disponibilidad
relativa de biocombustibles versus combustibles fósiles en el mercado durante el periodo de vida futura del automóvil.
a. Supón que el comprador es neutral al riesgo con una función de utilidad de Von Neumann-Morgenstern U(x) x. Calcula el valor de la
opción de un auto de combustible flexible que permite al comprador reproducir el beneficio de cualquier auto para un solo tipo de combustible.
b. Repite el cálculo del valor de la opción para un comprador resistente al riesgo con función de utilidad U(x) x.
c. Compara tus respuestas con las del ejemplo 7.5. Explica cómo el incremento en el valor del auto para biocombustible afecta el valor de
la opción provista por el auto de combustible flexible.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
241
Problemas analíticos
7.10 Utilidad ARAA
Las funciones de utilidad ARCA y ARCR pertenecen a una clase más general de funciones de utilidad llamadas funciones de aversión al
riesgo armónica absoluta (ARAA). La forma general de esta función es U(W) ( W/)1, donde los diversos parámetros obedecen
las restricciones siguientes:
• 1,
• W/ 0,
• (1 )/ 0.
Las razones de las dos primeras restricciones son obvias; la tercera se requiere para que U 0.
a. Calcula r(W) para esta función. Demuestra que la inversa de esta expresión es lineal en W. Este es el origen del adjetivo armónica en el
nombre de la función.
b. Demuestra que cuando 0 y (1 )/ 1, esta función se reduce a la función ARCR dada en el capítulo 7 (véase la nota 17).
c. Usa tu resultado del inciso a) para demostrar que si S , entonces r(W) es una constante en esta función.
d. Considera que la constante hallada en el inciso c) está representada por (A). Demuestra que la forma incluida de la función de utilidad
en este caso es la función ARCA dada en la ecuación 7.35.
e. Por último, demuestra que una función de utilidad cuadrática puede generarse a partir de la función ARAA simplemente estableciendo 1.
f. Pese a su aparente generalidad, la función ARAA exhibe varias limitaciones para el estudio del comportamiento en situaciones inciertas. Describe algunas de estas deficiencias.
7.11 Teoría de prospectos
Dos pioneros en el campo de la economía del comportamiento, Daniel Kahneman y Amos Tversky (ganadores del Premio Nobel en economía, en 2002), realizaron un experimento en el que presentaron a diferentes grupos de sujetos con uno de estos dos escenarios:
• Escenario 1: Además de pagar $1 000 por adelantado, el individuo debe elegir entre dos apuestas. La apuesta A ofrece una posibilidad
pareja de ganar $1 000 o nada. La apuesta B ofrece $500 con seguridad.
• Escenario 2: Además de pagar $2 000 por adelantado, el sujeto debe elegir entre dos apuestas. La apuesta C ofrece una posibilidad pareja
de perder $1 000 o nada. La apuesta D resulta en la pérdida de $500 con seguridad.
a. Supón que Norma Ecuánime toma decisiones en condiciones de incertidumbre, de acuerdo con la teoría de la utilidad esperada. Si
Ecuánime es neutral al riesgo, ¿qué decisión tomaría en cada escenario?
b. ¿Qué decisión tomaría Stan si es resistente al riesgo?
c. Kahneman y Tversky determinaron que 16% de los individuos eligió A en el primer escenario y 68% eligió C en el segundo. Con base
en tus respuestas precedentes, explica por qué estos hallazgos son difíciles de conciliar con la teoría de la utilidad esperada.
d. Kahneman y Tversky propusieron una alternativa a la teoría de la utilidad esperada, llamada teoría de prospectos, para explicar los
resultados experimentales. Esta teoría dice que el nivel actual de ingreso de los individuos funciona como un “punto de partida” para
ellas. Son resistentes al riesgo frente a beneficios más allá de ese punto, pero sensibles a pérdidas reducidas por debajo de ese punto.
Esta sensibilidad a pérdidas reducidas es lo contrario de la aversión al riesgo: un individuo resistente al riesgo sufre desproporcionadamente más por una pérdida grande que por una reducida.
1) Pedro Prospecto toma decisiones en condiciones de incertidumbre, de acuerdo con la teoría de prospectos. ¿Qué decisiones tomaría en el experimento de Kahneman y Tversky? Explica tu respuesta.
2) Traza un diagrama esquemático de una curva de utilidad de dinero para Pedro Prospecto en el primer escenario. Traza una curva
de utilidad para él en el segundo escenario. ¿La misma curva puede bastar para ambos escenarios, o debe desplazarse? ¿En qué
difieren las curvas de utilidad de Pedro de las que se usaron para describir a individuos como Standard Stan?
7.12 Más sobre la función ARCR
Respecto a la función de utilidad ARCR (ecuación 7.42) se demostró que el grado de aversión al riesgo se mide con 1 I. En el capítulo 3
se demostró que la elasticidad de sustitución de la misma función está dada por 1/(1 I). De ahí que las medidas sean recíprocas entre sí.
Usando este resultado, analiza las preguntas siguientes.
a. ¿Por qué la aversión al riesgo se relaciona con la disposición de un individuo a sustituir patrimonio entre los espacios muestrales? ¿Qué
fenómeno recogen ambos conceptos?
b. ¿Cómo interpretarías los casos polares I 1 y I en los marcos tanto de aversión al riesgo como de sustitución?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
242
Parte 3: Incertidumbre y estrategia
c. Un aumento en el precio de derechos contingentes en un “mal” momento (pb) inducirá efectos de sustitución e ingreso en las demandas
de Wg y Wb. Si el individuo tiene un presupuesto fijo para dedicarlo a estos dos bienes, ¿de qué manera afectan a los bienes estas decisiones? ¿Por qué el aumento o la disminución en Wg podría depender del grado de aversión al riesgo exhibido por el individuo?
d. Supón que los datos empíricos sugieren que un individuo requiere un rendimiento promedio de 0.5% para verse tentado a emplear una
inversión que tiene una posibilidad de 50-50 de ganar o perder 5%. Es decir, este individuo recibiría la misma utilidad de W0 que de
una apuesta pareja sobre 1.055 W0 y 0.955 W0.
1) ¿Qué valor de I es congruente con este comportamiento?
2) ¿Cuánto rendimiento promedio requerirá este individuo para aceptar una posibilidad de 50-50 de ganar o perder 10 por ciento?
Nota: Este inciso requiere resolver ecuaciones no lineales, así que bastará con soluciones aproximadas. La comparación de la disyuntiva
de recompensas de riesgo ilustra lo que se conoce como enigma de la prima de equidad, en el sentido de que las inversiones arriesgadas
en realidad parecen ganar mucho más que lo congruente con el grado de aversión al riesgo sugerido por otros datos. Véase N. R.
Kocherlakota, “The Equity Premium: It’s Still a Puzzle”, Journal of Economic Literature (marzo de 1996), pp. 42-71.
7.13 Gráfica de inversiones arriesgadas
La inversión en activos arriesgados puede examinarse en el marco de la preferencia de estado, suponiendo que W* dólares invertidos en un
activo con cierto rendimiento r producirán W*(1 + r) en ambos estados del mundo, mientras que una inversión en un activo arriesgado
producirá W*(1 + rg) en un buen momento y W*(1 + rb) en uno malo (donde rg r rb).
a. Grafica los resultados de las dos inversiones.
b. Muestra cómo podría ilustrarse en tu gráfica una “cartera mixta” con activos tanto libres de riesgo como riesgosos. ¿Cómo mostrarías
la fracción patrimonial invertida en el activo riesgoso?
c. Muestra cómo las actitudes de los individuos ante el riesgo determinarán la mezcla de activos libres de riesgo y riesgosos que llevarán
a cabo. ¿En qué caso un individuo no tendría activos riesgosos?
d. Si la utilidad de un individuo adopta la forma de aversión al riesgo constante relativa (ecuación 7.42), explica por qué ese individuo no
cambiará la fracción de activos riesgosos en su poder al incrementar su patrimonio.25
7.14 El problema de cartera con un activo riesgoso normalmente distribuido
En el ejemplo 7.3 se demostró que un individuo con una función de utilidad ARCA, que enfrenta un riesgo normalmente distribuido,
tendrá una utilidad esperada de la forma EU(W) W (A/2)2W, donde W es el valor patrimonial esperado y 2W, su varianza. Usa
este hecho para despejar la asignación óptima de cartera para un individuo con una función de utilidad ARCA que debe invertir k de su
patrimonio en un activo riesgoso normalmente distribuido cuyo rendimiento esperado es r y cuya varianza en rendimiento es r2 (tu
respuesta debería depender de A). Explica tus resultados intuitivamente.
Sugerencias de lecturas adicionales
Arrow, K. J. “The Role of Securities in the Optimal Allocation of
Risk Bearing”, Review of Economic Studies, núm. 31 (1963), pp.
91-96.
Presenta el concepto de preferencia de estado e interpreta los valores
bursátiles como derechos sobre mercancías contingentes.
_____. “Uncertainty and the Welfare Economics of Medical Care”,
Review of Economic Studies, núm. 53 (1963), pp. 941-973.
Excelente análisis de las implicaciones de bienestar de los seguros.
Contiene un apéndice matemático claro y conciso. Debería leerse junto
con el artículo de Pauly sobre riesgo moral (véase el capítulo 18).
Bernoulli, D. “Exposition of a New Theory on the Measurement of
Risk”, Econometrica, núm. 22 (1954), pp. 23-36.
Reimpresión del análisis clásico de la paradoja de San Petersburgo.
Dixit, A. K. y R. S. Pindyck. Investment under Uncertainty, Princeton University Press, Princeton, 1994.
Se centra principalmente en la decisión de inversión de empresas, pero
contiene una buena cobertura de concepto de opciones.
Friedman, M. y L. J. Savage. “The Utility Analysis of Choice”, Journal of Political Economy, núm. 56 (1948), pp. 279-304.
Analiza por qué los individuos podrían tanto apostar como comprar
seguros. Muy legible.
Gollier, Christian. The Economics of Risk and Time, MIT Press,
Cambridge, MA, 2001.
Contiene un completo tratamiento de muchos de los temas analizados
en este capítulo. Especialmente bueno sobre la relación entre asignación
en condiciones de incertidumbre y asignación a lo largo del tiempo.
25
Este problema se basa en J. E. Stiglitz, “The Effects of Income, Wealth, and Capital Gains Taxation in Risk Taking”, Quarterly Journal of Economics (mayo de 1969),
pp. 263-283.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
Mas-Colell, Andreu, Michael D. Whinston y Jerry R. Green.
Microeconomic Theory, Oxford University Press, Nueva York,
1995, capítulo 6.
Brinda un buen resumen de los fundamentos de la teoría de la utilidad
esperada. Examina asimismo en detalle el supuesto de “independencia
de estado” y muestra que algunas nociones de aversión al riesgo se aplican a casos de dependencia de estado.
Pratt, J. W. “Risk Aversion in the Small and in the Large”, Econométrica, núm. 32 (1964), pp. 122-136.
Desarrollo teórico de medidas de aversión al riesgo. Tratamiento muy
técnico pero legible.
243
Rothschild, M. y J. E. Stiglitz. “Increasing Risk: 1. A Definition”,
Journal of Economic Theory, núm. 2 (1970), pp. 225-243.
Desarrolla una definición de economía de lo que significa que una
apuesta sea “más arriesgada” que otra. Una secuela en el Journal of
Economic Theory ofrece ilustraciones de la economía.
Silberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001.
El capítulo 13 proporciona una buena introducción a la relación
entre conceptos estadísticos y maximización de la utilidad esperada.
Muestra asimismo en detalle la integración mencionada en el ejemplo 7.3.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
244
Parte 3: Incertidumbre y estrategia
EXTENSIONES
El problema de la cartera
Uno de los problemas clásicos en la teoría del comportamiento
en condiciones de incertidumbre es la cuestión de cuánto de su
patrimonio deber asignar un inversionista con aversión al riesgo
a un activo riesgoso. Intuitivamente, todo indica que la fracción
invertida en activos riesgosos debería ser menor en el caso de
inversionistas con aversión al riesgo, y una meta de nuestro análisis en estas extensiones es demostrar esto formalmente. Luego
se verá cómo generalizar ese modelo para considerar carteras con
muchos de esos activos para abordar finalmente el modelo de
valuación de activos de capital, básico en los cursos de economía
financiera.
E7.1 Modelo básico con un activo riesgoso
Para comenzar, supón que un inversionista tiene cierto monto
patrimonial, W0, para invertir en uno de dos activos. El primero
de ellos produce cierto rendimiento de rf, mientras que el rendimiento del segundo es una variable aleatoria, r. Si se concede que
el monto invertido en el activo riesgoso se denota con k, el patrimonio de este individuo al final de un periodo será
W ¼ ðW0 kÞð1 þ rf Þ þ kð1 þ rÞ ¼ W0 ð1 þ rf Þ þ kðr rf Þ: (i)
Adviértanse tres cosas en este patrimonio al final de periodo. Primero, W es una variable aleatoria porque su valor depende de r.
Segundo, k puede ser positiva o negativa aquí, dependiendo de si
un individuo compra el activo riesgoso o si lo vende rápido. Como
veremos, sin embargo, en el caso usual E(r rf) 0, y esto implica
que k 0. Por último, nótese que la ecuación i permite una solución en la que k W0. En este caso, el inversionista apalancaría su
inversión en el activo riesgoso, pidiendo un préstamo a la tasa libre
de riesgo rf.
Si se considera que U(W) representa la función de utilidad del
inversionista, el teorema de Von Neumann-Morgenstern establece que elegirá k para maximizar E[U(W)]. La condición de primer orden para ese máximo es
@E½UðWÞ @E½UðW 0 ð1 þ rf Þ þ kðr rf ÞÞ
¼
@k
@k
¼ E½U 0 ðr r f Þ ¼ 0:
(ii)
Al calcular la condición de primer orden, podemos diferenciar a
través del operador de valor esperado, E. Véase el capítulo 2 para
un análisis de la diferenciación de integrales (de la cual un operador de valor esperado es un ejemplo). La ecuación ii implica el
valor esperado del producto de la utilidad marginal y el término
r rf. Estos dos términos son aleatorios. Que r rf sea positivo o
negativo depende de lo bien que los activos riesgosos se desempeñen en el periodo siguiente. Pero el rendimiento de este activo
riesgoso también afectará el patrimonio del inversionista al final
de periodo, afectando por tanto su utilidad marginal. Si la inversión se desarrolla bien, W será grande y la utilidad marginal relativamente baja (debido a la utilidad marginal decreciente). Si la
inversión se desarrolla mal el patrimonio será relativamente bajo
y la utilidad marginal relativamente alta. De ahí que en el cálculo
del valor esperado en la ecuación ii, los resultados negativos de
r rf pesen más que los positivos para tomar en cuenta las consecuencias de utilidad de estos resultados. Si el valor esperado en la
ecuación ii fuera positivo, un individuo podría incrementar su
utilidad esperada invirtiendo más en el activo riesgoso. Si el valor
esperado fuera negativo, este individuo podría incrementar su utilidad esperada reduciendo el monto del activo riesgoso en su
poder. Sólo cuando la condición de primer orden se cumpla este
individuo tendrá una cartera óptima.
Otras dos conclusiones pueden extraerse de la ecuación ii. Primero, mientras E(r rf) 0, un inversionista elegirá montos positivos del activo riesgoso. Para ver por qué, adviértase que satisfacer
la ecuación ii requerirá que muy grandes valores de U se atribuyan
a situaciones en las que r rf resulte negativo. Esto sólo puede
ocurrir si el inversionista posee montos positivos del activo riesgoso, de tal modo que su patrimonio al final del periodo sea bajo
en muchas situaciones.
Una segunda conclusión de la ecuación ii es que los inversionistas con más aversión al riesgo tendrán montos menores del
activo riesgoso. Nuevamente, la razón de esto tiene que ver con la
forma de la función U. Para los inversionistas con aversión al
riesgo la utilidad marginal aumenta rápidamente al reducirse el
patrimonio. De ahí que necesiten relativamente poca exposición a
posibles resultados negativos de tener el activo riesgoso para satisfacer la ecuación ii.
E7.2 Utilidad ARCA
Avanzar en el problema de la cartera requiere elaborar supuestos
específicos sobre la función de utilidad del inversionista. Supón que
ésta se halla dada por la forma ARCA: U(W) exp(AW).
Entonces, la función de utilidad marginal está dada por U(W) A
exp(AW); sustituyendo para el patrimonio al final del periodo,
tenemos
U 0 ðWÞ ¼ A exp½AðW0 ð1 þ rf Þ þ kðr rf ÞÞ
¼ A exp½AW0 ð1 þ rf Þexp½Akðr rf Þ:
(iii)
Es decir, la función de utilidad marginal puede separarse en una
parte aleatoria y en una parte no aleatoria (tanto el patrimonio
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
inicial como la tasa libre de riesgo son no aleatorias). De ahí que
la condición óptima de la ecuación ii pueda escribirse como
E½U 0 ðr r f Þ ¼ A exp½AW 0 ð1 þ r f Þ
E½expðAkðr r f ÞÞ ðr r f Þ ¼ 0:
(iv)
Ahora es posible dividir entre la función exponencial del patrimonio inicial, lo que deja una condición óptima que sólo involucra
los términos en k, A y r rf. Despejar el nivel óptimo de k en esta
condición puede ser difícil en general (véase, sin embargo, el problema 7.14). No obstante, más allá de la solución específica, la
ecuación iv muestra que este monto óptimo de inversión será una
constante independientemente del nivel patrimonial inicial. De
ahí que la función ARCA implique que la fracción del patrimonio
que un inversionista mantiene en activos riesgosos debería decrecer al incrementarse el patrimonio, conclusión que parece precisamente opuesta a los datos empíricos, los cuales tienden a mostrar
que la fracción del patrimonio mantenida en activos riesgosos se
incrementa junto con el patrimonio.
Si supusiéramos, en cambio, que la utilidad adopta la forma
ARCR en vez de la forma ARCA, podríamos demostrar (con un
poco de paciencia) que todos los individuos con la misma tolerancia al riesgo tendrán la misma fracción patrimonial en activos
riesgosos, más allá de sus niveles absolutos de patrimonio. Aunque esta conclusión es ligeramente más consistente con los
hechos que la conclusión resultante de la función ARCA, sigue
siendo insuficiente para explicar por qué la fracción de patrimonio mantenida en activos riesgosos tiende a incrementarse junto
con el patrimonio.
E7.3 Carteras de muchos activos riesgosos
Discernimientos adicionales pueden obtenerse si el modelo se
generaliza para tomar en cuenta muchos activos riesgosos. Sea el
rendimiento de cada uno de los n activos riesgosos la variable
aleatoria ri (i 1,…, n). Los valores esperados y varianzas de los
rendimientos de estos activos están denotados por E(ri) i y
Var(ri) 2i, respectivamente. Un inversionista que invierte una
porción de su patrimonio en una cartera con estos activos obtendrá un rendimiento aleatorio (rp) dado por
rp ¼
n
X
(v)
ai ri ,
i¼1
donde ai ( 0) es la fracción de la cartera riesgosa mantenida en
el activo i y donde ni1 i 1. En esta situación el rendimiento
esperado de esta cartera será
n
X
Eðr p Þ ¼ lp ¼
ai li :
(vi)
i¼1
Si los rendimientos de cada activo son independientes, la varianza
del rendimiento de la cartera será
Var(r p Þ ¼ r2p ¼
n
X
a2i r2i :
(vii)
i¼1
Si los rendimientos no son independientes la ecuación vii tendrá
que modificarse para tomar en cuenta las covarianzas entre rendimientos. Usando esta notación general procederemos ahora a examinar algunos aspectos de este problema de asignación de cartera.
245
E7.4 Carteras óptimas
Con muchos activos riesgosos el problema de la cartera óptima
puede dividirse en dos pasos. El primero es considerar carteras
con únicamente los activos riesgosos. El segundo, añadir el menos
riesgoso.
Para resolver la cartera óptima con únicamente activos riesgosos
puede procederse como en el texto en el cual en la sección sobre
diversificación se examinaron ponderaciones de la inversión óptima
entre sólo dos activos riesgosos. Aquí se elegirá un conjunto general
de ponderaciones de activos (las i) para minimizar la varianza (o
desviación estándar) de la cartera para cada posible rendimiento
esperado. La solución de este problema produce una “frontera de
eficiencia” de carteras de activos riesgosos como la representada por
la línea EE en la figura E7.1. Las carteras ubicadas bajo esta frontera
son inferiores a aquellas sobre la frontera porque ofrecen menores
rendimientos esperados en relación con cualquier grado de riesgo.
Los rendimientos de cartera por encima de la frontera son inalcanzables. Sharpe (1970) analiza las matemáticas asociadas con la elaboración de la frontera EE.
Añádase ahora un activo sin riesgo con rendimiento esperado
f y f 0, indicado como punto R en la figura E7.1. Las carteras
óptimas constarán ahora de combinaciones de este activo con los
riesgosos. Todas estas carteras se ubicarán a lo largo de la línea
RP en la figura porque esta señala el rendimiento máximo alcanzable para cada valor de para varias asignaciones de cartera.
Estas asignaciones sólo contendrán un conjunto específico de
activos riesgosos: el representado por el punto M. En equilibrio,
esta será la “cartera del mercado” integrada por activos de capital, mantenidos en proporción con sus valuaciones de mercado.
Esta cartera del mercado ofrecerá un rendimiento esperado de
M y una desviación estándar de ese rendimiento de M. La ecuación para la línea RP que representa a cualquier cartera mixta
está dada por la ecuación lineal
lM lf
lp ¼ lf þ
rp :
(viii)
rM
Esto indica que la línea del mercado RP permite a los inversionistas individuales “adquirir” rendimientos que exceden el rendimiento sin riesgo (M f), asumiendo proporcionalmente más
riesgo (P/M). Para opciones en RP a la izquierda del punto de
mercado M, P/M 1 y f P M. Puntos de alto riesgo a la
derecha de M —los cuales pueden obtenerse pidiendo préstamos
para producir una cartera apalancada— tendrán P/M 1 y prometerán un rendimiento esperado superior al provisto por la cartera del mercado (P M). Tobin (1958) fue uno de los primeros
economistas en reconocer el papel que esos activos sin riesgo desempeñan en la identificación de la cartera del mercado y en el establecimiento de los términos en los cuales los inversionistas pueden
obtener rendimientos superiores a los niveles sin riesgo.
E7.5 Decisiones individuales
La figura E7.2 ilustra las decisiones de cartera de varios inversionistas frente a las opciones ofrecidas por la línea RP. Esta figura
ilustra el tipo de modelo de decisiones de cartera ya descrito en
este capítulo. Los individuos con baja tolerancia al riesgo (I) optarán por carteras muy inclinadas al activo sin riesgo. Los inversionistas dispuestos a asumir un grado modesto de riesgo (II) optarán
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
246
Parte 3: Incertidumbre y estrategia
FIGURA E7.1
Carteras eficientes.
La frontera EE representa combinaciones óptimas de activos riesgosos que minimizan la desviación estándar de la cartera, P, para cada rendimiento esperado, P. Un activo sin riesgo con rendimiento f ofrece a
los inversionistas la oportunidad de mantener carteras mixtas a lo largo de RP que combinen este activo sin
riesgo con la cartera del mercado, M.
P
P
E
M
M
f
R
E
M
FIGURA E7.2
Comportamiento del
inversionista y aversión
al riesgo.
P
Dadas las opciones del mercado RP, los inversionistas pueden elegir cuánto riesgo desean asumir. Inversionistas con aversión al riesgo (UI) mantendrán principalmente activos sin riesgo, mientras que los corredores
de riesgos (UIII) optarán por carteras apalancadas.
P
UIII
P
UII
UI
f
M
R
P
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 7: Incertidumbre
por carteras cercanas a la cartera del mercado. Los inversionistas
de alto riesgo (III) podrían optar por carteras apalancadas. Nótese
que todos los inversionistas enfrentan el mismo “precio” de riesgo
(M f), mientras que sus rendimientos esperados están determinados por cuánto riesgo relativo (P/M) están dispuestos a
correr. Nótese también que el riesgo asociado con la cartera de un
inversionista sólo depende de la fracción de la cartera invertida en
la cartera del mercado ( ) porque 2P 22M (1 )2 · 0. De
ahí que P/M , así que la decisión de cartera del inversionista
es equivalente a su decisión de riesgo.
Fondos de inversión mobiliaria
La noción de eficiencia de cartera se ha aplicado ampliamente al
estudio de los fondos de inversión mobiliaria. En general, estos
fondos son una buena respuesta a las necesidades de diversificación de los pequeños inversionistas. Dado que tales fondos reúnen
los fondos de muchos individuos, pueden alcanzar economías de
escala en transacciones y costos de manejo de cuenta. Esto les permite a los dueños de los fondos compartir la suerte de una variedad
mucho más amplia de valores bursátiles de la que sería posible si
cada uno actuara por separado. Sin embargo, los administradores
de fondos de inversión mobiliaria tienen sus propios incentivos;
así, las carteras en su poder quizá no siempre sean representaciones perfectas de las actitudes ante el riesgo de sus clientes. Por
ejemplo, Scharfstein y Stein (1990) desarrollaron un modelo que
muestra por qué los administradores de fondos de inversión mobiliaria tienen incentivos para “seguir a la manada” en sus selecciones
de inversión. Otros estudios, como la investigación clásica de Jensen (1968), establecen que los administradores de los fondos de
inversión mobiliaria rara vez pueden alcanzar rendimientos extra
lo bastante grandes para neutralizar los gastos que cobran a los
inversionistas. En años recientes esto ha llevado a muchos compradores de fondos de inversión mobiliaria a favorecer fondos “de
índice” que buscan simplemente duplicar su promedio del mercado (representado, digamos, por el índice accionario Standard &
Poor’s 500). Tales fondos tienen gastos bajos y, por tanto, permiten
a los inversionistas alcanzar diversificación a un costo mínimo.
E7.6 Modelo de valuación de activos de capital
Aunque el análisis de E7.5 muestra cómo se determinará el precio
de una cartera que combina un activo sin riesgo con la cartera del
mercado no describe la disyuntiva de riesgo-rendimiento de un
activo. Puesto que (suponiendo transacciones sin costo) un inversionista siempre puede evitar el riesgo no asociado con el mercado
general, optando por diversificarse con una “cartera del mercado”,
ese riesgo “asistemático” no garantizará un rendimiento excedente. Sin embargo, un activo obtendrá un rendimiento excedente
en la medida en que contribuya al riesgo general del mercado. Un
activo que no produce esos rendimientos extra no se mantendría
en la cartera del mercado, así que no se le tendría en absoluto. Este
es el discernimiento fundamental del modelo de valuación de
activos de capital (MVAC).
Para examinar formalmente estos resultados considera una
cartera que combina un monto reducido ( ) de un activo con rendimiento aleatorio de x con la cartera del mercado (la cual tiene
un rendimiento aleatorio de M. El rendimiento de esta cartera (z)
estaría dado por
z ¼ ax þ ð1 aÞM:
247
(ix)
El rendimiento esperado es
lz ¼ alx þ ð1 aÞlM
(x)
r2z ¼ a2 r2x þ ð1 aÞ2 r2M þ 2að1 aÞrx,M ,
(xi)
con varianza
donde x,M es la covarianza entre el rendimiento de x y el rendimiento del mercado.
Pero nuestro análisis previo indica que
rz
:
lz ¼ lf þ ðlM lf Þ (xii)
rM
Igualar las ecuaciones x a xii y diferenciar respecto a
lM lf @rz
@lz
¼ lx lM ¼
:
@a
rM @a
arroja
(xiii)
Al calcular z/ de la ecuación xi y tomar el límite conforme
se aproxima a cero, se obtiene
lM lf rx,M r2M
(xiv)
lx lM ¼
,
rM
rM
o, reordenando los términos,
lx ¼ lf þ ðlM lf Þ rx;M
:
r2M
(xv)
Nuevamente, el riesgo tiene una recompensa de M f, pero
ahora la cantidad de riesgo es medida por x,M/2M. Esta razón de
la covarianza entre el rendimiento x y el mercado con la varianza
del rendimiento del mercado se conoce como coeficiente beta del
activo. En muchas publicaciones se reportan los coeficientes beta
estimados para activos financieros.
Estudios del MVAC
Esta versión del MVAC tiene importantes implicaciones para las
determinantes de la tasa esperada de rendimiento de cualquier
activo. Debido a esta simplicidad el modelo ha sido sometido a
gran número de pruebas empíricas. En general, estas establecen
que la medida de riesgo sistémico (beta) del modelo se correlaciona en efecto con los rendimientos esperados, mientras que
medidas de riesgo más simples (como la desviación estándar de
rendimientos pasados) no. Quizá la prueba empírica temprana
más influyente que llegó a esa conclusión sea la de Fama y
MacBeth (1973). Pero el MVAC mismo sólo explica una reducida fracción de las diferencias en los rendimientos de varios
activos. Y contrariamente al MVAC, varios autores han descubierto que muchos otros factores económicos afectan significativamente los rendimientos esperados. De hecho, un notorio desafío al MVAC procede de uno de sus fundadores originales (véase
Fama y French, 1992).
Referencias
Fama, E. F. y K. R. French. “The Cross Section of Expected Stock
Returns”, Journal of Finance, núm. 47 (1992), pp. 427-466.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
248
Parte 3: Incertidumbre y estrategia
Fama, E. F. y J. MacBeth. “Risk Return and Equilibrium”, Journal
of Political Economy, núm. 8 (1973), pp. 607-636.
Jensen, M. “The Performance of Mutual Funds in the Period
1945-1964”, Journal of Finance (mayo de 1968), pp. 386-416.
Scharfstein, D. S. y J. Stein. “Herd Behavior and Investment”, American Economic Review (junio de 1990), pp. 465-489.
Sharpe, W. F. Portfolio Theory and Capital Markets, McGraw-Hill,
Nueva York, 1970.
Tobin, J. “Liquidity Preference as Behavior towards Risk”, Review
of Economic Studies (febrero de 1958), pp. 65-86.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
OCHO
Teoría de juegos
En este capítulo se ofrece una introducción a la teoría de juegos no cooperativa, herramienta
usada para entender las interacciones estratégicas entre dos o más agentes. La gama de aplicaciones de la teoría de juegos se ha incrementado constantemente, incluidas todas las áreas de la
economía (de la economía del trabajo a la macroeconomía) y otros campos, como los de la ciencia
política y biológica. La teoría de juegos es particularmente útil para comprender la interacción
entre empresas en un oligopolio, así que los conceptos que se estudien aquí se usarán ampliamente en el capítulo 15. Comenzaremos con el concepto central del equilibrio de Nash y estudiade Nash, que se usan en juegos con estructuras de tiempo e información más complicadas.
CONCEPTOS BÁSICOS
Hasta aquí, en la parte 3 de este texto, se han estudiado las decisiones individuales tomadas en aislamiento. En este capítulo se estudiará la toma de decisiones en un marco estratégico más complicado.
En un marco estratégico un individuo ya no puede tener una decisión obvia que es la mejor para él.
Lo mejor para un tomador de decisiones puede depender de lo que hace el otro y viceversa.
Por ejemplo, considera la interacción estratégica entre automovilistas y la policía. El que los
trampas de velocidad. Que la policía considere valiosas esas trampas depende de en cuánto exceavance en el análisis del comportamiento estratégico. De hecho, las herramientas de la teoría de
juegos nos permitirán llevar el análisis casi tan lejos como, por ejemplo, nuestro análisis de la
optimización de la utilidad del consumidor en el capítulo 4.
Hay dos grandes tareas implicadas en el uso de la teoría de juegos para analizar una situación
económica. La primera es descubrir la situación en un juego simple. Dado que el análisis implicado
en marcos estratégicos pronto se complica, más que en problemas de decisión simples, es imporcierto arte en descubrir juegos de situaciones que es difícil de enseñar. Los ejemplos en el texto y
problemas de este capítulo pueden servir como modelos que ayuden a abordar situaciones nuevas.
La segunda tarea es “resolver” el juego dado, lo cual resulta en una predicción respecto a lo que
ocurrirá. Para resolver un juego se toma un concepto de equilibrio (como el equilibrio de Nash)
y se hacen los cálculos requeridos para aplicarlo al juego dado. Gran parte de este capítulo se
dedicará a enseñar los conceptos de equilibrio de uso más común y a practicar los cálculos necesarios para aplicarlos a juegos particulares.
Un juego es un modelo abstracto de una situación estratégica. Aun los juegos más elementales
251
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
252
Parte 3: Incertidumbre y estrategia
y la información que tienen los jugadores al moverse (quién sabe qué y cuándo) para describir el
juego en su totalidad.
Jugadores
En un juego se le denomina jugador a cada tomador de decisiones. Los jugadores pueden ser
individuos (como en los juegos de póquer), empresas (como en los mercados con pocas firmas) o
naciones enteras (como en los conflictos militares). Un jugador se caracteriza por poseer la capacidad de elegir entre una serie de acciones posibles. Usualmente, el número de jugadores es fijo
durante la “ejecución” del juego. Los juegos se caracterizan a veces por el número de jugadores
implicados (juegos de dos jugadores, de tres jugadores, de n jugadores). A la manera de buena
parte de la bibliografía económica, este capítulo tenderá a concentrarse en juegos de dos jugadores, porque este es el marco estratégico más simple.
Denominaremos a los jugadores con números; así, en un juego de dos jugadores tendremos a
los jugadores 1 y 2. En un juego de n jugadores tendremos a los jugadores 1, 2,…, n, mientras que
al jugador genérico se le designará como i.
Estrategias
Cada curso de acción del que dispone un jugador durante el juego se llama estrategia. Dependiendo
del juego bajo examen, una estrategia puede ser una acción simple (exceder o no el límite de velocidad) o un complejo plan de acciones que puede ser contingente de una jugada anterior en el
juego (digamos, infraccionar sólo si el automovilista ha observado las trampas de velocidad en
menos de la cuarta parte de los casos en viajes previos). Muchos aspectos de la teoría de los juegos
pueden ilustrarse en juegos en los que los jugadores eligen entre sólo dos acciones posibles.
Concédase que S1 denota la serie de estrategias a disposición del jugador 1, S2 la serie a disposición del jugador 2 y (más generalmente) Si la serie a disposición del jugador i. Sea s1 僆 S1 una
estrategia particular elegida por el jugador 1 entre la serie de posibilidades, s2 僆 S2 la estrategia
particular elegida por el jugador 2 y si 僆 Si por el jugador i. Un perfil de estrategias remitirá a una
lista de estrategias particulares elegidas por cada uno de los miembros de un grupo de jugadores.
Beneficios
El rendimiento final para cada jugador en la conclusión de un juego se llama beneficio. Los beneficios se miden en niveles de utilidad obtenidos por los jugadores. Para mayor simplicidad suelen
usarse beneficios monetarios (como ganancias de las empresas). En general los beneficios pueden incorporar factores no monetarios como prestigio, emoción, preferencias de riesgo, etcétera.
En un juego de dos jugadores, u1(s1, s2) denota el beneficio del jugador 1, dado que elige s1 y el
otro jugador elige s2 e, igualmente, u2(s2, s1) denota el beneficio del jugador 2.1 El hecho de que el
beneficio del jugador 1 pueda depender de la estrategia del jugador 2 (y viceversa) es el punto
donde aparece la interdependencia estratégica. En un juego de n jugadores, el beneficio de un
jugador genérico i puede escribirse como ui(si, si), lo que depende de la estrategia si del jugador i
y el perfil si (s1,…, si1, si1,…, sn) de las estrategias de todos los demás jugadores aparte de i.
DILEMA DEL PRISIONERO
El dilema del prisionero, introducido por A. W. Tucker en la década de 1940, es uno de los juegos
más famosos estudiados en la teoría de juegos y servirá aquí de ejemplo para ilustrar toda lo notación que hemos presentado. El título se deriva de la situación siguiente. Dos sospechosos son
arrestados por un crimen. El fiscal del distrito tiene pocas evidencias del caso y ansía extraer una
1
Técnicamente, estas son las funciones de utilidad Von Neumann-Morgenstern del capítulo anterior.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
253
confesión. Separa a los sospechosos y le dice a cada uno: “Si delatas a tu compañero, pero él no te
delata a ti, te prometo una sentencia reducida (de un año), mientras que tu compañero obtendrá
cuatro. Si ambos se delatan entre sí, cada uno obtendrá una sentencia de tres años”. Cada sospechoso sabe, asimismo, que si ninguno delata, la falta de evidencias resultará en que se le juzgue
por un crimen menor, con una sentencia de dos años.
Reducido a su esencia el dilema del prisionero tiene dos jugadores estratégicos: el sospechoso
1 y el sospechoso 2. (También hay un fiscal de distrito, pero como sus acciones ya fueron completamente especificadas no hay razón de complicar el juego e incluirlo en la especificación.) Cada
jugador tiene dos estrategias posibles a su disposición: delatar o callar. Por tanto, escribimos sus
series de estrategias como S1 S2 {delatar, callar}. Para evitar números negativos, los beneficios
se especificarán como los años de libertad sobre los cuatro años siguientes. Por ejemplo, si el sospechoso 1 delata y el sospechoso 2 no, el sospechoso 1 disfrutará de tres años de libertad y el
sospechoso 2 de ninguno, es decir u1 (delatar, callar) 3 y u2 (callar, delatar) 0.
Forma normal
El dilema del prisionero (y juegos como éste) puede resumirse con la matriz que aparece en la
figura 8.1, llamada forma normal del juego. Cada uno de los cuatro cuadros representa una combinación diferente de estrategias y muestra los beneficios de los jugadores para tal combinación.
La convención usual es que las estrategias del jugador 1 aparezcan en los encabezados de las filas
y las del jugador 2 en los encabezados de las columnas, así como enlistar los beneficios correspondientes del jugador 1 y luego del jugador 2 en cada cuadro.
Pensar estratégicamente en el dilema del prisionero
Aunque no se ha analizado aún cómo resolver los juegos, vale la pena detenerse a pensar en lo
que podría predecirse respecto al dilema del prisionero. Estudiando la figura 8.1, lo primero que
uno podría predecir es que ambos sospechosos callarán. Esto da a ambos el total más alto de
años de libertad (cuatro) en comparación con cualquier otro resultado. Pero luego de pensarlo
mejor, ésa podría no ser la mejor predicción del juego. Imaginémonos un momento en la posición
del jugador 1. No sabemos qué hará el jugador 2, pero como aún no hemos resuelto el juego investiguemos cada posibilidad. Supongamos que el jugador 2 decidiera delatar. Delatándonos, nosotros obtendríamos un año de libertad contra ninguno si calláramos, así que delatar es lo mejor
para nosotros. Supongamos ahora que el jugador 2 decide callar. Delatar sigue siendo para nosotros mejor que callar, porque así obtendremos tres, no dos años de libertad. Más allá de lo que
haga el otro jugador delatar es mejor para nosotros que callar, porque resulta en un año adicional
de libertad. Como los jugadores son simétricos, el mismo razonamiento vale si nos imaginamos
en la posición del jugador 2. Por tanto, la mejor predicción en el dilema del prisionero es que
FIGURA 8.1
Sospechoso 2
Delatar
Callar
Forma normal del dilema
del prisionero.
Sospechoso 1
Delatar u1 1, u2 1
u1 3, u2 0
Callar u1 0, u2 3 u1 2, u2 2
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
254
Parte 3: Incertidumbre y estrategia
ambos delatarán. Cuando se introduzca formalmente el concepto de solución principal —equilibrio
de Nash— se descubrirá que, en efecto, el hecho de que ambos delaten es un equilibrio de Nash.
Esta predicción tiene una propiedad paradójica: al delatar ambos, los sospechosos sólo disfrutarán de un año de libertad, pero si ambos callaran les iría mejor, pues disfrutarían de dos años de
libertad. Esta paradoja no debe interpretarse como que los jugadores son tontos o nuestra predicción errónea. Más bien, revela un discernimiento central de la teoría de juegos en el sentido de
que oponer a los jugadores entre sí en situaciones estratégicas lleva a veces a resultados ineficientes para ellos.2 Los sospechosos podrían tratar de evitar pasar tiempo adicional en prisión llegando al previo acuerdo de callar, reforzado tal vez por amenazas de represalias posteriores en
caso de que uno u otro delate. Introducir acuerdos y amenazas conduce a un juego que difiere del
dilema básico del prisionero, un juego que debe analizarse en sus propios términos usando las
herramientas que se desarrollarán en breve.
Resolver el dilema del prisionero fue fácil porque sólo había dos jugadores y dos estrategias y
porque los cálculos estratégicos implicados eran muy sencillos. Sería útil disponer de una manera
sistemática de resolver estos juegos, así como juegos más complicados. El equilibrio de Nash nos
brinda esa solución sistemática.
EQUILIBRIO DE NASH
En la teoría económica de los mercados el concepto de equilibrio se desarrolla para indicar una
situación en la que tanto ofertantes como demandantes están satisfechos con el resultado del mercado. Dados el precio y la cantidad de equilibrio ningún participante en el mercado tiene un
incentivo para cambiar su comportamiento. En el marco estratégico de la teoría de juegos se
adoptará una noción asociada de equilibrio, formalizada por John Nash en la década de 1950,
llamada equilibrio de Nash.3 El equilibrio de Nash implica decisiones estratégicas que, una vez
tomadas, no dan incentivos a los jugadores para alterar adicionalmente su comportamiento. Un
equilibrio de Nash es una estrategia para cada jugador la cual consiste en la mejor decisión para
cada uno de ellos, dadas las estrategias de equilibrio de los demás.
En las secciones siguientes se dará una definición formal del equilibrio de Nash, se aplicará este
concepto al dilema del prisionero y se mostrará un atajo (que implica enfatizar los beneficios)
para elegir equilibrios de Nash a partir de la forma normal. Como en otras partes de este capítulo,
el lector que quiera evitar tantas matemáticas puede saltarse la notación y las definiciones y pasar
directamente a las aplicaciones sin perder demasiado del discernimiento básico detrás de la teoría
de los juegos.
Una definición formal
El equilibrio de Nash puede definirse simplemente en términos de mejores respuestas. En un juego
de n jugadores la estrategia si es una mejor respuesta a las estrategias de los rivales si, si el jugador
i no puede obtener un beneficio estrictamente más alto con ninguna otra estrategia posible, s'i 僆
Si, dado que los rivales juegan si.
DEFINICIÓN
Mejor respuesta. si es una mejor respuesta del jugador i a las estrategias de los rivales si, denotada como
si 僆 BRi(si), si
ui(si, si)
ui(s'i, si) para todas las s'i 僆 Si.
(8.1)
2
Cuando se dice que el resultado es ineficiente se atienden sólo las utilidades de los sospechosos; si la atención se dirigiera a la
sociedad en general, el hecho de que ambos delaten podría ser un buen resultado para el sistema de justicia penal, presumiblemente la motivación detrás del ofrecimiento del fiscal del distrito.
3
John Nash, “Equilibrium Points in n-Person Games”, Proceedings of the National Academy of Sciences, núm. 36 (1950), pp. 48-49.
Nash es la principal figura en la película de 2001 A Beautiful Mind (véase el problema 8.5 para un ejemplo de la teoría de juegos,
tomado de ese filme) y coganador del Premio Nobel de Economía en 1994.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
255
Un tecnicismo inserto en esta definición es que podría haber un conjunto de mejores respuestas en vez de una sola; por eso usamos la notación de inclusión de conjuntos si 僆 BRi(si). Podría
haber un empate para la mejor respuesta, en cuyo caso el conjunto BRi(si) contendrá más de un
elemento. Si no hay empate, habrá una sola mejor respuesta si y podemos escribir simplemente
si BRi(si).
Ahora es posible definir un equilibrio de Nash en un juego de n jugadores como sigue.
DEFINICIÓN
Equilibrio de Nash. Un equilibrio de Nash es un perfil de estrategias (s*1 , s*2 ,…, s*n ) tal que, para cada
jugador, i 1, 2,…, n, s*i es una mejor respuesta a las estrategias de equilibrio de los demás jugadores s*i.
Es decir, s*i 僆 BRi(s*i).
Estas definiciones implican mucha notación. La notación es un poco más simple en un juego de
dos jugadores. En un juego de dos jugadores (s*1, s*2) es un equilibrio de Nash si s*1 y s*2 son mejores
respuestas mutuas:
u1(s*1, s*2)
u1(s1, s*2)
para todas las s1 僆 S1
(8.2)
u2(s*1, s*2)
u2(s2, s*1)
para todas las s2 僆 S2.
(8.3)
y
Un equilibrio de Nash es estable en cuanto que, aun si todos los jugadores revelaran sus estrategias unos a otros, ninguno tendría un incentivo para desviarse de su estrategia de equilibrio y
elegir otra. Las estrategias de no equilibrio no son estables en este sentido. Si un resultado no es
un equilibrio de Nash, al menos un jugador debe beneficiarse del desvío. De jugadores hiperracionales sería de esperar que resolvieran el problema de inferencia y dedujeran que todos aplicarán un equilibrio de Nash (especialmente si sólo hay uno). Aun si los jugadores no son hiperracionales, a la larga es de esperar que su juego converja en un equilibrio de Nash, a medida que
vayan abandonando estrategias que no son mejores respuestas mutuas.
Aparte de esta propiedad de estabilidad, otra razón del amplio uso en economía del equilibrio de Nash es que su existencia está garantizada para todos los juegos que estudiaremos (lo
cual permite estrategias mixtas que se definirán más adelante; en estrategias puras no necesariamente existen los equilibrios de Nash). Las matemáticas detrás de este resultado de existencia se analizarán ampliamente en las extensiones de este capítulo. El equilibrio de Nash tiene
algunos inconvenientes. Puede haber múltiples equilibrios de Nash lo que dificulta dar con una
predicción única. Asimismo, la definición de equilibrio de Nash deja sin aclarar cómo un jugador puede elegir una estrategia de mejor respuesta antes de saber cómo jugarán los rivales.
Equilibrio de Nash en el dilema del prisionero
Apliquemos los conceptos de mejor respuesta y equilibrio de Nash al ejemplo del dilema del prisionero. Nuestra suposición informada fue que ambos jugadores terminarán delatando. Demostraremos que la delación por ambos es un equilibrio de Nash de este juego. Para hacerlo, debe
comprobarse que delatar es una mejor respuesta a la delación de los demás jugadores. Remitámonos a la matriz de beneficios de la figura 8.1. Si el jugador 2 delata, se está en la primera columna
de la matriz. Si el jugador 1 también delata, su beneficio es 1; si calla, su beneficio es 0. Puesto que
se obtiene más de delatar dada la delación del jugador 2, delatar es la mejor respuesta del jugador
1 ante la delación del jugador 2. Puesto que los jugadores son simétricos, la misma lógica implica
que la delación del jugador 2 es una mejor respuesta a la delación del jugador 1. Así, la mutua
delación es, en efecto, un equilibrio de Nash.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
256
Parte 3: Incertidumbre y estrategia
Podemos demostrar más aún: que la delación de ambos es el único equilibrio de Nash. Para
hacerlo, deben descartarse los otros tres resultados. Consideremos el resultado en que el jugador
1 delata y el jugador 2 calla, abreviado (delatar, callar), el extremo superior derecho de la matriz.
Este no es un equilibrio de Nash. Dado que el jugador 1 delata, como ya se dijo, la mejor respuesta
del jugador 2 es delatar, no callar. Simétricamente, el resultado en que el jugador 1 calla y el jugador 2 delata en el extremo inferior izquierdo de la matriz no es un equilibrio de Nash. Esto resulta
en que los dos callan. Dado que el jugador 2 calla, dirigimos nuestra atención a la segunda
columna de la matriz: las dos filas en esa columna muestran que el beneficio para el jugador 1 de
callar es 2 y de delatar es 3. Así, callar no es una mejor respuesta a delatar; por tanto, el silencio de
ambos no puede ser un equilibrio de Nash.
Para descartar un equilibrio de Nash, basta con determinar que un solo jugador no ejerce una
mejor respuesta y, por tanto, querría desviarse a otra estrategia. Considerando el resultado (delatar, callar), aunque el jugador 1 no se desviara de este (obtiene 3, que es lo más posible), el jugador
2 preferirá desviarse de callar a delatar. Simétricamente, considerando el resultado (callar, delatar), aunque el jugador 2 no quiera desviarse, el jugador 1 prefiere desviarse de callar a delatar, así
que este no es un equilibrio de Nash. Considerando el resultado (callar, callar), ambos jugadores
prefieren desviarse a otra estrategia, lo cual es más que suficiente para descartar este resultado
como un equilibrio de Nash.
Énfasis en los beneficios de la mejor respuesta
Una manera rápida de encontrar los equilibrios de Nash de un juego es hacer énfasis en los
beneficios de la mejor respuesta en la matriz. El procedimiento de énfasis se muestra en relación
con el dilema del prisionero en la figura 8.2. El primer paso es subrayar los beneficios correspondientes a las mejores respuestas del jugador 1. La mejor respuesta del jugador 1 es delatar si el
jugador 2 delata, así que subrayamos u1 1 en el cuadro superior izquierdo; y delatar si el jugador 2 calla, así que subrayamos u1 3 en el cuadro superior izquierdo. Luego se procede a
subrayar los beneficios correspondientes a las mejores respuestas del jugador 2. La mejor respuesta del jugador 2 es delatar si el jugador 1 delata, así que se subraya u2 1 en el cuadro
superior izquierdo; y delatar si el jugador 1 calla, así que se subraya u2 3 en el cuadro inferior
izquierdo.
Una vez subrayados los beneficios de las mejores respuestas, se buscan los cuadros en los que
se ha subrayado el beneficio de cada jugador. Estos cuadros corresponden a los equilibrios de
Nash. (Puede haber equilibrios de Nash adicionales que impliquen estrategias mixtas, los cuales
se definirán más adelante.) En la figura 8.2, sólo en el cuadro superior izquierdo se subrayaron
FIGURA 8.2
Procedimiento de
subrayado en el dilema
del prisionero.
Sospechoso 2
Delatar
Callar
u1 1, u2 1
u1 3, u2 0
Callar
u1 0, u2 3
u1 2, u2 2
Sospechoso 1
Delatar
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
257
ambos beneficios, lo que comprueba que (delatar, delatar) —y ninguno de los demás resultados—
es un equilibrio de Nash.
Estrategias dominantes
(Delatar, delatar) es un equilibrio de Nash en el dilema del prisionero porque la delación es una
mejor respuesta a la delación del otro jugador. Más todavía: delatar es la mejor respuesta a todas
las estrategias del otro jugador, delatar y callar. (Esto puede verse, entre otras cosas, en el procedimiento de subrayado que se muestra en la figura 8.2: todos los beneficios del jugador 1 están
subrayados en la fila, en la que él juega a delatar, y todos los beneficios del jugador 2 están subrayados en la columna en la que él juega a delatar.)
Una estrategia que es una mejor respuesta a cualquier estrategia que los demás jugadores
podrían elegir se llama estrategia dominante. Los jugadores no siempre tienen estrategias dominantes, pero cuando las tienen hay firmes razones para creer que jugarán de esa manera. Las
complicadas consideraciones estratégicas no importan cuando un jugador tiene una estrategia
dominante porque lo mejor para ese jugador es independiente de lo que hagan los demás.
DEFINICIÓN
Estrategia dominante. Una estrategia dominante es una estrategia s*i para el jugador i, que es una mejor
respuesta a todos los perfiles de estrategias de otros jugadores. Es decir, s*i 僆 BRi(si) para todas las si.
Nótese la diferencia entre una estrategia de equilibrio de Nash y una estrategia dominante. Una estrategia que es parte de un equilibrio de Nash debe ser sólo una mejor respuesta a un perfil de estrategias
de otros jugadores, es decir sus estrategias de equilibrio. Una estrategia dominante debe ser una
mejor respuesta no sólo a las estrategias de equilibrio de Nash de otros jugadores, sino a todas las
estrategias de esos jugadores.
Si todos los jugadores en un juego tienen una estrategia dominante, se dice que el juego tiene
un equilibrio de estrategia dominante. Además de ser el equilibrio de Nash del dilema del prisionero (delatar, delatar) es un equilibrio de estrategia dominante. Es generalmente cierto para
todos los juegos que un equilibrio de estrategia dominante, si existe, es también un equilibrio de
Nash y es el único equilibrio de ese tipo.
Batalla de los sexos
El famoso juego de la batalla de los sexos es otro ejemplo que ilustra los conceptos de mejor respuesta y equilibrio de Nash. El caso es que una esposa (jugador 1) y un esposo (jugador 2) desean
FIGURA 8.3
Forma normal de la batalla de los sexos
Jugador 1
(Esposa)
Jugador 2 (Esposo)
Ballet
Box
Ballet
2, 1
0, 0
Box
0, 0
1, 2
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
258
Parte 3: Incertidumbre y estrategia
coincidir acerca de a dónde ir en la noche. Pueden ir al ballet o al box. Ambos prefieren pasar
tiempo juntos que separados. A condición de estar juntos, la esposa prefiere ir al ballet y el esposo
al box. La forma normal de este juego se presenta en la figura 8.3. Para abreviar, omitimos las
etiquetas u1 y u2 de los beneficios y simplemente enfatizamos la convención de que el primer
beneficio es del jugador 1 y el segundo del jugador 2.
Examinaremos los cuatro cuadros de la figura 8.3 y determinaremos cuáles son equilibrios
de Nash y cuáles no. Comencemos por el resultado en el que ambos jugadores eligen el ballet,
anotado como (ballet, ballet) en el extremo superior izquierdo de la matriz de beneficios. Dado
que el esposo juega ballet, la mejor respuesta de la esposa es jugar ballet (esto le da su mayor
beneficio en la matriz de 2). Usando la notación, ballet BR1(ballet). [No necesitamos el elaborado símbolo de inclusión de conjuntos como en “ballet 僆 BR1(ballet)” porque el esposo sólo
tiene una mejor respuesta a la elección de ballet de la esposa.] Dado que la esposa juega ballet,
la mejor respuesta del esposo es jugar ballet. Si se desviara al box, obtendría 0 en lugar de 1,
porque ambos terminarían no coordinándose. Usando la notación, ballet BR2(ballet). Por
tanto (ballet, ballet) es, en efecto, un equilibrio de Nash. Simétricamente (box, box) es un equilibrio de Nash.
Considérese el resultado (ballet, box) en el extremo superior izquierdo de la matriz. Dado que
el esposo elige box, la esposa obtiene 0 por elegir ballet, pero 1 por elegir box; así, ballet no es una
mejor respuesta para la esposa a la elección de box del esposo. En la notación, ballet 僆 BR1(box).
De ahí que (ballet, box) no pueda ser un equilibrio de Nash. [La estrategia de box del esposo tampoco es una mejor respuesta al jugar ballet de la esposa; por tanto, ambos jugadores preferirían
desviarse de (ballet, box), aunque nos basta con encontrar un solo jugador que quiera desviarse
para descartar un resultado como un equilibrio de Nash.] Simétricamente (box, ballet) tampoco
es un equilibrio de Nash.
La batalla de los sexos es un ejemplo de un juego con más de un equilibrio de Nash (de hecho,
tiene tres, un tercero en estrategias mixtas, como veremos). Es difícil saber cuál de los dos que
hemos hallado hasta este momento es más verosímil, porque son simétricos. Por tanto, es difícil
hacer una predicción firme en este juego. La batalla de los sexos es también un ejemplo de un
juego sin estrategias dominantes. Un jugador prefiere jugar ballet si el otro juega ballet, y jugar
box si el otro juega box.
La figura 8.4 aplica el procedimiento de subrayado —el cual se usó para encontrar rápido los
equilibrios de Nash—, a la batalla de los sexos. Este procedimiento comprueba que los dos resultados en que los jugadores logran coordinarse son equilibrios de Nash y que los dos resultados en
los que no se coordinan no lo son.
Los ejemplos 8.1 y 8.2 brindan práctica adicional en el hallazgo de equilibrios de Nash en marcos más complicados (un juego que tiene muchos empates de mejores respuestas en el ejemplo 8.1
y un juego que tiene tres estrategias para cada jugador en el ejemplo 8.2).
FIGURA 8.4
Procedimiento de
subrayado en la batalla
de los sexos
Jugador 1
(esposa)
Jugador 2 (esposo)
Ballet
Box
Ballet
2, 1
0, 0
Box
0, 0
1, 2
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
259
EJEMPLO 8.1 El dilema del prisionero reducido
En esta variación del dilema del prisionero, un sospechoso es condenado y recibe una sentencia de cuatro
años si lo delatan y, si no, sale libre. El fiscal del distrito no recompensa la delación. La figura 8.5 presenta
la forma normal de este juego antes y después de aplicar el procedimiento de subrayar mejores respuestas.
Los beneficios se reformulan nuevamente en términos de años de libertad.
FIGURA 8.5 El dilema del prisionero reducido
a) Forma normal
Sospechoso 1
Sospechoso 2
Delatar
Callar
Delatar
0, 0
1, 0
Callar
0, 1
1, 1
b) Procedimiento de subrayado
Sospechoso 1
Sospechoso 2
Delatar
Callar
Delatar
0, 0
1, 0
Callar
0, 1
1, 1
Los empates de mejores respuestas abundan. Por ejemplo, dado que el jugador 2 delata, el beneficio
del jugador 1 es 0 si delata o calla. Por tanto hay un empate de mejor respuesta del jugador 1 a la delación
por el jugador 2. Este es un ejemplo en el que el conjunto de mejores respuestas contiene más de un elemento: BR1 (delatar) {delatar, callar}.
El procedimiento de subrayado muestra que hay un equilibrio de Nash en cada uno de los cuatro cuadrantes. Dado que los sospechosos no reciben ninguna recompensa o sanción personal por delatar, ambos
son indiferentes entre delatar y callar; por tanto, cualquier resultado puede ser un equilibrio de Nash.
PREGUNTA: ¿Alguno de los jugadores tiene una estrategia dominante?
EJEMPLO 8.2 Piedra, papel o tijeras
“Piedra, papel o tijeras” es un juego infantil en el que los dos jugadores muestran simultáneamente uno
de tres símbolos con la mano. La figura 8.6 presenta la forma normal. Los cero beneficios a lo largo de la
diagonal indican que si los jugadores adoptan la misma estrategia, no se hará ningún pago. En otros casos
los beneficios indican un pago de 1 dólar del perdedor al ganador conforme a la jerarquía usual (la piedra
rompe las tijeras, las tijeras cortan el papel, el papel cubre la piedra).
Como sabe quienquiera que haya jugado este juego, y como lo revela el procedimiento de subrayado,
ninguno de los nueve cuadros representa un equilibrio de Nash. Todo par de estrategias es inestable
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Parte 3: Incertidumbre y estrategia
porque ofrece al menos a uno de los jugadores un incentivo para desviarse. Por ejemplo, (tijeras, tijeras)
da un incentivo para que el jugador 1 o 2 elija piedra; (papel, piedra) da un incentivo al jugador 2 para
elegir tijeras.
FIGURA 8.6 Piedra, papel o tijeras
a) Forma normal
Jugador 1
Jugador 2
Piedra
Papel
Tijeras
Piedra
0, 0
−1, 1
1, −1
Papel
1, −1
0, 0
−1, 1
Tijeras
−1, 1
1, −1
0, 0
b) Procedimiento de subrayado
Jugador 2
Jugador 1
260
Piedra
Papel
Tijeras
Piedra
0, 0
−1, 1
1, −1
Papel
1, −1
0, 0
−1, 1
Tijeras
−1, 1
1, −1
0, 0
Este juego tiene un equilibrio de Nash no en los nueve cuadros de la figura, sino en estrategias mixtas,
que se definirán en la sección siguiente.
PREGUNTAS: ¿Algún jugador tiene una estrategia dominante? ¿Por qué (papel, tijeras) no es un equilibrio de Nash?
ESTRATEGIAS MIXTAS
Las estrategias de los jugadores pueden ser más complicadas que simplemente elegir una acción
con certidumbre. En esta sección se estudiarán las estrategias mixtas, en las que el jugador selecciona aleatoriamente a partir de varias acciones posibles. En contraste, las estrategias consideradas en los ejemplos hasta aquí implicaban que un jugador eligiera con certidumbre una acción u
otra; estas se llaman estrategias puras. Por ejemplo, en la batalla de los sexos se consideraron las
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
261
estrategias puras de elegir con seguridad entre ballet y box. Una posible estrategia mixta en este
juego sería lanzar una moneda al aire y luego asistir al ballet si y sólo si la moneda resulta en cara,
produciendo una posibilidad de 50-50 de que caiga uno u otro evento.
Aunque a primera vista podría parecer extraño hacer que los jugadores lancen monedas al aire
para determinar cómo jugarán, hay buenas razones para estudiar las estrategias mixtas. Primero,
algunos juegos (como el de “Piedra, papel o tijeras”) no tienen equilibrios de Nash en estrategias
puras. Como se verá en la sección sobre la existencia, esos juegos siempre tienen un equilibrio de
Nash en estrategias mixtas; por tanto, considerar estrategias mixtas nos permitirá hacer predicciones en aquellos juegos en los que de otra forma sería imposible hacerlo. Segundo, las estrategias que implican aleatorización son naturales y conocidas en ciertos ámbitos. Los estudiantes
conocen el ámbito de los exámenes de cursos. El tiempo de una clase suele ser demasiado limitado para que el profesor examine a los alumnos sobre cada tema impartido en el aula, pero puede
ser suficiente para probarlos en un subconjunto de temas para inducirlos a estudiar todo el material. Si los estudiantes supieran qué temas aparecerán en el examen podrían inclinarse a estudiar
sólo esos y no los demás; así, el profesor debe escoger los temas al azar para lograr que los alumnos estudien todo. Las estrategias aleatorias también son comunes en los deportes (el mismo
futbolista dispara a veces a la derecha de la portería y a veces a la izquierda en penaltis) y en los
juegos de cartas (el jugador de póquer a veces se repliega y a veces engaña con una mano igualmente mala en distintos momentos).4
Definiciones formales
Para ser más formales, supongamos que un jugador i tiene una serie de M posibles acciones Ai
{ai1,…, ami,…, aMi}, donde el subíndice se refiere al jugador y el superíndice a las diferentes opciones. Una estrategia mixta es una distribución de probabilidad sobre las M acciones, si {i1,…,
mi, …, Mi }, donde mi es un número entre 0 y 1 que indica la probabilidad de que el jugador i
ejecute la acción ami. Las probabilidades en si deben sumar la unidad: i1 … mi … mi
1.
En la batalla de los sexos, por ejemplo, ambos jugadores tienen las mismas dos acciones de
ballet y box, así que puede escribirse A1 A2 {ballet, box}. Una estrategia mixta puede escribirse como un par de probabilidades (, 1 ), donde es la probabilidad de que el jugador elija
ballet. Las probabilidades deben sumar la unidad, así que, con dos acciones, y una vez especificada la probabilidad de una acción, se determina la probabilidad de la otra. La estrategia mixta
(1/3, 2/3) significa que el jugador juega ballet con probabilidad de 1/3, y box con probabilidad de
2/3; (1/2, 1/2) significa que el jugador tiene la misma probabilidad de jugar ballet o box; (1, 0)
significa que el jugador elegirá ballet con toda certeza; y (0, 1), que con seguridad elegirá box.
En nuestra terminología una estrategia mixta es una categoría general que incluye el caso especial de una estrategia pura. Una estrategia pura es el caso especial en el que sólo se ejecuta una
acción con probabilidad positiva. Las estrategias mixtas que implican dos o más acciones ejecutadas con probabilidad positiva se llaman estrategias estrictamente mixtas. Para volver a los ejemplos del párrafo anterior de estrategias mixtas en la batalla de los sexos, las cuatro estrategias (1/3,
2/3), (1/2, 1/2), (1, 0) y (0, 1) son estrategias mixtas. Las dos primeras son estrictamente mixtas, y
las dos segundas estrategias puras.
Con esta notación para las acciones y estrategias mixtas detrás de nosotros no necesitamos
nuevas definiciones para mejor respuesta, equilibrio de Nash y estrategia dominante. Las definiciones que se presentaron cuando si se tomó como una estrategia pura también se aplican al caso
en el que si se toma como una estrategia mixta. El único cambio es que la función de beneficio
4
Una tercera razón es que las estrategias mixtas puedan “purificarse”, especificando un juego más complicado en el que una u otra
acción es mejor para el jugador por razones privadas y donde esa acción con seguridad se ejecuta. Por ejemplo, un profesor de
historia podría decidir hacer una pregunta en un examen sobre la primera Guerra Mundial porque, sin que los estudiantes lo
sepan, recientemente leyó en una revista especializada un interesante artículo sobre ella. Véase John Harsanyi, “Games with Randomly Disturbed Payoffs: A New Rationale for Mixed-Strategy Equilibrium Points”, International Journal of Game Theory, núm. 2
(1973), pp. 1-23. Harsanyi fue coganador (junto con Nash) del Premio Nobel de Economía en 1994.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
262
Parte 3: Incertidumbre y estrategia
ui(si, si), más que ser un beneficio cierto, debe reinterpretarse como el valor esperado de un
beneficio aleatorio con probabilidades dadas por las estrategias si y si. El ejemplo, 8.3 proporciona alguna práctica en el cálculo de beneficios esperados en la batalla de los sexos.
EJEMPLO 8.3 Beneficios esperados en la batalla de los sexos
Calculemos los beneficios esperados de los jugadores si la esposa elige la estrategia mixta (1/9, 8/9) y el
esposo (4/5, 1/5) en la batalla de los sexos. El beneficio esperado de la esposa es
U1
1 8
4 1
1 4
1 1
,
,
,
¼
U1 ðballet, balletÞ þ
U1 ðballet, boxÞ
9 9
5 5
9 5
9 5
8 4
8 1
U1 ðbox, balletÞ þ
U1 ðbox, boxÞ
þ
9 5
9 5
1 4
1 1
8 4
8 1
ð2Þ þ
ð0Þ þ
ð0Þ þ
ð1Þ
¼
9 5
9 5
9 5
9 5
16
¼ :
45
(8.4)
Para entender la ecuación 8.4 es útil repasar el concepto de valor esperado del capítulo 2. El valor esperado de una variable aleatoria es igual a la suma de todos los resultados de la probabilidad del resultado
multiplicada por el valor de la variable aleatoria en ese resultado. En la batalla de los sexos hay cuatro
resultados, correspondientes a los cuatro cuadrantes en la figura 8.3. Como los jugadores deciden de
manera aleatoria e independiente, la probabilidad de llegar a un cuadrante particular es igual al producto
de las probabilidades de que cada jugador ejecute la estrategia que conduce a ese cuadrante. Por tanto,
por ejemplo, la probabilidad (box, ballet) —es decir, que la esposa juegue box y el esposo ballet— equivale a (8/9) × (4/5). Las probabilidades de los cuatro resultados se multiplican por el valor de la variable
aleatoria relevante (en este caso, el beneficio del jugador 1) en cada resultado.
Calculemos ahora el beneficio esperado de la esposa si esta ejecuta la estrategia pura de ir al ballet
[igual que la estrategia mixta (1, 0)] y el esposo sigue ejecutando la estrategia mixta (4/5, 1/5). Esta vez
sólo hay dos resultados relevantes dados por los dos cuadrantes en la fila en la que la esposa juega ballet.
Las probabilidades de esos dos resultados están dadas por las probabilidades en la estrategia mixta del
esposo. Por tanto,
4 1
4
1
U 1 ballet,
U 1 ðballet, boxÞ
,
¼
U 1 ðballet, balletÞ þ
5 5
5
5
4
1
8
¼
ð2Þ þ
ð0Þ ¼ :
5
5
5
(8.5)
Por último calculemos la expresión general para el beneficio esperado de la esposa cuando ejecuta la
estrategia mixta (w, 1 w) y el esposo ejecuta (h, 1 h): si la esposa juega ballet con probabilidad w y el
esposo con probabilidad h, entonces
U 1 ððw, 1 wÞ, ðh, 1 hÞÞ ¼ ðwÞðhÞU 1 ðballet, balletÞ þ ðwÞð1 hÞU 1 ðballet, boxÞ
þ ð1 wÞðhÞU 1 ðbox, balletÞ
þ ð1 wÞð1 hÞU 1 ðbox, boxÞ
¼ ðwÞðhÞð2Þ þ ðwÞð1 hÞð0Þ þ ð1 wÞðhÞð0Þ
þ ð1 wÞð1 hÞð1Þ
¼ 1 h w þ 3hw:
(8.6)
PREGUNTAS: ¿Cuál es el beneficio esperado del esposo en cada caso? Demuestra que su beneficio esperado es 2 –2h 2w + 3hw en el caso general. Dado que el esposo ejecuta la estrategia mixta (4/5, 1/5),
¿qué estrategia brinda a la esposa el beneficio más alto?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
263
Cálculo de equilibrios de estrategias mixtas
Calcular los equilibrios de Nash de un juego cuando están implicadas estrategias estrictamente
mixtas es un poco más complicado que cuando están implicadas estrategias puras. Antes de
meternos en eso podríamos ahorrarnos mucho trabajo preguntando si el juego tiene siquiera un
equilibrio de Nash en estrategias estrictamente mixtas. De no ser así, habiendo encontrado todos
los equilibrios de Nash de estrategias puras, se ha terminado de analizar el juego. La clave para
suponer que un juego tiene un equilibrio de Nash en estrategias estrictamente mixtas es el sorprendente resultado de que casi todos los juegos tienen un número impar de equilibrios de Nash.5
Apliquemos este discernimiento a algunos de los ejemplos que hemos considerado hasta aquí.
Encontramos un número impar (uno) de equilibrios de Nash en estrategias puras en el dilema del
prisionero, lo cual sugiere que ya no necesitamos buscar uno en estrategias estrictamente mixtas.
En la batalla de los sexos encontramos un número par (dos) de equilibrios de Nash en estrategias
puras, lo que sugiere la existencia de un tercero en estrategias estrictamente mixtas. El ejemplo 8.2
—“Piedra, papel o tijeras”— no tiene equilibrios de Nash en estrategias puras. Para llegar a un
número impar de equilibrios de Nash, sería de esperar que encontráramos un equilibrio de Nash
en estrategias estrictamente mixtas.
EJEMPLO 8.4 Equilibrio de Nash en estrategias mixtas en la batalla de los sexos
Una estrategia mixta general para la esposa en la batalla de los sexos es (w, 1 w), y para el esposo (h,
1 h), donde w y h son las probabilidades de jugar ballet para la esposa y el esposo, respectivamente. Se
calcularán valores para w y h que compongan equilibrios de Nash. Ambos jugadores tienen un continuo
de estrategias posibles entre 0 y 1. Así, estas estrategias no pueden escribirse en las filas y columnas de una
matriz, y tampoco es posible subrayar beneficios de mejor respuesta para hallar los equilibrios de Nash.
En cambio, para despejar los equilibrios de Nash, se usarán métodos gráficos.
Dadas las estrategias mixtas generales de los jugadores, en el ejemplo 8.3 se vio que el beneficio esperado de la esposa es
U1((w, 1 w), (h, 1 h)) 1 h w 3hw.
(8.7)
Como indica la ecuación 8.7, la mejor respuesta de la esposa depende de h. Si h 1/3, ella quiere fijar w
lo más bajo posible: w 0. Si h 1/3, su mejor respuesta es fijar w lo más alto posible: w 1. Cuando
h 1/3, su beneficio esperado es igual a 2/3 más allá de lo que w elija. En este caso hay un empate en la
mejor respuesta, que incluye cualquier w de 0 a 1.
En el ejemplo 8.3 se estableció que el beneficio esperado del esposo es
U2((h, 1 h), (w, 1 w)) 2 2h 2w 3hw.
(8.8)
Cuando w 2/3, su beneficio esperado es optimizado por h 0; cuando w 2/3, su beneficio esperado
es optimizado por h 1; y cuando w 2/3 el esposo es indiferente entre todos los valores de h, obteniendo un beneficio esperado de 2/3.
Las mejores respuestas se grafican en la figura 8.7. Los equilibrios de Nash están dados por los puntos
de intersección entre las mejores respuestas. En esos puntos de intersección, ambos jugadores se dan
mejores respuestas entre sí, lo cual es lo que se requiere para que el resultado sea un equilibrio de Nash.
Hay tres equilibrios de Nash. Los puntos E1 y E2 son los equilibrios de Nash en estrategias puras que ya
hallamos, correspondiendo E1 al equilibrio de Nash en estrategias puras en el que ambos juegan box y E2
a aquel en el que ambos juegan ballet. El punto E3 es el equilibrio de Nash en estrategias estrictamente
mixtas, el cual puede formularse como “la esposa juega ballet con probabilidad de 2/3 y box con probabilidad de 1/3; y el esposo juega ballet con probabilidad de 1/3 y box con probabilidad de 2/3”. Más
sucintamente, habiendo definido w y h, podemos escribir este equilibrio como “w* 2/3 y h* 1/3”.
5
John Harsanyi, “Oddness of the Number of Equilibrium Points: A New Proof ”, International Journal of Game Theory, núm. 2
(1973), pp. 235-250. Los juegos en los que hay empates entre beneficios pueden tener un número par o infinito de equilibrios de
Nash. El ejemplo 8.1, “El dilema del prisionero”, tiene varios empates de beneficios. Tiene cuatro equilibrios de Nash en estrategias
puras y un número infinito de equilibrios en estrategias mixtas.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
264
Parte 3: Incertidumbre y estrategia
FIGURA 8.7 Equilibrios de Nash en estrategias mixtas en la batalla de los sexos
El ballet es elegido por la esposa con probabilidad w y por el esposo con probabilidad h. La mejores respuestas de los jugadores se grafican en la misma serie de ejes. Los tres puntos de intersección E1, E2 y E3 son
equilibrios de Nash. El equilibrio de Nash en estrategias estrictamente mixtas, E3, es w* 2/3 y h* 1/3.
h
E2
1
Mejor respuesta
del esposo,
BR 2
2/3
E3
1/3
Mejor respuesta
de la esposa,
BR1
E1
0
w
1/3
2/3
1
PREGUNTAS: ¿Cuál es el beneficio esperado de un jugador en el equilibrio de Nash en estrategias estrictamente mixtas? ¿Qué resulta de comparar ese beneficio con aquellos en los equilibrios de Nash en estrategias puras? ¿Qué argumentos podrían ofrecerse de que uno u otro de los tres equilibrios de Nash pudieran ser la mejor predicción en este juego?
El ejemplo 8.4 hace los extensos cálculos contenidos en la determinación de todos los equilibrios de Nash en la batalla de los sexos, los de estrategias puras y los de estrategias estrictamente
mixtas. Un atajo para hallar el equilibrio de Nash en estrategias estrictamente mixtas se basa en el
discernimiento de que un jugador estará dispuesto a decidir aleatoriamente entre dos acciones en
equilibrio, sólo si obtiene el mismo beneficio esperado de ejecutar cualquiera de ambas acciones
o, en otras palabras, si es indiferente entre las dos acciones en equilibrio. De lo contrario, una de
las dos acciones brindaría un beneficio esperado más alto, y con seguridad el jugador preferirá
ejecutar esa acción.
Supongamos que el esposo ejecuta la estrategia mixta (h, 1 h), es decir jugar ballet con probabilidad h y box con probabilidad 1 h. El beneficio esperado de la esposa de jugar ballet es
U1(ballet, (h, 1 h)) (h)(2) (1 h)(0) 2h.
(8.9)
El beneficio esperado de jugar box es
U1(box, (h, 1 h)) (h)(0) (1 h)(1) 1 h.
(8.10)
Para que la esposa sea indiferente entre ballet y box en equilibrio, las ecuaciones 8.9 y 8.10 deben
ser iguales: 2h 1 – h, lo cual implica que h* 1/3. Cálculos similares, basados en la indiferencia
del esposo entre jugar ballet y box en equilibrio, indican que la probabilidad de que la esposa
juegue ballet en el equilibrio de Nash en estrategias estrictamente mixtas es w* 2/3. (Haz estos
cálculos como ejercicio.)
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
265
Nótese que la condición de indiferencia de la esposa no “fija” su estrategia mixta de equilibrio. La condición de indiferencia de la esposa no puede fijar su propia estrategia mixta de
equilibrio porque, dado que ella es indiferente entre las dos acciones en equilibrio, su beneficio esperado general es el mismo sin importar qué distribución de probabilidad ponga en juego
sobre las dos acciones. Más bien, la condición de indiferencia de la esposa fija la estrategia mixta
del otro jugador, el esposo. Hay una única distribución de probabilidad que él puede usar para
jugar ballet o jugar box que la vuelve a ella indiferente entre las dos acciones, y que por tanto la
dispone a decidir aleatoriamente. Dada cualquier probabilidad de que él juegue ballet y box diferente de (1/3, 2/3), este no sería un resultado estable para que ella decidiera aleatoriamente.
Por tanto, dos principios deben tenerse en mente al buscar equilibrios de Nash en estrategias
estrictamente mixtas. Uno es que un jugador decide al azar sólo aquellas acciones entre las que es
indiferente, dadas las estrategias mixtas en equilibrio de otros jugadores. El segundo es que la
condición de indiferencia de un jugador fija la estrategia mixta del otro jugador.
EXISTENCIA DE EQUILIBRIO
Una de las razones por las que el equilibrio de Nash es de uso tan común es que un equilibrio de
Nash tiene garantizada su existencia en una amplia clase de juegos. Este no es el caso de otros
conceptos de equilibrio. Considérese el concepto de equilibrio de estrategias dominantes. El
dilema del prisionero tiene un equilibrio de estrategias dominantes (ambos sospechosos delatan),
pero la mayoría de los juegos no. En efecto, hay muchos juegos —como el de la batalla de los
sexos— en los que ningún jugador tiene una estrategia dominante, y menos aún todos los jugadores. En tales juegos no es posible hacer predicciones usando el equilibrio de estrategias dominantes, aunque pueden hacerse usando el equilibrio de Nash.
La sección de extensiones, al final de este capítulo, ofrece los detalles técnicos detrás de la
prueba de John Nash acerca de la existencia de su equilibrio en todos los juegos finitos (juegos con
un número finito de jugadores y un número finito de acciones). El teorema de la existencia no
garantiza que haya un equilibrio de Nash en estrategias puras. Ya se vio un ejemplo: “Piedra, papel
o tijeras” en el ejemplo 8.2. Sin embargo, si un juego finito no tiene un equilibrio de Nash en estrategias puras, ese teorema garantiza que tendrá un equilibrio de Nash en estrategias mixtas. La
prueba del teorema de Nash es similar a la prueba en el capítulo 13 de la existencia de precios
conducentes a un equilibrio competitivo general. La sección “Extensiones” incluye un teorema de
la existencia para juegos con un continuo de acciones, como se estudiará en la sección siguiente.
CONTINUO DE ACCIONES
La mayoría de los discernimientos procedentes de situaciones económicas puede obtenerse a
menudo separando la situación en varias o incluso en dos acciones, como en el caso de todos los
juegos estudiados hasta aquí. En otros momentos, los discernimientos adicionales pueden obtenerse permitiendo un continuo de acciones. Para ser claros, ya encontramos un continuo de estrategias —en nuestro análisis de las estrategias mixtas—, pero aun así las distribuciones de probabilidad en estrategias mixtas fueron sobre un número finito de acciones. En esta sección nos
concentraremos en un continuo de acciones.
Algunas situaciones se modelizan en forma más realista mediante una gama continua de acciones. En el capítulo 15, por ejemplo, se estudiará la competencia entre empresas estratégicas. En un
modelo (de Bertrand) las empresas fijan precios; en otro (de Cournot), fijan cantidades. Es natural
permitir que las empresas elijan cualquier precio o cantidad no negativos en vez de restringirlas
artificialmente a sólo dos precios (digamos 2 o 5 dólares) o dos cantidades (digamos 100 o 1 000
unidades). Las acciones continuas tienen otras ventajas. Los conocidos métodos del cálculo pueden usarse con frecuencia para despejar equilibrios de Nash. También es posible analizar cómo las
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
266
Parte 3: Incertidumbre y estrategia
acciones de equilibrio varían con cambios en los parámetros subyacentes. Con el modelo de
Cournot, por ejemplo, podríamos querer saber cómo varían las cantidades de equilibrio con un
pequeño incremento en los costos marginales o un parámetro de la demanda de una empresa.
Tragedia de los comunes
El ejemplo 8.5 ilustra cómo despejar el equilibrio de Nash cuando el juego (en este caso la tragedia de los comunes) implica un continuo de acciones. El primer paso es escribir el beneficio de
cada jugador como una función de las acciones de todos los jugadores. El paso siguiente es calcular la condición de primer orden, asociada con el beneficio óptimo de cada jugador. Esto dará
una ecuación que puede reordenarse para dar lugar a la mejor respuesta de cada jugador
como una función de las acciones de todos los demás jugadores. Habrá una ecuación para
cada jugador. Con n jugadores el sistema de n ecuaciones para las n acciones de equilibrio
desconocidas puede resolverse simultáneamente con métodos algebraicos o gráficos.
EJEMPLO 8.5 Tragedia de los comunes
El término tragedia de los comunes ha terminado por significar problemas ambientales por abuso que
ocurre cuando los recursos escasos se tratan como si fueran propiedad común.6 Una ilustración teórica
de juego de este asunto puede desarrollarse suponiendo que dos pastores deciden cuántas ovejas llevar a
pastar a los terrenos comunales del pueblo. El problema es que esos bienes comunales son reducidos y
pueden sucumbir rápidamente al sobrepastoreo.
Para dotar de cierta estructura matemática a este problema, sea qi el número de ovejas que el pastor
i 1, 2 lleva a pastar a los terrenos comunales, y que el valor por oveja del pastoreo en esos terrenos (en
términos de lana y queso de leche de oveja) es
v(q1, q2) 120 (q1 q2).
(8.11)
Esta función implica que el valor de apacentar un determinado número de ovejas es menor mientras más
ovejas compiten por pastos. Para representar la forma normal de este juego de acciones continuas no es
posible usar una matriz. En cambio, la forma normal es simplemente una lista de las funciones de beneficio de los pastores
u1(q1, q2) q1v(q1, q2) q1(120 q1 q2),
u2(q1, q2) q2v(q1, q2) q2(120 q1 q2).
(8.12)
Para hallar el equilibrio de Nash se resuelve el problema de maximización de valor del pastor 1:
max{q1(120 q1 q2)}.
q1
(8.13)
La condición de primer orden para un máximo es
120 2q1 q2 0
(8.14)
o, reordenando,
q1 ¼ 60 q2
¼ BR1 ðq2 Þ:
2
(8.15)
Pasos similares muestran que la mejor respuesta del pastor 2 es
q2 ¼ 60 q1
¼ BR2 ðq1 Þ:
2
(8.16)
El equilibrio de Nash está dado por el par (q*1, q*2) que satisface las ecuaciones 8.15 y 8.16, simultáneamente. Adoptando un enfoque algebraico de la solución simultánea la ecuación 8.16 puede sustituirse en
la ecuación 8.15, lo cual al reordenar produce
6
Este término fue popularizado por G. Hardin en “The Tragedy of the Commons”, Science, núm. 162 (1968), pp. 1243-1248.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
q1 ¼ 60 1
q
60 1 ;
2
2
267
(8.17)
esto implica que q*1 40. Sustituir q*1 40 en la ecuación 8.17 implica que también q*2 40. Por tanto,
cada pastor apacentará 40 ovejas en los terrenos comunales. Cada cual obtiene un beneficio de 1 600,
como puede verse al sustituir q*1 q*2 40 en la función de beneficio de la ecuación 8.13.
Las ecuaciones 8.15 y 8.16 también pueden resolverse simultáneamente usando métodos gráficos. La
figura 8.8 traza las dos mejores respuestas en una gráfica en que la acción del jugador 1 aparece en el eje
horizontal y la del jugador 2, en el eje vertical. Estas mejores respuestas son simplemente líneas, así que es
fácil graficarlas en el ejemplo. (Para ser congruentes con las etiquetas de los ejes, lo que realmente se ha graficado es la inversa de la ecuación 8.15.) Las dos mejores respuestas intersecan en el equilibrio de Nash E1.
FIGURA 8.8 Diagrama de mejores respuestas para la tragedia de los comunes
La intersección E1, entre las mejores respuestas de los dos pastores, es el equilibrio de Nash. Un incremento
en el valor por oveja de pastar en la tragedia de los comunes desplaza hacia fuera la mejor respuesta del
pastor 1, lo que resulta en un equilibrio de Nash E2, en el cual el pastor 1 apacienta más ovejas (y el pastor
2, menos) que en el equilibrio de Nash original.
q2
120
BR1(q2)
60
40
E1
E2
BR 2(q1)
0
40
60
120
q1
El método gráfico es útil para mostrar cómo el equilibrio de Nash se desplaza con variaciones en los
parámetros del problema. Supongamos que el valor por oveja del pastoreo se incrementa para el primer pastor mientras que el del segundo permanece como en la ecuación 8.11, quizás porque el primer
pastor comienza a criar ovejas merina con lana más valiosa. Este cambio desplazaría hacia fuera la
mejor respuesta del pastor 1, dejando sin variación la del pastor 2. El nuevo punto de intersección (E2
en la figura 8.8), el cual es el nuevo equilibrio de Nash, implica más ovejas para 1 y menos para 2.
El equilibrio de Nash no es el mejor uso de los bienes comunes. En el problema original, el valor por
oveja del pastoreo de ambos pastores está dado por la ecuación 8.11. Si ambos apacentaran sólo 20 ovejas,
cada uno obtendría un beneficio de 1 800, como puede verse al sustituir q1 q2 30 en la ecuación 8.13.
En realidad, el “problema de optimización del beneficio”
max fðq1 þ q2 Þvðq1 , q2 Þg ¼ max fðq1 þ q2 Þð120 q1 q2 Þg
q1 , q2
q1 , q2
(8.18)
se resuelve con q1 q2 30 o, en general, con cualesquier q1 y q2 que sumen 60.
PREGUNTAS: ¿Cómo se desplazaría el equilibrio de Nash si los beneficios de ambos pastores se incrementaran en el mismo monto? ¿Qué podría decirse del decremento en el beneficio del pastoreo para
(únicamente) el pastor 2?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
268
Parte 3: Incertidumbre y estrategia
Como indica el ejemplo 8.5, los métodos gráficos son especialmente convenientes para determinar rápidamente los desplazamientos del equilibrio con cambios en los parámetros subyacentes. El ejemplo desplazó el beneficio del pastoreo de uno de los pastores. Este ejercicio ilustra
claramente la naturaleza de la interacción estratégica. La función de beneficio del pastor 2 no ha
cambiado (sólo la del pastor 1), pero su acción de equilibrio cambia. El segundo pastor observa el
beneficio más alto del primero, prevé que el primero incrementará el número de ovejas que apacienta y reduce su pastoreo en respuesta.
La tragedia de los comunes comparte con el dilema del prisionero el rasgo de que el equilibrio
de Nash es menos eficiente para todos los jugadores que cualquier otro resultado. En el dilema del
prisionero ambos sospechosos delatan en equilibrio cuando para ambos sería más eficiente callar.
En la tragedia de los comunes los pastores apacientan más ovejas en equilibrio de las eficientes.
Este discernimiento podría explicar por qué las áreas de pesca océanicas y otros recursos comunes pueden acabar siendo objeto de abusos aun al punto de su agotamiento en ausencia de regulaciones. En el capítulo 19 se darán más detalles sobre estos problemas, que implican lo que llamaremos externalidades negativas.
JUEGOS SECUENCIALES
En algunos juegos el orden de los movimientos importa. Por ejemplo, en una carrera ciclista con
un inicio escalonado, podría ser útil llegar en último lugar y conocer así el tiempo por batir. Por
otro lado, la competencia por establecer un nuevo formato de video de alta definición puede ser
ganada por la primera empresa en comercializar su tecnología, capturando así una base de clientes cautivos.
Los juegos secuenciales difieren de los simultáneos, que hemos considerado hasta aquí, en que
un jugador que se mueve después en el juego puede observar cómo han jugado otros hasta ese
momento. Este jugador puede usar esa información para elaborar estrategias más sofisticadas que
la simple elección de una acción; la estrategia de este jugador podría ser un plan contingente en el
que la acción por ejecutar dependa de lo que hayan hecho los demás jugadores.
Para ilustrar los nuevos conceptos, planteados por los juegos secuenciales —y, en particular,
para hacer un marcado contraste entre juegos simultáneos y secuenciales—, tomaremos un juego
simultáneo ya analizado, la batalla de los sexos, y lo convertiremos en un juego secuencial.
Batalla de los sexos secuencial
Consideremos el juego de la batalla de los sexos que ya hemos analizado, con las mismas acciones y
beneficios, pero cambiando ahora el tiempo de los movimientos. En vez de que esposa y esposo
tomen una decisión simultánea la esposa se mueve primero, eligiendo ballet o box; el esposo observa
esta situación (digamos que la esposa lo llama desde el lugar elegido) y entonces toma su decisión.
Las posibles estrategias de la esposa no han cambiado: ella puede elegir las acciones simples ballet o
box (o quizá una estrategia mixta que implique ambas acciones, aunque esta no será una consideración relevante en el juego secuencial). La serie de posibles estrategias del esposo se ha ampliado. Por
cada una de las dos acciones de la esposa él puede elegir una de las dos acciones; por tanto tiene
cuatro estrategias posibles, las que se enlistan en la tabla 8.1.
TABLA 8.1 ESTRATEGIAS CONTINGENTES DEL ESPOSO
Estrategia contingente
Escrita en formato condicional
Ir siempre al ballet
(ballet | ballet, ballet | box)
Seguir a su esposa
(ballet | ballet, box | box)
Hacer lo contrario
(box | ballet, ballet | box)
Ir siempre al box
(box | ballet, box | box)
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
269
La barra vertical en las estrategias del esposo significa “a condición de que”, así que, por ejemplo, “box | ballet” debe leerse como “el esposo elige box a condición de que la esposa elija
ballet”.
Dado que el esposo tiene cuatro estrategias puras más que sólo dos, la forma normal (dada en
la figura 8.9) debe ampliarse ahora a ocho cuadrantes. En términos generales, la forma normal es
dos veces más complicada que la de la versión simultánea del juego en la figura 8.2. Esto motiva
una nueva manera de representar juegos, llamada forma extensiva, especialmente conveniente
para los juegos secuenciales.
Forma extensiva
La forma extensiva de un juego muestra el orden de los movimientos como las ramas de un árbol
más que colapsar todo en una matriz. La forma extensiva de la batalla de los sexos secuencial
aparece en la figura 8.10a. La acción procede de izquierda a derecha. Cada nodo (indicado como
un punto en el árbol) representa un punto de decisión para el jugador que se señala ahí. El primer
movimiento corresponde a la esposa. Luego de cada acción que ella podría emprender, el esposo
se mueve. Los beneficios se enlistan al final del árbol en el mismo orden (del jugador 1, del jugador 2) que en la forma normal.
Contrastemos la figura 8.10a con la figura 8.10b, que muestra la forma extensiva de la versión simultánea del juego. Es difícil armonizar una forma extensiva en la que los movimientos
ocurren en progresión, con un juego simultáneo, en el que todo sucede al mismo tiempo. El
truco es elegir a uno de los dos jugadores para que ocupe el papel de segundo en moverse, pero
destacando luego que en realidad no lo es, uniendo sus puntos de decisión en el mismo conjunto
de información, el óvalo punteado alrededor de los nodos. El óvalo punteado de la figura 8.10b
indica que el esposo no conoce el movimiento de su esposa cuando elige su acción. No importa
qué jugador se elige como primero o segundo en moverse en un juego simultáneo; nosotros
elegimos al esposo en esta figura para asemejar lo más posible la forma extensiva de la figura
8.10b con la de la figura 8.10a.
La semejanza entre estas dos formas extensivas ilustra el hecho de que esa forma no ve
aumentada su complejidad para juegos secuenciales como lo hace la forma normal. A continuación trazaremos las formas normal y extensiva en nuestro análisis de la batalla de los sexos
secuencial.
FIGURA 8.9
Forma normal de la batalla
de los sexos secuencial.
Esposo
(Ballet | Ballet
Box| Box)
(Box| Ballet
Ballet | Box)
(Box| Ballet
Box| Box)
Ballet
2, 1
2, 1
0, 0
0, 0
Box
0, 0
1, 2
0, 0
1, 2
Esposa
(Ballet | Ballet
Ballet | Box)
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
270
Parte 3: Incertidumbre y estrategia
FIGURA 8.10
Forma extensiva de la
batalla de los sexos.
En la versión secuencial a) el esposo es el segundo en moverse después de observar el movimiento de su
esposa. En la versión simultánea b) él no conoce la decisión de ella cuando se mueve, así que sus nodos de
decisión deben unirse en un conjunto de información.
2, 1
2, 1
Ballet
Ballet
2
2
Box
Ballet
0, 0
Ballet
Box
Box
Ballet
0, 0
1
1
0, 0
Box
Ballet
0, 0
2
2
Box
Box
1, 2
1, 2
b) Versión simultánea
a) Versión secuencial
Equilibrios de Nash
Para despejar los equilibrios de Nash volvamos a la forma normal en la figura 8.9. Aplicar el
método de subrayar los beneficios de las mejores respuestas —teniendo cuidado de subrayar
ambos beneficios en casos de empate en la mejor respuesta— revela tres equilibrios de Nash en
estrategias puras:
1. la esposa juega ballet, el esposo juega (ballet | ballet, ballet | box);
2. la esposa juega ballet, el esposo juega (ballet | ballet, box | box);
3. la esposa juega box, el esposo juega (box | ballet, box | box).
Como en el caso de la versión simultánea de la batalla de los sexos, aquí se tienen de nuevo
múltiples equilibrios. Pero ahora la teoría de juegos ofrece una buena manera de seleccionar entre
los equilibrios. Considérese el tercer equilibrio de Nash. La estrategia del esposo (box | ballet, box
| box) involucra la amenaza implícita de que él elegirá box aun si su esposa elige ballet. Esta amenaza es suficiente para disuadirla de elegir ballet. Dado que ella escoge box en equilibrio, la estrategia del esposo le beneficiaría en 2, lo más que puede hacer en cualquier resultado. Por tanto el
resultado es un equilibrio de Nash. Pero la amenaza del esposo no es creíble; es decir, es una amenaza vacía. Si la esposa realmente eligiera primero ballet, él renunciaría a un beneficio de 1 eligiendo el box en vez del ballet. Es obvio por qué querría amenazar con elegir box, pero no es tan
obvio por qué esa amenaza debería ser creíble. De igual manera, la estrategia del esposo (ballet |
ballet, ballet | box) en el primer equilibrio de Nash también implica una amenaza vacía: que él
elegirá ballet si su esposa elige box. (Esta es una amenaza extraña porque él no gana nada haciéndola, es una amenaza vacía de todas formas.)
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
271
Otra manera de entender las amenazas vacías versus creíbles es usar el concepto de trayectoria
de equilibrio, la senda enlazada en la forma extensiva implicada por las estrategias de equilibrio.
En la figura 8.11, la cual reproduce la forma extensiva de la batalla de los sexos secuencial de la
figura 8.10, se usa una línea punteada para identificar la trayectoria de equilibrio del tercero de los
equilibrios de Nash enlistados. El tercer resultado es un equilibrio de Nash porque las estrategias
son racionales a lo largo de la trayectoria de equilibrio. Sin embargo, al seguir la elección de ballet
de la esposa —hecho que está fuera de la trayectoria de equilibrio— la estrategia del esposo es
irracional. El concepto de equilibrio perfecto de subjuegos en la sección siguiente eliminará el
juego irracional, tanto dentro como fuera de la trayectoria de equilibrio.
Equilibrio perfecto de subjuegos
La teoría de juegos ofrece un modo formal de seleccionar los equilibrios de Nash razonables en
los juegos secuenciales, usando el concepto de equilibrio perfecto de subjuegos. El equilibrio perfecto de subjuegos es un refinamiento que elimina amenazas vacías y requiere que las estrategias
sean racionales aun para contingencias que no surgen en equilibrio.
Antes de definir formalmente el equilibrio perfecto de subjuegos necesitamos algunas definiciones preliminares. Un subjuego es una parte de la forma extensiva que comienza en un nodo de
decisión e incluye todo lo que se ramifica a la derecha de éste. Un subjuego apropiado es un subjuego que comienza en un nodo de decisión no unido a otro en un conjunto de información.
Conceptualmente esto significa que el primer jugador en moverse en un subjuego apropiado
conoce las acciones ejecutadas por otros hasta ese punto. Ver qué es un subjuego apropiado es más
fácil que definirlo con palabras. La figura 8.12 muestra las formas extensivas de las versiones
simultánea y secuencial de la batalla de los sexos con cuadros trazados alrededor de los subjuegos
FIGURA 8.11
Trayectoria de equilibrio.
En el tercero de los equilibrios de Nash enlistados para la batalla de los sexos secuencial, la esposa juega box
y el esposo (box | ballet, box | box), trazándose las ramas indicadas con líneas gruesas (tanto continuas
como punteadas). La línea punteada es la trayectoria de equilibrio; del resto del árbol se dice que está “fuera
de la trayectoria de equilibrio”.
2, 1
Ballet
2
Ballet
Box
Box
Ballet
0, 0
1
0, 0
2
Box
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
1, 2
8/23
272
Parte 3: Incertidumbre y estrategia
apropiados en cada una. La versión secuencial a) tiene tres subjuegos apropiados: el juego mismo
y dos subjuegos inferiores que comienzan en nodos de decisión en los que le corresponde al
esposo moverse. La versión simultánea b) sólo tiene un nodo de decisión —el nodo de más
arriba— no unido con ningún otro en un conjunto de información. De ahí que esta versión sólo
tenga un subjuego: el juego entero mismo.
DEFINICIÓN
Equilibrio perfecto de subjuegos. Un equilibrio perfecto de subjuegos es un perfil de estrategias (s*1,
s*2,…, s*n) que es un equilibrio de Nash en todos los subjuegos apropiados.
Un equilibrio perfecto de subjuegos es siempre un equilibrio de Nash. Esto es así porque el
juego entero es un subjuego apropiado en sí mismo; por tanto, un equilibrio perfecto de subjuegos
debe ser un equilibrio de Nash para todo el juego. En la versión simultánea de la batalla de los
sexos no hay más que decir porque no hay más subjuego que el juego entero mismo.
En la versión secuencial el equilibrio perfecto de subjuegos tiene más que ofrecer. Las estrategias deben formar no sólo un equilibrio de Nash en todo el juego; también deben formar
equilibrios de Nash en los dos subjuegos apropiados que parten de los puntos de decisión en los
que el esposo se mueve. Estos subjuegos son problemas de decisión simples, así que es fácil calcu-
FIGURA 8.12
Subjuegos apropiados en
la batalla de los sexos.
La versión secuencial en a) tiene tres subjuegos apropiados, llamados A, B y C. La versión simultánea en
b) sólo tiene un subjuego apropiado: el juego entero mismo, llamado D.
A
2, 1
B
D
2, 1
Ballet
Ballet
2
2
Ballet
Ballet
Box
Box
0, 0
0, 0
1
1
C
Box
Ballet
0, 0
Box
Ballet
0, 0
2
2
Box
Box
1, 2
a) Secuencial
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
b) Simultánea
23.08.2019
1, 2
8/23
Capítulo 8: Teoría de juegos
273
lar los equilibrios de Nash correspondientes. Para el subjuego B, que comienza en el nodo de
decisión del esposo que sigue a la elección de ballet de su esposa, él tiene una decisión simple
entre ballet (que le rinde un beneficio de 1) y box (que le rinde un beneficio de 0). El equilibrio
de Nash en este subjuego simple de decisión es que el esposo elija ballet. Para el otro subjuego,
C, él tiene una decisión simple entre ballet, que le rinde 0, y box, que le rinde 2. El equilibrio de
Nash en este subjuego simple de decisión es que él elija box. Por tanto, el esposo sólo tiene una
estrategia que puede ser parte de un equilibrio perfecto de subjuegos: (ballet | ballet, box | box).
Cualquier otra estrategia le haría jugar algo que no es un equilibrio de Nash para un subjuego
apropiado. Para volver a los tres equilibrios de Nash enumerados, sólo el segundo es un subjuego perfecto; el primero y el tercero, no. Por ejemplo, el tercer equilibrio, en el que el esposo
siempre va al box, se descarta como un equilibrio perfecto de subjuegos porque la estrategia del
esposo (box | box) no es un equilibrio de Nash en el subjuego apropiado B. Por tanto, el equilibrio perfecto de subjuegos elimina la amenaza vacía (de ir siempre al box) que ya nos había
incomodado.
En general, el equilibrio perfecto de subjuegos descarta cualquier tipo de amenaza vacía en un
juego secuencial. En efecto, el equilibrio de Nash requiere que el comportamiento sea racional
sólo en la trayectoria de equilibrio. Los jugadores pueden elegir acciones potencialmente irracionales en otras partes de la forma extensiva. En particular, un jugador puede amenazar con dañar
a ambos para disuadir al otro de elegir ciertas acciones. El equilibrio perfecto de subjuegos
requiere comportamiento racional tanto dentro como fuera de la trayectoria de equilibrio. Las
amenazas de jugar irracionalmente —es decir, amenazas de elegir algo diferente de una mejor
respuesta propia— se descartan por vacías.
Inducción hacia atrás
Nuestro método para despejar el equilibrio en la batalla de los sexos secuencial fue hallar todos
los equilibrios de Nash, usando la forma normal, y buscar después entre ellos el equilibrio perfecto de subjuegos. Un atajo para encontrar directamente el equilibrio perfecto de subjuegos es
usar la inducción hacia atrás, el proceso de despejar el equilibrio trabajando hacia atrás, del final
al principio del juego. La inducción hacia atrás opera como sigue. Identifica todos los subjuegos
en la parte inferior de la forma extensiva. Encuentra los equilibrios de Nash en esos subjuegos.
Reemplaza los (potencialmente complicados) subjuegos por las acciones y beneficios que resultan
de jugar el equilibrio de Nash en esos subjuegos. Sube después al siguiente nivel de subjuegos y
repite el procedimiento.
La figura 8.13 ilustra el uso de la inducción hacia atrás en la batalla de los sexos secuencial.
Primero se calculan los equilibrios de Nash de los subjuegos de más abajo en los nodos de decisión del esposo. En el subjuego que sigue a la elección de ballet de su esposa, él escogería el
ballet, lo que da beneficios de 2 a ella y de 1 a él. En el subjuego que sigue a la elección de box
de su esposa, él elegiría box, lo que da beneficios de 1 a ella y de 2 a él. Luego, sustituye las
estrategias de equilibrio del esposo por los subjuegos mismos. El juego resultante es un problema de decisión simple para la esposa (representado en el panel inferior de la figura): una
decisión entre ballet, que le daría a ella un beneficio de 2, y box, que le daría un beneficio de 1.
El equilibrio de Nash de este juego es que ella elija la acción con el beneficio más alto, ballet. En
suma, la inducción hacia atrás nos permite saltar directamente el equilibrio perfecto de subjuegos en el que la esposa elige ballet y el esposo elige (ballet | ballet, box | box), eludiendo los
demás equilibrios de Nash.
La inducción hacia atrás es particularmente útil en juegos que contienen muchas rondas de
juego secuencial. Al añadirse rondas pronto se vuelve demasiado difícil despejar todos los equilibrios de Nash y determinar después cuáles son equilibrios perfectos del subjuego. Con la inducción hacia atrás, una ronda adicional se resuelve añadiendo simplemente otra iteración del procedimiento.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
274
Parte 3: Incertidumbre y estrategia
FIGURA 8.13
Aplicación de la
inducción hacia atrás.
Los últimos subjuegos (donde se mueve el jugador 2) son reemplazados por los equilibrios de Nash en
esos subjuegos. En el juego simple que resulta a la derecha es posible despejar la acción de equilibrio del
jugador 1.
2, 1
Ballet
Juega 2
ballet | ballet
beneficio 2, 1
2
Box
Ballet
Ballet
0, 0
1
1
Ballet
Box
0, 0
Box
2
Juega 2
box | box
beneficio 1, 2
Box
1, 2
JUEGOS REPETIDOS
En los juegos examinados hasta aquí cada jugador toma una decisión y el juego termina. En
muchas situaciones reales, sin embargo, los jugadores juegan el mismo juego una y otra vez. Por
ejemplo, los jugadores del dilema del prisionero pueden prever cometer crímenes futuros y, por
tanto, jugar juntos futuros dilemas del prisionero. Las gasolineras ubicadas una frente a la otra, al
fijar sus precios cada mañana, en realidad juegan diariamente un nuevo juego de precios. El juego
constitutivo simple (como el dilema del prisionero o el juego de fijación de precio a la gasolina)
que se juega repetidamente se llama juego en etapas. Como se vio en el dilema del prisionero, el
equilibrio en una jugada del juego en etapas puede ser peor para todos los jugadores que otro
resultado más cooperativo. La repetida ejecución del juego en etapas abre la posibilidad de cooperación en equilibrio. Los jugadores pueden adoptar estrategias de gatillo para seguir cooperando
mientras lo hayan hecho hasta ese punto, pero también para volver a jugar el equilibrio de Nash
si alguien se desvía de la cooperación. Investigaremos las condiciones en las cuales las estrategias
de gatillo funcionan para incrementar los beneficios de los jugadores. Como es normal en la teoría de los juegos, nos centraremos en los equilibrios perfectos del subjuego de los juegos repetidos.
Juegos de repetición finita
En el caso de muchos juegos en etapas, repetirlos un número finito y conocido de veces no incrementa la posibilidad de cooperación. Para ver concretamente esta cuestión supongamos que el
dilema del prisionero se jugara repetidamente durante t periodos. Usemos la inducción hacia atrás
para despejar el equilibrio perfecto de subjuegos. El subjuego de más abajo es el juego en etapas del
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
275
dilema del prisionero jugado en el periodo t. Independientemente de lo que haya ocurrido antes el
equilibrio de Nash en este subjuego es que ambos delaten. Retrocediendo en el juego al periodo
t – 1 se descartan las estrategias de gatillo que condicionan la jugada del periodo t a lo que ocurra
en el periodo t – 1. Aunque un jugador podría querer prometer que jugará cooperativamente en
el periodo t para premiar así al otro por jugar cooperativamente en el periodo t – 1, acabamos
de ver que nada de lo ocurrido en el periodo t – 1 afecta lo que ocurre subsecuentemente, porque
ambos jugadores delatan en el periodo t pase lo que pase. Es como si el periodo t – 1 fuera el
último, y el equilibrio de Nash de este subjuego fuera otra vez que ambos delaten. Trabajando
hacia atrás de esta manera vemos que los jugadores delatarán en cada periodo; es decir, los jugadores simplemente repetirán t veces el equilibrio de Nash del juego en etapas.
Reinhard Selten, ganador del Premio Nobel de Economía por sus contribuciones a la teoría de
juegos, demostró que esta lógica es general: para cualquier juego en etapas con un equilibrio de Nash
único, el equilibrio perfecto de subjuegos único del juego de repetición finita supone jugar el equilibrio de Nash en cada periodo.7
Si el juego en etapas tiene múltiples equilibrios de Nash, tal vez sea posible alcanzar cierta
cooperación en un juego de repetición finita. Los jugadores pueden usar estrategias de gatillo,
manteniendo la cooperación en periodos tempranos en un resultado que no es un equilibrio del
juego en etapas con la amenaza de jugar en periodos posteriores el equilibrio de Nash que produce un resultado peor para el jugador que se desvía de la cooperación.8 Pero en lugar de entrar
en detalles de los juegos de repetición finita pasemos a los juegos de repetición infinita, que
amplían enormemente la posibilidad de cooperación.
Juegos de repetición infinita
En el caso de los juegos de repetición finita el teorema tradicional se aplica sólo si el juego en
etapas tiene múltiples equilibrios. Si, como en el dilema del prisionero, el juego en etapas sólo
tiene un equilibrio de Nash el resultado de Selten indica que el juego de repetición finita sólo tiene
un equilibrio perfecto de subjuegos: repetir el equilibrio de Nash del juego en etapas en cada
periodo. La inducción hacia atrás a patir del último periodo t descarta cualquier otro resultado.
Sin embargo, en el caso de los juegos de repetición infinita no hay definido un periodo final t
en el cual iniciar la inducción hacia atrás. Los resultados que implican cooperación no necesariamente terminan desvaneciéndose. En algunas condiciones puede ocurrir lo contrario al grado de
que, en esencia, cualquier cosa es posible en el equilibrio del juego de repetición infinita. Este
resultado también se conoce como teorema tradicional porque formaba parte del “saber tradicional” de la teoría de juegos antes de que alguien se tomara la molestia de demostrarlo formalmente.
Una dificultad de los juegos de repetición infinita implica sumar beneficios entre periodos. Un
flujo infinito de beneficios bajos se suma hasta el infinito igual que un flujo infinito de beneficios
altos. ¿Cómo clasificar ambos flujos? Sortearemos este problema con la ayuda del descuento. Sea el factor de descuento (del que se tratará en el apéndice del capítulo 17) que mide cuánto valdría
una unidad de beneficios si se le recibiera en un periodo futuro en lugar de hoy. En el capítulo 17
se demostrará que se relaciona inversamente con la tasa de interés.9 Si la tasa de interés es alta, un
individuo recibirá hoy un pago mucho mayor que en el periodo siguiente porque invertir el pago
de hoy proporcionaría un rendimiento principal más un gran pago de intereses en el periodo
siguiente. Además de la tasa de interés, también puede incorporar incertidumbre acerca de si el
juego continuará en periodos futuros. Cuanto mayor sea la probabilidad de que el juego termine
7
R. Selten, “A Simple Model of Imperfect Competition, Where 4 Are Few and 6 Are Many”, International Journal of Game Theory,
núm. 2 (1973), pp. 141-201.
8
J. P. Benoit y V. Krishna, “Finitely Repeated Games”, Econometrica, núm. 53 (1985), pp. 890-940.
9
Hay que tener cuidado con la sutil diferencia entre las fórmulas del valor presente del flujo de una anualidad usadas aquí y las del
apéndice del capítulo 17. Los pagos llegan al final del periodo y no al principio como se supone aquí. Por tanto, aquí el valor presente de un pago de $1 por periodo a partir de este momento es
$1 þ $1 d þ $1 d2 þ $1 d3 þ ::: ¼
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
$1
:
1d
8/23
276
Parte 3: Incertidumbre y estrategia
después del periodo corriente, menor será el rendimiento esperado de juegos en etapas que podrían
no jugarse en realidad.
Factorizar una probabilidad de que el juego repetido termine después de cada periodo vuelve
más creíble el marco de un juego de repetición infinita. El aspecto crucial de un juego de repetición infinita no es que dure para siempre, sino que su final sea indeterminado. Interpretado de
esta manera, hay un sentido en el que los juegos de repetición infinita son más realistas que los
juegos de repetición finita con t grande. Supongamos que es de esperar que dos gasolineras vecinas jueguen un juego de precios cada día hasta que los automóviles eléctricos reemplacen a los
que funcionan con gasolina. Es improbable que las gasolineras sepan que los autos eléctricos llegarán en exactamente t 2 000 días. En términos más realistas, las gasolineras estarán inseguras
acerca del fin de los autos que funcionan con gasolina; por tanto, el fin de su juego de precios es
indeterminado.
Los jugadores pueden tratar de mantener la cooperación usando estrategias de gatillo. Las
estrategias de gatillo harán que sigan cooperando mientras nadie se desvíe; la desviación provocará algún tipo de castigo. La cuestión clave para determinar si las estrategias de gatillo “funcionan” es si el castigo puede ser tan severo para disuadir la desviación en primer término.
Supongamos que ambos jugadores usan la siguiente estrategia de gatillo específica en el dilema
del prisionero: sigue callando si nadie se desvía; delata siempre después si alguien se ha desviado
para delatar en el pasado. Para demostrar que esta estrategia de gatillo forma un equilibrio perfecto de subjuegos debemos comprobar que ningún jugador podría beneficiarse de una desviación. A lo largo de la trayectoria de equilibrio ambos jugadores callan en cada periodo; esto proporciona a cada uno un beneficio de 2 en cada periodo, para un valor presente descontado de
V eq ¼ 2 þ 2d þ 2d2 þ 2d3 þ ¼ 2ð1 þ d þ d2 þ d3 þ Þ
2
:
¼
1d
(8.19)
Un jugador que se desvía delatando obtiene 3 en ese periodo, pero después ambos jugadores delatan en cada periodo subsecuente, obteniendo cada cual 1 por periodo para un beneficio presente
descontado total de
V dev ¼ 3 þ ð1ÞðdÞ þ ð1Þðd2 Þ þ ð1Þðd3 Þ þ ¼ 3 þ dð1 þ d þ d2 þ Þ
d
:
¼3þ
1d
Las estrategias de gatillo forman un equilibrio perfecto de subjuegos si Veq
implica que
2
1d
3þ
d
:
1d
(8.20)
Vdev, lo que
(8.21)
Después de multiplicar por 1 y reordenar, se obtiene 1/2. En otras palabras, los jugadores
hallarán deseable el juego cooperativo continuo siempre y cuando no descuenten muy altamente
beneficios futuros de esa cooperación. Si 1/2, ninguna cooperación es posible en el dilema del
prisionero de repetición infinita; el único equilibrio perfecto de subjuegos implica delatar en cada
periodo.
La estrategia de gatillo, que ya hemos considerado, hace que los jugadores regresen al equilibrio de Nash del juego en etapas de delatar para siempre en cada periodo. Esta estrategia, que
implica el castigo más riguroso posible a la desviación, se llama estrategia siniestra. Castigos
menos rigurosos incluyen la así llamada estrategia ojo por ojo que supone una sola ronda de castigo por hacer trampa. Como la estrategia siniestra implica el castigo más riguroso posible induce
cooperación para la más grande gama de casos (el menor valor de ) de cualquier estrategia. Los
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
277
castigos severos funcionan bien porque si los jugadores logran cooperar nunca experimentan las
pérdidas del castigo en equilibrio.10
El factor de descuento es crucial para determinar si las estrategias de gatillo pueden mantener la cooperación en el dilema del prisionero o, en realidad, en cualquier juego en etapas. Conforme se aproxima a 1 los castigos de la estrategia siniestra se vuelven infinitamente rigurosos
porque implican un flujo interminable de pérdidas no descontadas. Los castigos infinitos pueden
usarse para sostener una amplia variedad de resultados posibles. Esta es la lógica detrás del teorema tradicional de los juegos de repetición infinita. Tómese cualquier beneficio de un juego en
etapas para un jugador entre uno en el equilibrio de Nash y el más alto en cualquier parte de la
matriz de beneficios. Sea V el valor presente descontado del flujo infinito de este beneficio. El
teorema tradicional establece que el jugador puede obtener V en algún equilibrio perfecto de
subjuegos para suficientemente cerca de 1.11
INFORMACIÓN INCOMPLETA
En los juegos estudiados hasta aquí los jugadores sabían todo lo que había que saber sobre la
organización del juego, incluidas las series de estrategias y beneficios de los demás. Las cosas se
complican, y quizá se ponen más interesantes, si algunos jugadores tienen información sobre el
juego que otros no. El póquer sería diferente si todas las manos se jugaran exhibiendo las cartas.
Pero jugarlo es divertido precisamente porque sabes lo que tienes en la mano, no lo que los demás
tienen en las suyas. La información incompleta aparece en muchos otros contextos reales aparte
de los juegos de mesa. Un equipo deportivo podría tratar de ocultarles la lesión de una de sus
estrellas a sus futuros adversarios para impedirles explotar esa debilidad. Las tecnologías de producción de las empresas pueden ser secretos comerciales, así que las compañías podrían no saber
si enfrentan competidores eficientes o débiles. En esta sección (y en las dos siguientes) se presentarán las herramientas necesarias para analizar juegos de información incompleta. El análisis
integra el material de la teoría de juegos que hemos desarrollado hasta aquí, en este capítulo, con
el material sobre incertidumbre e información del capítulo anterior.
Los juegos de información incompleta pueden complicarse rápidamente. Los jugadores que
carecen de información completa sobre el juego intentarán usar lo que saben para hacer inferencias sobre lo que no. El proceso de inferencia puede ser complejo. En el póquer, por ejemplo,
saber lo que tienes en la mano puede decirte algo sobre lo que está en las de los demás. Un jugador
con dos ases sabe que es menos probable que los demás tengan ases, porque dos de los cuatro no
están disponibles. Información sobre las manos de los demás también puede proceder de la magnitud de sus apuestas o de sus expresiones faciales (aunque, desde luego, una apuesta grande
puede ser un engaño, y una expresión facial puede ser falsa). La teoría de la probabilidad brinda
una fórmula, llamada regla de Bayes, para hacer inferencias sobre información oculta. Nos encontraremos con la regla de Bayes en una sección posterior. La relevancia de la regla de Bayes en los
juegos de información incompleta ha llevado a llamarlos juegos bayesianos.
Para limitar la complejidad del análisis nos concentraremos en el marco más simple posible. Nos
ocuparemos de un juego de dos jugadores en el que uno de ellos (jugador 1) tiene información privada y el otro (jugador 2) no. El análisis de los juegos de información incompleta se dividirá en dos
secciones. La sección siguiente comienza con el caso simple en el que los jugadores se mueven en
10
El economista ganador del Premio Nobel, Gary Becker, introdujo un punto similar, el principio de la pena máxima al crimen.
Este principio sostiene que aun los delitos menores deben recibir castigos draconianos, capaces de disuadir el crimen con un gasto
mínimo en vigilancia. Los castigos no cuestan nada a la sociedad porque ningún crimen se comete en equilibrio, así que los castigos nunca tienen que ejecutarse. Véase G. Becker, “Crime and Punishment: An Economic Approach”, Journal of Political Economy,
núm. 76 (1968), pp. 169-217. Castigos menos severos pueden ser apropiados en situaciones que implican incertidumbre. Por
ejemplo, los ciudadanos podrían no estar seguros del código penal; la policía podría no estar segura de haber arrestado al culpable.
11
Una versión más efectiva del teorema tradicional fue probada por D. Fudenberg y E. Maskin (“The Folk Theorem in Repeated
Games with Discounting or with Incomplete Information”, Econometrica, núm. 54 (1986), pp. 533-556). Beneficios por debajo
incluso de los del equilibrio de Nash pueden ser generados por un equilibrio perfecto del subjuego, beneficios hasta el nivel minimax de los jugadores (el nivel más bajo al cual un jugador puede ser reducido por los demás jugadores que operan contra él).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
278
Parte 3: Incertidumbre y estrategia
forma simultánea. La sección subsiguiente analiza juegos en los que el jugador informado 1 se mueve
primero. Esos juegos, llamados juegos de señalamiento, son más complicados que los simultáneos
porque la acción del jugador 1 puede señalar algo sobre su información privada al jugador no informado 2. Introduciremos la regla de Bayes en ese momento para analizar la inferencia del jugador 2
sobre la información oculta del jugador 1 con base en las observaciones de la acción del jugador 1.
JUEGOS BAYESIANOS SIMULTÁNEOS
En esta sección se estudiará un juego de dos jugadores de movimientos simultáneos en el que el
jugador 1 tiene información privada, pero el jugador 2 no. (Se usará “él” para el jugador 1 y “ella”
para el jugador 2 para facilitar la exposición.) Se comenzará estudiando cómo modelizar la información privada.
Tipos de jugadores y creencias
John Harsanyi, quien recibió el Premio Nobel de Economía por su trabajo sobre juegos con información incompleta, ofreció una manera simple de modelizar información privada, introduciendo
características o tipos de jugadores.12 El jugador 1 puede ser de uno de los diversos tipos posibles,
denotado por t. El jugador 1 conoce su tipo. La jugadora 2 ignora t y debe decidir su estrategia con
base en creencias sobre t.
Formalmente el juego comienza en un nodo inicial, llamado nodo casual, en el que un valor tk
particular es extraído al azar para el tipo t del jugador 1 de un conjunto de tipos posibles T {t1,…, tk,…, tk}. Sea Pr(tk) la probabilidad de extraer el tipo particular tk. El jugador 1 ve qué tipo
se extrae. La jugadora 2 no ve la extracción y sólo conoce las probabilidades, usándolas para formar sus creencias sobre el tipo del jugador 1. Por tanto la probabilidad de que la jugadora 2
encuentre que el jugador 1 es de tipo tk es Pr(tk).
Puesto que el jugador 1 observa su tipo, antes de moverse, su estrategia puede condicionarse a
t. Condicionar a esta información puede ser un gran beneficio para un jugador. En el póquer, por
ejemplo, cuanto más fuerte sea la mano de un jugador, es más probable que éste gane el pozo y que
quiera apostar agresivamente. Sea s1(t) la estrategia del jugador 1 contingente de su tipo. Como la
jugadora 2 no observa t, su estrategia es simplemente la incondicional s2. Como en el caso de los
juegos de información completa, los beneficios de los jugadores dependen de las estrategias. En
los juegos bayesianos los beneficios también pueden depender de los tipos. Por tanto, escribimos
el beneficio del jugador 1 como u1(s1(t), s2, t) y el de la jugadora 2 como u2(s2, s1(t), t). Nótese que
t aparece en dos lugares en la función de beneficio de la jugadora 2. El tipo del jugador 1 también
tiene un efecto indirecto mediante su efecto en la estrategia del jugador 1 s1(t), que a su vez afecta
los beneficios de la jugadora 2. Dado que los beneficios de la jugadora 2 dependen de t en estas
dos maneras, sus creencias sobre t serán cruciales en el cálculo de su estrategia óptima.
La figura 8.14 da un ejemplo simple de un juego bayesiano simultáneo. Cada jugador elige una
de dos acciones. Todos los beneficios son conocidos salvo el beneficio del jugador 1 cuando 1 elige
U y 2 elige L. El beneficio del jugador 1 en el resultado (U, L) es identificado como su tipo, t. Hay
dos valores posibles para el tipo del jugador 1, t 6 y t 0, cada uno de los cuales ocurre con
igual probabilidad. El jugador 1 conoce su tipo antes de moverse. Las creencias de la jugadora 2
son que cada tipo tiene una probabilidad de 1/2. La forma extensiva se presenta en la figura 8.15.
Equilibrio de Bayes-Nash
Extender el equilibrio de Nash a los juegos bayesianos requiere dos pequeñas cuestiones de interpretación. Primero, recuérdese que el jugador 1 puede ejecutar una acción diferente para cada
uno de sus tipos. El equilibrio requiere que la estrategia del jugador 1 sea una mejor respuesta
12
J. Harsanyi, “Games with Incomplete Information Played by Bayesian Players”, Management Science, núm. 14 (1967-1968), pp.
159-182, 320-334, 486-502.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
FIGURA 8.14
279
t 6 con probabilidad de 1/2 y t 0 con probabilidad de 1/2.
Juego simple de
información incompleta.
Jugador 1
Jugadora 2
FIGURA 8.15
Forma extensiva del juego
simple de información
incompleta.
L
R
U
t, 2
0, 0
D
2, 0
2, 4
Esta figura traduce la figura 8.14 en un juego de forma extensiva. El nodo casual inicial está indicado por
un círculo en blanco. Los nodos de decisión de la jugadora 2 están en el mismo conjunto de información
porque ella no observa el tipo o acción del jugador 1 antes de moverse.
2
U
1
t=6
Pr = 1/2
D
2
2
t=0
Pr = 1/2
U
1
D
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
2
23.08.2019
L
6, 2
R
0, 0
L
2, 0
R
2, 4
L
0, 2
R
0, 0
L
2, 0
R
2, 4
8/23
280
Parte 3: Incertidumbre y estrategia
para todos y cada uno de sus tipos. Segundo, recuérdese que la jugadora 2 no sabe cuál es el tipo
del jugador 1. El equilibrio requiere que la estrategia de la jugadora 2 optimice un beneficio esperado, donde la expectativa se toma respecto a sus creencias sobre el tipo del jugador 1. Encontramos beneficios esperados en nuestro análisis de estrategias mixtas. Los cálculos implicados en la
estimación de la mejor respuesta a las estrategias puras de tipos diferentes de rivales en un juego
de información incompleta son similares a los implicados en la estimación de la mejor respuesta
a la estrategia mixta de un rival en un juego de información completa.
Interpretado de esta manera, el equilibrio de Nash en el marco de un juego bayesiano se llama
equilibrio de Bayes-Nash. A continuación se dará una definición formal del concepto para su consulta. Dado que la notación es muy densa, quizá sea más fácil pasar primero a los ejemplos 8.6 y
8.7, que ofrecen un esbozo de cómo despejar equilibrios en juegos bayesianos con los que podrías
toparte.
DEFINICIÓN
Equilibrio de Bayes-Nash. En un juego de dos jugadores de movimientos simultáneos en el que el jugador 1 tiene información privada, un equilibrio de Bayes-Nash es un perfil de estrategias (s*1(t), s*2) tal que
s*1(t) es una mejor respuesta a s*2 para cada tipo t 僆 T del jugador 1,
U1(s*1(t), s*2, t)
U1(s1, s*2, t)
para todas las s1 僆 S1,
(8.22)
y tal que s*2 es una mejor respuesta a s*1(t) dadas las creencias del jugador 2 Pr(tk) sobre los tipos del
jugador 1:
X
X
Prðt k ÞU 2 ðs2 , s1 ðt k Þ, t k Þ Prðt k ÞU 2 ðs02 , s1 ðt k Þ, t k Þ para todas las s02 2 S2 :
(8.23)
t k 2T
t k 2T
Puesto que la diferencia entre el equilibrio de Nash y el equilibrio de Bayes-Nash es sólo cuestión de interpretación, todos nuestros resultados previos para el equilibrio de Nash (incluida la
prueba de la existencia) se aplican también al equilibrio de Bayes-Nash.
EJEMPLO 8.6 Equilibrio de Bayes-Nash del juego de la figura 8.15
Para despejar el equilibrio de Bayes-Nash del juego de la figura 8.15, primero se despejan las mejores
respuestas del jugador informado (el jugador 1) para cada uno de sus tipos. Si el jugador 1 es de tipo
t 0, elegiría D en vez de U porque obtiene 0 jugando U y 2 jugando D independientemente de lo
que haga la jugadora 2. Si el jugador 1 es de tipo t 6, su mejor respuesta es U a la elección de L por
la jugadora 2 y D a su elección de R. Esto deja sólo dos posibles candidatos para un equilibrio en
estrategias puras:
1 juega ðUjt ¼ 6, Djt ¼ 0Þ y 2 juega L;
1 juega ðDjt ¼ 6, Djt ¼ 0Þ y 2 juega R:
El primer candidato no puede ser un equilibrio porque, dado que el jugador 1 ejecuta (U|t 6, D|t 0),
la jugadora 2 obtiene un beneficio esperado de 1 de ejecutar L. La jugadora 2 se beneficiaría de desviarse
a R, obteniendo un beneficio esperado de 2.
El segundo candidato es un equilibrio de Bayes-Nash. Dado que la jugadora 2 elige R, la mejor respuesta del jugador 1 es elegir D, lo que le brinda un beneficio de 2 en vez de 0 independientemente de su
tipo. Puesto que los dos tipos del jugador 1 eligen D, la mejor respuesta de la jugadora 2 es elegir R, lo que
le brinda un beneficio de 4 en vez de 0.
PREGUNTA: Si la probabilidad de que el jugador 1 sea de tipo t 6 es lo bastante alta, ¿el primer candidato puede ser un equilibrio de Bayes-Nash? De ser así, calcula la probabilidad de umbral.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
281
EJEMPLO 8.7 Tragedia de los comunes como juego bayesiano
Para un ejemplo de un juego bayesiano con acciones continuas, considérese la tragedia de los comunes
del ejemplo 8.5 pero supongamos ahora que el pastor 1 tiene información privada sobre su valor de pastoreo por oveja:
v1 ðq1 , q2 , tÞ ¼ t ðq1 þ q2 Þ,
(8.24)
donde el tipo del pastor 1 es t 130 (el tipo “alto”) con probabilidad de 2/3 y t 100 (el tipo “bajo”) con
probabilidad de 1/3. El valor del pastor 2 sigue siendo el mismo de la ecuación 8.11.
Para despejar el equilibrio de Bayes-Nash, primero se despejan las mejores respuestas del jugador
informado (pastor 1) para cada uno de sus tipos. Para cualquier tipo t y estrategia del rival q2, el problema
de optimización de valor del pastor 1 es
maxfq1 v1 ðq1 , q2 , tÞg ¼ maxfq1 ðt q1 q2 Þg:
q1
q1
(8.25)
La condición de primer orden para un óptimo es
t 2q1 q2 ¼ 0:
(8.26)
Reordenando y sustituyendo después los valores t 130 y t 100 se obtiene
q1H ¼ 65 q2
2
y q1L ¼ 50 q2
,
2
(8.27)
donde q1H es la cantidad para el tipo “alto” del pastor 1 (es decir, el tipo t 100) y q1L para el tipo “bajo”
(el tipo t 100).
Luego se despeja la mejor respuesta del pastor 2. El beneficio esperado del pastor 2 es
2
1
½q ð120 q1H q2 Þ þ ½q2 ð120 q1L q2 Þ ¼ q2 ð120 q1 q2 Þ,
3 2
3
donde
2
1
q1 ¼ q1H þ q1L :
3
3
(8.28)
(8.29)
Reordenar la condición de primer orden de la optimización de la ecuación 8.28 respecto a q2 da
q2 ¼ 60 q1
:
2
(8.30)
La sustitución de q1H y q1L de la ecuación 8.27 en la ecuación 8.29 y la posterior sustitución de la expresión resultante de q1 en la ecuación 8.30 produce
q2 ¼ 30 þ
q2
,
4
(8.31)
lo que implica que q*2 40. Sustituir q*2 40 en la ecuación 8.27 implica que q*1H 45 y q*1L 30.
La figura 8.16 describe gráficamente el equilibrio de Bayes-Nash. El pastor 2 imagina que juega contra un tipo promedio del pastor 1, cuya mejor respuesta promedio está dada por la línea punteada
gruesa. La intersección de esta mejor respuesta y la del pastor 2 en el punto B determinan la cantidad de
equilibrio del pastor 2, q*2 40. La mejor respuesta del tipo bajo (respuesta alta) del pastor 1 a q*2 40
está dada por el punto A (respuesta punto C). Para efectos comparativos, se muestran los equilibrios de
Nash de información completa cuando se sabe que el pastor 1 es del tipo bajo (punto A' ) o del tipo alto
(punto C' ).
PREGUNTAS: Supongamos que el pastor 1 es del tipo alto. ¿Cómo cambia el número de ovejas que cada
pastor apacienta cuando el juego pasa de información incompleta a completa (desplazándose del punto
C' a C)? ¿Qué ocurriría si el pastor 1 fuera del tipo bajo? ¿Qué tipo prefiere información completa y, por
tanto, desearía señalar su tipo? ¿Qué tipo prefiere información incompleta y por tanto querría ocultar su
tipo? En la siguiente sección se estudiará la posibilidad de que el jugador 1 señale su tipo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
282
Parte 3: Incertidumbre y estrategia
FIGURA 8.16 Equilibrio de la tragedia de los comunes bayesiano
Mejores respuestas para el pastor 2 y ambos tipos del pastor 1 se presentan como líneas gruesas continuas;
la mejor respuesta esperada percibida por 2 se presenta como una línea gruesa punteada. El equilibrio de
Bayes-Nash del juego de información incompleta está dado por los puntos A y C; los equilibrios de Nash
de los correspondientes juegos de información completa están dados por los puntos A' y C' .
q2
Mejor respuesta del tipo alto
Mejor respuesta del tipo bajo
40
A′
A
B
C
C′
Mejor respuesta de 2
0
q1
30
40 45
JUEGOS DE SEÑALAMIENTO
En esta sección pasaremos de los juegos de movimientos simultáneos de información privada
a los juegos secuenciales en los que el jugador informado, el jugador 1, emprende una acción
que es observable para la jugadora 2 antes de que la jugadora 2 se mueva. La acción del jugador
1 da información, una señal, que la jugadora 2 puede usar para poner al día sus creencias sobre
el tipo del jugador 1, alterando quizá la manera en que la jugadora 2 jugaría sin tener esa información. En el póquer, por ejemplo, la jugadora 2 puede interpretar un gran aumento del jugador 1 como señal de que tiene una buena mano, lo que tal vez conduzca a la jugadora 2 a
rendirse. Una empresa que considera si entrar o no a un mercado podría interpretar el bajo
precio de la empresa titular como una señal de que ésta es un productor de bajo costo y, por
tanto, un competidor fuerte, lo que quizá la disuadiría de entrar en ese mercado. Un título de
una universidad prestigiosa podría indicar que un solicitante de un puesto está altamente
calificado.
El análisis de los juegos de señalamiento es más complicado que el de los juegos simultáneos porque debe modelizarse cómo procesa la jugadora 2 la información contenida en la
señal del jugador 1 y cómo actualiza después sus creencias sobre el tipo del jugador 1. Para
fijar las ideas nos concentraremos en una aplicación concreta: una versión del modelo de
señalamiento en el mercado del empleo de Michael Spence, por el cual ganó el Premio Nobel
de Economía.13
13
M. Spence, “Job-Market Signaling”, Quarterly Journal of Economics, núm. 87 (1973), pp. 355-374.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
283
Señalamiento en el mercado de trabajo
El jugador 1 es un trabajador que puede ser de uno de dos tipos, altamente calificado (t H) o
escasamente calificado (t L). La jugadora 2 es una empresa que considera contratar al solicitante. Un trabajador escasamente calificado es completamente improductivo y no genera ingresos
para la empresa; un trabajador altamente calificado genera ingresos . Si el solicitante es contratado, la empresa debe pagar al trabajador w (pensemos que este salario ha sido fijado por la regulación gubernamental). Supongamos que w 0. Por tanto, la empresa desea contratar al
solicitante si, y sólo si está altamente calificado. Sin embargo, la empresa no puede observar la
calificación del solicitante; sólo puede observar los estudios previos del solicitante. Sea cH el costo
del tipo alto de obtener estudios y cL el costo del tipo bajo. Supongamos que cH cL, lo cual
implica que los estudios requieren menos esfuerzo para el solicitante altamente calificado que
para el escasamente calificado. Adoptamos el supuesto extremo de que los estudios no incrementan directamente la productividad del trabajador. El solicitante aún puede decidir obtener estudios, debido al valor de éstos como señal de aptitud para empleadores futuros.
La figura 8.17 muestra la forma extensiva. El jugador 1 observa su tipo al principio; la jugadora
2 sólo observa la acción del jugador 1 (señal de estudios) antes de moverse. Sean Pr(H) y Pr(L) las
creencias de la jugadora 2 antes de observar la señal de estudios del jugador 1 de que éste está alta
o escasamente calificado. Estas se llaman creencias previas del jugador 1. Observar la acción del
jugador 1 llevará a la jugadora 2 a revisar sus creencias para formar las que se llaman creencias
posteriores. Por ejemplo, la probabilidad de que el trabajador esté altamente calificado está condi-
FIGURA 8.17
Señalamiento en el
mercado de trabajo.
El jugador 1 (trabajador) observa su propio tipo. Entonces decide educarse (E) o no educarse (NE). Después
de observar la acción del jugador 1, la jugadora 2 (empresa) decide hacerle una oferta de trabajo (J) o no (NJ).
Los nodos en los conjuntos de información de la jugadora 2 se han etiquetado n1,…, n4 para referencia.
2
1
E
Pr(H)
E
Pr(L)
w − cH, π − w
n1
NJ
2
NE
J
n2
2
J
NJ
J
−cH, 0
w − cL, −w
−cL, 0
w, π − w
n3
NJ
1
NE
2
J
0, 0
w, −w
n4
NJ
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
0, 0
8/23
284
Parte 3: Incertidumbre y estrategia
cionada a que el trabajador haya obtenido estudios, Pr(H|E), y condicionada a que no los haya
obtenido Pr(H|NE).
Las creencias posteriores de la jugadora 2 se usan para calcular su mejor respuesta a la decisión
de estudios del jugador 1. Supongamos que la jugadora 2 ve que el jugador 1 elige E. Entonces, el
beneficio esperado de la jugadora 2 resultante de jugar J es
Pr(H|E)( w) Pr(L|E)(w) Pr(H|E) w,
(8.32)
donde el miembro izquierdo de la ecuación se desprende del hecho de que como L y H son los
únicos tipos, Pr(L|E) 1 – Pr(H|E). El beneficio de la jugadora 2 resultante de jugar NJ es 0. Para
determinar la mejor respuesta a E, la jugadora 2 compara el beneficio esperado en la ecuación
8.32 con 0. La mejor respuesta de la jugadora 2 es J si, y sólo si, Pr(H|E) w/.
La pregunta sigue siendo cómo calcular creencias posteriores como Pr(H|E). Los jugadores
racionales usan una fórmula estadística, la regla de Bayes, para revisar sus creencias previas a fin
de formar creencias posteriores basadas en la observación de una señal.
Regla de Bayes
La regla de Bayes da la fórmula siguiente para calcular la creencia posterior de la jugadora 2
Pr(H|E):14
PrðHjEÞ ¼
PrðEjHÞ PrðHÞ
:
PrðEjHÞ PrðHÞ þ PrðEjLÞ PrðLÞ
(8.33)
De igual forma, Pr(H|E) está dada por
PrðHjNEÞ ¼
PrðNEjHÞ PrðHÞ
:
PrðNEjHÞ PrðHÞ þ PrðNEjLÞ PrðLÞ
(8.34)
Dos clases de probabilidades aparecen en el miembro izquierdo de las ecuaciones 8.33 y 8.34:
• las creencias previas Pr(H) y Pr(L);
• las probabilidades condicionales Pr(E|H), Pr(NE|L)y así sucesivamente.
Las creencias previas están dadas en la especificación del juego por las probabilidades de las diferentes ramas del nodo aleatorio inicial. Las probabilidades condicionales Pr(E|H), Pr(NE|L), y así
sucesivamente están dadas por la estrategia de equilibrio del jugador 1. Por ejemplo, Pr(E|H) es
la probabilidad de que el jugador 1 juegue E, si es de tipo H; Pr(NE|L) es la probabilidad de que el
jugador 1 juegue NE, si es de tipo L, y así sucesivamente. Como lo resume el diagrama esquemático de la figura 8.18 la regla de Bayes puede concebirse como una “caja negra” que toma como
entradas las creencias previas y las estrategias, y da como salida las creencias que debemos saber
y que despejan un equilibrio del juego: las creencias posteriores del jugador 2.
14
La ecuación 8.33 puede derivarse de la definición de probabilidad condicional de la nota 25 del capítulo 2. (La ecuación 8.34
puede derivarse en forma similar.) Por definición,
PrðHjEÞ ¼
PrðH y EÞ
:
PrðEÞ
Invertir el orden de los dos eventos en la probabilidad condicional produce
PrðEjHÞ ¼
o, después de reordenar,
PrðH y EÞ
PrðHÞ
PrðH y EÞ ¼ PrðEjHÞ PrðHÞ:
La sustitución de la ecuación precedente en la primera ecuación incluida en esta nota da el numerador de la ecuación 8.33. El
denominador se desprende de él porque los eventos del jugador 1, siendo tipo H o L, son mutuamente excluyentes y conjuntamente exhaustivos, de tal manera que
PrðEÞ ¼ PrðE y HÞ þ PrðE y LÞ
¼ PrðEjHÞ PrðHÞ þ PrðEjLÞ PrðLÞ:
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
FIGURA 8.18
La regla de Bayes como
una caja negra.
285
La regla de Bayes es una fórmula para calcular las creencias posteriores del jugador 2, a partir de otras piezas
de información en el juego.
Entradas
Creencias previas
del jugador 2
Salida
Regla
de Bayes
Creencias
posteriores
del jugador 2
Estrategia
del jugador 1
Cuando el jugador 1 ejecuta una estrategia pura, la regla de Bayes suele dar un resultado simple.
Supongamos, por ejemplo, que Pr(E|H) 1 y Pr(E|L) 0 o, en otras palabras, que el jugador 1
obtiene estudios si, y sólo si está altamente calificado. Entonces la ecuación 8.33 implica que
PrðHjEÞ ¼
1 PrðHÞ
¼ 1:
1 PrðHÞ þ 0 PrðLÞ
(8.35)
Esto es, el jugador 2 cree que el jugador 1 debe estar altamente calificado si ve al jugador 1 elegir
E. Por otro lado, supongamos que Pr(E|H) Pr(E|L) 1; es decir, que el jugador 1 obtiene estudios independientemente de su tipo. Entonces, la ecuación 8.33 implica que
PrðHjEÞ ¼
1 PrðHÞ
¼ PrðHÞ,
1 PrðHÞ þ 1 PrðLÞ
(8.36)
porque Pr(H) + Pr(L) 1. Es decir, ver que el jugador 1 elige E no da información sobre el tipo
del jugador 1, así que la creencia posterior del jugador 2 es la misma que la anterior. Más generalmente, si el jugador 2 sigue la estrategia mixta Pr(E|H) p y Pr(E|L) q, la regla de Bayes
implica que
PrðHjEÞ ¼
p PrðHÞ
:
p PrðHÞ þ q PrðLÞ
(8.37)
Equilibrio perfecto bayesiano
En los juegos de información completa pasamos del equilibrio de Nash al refinamiento del equilibrio perfecto de subjuegos para descartar amenazas no creíbles en los juegos secuenciales. Por la
misma razón en los juegos de información incompleta pasaremos del equilibrio de Bayes-Nash al
refinamiento del equilibrio perfecto de Bayes.
El requerimiento de que los jugadores jueguen racionalmente en cada conjunto de información es similar al requerimiento del equilibro perfecto del subjuego de que el juego en cada sub-
DEFINICIÓN
Equilibrio perfecto de Bayes. Un equilibrio perfecto de Bayes consta de un perfil de estrategias y una
serie de creencias tales que
• en cada conjunto de información la estrategia del jugador que se mueve ahí maximiza su beneficio
esperado, donde la expectativa se toma respecto a sus creencias, y
• en cada conjunto de información, donde sea posible, las creencias del jugador que se mueve ahí se
forman usando la regla de Bayes (basada en las creencias previas y en las estrategias de otros jugadores).
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
286
Parte 3: Incertidumbre y estrategia
juego forme un equilibrio de Nash. El requerimiento de que los jugadores usen la regla de Bayes
para actualizar sus creencias garantiza que los jugadores incorporen la información obtenida de
observar el juego de otros en una forma racional.
El truco restante en la definición del equilibrio perfecto de Bayes es que la regla de Bayes sólo
debe usarse “donde sea posible”. La regla de Bayes es inútil después de un evento totalmente inesperado; en el contexto de un modelo de señalamiento, una acción que no es ejecutada en equilibrio por ningún tipo del jugador 1. Por ejemplo, si ni el tipo H ni el L eligen E en el juego de
señalamiento del mercado de trabajo, los denominadores de las ecuaciones 8.33 y 8.34 son iguales
a cero y la fracción es indefinida. Si la regla de Bayes da una respuesta indefinida, el equilibrio
perfecto de Bayes no impone restricciones a las creencias posteriores del jugador 2 y, por tanto,
pueden suponerse las creencias que se desee.
Como se vio en los juegos de información completa, los juegos de señalamiento pueden tener
múltiples equilibrios. La libertad para especificar cualesquier creencias cuando la regla de Bayes
da una respuesta indefinida puede sostener equilibrios perfectos de Bayes adicionales. Un análisis
sistemático de equilibrios múltiples se inicia dividiendo los equilibrios en tres clases: de separación, de unión e híbridos. Luego se buscan los equilibrios perfectos de Bayes dentro de cada clase.
En un equilibrio de separación cada tipo del jugador 1 elige una acción diferente. Por tanto, el
jugador 2 conoce con seguridad el tipo del jugador 1, después de observar la acción del jugador 1.
Las creencias posteriores procedentes de la regla de Bayes son todas ellas ceros y unos. En un
equilibrio de unión diferentes tipos del jugador 1 eligen la misma acción. Observar la acción del
jugador 1 no le proporciona al jugador 2 información sobre el tipo del jugador 1. Los equilibrios
de unión emergen cuando uno de los tipos del jugador 1 elige una acción que, de lo contrario,
sería subóptima para ocultar su información privada. En un equilibrio híbrido un tipo del jugador
1 sigue una estrategia estrictamente mixta; este se llama equilibrio híbrido porque la estrategia
mixta a veces resulta en que los tipos se separen y, a veces, en que se unan. El jugador 2 conoce un
poco sobre el tipo del jugador 1 (la regla de Bayes pule un poco las creencias del jugador 2), pero
no conoce con seguridad el tipo del jugador 1. El jugador 2 puede responder a la incertidumbre
siguiendo él mismo una estrategia mixta. Los tres ejemplos siguientes despejan las tres clases de
equilibrio en el juego de señalamiento del mercado de trabajo.
EJEMPLO 8.8 Equilibrio de separación en el juego de señalamiento del mercado de trabajo
Una buena suposición para un equilibrio de separación es que el trabajador altamente calificado señala
su tipo obteniendo estudios y el trabajador escasamente calificado, no. Dadas estas estrategias las creencias del jugador 2 deben ser Pr(H|E) Pr(L|NE) 1 y Pr(H|NE) Pr(L|E) 0, de acuerdo con la regla
de Bayes. Condicionado a estas creencias, si el jugador 2 observa que el jugador 1 obtiene estudios, el
jugador 2 sabe que aquél debe estar en el nodo n1, no en el nodo n2 en la figura 8.17. Su mejor respuesta
es ofrecer un empleo (J), dado el beneficio de w 0. Si el jugador 2 observa que el jugador 1 no
obtiene estudios, el jugador 2 sabe que aquél debe estar en el nodo n4, no en el nodo n3, y su mejor respuesta es no ofrecer un empleo (NJ), porque 0 w.
El último paso es retroceder y comprobar que el jugador 1 no querría desviarse de la estrategia de
separación (E|H, NE|L), dado que el jugador 2 juega (J|E, NJ|NE). El tipo H del jugador 1 consigue w cH
al obtener estudios en equilibrio. Si el tipo H se desvía y no obtiene estudios, consigue 0 porque el jugador
2 cree que el jugador 1 es del tipo L y no le ofrece un empleo. Para que el tipo H no prefiera desviarse, debe
ser el caso de que w cH 0. Pasemos ahora al tipo L del jugador 1. El tipo L consigue 0, de no obtener
estudios en equilibrio. Si el tipo L se desvía y obtiene estudios, consigue w cL porque el jugador 2 cree
que el jugador 1 es de tipo H y le ofrece un empleo. Para que el tipo L no prefiera desviarse, debe tenerse
w cL 0. Al juntar estas condiciones hay un equilibrio de separación en el que el trabajador obtiene
estudios si, y sólo si está altamente calificado y en el que la empresa ofrece un empleo sólo a solicitantes
con estudios si, y sólo si cH w cL.
Otro posible equilibrio de separación es que el jugador 1 obtenga estudios si, y sólo si está escasamente calificado. Este es un resultado raro —porque es de esperar que la educación sea una señal de alta
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
287
más que de baja calificación—, y por fortuna podemos descartarlo como un equilibrio perfecto de Bayes.
La mejor respuesta del jugador 2 sería ofrecer un empleo si, y sólo si el jugador 1 no obtuviera estudios.
El tipo L conseguiría cL por jugar E, y w por jugar NE, así que se desviaría a NE.
PREGUNTAS: ¿Por qué el trabajador a veces obtiene estudios aunque no eleve su nivel de calificación?
¿Existiría el equilibrio de separación si un trabajador escasamente calificado pudiera obtener estudios
más fácilmente que uno altamente calificado?
EJEMPLO 8.9 Equilibrios de unión en el juego de señalamiento del mercado de trabajo
Investiguemos un posible equilibrio de unión en el que ambos tipos del jugador 1 eligen E. Para que
el jugador 1 no se desvíe de elegir E, la estrategia del jugador 2 debe ser ofrecer un empleo si, y sólo
si el trabajador tiene estudios; es decir, (J|E, NJ|NE). Si el jugador 2 no ofrece empleos a trabajadores
con estudios, el jugador 1 también podría ahorrar el costo de obtener estudios y elegir NE. Si el jugador 2 ofrece empleos a trabajadores sin estudios, el jugador 1 elegirá de nuevo NE porque se ahorra
el costo de obtener estudios y aun así consigue el salario de la oferta de empleo.
Ahora investigaremos cuándo (J|E, NJ|NE) es una mejor respuesta para el jugador 2. Las creencias
posteriores del jugador 2 después de ver E son iguales a sus creencias previas en este equilibrio de unión.
El beneficio esperado del jugador 2 de elegir J es
PrðHjEÞðp wÞ þ PrðLjEÞðwÞ ¼ PrðHÞðp wÞ þ PrðLÞðwÞ
¼ PrðHÞp w:
(8.38)
Para que J sea una mejor respuesta a E, la ecuación 8.38 debe exceder al beneficio cero del jugador 2 de
elegir NJ lo cual, al reordenar, implica que Pr(H) w/. Las creencias posteriores del jugador 2 en los
nodos n3 y n4 no son precisadas por la regla de Bayes porque NE nunca se juega en equilibrio, así que ver
al jugador 1 jugar NE es un evento totalmente inesperado. El equilibrio perfecto de Bayes nos permite
especificar cualquier distribución de probabilidad que queramos para las creencias posteriores Pr(H|NE)
en el nodo n3 y Pr(L|NE) en el nodo n4. El beneficio del jugador 2 de elegir NJ es 0. Para que NJ sea una
mejor respuesta a NE, 0 debe exceder al beneficio esperado del jugador 2 por jugar J:
0 > PrðHjNEÞðp wÞ þ PrðLjNEÞðwÞ ¼ PrðHjNEÞp w,
(8.39)
donde el miembro derecho se desprende de que Pr(H|NE Pr(L|NE) 1. Reordenar produce Pr(H|NE)
w/.
En suma, para que haya un equilibrio de unión en el que ambos tipos del jugador 1 obtengan estudios
necesitamos Pr(H|NE) w/ Pr(H). La empresa tiene que ser optimista respecto a la proporción de
trabajadores calificados en la población: Pr(H) debe ser suficientemente alta; y pesimista respecto al nivel
de calificación de los trabajadores sin estudios: Pr(H|NE) debe ser suficientemente baja. En este equilibrio, el tipo L se une con el tipo H para impedir que el jugador 2 sepa algo sobre la calificación del trabajador a partir de la señal de la educación.
La otra posibilidad para un equilibrio de unión es que ambos tipos del jugador 1 elijan NE. Varios de
esos equilibrios dependen de qué se suponga sobre las creencias posteriores del jugador 2 fuera de equilibrio (es decir, de las creencias del jugador 2 después de observar al jugador 1 elegir E). El equilibrio
perfecto bayesiano no impone restricciones a estas creencias posteriores. En el problema 8.12 se te pedirá
buscar varios de esos equilibrios y se introducirá un refinamiento adicional del equilibrio perfecto de
Bayes (el criterio intuitivo) que ayuda a descartar creencias irrazonables fuera de equilibrio y, por tanto,
equilibrios inverosímiles.
PREGUNTAS: Vuelve al resultado de unión en el que ambos tipos del jugador 1 obtienen estudios. Considera las creencias posteriores del jugador 2 que se desprenden del evento inesperado de que un trabajador aparezca sin estudios. El equilibrio perfecto de Bayes nos deja en libertad de suponer lo que queramos sobre estas creencias posteriores. Supongamos que asumimos que la empresa no obtiene información
de la señal “no estudios”, y que, por tanto, mantiene sus opiniones previas. ¿El resultado de unión propuesto es un equilibrio? ¿Qué pasaría si supusiéramos que la empresa interpreta “no estudios” como una
mala señal de calificación, creyendo que el tipo del jugador 1 es seguramente L?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
288
Parte 3: Incertidumbre y estrategia
EJEMPLO 8.10 Equilibrios híbridos en el juego de señalamiento del mercado de trabajo
Un posible equilibrio híbrido es que el tipo H siempre obtenga estudios y el tipo L quede al azar, pretendiendo a veces ser un tipo alto mediante el hecho de obtener estudios. El tipo L juega al azar entre E y NE
con probabilidades de e y 1 – e. La estrategia del jugador 2 es ofrecer un empleo a un solicitante con estudios con probabilidad j y no ofrecer un empleo a un solicitante sin estudios.
Debemos despejar los valores de equilibrio de las estrategias mixtas e* y j* y las creencias posteriores
Pr(H|E) y Pr(H|NE) que son congruentes con el equilibrio perfecto de Bayes. Las creencias posteriores se
calculan usando la regla de Bayes:
PrðHjEÞ ¼
PrðHÞ
PrðHÞ
¼
PrðHÞ þ ePrðLÞ PrðHÞ þ e½1 PrðHÞ
(8.40)
y Pr(H|NE) 0.
Para que el tipo L del jugador 1 esté dispuesto a seguir una estrategia estrictamente mixta debe recibir
el mismo beneficio esperado de jugar E el cual es igual a jw cL dada la estrategia mixta del jugador 2,
que de jugar NE el cual es igual a 0 dado que el jugador 2 no ofrece un empleo a solicitantes sin estudios.
De ahí que jw cL 0 o, despejando j, j* cL/w.
El jugador 2 seguirá una estrategia estrictamente mixta (condicionada a observar E) sólo si obtiene el
mismo beneficio esperado de jugar J, el cual es igual a
PrðHjEÞðp wÞ þ PrðLjEÞðwÞ ¼ PrðHjEÞp w,
(8.41)
que de jugar NJ, el cual es igual a 0. Igualar la ecuación 8.41 a 0, sustituir Pr(H|E) de la ecuación 8.40 y
despejar e, da
e ¼
ðp wÞPrðHÞ
:
w½1 PrðHÞ
(8.42)
PREGUNTAS: Para completar nuestro análisis, en este equilibrio el tipo H del jugador 1 no puede preferir
desviarse de E, ¿cierto? De ser así, ¿puedes demostrarlo? ¿Cómo varía la probabilidad del tipo L de tratar
de “unirse” al tipo alto obteniendo estudios, con la creencia previa del jugador 2 de que el jugador 1 es del
tipo alto?
JUEGOS EXPERIMENTALES
La economía experimental es una rama reciente de investigación que explora lo bien que la
teoría económica se ajusta al comportamiento de sujetos experimentales en condiciones de
laboratorio. Los métodos son similares a los que se usan en la psicología experimental —a
menudo aplicados en campus que usan estudiantes como sujetos—, aunque los experimentos
en economía tienden a implicar incentivos en forma de pagos monetarios explícitos realizados
a los sujetos. La importancia de la economía experimental fue subrayada en 2002, cuando Vernon Smith recibió el Premio Nobel de Economía por su trabajo precursor en este campo. Un
área importante de este terreno es el uso de métodos experimentales para probar la teoría de
juegos.
Experimentos con el dilema del prisionero
Ha habido cientos de pruebas de si los jugadores delatan en el dilema del prisionero, tal como lo
predice el equilibrio de Nash, o si producen el resultado cooperativo de callar. En un experimento
los sujetos practicaron el juego 20 veces, cada vez enfrentando a un jugador con un adversario
anónimo diferente para evitar los efectos de los juegos repetidos. El juego convergió en el equilibrio de Nash a medida que los sujetos obtenían experiencia en él. Los jugadores produjeron la
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
289
acción cooperativa en 43% de los casos en las cinco primeras rondas, proporción que se redujo a
sólo 20% en las cinco últimas rondas.15
Como suele suceder en los experimentos el comportamiento de los sujetos tendió a ser bullicioso. Aunque 80% de las decisiones fueron congruentes con el juego del equilibrio de Nash para
el final del experimento, 20% de estas fueron anómalas de cualquier manera. Aun si el juego experimental es más o menos congruente con las predicciones de la teoría, es raro que sea enteramente
congruente.
Experimentos con el juego del ultimátum
La economía experimental también ha hecho pruebas para ver si el equilibrio perfecto de subjuegos
es una buena predicción del comportamiento en juegos secuenciales. En un juego secuencial
ampliamente estudiado, el juego del ultimátum, el experimentador les proporciona un recipiente
con dinero a dos jugadores. El primero en moverse (proponedor) sugiere una división de ese recipiente al otro. El segundo en moverse (respondedor) decide si acepta la oferta, por tanto, los jugadores reciben la cantidad de dinero indicado; o rechazarla en cuyo caso ningún jugador recibe nada.
En el equilibrio perfecto de subjuegos el proponedor ofrece una parte mínima del recipiente la cual
es aceptada por el respondedor. Esto puede verse aplicando inducción hacia atrás: el respondedor debería aceptar cualquier división positiva, por reducida que sea; sabiendo esto el proponedor debería ofrecer al respondedor apenas una mínima parte.
En experimentos la división tiende a ser mucho más pareja que en el equilibrio perfecto de
subjuegos.16 La oferta más común es una división de 50-50. Los respondedores tienden a rechazar ofertas que les den menos de 30% del recipiente. Este resultado se observa si el recipiente es
de hasta 100 dólares, de manera que rechazar una oferta de 30% significa declinar 30 dólares.
Algunos economistas han sugerido que el dinero que reciben los jugadores podría no ser una
medida verdadera de sus beneficios. Quizá les importen otros factores como la justicia y obtengan, por tanto, un beneficio de una división más equitativa del recipiente. Aun si un proponedor no se interesa directamente en la justicia, el temor de que el respondedor sí lo haga y
rechace, por ende, una oferta inequitativa puede llevar al proponedor a sugerir una división
pareja.
La diferencia del comportamiento experimental respecto a las predicciones de la teoría de
juegos fue demasiado sistemática en el juego del ultimátum como para atribuírsele a un juego
bullicioso, lo que ha llevado a algunos teóricos de los juegos a replantear la teoría y añadir una
consideración explícita de la justicia.17
Experimentos con el juego del dictador
Para probar si los jugadores se interesan directamente en la justicia o si actúan por temor al resentimiento del otro jugador los investigadores experimentaron con un juego parecido, el juego del
dictador. En el juego del dictador el proponedor decide una división del recipiente, y esta división
es implementada sin intervención del respondedor. Los proponedores tienden a ofrecer una división menos pareja que en el juego del ultimátum, pero aun así ofrecen al respondedor parte del
recipiente, lo cual sugiere que los primeros tienen algún interés residual en la justicia. Los detalles
del diseño experimental son cruciales, sin embargo, como lo demostró un experimento ingenioso.18 Este experimento fue diseñado de tal manera que el experimentador nunca supiera qué
15
R. Cooper, D. V. DeJong, R. Forsythe y T. W. Ross, “Cooperation Without Reputation: Experimental Evidence form Prisoner’s
Dilemma Games”, Games and Economic Behavior (febrero de 1996), pp. 187-218.
16
Para una revisión de experimentos del juego del ultimátum y un tratamiento del libro de texto de la economía experimental más
en general, véase D. D. Davis y C. A. Holt, Experimental Economics (Princeton University Press, Princeton, 1993).
17
Véase, por ejemplo, E. Fehr y K. M. Schmidt, “A Theory of Fairness, Competition, and Cooperation”, Quarterly Journal of Economics (agosto de 1999), pp. 817-868.
18
E. Hoffman, K. McCabe, K. Shachat y V. Smith, “Preferences, Property Rights, and Anonimity in Bargaining Games”, Games and
Economic Behavior (noviembre de 1994), pp. 346-380.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
290
Parte 3: Incertidumbre y estrategia
proponedores habían hecho cuáles ofertas. Con este elemento de anonimato los proponedores
casi nunca dieron una división equitativa a los respondedores, y en realidad tomaron todo el recipiente para sí mismos en dos tercios de los casos. Los proponedores parecen interesarse más por
parecer justos ante el experimentador que en serlo realmente.
JUEGOS EVOLUTIVOS Y APRENDIZAJE
La frontera de la investigación en la teoría de juegos concierne a si los jugadores terminan por
jugar un equilibrio de Nash y cómo. Jugadores hiperracionales pueden deducir las estrategias
de los demás y decidirse al instante por el equilibrio de Nash. ¿Cómo pueden coordinar instantáneamente un solo resultado cuando hay múltiples equilibrios de Nash? ¿Qué resultado decidirían jugadores reales para quienes las deducciones hiperracionales podrían ser demasiado
complejas?
Los teóricos de los juegos han tratado de modelizar el proceso dinámico por el cual emerge un
equilibrio a largo plazo del juego de una gran población de agentes que se conocen al azar y que
practican un juego en pares. Los teóricos de los juegos analizan si el juego converge en un equilibrio de Nash o en algún otro resultado, y cuánto tiempo tarda esa convergencia. Dos modelos que
establecen supuestos variables sobre el nivel de racionalidad de los jugadores han sido los más
ampliamente estudiados: un modelo evolutivo y un modelo de aprendizaje.
En el modelo evolutivo los jugadores no toman decisiones racionales; en cambio, juegan a la
manera en que están genéticamente programados. Cuanto más exitosa es la estrategia de un jugador en la población, más apto es el jugador y más probabilidades tiene de sobrevivir para transmitir sus genes a las generaciones futuras y, por tanto, más probabilidades tiene también de difundirse la estrategia en la población.
Los modelos evolutivos fueron inicialmente desarrollados por John Maynard Smith y otros
biólogos para explicar la evolución de conductas animales como el coraje con que pelea un león
por una pareja, o una hormiga para defender su colonia. Aunque podría ser un poco excesivo
aplicar modelos evolutivos a seres humanos, los modelos evolutivos brindan una forma conveniente de analizar la dinámica de la población y pueden tener repercusiones directas en el modo
en que se transmiten las convenciones sociales, quizá a través de la cultura.
En un modelo de aprendizaje los jugadores nuevamente son reunidos al azar con otros de una
población grande. Usan sus experiencias de beneficios de juegos pasados para enseñar cómo
juegan los otros y cuál es la mejor forma en que ellos pueden responder. Suele suponerse que los
jugadores poseen un grado de racionalidad en cuanto que pueden elegir una mejor respuesta
estática dadas sus creencias, pueden hacer alguna experimentación y pondrán al día sus creencias de acuerdo con alguna regla razonable. Los jugadores no son plenamente racionales en
cuanto que no distorsionan sus estrategias para afectar el aprendizaje de otros y, por tanto, el
juego futuro.
Los teóricos de los juegos han investigado si las estrategias de aprendizaje más o menos sofisticadas convergen en forma más o menos rápida en un equilibrio de Nash. La investigación actual
intenta integrar la teoría con el estudio experimental, tratando de identificar los algoritmos específicos que usan los sujetos reales cuando aprenden a jugar juegos.
Resumen
Este capítulo brindó una manera estructurada de pensar en situaciones estratégicas. Nos centramos en el concepto de la solución
más importante usado en la teoría de los juegos, el equilibrio de
Nash. Luego pasamos a conceptos de solución más refinados
de uso estándar en la teoría de los juegos en marcos más compli-
cados (con movimientos secuenciales e información incompleta).
Algunos de los resultados principales son los siguientes.
• Todos los juegos tienen los mismos componentes básicos: jugadores, estrategias, beneficios y una estructura de información.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
cios más altos que si el juego en etapas se jugara una vez. Si los
jugadores son lo bastante pacientes en un juego de repetición
infinita, se aplica un teorema tradicional, lo cual implica que,
en esencia, cualesquier beneficios son posibles en el juego
repetido.
• Los juegos pueden escribirse en forma normal (proporcionando una matriz de beneficios o funciones de beneficios) o en
forma extensiva (proporcionando un árbol del juego).
• Las estrategias pueden ser acciones simples, planes más complicados contingentes de acciones de otros o incluso distribuciones
de probabilidad sobre acciones simples (estrategias mixtas).
• Un equilibrio de Nash es una serie de estrategias, una para
cada jugador, que son mejores respuestas mutuas. En otras
palabras, la estrategia de un jugador en un equilibrio de Nash
es óptima dado que todos los demás juegan sus estrategias de
equilibrio.
• Un equilibrio de Nash siempre existe en juegos finitos (en
estrategias mixtas si no es que puras).
• El equilibrio perfecto de subjuego es un refinamiento del equilibrio de Nash que ayuda a descartar equilibrios en juegos
secuenciales que implican amenazas no creíbles.
• Repetir un juego en etapas gran número de veces introduce la
posibilidad de usar estrategias de castigo para alcanzar benefi-
291
• En juegos de información privada un jugador sabe más sobre
su “tipo” que otro. Los jugadores maximizan sus beneficios
esperados dado el conocimiento de su propio tipo y sus creencias sobre el de los demás.
• En un equilibrio perfecto de Bayes de un juego de señalamiento, el segundo en moverse usa la regla de Bayes para
poner al día sus creencias sobre el tipo del primero después de
observar su acción.
• La frontera de la investigación en teoría de los juegos combina
teoría con experimentos para determinar si los jugadores que
quizá no sean hiperracionales terminan por jugar un equilibrio de Nash, qué equilibrio particular (si hay más de uno) y
qué trayectoria conduce al equilibrio.
Problemas
8.1
Jugador 1
Considera el juego siguiente:
a.
b.
c.
d.
D
Jugador 2
E
F
A
7, 6
5, 8
0, 0
B
5, 8
7, 6
1, 1
C
0, 0
1, 1
4, 4
Halla los equilibrios de Nash en estrategias puras (de haberlos).
Halla el equilibrio de Nash en estrategias mixtas en el que cada jugador decide al azar sobre apenas las dos primeras acciones.
Calcula los beneficios esperados de los jugadores en los equilibrios hallados en los incisos a) y b).
Traza la forma extensiva de este juego.
8.2
El equilibrio de Nash en estrategias mixtas en la batalla de los sexos en la figura 8.3 podría depender de los valores numéricos de los beneficios. Para generalizar esta solución supongamos que la matriz de beneficios del juego está dada por
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
292
Parte 3: Incertidumbre y estrategia
Jugador 1
(Esposa)
Jugador 2 (Esposo)
Ballet
Box
donde K
Ballet
K, 1
0, 0
Box
0, 0
1, K
1. Muestra cómo el equilibrio de Nash en estrategias mixtas depende del valor de K.
8.3
El juego del pollo es jugado por dos adolescentes que aceleran uno contra otro en una calle de un solo carril. El primero en virar es calificado como el pollo, mientras que el que no vira conquista la estimación de su grupo de amigos. Claro que si ninguno de los dos vira, ambos
mueren en el choque resultante. Los beneficios del juego del pollo se ofrecen en la tabla siguiente.
Adolescente 1
Adolescente 2
Vira
No vira
Vira
2, 2
1, 3
No vira
3, 1
0, 0
a. Grafica la forma extensiva.
b. Determina el equilibrio o los equilibrios de Nash en estrategias puras.
c. Calcula el equilibrio de Nash en estrategias mixtas. Como parte de tu respuesta traza el diagrama de la función de mejor respuesta para
las estrategias mixtas.
d. Supongamos que el juego se practica secuencialmente, siendo el adolescente 1 el primero en moverse y comprometiéndose en esta
acción a tirar el volante. ¿Cuáles son las estrategias contingentes del adolescente 2? Escribe las formas normal y extensiva de la versión
secuencial de este juego.
e. Usando la forma normal de la versión secuencial del juego despeja los equilibrios de Nash.
f. Identifica los subjuegos apropiados en la forma extensiva de la versión secuencial del juego. Usa la inducción hacia atrás para despejar
el equilibrio perfecto de subjuegos. Explica por qué los demás equilibrios de Nash del juego secuencial son “irrazonables”.
8.4
Dos dueños de casas vecinas, i 1, 2, eligen simultáneamente cuántas horas li dedicar a mantener hermoso un césped. El beneficio promedio por hora es
lj
10 l i þ ,
2
y el costo (de oportunidad) por hora para cada uno es de 4. El beneficio promedio del dueño i es creciente en las horas que el vecino j dedica
a su césped, porque la apariencia de la propiedad de uno depende en parte de la belleza del vecindario circundante.
a. Calcula el equilibrio de Nash.
b. Grafica las funciones de mejor respuesta e indica el equilibrio de Nash en la gráfica.
c. Muestra en la gráfica cómo el equilibrio cambiaría si la intersección de las funciones de beneficio promedio de uno de los vecinos cayera
de 10 a algún número menor.
8.5
La película ganadora del Óscar A Beautiful Mind, sobre la vida de John Nash, dramatiza la contribución académica de Nash en una sola
escena: su concepto de equilibrio se le ocurre mientras bromea en un bar con sus compañeros de posgrado. Ven a varias mujeres, una
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
293
de ellas rubia y las demás morenas, y coinciden en que la rubia es más atractiva que las morenas. El personaje de Nash ve la situación
como un juego entre los estudiantes de posgrado, en los siguientes términos. Supongamos que hay n varones que se acercan simultáneamente a la rubia o a una de las morenas. Si el varón i se acerca él solo a la rubia logrará conseguir una cita con ella y obtendrá el beneficio a. Si uno o más de los otros varones se acercan a la rubia junto con i, la competencia provocará que todos la pierdan, e i (lo mismo
que los demás que se acercaron a ella) obtendrá un beneficio de cero. Por otro lado, el varón i obtiene un beneficio de b 0 de acercarse
a una morena, porque hay más morenas que varones; por tanto, conseguirá con seguridad una cita con una morena. El atractivo de la
rubia implica que a b.
a. Argumenta que este juego no tiene un equilibrio de Nash simétrico en estrategias puras.
b. Despeja el equilibrio simétrico en estrategias mixtas. Es decir, siendo p la probabilidad de que un varón se acerque a la rubia, halla p*.
c. Demuestra que cuantos más varones hay, menos probable es que en el equilibrio del inciso b) se acerque a la rubia al menos uno de
ellos. Nota: Este resultado paradójico fue señalado por S. Anderson y M. Engers en “Participation Games: Market Entry, Coordination,
and the Beautiful Blond”, Journal of Economic Behavior and Organization, núm. 63 (2007), pp. 120-137.
8.6
El juego siguiente es una versión del dilema del prisionero, pero los beneficios son ligeramente distintos de los de la figura 8.1.
Sospechoso 1
Sospechoso 2
Delata
Calla
Delata
0, 0
3, −1
Calla
−1, 3
1, 1
a. Comprueba que el equilibrio de Nash es el usual para el dilema del prisionero y que ambos jugadores tienen estrategias dominantes.
b. Supongamos que el juego en etapas se repite infinitas veces. Calcula el factor de descuento requerido para que los sospechosos sean
capaces de cooperar en callar en cada periodo. Esboza las estrategias de gatillo que consideres para ellos.
8.7
Vuelve al juego de los dos vecinos del problema 8.5. Sigue suponiendo que el beneficio promedio del jugador i por hora de trabajo en jardinería es
lj
10 l i þ ,
2
Continúa suponiendo que el costo de oportunidad para el jugador 2 de una hora de trabajo de jardinería es de 4. Supongamos que el costo
de oportunidad del jugador 1 es de 3 o 5 con igual probabilidad y que este costo es información privada del jugador 1.
a. Despeja el equilibrio de Bayes-Nash.
b. Indica el equilibrio de Bayes-Nash en un diagrama de funciones de mejores respuestas.
c. ¿Qué tipo del jugador 1 querría enviar una señal veraz al jugador 2, si pudiera? ¿Qué tipo querría ocultar su información privada?
8.8
En Blind Texan Poker el jugador 2 extrae una carta de un mazo estándar y la pone contra su frente sin mirarla, pero de tal manera que el
jugador 1 pueda verla. El jugador 1 se mueve primero, decidiendo si mantenerse o rendirse. Si el jugador 1 se rinde debe pagar 50 dólares
al jugador 2. Si el jugador 1 se queda, la acción pasa al jugador 2. El jugador 2 puede rendirse o llamar. Si el jugador 2 se rinde, debe pagar
50 dólares al jugador 1. Si el jugador 2 llama, la carta es examinada. Si es una carta baja (2-8), el jugador 2 paga 100 dólares al jugador 1. Si
es una carta alta (9, 10, comodín, reina, rey o as), el jugador 1 paga 100 dólares al jugador 2.
a. Grafica la forma extensiva de este juego.
b. Despeja el equilibro híbrido.
c. Calcula los beneficios esperados de los jugadores.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
294
Parte 3: Incertidumbre y estrategia
Problemas analíticos
8.9 Justicia en el juego del ultimátum
Considera la versión simple del juego del ultimátum expuesta en el texto. El primero en jugar propone una división de $1. Sea r la parte
recibida por el otro jugador en esta propuesta (de manera que el primero en jugar mantiente 1 – r), donde 0 r 1/2. Entonces el otro
jugador se mueve, respondiendo con la aceptación o el rechazo de la propuesta. Si el que responde acepta la propuesta, se les paga a los
jugadores su parte; si el respondedor la rechaza, ninguno de los jugadores recibe nada. Supongamos que si el respondedor es indiferente
entre aceptar o rechazar una propuesta, la aceptará.
a. Supongamos que a los jugadores sólo les interesan los beneficios monetarios. Comprueba que el resultado mencionado en el texto
ocurre de hecho en el único equilibrio perfecto de subjuego del juego del ultimátum.
b. Compara el resultado en el juego del ultimátum con el resultado en el juego del dictador (también expuesto en el texto), en el que la
división excedente del proponedor es implementada independientemente de si el segundo en jugar la acepta o rechaza (¡así que este no
es precisamente un juego estratégico!).
c. Supongamos ahora que a los jugadores les interesa la justicia tanto como el dinero. Siguiendo el artículo de Fehr y Schmidt, citado en
el texto, supongamos que estas preferencias están representadas por la función de utilidad
U1 ðx1 , x2 Þ ¼ x1 ajx1 x2 j,
donde x1 es el beneficio del jugador 1 y x2 el del jugador 2 (una función simétrica se aplica al jugador 2). El primer término refleja el deseo
usual de más dinero. El segundo término refleja el justo deseo de que los beneficios de los jugadores no sean tan desiguales. El parámetro
a mide cuán intensa es la preferencia por la justicia en relación con el deseo de más dinero. Supongamos que a 1/2.
1. Despeja la estrategia de equilibrio del respondedor en el juego del ultimátum.
2. Tomando en cuenta cómo responderá el segundo en jugar, despeja la estrategia de equilibrio del proponedor r* en el juego del ultimátum. (Pista: r* será una solución de esquina, que depende del valor de a.)
3. Continuando con las preferencias por la justicia, compara el resultado del juego del ultimátum con el del juego del dictador. Halla casos
que coincidan con los resultados experimentales descritos en el texto, en particular en los que la división del recipiente de dinero es más
equitativa en el juego del ultimátum que en el juego del dictador. ¿Hay un límite a lo equitativa que puede ser la división en el juego del
ultimátum?
8.10 Teorema del chico maleado
En A Treatise on the Family (Harvard University Press, Cambridge, 1981), Gary Becker, galardonado con el Nobel, propone su famoso
teorema del chico maleado, como un juego secuencial entre el chico potencialmente maleado (jugador 1) y su padre (jugador 2). El chico
es el primero en jugar, eligiendo una acción r que afecta a su propio ingreso 1 ðrÞ½ 01 ðrÞ > 0 y el ingreso del padre 2 ðrÞ½ 02 ðrÞ < 0 .
Luego juega el padre, dejando un legado monetario L al hijo. Al hijo sólo le interesa su utilidad, U1 ð 1 þ LÞ , pero el padre optimiza
U2 ð 2 LÞ þ aU1 , donde 0 refleja el altruismo del padre hacia el hijo. Demuestra que, en un equilibrio perfecto de subjuegos, el hijo
optará por el valor de r que optimiza 1 þ 2 aunque no tenga intenciones altruistas. Pista: Aplica la inducción hacia atrás al problema
del padre primero, lo que dará una condición de primer orden que determinará implícitamente L*; aunque una solución explícita para L*
no puede hallarse, la derivada de L* respecto a r —requerida en el problema de optimización de primera etapa del hijo— puede determinarse usando la regla de la función implícita.
8.11 Opciones a la estrategia siniestra
Supongamos que el juego del dilema del prisionero en etapas (véase figura 8.1) se repite durante periodos infinitos.
a. ¿Los jugadores pueden sostener el resultado cooperativo usando estrategias de ojo por ojo, castigando la desviación en un periodo
pasado mediante el hecho de volver al equilibrio de Nash del juego en etapas durante sólo un periodo y retornando después a la cooperación? ¿Serán suficientes dos periodos de castigo?
b. Supongamos que los jugadores usan estrategias que castigan la desviación de la cooperación, volviendo al equilibrio de Nash del juego
en etapas durante 10 periodos antes de retornar a la cooperación. Calcula el factor de descuento de umbral por encima del cual la
cooperación es posible en el resultado que optimiza los beneficios conjuntos.
8.12 Refinamientos del equilibrio perfecto de Bayes
Recuerda el juego de señalamiento del mercado de trabajo del ejemplo 8.9.
a. Determina las condiciones en las cuales hay un equilibrio de unión en el que ambos tipos de trabajador eligen no obtener estudios
(NE) y en el que la empresa ofrece empleo a un trabajador sin estudios. Cerciórate de especificar las creencias tanto como las estrategias.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 8: Teoría de juegos
295
b. Determina las condiciones en las cuales hay un equilibrio de unión en el que ambos tipos de trabajador eligen no obtener estudios (NE)
y en el que la empresa no ofrece empleo a un trabajador sin estudios. ¿Cuál es la menor creencia posterior, de que el trabajador está
escasamente calificado, condicionada a obtener estudios congruentes con este equilibrio de unión? ¿Por qué es más natural pensar que
un trabajador escasamente calificado nunca se desviaría a E y que, por tanto, un trabajador con estudios debe estar altamente calificado?
El criterio intuitivo de Cho y Kreps es uno de una serie de complicados refinamientos del equilibrio perfecto de Bayes que descartan
equilibrios basados en creencias posteriores irrazonables como se identificaron en esta parte; véase I. K. Cho y D. M. Kreps, “Signalling
Games and Stable Criteria”, Quarterly Journal of Economics, núm. 102 (1987), pp. 179-221
Sugerencias de lecturas adicionales
Fundenberg, D. y J. Tirole. Game Theory, MIT Press, Cambridge,
1991.
Rasmusen, E. Games and Information, 4a. ed., Blackwell, Malden,
2007.
Completo estudio de la teoría de los juegos de nivel posgrado; no obstante, las secciones selectas son accesibles para los estudiantes avanzados de licenciatura.
Texto avanzado para estudiantes de licenciatura con muchas aplicaciones reales.
Holt, C. A. Markets, Games and Strategic Behavior, Pearson, Boston, 2007.
Texto para estudiantes de licenciatura con énfasis en juegos experimentales.
Watson, Joel. Strategy: An Introduction to Game Theory, Norton,
Nueva York, 2002.
Texto para estudiantes de licenciatura que equilibra el rigor con ejemplos sencillos (a menudo juegos de 2 × 2). Énfasis en ejemplos de negociación colectiva y contratación.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
296
Parte 3: Incertidumbre y estrategia
EXTENSIONES
Existencia del equilibrio de Nash
En esta sección se esbozará la prueba original de John Nash de que
todos los juegos finitos tienen al menos un equilibrio de Nash (en
estrategias mixtas, si no es que también en puras). Se darán aquí
algunos de los detalles de esa prueba; la prueba original se encuentra en Nash (1950), y una presentación clara del libro de texto de
la prueba completa se ofrece en Fudenberg y Tirole (1991). La
sección concluirá mencionando un teorema de existencia conexo
para juegos con acciones continuas.
La prueba de Nash es similar a la prueba de la existencia de un
equilibrio competitivo general en el capítulo 13. Ambas pruebas
se apoyan en un teorema de punto fijo. La prueba de la existencia
del equilibrio de Nash requiere un teorema un poco más eficiente.
En vez del teorema de punto fijo de Brouwer que se aplica a funciones, la prueba de Nash se apoya en el teorema de punto fijo de
Kakutani que se aplica a correspondencias, más mapas generales
que funciones.
E8.1 Correspondencias versus funciones
Una función traza cada punto en un primer conjunto en relación
con un punto en un segundo conjunto. Una correspondencia
FIGURA E8.1
Comparación de
funciones y
correspondencias.
traza un punto en el primer conjunto en relación con posiblemente muchos puntos en el segundo. La figura E8.1 ilustra la
diferencia.
Un ejemplo de una correspondencia que ya vimos es la mejor
respuesta, BRi(si). La mejor respuesta no debe trazar las estrategias de otros jugadores si en una sola estrategia que sea una mejor
respuesta para el jugador i. Puede haber empates entre varias
mejores respuestas. Como se mostró en la figura 8.4, en la batalla
de los sexos, la mejor respuesta del esposo al hecho de que la
esposa siguiera la estrategia mixta de ir al ballet con una probabilidad de 2/3 y al box con una probabilidad de 1/3 (o sencillamente
w 2/3 para abreviar) es no sólo un punto, sino el intervalo completo de posibles estrategias mixtas. Las mejores respuestas tanto
del esposo como de la esposa en esta figura son correspondencias,
no funciones.
La razón de que Nash necesitara un teorema de punto fijo que
implicara correspondencias, más que sólo funciones, es precisamente que su prueba opera con mejores respuestas de los jugadores para demostrar su existencia.
La función graficada en a) parece una curva conocida. Cada valor de x se traza en relación con un solo valor
de y. Con las correspondencias graficadas en b), cada valor de x puede trazarse en relación con muchos
valores de y. Así, las correspondencias pueden tener abultamientos como los que muestran las regiones
sombreadas en b).
y
y
a) Función
x
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
b) Correspondencia
23.08.2019
x
8/23
Capítulo 8: Teoría de juegos
FIGURA E8.2
Condiciones de Kakutani
a correspondencias.
297
La correspondencia en a) no es convexa porque el segmento vertical punteado entre A y B no está dentro
de la correspondencia. La correspondencia en b) no es semicontinua superior porque hay una trayectoria
(C) dentro de la correspondencia que conduce a un punto (D) que, como lo indica el círculo en blanco,
no está dentro de la correspondencia. Tanto a) como b) no tienen puntos fijos.
f(x)
f(x)
1
1
45°
45°
A
D
C
B
x
1
a) Correspondencia que no es convexa
E8.2 Teorema de punto fijo de Kakutani
He aquí el enunciado del teorema de punto fijo de Kakutani:
Toda correspondencia convexa semicontinua superior [f(x)]
de un conjunto convexo cerrado y limitado en sí mismo tiene
al menos un punto fijo (x*) tal que x* 僆 f(x*).
Comparando el enunciado del teorema de punto fijo de Kakutani con el de Brouwer en el capítulo 13, se descubre que son
similares salvo por la sustitución de “correspondencia” por “función” y por las condiciones de la correspondencia. El teorema de
Brouwer requiere que la función sea continua; el teorema
de Kakutani requiere que la correspondencia sea convexa y semicontinua superior.
Estas propiedades, que se relacionan con la continuidad, son
menos conocidas y vale la pena dedicar un momento a comprenderlas. La figura E8.2 da ejemplos de correspondencias que violan
a) la convexidad y b) la semicontinuidad superior. Esa figura
muestra por qué esas dos propiedades son necesarias para garantizar un punto fijo. Sin ambas propiedades la correspondencia
podría “saltar” a lo largo de la línea de 45° y carecer por tanto de
un punto fijo, es decir de un punto para el cual x f(x).
E8.3 Prueba de Nash
Usaremos R(s) para denotar la correspondencia que subyace en la
prueba de existencia de Nash. Esta correspondencia toma cualquier perfil de estrategias de los jugadores s (s1, s2,…, sn) (posiblemente mixtas) y lo traza en otro perfil de estrategias mixtas, el
perfil de mejores respuestas:
RðsÞ ¼ ðBR1 ðs1 Þ; BR2 ðs2 Þ, . . . , BRn ðsn ÞÞ: (i)
x
b) Correspondencia que no es
semicontinua superior
Un punto fijo de la correspondencia es una estrategia para la cual
s* 僆 R(s*); éste es un equilibrio de Nash, porque la estrategia de
cada jugador es una mejor respuesta a las estrategias de otros.
Esta prueba demuestra que todas las condiciones implicadas
en el teorema de punto fijo de Kakutani son satisfechas por la
correspondencia de mejores respuestas R(s). Primero se debe
demostrar que el conjunto de perfiles de estrategias mixtas está
cerrado y delimitado y es convexo. Puesto que un perfil de estrategias es sólo una lista de estrategias individuales, el conjunto de
perfiles de estrategias será cerrado, delimitado y convexo si el conjunto de estrategias de cada jugador Si tiene estas propiedades
individualmente. Como indica la figura E8.3 para el caso de dos y
tres acciones, la serie de estrategias mixtas sobre acciones tiene
una forma simple.1 La serie es cerrada (contiene su límite), delimitada (no tiende al infinito en ninguna dirección) y convexa (el
segmento entre dos puntos cualesquiera en el conjunto también
está en el conjunto).
Luego debe verificarse que la correspondencia de mejores respuestas R(s) es convexa. Mejores respuestas particulares no pueden parecerse a la figura E8.2a porque si dos estrategias mixtas
cualesquiera como A y B son mejores respuestas a estrategias de
otros, las estrategias mixtas entre ellas también deben ser mejores
respuestas. Por ejemplo, en la batalla de los sexos, si (1/3, 2/3) y
(2/3, 1/3) sin mejores respuestas para el esposo contra el hecho de
que su esposa juegue (2/1, 1/3) (donde, en cada par, el primer
número es la probabilidad de jugar ballet y el segundo de jugar
box), las estrategias mixtas entre las dos, tales como (1/2, 1/2),
también deben ser mejores respuestas para él. La figura 8.4 mos-
1
Los matemáticos los estudian con tanta frecuencia que tienen un nombre
especial para tal conjunto: simplex.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
298
Parte 3: Incertidumbre y estrategia
FIGURA E8.3
Conjunto de estrategias
mixtas para un individuo.
El conjunto de posibles estrategias mixtas del jugador 1 sobre dos acciones está dado por el segmento de
línea diagonal en a). El conjunto de tres acciones está dado por el triángulo sombreado en la gráfica tridimensional en b).
p31
p21
1
1
0
1
p21
1
0
1
p11
a) Dos acciones
tró que, de hecho, todas las posibles estrategias mixtas para el
esposo son mejores respuestas al juego de la esposa (2/3, 1/3).
Por último debe verificarse que R(s) es semicontinua superior. Mejores respuestas particulares no pueden parecerse a la
figura E8.2b. No pueden tener agujeros como el punto D en ellas
porque las funciones de beneficio ui(si, si) son continuas.
Recuerda que los beneficios, cuando se escriben como funciones
de estrategias mixtas, en realidad son valores esperados con probabilidades dadas por las estrategias si y si. Como demostró la
ecuación 2.176, los valores esperados son funciones lineales de
las probabilidades subyacentes. Las funciones lineales son, desde
luego, continuas.
E8.4 Juegos con acciones continuas
El teorema de existencia de Nash se aplica a juegos finitos; es decir,
juegos con un número finito de jugadores y acciones por jugador.
p11
b) Tres acciones
El teorema de Nash no se aplica a juegos que contienen acciones
continuas, como la tragedia de los comunes en el ejemplo 8.5. ¿Un
equilibrio de Nash también es de existencia garantizada para estos
juegos? Glicksberg (1952) comprobó que la respuesta es “sí” mientras las funciones de beneficios sean continuas.
Referencias
Fundenberg, D. y J. Tirole. Game Theory, MIT Press, Cambridge,
1991, sección 1.3.
Glicksberg, I. L. “A Further Generalization of the Kakutani Fixed
Point Theorem with Application to Nash Equilibrium Points”,
Proceedings of the National Academy of Sciences, núm. 38
(1952), pp. 170-174.
Nash, John. “Equilibrium Points in n-Person Games”, Proceedings
of the National Academy of Sciences, núm. 36 (1950), pp.
48-49.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Producción y oferta
PARTE
CUATRO
Capítulo 9
Funciones de producción
Capítulo 10
Funciones de costo
Capítulo 11
cios
En esta parte se examinarán la producción y la oferta de bienes económicos. Las instituciones que coordinan la transformación de insumos en productos se llaman empresas. Pueden ser instituciones grandes
(como Google, Sony o el Departamento de Defensa de Estados Unidos) o pequeñas (como las tiendas de
propiedad familiar o los individuos que se emplean a sí mismos). Aunque pueden perseguir diferentes
objetivos (Google puede buscar beneficios máximos, mientras que un kibbutz israelí puede tratar de hacer
que los miembros del mismo estén en las mejores condiciones posibles), todas las empresas deben tomar
ciertas decisiones básicas en el proceso de producción. El propósito de la parte 4 es desarrollar algunas
herramientas para analizar esas decisiones.
En el capítulo 9 se examinarán maneras de modelar la relación física entre insumos y productos. Se
introducirá el concepto de función de producción, abstracción útil a partir de las complejidades de los procesos de producción de la realidad. Dos aspectos mensurables de la función de producción se subrayarán:
sus rendimientos a escala (es decir, cómo la producción aumenta cuando todos los insumos se incrementan)
y su elasticidad de sustitución (es decir, la facilidad con que un insumo puede ser reemplazado por otro,
manteniendo el mismo nivel de producción). Asimismo, se describirá brevemente cómo se reflejan las
mejoras técnicas en funciones de producción.
El concepto de función de producción se usará después en el capítulo 10 para analizar los costos de
producción. Supondremos que todas las empresas buscan generar su producción al menor costo posible,
supuesto que permite el desarrollo de funciones de costo para la empresa. El capítulo 10 también atenderá
cómo los costos pueden diferir entre los plazos corto y largo.
En el capítulo 11 se investigará la decisión de oferta de la empresa. Para hacerlo se supondrá que el
gerente de la empresa toma decisiones de insumos y productos para maximizar los beneficios. Este capítulo
concluirá con el modelo fundamental del comportamiento de la oferta de las empresas que maximizan
beneficios, el cual se usará en muchos capítulos subsecuentes.
301
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
NUEVE
Funciones de producción
La principal actividad de toda empresa es convertir insumos en bienes . Como los economistas se
interesan en las decisiones que la empresa toma para cumplir su objetivo, pero quieren evitar
analizar muchas de las minucias de ingeniería contenidas en ello, han optado por elaborar un
modelo abstracto de producción. En este modelo la relación entre insumos y productos se formaliza mediante una función de producción de la forma
q
f (k, l, m, . . .),
(9.1)
donde q representa la producción de la empresa de un bien particular durante un periodo, 1 k
representa el uso de maquinaria (es decir, de capital) durante ese periodo, l representa horas de
insumo de trabajo, m representa las materias primas utilizadas2 y la notación indica la posibilidad
de que otras variables afecten el proceso de producción. Se supone que la ecuación 9.1 da, para
cualquier conjunto concebible de insumos, la solución de ingeniería al problema de cuál es la
mejor forma de combinar esos insumos para obtener productos.
PRODUCTIVIDAD MARGINAL
En esta sección se examina la variación en la producción, ocasionado por una variación en uno
de los insumos productivos. Para los propósitos de este análisis (y en realidad para la mayoría de
cada
nida como sigue.
DEFINICIÓN
Función de producción. La función de producción de la empresa para un bien particular, q,
q
f(k, l),
(9.2)
muestra la cantidad máxima del bien que puede producirse usando combinaciones alternas de capital (k)
y trabajo (l).
Desde luego que la mayor parte de nuestro análisis valdrá para dos insumos cualesquiera del
proceso de producción que queramos examinar. Los términos capital y trabajo se usan sólo por
1
Aquí se usará una q minúscula para representar la producción de una empresa. Reservaremos la Q mayúscula para representar
la producción total en un mercado. Por lo general se supone que una empresa produce sólo un bien o servicio. Asuntos que surgen
en empresas de productos múltiples se analizarán en algunas notas y problemas.
2
En el trabajo empírico los insumos de materias primas suelen desestimarse y la producción, q, se mide en términos de “valor
agregado”.
303
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
304
Parte 4: Producción y oferta
conveniencia. De igual forma, sería simple generalizar nuestro análisis a casos que implican más de
dos insumos; ocasionalmente, lo haremos. En la mayoría de los casos, sin embargo, será útil limitar
el análisis a dos insumos porque podremos mostrar esos insumos en gráficas bidimensionales.
Producto físico marginal
Para estudiar la variación en un insumo definiremos el producto físico marginal como sigue.
DEFINICIÓN
Producto físico marginal. El producto físico marginal de un insumo es la producción adicional que es
posible generar usando una unidad más de ese insumo, manteniendo constantes todos los demás. Matemáticamente,
q
f k,
k
q
producto físico marginal de trabajo PMg l f l .
l
producto físico marginal de capital PMgk (9.3)
Nótese que las definiciones matemáticas del producto marginal usan derivadas parciales, lo cual
refleja propiamente el hecho de que el uso de todos los demás insumos se mantiene constante
mientras el insumo de interés varía. Por ejemplo, consideremos a un agricultor que contrata a un
trabajador más para cosechar el cultivo, pero que mantiene constantes todos los demás insumos.
El producto adicional que este trabajador genera es que el producto físico marginal de este peón,
medido en cantidades físicas como bushels de trigo, cajas de naranjas o cabezas de lechuga. Podría
observarse, por ejemplo, que 50 trabajadores en una granja pueden producir 100 bushels de trigo
al año, mientras que 51 trabajadores, con la misma tierra y equipo, pueden producir 102 bushels.
El producto físico marginal del trabajador número 51 es entonces de 2 bushels al año.
Productividad marginal decreciente
Cabría esperar que el producto físico marginal de un insumo dependa de cuánto de ese insumo
se use. El trabajo, por ejemplo, no puede añadirse indefinidamente a un campo dado (manteniendo fija la cantidad de equipo, fertilizante, etcétera) sin exhibir finalmente un deterioro en su
productividad. Matemáticamente el supuesto de productividad física marginal decreciente es un
supuesto sobre las derivadas parciales de segundo orden de la función de producción:
PMgk
2f
2 fkk f11 0,
k
k
PMg l 2 f
2 fll f22 0.
l
l
(9.4)
El supuesto de productividad marginal decreciente fue originalmente propuesto por el economista del siglo xix, Thomas Malthus, a quien le preocupaba que los rápidos incrementos en la
población resultaran en menor productividad laboral. Sus sombrías predicciones para el futuro de
la humanidad llevaron a que la economía fuera llamada la “ciencia deprimente”. Pero las matemáticas de la función de producción sugieren que ese pesimismo podría ser erróneo. Variaciones en
la productividad marginal del trabajo a lo largo del tiempo dependen no sólo de cómo crece el
insumo trabajo, sino también las variaciones en otros insumos como el capital. Es decir, también
debe interesarnos PMgl/k f lk. En la mayoría de los casos, f lk 0, así que la productividad
laboral decreciente como el incremento tanto de l como de k no es una conclusión precedente. En
realidad, parece que la productividad del trabajo ha aumentado significativamente desde tiempos
de Malthus, principalmente porque los incrementos en los insumos de capital (junto con mejoras
técnicas) han neutralizado el impacto de la productividad marginal decreciente.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
305
Productividad física media
En el uso común el término productividad del trabajo suele significar productividad media.
Cuando se dice que cierta industria ha experimentado incrementos de productividad se entiende
que su producción por unidad de insumo trabajo se ha incrementado. Aunque el concepto de
productividad media no es tan importante en los análisis económicos teóricos como el de productividad marginal, en los análisis empíricos recibe mucha atención. Dado que la productividad
media es fácil de medir (digamos, tantos bushels de trigo por insumo de hora-trabajo), a menudo
se le usa como medida de eficiencia. Definiremos el producto medio del trabajo (PMel) como
PMe l producción
q f (k, l)
.
insumo trabajo
l
l
(9.5)
Nótese que PMel también depende del nivel de capital usado. Esta observación resultará importante al examinar la medición de la variación técnica al final de este capítulo.
EJEMPLO 9.1 Función de producción con dos insumos
Supongamos que la función de producción de matamoscas durante un periodo particular puede representarse con
q f(k, l) 600k2l 2 k3l 3.
(9.6)
Para elaborar las funciones productividad marginal y media del trabajo (l) para esta función, debemos
suponer un valor particular para el otro insumo, capital (k). Supóngase que k 10. Entonces, la función
de producción está dada por
q 60 000l 2 1 000l 3.
(9.7)
Producto marginal. La función de productividad marginal k 10 está dada por
PMg l q
120 000l
l
3 000l2 ,
(9.8)
que disminuye al incrementar l, volviéndose finalmente negativa. Esto implica que q llega a un valor
máximo. Igualar PMgl con 0,
120 000l 3 000l2 0
(9.9)
40l l 2
(9.10)
l 40
(9.11)
produce
o
como el punto en el que q llega a su valor máximo. El insumo trabajo más allá de 40 unidades por periodo
en realidad reduce la producción total. Por ejemplo, cuando l 40, la ecuación 9.7 muestra que q 32
millones de matamoscas, mientras que cuando l 50 la producción de matamoscas asciende a sólo
25 millones.
Producto medio. Para determinar la productividad media del trabajo en la producción de matamoscas, se divide q entre l, manteniendo todavía k 10:
q
PMe l 60 000l
l
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
1 000l2 .
(9.12)
8/23
306
Parte 4: Producción y oferta
Nuevamente, esta es una parábola invertida que alcanza su valor máximo cuando
PMe l
60 000
l
2 000l 0,
(9.13)
lo que ocurre cuando l 30. En este valor para el insumo trabajo, la ecuación 9.12 indica que PMel
900 000, y la ecuación 9.8 indica que PMel es también de 900 000. Cuando PMel está en un máximo,
las productividades media y marginal del trabajo son iguales.3
Adviértase la relación entre producción total y productividad media que se ilustra en este ejemplo.
Aunque la producción total de matamoscas es mayor con 40 trabajadores (32 millones), que con 30 trabajadores (27 millones), la producción por trabajador es más alta en el segundo caso. Con 40 trabajadores
cada trabajador produce 800 000 matamoscas por periodo, mientras que con 30 trabajadores cada trabajador produce 900 000. Como el insumo de capital (prensas de matamoscas) se mantiene constante en
esta definición de productividad, la productividad marginal decreciente del trabajo finalmente resulta
en un nivel declinante de producción por trabajador.
PREGUNTA: ¿Cómo afectaría aquí un incremento de k de 10 a 11 a las funciones PMgl y PMel? Explica
intuitivamente tus resultados.
GRÁFICAS DE ISOCUANTAS Y TASA
DE SUSTITUCIÓN TÉCNICA
Para ilustrar la posible sustitución de un insumo por otro en una función de producción se usa
su gráfica de isocuantas. Estudiaremos de nueva cuenta una función de producción de la forma
q f (k, l), en el entendido de que “capital” y “trabajo” son simplemente ejemplos convenientes de
dos insumos cualesquiera que podrían ser de interés. Una isocuanta (de iso, que significa “igual”)
registra las combinaciones de k y l capaces de generar una cantidad dada de producción. Por
ejemplo, todas las combinaciones de k y l en la curva denominada “q 10” en la figura 9.1 son
capaces de producir 10 unidades de producción por periodo. Esta isocuanta registra entonces el
hecho de que hay muchas formas alternas de generar 10 unidades de producción. Una forma
podría estar representada por el punto A: usaríamos lA y kA para generar 10 unidades de producción. O bien, podríamos preferir usar relativamente menos capital y más trabajo y elegir, por
tanto, un punto como B. De ahí que una isocuanta pueda definirse como sigue.
DEFINICIÓN
Isocuanta. Una isocuanta muestra las combinaciones de k y l que pueden generar un nivel dado de producción (digamos q0. Matemáticamente, una isocuanta registra el conjunto de k y l que satisface
f(k, l) q0.
(9.14)
Igual que en el caso de las curvas de indiferencia, existen infinitas isocuantas en el plano k-l . Cada
isocuanta representa un nivel diferente de producción. Las isocuantas registran niveles sucesivamente más altos de producción conforme nos movemos en dirección noreste. Presumiblemente,
3
Este resultado es general. Dado que
PMe l
l
l PMgl
l2
q
,
en un máximo l PMgl q o PMgl PMel.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
FIGURA 9.1
Gráfica de isocuantas.
307
Las isocuantas registran las combinaciones alternas de insumos que pueden usarse para generar un nivel
dado de producción. La pendiente de estas curvas indica la tasa en que l puede ser sustituida por k, manteniendo constante la producción. La negativa de esta pendiente se llama tasa marginal de sustitución técnica
(TMST). En la figura, la TMST es positiva y decreciente para insumos de trabajo crecientes.
k por periodo
kA
A
q = 30
q = 20
kB
B
lA
q = 10
lB
l por periodo
usar más de cada uno de los insumos permitirá incrementar la producción. Otras dos isocuantas
(para q 20 y q 30) se muestran en la figura 9.1. Notarás la semejanza entre una gráfica de
isocuantas y el mapa de curvas de indiferencia del individuo analizado en la parte 2. Son, en
efecto, conceptos similares porque ambos representan mapas de “líneas de nivel” de una función
particular. En el caso de las isocuantas, sin embargo, la denominación de las curvas es mensurable; una producción de 10 unidades por periodo tiene un significado cuantificable. Por tanto a los
economistas les interesa más estudiar la forma de las funciones de producción que examinar la
forma exacta de las funciones de utilidad.
Tasa marginal de sustitución técnica (TMST)
La pendiente de una isocuanta muestra cómo un insumo puede cambiarse por otro, manteniendo
constante la producción. Examinar la pendiente proporciona información sobre la posibilidad
técnica de sustituir trabajo por capital. He aquí una definición formal.
DEFINICIÓN
Tasa marginal de sustitución técnica. La tasa marginal de sustitución técnica (TMST) muestra la tasa en
la cual trabajo puede ser sustituido por capital, manteniendo constante la producción a lo largo de una
isocuanta. En términos matemáticos,
TMST (l para k)
dk
dl
.
(9.15)
qq0
En esta definición, la notación pretende ser un recordatorio de que la producción debe mantenerse constante al sustituir l por k. El valor particular de esta tasa dependerá no sólo del nivel de
producción, sino también de las cantidades de capital y trabajo en uso. Su valor depende del
punto en la gráfica de isocuantas en el cual debe medirse la pendiente.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
308
Parte 4: Producción y oferta
TMST y productividades marginales
Para examinar la forma de las isocuantas de la función producción es útil comprobar el resultado
siguiente: la TMST (de l para k) es igual a la razón de la productividad física marginal del trabajo
(PMgl) con la productividad física marginal del capital (PMgk). Imagina usar la ecuación 9.14
para graficar la isocuanta q0. Sustituimos una secuencia de valores crecientes de l y vemos cómo k
tiene que ajustarse para mantener constante la producción en q0. La gráfica de la isocuanta es en
realidad la gráfica de la función implícita k(l) que satisface
q0 f (k(l), l).
(9.16)
Justo como hicimos en la sección sobre funciones contenidas del capítulo 2 (véase en particular
la ecuación 2.22), podemos usar la regla de cadena para diferenciar la ecuación 9.16, lo que
resulta en
0 fk
dk
dk
fl PMgk
PMg l ,
dl
dl
(9.17)
donde el 0 inicial aparece porque q0 se mantiene constante; así, la derivada del miembro izquierdo
de la ecuación 9.16 respecto a l es igual a 0. Reordenar la ecuación 9.17 da
TMST (l para k)
dk
dl
qq0
PMg l
.
PMgk
(9.18)
De ahí que la TMST esté dada por la razón de las productividades marginales de los insumos.
La ecuación 9.18 indica que las isocuantas que realmente observamos deben ser de pendiente
negativa. Dado que tanto PMgl como PMgk son no negativas (ninguna empresa elegiría usar un
insumo costoso que redujera la producción), la TMST también será positiva (o quizá de cero).
Puesto que la pendiente de una isocuanta es la negativa de la TMST cualquier empresa que observemos no operará en la porción de pendiente positiva de una isocuanta. Aunque es matemáticamente posible idear funciones de producción cuyas isocuantas tengan pendientes positivas en
algunos puntos, para una empresa no tendría sentido económico optar por esas alternativas de
insumos.
Razones de una TMST decreciente
Las isocuantas de la figura 9.1 se trazan no sólo con una pendiente negativa (como debe ser), sino
también como curvas convexas. A lo largo de cualesquiera de las curvas, la TMST es decreciente.
Para razones altas de k para l, la TMST es un número positivo grande, lo cual indica que es posible
renunciar a gran cantidad de capital si una unidad más de trabajo se vuelve disponible. Por otro
lado, cuando ya se usa mucho trabajo, la TMST es baja, lo que significa que sólo una pequeña
cantidad de capital puede intercambiarse por una unidad adicional de trabajo, si ha de mantenerse constante la producción. Este supuesto parecería tener cierta relación con el supuesto de
productividad marginal decreciente. Un uso apresurado de la ecuación 9.18 podría llevarnos a
concluir que un incremento en l acompañado de un decremento en k resultaría en un decremento
en PMgl, un incremento en PMgk y, por tanto, un decremento en la TMST. El problema de esta
“prueba” rápida es que la productividad marginal de un insumo depende del nivel de ambos insumos; variaciones en l afectan a PMgk y viceversa. No es posible derivar una TMST decreciente
únicamente del supuesto de productividad marginal decreciente.
Para ver por qué matemáticamente esto es así, supongamos que q f (k, l) y que f k y f l son
positivas (es decir, las productividades marginales son positivas). Supóngase también que f kk 0
y f ll 0 (que las productividades marginales son decrecientes). Para demostrar que las isocuantas
son convexas, desearemos demostrar que d(TMST)/dl 0. Puesto que TMST f l/f k, tenemos
dTMST d( fl /fk )
.
dl
dl
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
(9.19)
8/23
Capítulo 9: Funciones de producción
309
Debido a que f l y f k son funciones tanto de k como de l debe tenerse cuidado al tomar la derivada
de esta expresión:
dTMST fk ( fll f lk dk/dl
fl ( fkl fkk dk/dl)
.
dl
( fk ) 2
(9.20)
Usando el hecho de que dk/dl f l/f k a lo largo de una isocuanta y el teorema de Young (f kl f lk),
tenemos
dTMST fk2 fll
dl
2fk fl fkl fl2 fkk
.
( fk ) 3
(9.21)
Debido a que hemos supuesto f k 0, el denominador de esta función es positivo. De ahí que la
fracción entera sea negativa, si el numerador es negativo. Como se supone que tanto f ll como f kk
son negativas, el numerador definitivamente será negativo si f kl es positiva. Si podemos suponer
esto, hemos demostrado que dTMST/dl 0 (que las isocuantas son convexas).4
Importancia de los efectos de productividad cruzada
Intuitivamente parece razonable que la derivada parcial cruzada f kl f lk deba ser positiva. Si los
trabajadores tuvieran más capital tendrían productividades marginales más altas. Aunque este es
probablemente el caso más frecuente, no necesariamente tiene que serlo. Algunas funciones de
producción tienen f kl 0, al menos para una gama de valores de insumos. Cuando suponemos
una TMST decreciente (como lo haremos a lo largo de la mayor parte de nuestro análisis), establecemos un supuesto más firme que el de productividades marginales simplemente decrecientes
para cada insumo; específicamente, suponemos que las productividades marginales disminuyen
“lo bastante rápido” para compensar cualquier posible efecto negativo de productividad cruzada.
Desde luego que, como veremos más adelante, con tres o más insumos las cosas se complican un
poco más.
EJEMPLO 9.2 TMST decreciente
En el ejemplo 9.1 la función producción de matamoscas fue dada por
q f(k, l) 600k2l 2 k3l3.
(9.22)
Las funciones generales de productividad marginal para esta función de producción son
q
1 200k2 l 3k3 l2 ,
l
q
PMg k fk 1 200kl2 3k2 l3 .
k
PMgl fl (9.23)
Nótese que cada una de estas depende de los valores de ambos insumos. Simple factorización indica que
estas productividades marginales serán positivas para valores de k y l para los cuales kl 400.
Dado que
f ll 1 200k2 6k3l
y
f kk 1 200l 2 6kl3,
(9.24)
está claro que esta función exhibe productividades marginales decrecientes para valores suficientemente
grandes de k y l. En efecto, factorizando de nuevo cada expresión es fácil demostrar que f ll, f kk 0 si
4
Como se señaló en el capítulo 2, las funciones para las cuales el numerador en la ecuación 9.21 es negativo se llaman funciones
(estrictamente) cuasi cóncavas.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
310
Parte 4: Producción y oferta
kl 200. Sin embargo, aun dentro del rango 200 kl 400 donde las relaciones de productividad marginal para esta función se comportan “normalmente”, esta función de producción podría no tener necesariamente una TMST decreciente. La diferenciación cruzada de cualesquiera de las funciones de productividad marginal (ecuación 9.23) produce
f kl f lk 2 400kl 9k2l2,
(9.25)
la cual es positiva sólo para kl 266.
Por tanto el numerador de la ecuación 9.21 definitivamente será negativo para 200 kl 266, pero
para fábricas de matamoscas de mayor escala el caso no es tan claro porque f kl es negativa. Cuando f kl es
negativa, los incrementos en el insumo de trabajo reducen la productividad marginal del capital. De ahí
que sea incorrecto el argumento intuitivo de que el supuesto de productividades marginales decrecientes
produce una predicción inequívoca acerca de lo que pasará con la TMST ( f l/f k) al incrementarse l y
decrecer k. Todo depende de los efectos relativos en las productividades marginales de las productividades marginales decrecientes (que tienden a reducir f l e incrementar f k) y los efectos contrarios de las
productividades marginales cruzadas (que tienden a incrementar f l y a reducir f k). Aun así, para este caso
de los matamoscas, es cierto que la TMST es decreciente a todo lo largo de la gama de k y l donde las
productividades marginales son positivas. Para casos en los que 266 kl 400, las productividades
marginales decrecientes exhibidas por la función son suficientes para superar la influencia de un valor
negativo de f kl en la convexidad de las isocuantas.
PREGUNTAS: Para casos en los que k l , ¿qué puede decirse de las productividades marginales de esta
función de producción? ¿Cómo simplificaría esto el numerador de la ecuación 9.21? ¿Cómo te permite
esto evaluar más fácilmente esta expresión para algunos valores más grandes de k y l?
RENDIMIENTOS A ESCALA
Ahora procederemos a caracterizar las funciones de producción. Una primera pregunta que
podría hacerse sobre estas es cómo responde la producción a incrementos en todos los insumos
juntos. Por ejemplo, supongamos que todos los insumos se duplican: ¿la producción se duplicaría
o la relación no sería tan simple? Esta es una pregunta de los rendimientos a escala exhibidos por
la función de producción que han interesado a los economistas desde que Adam Smith estudió
intensivamente la producción de alfileres. Smith identificó dos fuerzas que entraban en operación
cuando el experimento conceptual de duplicar todos los insumos se llevaba a cabo. Primero, una
duplicación de la escala permite una mayor división del trabajo y especialización de funciones. De
ahí que haya cierta presunción de que la eficiencia puede aumentar; la producción podría más que
duplicarse. Segundo, la duplicación de los insumos también supone cierta pérdida de eficiencia
porque la supervisión gerencial puede dificultarse, dada la mayor escala de la empresa. Cuál de
estas dos tendencias tendrá mayor efecto, es una importante pregunta empírica.
Estos conceptos pueden definirse técnicamente como sigue:
DEFINICIÓN
Rendimientos a escala. Si la función de producción está dada por q f (k, l)y si todos los insumos se
multiplican por la misma constante positiva t (donde t 1), los rendimientos a escala de la función de
producción se clasifican como
Efecto en la producción
Rendimientos a escala
f(tk, tl) tf (k, l) tq
f(tk, tl) tf (k, l) tq
f(tk, tl) tf (k, l) tq
Constantes
Decrecientes
Crecientes
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
311
En términos intuitivos, si un incremento proporcional en insumos aumenta la producción en la
misma proporción la función de producción exhibe rendimientos constantes a escala. Si la producción se incrementa menos que proporcionalmente, la función exhibe rendimientos decrecientes a escala. Y si la producción se incrementa más que proporcionalmente, hay rendimientos
crecientes a escala. Como veremos, es teóricamente posible que una función exhiba rendimientos constantes a escala, en algunos niveles de uso de insumos y rendimientos crecientes o decrecientes en otros niveles.5 A menudo, sin embargo, los economistas se refieren a los rendimientos
a escala de una función de producción con el entendido implícito de que sólo se toman en cuenta
un muy estrecho rango de variación en uso de insumos y el nivel asociado de producción.
Rendimientos constantes a escala
Existen razones económicas por las cuales la función de producción de una empresa puede exhibir rendimientos constantes a escala. Si la empresa opera muchas plantas idénticas, podría aumentar o disminuir su producción simplemente variando el número de ellas en operación corriente.
Es decir, la empresa puede duplicar la producción duplicando el número de plantas que opera, y
para eso requerirá emplear precisamente el doble de insumos. Estudios empíricos de funciones de
producción suelen determinar que los rendimientos a escala son más o menos constantes para las
empresas estudiadas (al menos alrededor de producciones cercanas a los niveles de operación
establecidos de las empresas; estas pueden exhibir rendimientos crecientes a escala mientras crecen a su tamaño establecido). Por todas estas razones, el caso de rendimientos constantes a escala
es digno de ser examinado con mayor detalle.
Cuando una función de producción exhibe rendimientos constantes a escala, satisface la definición de “homogeneidad” que se presenta en el capítulo 2. Es decir, la producción es homogénea
de grado 1 en sus insumos porque
f (tk, tl) t1f(k, l) tq.
(9.26)
En el capítulo 2 se demostró que, si una función es homogénea de grado k, sus derivadas son
homogéneas de grado k l. En este contexto lo anterior implica que las funciones de productividad marginal derivadas de una función de producción de rendimientos constantes a escala son
homogéneas de grado 0. Es decir,
f (k, l) f (tk, tl)
,
k
k
f (k, l) f (tk, tl)
PMg l l
l
PMg k (9.27)
para cualquier t 0. En particular, puede concederse que t 1/l en las ecuaciones 9.27 y obtener
f (k/l, 1)
,
k
f (k/l, 1)
PMg l .
l
PMg k (9.28)
Esto es, la productividad marginal de cualquier insumo sólo depende de la razón de capital con el
insumo de trabajo, no de los niveles absolutos de estos insumos. Este hecho es especialmente
importante, por ejemplo, para explicar las diferencias en productividad entre industrias o países.
5
Una medida local de los rendimientos a escala es provista por la elasticidad de escala, definida como
eq, t f (tk, tl)
t
t
,
f (tk, tl)
donde esta expresión se debe evaluar en t 1. En principio este parámetro puede adoptar diferentes valores, dependiendo del
nivel de uso de los insumos. Para algunos ejemplos con el uso de este concepto, véase el problema 9.9.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
312
Parte 4: Producción y oferta
Funciones de producción homotéticas
Una consecuencia de las ecuaciones 9.28 es que la TMST (PMgl/PMgk) de cualquier función de
producción con rendimientos constantes a escala sólo dependerá de la razón de los insumos, no
de sus niveles absolutos. Es decir, dicha función será homotética (véase el capítulo 2); sus isocuantas serán expansiones radiales unas de otras. Esta situación se muestra en la figura 9.2. A lo largo
de cualquier radio a través del origen (donde la razón k/l no cambia), las pendientes de isocuantas
sucesivamente más altas son idénticas. Esta propiedad de la gráfica de isocuantas nos será útil en
diversas ocasiones.
Un simple ejemplo numérico puede brindar cierta intuición sobre este resultado. Supongamos
que un gran pedido de pan (consistente en, digamos, 200 hogazas) puede surtirse en un día con
tres panaderos trabajando en tres hornos, o con dos panaderos trabajando en cuatro hornos. Por
tanto la TMST de los hornos por panaderos es de uno a uno: un horno adicional puede sustituir
a un panadero. Si este proceso de producción exhibe rendimientos constantes a escala, dos pedidos grandes de pan (por un total de 400 hogazas) puede surtirse en un día, ya sea con seis panaderos trabajando en seis hornos, o con cuatro panaderos y ocho hornos. En este último caso, dos
hornos sustituyen a dos panaderos, así que nuevamente la TMST es de uno a uno. En casos de
rendimientos constantes a escala, elevar el nivel de producción no altera las disyuntivas entre
insumos; así, las funciones de producción son homotéticas.
Una función de producción puede tener un mapa de curvas de indiferencia homotéticas aun si
no exhibe rendimientos constantes a escala. Como se mostró en el capítulo 2 esta propiedad de
homotecia es retenida por cualquier transformación monótona de una función homogénea. De
ahí que los rendimientos crecientes o decrecientes a escala puedan incorporarse en una función
de rendimientos constantes a escala mediante una transformación apropiada. Quizá la más
FIGURA 9.2
Gráfica de isocuantas de
una función de producción de rendimientos
constantes a escala.
Dado que una función de producción de rendimientos constantes a escala es homotética, la TMST sólo
depende de la razón de k con l, no de la escala de producción. En consecuencia, a lo largo de cualquier radio
a través del origen (un radio de k/l constante), la TMST será la misma en todas las isocuantas. Un rasgo
adicional es que las etiquetas de las isocuantas se incrementan proporcionalmente con los insumos.
k por periodo
q=3
q=2
q=1
l por periodo
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
313
común de estas transformaciones sea la exponencial. Por tanto si f (k, l) es una función de producción con rendimientos constantes a escala, puede concederse que
F(k, l) = [f(k, l)] ,
donde
es cualquier exponente positivo. Si
(9.29)
1, entonces
F(tk, tl) [f (tk, tl)] [tf (k, l)] t [f (k, l)] t F(k, l) tF(k, l)
(9.30)
para cualquier t 1. De ahí que esta función de producción transformada exhiba rendimientos
crecientes a escala. El exponente recoge el grado de los rendimientos crecientes a escala. Una
duplicación de insumos llevaría a un incremento de cuatro veces en la producción si 2, pero
a un incremento de ocho veces si 3. Una prueba idéntica demuestra que la función F exhibe
rendimientos decrecientes a escala para 1. Como esta función sigue siendo homotética en
todas esas transformaciones, hemos demostrado que hay casos importantes en los que la cuestión
de los rendimientos a escala puede separarse de cuestiones contenidas con la forma de una
isocuanta. En estos casos, las variaciones en los rendimientos a escala sólo cambiarán las etiquetas
de las isocuantas, no su forma. En la sección siguiente se examinará cómo pueden describirse las
formas de las isocuantas.
El caso de n insumos
La definición de los rendimientos a escala puede generalizarse fácilmente a una función de producción con n insumos. Si esa función de producción está dada por
q f (x1, x2, . . . , xn)
(9.31)
y si todos los insumos se multiplican por t 1, tenemos
f (tx1, tx2, . . . , txn) tkf(x1, x2, . . . , xn) tkq
(9.32)
para alguna constante k. Si k 1, la función de producción exhibe rendimientos constantes a
escala. Rendimientos decrecientes y crecientes a escala corresponden a los casos k 1 y k 1,
respectivamente.
La parte crucial de esta definición matemática es el requerimiento de que todos los insumos
aumenten en la misma proporción, t. En muchos procesos de producción de la realidad, esta disposición podría tener poco sentido económico. Por ejemplo, una empresa podría tener sólo un
“jefe”, y ese número no necesariamente se duplicaría aun si todos los demás insumos lo hicieran.
O bien, la producción de una granja podría depender de la fertilidad de la tierra. Podría no ser
literalmente posible duplicar los acres sembrados y mantener al mismo tiempo la fertilidad, porque la nueva tierra podría no ser tan buena como la que ya está cultivada. De ahí que algunos
insumos tengan que fijarse (o al menos ser imperfectamente variables) para casi todos los efectos
prácticos. En esos casos parece probable algún grado de productividad decreciente (resultado del
empleo creciente de insumos variables), aunque esto no puede llamarse propiamente “rendimientos decrecientes a escala”, debido a la presencia de insumos que se mantienen fijos.
ELASTICIDAD DE SUSTITUCIÓN
Otra característica importante de la función de producción es qué tan “fácil” es sustituir un
insumo por otro. Esta es una pregunta sobre la forma de una isocuanta, más que sobre la gráfica
completa de isocuantas. A lo largo de una isocuanta la tasa marginal de sustitución técnica decrecerá al decrecer la razón capital-trabajo (es decir, al decrecer k/l): ahora deseamos definir algún
parámetro que mida este grado de sensibilidad. Si la TMST no varía en absoluto para variaciones
en k/l, podría decirse que la sustitución es fácil porque la razón de las productividades marginales
de los dos insumos no varía al cambiar la mezcla de insumos. O bien, si la TMST varía rápidamente respecto a pequeñas varaciones en k/l, diríamos que la sustitución es difícil porque las
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
314
Parte 4: Producción y oferta
variaciones pequeñas en la mezcla de insumos tendrán un efecto sustancial en las productividades relativas de los insumos. Una medida sin escala de esta sensibilidad es provista por la elasticidad de sustitución, concepto que encontramos informalmente en nuestro análisis de las funciones
de utilidad ESC. Aquí trabajaremos en el suministro de una definición más formal.
Para variaciones discretas la elasticidad de sustitución está dada por
porcentaje de ( k /l)
(k/l)
porcentaje de TMST
k /l
TMST
TMST
(k/l) TMST
.
TMST (k/l)
(9.33)
Más a menudo nos interesará considerar pequeñas variaciones; Por tanto una modificación de la
ecuación 9.33 será de más interés:
d(k/l) TMST
d ln(k /l)
.
d TMST
k/l
d ln TMST
(9.34)
La expresión logarítmica se desprende de derivaciones matemáticas a lo largo de las líneas del
ejemplo 2.2 del capítulo 2. Todas estas ecuaciones pueden reunirse en la definición formal
siguiente.
DEFINICIÓN
Elasticidad de sustitución. Para la función de producción q f(k, l), la elasticidad de sustitución ( )
mide la variación proporcional en k/l en relación con la variación proporcional en la TMST a lo largo de
una isocuanta. Es decir.
porcentaje de (k /l)
d(k /l) TMST
d ln(k /l)
d ln(k /l)
.
porcentaje de TMST
d TMST k /l
d ln TMST d ln( fl /fk )
(9.35)
Puesto que a lo largo de una isocuanta k/l y TMST se mueven en la misma dirección, el valor de
siempre es positivo. Gráficamente, este concepto se ilustra en la figura 9.3 como un movimiento
del punto A al punto B en una isocuanta. En este movimiento, tanto la TMST como la razón k/l
cambiarán; nos interesa la magnitud relativa de estas variaciones. Si es alta, la TMST no variará
mucho en relación con k/l y la isocuanta estará cerca de ser lineal. Por otro lado, un bajo valor de
implica una isocuanta más bien marcadamente curva; la TMST variará en una cantidad sustancial al cambiar k/l. En general, es posible que la elasticidad de sustitución varíe conforme uno se
mueve a lo largo de una isocuanta, y conforme a la variación en la escala de producción. Sin
embargo, con frecuencia es conveniente suponer que es constante a lo largo de una isocuanta.
Si la función de producción también es homotética, entonces —dado que todas las isocuantas son
meramente extensiones radiales— será la misma a lo largo de todas las isocuantas. Encontraremos tales funciones más adelante, y en muchos de los problemas al final de este capítulo.6
El caso de n insumos
Generalizar la elasticidad de sustitución al caso de muchos insumos puede plantear varias complicaciones. Un método es adoptar una definición análoga a la ecuación 9.35; es decir, definir la
6
La elasticidad de sustitución puede formularse directamente en términos de la función de producción y sus derivadas en el caso
de los rendimientos constantes a escala, como
fk fl
f fk, l
Pero esta forma es complicada. De ahí que por lo general la definición logarítmica de la ecuación 9.35 sea la más fácil de aplicar.
Para un breve resumen, véase P. Berck y K. Sydsaeter, Economist’s Mathematical Manual (Springer-Verlag, Berlín, 1999), cap. 5.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
315
Al pasar del punto A al punto B en la isocuanta q q0, tanto la razón capital-trabajo (k/l) como la TMST
cambiarán. La elasticidad de sustitución ( ) se define como la razón de estas variaciones proporcionales; es
una medida de cuán curvada es la isocuanta.
FIGURA 9.3
Descripción gráfica de la
elasticidad de sustitución.
k por
periodo
A
TMSTA
TMSTB
B
q = q0
(k /l ) A
(k /l ) B
l por periodo
elasticidad de sustitución entre dos insumos como la variación proporcional en la razón de ambos
insumos con la variación proporcional en la TMST entre ellos, manteniendo constante la producción.7 Para completar esta definición es necesario requerir que todos los insumos que no sean los
dos bajo examen se mantengan constantes. Sin embargo, este último requisito (que no es relevante cuando hay sólo dos insumos) restringe el valor de esta definición potencial. En procesos de
producción de la realidad es probable que cualquier variación en la razón de dos insumos también sea acompañado por variaciones en los niveles de otros insumos. Algunos de estos otros
insumos podrían ser complementarios con aquellos que varían, mientras que otros podrían
ser sustitutos, y mantenerlos constantes crea una restricción más bien artificial. Por esta razón
una definición alterna de la elasticidad de sustitución que permita tal complementariedad y sustitución en la función de costo de la empresa se usa generalmente en el caso de n bienes. Dado
que este concepto suele medirse usando funciones de costo, lo describiremos en el capítulo
siguiente.
7
Esto es, la elasticidad de sustitución entre el insumo i y el insumo j podría definirse como
ij
ln(xi /xj )
ln( fj /fi )
para movimientos a lo largo de f(x1, x2, . . ., xn) q0. Nótese que el uso de derivadas parciales en esta definición requiere, en efecto,
que todos los insumos que no sean i ni j se mantengan constantes cuando se consideran movimientos a lo largo de la isocuanta q0.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
316
Parte 4: Producción y oferta
CUATRO FUNCIONES
DE PRODUCCIÓN SIMPLES
En esta sección se ilustrarán cuatro funciones de producción simples, cada una de las cuales está
caracterizada por una elasticidad de sustitución diferente. Estas se muestran sólo para el caso
de dos insumos, pero la generalización a muchos insumos es fácil de hacer (véanse las extensiones de este capítulo).
Caso 1: (␴ ⴝ ⴥ) lineal
Supongamos que la función de producción está dada por
q f (k, l) k l.
(9.36)
Es fácil demostrar que esta función de producción exhibe rendimientos constantes a escala. Para
cualquier t 1,
f(tk, tl) tk tl t( k l) tf (k, l).
(9.37)
Todas las isocuantas de esta función de producción son líneas rectas paralelas con pendiente
/ . En la figura 9.4a se muestra una gráfica de isocuantas de este tipo. Puesto que la TMST es
constante a lo largo de cualquier isocuanta en línea recta, el denominador en la definición de
(ecuación 9.35) es igual a 0, y de ahí que sea infinita. Aunque esta función de producción lineal
es un ejemplo útil es raro encontrarla en la práctica porque pocos procesos de producción se
caracterizan por tal facilidad de sustitución. En realidad, en este caso, capital y trabajo pueden
concebirse como sustitutos perfectos entre sí. Una industria caracterizada por tal función de producción podría usar sólo capital o sólo trabajo, dependiendo de los precios de estos insumos. Es
difícil imaginar un proceso de producción así; toda máquina precisa de alguien que apriete sus
botones, y todo trabajador requiere algo de equipo de capital, por modesto que sea.
Caso 2: (␴ ⴝ 0) de proporciones fijas
Las funciones de producción caracterizadas por 0 tienen isocuantas en forma de L como las
que aparecen en la figura 9.4b. En la esquina de una isocuanta en forma de L, un incremento despreciable en k/l causa un incremento infinito en TMST, porque ahí la isocuanta varía repentinamente de horizontal a vertical. Sustituir 0 por la variación en TMST en el numerador de la
fórmula para en la ecuación 9.33 y el infinito por la variación en TMST en el denominador
contenido que 0. Una empresa operaría siempre en la esquina de una isocuanta. Operar en
cualquier otra parte es ineficiente porque la misma producción podría generarse con menos insumos desplazándose a lo largo de la isocuanta hacia la esquina.
Como se advierte en la figura 9.4, todas las esquinas de las isocuantas se ubican a lo largo del
mismo radio desde el origen. Esto ilustra el importante caso especial de una función de producción
de proporciones fijas. Como la empresa opera siempre en la esquina de alguna isocuanta, y como
todas las isocuantas están formadas a lo largo del mismo radio, debe ser el caso de que la empresa
use insumos en las proporciones fijas dadas por la pendiente de ese rayo independientemente de
cuánto produzca.8 Los insumos son complementos perfectos en el sentido de que, a partir de la
proporción fija, un incremento en un insumo es inútil a menos que el otro se incremente también.
La forma matemática de la función de producción de proporciones fijas está dada por
q min( k, l), , 0,
(9.38)
donde el operador “min” significa que q está dada por el menor de los dos valores entre paréntesis.
Por ejemplo, supongamos que k l; entonces q k y podemos decir que el capital es la resFunciones de producción con 0 no necesitan ser de proporciones fijas. La otra posibilidad es que las esquinas de las isocuantas se ubiquen a lo largo de una curva no lineal desde el origen, más que alinearse a lo largo de un radio.
8
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
FIGURA 9.4
Gráficas de isocuantas de
funciones de producción
simples con varios valores de .
317
En estas figuras se ilustran tres posibles valores de la elasticidad de sustitución. En a) capital y trabajo son
sustitutos perfectos. En este caso, la TMST no cambiará al variar la razón capital-trabajo. En b), el caso
de proporciones fijas, no es posible ninguna sustitución. La razón capital-trabajo está fija en / . Un caso de
sustitución limitada se ilustra en c).
k por
periodo
k por
periodo
σ=∞
σ=0
−β
Pendiente = __
α
q__3
α
q1
q2
q3
q2
q3
q1
l por periodo
(a)
(b)
q__3
β
l por periodo
k por
periodo
σ=1
q3
q2
q1
l por periodo
(c)
tricción vinculante en este proceso de producción. El empleo de más trabajo no incrementará la
producción, y de ahí que el producto marginal del trabajo sea de cero; trabajo adicional es superfluo en este caso. De igual forma, si k l, entonces el trabajo es la restricción vinculante de la
producción, y el capital adicional es superfluo. Cuando k l, ambos insumos son completamente utilizados. Cuando esto sucede, k/l / , y la producción tiene lugar en un vértice en la
gráfica de isocuantas. Si ambos insumos son costosos, este es el único lugar de minimización de
costos en el cual operar. El locus de todos esos vértices es una línea recta a través del origen con
pendiente dada por / .9
9
Con la forma reflejada por la ecuación 9.38 la función de producción de proporciones fijas exhibe rendimientos constantes a
escala porque
f(tk, tl) min( tk, tl) t min( k, l) tf(k, l)
para cualquier t 1. Como antes, rendimientos crecientes o decrecientes pueden ser fáciles de incorporar en las funciones,
usando una transformación no lineal de esta forma funcional, como [f(k, l)] , donde puede ser mayor o menor que 1.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
318
Parte 4: Producción y oferta
La función de producción de proporciones fijas tiene una amplia gama de aplicaciones. Muchas
máquinas, por ejemplo, requieren que cierto número de individuos las operen, pero todo trabajo
excedente es superfluo. Consideremos la combinación de capital (una podadora de pasto) y trabajo para podar un jardín. Siempre se necesitará un individuo que opere la podadora, y cualquiera de estos insumos sin el otro no podrá producir nada en absoluto. Puede ser que muchas
máquinas sean de este tipo y requieran un complemento fijo de trabajadores por máquina.10
Caso 3: (␴ ⴝ 1) Cobb-Douglas
La función de producción para la cual ( 1), llamada función de producción Cobb-Douglas,11
ofrece un punto medio entre los dos casos polares previamente analizados. Las isocuantas para el
caso de la función Cobb-Douglas tienen la forma convexa “normal” y se muestran en la figura
9.4c. La forma matemática de la función de producción Cobb-Douglas está dada por
q f (k, l) Ak l,
(9.39)
donde y son todas constantes positivas.
La función Cobb-Douglas puede exhibir cualquier grado de rendimientos a escala, dependiendo de los valores de y . Supóngase que todos los insumos aumentaran en un factor de t.
Por tanto
f (tk, tl ) A(tk) (tl ) At
t
k l
(k, l ).
(9.40)
De ahí que si 1, la función Cobb-Douglas exhibe rendimientos constantes a escala porque la producción también se incrementa por un factor de t. Si 1, la función exhibe
rendimientos crecientes a escala, mientras que 1 corresponde al caso de los rendimientos
decrecientes a escala. Todo se reduce a mostrar que la elasticidad de sustitución es de 1 para la
función Cobb-Douglas.12 Este hecho ha llevado a los investigadores a usar la versión de rendimientos constantes a escala de esta función para una descripción general de relaciones de producción agregada en muchos países.
La función Cobb-Douglas también ha demostrado ser útil en muchas aplicaciones, porque es
lineal en logaritmos:
ln q ln A ln k ln l.
(9.41)
La constante es entonces la elasticidad de producción respecto al insumo de capital, y es la
elasticidad de producción respecto al insumo de trabajo.13 A veces estas constantes pueden esti10
El ejemplo de la podadora de pasto señala otra posibilidad, sin embargo. Presumiblemente, hay cierto margen al elegir qué
tamaño de podadora comprar. De ahí que antes de la compra real, la razón capital-trabajo en el corte de pasto pueda considerarse
variable: cualquier dispositivo puede elegirse, desde un par de tijeras hasta una podadora enorme. Una vez adquirida la podadora,
sin embargo, la razón capital-trabajo se vuelve fija.
11
Así llamada en honor de C. W. Cobb y P. H. Douglas. Véase P. H. Douglas, The Theory of Wages (Macmillan Co., Nueva York,
1934), pp. 132-135.
12
Para la función Cobb-Douglas,
TMST fl Ak l 1 k
fk
Ak 1 l
l
o
ln TMST ln(/ ) ln(k/l).
De ahí que
13
ln k /l
1.
ln TMST
Véase el problema 9.5.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
319
marse a partir de datos reales, y tales estimaciones pueden usarse para medir rendimientos a
escala (examinando la suma ) y para otros propósitos.
Caso 4: Función de producción ESC
Una forma funcional que incorpora los tres casos anteriores y permite que adopte también otros
valores es la función de producción de elasticidad de sustitución constante (ESC), originalmente
presentada por Arrow et al., en 1961.14 Esta función está dada por
q f (k, l) [k l]
/
(9.42)
para 1, 0 y 0. Esta función se parece mucho a la función de utilidad esc que se analizó
en el capítulo 3, aunque ahora hemos añadido el exponente / para permitir la introducción
explícita de factores de rendimientos a escala. Para 1 la función exhibe rendimientos crecientes a escala, mientras que para 1 exhibe rendimientos decrecientes.
La aplicación directa de la definición de a esta función15 da el importante resultado de que
1
(9.43)
.
1
De ahí que las proporciones lineales fijas y los casos de la función Cobb-Douglas correspondan a
1, y 0, respectivamente. La prueba de este resultado para los casos de proporciones fijas y de la función Cobb-Douglas requiere un argumento límite.
A menudo la función ESC se usa con una ponderación distributiva, (0 1), para indicar
la significación relativa de los insumos:
q f (k, l) [ k (1 )l] /.
(9.44)
Con rendimientos constantes a escala y 0, esta función converge a la forma de la función
Cobb-Douglas
q f (k, l) k l1 .
(9.45)
EJEMPLO 9.3 Función de producción de Leontief generalizada
Supóngase que la función de producción de un bien está dada por
k . l.
q f(k, l) k l 2冑苴
(9.46)
14
K. J. Arrow, H. B, Chenery, B. S. Minhas y R. M. Solow, “Capital-Labor Substitution and Economic Efficiency”, Review of Economics and Statistics (agosto de 1961), pp. 225-250.
15
Para la función ESC tenemos
TMST fl
( /
fk ( /
q(
q(
)/
)/
l
k
1
1
l
k
1
k
l
1 .
Aplicar la definición de la elasticidad de sustitución produce entonces
ln (k /l)
ln TMST
1
1
.
Adviértase en este cálculo que el factor cancela las funciones de productividad marginal, garantizando por tanto que estas
productividades marginales sean positivas aun si es negativa (como lo es en muchos casos). Esto explica por qué aparece en
dos lugares diferentes en la definición de la función ESC.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
320
Parte 4: Producción y oferta
Esta función es un caso especial de una clase de funciones llamada así en honor del economista rusoestadounidense Wassily Leontief.16 La función exhibe claramente rendimientos constantes a escala porque
f (tk, tl ) tk tl 2t 冑苴
kl tf (k, l ).
(9.47)
Las productividades marginales de la función de Leontief son
fk 1 (k /l )
0.5
,
(9.48)
0.5
fl 1 (k /l ) .
De ahí que las productividades marginales sean positivas y decrecientes. Como era de esperar (ya que su
función exhibe rendimientos constantes a escala), la TMST aquí sólo depende de la razón de los dos
insumos
TMST fl
1 (k /l ) 0.5
.
fk 1 (k /l ) 0.5
(9.49)
La TMST disminuye al reducirse k/l, así que las isocuantas tienen la forma convexa usual.
Hay dos maneras en las que puedes calcular la elasticidad de sustitución para esta función de producción. Primero, puedes advertir que en este caso especial la función puede factorizarse como
q k l 2冑苴
kl ( 冑苴k l ) 2 (k0.5 l 0.5 ) 2 ,
(9.50)
lo que deja en claro que esta función tiene una forma ESC con 0.5 y 1. De ahí que la elasticidad
de sustitución aquí sea 1/(1 ) 2.
Desde luego que en la mayoría de los casos no es posible hacer una factorización tan simple. Un enfoque más exhaustivo es aplicar la definición de la elasticidad de sustitución dada en la nota 6 de este capítulo:
fk fl
[1 (k /l) 0.5 ][1 (k /l)
f fk l
q 0.5 /冑苴
kl )
2 (k /l) 0.5 (k /l) 0.5
1 0.5(k /l) 0.5 0.5(k /l )
0.5
0.5
]
(9.51)
2.
Obsérvese que en este cálculo la razón de insumos (k/l) se elimina, dejando un resultado simple. En otras
aplicaciones, uno podría dudar de que ocurra un resultado tan fortuito, y de ahí que se dude de que la
elasticidad de sustitución sea constante a lo largo de una isocuanta (véase problema 9.7). Pero aquí el
resultado de que 2 es intuitivamente razonable, porque ese valor representa un arreglo entre la elasticidad de sustitución de la parte lineal de esta función de producción (q k l, ) y su parte de la
función Cobb-Douglas (q 2k0.5l 0.5, 1).
PREGUNTAS: ¿Qué puedes saber de esta función de producción graficando la isocuanta q 4? ¿Por qué
esta función generaliza el caso de proporciones fijas?
PROGRESO TÉCNICO
Los métodos de producción mejoran al paso del tiempo, y es importante poder recoger estas
mejoras con el concepto de función de producción. Una visión simplificada de ese progreso se
ofrece en la figura 9.5. Inicialmente, la isocuanta q0 registra las combinaciones de capital y trabajo
que pueden usarse para generar un nivel de producción de q0. Como resultado del desarrollo de
técnicas de producción superiores, esta isocuanta se desplaza a q0. Ahora el mismo nivel de pro16
Leontief fue pionero en el desarrollo del análisis de insumos-productos. En este se supone que la producción tiene lugar con una
tecnología de proporciones fijas. La función de producción de Leontief generaliza el caso de las proporciones fijas. Para más detalles véase el análisis de las funciones de producción de Leontief en las extensiones de este capítulo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
FIGURA 9.5
Progreso técnico.
321
El progreso técnico desplaza la isocuanta q0 hacia el origen. La nueva isocuanta q0, q0, indica que un nivel
dado de producción puede generarse ahora con menos insumos. Por ejemplo, con k1 unidades de capital
ahora sólo se necesitan l1 unidades de trabajo para generar q0, mientras que antes del avance técnico se
necesitaban l2 unidades de trabajo.
k por
periodo
k2
k1
q0
q′0
l1
l2
l por periodo
ducción puede generarse con menos insumos. Una forma de medir esta mejora es fijarse en que
con un nivel de insumo de capital de, digamos, k1, antes se necesitaban l2 unidades de trabajo para
producir q0, mientras que ahora sólo se necesita l1. La producción por trabajador ha aumentado
de q0/l2 a q0/l1. Pero debe tenerse cuidado en este tipo de cálculo. Un incremento en el insumo de
capital a k2 también habría permitido una reducción en el insumo de trabajo a l1 a lo largo de la
isocuanta original q0. En este caso, la producción por trabajador se incrementará igualmente,
aunque no haya habido ningún progreso técnico verdadero. El uso del concepto de la función de
producción puede ayudar a diferenciar entre estos dos conceptos y permitir, por tanto, a los economistas obtener una estimación atinada de la tasa de variación técnica.
Medición del progreso técnico
La primera observación por hacer acerca del progreso técnico es que, históricamente, la tasa de
crecimiento de la producción en el tiempo ha excedido la tasa de crecimiento atribuible al crecimiento en insumos convencionalmente definidos. Supongamos que concedemos que
q A(t)f (k, l)
(9.52)
es la función de producción de un bien (o quizá de la producción de una sociedad en su conjunto). El término A(t) en la función representa todas las influencias que intervienen en la determinación de una q diferente de k (horas-maquinaria) y l (horas-trabajo). Variaciones en A a lo
largo del tiempo representan progreso técnico. Por esta razón, A se muestra como una función de
tiempo. Presumiblemente, dA/dt 0; niveles particulares de insumos de trabajo y capital se vuelven más productivos con el paso del tiempo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
322
Parte 4: Producción y oferta
Contabilidad del crecimiento
Diferenciar la ecuación 9.52 respecto al tiempo da
dq dA
df (k, l)
f (k, l) A
dt
dt
dt
dA q
q
f dk f dl
.
dt A f (k, l) k dt l dt
(9.53)
dq/dt dA/dt
f/ k dk
f/ l dl
q
A
f (k, l ) dt f (k, l ) dt
(9.54)
dq/ dt dA/dt f
k
dk/dt f
l
dl /dt
.
q
A
k
l
k f (k, l )
l f (k, l )
(9.55)
Dividir entre q da
o
Ahora, para cualquier variable x, (dx/dt)/x es la tasa proporcional de crecimiento de x por unidad
de tiempo. Denotaremos esto con Gx.17 De ahí que la ecuación 9.55 pueda escribirse en términos de tasas de crecimiento como
Gq GA f
k
f
l
Gk Gt .
k f (k, l )
l f (k, l )
(9.56)
Pero
f
k
q k
elasticidad de producción respecto al capital eq, k
k f (k, l ) k q
(9.57)
f
l
q l
elasticidad de producción respecto al trabajo eq, l .
l f (k, l ) l q
(9.58)
y
Así, nuestra ecuación de crecimiento se convierte por fin en
Gq GA eq, k Gk eq, l Gl .
(9.59)
Esto indica que la tasa de crecimiento de la producción puede desintegrarse en la suma de dos
componentes: crecimiento atribuido a variaciones en los insumos (k y l) y otro crecimiento “residual” (es decir, variaciones en A) que representa progreso técnico.
La ecuación 9.59 brinda una manera de estimar la importancia relativa del progreso técnico
(GA) en la determinación del crecimiento de la producción. Por ejemplo, en un estudio pionero
de la economía estadounidense en general, entre 1909 y 1949, R. M. Solow registró los valores
siguientes para los términos de esa ecuación:18
Gq 2.75 por ciento anual,
Gl 1.00 por ciento anual,
Gk 1.75 por ciento anual,
(9.60)
eq, l 0.65,
eq, k 0.35.
Dos rasgos útiles de esta definición son: 1) Gx y Gx Gy; es decir, la tasa de crecimiento de un producto de dos variables es
la suma de las tasas de crecimiento de cada uno; y 2) Gx/y Gx Gy.
17
18
R. M. Solow, “Technical Progress and the Aggregate Production Function”, Review of Economics and Statistics, núm. 39 (agosto
de 1959), pp. 312-320.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
323
En consecuencia,
GA Gq eq, l Gl eq, k Gk
2.75 0.65(1.00
0.35(1.75)
2.75
0.65
0.60
(9.61)
1.50.
La conclusión a la que llegó Solow fue que la tecnología avanzó a una tasa de 1.5 por ciento al año,
de 1909 a 1949. Más de la mitad del crecimiento en producción real podría atribuirse a la variación técnica más que al crecimiento en las cantidades físicas de los factores de producción. Evidencias más recientes han tendido a confirmar las conclusiones de Solow sobre la importancia
relativa de la variación técnica. Sin embargo, impera la incertidumbre respecto a las causas precisas de esa variación.
EJEMPLO 9.4 Progreso técnico en la función de producción Cobb-Douglas
La función de producción Cobb-Douglas brinda una vía especialmente fácil para ilustrar el progreso
técnico. Suponiendo rendimientos constantes a escala, dicha función de producción con progreso técnico podría representarse mediante
q A(t)f (k, l ) A(t)k l1
.
(9.62)
Si se supone asimismo que el progreso técnico ocurre a una exponencial constante (), puede escribirse
A(t) Aet, y la función de producción se convierte en
q Aet k l1
.
(9.63)
Una forma particularmente fácil de estudiar las propiedades de este tipo de función en el tiempo es usar
“diferenciación logarítmica”:
ln q ln q q q/ t
[ln A t ln k (1
) ln l
Gq t
t
q
t
q
ln k
ln l
)Gl .
(1
Gk (1
t
t
(9.64)
Por tanto, esta derivación simplemente repite la ecuación 9.59 para el caso de la función Cobb-Douglas.
Aquí el factor del variación técnica se modela explícitamente, y las elasticidades de producción están
dadas por los valores de los exponentes en la función Cobb-Douglas.
La importancia del progreso técnico puede ilustrarse numéricamente con esta función. Supongamos
que A 10, 0.03, 0.5 y que una empresa usa una mezcla de insumos de k l 4. Entonces, en
t 0, la producción es 40( 10 . 40.5 . 40.5). Después de 20 años (t 20), la función de producción se
convierte en
q 10e0.03.20 k0.5 l 0.5 10
1.82)k0.5 l 0.5 18.2k0.5 l 0.5 .
(9.65)
En el año 20, la mezcla de insumos original produce ahora q 72.8. Desde luego que también habría
podido producirse q 72.8 en el año 0, pero esto habría absorbido muchos más insumos. Por ejemplo,
con k 13.25 y l 4 la producción es, en efecto, de 72.8, pero se usó mucho más capital. La producción
por unidad de insumo de trabajo se incrementaría de 10 (q/l 40/4) a 18.2 ( 72.8/4) en cualquier circunstancia, pero sólo el primer caso habría sido verdadero progreso técnico.
Progreso técnico de aumento de insumos. Resulta tentador atribuir el incremento en la productividad media del trabajo en este ejemplo a, digamos, mejores habilidades de los trabajadores, pero eso
sería engañoso en el caso de la función Cobb-Douglas. Uno podría igualmente haber dicho que la producción por unidad de capital se incrementó de 10 a 18.2 en los 20 años y atribuir este incremento a
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
324
Parte 4: Producción y oferta
mejor maquinaria. Un enfoque verosímil de modelización de mejoras en trabajo y capital por separado
es suponer que la función de producción es
q A(et k) (et l) 1
(9.66)
,
donde representa la tasa anual de mejora en el insumo de capital y representa la tasa anual de mejora
en el insumo de trabajo. Pero debido a la naturaleza exponencial de la función Cobb-Douglas, esto sería
indistinguible de nuestro ejemplo original:
q Ae[
(1
) t
k l1
Aet k l1
,
(9.67)
donde (1 ). De ahí que sea necesario estudiar el progreso técnico en los insumos particulares, ya sea para adoptar un modo más complejo de medir los insumos que permita mejorar la calidad o
(lo que equivale a lo mismo) para usar una función de producción con insumos múltiples.
PREGUNTA: Estudios reales de producción con el uso de la función Cobb-Douglas tienden a hallar
≈ 0.3. Usa este hallazgo junto con la ecuación 9.67 para analizar la importancia relativa de mejorar el
capital y la calidad del trabajo para la tasa general de progreso técnico.
Resumen
En este capítulo se ilustraron las formas en que los economistas
conceptualizan el proceso de producción de convertir insumos en
productos. La herramienta fundamental es la función de producción, la que —en su forma más simple— supone que la producción por periodo (q) es una función simple de los insumos de
capital y trabajo durante ese periodo, q f(k, l). Usando este
punto de partida se desarrollaron varios resultados básicos para la
teoría de la producción.
• Si todos menos uno de los insumos se mantienen constantes
puede derivarse una relación entre el insumo de una variable y
la producción. De esta relación es posible derivar la productividad física marginal (PM) del insumo como la variación en
producción resultante del incremento de una unidad en el uso
del insumo. Se supone que la productividad física marginal de
un insumo decrece al aumentar el uso del insumo.
• La función de producción entera puede ilustrarse mediante su
gráfica de isocuantas. La pendiente negativa de una isocuanta
se denomina tasa marginal de sustitución técnica (TMST) porque indica cómo un insumo puede ser sustituido por otro
manteniendo constante la producción. La TMST es la razón de
las productividades físicas marginales de los dos insumos.
puede derivarse exclusivamente del supuesto de productividades físicas marginales decrecientes. Uno también debe interesarse en el efecto de variaciones en un insumo sobre la productividad marginal de otros insumos.
• Los rendimientos a escala exhibidos por una función de producción registran cómo responde la producción a incrementos
proporcionales en todos los insumos. Si la producción aumenta
proporcionalmente con el uso de insumos, hay rendimientos
constantes a escala. Si hay incrementos más que proporcionales en la producción, hay retornos crecientes a escala, mientras
que si hay incrementos menos que proporcionales en producción, hay rendimientos decrecientes a escala.
• La elasticidad de sustitución ( ) aporta una medida de qué tan
fácil es sustituir un insumo por otro en la producción. Una
alta implica isocuantas casi lineales, mientras que una baja
implica que las isocuantas son casi en forma de L.
• El progreso técnico desplaza la función de producción entera y
su gráfica de isocuantas asociada. Mejoras técnicas pueden
surgir del uso de insumos mejorados y más productivos o de
mejores métodos de organización económica.
• Suele suponerse que las isocuantas son convexas, que obedecen el supuesto de una TMST decreciente. Este supuesto no
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
325
Problemas
9.1
Power Goat Lawn Company usa dos tamaños de podadoras para cortar el pasto. Las podadoras pequeñas tienen una plataforma de 56
centímetros. Las grandes combinan dos plataformas de 56 centímetros en una sola podadora. Para cada tamaño de podadora Power Goat
tiene una función de producción diferente, de acuerdo con la tabla siguiente.
Podadoras chicas
Podadoras grandes
Producción por hora
(kilometros cuadrados)
Insumo de capital
(# de podadoras de 56 cm)
Insumo
de trabajo
1.53
2.44
1
2
1
1
a. Grafica la isocuanta q 12.19 kilómetros cuadrados para la primera función de producción. ¿Cuántas k y l se usarían si estos factores
se combinaran sin desperdicio?
b. Responde el inciso a) para la segunda función.
c. ¿Cuántas k y l se usarían sin desperdicio si la mitad del pasto de 12.19 kilómetros cuadrados se podara con el método de la primera
función de producción y la otra mitad con el método de la segunda? ¿Cuántas k y l se usarían si un cuarto del pasto se podara con el
primer método y tres cuartos, con el segundo? ¿Qué significa hablar de fracciones de k y l?
d. Con base en tus observaciones en el inciso c), traza una isocuanta q 12.19 kilómetros para las funciones de producción combinadas.
9.2
Supón que la función de producción de artefactos está dada por
q kl 0.8k2 0.2l2,
donde q representa la cantidad anual de artefactos producida, k representa el insumo de capital anual y l representa el insumo de trabajo
anual.
a. Supón que k 10; grafica la productividad total y media de las curvas de trabajo. ¿En qué nivel del insumo de trabajo esta productividad media alcanza un máximo? ¿Cuántos artefactos se producen en ese punto?
b. Suponiendo de nuevo que k 10 grafica la curva PMgl. ¿En qué nivel del insumo de trabajo PMgl 0?
c. Supón que los insumos de capital aumentaron a k 20. ¿Cómo cambiarían tus respuestas de los incisos a) y b)?
d. ¿La función de producción de artefactos exhibe rendimientos a escala constantes crecientes o decrecientes?
9.3
Sam Malone considera la posibilidad de renovar los bancos de la barra de Cheers. La función de producción para nuevos bancos de barra
está dada por
q 0.1k0.2l 0.8,
donde q es el número de bancos producidos durante la semana de renovación, l representa el número de horas empleadas en tornos para
bancos durante la semana y l representa el número de horas utilizadas por los trabajadores durante el periodo. A Sam le gustaría proveer
10 bancos nuevos y ha asignado un presupuesto de $10 000 al proyecto.
a. Sam razona que como los tornos para los bancos y los trabajadores calificados en bancos de barra cuestan lo mismo ($50 por hora),
bien podría contratar estos dos insumos en cantidades iguales. Si Sam procede de esta manera, ¿cuánto de cada insumo contratará y
cuánto costará el proyecto de renovación?
b. Norman (que sabe algo acerca de bancos de barra) argumenta que, una vez más, Sam ha olvidado su microeconomía. Afirma que debería elegir cantidades de insumos, de tal manera que sus productividades marginales (no medias) sean iguales. Si Sam opta, en variar,
por este plan ¿cuánto de cada insumo contratará y cuánto costará el proyecto de renovación?
c. Tras oír que el plan de Norman ahorrará dinero, Claudio sostiene que Sam debería invertir los ahorros en más bancos para que se
sentaran más de sus colegas del Servicio Postal de Estados Unidos (USPS, por sus siglas en inglés). ¿Cuántos bancos más puede obtener
Sam de su presupuesto si sigue el plan de Claudio?
d. A Carla le preocupa que la sugerencia de Claudio signifique sencillamente más trabajo para ella en el servicio de alimentos a los clientes
del bar. ¿Cómo podría convencer a Sam de apegarse a su plan original de 10 bancos?
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
326
Parte 4: Producción y oferta
9.4
Supón que la producción de crayones (q) se realiza en dos sitios y usa sólo trabajo como insumo. La función de producción en el sitio 1 está
dada por q1 10l 10.5 y en el sitio 2 por q2 50l 20.5.
a. Si una sola empresa produce crayones en ambos sitios, obviamente querrá obtener la producción más grande posible dado el insumo
de trabajo que usa. ¿Cómo debería asignar trabajo entre los sitios para poder hacer eso? Explica precisamente la relación entre l1 y l2.
b. Suponiendo que la empresa opera de la manera eficiente que se describe en el inciso a), ¿cómo depende la producción total (q) de la
cantidad total de trabajo contratado (l)?
9.5
Como se ha visto ya en muchas partes, la función de producción general Cobb-Douglas para dos insumos está dada por
q f(k, l) Ak l ,
donde 0 1 y 0 1. Para esta función de producción:
a. Demuestra que f k 0, f1 0, f kk 0, f ll 0 y f kl f lk 0.
b. Demuestra que eq, k y eq, l .
c. En la nota 5, se definió la elasticidad de escala como
eq, t f (tk, tl)
t
t
,
f (tk, tl)
donde la expresión debe evaluarse en t 1. Demuestra que, para esta función Cobb-Douglas, eq, t . De ahí que, en este caso,
coincidan la elasticidad de escala y los rendimientos a escala de la función de producción (para más sobre este concepto, véase el problema 9.9).
d. Demuestra que esta función es cuasi cóncava.
e. Demuestra que la función es cóncava para 1 pero no cóncava para 1.
9.6
Supón que recibimos la función de producción ESC con rendimientos constantes a escala
q [k l]1/.
a.
b.
c.
d.
Demuestra que PMgk (q/k)1– y PMgl (q/l )1–.
Demuestra que TMST (k/l)1–; usa esto para demostrar que 1(1 ).
Determina las elasticidades de producción para k y l, y demuestra que su suma es igual a 1.
Comprueba que
q
l
q
l
y de ahí que
ln
q
l
ln
q
l
.
Nota: Esta última igualdad es útil en el trabajo empírico porque podemos aproximar q/l mediante la tasa salarial competitivamente
determinada. De ahí que pueda estimarse a partir de una regresión de ln(q/l) sobre ln w.
9.7
Considera una generalización de la función de producción del ejemplo 9.3:
kl 2k 3l,
q 0 1冑苴
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
327
donde
0 i 1, i 0, . . . , 3.
a. Si esta función debe exhibir rendimientos constantes a escala, ¿qué restricciones deberían imponerse a los parámetros 0, . . . , 3?
b. Demuestra que, en el caso de los rendimientos constantes a escala esta función exhibe productividades marginales decrecientes y que
las funciones de productividad marginal son homogéneas de grado 0.
c. Calcula en este caso. Aunque no es constante en general, ¿para qué valores de las , 0, 1, o ?
9.8
Demuestra que el teorema de Euler implica que, para una función de producción con rendimientos constantes a escala [q f(k, l)],
q f k . k f l . l.
Usa este resultado para demostrar que, para tal función de producción, si PMgl PMel, entonces PMgk debe ser negativa. ¿Qué implica esto
respecto a dónde debe tener lugar la producción? ¿Puede una empresa producir siempre en un punto en el que PMel es creciente?
Problemas analíticos
9.9 Rendimientos locales a escala
Una medida local de los rendimientos a escala incorporados en una función de producción está dada por la elasticidad de escala eq,
f(tk, tl)/t . t/q evaluada en t 1.
t
a. Demuestra que si la función de producción exhibe rendimientos constantes a escala, entonces eq, t 1.
b. Podemos definir las elasticidades de producción de los insumos k y l como
eq, k f (k, l) k
,
q
f (k, l) l
.
eq, l q
l
k
Demuestra que eq, t eq, k eq, l.
c. Una función que exhibe elasticidad de escala variable es
q (1 k1l1)1.
Demuestra que, para esta función, eq, t 1 para q 0.5 y que eq, t 1 para q 0.5.
d. Explica intuitivamente tus resultados del inciso c). Pista: ¿Tiene q un límite superior para esta función de producción?
9.10 Rendimientos a escala y sustitución
Aunque gran parte de nuestro análisis de la medición de la elasticidad de sustitución para varias funciones de producción ha supuesto
rendimientos constantes a escala, a menudo ese supuesto no es necesario. Este problema ilustra algunos de estos casos.
a. En la nota 6 se señaló que, en el caso de rendimientos constantes a escala, la elasticidad de sustitución para una función de producción
con dos insumos está dada por
fk fl
.
f fkl
Supón ahora que definimos la función de producción homotética F como
F(k, l) [f(k, l)] ,
donde f(k, l) es una función de producción con rendimientos constantes a escala y un exponente positivo. Demuestra que la elasticidad de sustitución para esta función de producción es la misma que la elasticidad de sustitución para la función f.
b. Muestra cómo se puede aplicar este resultado a las funciones de producción tanto de la función Cobb-Douglas como ESC.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
328
Parte 4: Producción y oferta
9.11 Más sobre el teorema de Euler
Supongamos que una función de producción f(x1, x2, . . . xn) es homogénea de grado k. El teorema de Euler demuestra que 冱i xifi kf, y
este hecho puede usarse para demostrar que las derivadas parciales de f son homogéneas de grado k 1.
a. Comprueba que 冱ni1 冱nj1xixj fij k(k 1)f .
b. En el caso de n 2 y k 1, ¿qué tipo de restricciones impone el resultado del inciso a) a la derivada parcial de segundo orden f12?
¿Cómo cambian tus conclusiones cuando k 1 o k 1?
c. ¿Cómo se generalizarían los resultados del inciso b) a una función de producción con cualquier número de insumos?
d. ¿Cuáles son las implicaciones de este problema para los parámetros de la función de producción mutivariable de la función CobbDouglas f (x1, x2, . . . xn) 兿ni1 xi i para i 0?
Sugerencias de lecturas adicionales
Clark, J. M. “Diminishing Returns”, Ecyclopaedia of the Social
Sciences, vol. 5, Crowell-Collier y Macmillan, Nueva York, 1931,
pp. 144-146.
El capítulo 5 proporciona un sofisticado, aunque escueto, repaso de la
teoría de la producción. El uso de la función de beneficios (véase el
capítulo 11) es sofisticado e iluminador.
Lúcido análisis del desarrollo histórico del concepto de rendimientos
decrecientes.
Shephard, R. W. Theory of Cost and Production Funtions, Princeton University Press, Princeton, Nueva Jersey, 1978.
Douglas, P. H. “Are There Laws of Production?”, American Economic Review, núm. 38 (marzo de 1948), pp. 1-41.
Amplio análisis de la relación dual entre funciones de producción y de
costo.
Buen análisis metodológico de los usos y abusos de las funciones de
producción.
Slberberg, E. y W. Suen. The Structure of Economics: A Mathematical Analysis, 3a. ed., Irwin/McGraw-Hill, Boston, 2001.
Ferguson, C. E. The Neoclassical Theory of Production and Distribution, Cambridge University Press, Nueva York, 1969.
Exhaustivo análisis de la dualidad entre funciones de producción y
curvas de costos. Da una prueba de que la elasticidad de sustitución
puede derivarse como se mostró en la nota 6 de este capítulo.
Estudio completo de la teoría de la función de producción (en 1970).
Buen uso de gráficas tridimensionales.
Fuss, M. y D. McFadden. Production Economics: A Dual Approach
to Theory and Application, North-Holland, Amsterdam, 1980.
Método con marcado énfasis en el uso de la dualidad.
Mas-Collell, A, M. D. Whinston y J. R. Green. Microeconomic
Theory, Oxford University Press, Nueva York, 1995.
Stigler, G. J. “The Division of Labor Is Limited by the Extent of the
Market”, Journal of Political Economy, núm. 59 (junio de 1951), pp.
185-193.
Atento rastreo de la evolución de las ideas de Smith sobre economías de
escala.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Funciones de producción
con muchos insumos
La mayoría de las funciones de producción que se ilustran en este
capítulo 9 pueden generalizarse fácilmente a casos de muchos
insumos. Aquí se demostrará esto para los casos de la función
Cobb-Douglas y ESC, y se examinarán después dos formas flexibles que tales funciones de producción podrían adoptar. En todos
estos ejemplos, las son parámetros no negativos y los n insumos
están representados por x1, . . . xr.
E9.1 Función Cobb-Douglas
La función de producción Cobb-Douglas con muchos insumos
está dada por
n
q
冲 xi
i1
i
(i)
.
EXTENSIONES
y ij 1. Debido a que este parámetro está tan restringido
en la función Cobb-Douglas, esta función no suele usarse en
análisis econométricos de datos microeconómicos sobre
empresas. Sin embargo, la función tiene varios usos generales
en macroeconomía, como ilustra el ejemplo siguiente.
El modelo de crecimiento de Solow
La función de producción Cobb-Douglas con muchos insumos
es uno de los rasgos primordiales de muchos modelos de crecimiento económico. Por ejemplo, el modelo pionero de crecimiento de equilibrio de Solow (1956) puede derivarse muy fácilmente, usando una función Cobb-Douglas con dos insumos y
rendimientos constantes a escala de la forma
q Ak l1 ,
a. Esta función exhibe rendimientos constantes a escala si
n
冱
i
1.
(ii)
donde A es un factor de variación técnica que puede representarse
mediante crecimiento exponencial de la forma
i1
A eat.
b. En la función Cobb-Douglas con rendimientos constantes a
escala, i es la elasticidad de q respecto al insumo xi. Dado que
0 i 1, cada insumo exhibe productividad marginal
decreciente.
c. Cualquier grado de rendimientos crecientes a escala puede
incorporarse en esta función, dependiendo de
^
q^ eat k ,
donde
^
冱
(iii)
i.
d. La elasticidad de sustitución entre dos insumos cualesquiera
en esta función de producción es de 1. Esto puede demostrarse
usando la definición dada en la nota 7 de este capítulo:
ln(xi /xj )
.
ln( fj /fi )
Aquí
fj
fi
i xj
j 1
i xi
i 1
冲ij xi
冲ji xj
i
j
j
i
xi
.
xj
De ahí que
ln
fj
fi
ln
(vi)
q^ q/l y k k/l
i1
ij
(v)
Dividir ambos miembros de la ecuación iv entre l produce
n
(iv)
j
i
ln
xi
xj
Solow demuestra que las economías evolucionarán hacia un valor
^
de equilibrio de k (la razón capital-trabajo). De ahí que diferencias
entre países en tasas de crecimiento puedan tomarse en cuenta
sólo mediante diferencias en el factor de variación técnica, a.
Dos características de la ecuación vi argumentan en favor de
incluir más insumos en el modelo de Solow. Primero, tal como
está, esa ecuación es incapaz de explicar las grandes diferencias en
producción per cápita (q^) que se observan alrededor del mundo.
Suponiendo que 0.3, digamos (cifra congruente con muchos
estudios empíricos), se necesitarían diferencias entre los países en
k/l de hasta 4 000 000 a 1 para explicar las diferencias 100 a
1 observadas en el ingreso per cápita, magnitud evidentemente
irrazonable. Introduciendo insumos adicionales, como capital
humano, estas diferencias se vuelven más explicables.
Una segunda deficiencia de la formulación simple de la función Cobb-Douglas del modelo de Solow es que no ofrece ninguna explicación del parámetro de la variación técnica, a; su valor
está determinado “exógenamente”. Al agregar factores adicionales
se vuelve más fácil entender cómo puede responder el parámetro
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
330
Parte 4: Producción y oferta
a a incentivos económicos. Este es el discernimiento clave de la
bibliografía sobre la teoría del crecimiento “endógeno” (para un
resumen, véase Romer, 1996).
x4 [ x1 (1 )x2 ]1/ .
Entonces, la función de producción final podría adoptar una
forma Cobb-Douglas:
E9.2 ESC
q x3 x4.
La función de producción de la elasticidad de sustitución constante (ESC) con muchos insumos está dada por
q
冱
i xi
/
,
(vii)
1.
a. Sustituyendo txi por cada producción, es fácil demostrar
que esta función exhibe rendimientos constantes a escala para
1. Para 1, la función exhibe rendimientos a escala
crecientes.
b. Esta función de producción exhibe productividades marginales decrecientes para cada insumo, porque 1.
c. Como en el caso con dos insumos, la elasticidad de sustitución
está dada aquí por
1
1
(viii)
,
y esta elasticidad se aplica a la sustitución entre cualesquiera
dos de los insumos.
Comprobación de la función Cobb-Douglas
en la Unión Soviética
Una forma en la que se usa la función ESC con multiinsumos
es para determinar si el parámetro de sustitución estimado () es
congruente con el valor implicado por la función Cobb-Douglas
( 0, 1). Por ejemplo, en un estudio de cinco grandes
industrias en la antigua Unión Soviética. E. Bairam (1991) determinó que la función Cobb-Douglas brinda una explicación relativamente buena de variaciones en producción en la mayoría de los
sectores manufactureros. Sólo para el procesamiento de alimentos
parece apropiado un valor bajo de .
Los tres ejemplos siguientes ilustran funciones de producción
de forma flexible que pueden aproximar cualquier función general de n insumos. En las “Extensiones” del capítulo 10 se examinarán las analogías de la función de costo con algunas de estas funciones, de uso más amplio que las funciones de producción mismas.
E9.3 Funciones de producciones anidadas
En algunas aplicaciones las funciones de producción Cobb-Douglas y ESC se combinan en una sola función “anidada”. Para hacer
esto los n insumos primarios originales se dividen en, digamos, m
clases generales de insumos. Los insumos específicos en cada una
de estas categorías se agregan después en un solo insumo compuesto y la función de producción final es una función de estos m
compuestos. Por ejemplo, supongamos que hay tres insumos primarios, x1, x2, x3. Y supongamos, sin embargo, que x1 y x2 están
relacionados en forma relativamente estrecha en su uso por las
empresas (por ejemplo, capital y energía), mientras que el tercer
insumo (trabajo) es relativamente distinto. Uno podría querer
entonces usar una función ESC agregadora para elaborar un
insumo compuesto para servicios de capital de la forma
(ix)
(x)
Esta estructura permite que la elasticidad de sustitución entre x1 y
x2 adopte cualquier valor [ 1/(1 )], pero restringe que la
elasticidad de sustitución entre x3 y x4 sea de uno. Otras opciones
están disponibles dependiendo de qué tan precisamente se especifiquen las funciones incrustadas.
La dinámica de la sustitución capital/energía
Las funciones de producción anidadas se han usado ampliamente
en los estudios que intentan medir la naturaleza precisa de la sustitución entre insumos de capital y energía. Por ejemplo, Atkeson
y Kehoe (1999) usan un modelo más bien parecido al especificado
en las ecuaciones ix y x para tratar de conciliar dos hechos sobre el
modo en que los precios de la energía afectan la economía: 1) a lo
largo del tiempo, el uso de energía en la producción parece un
tanto insensible al precio (al menos a corto plazo), y 2) entre países, los precios de la energía parecen tener gran influencia respecto a cuánta energía se usa. Usando una ecuación de servicio de
capital de la forma dada en la ecuación ix con un bajo grado
de sustitución ( 2.3) —junto con una función de producción Cobb-Douglas que combina trabajo con servicios de capital—, estos autores lograron reproducir muy bien los hechos sobre
los precios de la energía. Concluyeron, sin embargo, que este
modelo implica un efecto mucho más negativo de los altos precios
de la energía sobre el crecimiento económico del que parece realmente haber sido el caso. De ahí que en última instancia hayan
optado por una forma más compleja de modelo de la producción
que subraya diferencias en el uso de la energía entre inversiones
de capital realizadas en fechas diferentes.
E9.4 Leontief generalizado
n
q
n
冱冱
ij
冑苴苴
xi xj ,
i1 j1
donde
ij
ji.
a. La función considerada en el problema 9.7 es un caso simple
de esta función para el caso n 2. Para n 3, esta función
tendría términos lineales en los tres insumos junto con tres
términos radicales en representación de todos los posibles
productos cruzados de los insumos.
b. Esta función exhibe rendimientos constantes a escala, como
puede demostrarse usando txi. Rendimientos crecientes a
escala pueden incorporarse en esta función usando la transformación
q q,
1.
c. Puesto que cada insumo aparece linealmente así como bajo el
radical, esta función exhibe productividades marginales
decrecientes en todos los insumos.
d. La restricción ij ji se usa para garantizar la simetría de las
derivadas parciales de segundo orden.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 9: Funciones de producción
A9.5 Translog
n
ln q 0
冱
n
i
ln xi 0.5
i1
n
冱冱
ij
ln xi ln xj ,
i1 j1
ij
ji .
a. Nótese que la función Cobb-Douglas es un caso especial de
esta función donde 0 ij 0 para todas las i, j.
b. Como en el caso de la función Cobb-Douglas esta función
puede asumir cualquier grado de rendimientos a escala. Si
n
冱
i1
n
i
1 y
冱
ij
0
j1
para todas las i, entonces esta función exhibe rendimientos
constantes a escala. La prueba requiere cierto cuidado en el
manejo de la doble suma.
c. Nuevamente, se requiere la condición ij ji para garantizar
la igualdad de las derivadas parciales cruzadas.
Inmigración
Puesto que la función de producción translog incorpora gran
número de posibilidades de sustitución entre varios insumos, se le
ha usado ampliamente para estudiar los modos en que los trabajadores recién llegados pueden sustituir a los ya existentes. De particular interés es la forma en que el nivel de habilidad de los inmi-
331
grantes puede conducir a reacciones diferentes en la demanda de
trabajadores calificados y no calificados en la economía interna.
Estudios de Estados Unidos y muchos otros países (como Canadá,
Alemania y Francia) han sugerido que la magnitud general de
tales efectos es modesta, en especial dados los flujos de inmigración relativamente reducidos. Pero hay ciertas evidencias de que
los trabajadores inmigrantes no calificados sí podrían actuar
como sustitutos de los trabajadores nacionales no calificados,
pero como complementos de los trabajadores nacionales calificados. De ahí que mayores flujos de inmigración puedan exacerbar
tendencias hacia crecientes diferenciales salariales. Para un resumen, véase Borjas (1994).
Referencias
Atkeson, Andrew y Patrick J. Kehoe. “Models of Energy Use:
Putty-Putty versus Putty-Clay”, American Economic Review
(septiembre de 1999), pp. 1028-1043.
Bairam, Erkin. “Elasticity of Substitution, Technical Progress and
Returns to Scale in Branches of Soviet Industry: A New CES
Production Function Approach”, Journal of Applied Economics (enero-marzo de 1991), pp. 91-96.
Borjas, G. J. “The Economics of Immigration”, Journal of Economic
Literature (diciembre de 1994), pp. 1667-1717.
Romer, David. Advanced Macroeconomics, McGraw-Hill, Nueva
York, 1996.
Solow, R. M. “A Contribution to the Theory of Economic Growth”,
Quarterly Journal of Economics (febrero de 1956), pp. 65-94.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
CAPÍTULO
DIEZ
Funciones de costo
En este capítulo se ilustran los costos en que incurre la empresa cuando genera productos. En el
capítulo 11 se abundará en este tema, mostrando cómo las empresas toman decisiones de insumos
cios.
DEFINICIONES DE COSTOS
cultades sobre la apropiada
camente, debe distinguirse entre 1) costo contable y 2) costo económico. La visión de costos del contador subraya los desembolsos, costos históricos, depreciación
nición de costo del economista (que en formas obvias se sirve de la noción fundamental de costo de oportunidad) es que el costo de cualquier insumo está dado por la magnitud del pago necesario para mantener el recurso en su empleo
presente. O bien, el costo económico de usar un insumo es lo que se le pagaría a ese insumo en su
nen
en cada sistema los costos de varios insumos (trabajo, capital y servicios empresariales).
Costos del trabajo
Economistas y contadores consideran los costos del trabajo casi de la misma manera. Para los
contadores los gastos en trabajo son gastos corrientes y, por tanto, costos de producción. Para
costo explícito. Los servicios de trabajo (horas-trabajo) se contratan a alguna tasa salarial por hora (w), y suele suponerse que eso es también lo que los servicios
de trabajo ganarían en su mejor empleo alterno. El salario por hora, desde luego, incluye los costos de las prestaciones ofrecidas a los empleados.
Costos de capital
En el caso de los servicios del capital (h
eren. Al
calcular los costos de capital, los contadores usan el precio histórico de la máquina particular bajo
investigación y aplican alguna regla de depreciación más o menos arbitraria para determinar
cuánto del precio original de esa máquina cargar a los costos corrientes. Los economistas consideran el precio histórico de una máquina como un “costo sumergido”, el cual es irrelevante para
las decisiones de producción. Consideran, en cambio, el costo implícito de la máquina como lo
que alguien estaría dispuesto a pagar por su uso. Por tanto el costo, de una hora-máquina es la tasa
de arrendamiento de esa máquina en su mejor uso alterno. Al seguir usando la máquina, la
333
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
334
Parte 4: Producción y oferta
empresa renuncia implícitamente a lo que alguien estaría dispuesto a pagar por usarla. Esta tasa
de arrendamiento por hora-máquina se denotará con v.1
Supongamos que una compañía compra una computadora por 2 000 dólares. Un contador que
aplique un método de depreciación de “línea recta” de cinco años considerará que esa computadora tiene un costo de 400 dólares anuales. Un economista examinaría el valor de mercado de
la computadora. La disponibilidad de computadoras mucho más veloces en años subsecuentes
puede causar que el precio de segunda mano de la computadora original se reduzca precipitadamente. Si el precio de segunda mano disminuye hasta, por ejemplo, 200 dólares después del
primer año, el costo económico se relacionará con esos 200 dólares; el precio original de $2 000
ya no será relevante. (Todos estos costos anuales pueden convertirse fácilmente en costo por
hora-computadora, desde luego.)
La distinción entre costos contables y costos económicos de capital desaparece en gran medida
si la compañía la renta a un precio de v en cada periodo en vez de adquirirla. Entonces v refleja un
gasto corriente de la compañía que aparece directamente como un costo contable; también refleja
el valor de mercado del uso del capital durante un periodo y es, por tanto, un costo de oportunidad/económico.
Costos de servicios empresariales
El dueño de una empresa es un reclamante residual con derecho a cualquier ingreso adicional o
pérdidas luego de pagar otros costos de insumos. Para un contador estas se llamarían beneficios
(los cuales pueden ser positivos o negativos). Los economistas, en cambio, preguntan si los dueños
(o empresarios) también se topan con costos de oportunidad trabajando en una empresa en particular o dedicando parte de sus fondos a su operación. De ser así, estos servicios deberían considerarse un insumo, y algún costo debe imputarse a ellos. Por ejemplo, supongamos que un programador de computadoras altamente calificado abre una empresa de software con la idea de
mantener los beneficios (de contabilidad) que puedan generarse. El tiempo del programador es
evidentemente un insumo para la empresa, y debe atribuírsele un costo. El salario que el programador exigiera, si trabajara para otro, podría usarse con ese propósito. De ahí que una parte de los
beneficios contables generados por la empresa, los economistas los catalogan como costos empresariales. Los beneficios económicos serían menores a los contables y podrían ser negativos si los
costos de oportunidad del programador excedieran los beneficios contables obtenidos por el negocio. Argumentos similares se aplican al capital que un emprendedor suministra a la empresa.
Costos económicos
No es de sorprender que en este libro usemos la definición costo de los economistas.
DEFINICIÓN
Costo económico. El costo económico de un insumo es el pago requerido para mantener ese insumo en
su empleo presente. En forma equivalente, el costo económico de un insumo es la remuneración que el
insumo recibiría en su mejor empleo alterno.
El uso de esta definición no persigue implicar que los conceptos de los contadores sean irrelevantes para el comportamiento económico. En realidad, los procedimientos contables son integralmente importantes para el proceso de toma de decisiones de cualquier gerente, porque pueden
afectar enormemente la tasa tributaria por aplicar a los beneficios. Asimismo, los datos contables
son fáciles de conseguir, mientras que los datos sobre costos económicos a menudo deben desarrollarse por separado. Las definiciones de los economistas, sin embargo, tienen las características
1
A veces el símbolo r se elige para representar la tasa de arrendamiento del capital. Como esta variable suele confundirse con el
concepto asociado pero distinto de la tasa de interés del mercado, aquí se eligió otro símbolo. La relación exacta entre v y la tasa
de interés se examina en el capítulo 17.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 10: Funciones de costo 335
deseables de ser ampliamente aplicables a todas las empresas y de formar un sistema conceptualmente coherente. Por tanto, son ideales para un análisis teórico general.
Supuestos simplificadores
En un principio haremos dos simplificaciones sobre los insumos que usa una empresa. Primero,
supondremos que sólo hay dos insumos: trabajo homogéneo (l, medido en horas-trabajo) y capital homogéneo (k, medido en horas-máquina). Los costos empresariales se incluyen en los costos
de capital. Es decir, supondremos que los principales costos de oportunidad que enfrenta el
dueño de una empresa son los asociados con el capital que el propio dueño aporta.
Segundo, supondremos que los insumos se contratan en mercados perfectamente competitivos.
Las empresas pueden comprar (o vender) todos los servicios de trabajo y capital que quieran a las
tasas de arrendamiento prevalecientes (w y v). En términos gráficos, la curva de oferta de estos
recursos es horizontal en los precios de los factores prevalecientes. Tanto w como v se tratan como
“parámetros” en las decisiones de la empresa; no hay nada que la empresa pueda hacer para afectarlos. Estas condiciones se relajarán en capítulos posteriores (principalmente el capítulo 16), pero
por el momento es conveniente y útil establecer la hipótesis del tomador de precios. Por tanto, con
estas simplificaciones, el costo total C para la empresa durante el periodo está dado por
costo total C wl vk
(10.1)
donde, como ya se dijo, k y l representan uso de insumos durante el periodo.
Relación entre maximización de beneficios
y minimización de costos
Adelantémonos aquí y comparemos el análisis de este capítulo con el del capítulo siguiente sobre
maximización de beneficios. Definiremos las beneficios económicos () como la diferencia entre
los ingresos totales de la empresa (I) y sus costos totales (C). Supongamos que la empresa toma
como establecido el precio del mercado (p) para su producción total (q) y que su función de producción es q f(k, l). Entonces, los beneficios pueden escribirse como
I C pq wl vk pf (k, l) wl vk.
(10.2)
La ecuación 10.2 indica que los beneficios económicos obtenidos por esta empresa son una función de la cantidad de capital y trabajo empleado. Si, como suponemos en muchos segmentos de
este libro, esta empresa persigue beneficios máximos, podríamos estudiar su comportamiento
examinando cómo se eligen k y l para maximizar la ecuación 10.2. Esto conduciría a su vez a una
teoría de la oferta y a una teoría de la “demanda derivada” de insumos de capital y trabajo. En el
capítulo siguiente nos ocuparemos en detalle de estos temas.
Aquí, en cambio, queremos desarrollar una teoría de los costos un poco más general que se
aplique no sólo a empresas tomadoras de precios en sus mercados de productos (competidores
perfectos), sino también a aquellas cuya elección de producción afecta al precio de mercado
(monopolios y oligopolios). Esa teoría más general se aplicará incluso a organizaciones no lucrativas (mientras se interesen en operar eficientemente). La otra ventaja de estudiar la minimización
de costos, aparte de la maximización de los beneficios, es que es más simple analizar esta pequeña
“pieza” por separado y sólo después añadir los discernimientos obtenidos al “rompecabezas”
general de las operaciones de la empresa. Las condiciones derivadas para decisiones de insumos
minimizadoras de costos emergerán de nueva cuenta en este capítulo como un “subproducto” del
análisis de la maximización de los beneficios especificado en la ecuación 10.2.
De ahí que comencemos el estudio de los costos elaborando, por el momento, un análisis de la
decisión de producción. Es decir, supongamos que por alguna razón la empresa ha decidido generar un nivel particular de producción (digamos q0). La empresa obtendrá desde luego ciertos
ingresos R de esta decisión de producción, pero ignoraremos los ingresos por ahora. Nos concentraremos solamente en la pregunta de cómo la empresa puede producir q0 a un costo mínimo.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
336
Parte 4: Producción y oferta
DECISIONES DE INSUMOS DE
MINIMIZACIÓN DE COSTOS
Matemáticamente este es un problema de minimización restringida. Pero antes de proceder con
una solución rigurosa es útil enunciar el resultado por derivar con un argumento intuitivo. Para
minimizar el costo de generar un nivel dado de producción, una empresa debe elegir el punto en
la isocuanta q0 en el que la tasa de sustitución técnica de l por k es igual a la razón w/v: esto debería igualar la tasa a la que k puede cambiarse por l en la producción, con la tasa a la que pueden
canjearse en el mercado. Supongamos que esto no es cierto; en particular, que la empresa genera
un nivel de producción q0 usando k 10, l 10, y que la TMST es de 2 en este punto. Supóngase
también que w $1, v $1, y de ahí que w/v 1 (lo que no es igual a 2). En esta combinación
de insumos el costo de producir q0 es de 20 dólares. Es fácil demostrar que este no es el costo de
insumos mínimo. Por ejemplo, q0 también puede producirse usando k 8 y l 11; podemos
renunciar a dos unidades de k y mantener constante la producción en q0, añadiendo una unidad
de l. Pero en esta combinación de insumos el costo de producir q0 es de 19 dólares, y de ahí que la
combinación de insumos inicial no sea la óptima. Una contradicción similar puede mostrarse
cada vez que la TMST y la razón de costos de los insumos difieren.
Análisis matemático
Matemáticamente se busca minimizar los costos totales dado que q f (k, l) q0. Al establecer la
expresión lagrangiana
ᏸ wl vk [q0 f (k, l)],
(10.3)
las condiciones de primer orden para un mínimo restringido son
ᏸ
f
w 0,
l
l
ᏸ
f
v 0,
k
k
ᏸ
q0 f (k, l) 0,
(10.4)
o, dividiendo las dos primeras ecuaciones,
w f / l
TMST (de l por k).
v f / k
(10.5)
Esto indica que la empresa minimizadora de costos debe igualar la TMST de los dos insumos con
la razón de sus precios.
Interpretaciones adicionales
Estas condiciones de primer orden para costos mínimos pueden manipularse de varias maneras
para rendir resultados interesantes. Por ejemplo, la multiplicación cruzada de la ecuación 10.5 da
fk fl
.
v w
(10.6)
Es decir, para que los costos sean minimizados la productividad marginal por dólar gastado debe
ser la misma para todos los insumos. Si incrementar un insumo ofreciera incrementar la producción en una cantidad mayor por dólar gastado que otro insumo, los costos no serían mínimos; la
empresa debería contratar más del insumo que ofrece un mayor “impacto por dólar” y menos del
insumo más costoso (en términos de productividad). Cualquier insumo que no pueda satisfacer la
razón común de costo-beneficio definida en la ecuación 10.6 no debe ser contratado en absoluto.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 10: Funciones de costo 337
La ecuación 10.6 también puede derivarse, por supuesto, de la ecuación 10.4, pero es más instructivo derivar su inversa:
w v
.
fl fk
(10.7)
Esta ecuación reporta el costo adicional de obtener una unidad adicional de producción, contratando ya sea trabajo adicional o capital adicional. A causa de la minimización de costos este costo
marginal es el mismo sin importar qué insumo se contrate. Este costo marginal común también
es medido por el multiplicador de Lagrange del problema de minimización de costos. Lo mismo
que para todos los problemas de optimización restringida, aquí el multiplicador de Lagrange
indica en cuántos costos adicionales se incurriría en un incremento ligero de la restricción de
producción. Puesto que el costo marginal desempeña un papel importante en las decisiones
de oferta de una empresa, volveremos con frecuencia a esta característica de la minimización de
costos.
Análisis gráfico
La minimización de costos se muestra gráficamente en la figura 10.1. Dada la isocuanta de producción q0, queremos encontrar el punto menos costoso en la isocuanta. Las líneas que señalan
costo igual son líneas rectas paralelas con pendientes –w/v. En la figura 10.1 aparecen tres líneas
de costo total igual; C1 C2 C3. De esta figura se deduce claramente que el costo total mínimo
para producir q0 está dado por C1, donde la curva de costo total es tangente a la isocuanta. Los
insumos asociados son l c y k c, donde los superíndices enfatizan que estos niveles de insumos son
una solución a un problema de minimización de costos. Esta combinación será un mínimo verdadero si la isocuanta es convexa (si la TMST decrece al decrecer k/l). Los análisis matemático y
gráfico llegan a la misma conclusión, como sigue.
FIGURA 10.1
Minimización de costos
dada q q0.
Se supone que una empresa elige k y l para minimizar sus costos totales. La condición para esta minimización es que la tasa a la que k y l pueden intercambiarse técnicamente (manteniendo q q0 debe ser igual a
la tasa a la que estos insumos pueden intercambiarse en el mercado. En otras palabras, la TMST (de k por l)
debe igualarse con la razón de precios w/v. Esta tangencia se muestra en la figura; los costos se minimizan
en C1 eligiendo los insumos kc y lc.
k por periodo
C1
C2
C3
kc
q0
lc
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
l por periodo
23.08.2019
8/23
338
Parte 4: Producción y oferta
PRINCIPIO DE
OPTIMIZACIÓN
Minimización de costos. Para minimizar el costo de cualquier nivel dado de producción q0, la empresa
debe producir en el punto en la isocuanta q0 para el cual la TMST (de l por k) es igual a la razón de los
precios de arrendamiento de los insumos (w/v).
Demanda contingente de insumos
La figura 10.1 exhibe la semejanza formal entre el problema de minimización de costos de la
empresa y el problema de minimización de gastos del individuo, que se estudió en el capítulo 4
(véase la figura 4.6). En ambos problemas el actor económico intenta alcanzar su objetivo (producción o utilidad) a un costo mínimo. En el capítulo 5 se mostró cómo se usa este proceso para
elaborar una teoría de la demanda compensada de un bien. En el caso presente la minimización
de costos conduce a una demanda de capital y trabajo contingente al nivel de producción por
generar. Por tanto, esta no es la historia completa de la demanda de los insumos que usa una
empresa porque no aborda el asunto de la decisión de producción. Sin embargo, estudiar la
demanda contingente de insumos aporta un elemento importante al análisis de la demanda general de insumos de la empresa, y este tema lo abordaremos en detalle más adelante.
Trayectoria de expansión de la empresa
Una empresa puede seguir el proceso de minimización de costos para cada nivel de producción:
para cada q, encuentra la decisión de insumos que minimiza el costo de producirla. Si los costos de los insumos (w y v) se mantienen constantes para todas las cantidades que la empresa
pueda demandar, podemos trazar fácilmente este locus de decisiones de minimización de costos.
Este procedimiento se advierte en la figura 10.2. La curva 0E registra las tangencias de minimización de costos para niveles de producción sucesivamente más altos. Por ejemplo, el costo mínimo
de generar el nivel de producción q1 está dado por C1, y se usan los insumos k1 y l1. Otras tangen-
FIGURA 10.2
Trayectoria de expansión
de la empresa.
La trayectoria de expansión de la empresa es el locus de las tangencias de minimización de costos. Suponiendo precios fijos de los insumos, la curva muestra cómo se incrementan los insumos al aumentar la
producción.
k por periodo
E
q3
k1
q2
C1
0
C2
l1
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
C3
q1
l por periodo
23.08.2019
8/23
Capítulo 10: Funciones de costo 339
cias en la figura pueden interpretarse en forma similar. El locus de estas tangencias se llama trayectoria de expansión de la empresa, porque registra cómo crecen los insumos al crecer la producción manteniendo constantes los precios de los insumos.
Como muestra la figura 10.2, la trayectoria de expansión no necesita ser una línea recta. El uso
de algunos insumos puede aumentar más pronto que el de otros al expandirse la producción. Qué
insumos se expanden más rápido dependerá de la forma de las isocuantas de producción. Como
la minimización de costos requiere que la TMST se iguale siempre con la razón w/v, y como la
razón w/v se supone constante, la forma de la trayectoria de expansión estará determinada por en
dónde ocurre una TMST particular en isocuantas sucesivamente más altas. Si la función de producción exhibe rendimientos constantes a escala (o, más generalmente, si es homotética), la trayectoria de expansión será una línea recta porque en ese caso la TMST sólo depende de la razón
de k a l. Esa razón sería constante a lo largo de tal trayectoria de expansión lineal.
Parecería razonable suponer que la trayectoria de expansión será de pendiente positiva; es
decir, que los niveles de producción sucesivamente más altos requerirán más de dos insumos. Este
no es necesariamente el caso, sin embargo, como ilustra la figura 10.3. Incrementos de producción
más allá de q2 causan que la cantidad de trabajo usada decrezca. En este rango se diría que el trabajo es un insumo inferior. La ocurrencia de insumos inferiores es entonces una posibilidad teórica que puede ocurrir, aun si las isocuantas tienen su forma convexa usual.
Mucho del análisis teórico se ha centrado en el estudio de la inferioridad de los factores. Que
la inferioridad es probable que ocurra en funciones de producción reales es una pregunta empírica difícil de contestar. Parece improbable que magnitudes tan amplias como “capital” y “trabajo”
pudieran ser inferiores, pero una clasificación de insumos más fina puede traer a la luz la inferioridad. Por ejemplo, el uso de palas puede decrecer al incrementarse la producción de cimientos de
edificios (y el uso de excavadoras). En este libro no nos interesarán en particular los temas analíticos planteados por esta posibilidad, aunque en algunas secciones se mencionarán las complicaciones representadas por insumos inferiores.
FIGURA 10.3
Inferioridad de insumos.
Con este conjunto particular de isocuantas el trabajo es un insumo inferior, porque se elige menos de l al
expandirse la producción más allá de q2.
k por periodo
E
q4
q3
q2
q1
0
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
l por periodo
23.08.2019
8/23
340
Parte 4: Producción y oferta
EJEMPLO 10.1 Minimización de costos
El proceso de minimización de costos puede ilustrarse fácilmente con dos de las funciones de producción
que encontramos en el capítulo anterior.
1. Función Cobb-Douglas: q f (k, l) k l . Para este caso, la expresión lagrangiana relevante para
minimizar el costo de producir, digamos, q0 es
ᏸ vk wl (q0 k l ),
(10.8)
y las condiciones de primer orden para un mínimo son
ᏸ
v k 1 l 0,
k
ᏸ
w k l 1 0,
l
ᏸ
q0 k l 0.
(10.9)
Dividir la segunda de estas ecuaciones entre la primera produce
w k l 1 k
,
v
l
k 1 l
(10.10)
que otra vez muestra que los costos se minimizan cuando la razón de los precios de los insumos es
igual a la TMST. Dado que la función Cobb-Douglas es homotética, la TMST sólo depende de la
razón de los dos insumos. Si la razón de costos de los insumos no varía, las empresas usarán la misma
razón de insumos sin importar cuánto produzca; es decir, la trayectoria de expansión será una línea
recta a través del origen.
Como ejemplo numérico, supongamos que 0.5, w 12, v 3 y que la empresa desea
producir q0 40. La condición de primer orden para un mínimo requiere que k 4l. Al insertar esto
en la función de producción (el requisito final en la ecuación 10.9), tenemos q0 40 k0.5l0.5 2l.
Por tanto, la combinación de insumos de minimización de costos es l 20 y k 80, y los costos
totales están dados por vk wl 3(80) 12(20) 480. Que este es un verdadero mínimo de costos
se sugiere al examinar otras combinaciones de insumos también capaces de generar 40 unidades de
producción:
k 40, l 40, C 600,
k 10, l 160, C 2 220,
(10.11)
k 160, l 10, C 600.
Cualquier otra combinación de insumos capaz de generar 40 unidades de producción también costará más que 480. La minimización de costos es sugerida asimismo al considerar las productividades
marginales. En el punto óptimo
PMk f k 0.5k
0.5 0.5
PMl f l 0.5k0.5 l
l
0.5
0.5(20 /80) 0.5 0.25,
0.5(80 /20) 0.5 1;
(10.12)
de ahí que, en el margen, el trabajo sea cuatro veces más productivo que el capital, y esta productividad adicional compensa exactamente el precio unitario más alto del insumo de trabajo.
2. ESC: q f (k, l) (k l ) /. Establecemos de nueva cuenta la expresión lagrangiana
ᏸ vk wl [q0 (k l ) /],
(10.13)
y las condiciones de primer orden para un mínimo son
ᏸ
v ( /)(k l ) ( )/ ()k k
ᏸ
w ( /)(k l ) ( )/ ()l l
ᏸ
k l ) ( ) 0.
q0
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
1
0,
1
0,
(10.14)
8/23
Capítulo 10: Funciones de costo 341
Dividir las dos primeras de estas ecuaciones causa la eliminación de gran parte de esta masa de símbolos, dejando
w
l
v
k
1
k
l
1 k
l
1/
,
o
k
w
l
v
,
(10.15)
donde 1/(1 ) es la elasticidad de sustitución. Dado que la función ESC también es homotética, la razón de insumos minimizadores de costos es independiente del nivel absoluto de producción. El resultado en la ecuación 10.15 es una generalización simple del resultado de la función
Cobb-Douglas (cuando 1). Con la función Cobb-Douglas la razón capital-trabajo de minimización de costos varía directamente en proporción a las variaciones en la razón de los salarios con las
tasas de arrendamiento del capital. En casos con mayor sustituibilidad ( 1), las variaciones en la
razón de los salarios con las tasas de arrendamiento causan un incremento más que proporcional en
la razón capital-trabajo de minimización de costos. Con menos sustituibilidad ( 1), la respuesta
es proporcionalmente menor.
PREGUNTAS: En el ejemplo numérico de la función Cobb-Douglas con w/v 4, se determinó que la
razón de insumos de minimización de costos para generar 40 unidades de producción era k/l 80/20 4. ¿Cómo variaría este valor para 2 o 0.5? ¿Qué combinaciones de insumos reales se usarían?
¿Cuáles serían los costos totales?
FUNCIONES DE COSTO
Ahora estamos en posición de examinar la estructura general de costos de la empresa. Para
hacerlo será conveniente usar las soluciones de la trayectoria de expansión para derivar la función
de costo total.
DEFINICIÓN
Función de costo total. La función de costo total indica que, para cualquier conjunto de costos de insumos y para cualquier nivel de producción, el costo total mínimo en que incurre la empresa es
C C(v, w, q).
(10.16)
La figura 10.2 deja ver claramente que los costos totales se incrementan al aumentar la producción, q. Comenzaremos analizando esta relación entre costo total y producción, manteniendo
fijos los precios de los insumos. Luego se considerará cómo una variación en el precio de un
insumo desplaza la trayectoria de expansión y sus funciones de costo asociadas.
Funciones de costo medio y marginal
Aunque la función de costo total proporciona información completa sobre la relación producción-costo a menudo es conveniente analizar los costos por unidad de producción, porque este
método se corresponde más estrechamente con el análisis de la demanda el cual se centró en el
precio por unidad de un bien. En economía se usan ampliamente dos diferentes medidas de
costo unitario: 1) costo medio, que es el costo por unidad de producción, y 2) costo marginal,
el costo de una unidad más de producción.
DEFINICIÓN
Funciones de costos medio y marginal: La función de costo medio (CMe) se determina calculando los
costos totales por unidad de producción:
costo medio CMe (v, w, q) Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
C(v, w, q)
.
q
(10.17)
8/23
342
Parte 4: Producción y oferta
La función de costo marginal (CMg) se determina calculando la variación en costos totales por una variación en la producción generada:
costo marginal CMg (v, w, q) C(v, w, q)
.
q
(10.18)
Nótese que en estas definiciones los costos medio y marginal dependen del nivel de producción
generado y de los precios de los insumos. En muchas secciones de este libro se graficarán relaciones bidimensionales simples entre costos y producción. Tal como dejan ver claramente las definiciones, todas estas gráficas se trazan con base en el supuesto de que los precios de los insumos
permanecen constantes y de que la tecnología no cambia. Si los precios de los insumos varían o si
la tecnología avanza, las curvas de costos generalmente se desplazarán a posiciones nuevas. Más
adelante se explorarán las probables dirección y magnitud de esos desplazamientos, al estudiar en
detalle la función de costo total.
Análisis gráfico de los costos totales
Las figuras 10.4a y 10.5a ilustran dos formas posibles de la relación entre costo total y nivel de
producción de la empresa. En la figura 10.4a, el costo total es simplemente proporcional a la producción. Esta situación surgiría si la función de producción subyacente exhibe rendimientos
constantes a escala. En ese caso, supóngase que se requieren k1 unidades de insumo de capital y l1
unidades de insumo de trabajo para generar una unidad de producción. Así pues,
C(q 1) vk1 wl1.
(10.19)
Para generar m unidades de producción se requieren mk1 unidades de capital y ml1 unidades de
trabajo, debido al supuesto de rendimientos constantes a escala.2 De ahí que
C(q m) vmk1 wml1 m(vk1 wl1 )
m C(q 1),
(10.20)
y se establece la proporcionalidad entre producción y costo.
La situación en la figura 10.5a es más complicada. Ahí se supone que inicialmente la curva de
costo total es cóncava; aunque al principio los costos se aumentan rápido para incrementos en la
producción, esa tasa de incremento se reduce cuando la producción se expande al rango intermedio de producción. Más allá de este rango medio, sin embargo, la curva de costo total se vuelve
convexa, y los costos comienzan a aumentar en forma progresivamente más rápida. Una posible
razón de esta forma de la curva de costo total es que hay un tercer factor de producción (digamos,
los servicios de un emprendedor) que es fijo mientras el uso de capital y trabajo se expande. En
este caso, la sección cóncava inicial de la curva podría explicarse por el uso crecientemente óptimo
de los servicios del emprendedor, quien necesita un moderado nivel de producción para usar
plenamente sus habilidades. Más allá del punto de inflexión, sin embargo, el emprendedor trabaja
en exceso al tratar de coordinar la producción, y aparecen los rendimientos decrecientes. De ahí
que los costos totales se incrementen rápidamente.
Se ha ofrecido una variedad de otras explicaciones para la curva de costo total de tipo cúbico
de la figura 10.5a, pero aquí no las examinaremos. En última instancia, la forma de la curva de
costo total es una cuestión empírica que sólo puede determinarse examinando datos de la realidad. En las extensiones de este capítulo se ilustrará parte de la bibliografía sobre funciones de
costo.
2
La combinación de insumos (ml1, mk1) minimiza el costo de generar m unidades de producción, porque la razón de los insumos
sigue siendo k1/l1 y la TMST para una función de producción con rendimientos constantes a escala sólo depende de esa razón.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 10: Funciones de costo 343
En a) los costos totales son proporcionales al nivel de producción. Los costos medio y marginal, como se
advierte en b), son iguales y constantes para todos los niveles de producción.
FIGURA 10.4
Curvas de costos total,
medio y marginal para el
caso de rendimientos
constantes a escala.
Costos
totales
C
Producción
por periodo
(a)
Costos medio
y marginal
CMe = CMg
Producción
por periodo
(b)
Análisis gráfico de los costos medio y marginal
La información de las curvas de costo total puede usarse para elaborar las curvas de costos medio
y marginal que aparecen en las figuras 10.4b y 10.5b. Para el caso de rendimientos constantes a
escala (figura 10.4), esto es simple. Dado que los costos totales son proporcionales a la producción, los costos medio y marginal son constantes e iguales para todos los niveles de producción.3
Estos costos se muestran en la línea horizontal CMe CMg de la figura 10.4b.
Para el caso cúbico de la curva costo total (figura 10.5b), el cálculo de los costos medio y marginal
requiere cierta intuición geométrica. Como se desprende claramente de la ecuación 10.18, el costo
marginal es simplemente la pendiente de la curva de costo total. De ahí que, a causa de la forma
supuesta de la curva, la curva CMg tiene forma en U, con CMg cayendo sobre la porción cóncava de
3
Matemáticamente, dado que C aq (donde a es el costo de una unidad de producción),
CMe C
C
a CMg.
q
q
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
344
Parte 4: Producción y oferta
Si la curva de costo total tiene la forma cúbica que se muestra en a), las curvas de costos medio y marginal
tendrán forma de U. En b), la curva de costo marginal pasa por el punto más bajo de la curva de costo medio
en el nivel de producción q∗.
FIGURA 10.5
Curvas de costos total,
medio y marginal para el
caso cúbico de la curva
de costo total.
Costos
totales
C
Producción
por periodo
(a)
Costos medio
y marginal
CMg
CMe
q*
Producción
por periodo
(b)
la curva de costo total y subiendo más allá del punto de inflexión. Puesto que la pendiente siempre
es positiva, sin embargo, CMg siempre es mayor que 0. Los costos medio (CMe) empiezan siendo
iguales que el costo marginal para la “primera” unidad de producción.4 Al expandirse la producción, sin embargo, CMe excede a CMg, porque CMe refleja tanto el costo marginal de la última
4
Técnicamente, CMe CMg en q 0. Esto puede demostrarse con la regla de L’Hôpital, que establece que si f(a) g(a) 0, entonces
lím
f (x)
x→ a g(x)
lím
f (x)
x→ a g (x)
.
En este caso, C 0 en q 0, de modo que
lím CMe lím
q→ 0
q→ 0
C
C/ q
lím
lím CMg
q→ 0
q q→ 0 1
o
CMe CMg en q 0,
lo que se tenía que demostrar.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.A. de C.V.
23.08.2019
8/23
Capítulo 10: Funciones de costo 345
unidad producida como los costos marginales más altos de las unidades previamente producidas.
Mientras CMe CMg, los costos medios deben ser decrecientes. Dado que los costos menores de
las unidades recién producidas son inferiores al costo medio, siguen empujando los costos medios
hacia bajo. Los costos marginales se incrementan, sin embargo, y finalmente (en q∗) igualan al costo
medio. Más allá de este punto CMg CMe y los costos medios aumentarán, porque son impulsados
hacia arriba por costos marginales crecientemente más altos. En consecuencia, se ha demostrado
que la curva CMe también tiene forma de U y que llega a un punto bajo en q∗, donde CMe y CMg
interceptan.5 En estudios empíricos de funciones de costo hay considerable interés en este punto de
costo medio mínimo. Refleja la escala mínima eficiente (EME) para el proceso de producción particular bajo examen. Esta cuestión también es teóricamente importante, debido al papel que desempeña en la determinación de precios perfectamente competitiva a largo plazo (véase el capítulo 12).
FUNCIONES DE COSTO Y DESPLAZAMIENTOS
EN CURVAS DE COSTO
Las curvas de costo ilustradas en las figuras 10.4 y 10.5 muestran la relación entre costos y cantidad producida con base en el supuesto de que todos los demás factores se mantienen constantes.
Específicamente, la elaboración de las curvas supone que los precios de los insumos y el nivel de
tecnología no cambian.6 Si estos factores cambian, las curvas de costo se desplazarán. En esta
sección se abundará en las matemáticas de las funciones de costo como una forma de estudiar
esos desplazamientos. Comenzaremos con algunos ejemplos.
EJEMPLO 10.2 Algunas funciones de costo ilustrativas
En este ejemplo se calcularán las funciones de costo asociadas con tres funciones de producción diferentes.
Luego se usarán estos ejemplos para ilustrar algunas de las propiedades generales de las funciones de costo.
1. Proporciones fijas: q f (k, l) min( k, l). El cálculo de funciones de costo a partir de sus funciones de producción subyacentes es una de las tareas más frustrantes para los estudiantes de economía.
Por tanto comencemos con un ejemplo sencillo. Lo que se quiere hacer es mostrar cómo los costos
totales dependen de los costos de los insumos y de la cantidad producida. En el caso de proporciones
fijas se sabe que la producción ocurrirá en el vértice de las isocuantas en forma de L donde q k l. De ahí que los costos totales sean
C(v, w, q) vk wl v
q
w
q
q
v
w
.
(10.21)
Este es, en efecto, el tipo de función que queremos, porque enuncia los costos totales como una función sólo de v, w y q junto con algunos parámetros de la función de producción subyacente. Debido
5
Matemáticamente puede hallarse el CMe mínimo igualando su derivada con 0:
CMe (C/q) q
q
q
C/ q
q2
C 1
q CMg
q2
C
0,
o
q . CMg C 0
o
CMg C/q CMe.
Así, CMg CMe cuando CMe se minimiza.
6
Para empresas multiproductos, debe considerarse una complicación adicional. Para estas, es posible que los costos asociados con
generar un producto (digamos q1) también se vean afectados por la cantidad de otro producto por generar (q2). En este caso se
dice que la empresa exhibe “economías de alcance”, y la función de costo total será de la forma C(v, w, q1, q2). De ahí que q2 también
deba mantenerse constante al elaborar las curvas de costo de q1. Presumiblemente, incrementos en q2 desplazarán hacia abajo las
curvas de costo de q1.
Reg. 312 Grammata © D.R. 2019 por Cengage Learning Editores, S.
Descargar