Construcción y uso de un modelo de pseudo

Anuncio
Gaceta de Economía
Año 16 , Número Especial, Tomo I
Construcción y uso de un modelo de pseudo-panel aplicado
al análisis de la propiedad y número de autos por parte de
los hogares en México
Rebeca Sahagún Martínez
*
Sumario
Las emisiones producidas por el sector transporte representan una fuente
importante del total de emisiones de bióxido de carbono en México. En
este sentido, se plantea y estima un modelo pseudo-panel para evaluar los
determinantes de la propiedad y el número de autos por los hogares con el
uso de encuestas a nivel nacional. Los determinantes más significativos
resultan ser: la edad, el nivel de ingreso y el crecimiento económico;
Adicionalmente, se encuentra que algunas políticas implementadas para
reducir emisiones no han cumplido con su objetivo.
Clasificación JEL: R41, Q53
1. Introducción
En los últimos 18 años, el número de autos registrados en propiedad
particular ha crecido a una tasa promedio de 5.8% anual, mientras que la tasa
1
poblacional ha crecido 1.28% anual. Esto representa la incorporación al país de
un promedio de cerca de 600.5 mil autos al año. Si bien el aumento en el número
de vehículos particulares tiene impactos positivos en el excedente del consumidor,
también causan externalidades negativas en materia ambiental tanto a nivel local
como global, relacionadas con el aumento de la contaminación atmosférica y el
cambio climático. De acuerdo con el Inventario Nacional de Emisiones de Gases
de Efecto Invernadero (INEGEI), en 2006 las emisiones producidas por el sector
transporte fueron la segunda fuente más importante de emisiones de bióxido de
carbono, las cuales están vinculadas directamente con el Calentamiento Global.
Considerando el impacto positivo en la economía del sector automotriz en
*
Jefe de departamento de Econometría, Instituto Nacional de Ecología. E-mail: rsahagun@ine.gob.mx
1
Cifra calculada con datos del Consejo Nacional de Población (CONAPO) en www.conapo.gob.mx
216
Gaceta de Economía
México y ahora incorporando la perspectiva ambiental, es que se considera
relevante la investigación empírica sobre cuáles son los determinantes de la
propiedad y del número de autos por parte de los hogares a nivel nacional. En
particular, el poder obtener estimadores sobre el efecto de cambios en el ingreso
de los hogares o los precios de automóviles y gasolinas sobre el número de autos,
sería de gran utilidad para la formulación de políticas públicas en materia
ambiental.
Dentro de las distintas opciones que existen para realizar análisis
econométricos, la opción más deseada por los economistas aplicados es el uso de
bases de tipo panel, ya que se pueden observar las decisiones que toma el agente a
través del tiempo, lo que nos da una noción más clara del comportamiento
económico del individuo. Desafortunadamente, la disponibilidad de este tipo de
bases en muchos países llega a ser escasa, debido a que implica varios costos el
seguir a un individuo, además de que en varias ocasiones la muestra llega a sufrir
de ‗desgaste‘, es decir, se van perdiendo observaciones en la muestra por distintas
razones: muerte, emigración, entre otras. Sin embargo en varios países,
incluyendo México, existen varias encuestas o bases de datos de tipo corte
transversal, donde cada levantamiento representa una muestra aleatoria de una
misma población en particular. Tal es el caso de la Encuesta Nacional de Ingresos
y Gastos del Hogar (ENIGH) que contiene información sobre distintas
características socio-demográficas del hogar, los ingresos y gastos en los que
incurren y, adicionalmente, información sobre el número de vehículos en
propiedad del hogar. Al ser sólo estos los datos disponibles no se puede tener un
modelo tipo panel, ya que no se encuestó al mismo individuo en diferentes puntos
del tiempo; para ello se han desarrollado nuevos modelos o técnicas
econométricas que nos permitan, utilizando las bases existentes, hacer un
seguimiento artificial de los individuos. Inicialmente el uso de pseudo-panel
surgió con Deaton [1993] y una de sus aplicaciones fue la descripción de patrones
de consumo en Taiwán; a pesar de que sigue siendo una técnica poco explorada,
puede llegar a ser de gran utilidad en temas relacionados con bienes durables,
como es el caso de la propiedad de autos.
2. Construcción y uso de un modelo de pseudo-panel
Una base de datos de tipo Pseudo-Panel requiere en primer lugar de la
construcción de cohortes, definidas como grupo de individuos/agentes que
comparten una o varias características en común, invariantes en el tiempo. En la
mayoría de las investigaciones que se han realizado usando este tipo de bases se
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
217
utiliza como variable en común el año de nacimiento de la persona, aunque
también puede utilizarse el género, raza, y/o lugar de nacimiento, entre otros. Una
vez definidas las cohortes, se deben calcular los valores medios de todas las
variables para cada cohorte. En el contexto de este análisis, la variable
dependiente es el número de autos y como variables independientes se incluyeron:
ingreso del hogar, tamaño de la localidad donde se ubica el hogar, número de
personas que habitan el hogar, precio del auto y precio de la gasolina, entre otras.
Estas cohortes son ahora las nuevas unidades de observación que conforman el
Pseudo-Panel (Deaton [1985]).
Precisando, tenemos que para un modelo de panel tradicional, la
especificación general es la siguiente:
(1)
Donde el subíndice i corresponde a cada uno de los N individuos en la
muestra y el subíndice t corresponde a la dimensión temporal,
es un vector de K variables explicativas, y
es un escalar,
es la observación i-ésima en el
periodo t de las K variables explicativas.
La caracterización más general del término de error
puede definirse como,
(2)
Donde
representa la heterogeneidad no observable por individuo,
invariante en el tiempo;
refleja la heterogeneidad no observable por periodo,
invariante entre individuos; y
se refiere al componente del error,
completamente aleatorio.
Ahora bien, para un pseudo panel, la especificación luciría de la siguiente
manera:
c=1,…, C t=1, …, T (3)
Donde
es el promedio de
sobre los i individuos pertenecientes al
cohorte c en el tiempo t, que en este caso, es el promedio del número de autos
dentro del cohorte. Es importante notar que, a diferencia de la especificación para
un panel, el término
retiene el indicador de tiempo para señalar que los
218
Gaceta de Economía
valores medios por cohorte son calculados para un conjunto diferente de
individuos. Esto conlleva a tener potencialmente un valor de
distinto para
cada periodo.
En principio, se busca que la definición de las cohortes sea tal que los
individuos al interior de cada cohorte sean lo más homogéneos entre sí y lo más
heterogéneos entre cohortes. En este sentido, el investigador enfrenta una
disyuntiva entre número de cohortes y número de observaciones en cada cohorte,
para la cual la literatura no ha llegado a una conclusión sobre el intercambio
óptimo. Por un lado, uno prefiere tener mayor número de cohortes para aumentar
el tamaño de la nueva muestra. Por otro lado, si el número de observaciones por
cohorte no es lo suficientemente grande, las medias muestrales no estimarían con
exactitud las medias poblacionales.
Con el objetivo de corregir estos errores de medición, varios autores han
propuesto Estimadores del tipo “Error-in-Variables” (Deaton [1985], Verbeek y
Hijman [1993], Biorn [1992], Marsgakkm [1992] y Devereux [2003]). Sin
embargo, en la práctica, la mayoría de los estudios empíricos que usan pseudopanel han optado por el uso de estimadores estándar del tipo ―within‖ justificando
que el problema de error de medición puede ser ignorado siempre que el número
de observaciones en cada celda por cohorte sea lo suficientemente grande. A
manera de convención, se ha considerado como mínimo un total de 100
observaciones por celda (Verbeek y Hijman [1992]).
Ignorando los errores de medición por medio del método anteriormente
explicado, es posible asumir que
para todo t. De esta manera,
simplificando la ecuación (3), se puede especificar este término como efectos
fijos por cohorte como:
(4)
Desde el punto de vista econométrico, trabajar con datos agrupados tiene dos
consecuencias importantes. La primera es que los parámetros estimados son
menos eficientes debido a que la agregación de datos conlleva la pérdida de
información. El ajuste de las regresiones de datos agrupados es
considerablemente más alto, incluso cercano a 1. Si el número de observaciones
por cohorte difiere considerablemente, el término de error será heteroscedástico.
Para corregir este problema se recomienda ponderar los datos por la raíz cuadrada
del tamaño de las cohortes. De esta manera, los errores se vuelven
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
219
homoscedásticos y todos los supuestos del modelo de regresión lineal clásico se
cumplen (Greene [1997]).
Las distintas especificaciones que puede tener un modelo de pseudo-panel
son prácticamente iguales a las de un panel, aunque requiere tener
consideraciones adicionales en la justificación e interpretación de cada una de las
variables incluidas en la regresión.
Partiendo de la ecuación (4), es posible definir tres principales
especificaciones basadas en los supuestos que se hagan sobre la
heteroscedasticidad de los datos. La primera de ellas, y la más sencilla, asume que
no existe heterogeneidad no observable por lo cual el término
=
0. Como
consecuencia, la estimación de dicha ecuación puede realizarse sin problemas
usando Mínimos Cuadrados Ordinarios con la ventaja de contar con más grados
de libertad.
Ahora bien, si se asume la existencia de heterogeneidad no observada, se
debe especificar la forma específica en la que dicha heterogeneidad afecta a la
variable dependiente. En el caso de los Modelos de Efectos Fijos, se asume que
las variables explicativas afectan por igual a las cohortes en cada levantamiento y
que estas cohortes se diferencian entre sí por características propias a cada uno.
Estas diferencias son capturadas por medio de intersectos constantes
independientes para cada cohorte. Por esta razón este modelo también se conoce
como Least Square Dummy Variables. Por ejemplo, en el caso en que las
cohortes representen distintas ―generaciones‖ de individuos u hogares, los efectos
fijos estarían capturando factores como cambios en gustos o moda entre
generaciones. Dado que se deben agregar a la ecuación tantas variables
explicativas como cohortes existan, se produce, en consecuencia, una pérdida
importante de grados de libertad.
Alternativamente, en un Modelo de Efectos Aleatorios se asume que los
efectos individuales no son independientes entre sí, sino que están distribuidos
aleatoriamente alrededor de un valor dado. En otras palabras, esto sería
equivalente a suponer que todos aquellos factores que influyen en las variaciones
de la variable dependiente, pero que no han sido incluidas en el modelo, pueden
ser representadas comprehensivamente por medio de una perturbación aleatoria.
La especificación econométrica luce igual que la ecuación (4) sólo se agrega la
condición adicional de que
y
se distribuye independiente y aleatoriamente
220
Gaceta de Economía
con media cero, es decir, que no existen efectos fijos. Debido a este último
supuesto, se tiene que los modelos de efectos aleatorios son los más deseables
cuando se tiene como objetivo hacer inferencia sobre toda la población, mientras
que los modelos de efectos fijos están limitados al tipo de cohortes incluidas en el
análisis (Baltagli [1995]).
Para la elección del modelo correcto a estimar, se han propuesto pruebas
estadísticas que detectan la presencia de efectos fijos. La más utilizada, es la
prueba de Hausman que permite identificar si existe o no correlación significativa
entre los efectos aleatorios no observados específicos (
) y los regresores
.
Si no existe correlación significativa, el modelo de efectos aleatorios sería el más
poderosos y parsimonioso.
En términos de interpretación de los resultados, cada tipo de especificación
parte de supuestos diferentes. El modelo de efectos fijos es visto como uno en el
que el investigador hace inferencias condicionales sobre los efectos que existen en
la muestra, mientras que el modelo de efectos aleatorios es visto como uno en el
que el investigador hace inferencia incondicional o marginal con respecto a toda
la población (Hsiao [1986]).
Existen argumentos a favor y en contra del uso de un pseudo-panel. Dentro de
los argumentos a favor tenemos primero, que se tienen menos problemas
relacionados al desgaste de la muestra, ya que ésta se renueva cada periodo.
Segundo, se tienen menos problemas en cuanto al error de medición por lo menos
a nivel individual, ya que éste es suavizado por el uso de valores medios y puede
ser explícitamente controlado usando los métodos de “Error-in-Variables”.
Tercero, debido a la mayor disponibilidad de varias bases de datos de corte
transversal, es posible construir un pseudo-panel representativo, cubriendo
periodos largos en el tiempo, más que lo que se puede cubrir con un panel real,
además, de poder incluir datos de otras fuentes que puedan ser comparables con
la definición de cohortes que se haya establecido. Cuarto, las inconsistencias entre
análisis macro y micro se pueden analizar si se transforman los datos individuales
a una cohorte macro.
El principal argumento en contra se debe a la construcción de las cohortes, ya
que existe un trade-off entre el número de cohortes y su tamaño. Cohortes con
menores observaciones implican menor precisión en el promedio por cohorte pero
cohortes con mayor número de observaciones reducen la muestra. A pesar de que
no se ha llegado a un consenso como tal, en la práctica se considera como mínimo
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
221
un total de 100 observaciones por celda para el cálculo del promedio por cohorte
(Verbeek y Hijman [1992]).
3. Análisis de la propiedad y número de autos por parte de los
hogares en México
Una vez explicada la forma en la que se construye y estima un modelo de
pseudo-panel, su utilidad, ventajas y desventajas, la presente sección muestra la
aplicación de un modelo de esta naturaleza al análisis de la propiedad y número
de autos por parte de los hogares en México.
Dos trabajos empíricos recientes en los que se utiliza un pseudo-panel para
analizar la propiedad de automóviles en los hogares son los de Dargay y
Vythoulkas [1999] y Dargay [2002]. El primero de ellos utiliza diversos
levantamientos de la Encuesta de Gasto de las Familias del Reino Unido (UK
Family Expenditure Survey, FES) entre 1982 y 1993 para identificar los factores
microeconómicos que determinan el número de autos particulares en el Reino
Unido. Los hogares fueron agrupados en cohortes con intervalos de cinco años
definidos a partir del año de nacimiento del jefe del hogar. El sello particular de
este trabajo es la estimación de modelos dinámicos por medio de la inclusión de
la variable dependiente rezagada como regresor. Como variables explicativas se
incluye el total del gasto semanal por hogar, número de adultos, número de niños,
porcentaje de hogares localizados en zonas metropolitanas dentro de la cohorte al
igual que el porcentaje en zonas rurales, una variable que indica la generación de
edad, los costos de adquirir y mantener el auto y tarifas de transporte público. En
los resultados se obtuvieron estimaciones para el modelo de efectos fijos y para
diferentes especificaciones del modelo de generación, el cual incluye la variable
de generación de edad: MCO, efectos aleatorios y efectos aleatorios AR1. Para
ambos modelos los parámetros estimados fueron muy similares y los signos de
éstos fueron los esperados.
El trabajo anterior fue mejorado en Dargay [2002] utilizando la misma base
de datos pero en esta ocasión se estimaron especificaciones no lineales como
semi-log, doble-log, y log-inverso que han probado ser más adecuadas para
modelar funciones de demanda. También se cambió la forma de armar las
cohortes: se utilizaron dos variables para agrupar las observaciones en cohortes:
una relacionada con la generación y la otra con el área de residencia. La
generación se definió por el año de nacimiento del jefe del hogar, mientras que el
222
Gaceta de Economía
área de residencia se dividió en tres: urbana, rural y otras áreas. Se estimaron
parámetros para las distintas especificaciones en ambos modelos (efectos fijos y
de generación). Sin embargo, el modelo de generación fue rechazado por la
prueba de razón de verosimilitud, lo que difiere de los resultados del primer
estudio, esto puede deberse a la mayor desagregación en las cohortes, ya que el
modelo de generación asume un incremento lineal en la tenencia de autos para
cada nueva generación y esa no parece ser la tendencia para las nuevas
generaciones, que constituye una gran parte de la muestra ampliada que se utilizó
en este estudio. Las pruebas para obtener la especificación funcional concluyeron
que el modelo de log inverso era el preferido.
En México se han hecho pocos estudios sobre propiedad de autos per se. Sin
embargo, hay estudios relacionados con el tema que usan distintos tipos de datos.
Por ejemplo, Berndt y Botero [1983] usan datos de tipo agregado en la estimación
de la demanda de energía para distintos medios de transporte como tren, avión y
auto, enfocándose principalmente en el cálculo de elasticidades de gasolina y
diesel. En el apartado de vehículos motores también se estima la elasticidad de
venta de autos nuevos con respecto al precio real de autos nuevos; la elasticidad
obtenida es -1.34, mientras que la elasticidad con respecto al ingreso per cápita es
de 0.992. Desde 1978, la razón de venta de autos nuevos con respecto al acervo
de autos es 0.76, la elasticidad del acervo de autos con respecto al precio de autos
nuevos e ingreso per cápita es de -0.10 y 0.08, respectivamente. Estos resultados
sugieren que la demanda por autos en México si se ve afectada por el crecimiento
económico y la política de precios de los autos.
Otro estudio relacionado es Eskeland y Feyzioglu [1997], quienes estimaron
un modelo de demanda por gasolina y propiedad de autos para México utilizando
observaciones anuales de datos panel por Estado (los 31 Estados de la República
y el Distrito Federal) del registro de vehículos de cada entidad federativa durante
el periodo de 1982 a 1988. Se utilizó el método de variables instrumentales para
la estimación del modelo utilizando como instrumentos de la variable dependiente
los valores rezagados para el consumo de gasolina y para el ingreso. Las variables
explicativas del modelo fueron: ingreso anual, consumo de gasolina (división total
del consumo de gasolina en cada Estado entre el número de autos registrados) y
precio de gasolina ―Magna‖. Como resultado se obtuvo un modelo de ajuste casi
inmediato (dentro del año) con una elasticidad-precio para consumo de gasolina
en el corto plazo de -.79, muy cercana a la estimada en el largo plazo (-.8). Con
respecto a otros estudios relacionados con el tema, Eskeland y Feyzioglu [1995]
analizaron la eficiencia del programa ―Hoy No Circula‖ aplicado a la Zona
Metropolitana del Valle de México. Se construyó un modelo de demanda por
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
223
gasolina con datos agregados de series de tiempo antes de la regulación para
simular el contra-factual de la demanda para los siguientes periodos, como si la
regulación no hubiera entrado en vigor. Los resultados mostraron que después de
un periodo inicial de ajuste de aproximadamente seis meses, el uso del auto
aumentó en lugar de reducirse. Adicionalmente, los autores analizaron la
propiedad de autos desde la perspectiva de hogares en la Ciudad de México
utilizando datos de tipo corte transversal de un periodo anterior a la regulación
para estimar los parámetros de un modelo, en donde el hogar maximiza su función
de utilidad, la cual se compone de servicios de transporte obtenidos del auto y
consumo de los demás bienes y servicios, sujeta a una restricción presupuestal. Se
asume que la demanda por el servicio de transporte está relacionada directamente
con la propiedad de autos y utiliza el modelo con diferentes escenarios para ver el
comportamiento de los hogares cuando parte de la flota es retirada debido a la
regulación. Los resultados muestran que la regulación hace que existan tanto
vendedores como compradores de autos; y aunque el modelo no puede indicar
que el aumento en propiedad de autos está directamente relacionado con la
regulación, si concluye que el número de compradores sería sustancial.
3.1. Especificación Econométrica y Descripción de la
Base de Datos
Siguiendo la intuición planteada en los estudios empíricos revisados y
considerando la disponibilidad de información útil para este estudio, se
especificaron dos ecuaciones a estimar econométricamente:
𝑃𝑟𝑜𝑝𝑐𝑡 = 𝛼 + 𝛽1 𝑆𝑜𝑐𝑖𝑜𝑐𝑡 + 𝛽2 𝐶𝑜𝑠𝑡𝑜𝑠𝑡 + 𝛽3 𝑀𝑎𝑐𝑟𝑜𝑡 + 𝛽4 𝑅𝑒𝑔𝑡 + 𝑢𝑐,𝑡
(1)
𝐴𝑢𝑡𝑜𝑠𝑐𝑡 = 𝛼 + 𝛽1 𝑆𝑜𝑐𝑖𝑜𝑐𝑡 + 𝛽2 𝐶𝑜𝑠𝑡𝑜𝑠𝑡 + 𝛽3 𝑀𝑎𝑐𝑟𝑜𝑡 + 𝛽4 𝑅𝑒𝑔𝑡 + 𝑢𝑐,𝑡
(2)
Donde,
c: indicador de cohortes (c=1,2,…16)
t: indicador de año (t=1984, 1989, 1992, 1994, 1996, 1998, 2000, 2002, 2004,
2006, 2008).
𝑃𝑟𝑜𝑝𝑐𝑡
: Proporción de hogares que cuentan con al menos un auto dentro de la
cohorte c en el año t.
: Número promedio de autos por hogar dentro de la cohorte c en el año t.
224
Gaceta de Economía
: Vector de variables socio-demográficas promedio de los hogares dentro
de la cohorte c en el año t.
: Vector de variables macroeconómicas.
: Vector de variables que capturan los costos de tenencia y uso del
automóvil.
: Variables que capturan los efectos de las regulaciones relevantes sobre la
propiedad de autos en los hogares.
Para construir la base de datos que se utilizó en este estudio, se usaron cuatro
distintas bases de datos oficiales:
1. Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH)
La ENIGH es una encuesta realizada desde 1984 por el Instituto Nacional
de Estadística y Geografía (INEGI). Los años de levantamiento desde esta
encuesta son: 1984, 1989, 1992, 1994, 1996, 1998, 2000, 2002, 2004,
2005, 2006 y 2008. La población objetivo la constituyen los hogares de
nacionales o extranjeros, que residen habitualmente en viviendas
particulares dentro del territorio nacional. El principal objetivo de esta
encuesta es conocer el comportamiento de los ingresos y gastos de los
hogares, así como las características ocupacionales y socio-demográficas
de los integrantes del hogar y las características de la infraestructura de la
vivienda y el equipamiento del hogar. La representatividad de esta
encuesta es nacional y para los estratos urbano y rural.
2. Banco de Información Económica (BIE)
El BIE es un sistema de información operado también por el INEGI que
cuenta con más de 160,000 series históricas con información económica de
México y de algunos otros países.
3. Banco de México (Banxico)
Banxico difunde información confiable y de calidad, donde se puede
consultar un amplio conjunto de estadísticas económicas y financieras de
la base de datos que utiliza el mismo banco en su análisis y en la
formulación de sus políticas2.
4. Sistema de Información Energética (SIE)
2
http://www.banxico.org.mx/
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
225
El SIE es un sistema operado conjuntamente por Secretaria de Energía,
Petróleos Mexicanos y la Comisión Federal de Electricidad, entre otros,
y contiene información estadística georeferenciada del sector energético
relacionada con hidrocarburos, electricidad, carbón, eficiencia energética
y actividades de investigación, entre otras.
Usando estas fuentes de información, fue posible construir una base de datos que
incluye diversas variables para cada categoría las cuales se detallan en el Cuadro
1.
Cuadro 1. Descripción de la base de datos utilizada
Nombre
Descripción
Tipo
Cobertura
temporal
Cobertura Geográfica
Fuente
Numérica
1984-2008
Nacional
ENIGH
Numérica
1984-2008
Nacional
ENIGH
Numérica
1976-2009
Nacional
SIE
Variables explicativas:
Edad jefe de familia Edad del jefe de familia
Características sociodemográficas
Costos de
adquisición y
operación
Indicadores macroeconómicos
Ingreso total trimestral normalizado
Ingreso trimestral del hogar a precios constantes del
2008
Precio Gasolina Precio público por litro fijado por
PEMEX para la venta de gasolina
tipo magna
IPC autos
Índice de Precios al Consumidor para
vehículos nuevos automotores
Numérica
1982-2009
Regional (Frontera Norte, BANXICO
Noroeste, Noreste, Centro
Norte, Centro Sur, Sur, Cd. de
México)
PIB
Producto Interno Bruto con base en
precios de 2003
Numérica
1896-2008
Nacional
BIE
Reside en zona
donde se aplica el
Programa Hoy No
Circula
Hogares que se encuentran en la
Zona Metropolitana del Valle de
México a partir del año 1989 que
corresponde al lugar y momento en
que entró envigor el Programa Hoy
no Circula
Categórica
1989-2008
Zona Metropolitana del Valle
de México
ENIGH
Categórica
2005-2008
Frontera Norte
ENIGH
Regulación
Región fronteriza
después del
decreto de
importación de
autos usados
Hogares que se encuentran en la
frontera con Estados Unidos a partir
del 2005, año en que entro en vigor
la Ley que permitió la entrada de los
autos chocolate (2005)
*Nota: Al inicio de esta investigación, se probó la inclusión de variables explicativas
adicionales a las reportadas en este cuadro como: tamaño de la localidad, número de
miembros que habitan el hogar y género del jefe de familia, entre otras. Sin embargo, éstas
fueron excluidas debido a que resultaron altamente correlacionadas con otras variables.
Dentro de la categoría de características socio-demográficas tenemos que
para la variable edad y edad al cuadrado se esperan efectos positivo y negativo
respectivamente, esto indicaría que conforme aumenta la edad del jefe de familia
la propiedad y número de autos aumenta hasta llegar a un umbral en el que
comienza a disminuir. Esta tendencia refleja el aumento de las necesidades y
226
Gaceta de Economía
preferencias por un automóvil durante la juventud y adultez y una posterior
disminución durante la madurez y tercera edad. En estudios previos, se ha
observado que el umbral en el que se alcanza el mayor número de autos por hogar
ocurre alrededor de los 50 años de edad (Dargay [1999]).
Con respecto a los costos de adquisición y operación, se incluyó como
variable explicativa el promedio del IPC que registra el nivel de precios de autos
3
nuevos adquiridos dentro del país . Considerando que las variables dependientes a
estimar en las regresiones (5) y (6) incluyen la propiedad de autos nuevos y
viejos, puede ser que el coeficiente estimado de esta variable tenga un efecto
positivo, pero pequeño o no significativo. En relación al costo de operación, se
incluyó el precio por litro de gasolina tipo ―magna‖. Debido a que durante el
periodo de estudio el precio de la gasolina en México no ha cambiado mucho, es
posible que el consumidor no lo vea como un costo grande y por lo tanto no
podamos identificar su efecto sobre la variable dependiente.
Bajo la categoría de indicadores macroeconómicos, se incluyeron el
promedio y la varianza del PIB de los tres años anteriores al año de observación.
Estos indicadores tienen la intención de capturar el efecto de las expectativas de
los hogares respecto al desempeño de la economía y la decisión de adquirir o
conservar su automóvil. Esta variable no ha sido incluida en estudios anteriores
aplicados a países desarrollados, pero se piensa que puede ser relevante en el
contexto de economías en desarrollo donde existen fluctuaciones económicas
mayores y donde la gente puede ser más sensible a estos cambios. Los modelos de
bienes durables predicen que habrá grandes cambios en la adquisición ante
pequeños cambios en las expectativas del ingreso debido a la posibilidad de
retrasar la adquisición o renovación de los mismos (Deaton y Muellbauer [1980]).
Finalmente, en la categoría de regulación, se incluyeron dos variables
que controlan en tiempo y área geográfica la entrada en vigor y aplicación de 2
legislaciones que podrían tener una gran incidencia directa en la decisión de
propiedad de autos de los hogares. La primera corresponde al Programa Hoy No
Circula que inició en 1989 y abarca las 16 delegaciones del Distrito Federal y 18
municipios conurbados del Estado de México, el cual restringe la circulación 1
día a la semana de autos de menores niveles de desempeño ambiental, medidos
directamente en estaciones ex profeso. La hipótesis es que este programa
aumentaría a cantidad de autos que un hogar quisiera tener para mantener el flujo
de servicios de transporte diario no decreciente. La segunda regulación que se
considera relevante se refiere al Decreto de importación de autos usados en la
3
En un inicio, se buscaron datos de precios de automóviles nuevos y viejos pero fue imposible
conseguir una medida consistente para todos los años bajo estudio.
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
227
frontera norte conocida como la Ley de ―Autos Chocolate‖, la cual entró en vigor
en el año 2005, con la finalidad de regular los vehículos provenientes de Estados
Unidos y Canadá. Esta ley permite la entrada de más autos usados a menores
precios que los observados en el mercado mexicano pre-apertura.
3.2. Resultados
Ambas ecuaciones fueron estimadas en forma de panel usando Mínimos
Cuadrados Ordinarios probando los dos tipos de especificaciones posibles:
efectos fijos y efectos aleatorios. Para determinar el mejor modelo, se aplicó la
prueba de Hausman la cual resultó negativa. Este tipo de resultados se observa
cuando hay diferencias no positivas semi-definidas en las varianzas de los
parámetros estimados (Shreiber [2006]). Esto implica que la prueba es incapaz de
favorecer el uso de un modelo sobre otro. En estos casos, algunos autores
proponen justificar la selección del modelo adecuado basado en la naturaleza de
los datos y del problema que se está analizando (Hsiao [1986]). Tomando ambos
criterios en consideración, se optó por un modelo de efectos fijos considerando
que estamos analizando 16 cohortes como definición de distintas ―generaciones‖,
para las cuales queremos conocer los determinantes de su comportamiento. Es
decir, no estamos buscando hacer inferencia sobre toda la población sino sobre la
muestra con la que contamos.
Los resultados para la Ecuación (1) se muestran en el Cuadro 2. En ella
aparecen cuatro especificaciones en las que se fueron incluyendo uno a uno los
distintos grupos de variables explicativas con el objetivo de identificar posibles
cambios en los niveles de significancia y cambios de signo entre una
especificación y otra.
Para el conjunto de variables socio-económicas, se observa que las variables
Edad y Edad al cuadrado del jefe de familia tuvieron el signo esperado, lo que
indica que el efecto de la Edad del Jefe de familia sobre la propiedad de autos es
creciente hasta alcanzar un máximo y después empieza a decrecer, tal y como se
ha encontrado en la literatura previa. La edad en la que ocurre este cambio de
signo es de 45 años. Para el caso del ingreso familiar, se observa que ante un
aumento del 1% en el ingreso del hogar, la proporción de hogares con auto dentro
de la cohorte aumentaría en 0.0003 puntos porcentuales. Las variables Edad y
Edad al cuadrado así como el ingreso parecen ser muy robustas a través de las 4
especificaciones probadas.
228
Gaceta de Economía
Con respecto a los costos de adquisición y operación de un auto, se observa
que el IPC de autos resulta positivo y significativo, lo cual es sorprendente y
contra intuitivo, ya que el IPC de autos ha disminuido a través de los años y la
propiedad de autos ha ido aumentando; sería necesario hacer más pruebas para
saber porque está ocurriendo esto. Asimismo, la variable de precio de gasolina
resulta no significativa, esto puede deberse a que los individuos no reaccionan a
cambios pequeños en el precio, como ha sucedido con el precio de gasolina en el
periodo estudiado.
En relación a las variables macroeconómicas como indicadores de las
expectativas por parte de los consumidores, tenemos que ambas variables resultan
significativas y con los signos esperados. Un aumento marginal en el promedio
del PIB durante los tres años anteriores a la observación, aumenta la proporción
de autos con al menos un vehículo en 0.00074 puntos porcentuales, mientras que
un aumento marginal en la varianza lo reduce en tan sólo 0.0002 puntos
porcentuales.
Finalmente, para las variables que capturan el efecto de las reformas
regulatorias en el sector, se observa que ambas tienen un efecto significativo y
positivo. Específicamente, el porcentaje de hogares con al menos un auto aumenta
en 0.003 puntos porcentuales cuando los hogares se encuentran ubicados en los
municipios para los cuales opera el programa Hoy No Circula. Asimismo, la
proporción de hogares con al menos un auto ubicados en estados fronterizos
después del 2005 aumenta en 0.0026 puntos porcentuales comparado al resto del
país.
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
229
Cuadro 2. Determinantes de la propiedad de autos en los hogares (Ecuación
1)
Variables Explicativas
Edad jefe de familia
Edad al cuadrado de jefe de
familia
Ingreso trimestral (ln)
(1)
(2)
(3)
(4)
0.0158
[0.0012]**
-0.0001
[0.0000]**
0.0168
[0.0013]**
-0.0001
[0.0000]**
0.0161
[0.0018]**
-0.0001
[0.0000]**
0.0170
[0.0015]**
-0.0001
[0.0000]**
0.0788
[0.0092]**
0.0948
[0.0108]**
0.0401
[0.0147]**
0.0600
[0.0294]*
0.0840
[0.0120]**
0.0273
[0.0236]
0.0899
[0.0318]**
0.0518
[0.0366]
0.0369
[0.0130]**
0.0279
[0.0208]
0.1134
[0.0282]**
0.0744
[0.0332]*
-0.0134
[0.0056]*
-0.0202
[0.0050]**
0.3000
[0.0561]**
Precio Gasolina (ln)
Índice de precios para autos
nuevos
PIB (Promedio 3 últimos
años normalizado)
PIB (Varianza 3 últimos
años normalizada)
Reside en zona donde se
aplica el
Programa Hoy No Circula
Región fronteriza después
del decreto de importación
de autos usados
Constante
-0.0127
[0.0010]**
Observaciones
163
Número de cohortes
16
R2
0.76
Error estándar dentro de los corchetes
0.2663
[0.0451]**
-0.0163
[0.0016]**
163
16
0.78
-0.0145
[0.0022]**
163
16
0.79
-0.0098
[0.0021]**
163
16
0.84
* significativo al 5%; ** significativo al 1%
Con respecto a la estimación de la Ecuación 2, el Cuadro 3 muestra los
resultados correspondientes. En comparación con el Cuadro 2, los resultados son
muy similares en nivel de significancia y signo esperado. De los detalles
importantes a destacar es el caso del ingreso, que en esta ecuación parece tener un
efecto marginal mayor pasando de 0.03 en el caso de propiedad de autos a 0.07 en
el caso de número de autos.
El efecto de las variables macroeconómicas disminuye considerablemente
para el caso del promedio normalizado que pasa de 0.00074 a 0.00047 puntos
230
Gaceta de Economía
porcentuales y de -0.0002 a -0.0003 en el caso de la varianza normalizada.
Finalmente, en las regulaciones, se observa que el efecto de ambas variables
aumenta.
Cuadro 3. Determinantes del número de autos en los hogares (Ecuación 2)
Variables Explicativas
Edad jefe de familia
Edad al cuadrado de jefe de
familia
Ingreso trimestral (ln)
(1)
(2)
(3)
(4)
0.0182
[0.0015]**
-0.0001
[0.0000]**
0.0203
[0.0017]**
-0.0001
[0.0000]**
0.0214
[0.0023]**
-0.0001
[0.0000]**
0.0224
[0.0020]**
-0.0001
[0.0000]**
0.1203
[0.0120]**
0.1431
[0.0141]**
0.0288
[0.0193]
0.1014
[0.0385]**
0.1357
[0.0155]**
0.0426
[0.0306]
0.1261
[0.0411]**
0.0166
[0.0473]
0.0784
[0.0173]**
0.0432
[0.0275]
0.1549
[0.0374]**
0.0475
[0.0441]
-0.0252
[0.0072]**
-0.0337
[0.0067]**
0.3730
[0.0744]**
Precio Gasolina (ln)
Índice de precios para autos
nuevos
PIB (Promedio 3 últimos
años normalizado)
PIB (Varianza 3 últimos años
normalizada)
Reside en zona donde se
aplica el
Programa Hoy No Circula
Región fronteriza después del
decreto de importación de
autos usados
Constante
-0.0180
[0.0013]**
Observaciones
163
Número de cohortes
16
R2
0.75
Error estándar dentro de los corchetes
0.3050
[0.0598]**
-0.0229
[0.0021]**
163
16
0.77
-0.0229
[0.0028]**
163
16
0.79
-0.0170
[0.0028]**
163
16
0.83
* significativo al 5%; ** significativo al 1%
4. Conclusiones
El objetivo de este artículo es mostrar a los lectores interesados en economía, y en
particular en economía ambiental, cómo se puede construir y estimar un modelo
de pseudo-panel; el tipo de información que se necesita, las posibles
especificaciones econométricas, y las diferencias que existen en su interpretación
en relación a un modelo de panel. Adicionalmente, se mostró la aplicación de este
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
231
modelo a un problema relevante en México como lo es el análisis de los
determinantes de propiedad y número de automóviles por parte de los hogares.
Con respecto al uso de modelos de pseudo-panel se concluye que éstos tienen
un gran potencial para ser usados en investigación aplicada dada la disponibilidad
de encuestas de corte transversal en distintos años. De esta manera, es posible
realizar análisis de tipo dinámico como se hace en un panel, pero reduciendo al
mismo tiempo los problemas de desgaste y error de medición al hacer uso de
promedios por cohortes.
Con respecto al análisis de la propiedad y número de autos en México, se
obtuvieron tres principales hallazgos. El primero de ellos se refiere al papel del
ingreso, donde se obtuvo una relación positiva, es decir, que en términos
generales, implica que si el ingreso promedio continúa aumentando, como ha
venido sucediendo en los últimos años, el número de autos aumentará y las
políticas públicas relacionadas a este tema tendrán que ir dirigidas a una mayor
oferta ya sea de infraestructura o de sustitutos, como sería el mejoramiento del
transporte público para así poder evitar el congestionamiento vial. El segundo va
dirigido a las expectativas económicas, donde se observa que el crecimiento
económico llega a ser un indicador importante de cómo los individuos perciben
les van a afectar estos cambios en cuanto a su ingreso personal y por lo tanto a la
compra de bienes durables. Lo que significa que una economía estable y en
crecimiento llevará a los hogares a una mayor tenencia de dichos bienes.
Finalmente, el tercer hallazgo se refiere a las regulaciones, en las cuales se
obtuvieron resultados que nuevamente respaldan a la literatura anteriormente
mencionada y en donde no se están cumpliendo los objetivos establecidos de
dichas políticas. Por lo que se recomendaría replantear el funcionamiento de las
mismas y hacer una evaluación más profunda para observar las causas y
consecuencias de dichos resultados.
Como pasos siguientes de esta investigación se calcularán las elasticidades
precio e ingreso con la finalidad de tener una medida más exacta de en cuánto
cambiará la proporción de hogares con auto dentro del cohorte y el número de
autos cuando cambia el ingreso y el precio promedio. También este tipo de
modelos llega a ser una herramienta útil para hacer un pronóstico del número de
autos que habrá en el futuro. Para México ese resultado tiene implicaciones
ambientales muy importantes, ya que los autos proveen valiosos servicios de
transporte para las familias hacia sus centros de trabajo, educación,
232
Gaceta de Economía
entretenimiento y convivencia social, pero a la vez generan externalidades
negativas significativas para la calidad del aire local y la emisión de gases de
efecto invernadero ligada al cambio climático global.
Es fundamental entender desde el punto de vista económico las decisiones de
los hogares mexicanos sobre una parte muy importante de sus acervos, los autos.
Hay gran bienestar asociado al tener autos privados, las ciudades mismas se
desarrollan entre la dicotomía del transporte público y el privado, las familias
tienen acceso a bajos costos (en tiempo) a una mayor multiplicad de lugares, y a
la vez los problemas de congestión, calidad de aire y salud local dependen de
cuántos y qué tipo de autos haya. Ahora, cuando el reto de cambio climático está
en el horizonte de nuestra generación y dependerá de nosotros, las decisiones
individuales ya verdaderamente dejan de serlo, por eso hay que entenderlas cada
vez mejor.
5. Referencias
Baltagi, B. H. (1995) Econometric Analysis of Panel Data. Nueva York: John
Wiley and Sons, Inc.
Centro Mario Molina (2006). Medición de Emisiones Vehiculares. Ciudad
Juárez, Chihuahua 2006. México.
Dargay, J.M., Vythoulkas P.C. (1999). ―Estimation of a Dynamic car ownership
model: a pseudo panel approach‖. Journal of Transport Economics and
Policy 33 (3).
Dargay, J.M. (2002). ―Determinants of car ownership in rural and urban areas: a
pseudo- panel analysis‖. Transportation Research. 38.
Deaton A. y Ch. Paxson (1993). Saving, Growth, and Aging in Taiwan. NBER
Documento de trabajo N°4330.
Deaton, A. y Muellbauer, J. (1980), Economics and Consumer Behavior pp367377. Cambridge: Cambridge University Press.
Deaton, A. (1985). Panel Data from Time Series of Cross Sections. Journal of
Econometrics, 30.
Greene, W.H. (1993). Econometric Analysis. New Jersey: Prentice Hall, Inc.
Huang, B. (2007), The Use of Pseudo Panel Data for Forecasting Car
Ownership, unpublished PhD thesis, Department of Economics, Birkbeck
College
Construcción y uso de un modelo pseudo-panel aplicado al análisis de …
233
Hsiao, C. (1986), Analysis of Panel Data. Press Syndicate of the University of
Cambridge.
INE-SEMARNAT (2009). Cuarta Comunicación ante la Convención Marco de
las Naciones Unidas sobre Cambio Climático. México.
INEGI . Instituto Nacional de Estadística y Geografía e Informática. Encuesta
Ingreso y Gasto de los Hogares en México. México.
Nolan, A. (2003). The determinants of urban households’ transport decisions: A
microeconometric study using Irish data. International Journal of Transport
Economics 30 (1) :103–132.
RAND Europe (2002). Review of recent international literature: car ownership.
Report 01192. January. pp 31 - 68
Russell J.E., Fraas J.W. An Application of Panel regression. Ashland University.
Schreiber, S. (2006). The Hausman Test Statistic Can Be Negative Even
Asymptotically. Technical report, Universität Frankfurt am Main.
Verbeek, M. (2006). Pseudo Panels and Repeated Cross-Sections. In Matyas, L.
and Sevestre, P. (eds.) ‗The Econometrics of Panel Data: Handbook of the
Theory and Applications‘, 3rd edition, Kluwer Academic Publishers,
Netherlands.
Verbeek, M., Nijman, T. (1992) Can Cohort Data be treated as genuine panel
data? Empirical Economics 17, 9-23.
Descargar