Gaceta de Economía Año 16 , Número Especial, Tomo I Construcción y uso de un modelo de pseudo-panel aplicado al análisis de la propiedad y número de autos por parte de los hogares en México Rebeca Sahagún Martínez * Sumario Las emisiones producidas por el sector transporte representan una fuente importante del total de emisiones de bióxido de carbono en México. En este sentido, se plantea y estima un modelo pseudo-panel para evaluar los determinantes de la propiedad y el número de autos por los hogares con el uso de encuestas a nivel nacional. Los determinantes más significativos resultan ser: la edad, el nivel de ingreso y el crecimiento económico; Adicionalmente, se encuentra que algunas políticas implementadas para reducir emisiones no han cumplido con su objetivo. Clasificación JEL: R41, Q53 1. Introducción En los últimos 18 años, el número de autos registrados en propiedad particular ha crecido a una tasa promedio de 5.8% anual, mientras que la tasa 1 poblacional ha crecido 1.28% anual. Esto representa la incorporación al país de un promedio de cerca de 600.5 mil autos al año. Si bien el aumento en el número de vehículos particulares tiene impactos positivos en el excedente del consumidor, también causan externalidades negativas en materia ambiental tanto a nivel local como global, relacionadas con el aumento de la contaminación atmosférica y el cambio climático. De acuerdo con el Inventario Nacional de Emisiones de Gases de Efecto Invernadero (INEGEI), en 2006 las emisiones producidas por el sector transporte fueron la segunda fuente más importante de emisiones de bióxido de carbono, las cuales están vinculadas directamente con el Calentamiento Global. Considerando el impacto positivo en la economía del sector automotriz en * Jefe de departamento de Econometría, Instituto Nacional de Ecología. E-mail: rsahagun@ine.gob.mx 1 Cifra calculada con datos del Consejo Nacional de Población (CONAPO) en www.conapo.gob.mx 216 Gaceta de Economía México y ahora incorporando la perspectiva ambiental, es que se considera relevante la investigación empírica sobre cuáles son los determinantes de la propiedad y del número de autos por parte de los hogares a nivel nacional. En particular, el poder obtener estimadores sobre el efecto de cambios en el ingreso de los hogares o los precios de automóviles y gasolinas sobre el número de autos, sería de gran utilidad para la formulación de políticas públicas en materia ambiental. Dentro de las distintas opciones que existen para realizar análisis econométricos, la opción más deseada por los economistas aplicados es el uso de bases de tipo panel, ya que se pueden observar las decisiones que toma el agente a través del tiempo, lo que nos da una noción más clara del comportamiento económico del individuo. Desafortunadamente, la disponibilidad de este tipo de bases en muchos países llega a ser escasa, debido a que implica varios costos el seguir a un individuo, además de que en varias ocasiones la muestra llega a sufrir de ‗desgaste‘, es decir, se van perdiendo observaciones en la muestra por distintas razones: muerte, emigración, entre otras. Sin embargo en varios países, incluyendo México, existen varias encuestas o bases de datos de tipo corte transversal, donde cada levantamiento representa una muestra aleatoria de una misma población en particular. Tal es el caso de la Encuesta Nacional de Ingresos y Gastos del Hogar (ENIGH) que contiene información sobre distintas características socio-demográficas del hogar, los ingresos y gastos en los que incurren y, adicionalmente, información sobre el número de vehículos en propiedad del hogar. Al ser sólo estos los datos disponibles no se puede tener un modelo tipo panel, ya que no se encuestó al mismo individuo en diferentes puntos del tiempo; para ello se han desarrollado nuevos modelos o técnicas econométricas que nos permitan, utilizando las bases existentes, hacer un seguimiento artificial de los individuos. Inicialmente el uso de pseudo-panel surgió con Deaton [1993] y una de sus aplicaciones fue la descripción de patrones de consumo en Taiwán; a pesar de que sigue siendo una técnica poco explorada, puede llegar a ser de gran utilidad en temas relacionados con bienes durables, como es el caso de la propiedad de autos. 2. Construcción y uso de un modelo de pseudo-panel Una base de datos de tipo Pseudo-Panel requiere en primer lugar de la construcción de cohortes, definidas como grupo de individuos/agentes que comparten una o varias características en común, invariantes en el tiempo. En la mayoría de las investigaciones que se han realizado usando este tipo de bases se Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 217 utiliza como variable en común el año de nacimiento de la persona, aunque también puede utilizarse el género, raza, y/o lugar de nacimiento, entre otros. Una vez definidas las cohortes, se deben calcular los valores medios de todas las variables para cada cohorte. En el contexto de este análisis, la variable dependiente es el número de autos y como variables independientes se incluyeron: ingreso del hogar, tamaño de la localidad donde se ubica el hogar, número de personas que habitan el hogar, precio del auto y precio de la gasolina, entre otras. Estas cohortes son ahora las nuevas unidades de observación que conforman el Pseudo-Panel (Deaton [1985]). Precisando, tenemos que para un modelo de panel tradicional, la especificación general es la siguiente: (1) Donde el subíndice i corresponde a cada uno de los N individuos en la muestra y el subíndice t corresponde a la dimensión temporal, es un vector de K variables explicativas, y es un escalar, es la observación i-ésima en el periodo t de las K variables explicativas. La caracterización más general del término de error puede definirse como, (2) Donde representa la heterogeneidad no observable por individuo, invariante en el tiempo; refleja la heterogeneidad no observable por periodo, invariante entre individuos; y se refiere al componente del error, completamente aleatorio. Ahora bien, para un pseudo panel, la especificación luciría de la siguiente manera: c=1,…, C t=1, …, T (3) Donde es el promedio de sobre los i individuos pertenecientes al cohorte c en el tiempo t, que en este caso, es el promedio del número de autos dentro del cohorte. Es importante notar que, a diferencia de la especificación para un panel, el término retiene el indicador de tiempo para señalar que los 218 Gaceta de Economía valores medios por cohorte son calculados para un conjunto diferente de individuos. Esto conlleva a tener potencialmente un valor de distinto para cada periodo. En principio, se busca que la definición de las cohortes sea tal que los individuos al interior de cada cohorte sean lo más homogéneos entre sí y lo más heterogéneos entre cohortes. En este sentido, el investigador enfrenta una disyuntiva entre número de cohortes y número de observaciones en cada cohorte, para la cual la literatura no ha llegado a una conclusión sobre el intercambio óptimo. Por un lado, uno prefiere tener mayor número de cohortes para aumentar el tamaño de la nueva muestra. Por otro lado, si el número de observaciones por cohorte no es lo suficientemente grande, las medias muestrales no estimarían con exactitud las medias poblacionales. Con el objetivo de corregir estos errores de medición, varios autores han propuesto Estimadores del tipo “Error-in-Variables” (Deaton [1985], Verbeek y Hijman [1993], Biorn [1992], Marsgakkm [1992] y Devereux [2003]). Sin embargo, en la práctica, la mayoría de los estudios empíricos que usan pseudopanel han optado por el uso de estimadores estándar del tipo ―within‖ justificando que el problema de error de medición puede ser ignorado siempre que el número de observaciones en cada celda por cohorte sea lo suficientemente grande. A manera de convención, se ha considerado como mínimo un total de 100 observaciones por celda (Verbeek y Hijman [1992]). Ignorando los errores de medición por medio del método anteriormente explicado, es posible asumir que para todo t. De esta manera, simplificando la ecuación (3), se puede especificar este término como efectos fijos por cohorte como: (4) Desde el punto de vista econométrico, trabajar con datos agrupados tiene dos consecuencias importantes. La primera es que los parámetros estimados son menos eficientes debido a que la agregación de datos conlleva la pérdida de información. El ajuste de las regresiones de datos agrupados es considerablemente más alto, incluso cercano a 1. Si el número de observaciones por cohorte difiere considerablemente, el término de error será heteroscedástico. Para corregir este problema se recomienda ponderar los datos por la raíz cuadrada del tamaño de las cohortes. De esta manera, los errores se vuelven Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 219 homoscedásticos y todos los supuestos del modelo de regresión lineal clásico se cumplen (Greene [1997]). Las distintas especificaciones que puede tener un modelo de pseudo-panel son prácticamente iguales a las de un panel, aunque requiere tener consideraciones adicionales en la justificación e interpretación de cada una de las variables incluidas en la regresión. Partiendo de la ecuación (4), es posible definir tres principales especificaciones basadas en los supuestos que se hagan sobre la heteroscedasticidad de los datos. La primera de ellas, y la más sencilla, asume que no existe heterogeneidad no observable por lo cual el término = 0. Como consecuencia, la estimación de dicha ecuación puede realizarse sin problemas usando Mínimos Cuadrados Ordinarios con la ventaja de contar con más grados de libertad. Ahora bien, si se asume la existencia de heterogeneidad no observada, se debe especificar la forma específica en la que dicha heterogeneidad afecta a la variable dependiente. En el caso de los Modelos de Efectos Fijos, se asume que las variables explicativas afectan por igual a las cohortes en cada levantamiento y que estas cohortes se diferencian entre sí por características propias a cada uno. Estas diferencias son capturadas por medio de intersectos constantes independientes para cada cohorte. Por esta razón este modelo también se conoce como Least Square Dummy Variables. Por ejemplo, en el caso en que las cohortes representen distintas ―generaciones‖ de individuos u hogares, los efectos fijos estarían capturando factores como cambios en gustos o moda entre generaciones. Dado que se deben agregar a la ecuación tantas variables explicativas como cohortes existan, se produce, en consecuencia, una pérdida importante de grados de libertad. Alternativamente, en un Modelo de Efectos Aleatorios se asume que los efectos individuales no son independientes entre sí, sino que están distribuidos aleatoriamente alrededor de un valor dado. En otras palabras, esto sería equivalente a suponer que todos aquellos factores que influyen en las variaciones de la variable dependiente, pero que no han sido incluidas en el modelo, pueden ser representadas comprehensivamente por medio de una perturbación aleatoria. La especificación econométrica luce igual que la ecuación (4) sólo se agrega la condición adicional de que y se distribuye independiente y aleatoriamente 220 Gaceta de Economía con media cero, es decir, que no existen efectos fijos. Debido a este último supuesto, se tiene que los modelos de efectos aleatorios son los más deseables cuando se tiene como objetivo hacer inferencia sobre toda la población, mientras que los modelos de efectos fijos están limitados al tipo de cohortes incluidas en el análisis (Baltagli [1995]). Para la elección del modelo correcto a estimar, se han propuesto pruebas estadísticas que detectan la presencia de efectos fijos. La más utilizada, es la prueba de Hausman que permite identificar si existe o no correlación significativa entre los efectos aleatorios no observados específicos ( ) y los regresores . Si no existe correlación significativa, el modelo de efectos aleatorios sería el más poderosos y parsimonioso. En términos de interpretación de los resultados, cada tipo de especificación parte de supuestos diferentes. El modelo de efectos fijos es visto como uno en el que el investigador hace inferencias condicionales sobre los efectos que existen en la muestra, mientras que el modelo de efectos aleatorios es visto como uno en el que el investigador hace inferencia incondicional o marginal con respecto a toda la población (Hsiao [1986]). Existen argumentos a favor y en contra del uso de un pseudo-panel. Dentro de los argumentos a favor tenemos primero, que se tienen menos problemas relacionados al desgaste de la muestra, ya que ésta se renueva cada periodo. Segundo, se tienen menos problemas en cuanto al error de medición por lo menos a nivel individual, ya que éste es suavizado por el uso de valores medios y puede ser explícitamente controlado usando los métodos de “Error-in-Variables”. Tercero, debido a la mayor disponibilidad de varias bases de datos de corte transversal, es posible construir un pseudo-panel representativo, cubriendo periodos largos en el tiempo, más que lo que se puede cubrir con un panel real, además, de poder incluir datos de otras fuentes que puedan ser comparables con la definición de cohortes que se haya establecido. Cuarto, las inconsistencias entre análisis macro y micro se pueden analizar si se transforman los datos individuales a una cohorte macro. El principal argumento en contra se debe a la construcción de las cohortes, ya que existe un trade-off entre el número de cohortes y su tamaño. Cohortes con menores observaciones implican menor precisión en el promedio por cohorte pero cohortes con mayor número de observaciones reducen la muestra. A pesar de que no se ha llegado a un consenso como tal, en la práctica se considera como mínimo Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 221 un total de 100 observaciones por celda para el cálculo del promedio por cohorte (Verbeek y Hijman [1992]). 3. Análisis de la propiedad y número de autos por parte de los hogares en México Una vez explicada la forma en la que se construye y estima un modelo de pseudo-panel, su utilidad, ventajas y desventajas, la presente sección muestra la aplicación de un modelo de esta naturaleza al análisis de la propiedad y número de autos por parte de los hogares en México. Dos trabajos empíricos recientes en los que se utiliza un pseudo-panel para analizar la propiedad de automóviles en los hogares son los de Dargay y Vythoulkas [1999] y Dargay [2002]. El primero de ellos utiliza diversos levantamientos de la Encuesta de Gasto de las Familias del Reino Unido (UK Family Expenditure Survey, FES) entre 1982 y 1993 para identificar los factores microeconómicos que determinan el número de autos particulares en el Reino Unido. Los hogares fueron agrupados en cohortes con intervalos de cinco años definidos a partir del año de nacimiento del jefe del hogar. El sello particular de este trabajo es la estimación de modelos dinámicos por medio de la inclusión de la variable dependiente rezagada como regresor. Como variables explicativas se incluye el total del gasto semanal por hogar, número de adultos, número de niños, porcentaje de hogares localizados en zonas metropolitanas dentro de la cohorte al igual que el porcentaje en zonas rurales, una variable que indica la generación de edad, los costos de adquirir y mantener el auto y tarifas de transporte público. En los resultados se obtuvieron estimaciones para el modelo de efectos fijos y para diferentes especificaciones del modelo de generación, el cual incluye la variable de generación de edad: MCO, efectos aleatorios y efectos aleatorios AR1. Para ambos modelos los parámetros estimados fueron muy similares y los signos de éstos fueron los esperados. El trabajo anterior fue mejorado en Dargay [2002] utilizando la misma base de datos pero en esta ocasión se estimaron especificaciones no lineales como semi-log, doble-log, y log-inverso que han probado ser más adecuadas para modelar funciones de demanda. También se cambió la forma de armar las cohortes: se utilizaron dos variables para agrupar las observaciones en cohortes: una relacionada con la generación y la otra con el área de residencia. La generación se definió por el año de nacimiento del jefe del hogar, mientras que el 222 Gaceta de Economía área de residencia se dividió en tres: urbana, rural y otras áreas. Se estimaron parámetros para las distintas especificaciones en ambos modelos (efectos fijos y de generación). Sin embargo, el modelo de generación fue rechazado por la prueba de razón de verosimilitud, lo que difiere de los resultados del primer estudio, esto puede deberse a la mayor desagregación en las cohortes, ya que el modelo de generación asume un incremento lineal en la tenencia de autos para cada nueva generación y esa no parece ser la tendencia para las nuevas generaciones, que constituye una gran parte de la muestra ampliada que se utilizó en este estudio. Las pruebas para obtener la especificación funcional concluyeron que el modelo de log inverso era el preferido. En México se han hecho pocos estudios sobre propiedad de autos per se. Sin embargo, hay estudios relacionados con el tema que usan distintos tipos de datos. Por ejemplo, Berndt y Botero [1983] usan datos de tipo agregado en la estimación de la demanda de energía para distintos medios de transporte como tren, avión y auto, enfocándose principalmente en el cálculo de elasticidades de gasolina y diesel. En el apartado de vehículos motores también se estima la elasticidad de venta de autos nuevos con respecto al precio real de autos nuevos; la elasticidad obtenida es -1.34, mientras que la elasticidad con respecto al ingreso per cápita es de 0.992. Desde 1978, la razón de venta de autos nuevos con respecto al acervo de autos es 0.76, la elasticidad del acervo de autos con respecto al precio de autos nuevos e ingreso per cápita es de -0.10 y 0.08, respectivamente. Estos resultados sugieren que la demanda por autos en México si se ve afectada por el crecimiento económico y la política de precios de los autos. Otro estudio relacionado es Eskeland y Feyzioglu [1997], quienes estimaron un modelo de demanda por gasolina y propiedad de autos para México utilizando observaciones anuales de datos panel por Estado (los 31 Estados de la República y el Distrito Federal) del registro de vehículos de cada entidad federativa durante el periodo de 1982 a 1988. Se utilizó el método de variables instrumentales para la estimación del modelo utilizando como instrumentos de la variable dependiente los valores rezagados para el consumo de gasolina y para el ingreso. Las variables explicativas del modelo fueron: ingreso anual, consumo de gasolina (división total del consumo de gasolina en cada Estado entre el número de autos registrados) y precio de gasolina ―Magna‖. Como resultado se obtuvo un modelo de ajuste casi inmediato (dentro del año) con una elasticidad-precio para consumo de gasolina en el corto plazo de -.79, muy cercana a la estimada en el largo plazo (-.8). Con respecto a otros estudios relacionados con el tema, Eskeland y Feyzioglu [1995] analizaron la eficiencia del programa ―Hoy No Circula‖ aplicado a la Zona Metropolitana del Valle de México. Se construyó un modelo de demanda por Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 223 gasolina con datos agregados de series de tiempo antes de la regulación para simular el contra-factual de la demanda para los siguientes periodos, como si la regulación no hubiera entrado en vigor. Los resultados mostraron que después de un periodo inicial de ajuste de aproximadamente seis meses, el uso del auto aumentó en lugar de reducirse. Adicionalmente, los autores analizaron la propiedad de autos desde la perspectiva de hogares en la Ciudad de México utilizando datos de tipo corte transversal de un periodo anterior a la regulación para estimar los parámetros de un modelo, en donde el hogar maximiza su función de utilidad, la cual se compone de servicios de transporte obtenidos del auto y consumo de los demás bienes y servicios, sujeta a una restricción presupuestal. Se asume que la demanda por el servicio de transporte está relacionada directamente con la propiedad de autos y utiliza el modelo con diferentes escenarios para ver el comportamiento de los hogares cuando parte de la flota es retirada debido a la regulación. Los resultados muestran que la regulación hace que existan tanto vendedores como compradores de autos; y aunque el modelo no puede indicar que el aumento en propiedad de autos está directamente relacionado con la regulación, si concluye que el número de compradores sería sustancial. 3.1. Especificación Econométrica y Descripción de la Base de Datos Siguiendo la intuición planteada en los estudios empíricos revisados y considerando la disponibilidad de información útil para este estudio, se especificaron dos ecuaciones a estimar econométricamente: 𝑃𝑟𝑜𝑝𝑐𝑡 = 𝛼 + 𝛽1 𝑆𝑜𝑐𝑖𝑜𝑐𝑡 + 𝛽2 𝐶𝑜𝑠𝑡𝑜𝑠𝑡 + 𝛽3 𝑀𝑎𝑐𝑟𝑜𝑡 + 𝛽4 𝑅𝑒𝑔𝑡 + 𝑢𝑐,𝑡 (1) 𝐴𝑢𝑡𝑜𝑠𝑐𝑡 = 𝛼 + 𝛽1 𝑆𝑜𝑐𝑖𝑜𝑐𝑡 + 𝛽2 𝐶𝑜𝑠𝑡𝑜𝑠𝑡 + 𝛽3 𝑀𝑎𝑐𝑟𝑜𝑡 + 𝛽4 𝑅𝑒𝑔𝑡 + 𝑢𝑐,𝑡 (2) Donde, c: indicador de cohortes (c=1,2,…16) t: indicador de año (t=1984, 1989, 1992, 1994, 1996, 1998, 2000, 2002, 2004, 2006, 2008). 𝑃𝑟𝑜𝑝𝑐𝑡 : Proporción de hogares que cuentan con al menos un auto dentro de la cohorte c en el año t. : Número promedio de autos por hogar dentro de la cohorte c en el año t. 224 Gaceta de Economía : Vector de variables socio-demográficas promedio de los hogares dentro de la cohorte c en el año t. : Vector de variables macroeconómicas. : Vector de variables que capturan los costos de tenencia y uso del automóvil. : Variables que capturan los efectos de las regulaciones relevantes sobre la propiedad de autos en los hogares. Para construir la base de datos que se utilizó en este estudio, se usaron cuatro distintas bases de datos oficiales: 1. Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH) La ENIGH es una encuesta realizada desde 1984 por el Instituto Nacional de Estadística y Geografía (INEGI). Los años de levantamiento desde esta encuesta son: 1984, 1989, 1992, 1994, 1996, 1998, 2000, 2002, 2004, 2005, 2006 y 2008. La población objetivo la constituyen los hogares de nacionales o extranjeros, que residen habitualmente en viviendas particulares dentro del territorio nacional. El principal objetivo de esta encuesta es conocer el comportamiento de los ingresos y gastos de los hogares, así como las características ocupacionales y socio-demográficas de los integrantes del hogar y las características de la infraestructura de la vivienda y el equipamiento del hogar. La representatividad de esta encuesta es nacional y para los estratos urbano y rural. 2. Banco de Información Económica (BIE) El BIE es un sistema de información operado también por el INEGI que cuenta con más de 160,000 series históricas con información económica de México y de algunos otros países. 3. Banco de México (Banxico) Banxico difunde información confiable y de calidad, donde se puede consultar un amplio conjunto de estadísticas económicas y financieras de la base de datos que utiliza el mismo banco en su análisis y en la formulación de sus políticas2. 4. Sistema de Información Energética (SIE) 2 http://www.banxico.org.mx/ Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 225 El SIE es un sistema operado conjuntamente por Secretaria de Energía, Petróleos Mexicanos y la Comisión Federal de Electricidad, entre otros, y contiene información estadística georeferenciada del sector energético relacionada con hidrocarburos, electricidad, carbón, eficiencia energética y actividades de investigación, entre otras. Usando estas fuentes de información, fue posible construir una base de datos que incluye diversas variables para cada categoría las cuales se detallan en el Cuadro 1. Cuadro 1. Descripción de la base de datos utilizada Nombre Descripción Tipo Cobertura temporal Cobertura Geográfica Fuente Numérica 1984-2008 Nacional ENIGH Numérica 1984-2008 Nacional ENIGH Numérica 1976-2009 Nacional SIE Variables explicativas: Edad jefe de familia Edad del jefe de familia Características sociodemográficas Costos de adquisición y operación Indicadores macroeconómicos Ingreso total trimestral normalizado Ingreso trimestral del hogar a precios constantes del 2008 Precio Gasolina Precio público por litro fijado por PEMEX para la venta de gasolina tipo magna IPC autos Índice de Precios al Consumidor para vehículos nuevos automotores Numérica 1982-2009 Regional (Frontera Norte, BANXICO Noroeste, Noreste, Centro Norte, Centro Sur, Sur, Cd. de México) PIB Producto Interno Bruto con base en precios de 2003 Numérica 1896-2008 Nacional BIE Reside en zona donde se aplica el Programa Hoy No Circula Hogares que se encuentran en la Zona Metropolitana del Valle de México a partir del año 1989 que corresponde al lugar y momento en que entró envigor el Programa Hoy no Circula Categórica 1989-2008 Zona Metropolitana del Valle de México ENIGH Categórica 2005-2008 Frontera Norte ENIGH Regulación Región fronteriza después del decreto de importación de autos usados Hogares que se encuentran en la frontera con Estados Unidos a partir del 2005, año en que entro en vigor la Ley que permitió la entrada de los autos chocolate (2005) *Nota: Al inicio de esta investigación, se probó la inclusión de variables explicativas adicionales a las reportadas en este cuadro como: tamaño de la localidad, número de miembros que habitan el hogar y género del jefe de familia, entre otras. Sin embargo, éstas fueron excluidas debido a que resultaron altamente correlacionadas con otras variables. Dentro de la categoría de características socio-demográficas tenemos que para la variable edad y edad al cuadrado se esperan efectos positivo y negativo respectivamente, esto indicaría que conforme aumenta la edad del jefe de familia la propiedad y número de autos aumenta hasta llegar a un umbral en el que comienza a disminuir. Esta tendencia refleja el aumento de las necesidades y 226 Gaceta de Economía preferencias por un automóvil durante la juventud y adultez y una posterior disminución durante la madurez y tercera edad. En estudios previos, se ha observado que el umbral en el que se alcanza el mayor número de autos por hogar ocurre alrededor de los 50 años de edad (Dargay [1999]). Con respecto a los costos de adquisición y operación, se incluyó como variable explicativa el promedio del IPC que registra el nivel de precios de autos 3 nuevos adquiridos dentro del país . Considerando que las variables dependientes a estimar en las regresiones (5) y (6) incluyen la propiedad de autos nuevos y viejos, puede ser que el coeficiente estimado de esta variable tenga un efecto positivo, pero pequeño o no significativo. En relación al costo de operación, se incluyó el precio por litro de gasolina tipo ―magna‖. Debido a que durante el periodo de estudio el precio de la gasolina en México no ha cambiado mucho, es posible que el consumidor no lo vea como un costo grande y por lo tanto no podamos identificar su efecto sobre la variable dependiente. Bajo la categoría de indicadores macroeconómicos, se incluyeron el promedio y la varianza del PIB de los tres años anteriores al año de observación. Estos indicadores tienen la intención de capturar el efecto de las expectativas de los hogares respecto al desempeño de la economía y la decisión de adquirir o conservar su automóvil. Esta variable no ha sido incluida en estudios anteriores aplicados a países desarrollados, pero se piensa que puede ser relevante en el contexto de economías en desarrollo donde existen fluctuaciones económicas mayores y donde la gente puede ser más sensible a estos cambios. Los modelos de bienes durables predicen que habrá grandes cambios en la adquisición ante pequeños cambios en las expectativas del ingreso debido a la posibilidad de retrasar la adquisición o renovación de los mismos (Deaton y Muellbauer [1980]). Finalmente, en la categoría de regulación, se incluyeron dos variables que controlan en tiempo y área geográfica la entrada en vigor y aplicación de 2 legislaciones que podrían tener una gran incidencia directa en la decisión de propiedad de autos de los hogares. La primera corresponde al Programa Hoy No Circula que inició en 1989 y abarca las 16 delegaciones del Distrito Federal y 18 municipios conurbados del Estado de México, el cual restringe la circulación 1 día a la semana de autos de menores niveles de desempeño ambiental, medidos directamente en estaciones ex profeso. La hipótesis es que este programa aumentaría a cantidad de autos que un hogar quisiera tener para mantener el flujo de servicios de transporte diario no decreciente. La segunda regulación que se considera relevante se refiere al Decreto de importación de autos usados en la 3 En un inicio, se buscaron datos de precios de automóviles nuevos y viejos pero fue imposible conseguir una medida consistente para todos los años bajo estudio. Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 227 frontera norte conocida como la Ley de ―Autos Chocolate‖, la cual entró en vigor en el año 2005, con la finalidad de regular los vehículos provenientes de Estados Unidos y Canadá. Esta ley permite la entrada de más autos usados a menores precios que los observados en el mercado mexicano pre-apertura. 3.2. Resultados Ambas ecuaciones fueron estimadas en forma de panel usando Mínimos Cuadrados Ordinarios probando los dos tipos de especificaciones posibles: efectos fijos y efectos aleatorios. Para determinar el mejor modelo, se aplicó la prueba de Hausman la cual resultó negativa. Este tipo de resultados se observa cuando hay diferencias no positivas semi-definidas en las varianzas de los parámetros estimados (Shreiber [2006]). Esto implica que la prueba es incapaz de favorecer el uso de un modelo sobre otro. En estos casos, algunos autores proponen justificar la selección del modelo adecuado basado en la naturaleza de los datos y del problema que se está analizando (Hsiao [1986]). Tomando ambos criterios en consideración, se optó por un modelo de efectos fijos considerando que estamos analizando 16 cohortes como definición de distintas ―generaciones‖, para las cuales queremos conocer los determinantes de su comportamiento. Es decir, no estamos buscando hacer inferencia sobre toda la población sino sobre la muestra con la que contamos. Los resultados para la Ecuación (1) se muestran en el Cuadro 2. En ella aparecen cuatro especificaciones en las que se fueron incluyendo uno a uno los distintos grupos de variables explicativas con el objetivo de identificar posibles cambios en los niveles de significancia y cambios de signo entre una especificación y otra. Para el conjunto de variables socio-económicas, se observa que las variables Edad y Edad al cuadrado del jefe de familia tuvieron el signo esperado, lo que indica que el efecto de la Edad del Jefe de familia sobre la propiedad de autos es creciente hasta alcanzar un máximo y después empieza a decrecer, tal y como se ha encontrado en la literatura previa. La edad en la que ocurre este cambio de signo es de 45 años. Para el caso del ingreso familiar, se observa que ante un aumento del 1% en el ingreso del hogar, la proporción de hogares con auto dentro de la cohorte aumentaría en 0.0003 puntos porcentuales. Las variables Edad y Edad al cuadrado así como el ingreso parecen ser muy robustas a través de las 4 especificaciones probadas. 228 Gaceta de Economía Con respecto a los costos de adquisición y operación de un auto, se observa que el IPC de autos resulta positivo y significativo, lo cual es sorprendente y contra intuitivo, ya que el IPC de autos ha disminuido a través de los años y la propiedad de autos ha ido aumentando; sería necesario hacer más pruebas para saber porque está ocurriendo esto. Asimismo, la variable de precio de gasolina resulta no significativa, esto puede deberse a que los individuos no reaccionan a cambios pequeños en el precio, como ha sucedido con el precio de gasolina en el periodo estudiado. En relación a las variables macroeconómicas como indicadores de las expectativas por parte de los consumidores, tenemos que ambas variables resultan significativas y con los signos esperados. Un aumento marginal en el promedio del PIB durante los tres años anteriores a la observación, aumenta la proporción de autos con al menos un vehículo en 0.00074 puntos porcentuales, mientras que un aumento marginal en la varianza lo reduce en tan sólo 0.0002 puntos porcentuales. Finalmente, para las variables que capturan el efecto de las reformas regulatorias en el sector, se observa que ambas tienen un efecto significativo y positivo. Específicamente, el porcentaje de hogares con al menos un auto aumenta en 0.003 puntos porcentuales cuando los hogares se encuentran ubicados en los municipios para los cuales opera el programa Hoy No Circula. Asimismo, la proporción de hogares con al menos un auto ubicados en estados fronterizos después del 2005 aumenta en 0.0026 puntos porcentuales comparado al resto del país. Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 229 Cuadro 2. Determinantes de la propiedad de autos en los hogares (Ecuación 1) Variables Explicativas Edad jefe de familia Edad al cuadrado de jefe de familia Ingreso trimestral (ln) (1) (2) (3) (4) 0.0158 [0.0012]** -0.0001 [0.0000]** 0.0168 [0.0013]** -0.0001 [0.0000]** 0.0161 [0.0018]** -0.0001 [0.0000]** 0.0170 [0.0015]** -0.0001 [0.0000]** 0.0788 [0.0092]** 0.0948 [0.0108]** 0.0401 [0.0147]** 0.0600 [0.0294]* 0.0840 [0.0120]** 0.0273 [0.0236] 0.0899 [0.0318]** 0.0518 [0.0366] 0.0369 [0.0130]** 0.0279 [0.0208] 0.1134 [0.0282]** 0.0744 [0.0332]* -0.0134 [0.0056]* -0.0202 [0.0050]** 0.3000 [0.0561]** Precio Gasolina (ln) Índice de precios para autos nuevos PIB (Promedio 3 últimos años normalizado) PIB (Varianza 3 últimos años normalizada) Reside en zona donde se aplica el Programa Hoy No Circula Región fronteriza después del decreto de importación de autos usados Constante -0.0127 [0.0010]** Observaciones 163 Número de cohortes 16 R2 0.76 Error estándar dentro de los corchetes 0.2663 [0.0451]** -0.0163 [0.0016]** 163 16 0.78 -0.0145 [0.0022]** 163 16 0.79 -0.0098 [0.0021]** 163 16 0.84 * significativo al 5%; ** significativo al 1% Con respecto a la estimación de la Ecuación 2, el Cuadro 3 muestra los resultados correspondientes. En comparación con el Cuadro 2, los resultados son muy similares en nivel de significancia y signo esperado. De los detalles importantes a destacar es el caso del ingreso, que en esta ecuación parece tener un efecto marginal mayor pasando de 0.03 en el caso de propiedad de autos a 0.07 en el caso de número de autos. El efecto de las variables macroeconómicas disminuye considerablemente para el caso del promedio normalizado que pasa de 0.00074 a 0.00047 puntos 230 Gaceta de Economía porcentuales y de -0.0002 a -0.0003 en el caso de la varianza normalizada. Finalmente, en las regulaciones, se observa que el efecto de ambas variables aumenta. Cuadro 3. Determinantes del número de autos en los hogares (Ecuación 2) Variables Explicativas Edad jefe de familia Edad al cuadrado de jefe de familia Ingreso trimestral (ln) (1) (2) (3) (4) 0.0182 [0.0015]** -0.0001 [0.0000]** 0.0203 [0.0017]** -0.0001 [0.0000]** 0.0214 [0.0023]** -0.0001 [0.0000]** 0.0224 [0.0020]** -0.0001 [0.0000]** 0.1203 [0.0120]** 0.1431 [0.0141]** 0.0288 [0.0193] 0.1014 [0.0385]** 0.1357 [0.0155]** 0.0426 [0.0306] 0.1261 [0.0411]** 0.0166 [0.0473] 0.0784 [0.0173]** 0.0432 [0.0275] 0.1549 [0.0374]** 0.0475 [0.0441] -0.0252 [0.0072]** -0.0337 [0.0067]** 0.3730 [0.0744]** Precio Gasolina (ln) Índice de precios para autos nuevos PIB (Promedio 3 últimos años normalizado) PIB (Varianza 3 últimos años normalizada) Reside en zona donde se aplica el Programa Hoy No Circula Región fronteriza después del decreto de importación de autos usados Constante -0.0180 [0.0013]** Observaciones 163 Número de cohortes 16 R2 0.75 Error estándar dentro de los corchetes 0.3050 [0.0598]** -0.0229 [0.0021]** 163 16 0.77 -0.0229 [0.0028]** 163 16 0.79 -0.0170 [0.0028]** 163 16 0.83 * significativo al 5%; ** significativo al 1% 4. Conclusiones El objetivo de este artículo es mostrar a los lectores interesados en economía, y en particular en economía ambiental, cómo se puede construir y estimar un modelo de pseudo-panel; el tipo de información que se necesita, las posibles especificaciones econométricas, y las diferencias que existen en su interpretación en relación a un modelo de panel. Adicionalmente, se mostró la aplicación de este Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 231 modelo a un problema relevante en México como lo es el análisis de los determinantes de propiedad y número de automóviles por parte de los hogares. Con respecto al uso de modelos de pseudo-panel se concluye que éstos tienen un gran potencial para ser usados en investigación aplicada dada la disponibilidad de encuestas de corte transversal en distintos años. De esta manera, es posible realizar análisis de tipo dinámico como se hace en un panel, pero reduciendo al mismo tiempo los problemas de desgaste y error de medición al hacer uso de promedios por cohortes. Con respecto al análisis de la propiedad y número de autos en México, se obtuvieron tres principales hallazgos. El primero de ellos se refiere al papel del ingreso, donde se obtuvo una relación positiva, es decir, que en términos generales, implica que si el ingreso promedio continúa aumentando, como ha venido sucediendo en los últimos años, el número de autos aumentará y las políticas públicas relacionadas a este tema tendrán que ir dirigidas a una mayor oferta ya sea de infraestructura o de sustitutos, como sería el mejoramiento del transporte público para así poder evitar el congestionamiento vial. El segundo va dirigido a las expectativas económicas, donde se observa que el crecimiento económico llega a ser un indicador importante de cómo los individuos perciben les van a afectar estos cambios en cuanto a su ingreso personal y por lo tanto a la compra de bienes durables. Lo que significa que una economía estable y en crecimiento llevará a los hogares a una mayor tenencia de dichos bienes. Finalmente, el tercer hallazgo se refiere a las regulaciones, en las cuales se obtuvieron resultados que nuevamente respaldan a la literatura anteriormente mencionada y en donde no se están cumpliendo los objetivos establecidos de dichas políticas. Por lo que se recomendaría replantear el funcionamiento de las mismas y hacer una evaluación más profunda para observar las causas y consecuencias de dichos resultados. Como pasos siguientes de esta investigación se calcularán las elasticidades precio e ingreso con la finalidad de tener una medida más exacta de en cuánto cambiará la proporción de hogares con auto dentro del cohorte y el número de autos cuando cambia el ingreso y el precio promedio. También este tipo de modelos llega a ser una herramienta útil para hacer un pronóstico del número de autos que habrá en el futuro. Para México ese resultado tiene implicaciones ambientales muy importantes, ya que los autos proveen valiosos servicios de transporte para las familias hacia sus centros de trabajo, educación, 232 Gaceta de Economía entretenimiento y convivencia social, pero a la vez generan externalidades negativas significativas para la calidad del aire local y la emisión de gases de efecto invernadero ligada al cambio climático global. Es fundamental entender desde el punto de vista económico las decisiones de los hogares mexicanos sobre una parte muy importante de sus acervos, los autos. Hay gran bienestar asociado al tener autos privados, las ciudades mismas se desarrollan entre la dicotomía del transporte público y el privado, las familias tienen acceso a bajos costos (en tiempo) a una mayor multiplicad de lugares, y a la vez los problemas de congestión, calidad de aire y salud local dependen de cuántos y qué tipo de autos haya. Ahora, cuando el reto de cambio climático está en el horizonte de nuestra generación y dependerá de nosotros, las decisiones individuales ya verdaderamente dejan de serlo, por eso hay que entenderlas cada vez mejor. 5. Referencias Baltagi, B. H. (1995) Econometric Analysis of Panel Data. Nueva York: John Wiley and Sons, Inc. Centro Mario Molina (2006). Medición de Emisiones Vehiculares. Ciudad Juárez, Chihuahua 2006. México. Dargay, J.M., Vythoulkas P.C. (1999). ―Estimation of a Dynamic car ownership model: a pseudo panel approach‖. Journal of Transport Economics and Policy 33 (3). Dargay, J.M. (2002). ―Determinants of car ownership in rural and urban areas: a pseudo- panel analysis‖. Transportation Research. 38. Deaton A. y Ch. Paxson (1993). Saving, Growth, and Aging in Taiwan. NBER Documento de trabajo N°4330. Deaton, A. y Muellbauer, J. (1980), Economics and Consumer Behavior pp367377. Cambridge: Cambridge University Press. Deaton, A. (1985). Panel Data from Time Series of Cross Sections. Journal of Econometrics, 30. Greene, W.H. (1993). Econometric Analysis. New Jersey: Prentice Hall, Inc. Huang, B. (2007), The Use of Pseudo Panel Data for Forecasting Car Ownership, unpublished PhD thesis, Department of Economics, Birkbeck College Construcción y uso de un modelo pseudo-panel aplicado al análisis de … 233 Hsiao, C. (1986), Analysis of Panel Data. Press Syndicate of the University of Cambridge. INE-SEMARNAT (2009). Cuarta Comunicación ante la Convención Marco de las Naciones Unidas sobre Cambio Climático. México. INEGI . Instituto Nacional de Estadística y Geografía e Informática. Encuesta Ingreso y Gasto de los Hogares en México. México. Nolan, A. (2003). The determinants of urban households’ transport decisions: A microeconometric study using Irish data. International Journal of Transport Economics 30 (1) :103–132. RAND Europe (2002). Review of recent international literature: car ownership. Report 01192. January. pp 31 - 68 Russell J.E., Fraas J.W. An Application of Panel regression. Ashland University. Schreiber, S. (2006). The Hausman Test Statistic Can Be Negative Even Asymptotically. Technical report, Universität Frankfurt am Main. Verbeek, M. (2006). Pseudo Panels and Repeated Cross-Sections. In Matyas, L. and Sevestre, P. (eds.) ‗The Econometrics of Panel Data: Handbook of the Theory and Applications‘, 3rd edition, Kluwer Academic Publishers, Netherlands. Verbeek, M., Nijman, T. (1992) Can Cohort Data be treated as genuine panel data? Empirical Economics 17, 9-23.