MODELOS DE ELECCIÓN MÚLTIPLE Más de dos alternativas es más complejo hallar una función de distribución que se ajuste a la función de probabilidad que tenemos planteada. Logit Multinomial Extensión logit binomial y es una v.a. que toma valores {0, 1, 2, ..., J} P( y j | x ) exp( x ) 1 exp( x j J j= 1, 2, …, J h h 1 Dado que las probabilidades deben sumar la unidad, P( y 0 | x ) 1 1 exp( x J h 1 h . 1 Coeficientes (y no las variables) dependen de la alternativa considerada. Es decir, si lo expresáramos en términos de utilidad sería: V(X, S ; βj) Aplicación: decisión entrada mercado de trabajo 2 Interpretación coeficientes Efectos parciales son complejos. β no informa ni tan solo de la dirección del cambio. Ratio de probabilidades es más informativa: P ( x, ) j P ( x, ) exp( x ) j o Cambio en el cociente de probabilidades puede aproximarse por: exp( x )x jk j k De manera equivalente: log( P ( x, ) / P ( x, )) x( ) j Si h=0 h j h log( P ( x, ) / P ( x, )) x j 0 j 3 Predicción: para cada observación i, el resultado con mayor probabilidad estimada es el resultado predicho. Estimación por máxima verosimilitud Para cada individuo i : l d log P x , J i j 0 ij j i d 1 si el individuo i elige la alternativa j, y cero en ij cualquier otro caso. El vector β se obtiene maximizando: l ( ) N i 1 i 4 Logit condicional Mc Fadden (1974) deriva un modelo similar al logit multinomial a partir de la maximización de la utilidad planeada anteriormente. Supuesto: los términos de error se distribuyen idéntica e independientemente, con función de distribución F ( nj ) e e nj Función Gumbel o de valor extremo tipo I. A partir de aquí podemos obtener la expresión para la probabilidad de elección de una alternativa i por parte del individuo n como: Pi eV i J e Vj j 1 Ahora V (Xj S, β) . Si la relación es lineal: 5 P( y j | x ) n exp( x ) exp( x ) nj J nh h 0 Variables x varían en j y posiblemente en n. Para introducir una variable que sólo varíe entre los individuos deberemos utilizar una variable ficticia. Interpretación de los coeficientes p ( x ) p ( x )(1 p ( x )) x j j j k jk p ( x ) p ( x) p ( x) x j j h k hk Si todas las variables son específicas del individuo, el modelo CL coincide con el MNL. 6 Principal limitación logit condicional Propiedades relativas entre dos alternativas dependen sólo de las características de estas dos alternativas. p ( x ) exp( x ) p ( x ) exp( x ) j j j h h h Propiedad de Independencia de Alternativas Irrelevantes La probabilidad relativa de elegir entre cualquier par de alternativas es independiente de las características de las demás alternativas del conjunto de elección. 7 Contraste de la propiedad de IIA Test de Hausman-McFadden (1984). Se estima el modelo con el conjunto de elección completo (f) y restringido (s). Bajo la hipótesis nula de que se cumple IIA, los coeficientes en ambos casos deberían ser similares. Se contrasta la significatividad de dicha diferencia. (ˆ ˆ )Vˆ Vˆ (ˆ ˆ ) 2 s Donde f V̂s y s Vˆ f f s f son la matriz de varianzas y covarianzas estimada en cada caso. Si rechazamos la hipótesis nula de validez de IIA, debemos emplear un modelo alternativo al MNL 8 Modelos alternativos La diferencia reside en la especificación del término aleatorio. Probit multinomial Modelos GEV Modelos HEV Modelos Mixtos 9 Probit Multinomial (MNP) U ni ' xni ni n ~ N ( 0, ) ( n ) 1 1 1 exp( ' n ) 1 / 2 n J /2 2 ( 2 ) Pni I ( Vni ni Vnj nj j i ) ( n ) d n El MNP requiere calcular una integral de J dimensiones para obtener Pni. Inviable con un alto número de alternativas, salvo por métodos de simulación (Train 2003) 10 MODELOS GEV Modelos de valor extremo generalizado (GEV). En estos modelos el componente aleatorio sigue una distribución de valor extremo, con distintos patrones de correlación. Un caso particular es el modelo logit anidado. Es posible probar que estos modelos son consistentes con la maximización de U del tipo: U V nj nj nj Logit multinomial anidado – nested logit (NL): Modelo adecuado cunado podemos dividir el conjunto de elección en grupos de tal manera que: - IIA se cumple entre alternativas pertenecientes al mismo grupo. - IIA no se cumple entre alternativas pertenecientes a distintos grupos. Permitimos que la varianza difiera entre grupos. 11 Ejemplo: Train (2003) Privado Sólo Compartido Público Bus Tren 12 Especificación se plantea como un problema de elección en distintos niveles. Estructura implícita de elección en forma de árbol: Grupo A alt. 1 alt. 2 Grupo B alt. 3 alt. 4 alt. 5 Primer nivel de elección: Grupo. Segundo nivel de elección: alternativa, condicionada por la elección del primer nivel. Para cada nivel de elección tenemos un conjunto de variables explicativas. 13 Las J alternativas se pueden particionar en B1, B2, ... , BK grupos. El modelo logit anidado se obtiene bajo la hipótesis de que los componentes aleatorios siguen una distribución generalizada de valor extremo. La función de distribución acumulativa conjunta de εj es: F ( ) exp e K k j k k 1 jBk La distribución marginal de εj es univariante de valor extremo pero cada εj dentro de un subconjunto están correlacionados. K es una medida del grado de independencia del componente aleatorio de las alternativas del grupo K. A mayor K mayor independencia o menor correlación. Si K = 1 para todo k, indica independencia entre todas las alternativas en todos los grupos, el NL equivale al logit condicional. 14 El modelo de probabilidad que se deriva de los anteriores supuestos es: e P ni e e Vni k Vni k jBk Vnj K l 1 jBk k 1 l l K [0,1] el NL es consistente con un comportamiento maximizador de la utilidad 15 Descomposición del NL en dos Logit permite una interpretación más ilustrativa. U W Y nj jB nk nj nj K WnK depende sólo de variables que definen el grupo k. Difieren entre grupos pero no dentro de un mismo grupo. Ynj depende de variables que describen la alternativa j De esta forma Pni puede escribirse como: P P P ni ni |Bk nBk Dónde Pni|Bk Probabilidad condicional de elegir i dentro del grupo k. Se define para variables que varían dentro de cada grupo. (modelo segundo nivel). 16 PBk Probabilidad marginal de elegir una alternativa del grupo k. Se define para las variables que varían entre grupos. (modelo del primer nivel). La probabilidad marginal y condicional toman la forma de logit de tal manera que su producto puede expresarse: P P ·P ni | B ni |BK K e Yni e k Ynj e k e jBk I nk ln e Ynj K Wnk k I nk Wnl k I nl l 1 k jB K Interpretación económica: refleja la utilidad esperada de un individuo de las alternativas del grupo k (Small y Rosen, 1981). Valor inclusivo (utilidad inclusiva). Estimación Dos procedimientos: 1. Estimación en dos etapas. Descomponer la probabilidad marginal y condicional. 17 a. Estimar la probabilidad condicional. b. Calcular Ik c. Estimar la probabilidad marginal incluyendo Ik como variable explicativa. Problemas: - sesgo en los errores estándard - imposibilidad de imponer ciertas restricciones 2. Máxima verosimilitud con información completa FIML. Logit anidado se aplica también a la toma de dos o más decisiones discreta. Ejemplo: decisión de número de coches y elección del coche para ir al lugar de trabajo. 18 OTROS MODELOS Modelo logit heteroscedástico Extensión del logit condicional que relaja la hipótesis de igual varianza para las perturbaciones dentro de un mismo grupo. Logit Mixto Brownstone y Train Modelo que combina parámetros aleatorios con una estructura muy flexible para los componentes no observables. Característica definitoria es que los factores no observables pueden descomponerse en dos elementos: - Una parte que contiene toda la correlación y heteroscedasticidad y puede seguir cualquier distribución - Una segunda parte que se distribuye i.i.d valor extremo 19