INV- Modelos no lineales en GRETL/2011-II APLICACIÓN DE MODELOS NO LINEALES CON VARIABLE DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL Diego Esteban Eslava Avendaño 1 diciembre de 2011 Resumen: El modelo de regresión lineal clásico no siempre es una buena aproximación en la explicación y análisis de fenómenos económicos debido a que los problemas que se buscan modelar pueden presentar características que hacen que las estimaciones bajo este modelo no sean adecuadas. Por tal motivo, esta investigación tiene como objetivo presentar al lector la aplicación de dos modelos (Logit y Probit) que buscan solucionar dos problemas: considerar la variable dependiente limitada o binaria, y, asumir que la probabilidad de que un evento pase no esté relacionada linealmente con las variables explicativas. Para la aplicación de dichos modelos se van a describir los procesos necesarios para su estimación en GRETL (The Gnu Regression, econometrics and Timeseries Library) como un software alternativo a los usualmente utilizados, por lo que se hará una descripción básica del software, se aplicarán los modelos Logit y Probit en éste y se evaluarán los resultados respecto a uno de los programas más reconocidos: Stata. Palabras Clave: Modelo de Probabilidad Lineal, Logit, Probit, GRETL, Stata. APPLICATION OF NON-LINEAR MODELS WITH LIMITED ENDOGENOUS VARIABLE (LOGIT, PROBIT) USING GRETL Abstract: The classic linear regression model is not always a useful approximation for explaining and analyzing the economic phenomena, that is because some problems researchers try to model may have characteristics that make estimations not appropriate under this model. Therefore, this research aims to present the application of two models (Logit and Probit) useful for solving two specific problems: to assume the endogenous variable limited or binary, and, to assume the probability that an event happens is not linearly associated with the exogenous variables. The processes needed for the application of those models will be described in GRETL (The Gnu Regression, econometrics and Timeseries Library) as alternative software to the ones usually used. A basic description of the software and the application of Logit and Probit using GRETL will be provided in this document; in addition the results will be evaluated in contrast to one of the most known software: Stata. Keywords: Linear Probability Model, Logit, Probit, GRETL, Stata. 1 Estudiante de Economía de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia, y monitor de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas. Correo Electrónico: deeslavaa@unal.edu.co INV- Modelos no lineales en GRETL/2011-II Estudiantes Auxiliares: Camilo Alexandry Peña Talero Cristian Andrés Hernández Caro Claudia Patricia Ospina Aldana Daniel Francisco Rojas Martín David Camilo Sánchez Zambrano David Mauricio Mahecha Salas Diego Esteban Eslava Avendaño Edward F. Yanquen Briñez Gloria Stella Barrera Ardila Iván Albeiro Cabezas Martínez Javier Alejandro Ortiz Varela Jeimmy Paola Muñoz Juan Carlos Tarapuez Roa Juan David Vega Baquero Juan Fernando López Prieto Leonardo Alexander Cárdenas Lina Marcela Igua Torres María Paula Contreras Navarrete Paola Alejandra Alvarado Castillo Viviana Contreras Moreno Viviana María Oquendo Director Unidad Informática: Henry Martínez Sarmiento Tutor Investigación: Juan Carlos Tarapuez roa. Coordinadores: Jasmin Guerra Cárdenas Juan Felipe Reyes Rodríguez Coordinador Servicios Web: John Jairo Vargas Analista de Infraestructura y Comunicaciones: Diego Alejandro Jiménez Arévalo Analista de Sistemas de Información: Víctor Hugo Ramos Ramos Este documento es resultado de un trabajo conjunto y coordinado de los integrantes de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias Económicas de la Universidad Nacional de Colombia. Esta obra está bajo una licencia reconocimiento no comercial 2.5 Colombia de Creative Commons. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/2.5/co/ o envíe una carta a Creative Commons, 171second street, suite 30 San Francisco, California 94105, USA. 2 INV- Modelos no lineales en GRETL/2011-II APLICACIÓN DE MODELOS NO LINEALES DE VARIABLE DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL Contenido 1. INTRODUCCIÓN. ..................................................................................................................5 1.1. PERTINENCIA DE LA APLICACIÓN DE MODELOS NO LINEALES Y GRETL EN LA FCE...................................................................................................................5 2. DESCRIPCIÓN BÁSICA DE GRETL. ...............................................................................7 2.1. 2.1.1. Linux. .......................................................................................................................7 2.1.2. MS Windows...........................................................................................................8 2.2. Ventana Principal .................................................................................................8 2.2.2. Importación de archivos .....................................................................................9 2.2.3. Herramientas de trabajo ...................................................................................11 ANÁLISIS ESTADÍSTICO DESCRIPTIVO Y EDICIÓN DE VARIABLES. ......11 2.3.1. Estadísticos y gráficos descriptivos. .............................................................12 2.3.2. Transformación y generación de nuevas variables. .................................15 APLICACIÓN DE MODELOS ECONOMÉTRICOS. ....................................................17 3.1. 4. EXPLORACIÓN BÁSICA DEL PROGRAMA. ..........................................................8 2.2.1. 2.3. 3. INSTALACIÓN. ...............................................................................................................7 MÍNIMOS CUADRADOS ORDINARIOS. ...............................................................17 3.1.1. Contraste de supuestos. ...................................................................................18 3.1.2. Intervalos de confianza. ....................................................................................18 MODELOS CON VARIABLE DEPENDIENTE BINARIA ............................................19 4.1. MODELO DE PROBABILIDAD LINEAL (MPL). ...................................................19 4.1.1. 4.2. Desventajas del MPL ..........................................................................................21 MODELOS NO LINEALES PARA RESPUESTA BINARIA. ................................21 4.2.1. Interpretación de las estimaciones de los modelos Logit y Probit ........24 4.2.2. Pruebas de hipótesis múltiples. .....................................................................26 4.3. CONCLUSIONES.........................................................................................................27 3 INV- Modelos no lineales en GRETL/2011-II 5. APLICACIÓN DE MODELOS LOGIT Y PROBIT EN GRETL. ..................................27 6. APLICACIÓN DE LOGIT Y PROBIT EN STATA. .........................................................31 7. CONCLUSIÓN. .....................................................................................................................34 8. REFERENCIAS. ...................................................................................................................35 4 INV- Modelos no lineales en GRETL/2011-II 1. INTRODUCCIÓN. En la práctica cada vez toma mayor importancia el análisis de la efectividad de políticas y medidas aplicadas en diversas esferas de la sociedad mediante el uso de modelos econométricos. Sin embargo, debido a la complejidad de la realidad económica encontrar modelos que se ajusten al problema analizado sugiere un gran problema para el investigador, que se agrava al sumársele el problema de encontrar software que le permita la exploración de nuevas herramientas y modelos, fáciles de utilizar y que no sean restrictivos en su uso. Bajo este contexto, la presente investigación tiene como objetivo darle a los estudiantes una introducción a la aplicación de dos modelos que buscan mayor precisión en el análisis: Logit y Probit; estos modelos responden específicamente a dos problemas básicos que presenta el modelo de regresión lineal clásico. Junto con esto, se ofrece una guía de aplicación de dichos modelos en un software alternativo a los utilizados generalmente en el análisis estadístico: GRETL, haciendo énfasis en el fácil acceso y utilización de dicho programa que favorece la interacción del usuario. Para contrastar los resultados de la aplicación de los modelos en GRETL, se va a realizar el mismo proceso en Stata, uno de los software más reconocidos y utilizados en el área. 1.1. PERTINENCIA DE LA APLICACIÓN DE MODELOS NO LINEALES Y GRETL EN LA FCE. La enseñanza de los distintos métodos econométricos debe considerar como componente de gran importancia los procesos necesarios para la estimación de modelos y el contraste de supuestos utilizando la diversidad de paquetes econométricos que existen en el mercado. Estos programas regularmente han sido desarrollados utilizando códigos y procedimientos propios, por lo que para los nuevos usuarios resulta un reto el hecho de tener que, además de aprender la teoría estadística detrás de cada modelo, entender el lenguaje del software que se está utilizando y los resultados que le son mostrados al ejecutar un procedimiento. Dentro de la Facultad de Ciencias Económicas se ha evidenciado la falta de diversidad en los programas utilizados para la aplicación de la teoría tomada en clase, esta problemática se puede deber principalmente a dos factores: el primero, es la falta de medios explicativos para que los estudiantes aprendan a utilizar los diferentes paquetes (clases auxiliares con monitores que conozcan diversos programas, documentos de apoyo, ejemplos, etc.); el segundo, los problemas de acceso a los software por fuera del aula, pues debido a que ciertos de ellos, generalmente los más utilizados, requieren licencias y permisos, su uso está restringido. INV- Modelos no lineales en GRETL/2011-II Como forma de colaborar a disminuir el problema que se evidencia en la facultad, la presente investigación busca, en primera instancia, ofrecerles a los estudiantes una guía para el uso básico de GRETL, un software que se ajusta a las necesidades de la academia y que cuenta con gran cantidad de funcionalidades. A continuación se hace un análisis de los contenidos de las materias básicas de la línea de econometría relacionándolos con GRETL: Materia2 Funcionalidad en GRETL Econometría I Contenidos: Modelo de regresión simple y MCO. Modelo de regresión múltiple: estimación y supuestos Inferencia. Problemas asociados: heteroscedasticidad, multicolinealidad, variables omitidas, error de medición y simultaneidad. Estimación de modelos por MCO, contraste de supuestos, intervalos de confianza, gráficos de variables estimadas y observadas, gráfico de residuos, intervalos de confianza. Econometría II Contenidos: Análisis de Componentes Principales. Datos panel. Procesos estocásticos: lineales, estacionarios y no estacionarios. Modelos ARMA y ARIMA: especificación y propiedades, identificación, estimación, verificación y uso del modelo (predicción). Pruebas de raíz unitaria. Modelo ARIMA estacional. Análisis de componentes principales (arroja los resultados básicos de valores propios con su varianza y varianza acumulada y los vectores propios asociados a cada valor), estimación de datos panel (por efectos fijos, efectos aleatorios, MCO ponderados), análisis de series de tiempo con modelos ARMA y ARIMA. TABLA 1. PERTINENCIA DE GRETL EN LA FCE Como se observa en la relación descrita, el programa se ajusta a las necesidades de las clases del núcleo básico que ofrece la carrera. A través del presente documento se mostrarán las características básicas para el uso del programa en las que se hace énfasis en la facilidad y versatilidad que este ofrece, lo cual fortalece la pertinencia de su uso en la facultad, pues puede servir como medio 2 Contenidos tomados del Sistema de Información Académica de la Universidad Nacional de Colombia 6 INV- Modelos no lineales en GRETL/2011-II para incentivar el trabajo autónomo de los estudiantes que no se van a ver limitados por problemas de entendimiento usuario-software, como tampoco por el acceso restringido al uso del programa; sin dejar de asegurar la calidad en las estimaciones y en los procesos realizados. Respecto a la calidad en los procesos que GRETL realiza, el documento busca abarcar un tema complementario a los normalmente enseñados en los cursos de la facultad (presentados en la Tabla 1) se trata de la aplicación de modelos no lineales con variable dependiente binaria, modelos muy utilizados para el análisis de la realidad pero que por la dificultad en su interpretación no tienen cabida en los cursos iniciales de econometría. De esta manera, se busca hacer una aproximación básica a temas complementarios que incentivan el aprendizaje de los estudiantes por fuera del aula de clases. Los resultados que se obtengan de la estimación de dichos modelos serán confrontados con los resultados obtenidos de uno de los programas más utilizados, como lo es Stata, buscando validar la pertinencia del uso alternativo de GRETL. 2. DESCRIPCIÓN BÁSICA DE GRETL. GRETL (The Gnu Regression, Econometrics and Time-series Library) es un paquete econométrico desarrollado bajo los principios del software libre y la “General Public License (GPL)” de GNU. De este modo está dirigido principalmente al sistema operativo Linux, aunque cuenta con versiones desarrolladas para Windows y Mac. La principal fortaleza pedagógica del programa reside en que además de ofrecer una interfaz agradable para el usuario, incluye gran cantidad de datos de ejercicios de libros de econometría ampliamente usados en la enseñanza de esta herramienta. GRETL, además de permitir desarrollar gran cantidad de métodos y pruebas estadísticas, permite asociarse con otros programas ya sea en importación de datos (lee bases de datos de SPSS, Excel, Stata, Eviews, etc.) o de exportación de documentos donde trabaja conjuntamente con LaTeX. Sumado a esto, el programa tiene un enlace con R-Project, que se puede usar para un análisis de datos más avanzado. 2.1. INSTALACIÓN. 2.1.1. Linux. En Linux existe la posibilidad de elegir entre dos tipos de instalaciones. Por un lado, se puede instalar GRETL desde la compilación y construcción de su código, esto es útil para las personas que pretenden hacer desarrollos sobre la plataforma o quieren adecuar el programa a sus necesidades; Por el otro, existe un paquete “pre-construido” el cual es instalado por los usuarios corrientes, pues 7 INV- Modelos no lineales en GRETL/2011-II el primer tipo requiere de un conocimiento del código de programación. Algunas distribuciones de Linux como Debian y Ubuntu incluyen dentro de sus paquetes a GRETL y sus librerías, además se pueden encontrar ciertos paquetes listos para ejecutar en la página principal del programa, sección descargas (http://gretl.sourceforge.net/gretl_espanol.html). 2.1.2. MS Windows. En Windows el proceso de instalación se reduce a un archivo ejecutable que se encuentra en la dirección http://gretl.sourceforge.net/win32/index_es.html. Al ejecutar el archivo y elegir el directorio donde va a ser instalado el programa se instala automáticamente. Aparte de encontrar el instalador de GRETL para Windows, en esta página están diversos paquetes que se han venido desarrollando, tales como TRAMO/SEATS, datos de libros de enseñanza de Econometría, etc. Además se encuentran de opciones para actualización y construcción del programa. Tanto para Windows como para Linux el programa busca actualizaciones recurrentemente, sin embargo para el caso de Windows, el usuario puede decidir si desea que el programa actualice automáticamente. Para esto el usuario debe cerrar GRETL, ejecutar el programa “gretl updater” y cuando este termine volver a abrir GRETL. 2.2. EXPLORACIÓN BÁSICA DEL PROGRAMA. 2.2.1. Ventana Principal A. VENTANA PRINCIPAL 8 INV- Modelos no lineales en GRETL/2011-II La ventana principal de GRETL es supremamente sencilla e intuitiva para el usuario, el cual no tiene que tener un conocimiento en programación para poder usarlo. GRETL le ofrece opciones que tan sólo tiene que elegir con unos cuantos clics y que simplifican el trabajo del investigador. Sin embargo, para usuarios avanzados que quieren aumentar la experiencia en GRETL, el código del programa es abierto y pueden colaborar en el desarrollo de este. A continuación se hará revisión de las principales herramientas que ofrece la ventana principal: Barra de herramientas: Contiene las principales herramientas del programa en lo que se refiere a gestión de archivos y análisis estadístico y econométrico. Además, contiene una ventana de ayuda que enriquece el aprendizaje del investigador. Variables disponibles: Esta ventana, que ocupa el espacio más amplio de la ventana principal, muestra al usuario las variables que son cargadas dándole a cada variable un orden, un nombre y una descripción básica. Barra de acceso rápido: Ubicada en la parte inferior izquierda de la ventana principal, le ofrece al usuario un acceso rápido a ciertas herramientas básicas como es calculadora, guía de instrucciones, guía de usuario, consola y la vista de íconos de sesión donde se encuentra la información principal del conjunto de datos que está siendo trabajado. Características del conjunto de datos: Es un pequeño espacio ubicado en la parte inferior central de la ventana principal. Muestra la periodicidad de los datos y los años que comprende. 2.2.2. Importación de archivos Para importar datos a GRETL hay que utilizar la herramienta Abrir Datos ubicada en el menú archivo de la barra de herramientas, al dar clic en esta opción el programa mostrará tres opciones: Archivo de usuario: en la que el usuario busca en su equipo el conjunto de datos que desea importar. Archivo de muestra: Aquí el usuario tiene a disposición, por defecto, tres librerías de datos las cuales muestran una cantidad de conjuntos de datos precargadas y que se pueden aplicar a gran cantidad de modelos según sus características (revisar Ilustración B). En la página de GRETL es posible más bases de datos procedentes de libros de econometría. Para más información revise el siguiente vínculo http://gretl.sourceforge.net/gretl_data_es.html 9 INV- Modelos no lineales en GRETL/2011-II Importar: GRETL permite importar datos de diversos programas y extensiones, como son: Octave, texto/csv, Eviews, Gnumeric, Stata, SPSS, entre muchos más. B. ARCHIVOS DE MUESTR A Además de esta opción, existe la posibilidad de cargar guiones para ejecutar por medio de la consola, esto se hace desde la opción Archivos de guion del menú Archivo. Aquí se encontrarán las opciones comunes de cargar un guion ya sea por el mismo archivo del usuario o precargadas con el programa o crear una nueva de tipo R, GRETL, Octave, entre otros. Otra función útil que GRETL contiene es la carga de archivos de funciones, que también se encuentra ubicada en el menú Archivo, en ésta opción se puede cargar paquetes de funciones que hayan sido desarrolladas por algún usuario o por usted mismo, evitando el proceso de tener que desarrollarla por medio de programación. Por último existe la opción de configurar el directorio predeterminado de GRETL, la opción Archivo – Directorio de trabajo, permite configurar el directorio y las opciones de uso como se observa en la Ilustración C. C. SELECCIÓN DE DIREC TORIO 10 INV- Modelos no lineales en GRETL/2011-II De este modo al trabajar con nuestro directorio predeterminado el programa automáticamente buscará allí todos los archivos que se llamen usando los comandos open, run o include, por medio de la consola. Además cualquier trabajo que sea guardado o editado quedara grabado en este directorio. GRETL ofrece la opción de guardar y abrir sesiones de trabajo en el programa, así se tendrán a salvo los datos usados, algunos modelos aplicados y algunas gráficas que el usuario al cerrar la sesión haya decido guardar. Ciertas veces puede ser necesario dar información acerca de la naturaleza de la información, esto se lleva a cabo a través de la opción “Estructura del conjunto de datos” ubicada en la pestaña Datos de la barra de herramientas, aquí se podrá especificar si los datos son de tipo sección cruzada, serie temporal o panel. 2.2.3. Herramientas de trabajo La opción Herramientas, ubicada en la barra de herramientas de la ventana principal, cuenta con ciertas opciones útiles tanto para mejorar la eficiencia o la capacidad de uso del programa, como para el análisis estadístico básico. Por el momento se hará referencia a las herramientas de trabajo del programa, en la próxima sección se revisarán las herramientas de análisis. La principal función que podemos encontrar es la consola de GRETL, desde aquí podemos trabajar todas las funciones usando la línea de comandos del programa. Las funciones que el programa contiene se encuentran, o escribiendo “help” en la consola de comandos o en el menú de ayuda, ubicado en la barra de herramientas, donde aparece la opción “guía de instrucciones”. Aquí tendremos a nuestra disposición una descripción de todos los comandos disponibles en el programa. Adicional a esta herramienta está disponible una opción llamada “historial de instrucciones” la cual muestra los comandos que han sido utilizados durante la sesión de trabajo, junto con una opción de enlace a GNU R, la cual nos va a llevar a la interfaz de R-Project, que puede llegar a ser útil en el desarrollo de funciones más avanzadas que GRETL puede no contener. 2.3. ANÁLISIS ESTADÍSTICO DESCRIPTIVO Y EDICIÓN DE VARIABLES. GRETL ofrece al usuario ciertas herramientas útiles para la creación de estadísticos descriptivos de las variables que se estén trabajando. Una ventaja del software es que no sólo tiene un proceso muy intuitivo para generar los estadísticos principales sino que además contiene una serie de calculadoras o 11 INV- Modelos no lineales en GRETL/2011-II programaciones que nos muestran, por ejemplo, tablas estadísticas, valores-p, gráficas de distribuciones, estadísticos de contraste, entre otros. 2.3.1. Estadísticos y gráficos descriptivos. En la barra de herramientas se encuentra la opción Variable que desplegará opciones de edición y análisis estadístico, hay que tener en cuenta que cualquier opción que se elija va a arrojar el resultado para la variable que se haya seleccionado previamente en la ventana principal del programa. En relación con las opciones de edición se encontrarán opciones para cambiar datos, atributos de la serie (cambiar el nombre y número) y para establecer el código que reconocerá valores ausentes. Una de las opciones a tener en cuenta es el tipo de estructura de los datos, opción que se ejecutará automáticamente al importar una base de datos, o que se encuentra ubicada en la opción Datos de la barra de herramientas de la ventana principal. Aquí se podrá especificar la naturaleza de los datos y el orden que tiene, algo básico para la estimación correcta del modelo. Las opciones se muestran en la Ilustración D. D. ESTRUCTURA DE LOS DATOS 12 INV- Modelos no lineales en GRETL/2011-II En cuanto al análisis descriptivo las opciones que es posible encontrar son básicamente: Estadísticos principales: La salida de esta opción nos mostrará: media, mediana, máximo, mínimo, desviación estándar o típica, coeficiente de variación, de asimetría y el excedente de curtosis. E. ESTADÍSTICOS PRINCIPALES Además de esta opción, desde la barra de acceso rápido se puede encontrar una herramienta aún más interesante: dando clic en el botón “vista de iconos de sesión” se encontrará la opción Resumen la cual automáticamente nos mostrará la media, mediana, mínimo y máximo de todos los datos que contiene la base que ha sido cargada. F. ESTADÍSTICOS DEL CONJUNTO DE DATOS GENERAL 13 INV- Modelos no lineales en GRETL/2011-II Contraste de normalidad: El programa automáticamente hace cuatro pruebas de normalidad para la serie escogida: Doornik-Hansen, W de Shapiro-Wilk, Lilliefors y Jarque-Bera. Para cada una el programa muestra el estadístico y su valor-p asociado. G. CONTRASTE DE NORMALIDAD Gráfico Q-Q normal: Esta herramienta nos permite comparar los cuantiles empíricos de la serie en cuestión contra los cuantiles de una distribución normal. Para llevar a cabo este proceso mínimo hay que contar con 20 datos y el programa por defecto calcula la distribución normal con la media y varianza de los datos que se están utilizando. Además hay dos opciones más para trabajar con datos estandarizados o enfrentar a los cuantiles brutos contra una normal de media 0 y varianza 1. H. Q-Q NORMAL. 14 INV- Modelos no lineales en GRETL/2011-II Gráfico de Cajas (Boxplot): Dando clic derecho sobre la variable es posible encontrar la opción de gráfico de cajas que nos permite ver la distribución de la variable, usando su mínimo, máximo, sus cuartiles, su media y su mediana. I. BOXPLOT 2.3.2. Transformación y generación de nuevas variables. Otra función muy útil de GRETL es la variedad de opciones que ofrece para convertir en diferentes formas funcionales las variables que se han cargado. Así mismo, es muy útil para agregar con tan sólo un clic variables dummy estacionales, variables aleatorias, entre otras herramientas que su construcción podría llevar mucho más tiempo. Todas estas herramientas las encontramos en el botón Añadir de la barra de herramientas de la ventana principal. Las opciones disponibles son: logaritmos, cuadrados, retardos, primeras diferencias, diferencias de logaritmos y diferencias estacionales de las variables seleccionadas. Además de esto existe la opción para definir una nueva variable que se quiera introducir, una gran ventaja pues dinamiza el trabajo de tener que ir hasta la base de datos original para poder incluirla, o para crear una matriz ya sea utilizando las series que están cargadas o introduciendo su tamaño y posteriormente los datos, o mediante una función que incluya una relación matemática entre ciertas variables. Apenas se haga clic sobre la opción que se desea, la nueva variable que ha sido creada aparecerá en la ventana principal, de esta forma ya puede ser llamada en cualquier proceso que se vaya a realizar. 15 INV- Modelos no lineales en GRETL/2011-II 2.3.3. Análisis de componentes principales. Uno de los procesos estadísticos no inferenciales más útiles que se pueden realizar es el Análisis de componentes principales (ACP). Aunque GRETL tiene una función desarrollada para este proceso es muy básica respecto a los procesos que se pueden desarrollar en otros programas como R y SPSS. La aplicación de ACP en GRETL se limita a una opción que se encuentra en el botón Ver de la barra de herramientas o al comando acp de la consola. Al dar clic sobre la opción de ACP el programa abrirá automáticamente una ventana que pedirá seleccionar las variables a analizar y decidir si se trabaja con la matriz de covarianzas o con la de correlaciones (paso básico para la determinación de los componentes). Si se realiza el proceso por medio del comando en la consola hay que especificar las variables a analizar, o en su defecto si se desea analizar toda la base simplemente hay que escribir el comando y dar enter. J. ANÁLISIS DE COMPONENTES PRINCIPALES La ventana de salida que se obtiene nos muestra, en primera instancia, la varianza de cada componente (vector propio) y la varianza acumulada que sirven como criterio de selección las componentes a retener. Debajo de estos datos se encontrará la ponderación que cada componente le otorga a cada variable, lo cual es útil para hacer el proceso de descripción de los componentes retenidos. 16 INV- Modelos no lineales en GRETL/2011-II 3. APLICACIÓN DE MODELOS ECONOMÉTRICOS. GRETL contiene programación para realizar procesos en aproximadamente 28 métodos econométricos, dentro de estos encontramos mínimos cuadrados ordinarios, estimación de la matriz de covarianzas robusta, datos panel estático y dinámico, mínimo cuadrados no lineales, Estimación de máxima verosimilitud y modelos de series de tiempo univariados y multivariados, entre muchos otros. Este documento se centrará al estudio de modelos que se enfrentan a problemas de variables discretas, como ya se verá más adelante al hacer referencia a los modelos Logit y Probit. Sin embargo, para explorar un poco más en detalle el programa se pretende hacer a continuación una exposición de la estimación de un modelo de regresión lineal por mínimos cuadrados ordinarios. 3.1. MÍNIMOS CUADRADOS ORDINARIOS. El proceso de estimar un modelo de regresión lineal por mínimos cuadrados ordinarios (MCO) en GRETL se puede desarrollar, al igual que la mayoría de los procesos, por medio de la interfaz de usuario o por medio de la consola. En la barra de herramientas se encontrará la pestaña Modelo en donde aparecerán los diferentes conjuntos de modelos que se pueden aplicar a los datos con los que se cuenta. Por consiguiente, en este menú aparecerá la opción de MCO que al seleccionarla mostrará una ventana en donde se debe seleccionar la variable dependiente y las variables independientes del modelo. Si se desea proceder usando la consola, se puede realizar con el comando ols seguido de la variable independiente y después de las independientes. K. MÍNIMOS CUADRADOS ORDINARIOS 17 INV- Modelos no lineales en GRETL/2011-II 3.1.1. Contraste de supuestos. Al haber estimado el modelo, aparecerá una ventana de salida en la cual se muestran los principales resultados de la estimación. Así mismo, se encuentra una barra de herramientas con todas las opciones disponibles para analizar y contrastar el modelo. Específicamente, la opción contrastes muestra una gran cantidad de contrastes a los supuestos del modelo, tal como muestra la Ilustración L. Al seleccionar cualquiera de los contrastes aparecerá automáticamente en otra ventana el proceso realizado por el programa y se creará debajo de los resultados principales de la estimación del modelo (obtenidos anteriormente) un resumen de la prueba realizada, mostrando la hipótesis nula, el estadístico y su valor-p principalmente. L. CONTRASTES DE LOS SUPUESTOS, TEST RESET DE RAMSEY. La diferencia entre las dos formas de aplicar el modelo (interfaz o consola) está en que para hacer los contrastes de los supuestos del modelo la primera opción ofrece en el documento de salida el menú explicado anteriormente. Al proceder mediante la consola se deben seguir utilizando los comandos correspondientes a los contrastes que se desean hacer, por ejemplo, para hacer el test de Ramsey se procede con el comando reset. 3.1.2. Intervalos de confianza. Una de las fortalezas con las que GRETL cuenta es la fácil estimación de los intervalos de confianza para cada una de las variables del modelos que se haya ejecutado, simplemente hay que dirigirse a la sección análisis en la ventana de 18 INV- Modelos no lineales en GRETL/2011-II salida de resultados del modelo, donde aparece la opción de intervalos de confianza, estos automáticamente serán generados. M. INTERVALOS DE CONFIANZA 4. MODELOS CON VARIABLE DEPENDIENTE BINARIA3 La aplicación del modelo de regresión múltiple lineal puede ser no adecuada para la explicación de problemas en los cuales la respuesta que se espera toma únicamente dos valores, por ejemplo, cuando se quiere hacer un análisis de políticas las únicas respuestas que se pueden esperar es si estas fueron exitosas o no en el medio en el cual fueron aplicadas. Para estos casos es necesario utilizar nuevas herramientas que difieren del modelo de regresión múltiple y que plantean nuevos mecanismos de medición. A continuación se consideraran ciertos modelos que son útiles para solucionar problemas con variable dependiente binaria, estos son: Modelo de probabilidad lineal, modelo Logit y modelo Probit. 4.1. MODELO DE PROBABILIDAD LINEAL (MPL). El modelo de probabilidad lineal (MPL) es básicamente una variación del modelo de regresión lineal múltiple enfocada a la explicación de eventos cualitativos. En este documento sólo se considerarán el caso en que el evento a explicar tiene resultados binarios, de este modo la variable dependiente del modelo de regresión lineal sólo podrá tomar valores de cero o uno. Al tener un modelo, Con y como una variable bivariada, la interpretación común de los no puede seguir siendo utilizada, pues los cambios en y ya no son continuos ante cambios en las X. De este modo hay que recurrir a una nueva forma de entender el modelo con el fin de hallar su utilidad. 3 Explicación de modelos basada en Wooldridge (2009) 19 INV- Modelos no lineales en GRETL/2011-II Al admitir el supuesto de media condicional cero, puede ser expresado como, , el modelo El punto clave de la explicación del modelo de regresión lineal con variable dependiente binaria está en que siempre se tiene que el valor esperado de y es igual a su probabilidad de éxito, que es la probabilidad de que y sea igual a 1, expresado de otra forma: . De este modo el modelo dice que la probabilidad de éxito es función lineal de las variables x, lo que se puede expresar como, Así mismo, dado que las probabilidades tienen que sumar uno podemos decir que , que también es función lineal de las variables x. Este modelo es llamado Modelo de Probabilidad Lineal (MPL) debido a la linealidad de los parámetros del éste. El modelo se estima por Mínimos Cuadrados Ordinarios (MCO) como un modelo común de regresión lineal múltiple. La interpretación de los se puede entender como “la variación de la probabilidad de éxito al variar , permaneciendo los demás factores constantes” (Wooldridge, 2009): Cuando se tiene variables independientes binarias el coeficiente que se obtiene “mide la diferencia que se predice para la probabilidad en relación con el grupo base” (Wooldridge, 2009) N. MPL BASE DE DATOS WOOLDRIDGE (2009) 20 INV- Modelos no lineales en GRETL/2011-II Al ser el modelo estimado por MCO, en GRETL se debe seguir el proceso explicado en la sección 3.1 con la variable independiente bivariada que exprese una relación cualitativa. Con el ánimo de evaluar los resultados de GRETL, se va a utilizar la base de datos MROZ del libro de Wooldridge (2009) la cual se puede encontrar dentro de la biblioteca de datos lista para instalar en el programa utilizando el enlace especificado en la sección 2.2.2 de este documento. 4.1.1. Desventajas del MPL El modelo MPL tiene dos desventajas principalmente que lo hacen débil frente a los modelos que posteriormente se explicarán. La primera debilidad reside en que es posible que se den, con ciertas combinaciones de las variables independientes, resultados en donde la probabilidad es negativa o mayor a uno; probabilidades que generan un problema de interpretación y que por lo tanto requieren de un cambio en la forma de entender y estimar el modelo. La segunda debilidad del modelo es que no se puede considerar que la probabilidad esté relacionada linealmente con las variables independientes para todos los valores, ciertos efectos sobre la variable dependiente varían en su magnitud según aumenta la variable independiente, el MPL no es capaz de recoger dichos cambios. Sin embargo, si los valores de las variables independientes están cerca del promedio el modelo es útil para predecir. 4.2. MODELOS NO LINEALES PARA RESPUESTA BINARIA. Los modelos Logit y Probit pueden superar las limitaciones que tienen los modelos de probabilidad lineal vistos en la sección anterior, pero la principal desventaja de estos modelos es el grado de dificultad que adquiere la interpretación de estos. Para especificar los modelos Logit y Probit se puede partir de la ecuación (3) y hacer una variación para considerar una clase de modelos como el siguiente: Donde G se considera una función con valores ente cero y uno estrictamente, para todos los números reales z. Esta primera condición elimina el problema del MPL de poder tener valores negativos o mayores a 1. Por otro lado, la función G es una función no lineal que cumple con la característica anterior de valores estrictamente entre cero y uno. Las funciones que se han utilizado más ampliamente en las aplicaciones de modelos de variable dependiente limitada son: 21 INV- Modelos no lineales en GRETL/2011-II Función logística (modelo Logit): función de distribución acumulada para una variable logística estándar. Se encuentra entre cero y uno para todos los números reales. Donde Función de distribución acumulada normal estándar (Modelo Probit): es la densidad normal estándar Una forma de derivar los modelos Logit y Probit es a través de un modelo de variable latente subyacente. Se parte de considerar a como una variable inobservable determinada por la ecuación (9) que introduce la notación de una función indicador, lo que significa que esta función asume el valor de uno si se cumple la condición dentro de los corchetes y de cero si no se cumple. Los errores, se suponen independientes de y que tienen la distribución logística estándar o la distribución normal estándar. Esto significa que en cualquier caso los errores se distribuyen simétricamente en torno a cero y así para todos los números reales z se tiene que . Con las consideraciones anteriores es posible calcular la probabilidad de respuesta para y en los modelos Logit y Probit como, ( Recordando que en los modelos de respuesta binaria toma importancia explicar los efectos de las variables independientes sobre la probabilidad de éxito, es importante tener en cuenta que aunque a primera vista parezca que lo importante está en mirar los efectos de las sobre la variable latente , en los modelos Logit y Probit la dirección del efecto sobre y sobre es la misma. De este modo, dado que la variable latente regularmente no tiene una unidad de medida definida, toma mayor 22 INV- Modelos no lineales en GRETL/2011-II importancia la estimación de los efectos de las sobre la probabilidad de éxito. Ahora el problema está en que la no linealidad de las funciones G complica la estimación e interpretación de dichos modelos. Para solucionar el problema hay que recurrir a la derivación, pues si es una variable aproximadamente continua el efecto parcial sobre la probabilidad de éxito, , se obtiene de la derivada parcial (Wooldridge, 2009), que se define como: Con G definida una función de distribución de probabilidad de una variable aleatoria continua y g como una función de densidad de probabilidad. Al ser G una función estrictamente creciente (como en los casos de Logit y Probit), g(z) siempre va a ser mayor a cero y así de (11) se puede decir que el efecto de sobre la probabilidad de éxito p(x) va a depender únicamente del signo de , reafirmando así su importancia en la explicación de los efectos. Cuando hay variables explicativas binarias, el efecto parcial de que sea cero o uno, ceteris paribus, es: Que indica el cambio en la probabilidad de tener o no cierta característica representada por la variable binaria, teniendo en cuenta las demás características que permanecen constantes. En resumen el que representa la variable binaria determinará el cambio en la probabilidad de éxito de acuerdo a su signo y la cantidad en que varía se estima mediante (12). También es útil utilizar (12) para mirar los cambios en la probabilidad para variables discretas, de este modo se puede medir el efecto de que cambie de a siguiendo la misma lógica: Para estimar los modelos de variables dependientes limitadas es necesario utilizar la Estimación de Máxima Verosimilitud (EMV) debido a la naturaleza no lineal de los modelos utilizados. Estos modelos se pueden poner bajo la forma: “Sea la función de densidad para una extracción aleatoria de la población, condicional en ” (Wooldridge, 2009), al suponerse que se tiene una muestra aleatoria de tamaño n, la densidad de , para los modelos Logit y Probit, se determina por dos 23 INV- Modelos no lineales en GRETL/2011-II valores Concretamente, la densidad va a estar dada por: Para = 0, 1. El estimador de máxima verosimilitud de log-verosimilitud: . maximiza la función de El vector b es el argumento binario en el problema de maximización. En general (Estimación de máxima verosimilitud) es consistente y tiene una distribución normal aproximada en muestras grandes (Wooldridge, 2009). Para los modelos Logit y Probit la función de log-verosimilitud se obtiene al aplicar el logaritmo a la ecuación (14), lo cual, para la observación i quedaría expresado como una función de los parámetros y los datos ( : Así el problema de maximización que expresa (15) se puede escribir como: Más adelante se revisará como GRETL realiza muestra los resultados del proceso de estimación por máxima verosimilitud. 4.2.1. Interpretación de las estimaciones de los modelos Logit y Probit Con los paquetes econométricos los problemas de estimación de los modelos debido a su complejidad deja de ser un problema, ahora toma importancia la forma en cómo se interpretan las estimaciones que resultan. Anteriormente, se dijo que los coeficientes resultantes de la estimación del modelo reflejan los efectos parciales de cada sobre la probabilidad de respuesta, con una significancia estadística determinada por la prueba de hipótesis , a un nivel de significancia suficiente. Inicialmente existe una medida de la bondad de ajuste del modelo conocido como “porcentaje predicho correctamente” que consiste en definir un predictor binario 24 INV- Modelos no lineales en GRETL/2011-II de como uno si la probabilidad que el modelo predice es mayor o igual a 0.5 y cero si ésta es menor de 0.5. (18) Con esta herramienta es posible observar que tan bien predice el a en cada observación del modelo. En GRETL la salida que se obtiene al aplicar el modelo contiene un análisis del porcentaje predicho correctamente y que observaremos posteriormente. Una deficiencia de este método es que en casos particulares puede no predecir correctamente el resultado menos probable. Entre las variantes a este método está el de cambiar el umbral de acuerdo a la fracción de éxitos en la muestra y partir de ahí para considerar si es 1 o 0. De este modo si el porcentaje de éxitos en nuestra muestra es 7% en la ecuación (18) hablaríamos de . Al calcularse un modelo sin utilizar MCO, el que servía como medida para la capacidad de ajuste del modelo ya no aplica, pues el procedimiento utilizado para calcular no ha sido minimizando la varianza sino por máxima verosimilitud. El equivalente para estos modelos ha sido conocido como pseudo . Uno de los más utilizados y que GRETL calcula automáticamente al correr el modelo es el Pseudo de McFadden que sugiere la siguiente medida: Con como la función de log-verosimilitud para el modelo estimado y como la función de log-verosimilitud con sólo el intercepto. “La log-verosimilitud del modelo del intercepto es tratada como la suma total de cuadrados, y la logverosimilitud del modelo completo como la suma de los errores al cuadrado” (UCLA, What are Pseudo R-squareds?) en comparación con el de MCO. El ratio entre y nos muestra la capacidad de mejoramiento sobre el modelo del intercepto que ofrece el modelo completo. Sabemos por la ecuación (16) que las log-verosimilitudes de los modelos Logit y Probit siempre van a ser negativas por lo cual , por lo tanto, si el modelo tiene baja probabilidad la log-verosimilitud será mayor en valor absoluto que la de un modelo con mayor probabilidad. Así, entre el ratio de log-verosimilitudes sea más cercano a cero el será más cercano a uno, que indica que el modelo se ajusta bien. Si el modelo completo no tiene poder explicativo el ratio va a ser cercano o igual a 1, con lo que el del modelo será igual o cercano a 0. 25 INV- Modelos no lineales en GRETL/2011-II Para estimar los efectos de las sobre las probabilidades de éxito, se parte de la derivada parcial y los efectos en el cambio de la probabilidad estimada de éxito para cambios pequeños de , que se puede escribir como: La dificultad de estimar el efecto está en que el factor de escala depende de todas las variables explicativas, así que se tiene que recurrir a diferentes medidas de como las medias, los máximos, los cuartiles, entre otras, y así ver cómo cambia el factor. Para GRETL el factor escalar es medido utilizando las variables explicativas en el promedio muestral, de este modo “se obtiene el efecto parcial de para la persona “promedio” en la muestra” (Wooldridge, 2009). El procedimiento es realizado tanto para variables explicativas continuas como discretas. Críticas y alternativas a este procedimiento en Wooldridge (2009). 4.2.2. Pruebas de hipótesis múltiples. Para probar restricciones de exclusión en los modelos Logit y Probit existen tres métodos: El multiplicador de Lagrange, el test de Wald y la Razón de verosimilitudes. GRETL en el resultado que muestra al usuario aplica la Razón de verosimilitudes. La prueba de la razón de verosimilitudes parte de considerar que, dado que la EMV maximiza la función de log-verosimilitud, la omisión de variables ocasiona generalmente una log-verosimilitud no mayor a la del modelo completo. Así, la prueba está basada en la diferencia de las funciones de log-verosimilitud entre un modelo restringido y uno no restringido y de este modo se puede concluir si la disminución en la log-verosimilitud es lo suficientemente grande para considerar a las variables omitidas significativas. Este estadístico es dos veces la diferencia de las log-verosimilitudes del modelo no restringido ( ) y el restringido ( ). ) (21) Con q como el número de restricciones de exclusión. La hipótesis nula del contraste considera que los parámetros de las variables excluidas en el modelo restringido son iguales a cero. 26 INV- Modelos no lineales en GRETL/2011-II 4.3. CONCLUSIONES. Como se observó anteriormente, los modelos Logit y Probit han surgido como nuevos métodos para superar las deficiencias del modelo de regresión lineal aplicado a variables endógenas restringidas (Modelo de Probabilidad Lineal) y así generar predicciones más precisas sobre los fenómenos observados y modelados. Sin embargo, se reconoce que la dificultad en el proceso de estimación e interpretación del modelo es mayor para los modelos Logit y Probit, planteando un nuevo reto a los investigadores en cuanto a cómo entender los resultados que obtienen. Evaluar las salidas de los programas utilizados para estimar los modelos toma cierta importancia en cuanto a las facilidades que le ofrece al usuario. Este apartado del documento busca únicamente ser una guía teórica de los modelos MPL, Logit y Probit; con el fin de evaluar posteriormente los resultados que GRETL arroja al usuario y su utilidad en la interpretación de dichos modelos. 5. APLICACIÓN GRETL. DE MODELOS LOGIT Y PROBIT EN Utilizando los mismos datos que se tomaron para ilustrar el proceso del MPL (sección 4.1) se ejecutará GRETL utilizando en este caso los modelos Logit y Probit. Dentro de la pestaña modelo, de la barra de herramientas de la interfaz, aparece la opción llamada Modelos no lineales, aquí se encontrarán los dos modelos en cuestión, tal como lo muestra la figura M. En este caso, solo se están considerando los modelos binarios o con variable endógena restringida, así que la opción Binario es la única que será trabajada en este documento. O. MODELOS NO LINEALES 27 INV- Modelos no lineales en GRETL/2011-II Al seleccionar la opción de aplicar el modelo Binario, tanto para Logit o Probit, aparecerá la ventana de selección de variables que ya había sido explicada en el apartado 3.1, las diferencias respecto a la explicada anteriormente son nombradas en la Ilustración P, a saber, opciones para mirar pendientes o pvalores, y detalles sobre iteraciones. De acuerdo a la teoría explicada anteriormente, las pendientes en la media son útiles para mirar los efectos parciales de las en la probabilidad de éxito. Debido a que este efecto parcial depende de las , GRETL por defecto calcula ésta pendiente en la media, lo cual indica que los resultados obtenidos se interpretan respecto al “individuo promedio” de la muestra. Los detalles sobre las iteraciones mostrarán los valores de la función de log-verosimilitud de cada iteración realizada hasta maximizar la función. P. ESPECIFICACIÓN DE LOGIT Dentro de la salida de GRETL para la estimación de un modelo no lineal con variable restringida, aparecen ciertos recursos estadísticos de gran ayuda para la interpretación de los resultados por parte del usuario. De acuerdo a la teoría enunciada anteriormente los más importantes son: El pseudo de McFadden, El contraste de razón de verosimilitudes, el número de casos “correctamente predichos” y un cuadro que muestra en detalle el acierto del modelo en su predicción mediante la comparación entre los predichos y los observados. 28 INV- Modelos no lineales en GRETL/2011-II Q. SALIDA LOGIT (CON DETALLES DE ITERACIONES) Por supuesto, en la parte central de la salida aparecerán los coeficientes estimados, la desviación típica, las pendientes o los p-valores según la elección tomada al momento de especificar el modelo. Una de las opciones que puede ser interesante para contrastar el modelo es el Test de Wald, aunque no se revisó teoría sobre este permite probar restricciones múltiples sobre el modelo y cumple una función similar a la del estadístico de razón de verosimilitudes. R. OMISIÓN DE VARIABLES, TEST DE WALD 29 INV- Modelos no lineales en GRETL/2011-II Los pasos para llevar a cabo este test es mediante la opción contrastes que aparece en la barra de herramientas de la ventana de salida del programa. Mediante la opción omitir variables el programa permitirá estimar otro modelo con variables omitidas o restringidas. La Ilustración P muestra la ventana para la omisión de variables. Los pasos a seguir son: seleccionar las variables a omitir y seleccionar la opción de Contraste de Wald. La hipótesis nula de la prueba es que los parámetros de las variables omitidas son cero. La salida generada por esta prueba mostrará detalles sobre la hipótesis nula y el estadístico de contraste utilizado. Si se comparan los resultados del contraste de Razón de Verosimilitudes y el de Wald los resultados generalmente tendrán conclusiones similares. S. CONTRASTE DE OMISIÓN DE WALD Otro forma por medio de la cual se puede estimar un modelo Logit o Probit es el mediante la consola de GRETL se hace mediante el comando Logit o probit, según sea el caso. El comando solo pide la especificación de las variables separadas por un espacio. Para activar opciones adicionales como ver los p-valores en vez de las pendientes (p-values), errores estándar robustos (robust), mostrar la matriz de covarianzas (VCV) o mostrar detalles de las iteraciones (verbose); sólo hay que dejar un espacio después de las variables escribir dos guiones seguido de la opción u opciones que deseamos, tal como se muestra a continuación: logit inlf const nwifeinc exper expersq kidslt6 --verbose --vcv Para llevar a cabo pruebas de restricción múltiples y en este caso el test de Wald, el comando es omit, seguido de las variables a restringir y la opción de Wald: omit nwifeinc exper expersq kidslt6 --wald Así se llegará al mismo resultado descrito anteriormente. 30 INV- Modelos no lineales en GRETL/2011-II Debido a que la única diferencia entre la aplicación de un modelo Logit y Probit está en la función utilizada, para efectos del proceso necesario en el software para su estimación no varía en absoluto. 6. APLICACIÓN DE LOGIT Y PROBIT EN STATA. Como una forma de comparar los resultados obtenidos en GRETL, se pretende a continuación hacer una exposición rápida de la estimación de un modelo Logit o Probit mediante STATA. Al ser reconocido STATA como uno de los programas de estadística más completos en el mercado, éste será un buen referente para comparar los resultados obtenidos con GRETL. A continuación se explicarán los comandos y paquetes necesarios para la estimación del modelo y todos los pasos para su consecución. Se seguirá trabajando con la misma base de datos que ha venido utilizándose en el documento. Para la estimación de un modelo Logit o Probit es STATA hay que utilizar los mismos comandos Logit o Probit, según sea el caso. Cuando no se adhieren opciones adicionales para la estimación del modelo la estructura del código utilizado en GRETL y STATA es el mismo. T. LOGIT EN STATA Sin embargo, la salida por defecto de Stata, en comparación a la de GRETL, no contiene información sobre las pendientes del modelo respecto a cada variable exógena, que como se revisó en la teoría es la única herramienta que permite la explicación de los efectos de las variables independientes sobre la probabilidad de éxito. Para conseguir esta información en Stata se recurre al comando mfx, el cual arroja información tal como muestra la Ilustración U. 31 INV- Modelos no lineales en GRETL/2011-II U. MODELO LOGIT CON PENDIENTES EN STATA El test de Wald y la razón de verosimilitudes son ejecutados por Stata mediante dos comandos: test y lrtest, respectivamente. Para el primero, simplemente se necesita haber corrido el modelo deseado, después se ejecuta el comando test seguido de las variables que se van a omitir y el software calcula la prueba y arroja el p-valor correspondiente. El resultado de este proceso se observa en la Ilustración V. V. TEST DE WALD EN STATA Para calcular el estadístico de razón de verosimilitudes el proceso que se debe realizar no es tan intuitivo como el test de Wald, en este caso se deben hacer unos cuántos pasos antes de ejecutar el comando lrtest que calcula el estadístico, pues este comando pide especificar los dos modelos (restringido y no restringido) que va a ser comparados. Por tal motivo es necesario (mediante el comando estimates store el cual nos permite guardar los modelos estimados dándoles un nombre) guardar las estimaciones del modelo restringido y no restringido, para el modelo restringido tan sólo hay que ejecutar el modelo con la variable independiente. Los comandos necesarios para la estimación del test en el ejemplo que ha sido trabajado en todo el documento se especifican en la Ilustración W. 32 INV- Modelos no lineales en GRETL/2011-II W. ESTIMACIÓN RAZÓN DE VEROSIMILITUDES EN STATA Por último, el comando que permite ver los casos “correctamente predichos” es estat classification el cual muestra principalmente el cuadro de predichos y observados con los casos en que el modelo predijo correctamente respecto al dato observado (al igual que en GRETL se considera predicho correctamente cuando el valor observado es uno y el valor de la estimación es mayor a 0,5; o cuando el observado es 0 y la estimación menor a 0,5). En la salida de Stata “True D” representa un dato observado de 1 y “Classified +” una estimación mayor a 0,5. X. CASOS CORRECTAMENTE PREDICHOS EN STATA En el último campo de la salida del comando estat classification aparece el porcentaje de casos correctamente predichos el cual sirve para mirar que tan bueno fue el modelo especificado. 33 INV- Modelos no lineales en GRETL/2011-II 7. CONCLUSIÓN. Aunque no se han explorado más funcionalidades de GRETL y Stata para la estimación de modelos no lineales con variable dependiente limitada, se ha hecho una revisión de los principales comandos que le permitirían al estudiante o investigador estimar e interpretar en un nivel básico un modelo no lineal de este tipo. Respecto a los dos software utilizados, es posible observar que las estimaciones y pruebas realizadas no varían entre los dos programas, por lo cual arrojan los mismos datos y conclusiones. Además, las salidas que se obtiene de los dos programas tienen un aspecto similar que permite una fácil comprensión por parte del usuario; en este punto es importante decir que GRETL genera la mayoría de cálculos con el mismo comando mientras que en Stata se deben buscar diversos comandos para analizar el modelo estimado, esto sin duda presenta una diferencia entre GRETL y Stata, pues para los nuevos usuarios puede llegar a ser más complicada la búsqueda de los comandos necesarios para llegar a buenas conclusiones. Esto demuestra que GRETL al ser software libre de código abierto, se presenta como un programa útil para el análisis econométrico con buenas estimaciones, una interfaz agradable e intuitiva en varios idiomas, de fácil instalación y disponible para cualquier usuario. Aunque todavía necesite desarrollos que fortalezcan su potencia en la ejecución de varios modelos, se presenta como una oportunidad para los usuarios que no pueden acceder a otros programas por los altos costos de las licencias o por la dificultad de entender cómo funcionan. Además, al ofrecer una librería gratuita con gran cantidad de bases de datos de los libros más reconocidos en la enseñanza de la econometría, GRETL se convierte en una herramienta muy interesante para el aprendizaje. Modelos como Logit y Probit son utilizados recurrentemente para la estimación de fenómenos en el mundo real, sin embargo debido a lo complejo que es su estimación no son tomados en cuenta en los cursos básicos. La pertinencia de aplicar modelos que no son vistos en la línea de econometría del programa de pregrado de la Facultad utilizando interfaces tan intuitivas como GRETL, está en que los estudiantes y las personas interesadas en profundizar en temas diferentes, como los modelos no lineales estudiados aquí, no necesitan de un tutor o profesor que los guíe sino de una guía teórica y práctica que los introduzca en el tema y les ofrezca las bases, incentivando así el autoaprendizaje como complemento a la formación que se recibe en las aulas. 34 INV- Modelos no lineales en GRETL/2011-II 8. REFERENCIAS. Cottrell, A., & Lucchetti, R. (Julio de 2011). GRETL user´s guide. Recuperado el 9 de Septiembre de 2011, de GRETL Web page: http://gretl.ecn.wfu.edu/pub/gretl/manual/PDF/gretl-guide-a4.pdf UCLA. (s.f.). Stata Data Analysis Examples: Logistic regression. Recuperado el 25 de Noviembre de 2011, de http://www.ats.ucla.edu/stat/stata/dae/logit.htm UCLA. (s.f.). What are Pseudo R-squareds? Recuperado el 16 de Noviembre de 2011, de http://www.ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm Wooldridge, J. (2009). Introductory Econometrics: A modern approach. Cengage Learning.