aplicación de modelos no lineales con variable dependiente limitada

Anuncio
INV- Modelos no lineales en GRETL/2011-II
APLICACIÓN DE MODELOS NO LINEALES CON VARIABLE
DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL
Diego Esteban Eslava Avendaño 1
diciembre de 2011
Resumen:
El modelo de regresión lineal clásico no siempre es una buena aproximación en la
explicación y análisis de fenómenos económicos debido a que los problemas que se
buscan modelar pueden presentar características que hacen que las estimaciones bajo
este modelo no sean adecuadas. Por tal motivo, esta investigación tiene como objetivo
presentar al lector la aplicación de dos modelos (Logit y Probit) que buscan solucionar dos
problemas: considerar la variable dependiente limitada o binaria, y, asumir que la
probabilidad de que un evento pase no esté relacionada linealmente con las variables
explicativas. Para la aplicación de dichos modelos se van a describir los procesos
necesarios para su estimación en GRETL (The Gnu Regression, econometrics and Timeseries Library) como un software alternativo a los usualmente utilizados, por lo que se
hará una descripción básica del software, se aplicarán los modelos Logit y Probit en éste y
se evaluarán los resultados respecto a uno de los programas más reconocidos: Stata.
Palabras Clave: Modelo de Probabilidad Lineal, Logit, Probit, GRETL, Stata.
APPLICATION OF NON-LINEAR MODELS WITH LIMITED
ENDOGENOUS VARIABLE (LOGIT, PROBIT) USING GRETL
Abstract:
The classic linear regression model is not always a useful approximation for explaining
and analyzing the economic phenomena, that is because some problems researchers try
to model may have characteristics that make estimations not appropriate under this
model. Therefore, this research aims to present the application of two models (Logit and
Probit) useful for solving two specific problems: to assume the endogenous variable
limited or binary, and, to assume the probability that an event happens is not linearly
associated with the exogenous variables. The processes needed for the application of
those models will be described in GRETL (The Gnu Regression, econometrics and Timeseries Library) as alternative software to the ones usually used. A basic description of the
software and the application of Logit and Probit using GRETL will be provided in this
document; in addition the results will be evaluated in contrast to one of the most known
software: Stata.
Keywords: Linear Probability Model, Logit, Probit, GRETL, Stata.
1
Estudiante de Economía de la Facultad de Ciencias Económicas de la Universidad Nacional de
Colombia, y monitor de la Unidad de Informática y Comunicaciones de la Facultad de Ciencias
Económicas. Correo Electrónico: deeslavaa@unal.edu.co
INV- Modelos no lineales en GRETL/2011-II
Estudiantes Auxiliares:
Camilo Alexandry Peña Talero
Cristian Andrés Hernández Caro
Claudia Patricia Ospina Aldana
Daniel Francisco Rojas Martín
David Camilo Sánchez Zambrano
David Mauricio Mahecha Salas
Diego Esteban Eslava Avendaño
Edward F. Yanquen Briñez
Gloria Stella Barrera Ardila
Iván Albeiro Cabezas Martínez
Javier Alejandro Ortiz Varela
Jeimmy Paola Muñoz
Juan Carlos Tarapuez Roa
Juan David Vega Baquero
Juan Fernando López Prieto
Leonardo Alexander Cárdenas
Lina Marcela Igua Torres
María Paula Contreras Navarrete
Paola Alejandra Alvarado Castillo
Viviana Contreras Moreno
Viviana María Oquendo
Director Unidad Informática:
Henry Martínez Sarmiento
Tutor Investigación:
Juan Carlos Tarapuez roa.
Coordinadores:
Jasmin Guerra Cárdenas
Juan Felipe Reyes Rodríguez
Coordinador Servicios Web:
John Jairo Vargas
Analista de Infraestructura y
Comunicaciones:
Diego Alejandro Jiménez Arévalo
Analista de Sistemas de
Información:
Víctor Hugo Ramos Ramos
Este documento es resultado de un
trabajo conjunto y coordinado de los
integrantes de la Unidad de Informática y
Comunicaciones de la Facultad de
Ciencias Económicas de la Universidad
Nacional de Colombia.
Esta obra está bajo una licencia reconocimiento no comercial 2.5
Colombia de Creative Commons. Para ver una copia de esta
licencia, visite http://creativecommons.org/licenses/by/2.5/co/ o
envíe una carta a Creative Commons, 171second street, suite 30
San Francisco, California 94105, USA.
2
INV- Modelos no lineales en GRETL/2011-II
APLICACIÓN DE MODELOS NO LINEALES DE VARIABLE
DEPENDIENTE LIMITADA (LOGIT, PROBIT) EN GRETL
Contenido
1.
INTRODUCCIÓN. ..................................................................................................................5
1.1. PERTINENCIA DE LA APLICACIÓN DE MODELOS NO LINEALES Y
GRETL EN LA FCE...................................................................................................................5
2.
DESCRIPCIÓN BÁSICA DE GRETL. ...............................................................................7
2.1.
2.1.1.
Linux. .......................................................................................................................7
2.1.2.
MS Windows...........................................................................................................8
2.2.
Ventana Principal .................................................................................................8
2.2.2.
Importación de archivos .....................................................................................9
2.2.3.
Herramientas de trabajo ...................................................................................11
ANÁLISIS ESTADÍSTICO DESCRIPTIVO Y EDICIÓN DE VARIABLES. ......11
2.3.1.
Estadísticos y gráficos descriptivos. .............................................................12
2.3.2.
Transformación y generación de nuevas variables. .................................15
APLICACIÓN DE MODELOS ECONOMÉTRICOS. ....................................................17
3.1.
4.
EXPLORACIÓN BÁSICA DEL PROGRAMA. ..........................................................8
2.2.1.
2.3.
3.
INSTALACIÓN. ...............................................................................................................7
MÍNIMOS CUADRADOS ORDINARIOS. ...............................................................17
3.1.1.
Contraste de supuestos. ...................................................................................18
3.1.2.
Intervalos de confianza. ....................................................................................18
MODELOS CON VARIABLE DEPENDIENTE BINARIA ............................................19
4.1.
MODELO DE PROBABILIDAD LINEAL (MPL). ...................................................19
4.1.1.
4.2.
Desventajas del MPL ..........................................................................................21
MODELOS NO LINEALES PARA RESPUESTA BINARIA. ................................21
4.2.1.
Interpretación de las estimaciones de los modelos Logit y Probit ........24
4.2.2.
Pruebas de hipótesis múltiples. .....................................................................26
4.3.
CONCLUSIONES.........................................................................................................27
3
INV- Modelos no lineales en GRETL/2011-II
5.
APLICACIÓN DE MODELOS LOGIT Y PROBIT EN GRETL. ..................................27
6.
APLICACIÓN DE LOGIT Y PROBIT EN STATA. .........................................................31
7.
CONCLUSIÓN. .....................................................................................................................34
8.
REFERENCIAS. ...................................................................................................................35
4
INV- Modelos no lineales en GRETL/2011-II
1. INTRODUCCIÓN.
En la práctica cada vez toma mayor importancia el análisis de la efectividad de
políticas y medidas aplicadas en diversas esferas de la sociedad mediante el uso
de modelos econométricos. Sin embargo, debido a la complejidad de la realidad
económica encontrar modelos que se ajusten al problema analizado sugiere un
gran problema para el investigador, que se agrava al sumársele el problema de
encontrar software que le permita la exploración de nuevas herramientas y
modelos, fáciles de utilizar y que no sean restrictivos en su uso.
Bajo este contexto, la presente investigación tiene como objetivo darle a los
estudiantes una introducción a la aplicación de dos modelos que buscan mayor
precisión en el análisis: Logit y Probit; estos modelos responden específicamente
a dos problemas básicos que presenta el modelo de regresión lineal clásico. Junto
con esto, se ofrece una guía de aplicación de dichos modelos en un software
alternativo a los utilizados generalmente en el análisis estadístico: GRETL,
haciendo énfasis en el fácil acceso y utilización de dicho programa que favorece la
interacción del usuario. Para contrastar los resultados de la aplicación de los
modelos en GRETL, se va a realizar el mismo proceso en Stata, uno de los
software más reconocidos y utilizados en el área.
1.1. PERTINENCIA DE LA APLICACIÓN DE MODELOS NO
LINEALES Y GRETL EN LA FCE.
La enseñanza de los distintos métodos econométricos debe considerar como
componente de gran importancia los procesos necesarios para la estimación de
modelos y el contraste de supuestos utilizando la diversidad de paquetes
econométricos que existen en el mercado. Estos programas regularmente han
sido desarrollados utilizando códigos y procedimientos propios, por lo que para
los nuevos usuarios resulta un reto el hecho de tener que, además de aprender la
teoría estadística detrás de cada modelo, entender el lenguaje del software que se
está utilizando y los resultados que le son mostrados al ejecutar un
procedimiento.
Dentro de la Facultad de Ciencias Económicas se ha evidenciado la falta de
diversidad en los programas utilizados para la aplicación de la teoría tomada en
clase, esta problemática se puede deber principalmente a dos factores: el primero,
es la falta de medios explicativos para que los estudiantes aprendan a utilizar los
diferentes paquetes (clases auxiliares con monitores que conozcan diversos
programas, documentos de apoyo, ejemplos, etc.); el segundo, los problemas de
acceso a los software por fuera del aula, pues debido a que ciertos de ellos,
generalmente los más utilizados, requieren licencias y permisos, su uso está
restringido.
INV- Modelos no lineales en GRETL/2011-II
Como forma de colaborar a disminuir el problema que se evidencia en la facultad,
la presente investigación busca, en primera instancia, ofrecerles a los estudiantes
una guía para el uso básico de GRETL, un software que se ajusta a las
necesidades de la academia y que cuenta con gran cantidad de funcionalidades. A
continuación se hace un análisis de los contenidos de las materias básicas de la
línea de econometría relacionándolos con GRETL:
Materia2
Funcionalidad en GRETL
Econometría I
Contenidos:
 Modelo de regresión simple y MCO.
 Modelo de regresión múltiple:
estimación y supuestos Inferencia.
 Problemas asociados:
heteroscedasticidad,
multicolinealidad, variables
omitidas, error de medición y
simultaneidad.
Estimación de modelos por MCO, contraste
de supuestos, intervalos de confianza,
gráficos
de
variables
estimadas
y
observadas, gráfico de residuos, intervalos
de confianza.
Econometría II
Contenidos:
 Análisis de Componentes
Principales.
 Datos panel.
 Procesos estocásticos: lineales,
estacionarios y no estacionarios.
 Modelos ARMA y ARIMA:
especificación y propiedades,
identificación, estimación,
verificación y uso del modelo
(predicción).
 Pruebas de raíz unitaria.
 Modelo ARIMA estacional.
Análisis de componentes principales (arroja
los resultados básicos de valores propios
con su varianza y varianza acumulada y
los vectores propios asociados a cada
valor), estimación de datos panel (por
efectos fijos, efectos aleatorios, MCO
ponderados), análisis de series de tiempo
con modelos ARMA y ARIMA.
TABLA 1. PERTINENCIA DE GRETL EN LA FCE
Como se observa en la relación descrita, el programa se ajusta a las necesidades
de las clases del núcleo básico que ofrece la carrera. A través del presente
documento se mostrarán las características básicas para el uso del programa en
las que se hace énfasis en la facilidad y versatilidad que este ofrece, lo cual
fortalece la pertinencia de su uso en la facultad, pues puede servir como medio
2
Contenidos tomados del Sistema de Información Académica de la Universidad Nacional de
Colombia
6
INV- Modelos no lineales en GRETL/2011-II
para incentivar el trabajo autónomo de los estudiantes que no se van a ver
limitados por problemas de entendimiento usuario-software, como tampoco por el
acceso restringido al uso del programa; sin dejar de asegurar la calidad en las
estimaciones y en los procesos realizados.
Respecto a la calidad en los procesos que GRETL realiza, el documento busca
abarcar un tema complementario a los normalmente enseñados en los cursos de
la facultad (presentados en la Tabla 1) se trata de la aplicación de modelos no
lineales con variable dependiente binaria, modelos muy utilizados para el análisis
de la realidad pero que por la dificultad en su interpretación no tienen cabida en
los cursos iniciales de econometría. De esta manera, se busca hacer una
aproximación básica a temas complementarios que incentivan el aprendizaje de
los estudiantes por fuera del aula de clases. Los resultados que se obtengan de la
estimación de dichos modelos serán confrontados con los resultados obtenidos de
uno de los programas más utilizados, como lo es Stata, buscando validar la
pertinencia del uso alternativo de GRETL.
2. DESCRIPCIÓN BÁSICA DE GRETL.
GRETL (The Gnu Regression, Econometrics and Time-series Library) es un
paquete econométrico desarrollado bajo los principios del software libre y la
“General Public License (GPL)” de GNU. De este modo está dirigido
principalmente al sistema operativo Linux, aunque cuenta con versiones
desarrolladas para Windows y Mac. La principal fortaleza pedagógica del
programa reside en que además de ofrecer una interfaz agradable para el usuario,
incluye gran cantidad de datos de ejercicios de libros de econometría
ampliamente usados en la enseñanza de esta herramienta.
GRETL, además de permitir desarrollar gran cantidad de métodos y pruebas
estadísticas, permite asociarse con otros programas ya sea en importación de
datos (lee bases de datos de SPSS, Excel, Stata, Eviews, etc.) o de exportación de
documentos donde trabaja conjuntamente con LaTeX. Sumado a esto, el
programa tiene un enlace con R-Project, que se puede usar para un análisis de
datos más avanzado.
2.1. INSTALACIÓN.
2.1.1. Linux.
En Linux existe la posibilidad de elegir entre dos tipos de instalaciones. Por un
lado, se puede instalar GRETL desde la compilación y construcción de su código,
esto es útil para las personas que pretenden hacer desarrollos sobre la
plataforma o quieren adecuar el programa a sus necesidades; Por el otro, existe
un paquete “pre-construido” el cual es instalado por los usuarios corrientes, pues
7
INV- Modelos no lineales en GRETL/2011-II
el primer tipo requiere de un conocimiento del código de programación. Algunas
distribuciones de Linux como Debian y Ubuntu incluyen dentro de sus paquetes
a GRETL y sus librerías, además se pueden encontrar ciertos paquetes listos para
ejecutar en la página principal del programa, sección descargas
(http://gretl.sourceforge.net/gretl_espanol.html).
2.1.2. MS Windows.
En Windows el proceso de instalación se reduce a un archivo ejecutable que se
encuentra en la dirección http://gretl.sourceforge.net/win32/index_es.html. Al
ejecutar el archivo y elegir el directorio donde va a ser instalado el programa se
instala automáticamente. Aparte de encontrar el instalador de GRETL para
Windows, en esta página están diversos paquetes que se han venido
desarrollando, tales como TRAMO/SEATS, datos de libros de enseñanza de
Econometría, etc. Además se encuentran de opciones para actualización y
construcción del programa.
Tanto para Windows como para Linux el programa busca actualizaciones
recurrentemente, sin embargo para el caso de Windows, el usuario puede decidir
si desea que el programa actualice automáticamente. Para esto el usuario debe
cerrar GRETL, ejecutar el programa “gretl updater” y cuando este termine volver a
abrir GRETL.
2.2. EXPLORACIÓN BÁSICA DEL PROGRAMA.
2.2.1. Ventana Principal
A. VENTANA PRINCIPAL
8
INV- Modelos no lineales en GRETL/2011-II
La ventana principal de GRETL es supremamente sencilla e intuitiva para el
usuario, el cual no tiene que tener un conocimiento en programación para poder
usarlo. GRETL le ofrece opciones que tan sólo tiene que elegir con unos cuantos
clics y que simplifican el trabajo del investigador. Sin embargo, para usuarios
avanzados que quieren aumentar la experiencia en GRETL, el código del
programa es abierto y pueden colaborar en el desarrollo de este. A continuación
se hará revisión de las principales herramientas que ofrece la ventana principal:

Barra de herramientas: Contiene las principales herramientas del
programa en lo que se refiere a gestión de archivos y análisis estadístico y
econométrico. Además, contiene una ventana de ayuda que enriquece el
aprendizaje del investigador.

Variables disponibles: Esta ventana, que ocupa el espacio más amplio de
la ventana principal, muestra al usuario las variables que son cargadas
dándole a cada variable un orden, un nombre y una descripción básica.

Barra de acceso rápido: Ubicada en la parte inferior izquierda de la
ventana principal, le ofrece al usuario un acceso rápido a ciertas
herramientas básicas como es calculadora, guía de instrucciones, guía de
usuario, consola y la vista de íconos de sesión donde se encuentra la
información principal del conjunto de datos que está siendo trabajado.

Características del conjunto de datos: Es un pequeño espacio ubicado
en la parte inferior central de la ventana principal. Muestra la periodicidad
de los datos y los años que comprende.
2.2.2. Importación de archivos
Para importar datos a GRETL hay que utilizar la herramienta Abrir Datos ubicada
en el menú archivo de la barra de herramientas, al dar clic en esta opción el
programa mostrará tres opciones:

Archivo de usuario: en la que el usuario busca en su equipo el conjunto
de datos que desea importar.

Archivo de muestra: Aquí el usuario tiene a disposición, por defecto, tres
librerías de datos las cuales muestran una cantidad de conjuntos de datos
precargadas y que se pueden aplicar a gran cantidad de modelos según
sus características (revisar Ilustración B). En la página de GRETL es
posible más bases de datos procedentes de libros de econometría. Para
más
información
revise
el
siguiente
vínculo
http://gretl.sourceforge.net/gretl_data_es.html
9
INV- Modelos no lineales en GRETL/2011-II

Importar: GRETL permite importar datos de diversos programas y
extensiones, como son: Octave, texto/csv, Eviews, Gnumeric, Stata, SPSS,
entre muchos más.
B. ARCHIVOS DE MUESTR A
Además de esta opción, existe la posibilidad de cargar guiones para ejecutar por
medio de la consola, esto se hace desde la opción Archivos de guion del menú
Archivo. Aquí se encontrarán las opciones comunes de cargar un guion ya sea
por el mismo archivo del usuario o precargadas con el programa o crear una
nueva de tipo R, GRETL, Octave, entre otros.
Otra función útil que GRETL contiene es la carga de archivos de funciones, que
también se encuentra ubicada en el menú Archivo, en ésta opción se puede
cargar paquetes de funciones que hayan sido desarrolladas por algún usuario o
por usted mismo, evitando el proceso de tener que desarrollarla por medio de
programación.
Por último existe la opción de configurar el directorio predeterminado de GRETL,
la opción Archivo – Directorio de trabajo, permite configurar el directorio y las
opciones de uso como se observa en la Ilustración C.
C. SELECCIÓN DE DIREC TORIO
10
INV- Modelos no lineales en GRETL/2011-II
De este modo al trabajar con nuestro directorio predeterminado el programa
automáticamente buscará allí todos los archivos que se llamen usando los
comandos open, run o include, por medio de la consola. Además cualquier trabajo
que sea guardado o editado quedara grabado en este directorio.
GRETL ofrece la opción de guardar y abrir sesiones de trabajo en el programa, así
se tendrán a salvo los datos usados, algunos modelos aplicados y algunas
gráficas que el usuario al cerrar la sesión haya decido guardar.
Ciertas veces puede ser necesario dar información acerca de la naturaleza de la
información, esto se lleva a cabo a través de la opción “Estructura del conjunto de
datos” ubicada en la pestaña Datos de la barra de herramientas, aquí se podrá
especificar si los datos son de tipo sección cruzada, serie temporal o panel.
2.2.3. Herramientas de trabajo
La opción Herramientas, ubicada en la barra de herramientas de la ventana
principal, cuenta con ciertas opciones útiles tanto para mejorar la eficiencia o la
capacidad de uso del programa, como para el análisis estadístico básico. Por el
momento se hará referencia a las herramientas de trabajo del programa, en la
próxima sección se revisarán las herramientas de análisis.
La principal función que podemos encontrar es la consola de GRETL, desde aquí
podemos trabajar todas las funciones usando la línea de comandos del programa.
Las funciones que el programa contiene se encuentran, o escribiendo “help” en la
consola de comandos o en el menú de ayuda, ubicado en la barra de
herramientas, donde aparece la opción “guía de instrucciones”. Aquí tendremos a
nuestra disposición una descripción de todos los comandos disponibles en el
programa.
Adicional a esta herramienta está disponible una opción llamada “historial de
instrucciones” la cual muestra los comandos que han sido utilizados durante la
sesión de trabajo, junto con una opción de enlace a GNU R, la cual nos va a llevar
a la interfaz de R-Project, que puede llegar a ser útil en el desarrollo de funciones
más avanzadas que GRETL puede no contener.
2.3. ANÁLISIS ESTADÍSTICO DESCRIPTIVO Y EDICIÓN DE
VARIABLES.
GRETL ofrece al usuario ciertas herramientas útiles para la creación de
estadísticos descriptivos de las variables que se estén trabajando. Una ventaja del
software es que no sólo tiene un proceso muy intuitivo para generar los
estadísticos principales sino que además contiene una serie de calculadoras o
11
INV- Modelos no lineales en GRETL/2011-II
programaciones que nos muestran, por ejemplo, tablas estadísticas, valores-p,
gráficas de distribuciones, estadísticos de contraste, entre otros.
2.3.1. Estadísticos y gráficos descriptivos.
En la barra de herramientas se encuentra la opción Variable que desplegará
opciones de edición y análisis estadístico, hay que tener en cuenta que cualquier
opción que se elija va a arrojar el resultado para la variable que se haya
seleccionado previamente en la ventana principal del programa. En relación con
las opciones de edición se encontrarán opciones para cambiar datos, atributos de
la serie (cambiar el nombre y número) y para establecer el código que reconocerá
valores ausentes.
Una de las opciones a tener en cuenta es el tipo de estructura de los datos,
opción que se ejecutará automáticamente al importar una base de datos, o que se
encuentra ubicada en la opción Datos de la barra de herramientas de la ventana
principal. Aquí se podrá especificar la naturaleza de los datos y el orden que
tiene, algo básico para la estimación correcta del modelo. Las opciones se
muestran en la Ilustración D.
D. ESTRUCTURA DE LOS DATOS
12
INV- Modelos no lineales en GRETL/2011-II
En cuanto al análisis descriptivo las opciones que es posible encontrar son
básicamente:
 Estadísticos principales: La salida de esta opción nos mostrará: media,
mediana, máximo, mínimo, desviación estándar o típica, coeficiente de
variación, de asimetría y el excedente de curtosis.
E. ESTADÍSTICOS PRINCIPALES
Además de esta opción, desde la barra de acceso rápido se puede encontrar
una herramienta aún más interesante: dando clic en el botón “vista de
iconos de sesión” se encontrará
la opción Resumen la cual
automáticamente nos mostrará la media, mediana, mínimo y máximo de
todos los datos que contiene la base que ha sido cargada.
F. ESTADÍSTICOS DEL CONJUNTO DE DATOS GENERAL
13
INV- Modelos no lineales en GRETL/2011-II
 Contraste de normalidad: El programa automáticamente hace cuatro
pruebas de normalidad para la serie escogida: Doornik-Hansen, W de
Shapiro-Wilk, Lilliefors y Jarque-Bera.
Para cada una el programa
muestra el estadístico y su valor-p asociado.
G. CONTRASTE DE NORMALIDAD
 Gráfico Q-Q normal: Esta herramienta nos permite comparar los cuantiles
empíricos de la serie en cuestión contra los cuantiles de una distribución
normal. Para llevar a cabo este proceso mínimo hay que contar con 20
datos y el programa por defecto calcula la distribución normal con la media
y varianza de los datos que se están utilizando. Además hay dos opciones
más para trabajar con datos estandarizados o enfrentar a los cuantiles
brutos contra una normal de media 0 y varianza 1.
H. Q-Q NORMAL.
14
INV- Modelos no lineales en GRETL/2011-II
 Gráfico de Cajas (Boxplot): Dando clic derecho sobre la variable es posible
encontrar la opción de gráfico de cajas que nos permite ver la distribución
de la variable, usando su mínimo, máximo, sus cuartiles, su media y su
mediana.
I. BOXPLOT
2.3.2. Transformación y generación de nuevas variables.
Otra función muy útil de GRETL es la variedad de opciones que ofrece para
convertir en diferentes formas funcionales las variables que se han cargado. Así
mismo, es muy útil para agregar con tan sólo un clic variables dummy
estacionales, variables aleatorias, entre otras herramientas que su construcción
podría llevar mucho más tiempo. Todas estas herramientas las encontramos en el
botón Añadir de la barra de herramientas de la ventana principal. Las opciones
disponibles son: logaritmos, cuadrados, retardos, primeras diferencias,
diferencias de logaritmos y diferencias estacionales de las variables
seleccionadas.
Además de esto existe la opción para definir una nueva variable que se quiera
introducir, una gran ventaja pues dinamiza el trabajo de tener que ir hasta la
base de datos original para poder incluirla, o para crear una matriz ya sea
utilizando las series que están cargadas o introduciendo su tamaño y
posteriormente los datos, o mediante una función que incluya una relación
matemática entre ciertas variables.
Apenas se haga clic sobre la opción que se desea, la nueva variable que ha sido
creada aparecerá en la ventana principal, de esta forma ya puede ser llamada en
cualquier proceso que se vaya a realizar.
15
INV- Modelos no lineales en GRETL/2011-II
2.3.3. Análisis de componentes principales.
Uno de los procesos estadísticos no inferenciales más útiles que se pueden
realizar es el Análisis de componentes principales (ACP). Aunque GRETL tiene
una función desarrollada para este proceso es muy básica respecto a los procesos
que se pueden desarrollar en otros programas como R y SPSS.
La aplicación de ACP en GRETL se limita a una opción que se encuentra en el
botón Ver de la barra de herramientas o al comando acp de la consola. Al dar clic
sobre la opción de ACP el programa abrirá automáticamente una ventana que
pedirá seleccionar las variables a analizar y decidir si se trabaja con la matriz de
covarianzas o con la de correlaciones (paso básico para la determinación de los
componentes). Si se realiza el proceso por medio del comando en la consola hay
que especificar las variables a analizar, o en su defecto si se desea analizar toda
la base simplemente hay que escribir el comando y dar enter.
J. ANÁLISIS DE COMPONENTES PRINCIPALES
La ventana de salida que se obtiene nos muestra, en primera instancia, la
varianza de cada componente (vector propio) y la varianza acumulada que sirven
como criterio de selección las componentes a retener. Debajo de estos datos se
encontrará la ponderación que cada componente le otorga a cada variable, lo cual
es útil para hacer el proceso de descripción de los componentes retenidos.
16
INV- Modelos no lineales en GRETL/2011-II
3. APLICACIÓN DE MODELOS ECONOMÉTRICOS.
GRETL contiene programación para realizar procesos en aproximadamente 28
métodos econométricos, dentro de estos encontramos mínimos cuadrados
ordinarios, estimación de la matriz de covarianzas robusta, datos panel estático y
dinámico, mínimo cuadrados no lineales, Estimación de máxima verosimilitud y
modelos de series de tiempo univariados y multivariados, entre muchos otros.
Este documento se centrará al estudio de modelos que se enfrentan a problemas
de variables discretas, como ya se verá más adelante al hacer referencia a los
modelos Logit y Probit. Sin embargo, para explorar un poco más en detalle el
programa se pretende hacer a continuación una exposición de la estimación de
un modelo de regresión lineal por mínimos cuadrados ordinarios.
3.1. MÍNIMOS CUADRADOS ORDINARIOS.
El proceso de estimar un modelo de regresión lineal por mínimos cuadrados
ordinarios (MCO) en GRETL se puede desarrollar, al igual que la mayoría de los
procesos, por medio de la interfaz de usuario o por medio de la consola.
En la barra de herramientas se encontrará la pestaña Modelo en donde
aparecerán los diferentes conjuntos de modelos que se pueden aplicar a los datos
con los que se cuenta. Por consiguiente, en este menú aparecerá la opción de
MCO que al seleccionarla mostrará una ventana en donde se debe seleccionar la
variable dependiente y las variables independientes del modelo. Si se desea
proceder usando la consola, se puede realizar con el comando ols seguido de la
variable independiente y después de las independientes.
K. MÍNIMOS CUADRADOS ORDINARIOS
17
INV- Modelos no lineales en GRETL/2011-II
3.1.1. Contraste de supuestos.
Al haber estimado el modelo, aparecerá una ventana de salida en la cual se
muestran los principales resultados de la estimación. Así mismo, se encuentra
una barra de herramientas con todas las opciones disponibles para analizar y
contrastar el modelo. Específicamente, la opción contrastes muestra una gran
cantidad de contrastes a los supuestos del modelo, tal como muestra la
Ilustración L. Al seleccionar cualquiera de los contrastes aparecerá
automáticamente en otra ventana el proceso realizado por el programa y se creará
debajo de los resultados principales de la estimación del modelo (obtenidos
anteriormente) un resumen de la prueba realizada, mostrando la hipótesis nula,
el estadístico y su valor-p principalmente.
L. CONTRASTES DE LOS SUPUESTOS, TEST RESET DE RAMSEY.
La diferencia entre las dos formas de aplicar el modelo (interfaz o consola) está en
que para hacer los contrastes de los supuestos del modelo la primera opción
ofrece en el documento de salida el menú explicado anteriormente. Al proceder
mediante la consola se deben seguir utilizando los comandos correspondientes a
los contrastes que se desean hacer, por ejemplo, para hacer el test de Ramsey se
procede con el comando reset.
3.1.2. Intervalos de confianza.
Una de las fortalezas con las que GRETL cuenta es la fácil estimación de los
intervalos de confianza para cada una de las variables del modelos que se haya
ejecutado, simplemente hay que dirigirse a la sección análisis en la ventana de
18
INV- Modelos no lineales en GRETL/2011-II
salida de resultados del modelo, donde aparece la opción de intervalos de
confianza, estos automáticamente serán generados.
M. INTERVALOS DE CONFIANZA
4. MODELOS CON VARIABLE DEPENDIENTE BINARIA3
La aplicación del modelo de regresión múltiple lineal puede ser no adecuada para
la explicación de problemas en los cuales la respuesta que se espera toma
únicamente dos valores, por ejemplo, cuando se quiere hacer un análisis de
políticas las únicas respuestas que se pueden esperar es si estas fueron exitosas
o no en el medio en el cual fueron aplicadas. Para estos casos es necesario
utilizar nuevas herramientas que difieren del modelo de regresión múltiple y que
plantean nuevos mecanismos de medición. A continuación se consideraran
ciertos modelos que son útiles para solucionar problemas con variable
dependiente binaria, estos son: Modelo de probabilidad lineal, modelo Logit y
modelo Probit.
4.1. MODELO DE PROBABILIDAD LINEAL (MPL).
El modelo de probabilidad lineal (MPL) es básicamente una variación del modelo
de regresión lineal múltiple enfocada a la explicación de eventos cualitativos. En
este documento sólo se considerarán el caso en que el evento a explicar tiene
resultados binarios, de este modo la variable dependiente del modelo de regresión
lineal sólo podrá tomar valores de cero o uno.
Al tener un modelo,
Con y como una variable bivariada, la interpretación común de los
no puede
seguir siendo utilizada, pues los cambios en y ya no son continuos ante cambios
en las X. De este modo hay que recurrir a una nueva forma de entender el modelo
con el fin de hallar su utilidad.
3
Explicación de modelos basada en Wooldridge (2009)
19
INV- Modelos no lineales en GRETL/2011-II
Al admitir el supuesto de media condicional cero,
puede ser expresado como,
, el modelo
El punto clave de la explicación del modelo de regresión lineal con variable
dependiente binaria está en que siempre se tiene que el valor esperado de y es
igual a su probabilidad de éxito, que es la probabilidad de que y sea igual a 1,
expresado de otra forma:
. De este modo el modelo dice que la
probabilidad de éxito es función lineal de las variables x, lo que se puede expresar
como,
Así mismo, dado que las probabilidades tienen que sumar uno podemos decir que
, que también es función lineal de las variables x. Este
modelo es llamado Modelo de Probabilidad Lineal (MPL) debido a la linealidad de
los parámetros del éste. El modelo se estima por Mínimos Cuadrados Ordinarios
(MCO) como un modelo común de regresión lineal múltiple.
La interpretación de los
se puede entender como “la variación de la
probabilidad de éxito al variar , permaneciendo los demás factores constantes”
(Wooldridge, 2009):
Cuando se tiene variables independientes binarias el coeficiente que se obtiene
“mide la diferencia que se predice para la probabilidad en relación con el grupo
base” (Wooldridge, 2009)
N. MPL BASE DE DATOS WOOLDRIDGE (2009)
20
INV- Modelos no lineales en GRETL/2011-II
Al ser el modelo estimado por MCO, en GRETL se debe seguir el proceso
explicado en la sección 3.1 con la variable independiente bivariada que exprese
una relación cualitativa.
Con el ánimo de evaluar los resultados de GRETL, se va a utilizar la base de
datos MROZ del libro de Wooldridge (2009) la cual se puede encontrar dentro de
la biblioteca de datos lista para instalar en el programa utilizando el enlace
especificado en la sección 2.2.2 de este documento.
4.1.1. Desventajas del MPL
El modelo MPL tiene dos desventajas principalmente que lo hacen débil frente a
los modelos que posteriormente se explicarán. La primera debilidad reside en
que es posible que se den, con ciertas combinaciones de las variables
independientes, resultados en donde la probabilidad es negativa o mayor a uno;
probabilidades que generan un problema de interpretación y que por lo tanto
requieren de un cambio en la forma de entender y estimar el modelo.
La segunda debilidad del modelo es que no se puede considerar que la
probabilidad esté relacionada linealmente con las variables independientes para
todos los valores, ciertos efectos sobre la variable dependiente varían en su
magnitud según aumenta la variable independiente, el MPL no es capaz de
recoger dichos cambios. Sin embargo, si los valores de las variables
independientes están cerca del promedio el modelo es útil para predecir.
4.2. MODELOS NO LINEALES PARA RESPUESTA BINARIA.
Los modelos Logit y Probit pueden superar las limitaciones que tienen los
modelos de probabilidad lineal vistos en la sección anterior, pero la principal
desventaja de estos modelos es el grado de dificultad que adquiere la
interpretación de estos.
Para especificar los modelos Logit y Probit se puede partir de la ecuación (3) y
hacer una variación para considerar una clase de modelos como el siguiente:
Donde G se considera una función con valores ente cero y uno estrictamente,
para todos los números reales z. Esta primera condición elimina el problema del
MPL de poder tener valores negativos o mayores a 1.
Por otro lado, la función G es una función no lineal que cumple con la
característica anterior de valores estrictamente entre cero y uno. Las funciones
que se han utilizado más ampliamente en las aplicaciones de modelos de variable
dependiente limitada son:
21
INV- Modelos no lineales en GRETL/2011-II

Función logística (modelo Logit): función de distribución acumulada
para una variable logística estándar.
Se encuentra entre cero y uno para todos los números reales.

Donde
Función de distribución acumulada normal estándar (Modelo Probit):
es la densidad normal estándar
Una forma de derivar los modelos Logit y Probit es a través de un modelo de
variable latente subyacente.
Se parte de considerar a
como una variable inobservable determinada por la
ecuación (9) que introduce la notación de una función indicador,
lo que
significa que esta función asume el valor de uno si se cumple la condición dentro
de los corchetes y de cero si no se cumple.
Los errores,
se suponen independientes de
y que tienen la distribución
logística estándar o la distribución normal estándar. Esto significa que en
cualquier caso los errores se distribuyen simétricamente en torno a cero y así
para todos los números reales z se tiene que
.
Con las consideraciones anteriores es posible calcular la probabilidad de
respuesta para y en los modelos Logit y Probit como,
(
Recordando que en los modelos de respuesta binaria toma importancia explicar
los efectos de las variables independientes sobre la probabilidad de éxito, es
importante tener en cuenta que aunque a primera vista parezca que lo
importante está en mirar los efectos de las
sobre la variable latente , en los
modelos Logit y Probit la dirección del efecto sobre
y sobre
es la misma. De este modo, dado que la variable
latente regularmente no tiene una unidad de medida definida, toma mayor
22
INV- Modelos no lineales en GRETL/2011-II
importancia la estimación de los efectos de las
sobre la probabilidad de éxito.
Ahora el problema está en que la no linealidad de las funciones G complica la
estimación e interpretación de dichos modelos.
Para solucionar el problema hay que recurrir a la derivación, pues si
es una
variable aproximadamente continua el efecto parcial sobre la probabilidad de
éxito,
, se obtiene de la derivada parcial (Wooldridge, 2009), que
se define como:
Con G definida una función de distribución de probabilidad de una variable
aleatoria continua y g como una función de densidad de probabilidad. Al ser G
una función estrictamente creciente (como en los casos de Logit y Probit), g(z)
siempre va a ser mayor a cero y así de (11) se puede decir que el efecto de
sobre
la probabilidad de éxito p(x) va a depender únicamente del signo de
,
reafirmando así su importancia en la explicación de los efectos.
Cuando hay variables explicativas binarias, el efecto parcial de que sea cero o
uno, ceteris paribus, es:
Que indica el cambio en la probabilidad de tener o no cierta característica
representada por la variable binaria, teniendo en cuenta las demás
características que permanecen constantes. En resumen el
que representa la
variable binaria determinará el cambio en la probabilidad de éxito de acuerdo a
su signo y la cantidad en que varía se estima mediante (12).
También es útil utilizar (12) para mirar los cambios en la probabilidad para
variables discretas, de este modo se puede medir el efecto de que
cambie de
a
siguiendo la misma lógica:
Para estimar los modelos de variables dependientes limitadas es necesario utilizar
la Estimación de Máxima Verosimilitud (EMV) debido a la naturaleza no lineal de
los modelos utilizados.
Estos modelos se pueden poner bajo la forma: “Sea
la función de
densidad para una extracción aleatoria
de la población, condicional en
”
(Wooldridge, 2009), al suponerse que se tiene una muestra aleatoria de tamaño n,
la densidad de
, para los modelos Logit y Probit, se determina por dos
23
INV- Modelos no lineales en GRETL/2011-II
valores
Concretamente, la densidad va a estar dada por:
Para
= 0, 1. El estimador de máxima verosimilitud de
log-verosimilitud:
.
maximiza la función de
El vector b es el argumento binario en el problema de maximización. En general
(Estimación de máxima verosimilitud) es consistente y tiene una distribución
normal aproximada en muestras grandes (Wooldridge, 2009).
Para los modelos Logit y Probit la función de log-verosimilitud se obtiene al
aplicar el logaritmo a la ecuación (14), lo cual, para la observación i quedaría
expresado como una función de los parámetros y los datos (
:
Así el problema de maximización que expresa (15) se puede escribir como:
Más adelante se revisará como GRETL realiza muestra los resultados del proceso
de estimación por máxima verosimilitud.
4.2.1. Interpretación de las estimaciones de los modelos Logit y Probit
Con los paquetes econométricos los problemas de estimación de los modelos
debido a su complejidad deja de ser un problema, ahora toma importancia la
forma en cómo se interpretan las estimaciones que resultan. Anteriormente, se
dijo que los coeficientes resultantes de la estimación del modelo reflejan los
efectos parciales de cada
sobre la probabilidad de respuesta, con una
significancia estadística determinada por la prueba de hipótesis
, a un
nivel de significancia suficiente.
Inicialmente existe una medida de la bondad de ajuste del modelo conocido como
“porcentaje predicho correctamente” que consiste en definir un predictor binario
24
INV- Modelos no lineales en GRETL/2011-II
de
como uno si la probabilidad que el modelo predice es mayor o igual a 0.5 y
cero si ésta es menor de 0.5.
(18)
Con esta herramienta es posible observar que tan bien predice el
a
en cada
observación del modelo. En GRETL la salida que se obtiene al aplicar el modelo
contiene un análisis del porcentaje predicho correctamente y que observaremos
posteriormente. Una deficiencia de este método es que en casos particulares
puede no predecir correctamente el resultado menos probable.
Entre las variantes a este método está el de cambiar el umbral de acuerdo a la
fracción de éxitos en la muestra y partir de ahí para considerar si
es 1 o 0. De
este modo si el porcentaje de éxitos en nuestra muestra es 7% en la ecuación (18)
hablaríamos de
.
Al calcularse un modelo sin utilizar MCO, el
que servía como medida para la
capacidad de ajuste del modelo ya no aplica, pues el procedimiento utilizado para
calcular no ha sido minimizando la varianza sino por máxima verosimilitud. El
equivalente para estos modelos ha sido conocido como pseudo
. Uno de los
más utilizados y que GRETL calcula automáticamente al correr el modelo es el
Pseudo
de McFadden que sugiere la siguiente medida:
Con
como la función de log-verosimilitud para el modelo estimado y
como
la función de log-verosimilitud con sólo el intercepto. “La log-verosimilitud del
modelo del intercepto es tratada como la suma total de cuadrados, y la logverosimilitud del modelo completo como la suma de los errores al cuadrado”
(UCLA, What are Pseudo R-squareds?) en comparación con el
de MCO.
El ratio entre
y
nos muestra la capacidad de mejoramiento sobre el
modelo del intercepto que ofrece el modelo completo. Sabemos por la ecuación
(16) que las log-verosimilitudes de los modelos Logit y Probit siempre van a ser
negativas por lo cual
, por lo tanto, si el modelo tiene baja
probabilidad la log-verosimilitud será mayor en valor absoluto que la de un
modelo con mayor probabilidad. Así, entre el ratio de log-verosimilitudes sea más
cercano a cero el
será más cercano a uno, que indica que el modelo se ajusta
bien. Si el modelo completo no tiene poder explicativo el ratio va a ser cercano o
igual a 1, con lo que el
del modelo será igual o cercano a 0.
25
INV- Modelos no lineales en GRETL/2011-II
Para estimar los efectos de las
sobre las probabilidades de éxito, se parte de la
derivada parcial y los efectos en el cambio de la probabilidad estimada de éxito
para cambios pequeños de , que se puede escribir como:
La dificultad de estimar el efecto está en que el factor de escala
depende de todas las variables explicativas, así que se tiene que recurrir a
diferentes medidas de como las medias, los máximos, los cuartiles, entre otras,
y así ver cómo cambia el factor.
Para GRETL el factor escalar es medido utilizando las variables explicativas en el
promedio muestral, de este modo “se obtiene el efecto parcial de
para la
persona “promedio” en la muestra” (Wooldridge, 2009).
El procedimiento es realizado tanto para variables explicativas continuas como
discretas. Críticas y alternativas a este procedimiento en Wooldridge (2009).
4.2.2. Pruebas de hipótesis múltiples.
Para probar restricciones de exclusión en los modelos Logit y Probit existen tres
métodos: El multiplicador de Lagrange, el test de Wald y la Razón de
verosimilitudes. GRETL en el resultado que muestra al usuario aplica la Razón de
verosimilitudes.
La prueba de la razón de verosimilitudes parte de considerar que, dado que la
EMV maximiza la función de log-verosimilitud, la omisión de variables ocasiona
generalmente una log-verosimilitud no mayor a la del modelo completo. Así, la
prueba está basada en la diferencia de las funciones de log-verosimilitud entre un
modelo restringido y uno no restringido y de este modo se puede concluir si la
disminución en la log-verosimilitud es lo suficientemente grande para considerar
a las variables omitidas significativas.
Este estadístico es dos veces la diferencia de las log-verosimilitudes del modelo no
restringido (
) y el restringido ( ).
)
(21)
Con q como el número de restricciones de exclusión. La hipótesis nula del
contraste considera que los parámetros de las variables excluidas en el modelo
restringido son iguales a cero.
26
INV- Modelos no lineales en GRETL/2011-II
4.3. CONCLUSIONES.
Como se observó anteriormente, los modelos Logit y Probit han surgido como
nuevos métodos para superar las deficiencias del modelo de regresión lineal
aplicado a variables endógenas restringidas (Modelo de Probabilidad Lineal) y así
generar predicciones más precisas sobre los fenómenos observados y modelados.
Sin embargo, se reconoce que la dificultad en el proceso de estimación e
interpretación del modelo es mayor para los modelos Logit y Probit, planteando
un nuevo reto a los investigadores en cuanto a cómo entender los resultados que
obtienen. Evaluar las salidas de los programas utilizados para estimar los
modelos toma cierta importancia en cuanto a las facilidades que le ofrece al
usuario.
Este apartado del documento busca únicamente ser una guía teórica de los
modelos MPL, Logit y Probit; con el fin de evaluar posteriormente los resultados
que GRETL arroja al usuario y su utilidad en la interpretación de dichos modelos.
5. APLICACIÓN
GRETL.
DE
MODELOS
LOGIT
Y PROBIT
EN
Utilizando los mismos datos que se tomaron para ilustrar el proceso del MPL
(sección 4.1) se ejecutará GRETL utilizando en este caso los modelos Logit y
Probit.
Dentro de la pestaña modelo, de la barra de herramientas de la interfaz, aparece
la opción llamada Modelos no lineales, aquí se encontrarán los dos modelos en
cuestión, tal como lo muestra la figura M. En este caso, solo se están
considerando los modelos binarios o con variable endógena restringida, así que la
opción Binario es la única que será trabajada en este documento.
O. MODELOS NO LINEALES
27
INV- Modelos no lineales en GRETL/2011-II
Al seleccionar la opción de aplicar el modelo Binario, tanto para Logit o Probit,
aparecerá la ventana de selección de variables que ya había sido explicada en el
apartado 3.1, las diferencias respecto a la explicada anteriormente son
nombradas en la Ilustración P, a saber, opciones para mirar pendientes o pvalores, y detalles sobre iteraciones.
De acuerdo a la teoría explicada anteriormente, las pendientes en la media son
útiles para mirar los efectos parciales de las
en la probabilidad de éxito. Debido
a que este efecto parcial depende de las , GRETL por defecto calcula ésta
pendiente en la media, lo cual indica que los resultados obtenidos se interpretan
respecto al “individuo promedio” de la muestra. Los detalles sobre las iteraciones
mostrarán los valores de la función de log-verosimilitud de cada iteración
realizada hasta maximizar la función.
P. ESPECIFICACIÓN DE LOGIT
Dentro de la salida de GRETL para la estimación de un modelo no lineal con
variable restringida, aparecen ciertos recursos estadísticos de gran ayuda para la
interpretación de los resultados por parte del usuario. De acuerdo a la teoría
enunciada anteriormente los más importantes son: El pseudo
de McFadden, El
contraste de razón de verosimilitudes, el número de casos “correctamente
predichos” y un cuadro que muestra en detalle el acierto del modelo en su
predicción mediante la comparación entre los predichos y los observados.
28
INV- Modelos no lineales en GRETL/2011-II
Q. SALIDA LOGIT (CON DETALLES DE ITERACIONES)
Por supuesto, en la parte central de la salida aparecerán los coeficientes
estimados, la desviación típica, las pendientes o los p-valores según la elección
tomada al momento de especificar el modelo.
Una de las opciones que puede ser interesante para contrastar el modelo es el
Test de Wald, aunque no se revisó teoría sobre este permite probar restricciones
múltiples sobre el modelo y cumple una función similar a la del estadístico de
razón de verosimilitudes.
R. OMISIÓN DE VARIABLES, TEST DE WALD
29
INV- Modelos no lineales en GRETL/2011-II
Los pasos para llevar a cabo este test es mediante la opción contrastes que
aparece en la barra de herramientas de la ventana de salida del programa.
Mediante la opción omitir variables el programa permitirá estimar otro modelo
con variables omitidas o restringidas.
La Ilustración P muestra la ventana para la omisión de variables. Los pasos a
seguir son: seleccionar las variables a omitir y seleccionar la opción de Contraste
de Wald. La hipótesis nula de la prueba es que los parámetros de las variables
omitidas son cero.
La salida generada por esta prueba mostrará detalles sobre la hipótesis nula y el
estadístico de contraste utilizado. Si se comparan los resultados del contraste de
Razón de Verosimilitudes y el de Wald los resultados generalmente tendrán
conclusiones similares.
S. CONTRASTE DE OMISIÓN DE WALD
Otro forma por medio de la cual se puede estimar un modelo Logit o Probit es el
mediante la consola de GRETL se hace mediante el comando Logit o probit, según
sea el caso. El comando solo pide la especificación de las variables separadas por
un espacio. Para activar opciones adicionales como ver los p-valores en vez de las
pendientes (p-values), errores estándar robustos (robust), mostrar la matriz de
covarianzas (VCV) o mostrar detalles de las iteraciones (verbose); sólo hay que
dejar un espacio después de las variables escribir dos guiones seguido de la
opción u opciones que deseamos, tal como se muestra a continuación:
logit inlf const nwifeinc exper expersq kidslt6 --verbose --vcv
Para llevar a cabo pruebas de restricción múltiples y en este caso el test de Wald,
el comando es omit, seguido de las variables a restringir y la opción de Wald:
omit nwifeinc exper expersq kidslt6 --wald
Así se llegará al mismo resultado descrito anteriormente.
30
INV- Modelos no lineales en GRETL/2011-II
Debido a que la única diferencia entre la aplicación de un modelo Logit y Probit
está en la función utilizada, para efectos del proceso necesario en el software para
su estimación no varía en absoluto.
6. APLICACIÓN DE LOGIT Y PROBIT EN STATA.
Como una forma de comparar los resultados obtenidos en GRETL, se pretende a
continuación hacer una exposición rápida de la estimación de un modelo Logit o
Probit mediante STATA. Al ser reconocido STATA como uno de los programas de
estadística más completos en el mercado, éste será un buen referente para
comparar los resultados obtenidos con GRETL. A continuación se explicarán los
comandos y paquetes necesarios para la estimación del modelo y todos los pasos
para su consecución. Se seguirá trabajando con la misma base de datos que ha
venido utilizándose en el documento.
Para la estimación de un modelo Logit o Probit es STATA hay que utilizar los
mismos comandos Logit o Probit, según sea el caso. Cuando no se adhieren
opciones adicionales para la estimación del modelo la estructura del código
utilizado en GRETL y STATA es el mismo.
T. LOGIT EN STATA
Sin embargo, la salida por defecto de Stata, en comparación a la de GRETL, no
contiene información sobre las pendientes del modelo respecto a cada variable
exógena, que como se revisó en la teoría es la única herramienta que permite la
explicación de los efectos de las variables independientes sobre la probabilidad de
éxito. Para conseguir esta información en Stata se recurre al comando mfx, el
cual arroja información tal como muestra la Ilustración U.
31
INV- Modelos no lineales en GRETL/2011-II
U. MODELO LOGIT CON PENDIENTES EN STATA
El test de Wald y la razón de verosimilitudes son ejecutados por Stata mediante
dos comandos: test y lrtest, respectivamente. Para el primero, simplemente se
necesita haber corrido el modelo deseado, después se ejecuta el comando test
seguido de las variables que se van a omitir y el software calcula la prueba y
arroja el p-valor correspondiente. El resultado de este proceso se observa en la
Ilustración V.
V. TEST DE WALD EN STATA
Para calcular el estadístico de razón de verosimilitudes el proceso que se debe
realizar no es tan intuitivo como el test de Wald, en este caso se deben hacer
unos cuántos pasos antes de ejecutar el comando lrtest que calcula el estadístico,
pues este comando pide especificar los dos modelos (restringido y no restringido)
que va a ser comparados.
Por tal motivo es necesario (mediante el comando estimates store el cual nos
permite guardar los modelos estimados dándoles un nombre) guardar las
estimaciones del modelo restringido y no restringido, para el modelo restringido
tan sólo hay que ejecutar el modelo con la variable independiente. Los comandos
necesarios para la estimación del test en el ejemplo que ha sido trabajado en todo
el documento se especifican en la Ilustración W.
32
INV- Modelos no lineales en GRETL/2011-II
W. ESTIMACIÓN RAZÓN DE VEROSIMILITUDES EN STATA
Por último, el comando que permite ver los casos “correctamente predichos” es
estat classification el cual muestra principalmente el cuadro de predichos y
observados con los casos en que el modelo predijo correctamente respecto al dato
observado (al igual que en GRETL se considera predicho correctamente cuando el
valor observado es uno y el valor de la estimación es mayor a 0,5; o cuando el
observado es 0 y la estimación menor a 0,5). En la salida de Stata “True D”
representa un dato observado de 1 y “Classified +” una estimación mayor a 0,5.
X. CASOS CORRECTAMENTE PREDICHOS EN STATA
En el último campo de la salida del comando estat classification aparece el
porcentaje de casos correctamente predichos el cual sirve para mirar que tan
bueno fue el modelo especificado.
33
INV- Modelos no lineales en GRETL/2011-II
7. CONCLUSIÓN.
Aunque no se han explorado más funcionalidades de GRETL y Stata para la
estimación de modelos no lineales con variable dependiente limitada, se ha hecho
una revisión de los principales comandos que le permitirían al estudiante o
investigador estimar e interpretar en un nivel básico un modelo no lineal de este
tipo.
Respecto a los dos software utilizados, es posible observar que las estimaciones y
pruebas realizadas no varían entre los dos programas, por lo cual arrojan los
mismos datos y conclusiones. Además, las salidas que se obtiene de los dos
programas tienen un aspecto similar que permite una fácil comprensión por parte
del usuario; en este punto es importante decir que GRETL genera la mayoría de
cálculos con el mismo comando mientras que en Stata se deben buscar diversos
comandos para analizar el modelo estimado, esto sin duda presenta una
diferencia entre GRETL y Stata, pues para los nuevos usuarios puede llegar a ser
más complicada la búsqueda de los comandos necesarios para llegar a buenas
conclusiones.
Esto demuestra que GRETL al ser software libre de código abierto, se presenta
como un programa útil para el análisis econométrico con buenas estimaciones,
una interfaz agradable e intuitiva en varios idiomas, de fácil instalación y
disponible para cualquier usuario. Aunque todavía necesite desarrollos que
fortalezcan su potencia en la ejecución de varios modelos, se presenta como una
oportunidad para los usuarios que no pueden acceder a otros programas por los
altos costos de las licencias o por la dificultad de entender cómo funcionan.
Además, al ofrecer una librería gratuita con gran cantidad de bases de datos de
los libros más reconocidos en la enseñanza de la econometría, GRETL se
convierte en una herramienta muy interesante para el aprendizaje.
Modelos como Logit y Probit son utilizados recurrentemente para la estimación de
fenómenos en el mundo real, sin embargo debido a lo complejo que es su
estimación no son tomados en cuenta en los cursos básicos. La pertinencia de
aplicar modelos que no son vistos en la línea de econometría del programa de
pregrado de la Facultad utilizando interfaces tan intuitivas como GRETL, está en
que los estudiantes y las personas interesadas en profundizar en temas
diferentes, como los modelos no lineales estudiados aquí, no necesitan de un
tutor o profesor que los guíe sino de una guía teórica y práctica que los
introduzca en el tema y les ofrezca las bases, incentivando así el autoaprendizaje como complemento a la formación que se recibe en las aulas.
34
INV- Modelos no lineales en GRETL/2011-II
8. REFERENCIAS.
Cottrell, A., & Lucchetti, R. (Julio de 2011). GRETL user´s guide. Recuperado el 9
de
Septiembre
de
2011,
de
GRETL
Web
page:
http://gretl.ecn.wfu.edu/pub/gretl/manual/PDF/gretl-guide-a4.pdf
UCLA. (s.f.). Stata Data Analysis Examples: Logistic regression. Recuperado el 25
de Noviembre de 2011, de http://www.ats.ucla.edu/stat/stata/dae/logit.htm
UCLA. (s.f.). What are Pseudo R-squareds? Recuperado el 16 de Noviembre de
2011,
de
http://www.ats.ucla.edu/stat/mult_pkg/faq/general/psuedo_rsquareds.htm
Wooldridge, J. (2009). Introductory Econometrics: A modern approach. Cengage
Learning.
Descargar