Análisis Estadístico en MATLAB - Facultad de Ciencias Económicas

Anuncio
Esta obra esta bajo una licencia reconocimiento-no comercial 2.5 Colombia de
creativecommons. Para ver una copia de esta licencia, visite
http://creativecommons.org/licenses/by/2.5/co/ o envié una carta a
creative commons, 171second street, suite 30 San Francisco, California
94105, USA
ANALISIS ESTADISTICO EN
MATLAB
Autores:
CRISTIAN GERARDO GIL SANCHEZ
MILLER GIOVANNY FRANCO LEMUS
Director Unidad Informática:
Tutor Investigación:
Coordinadores:
Henry Martínez Sarmiento
Álvaro Enrique Palacios
María Alejandra Enríquez
Leydi Diana Rincón
Coordinador Servicios Web:
Daniel Alejandro Ardila
Analista de Infraestructura
y Comunicaciones:
Adelaida Amaya
Analista de Sistemas de
Información:
Álvaro Palacios Villamil
Líder de Gestión de
Recurso Humano:
Islena del Pilar González
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
BOGOTÁ D.C.
FEBRERO 2005
ANALISIS ESTADISTICO EN
MATLAB
Director Unidad Informática:
Henry Martínez Sarmiento
Tutor Investigación: Maria Alejandra Enríquez G.
Auxiliares de Investigación:
Adriana Lucia Castelblanco
Alexis de Jesús Moros
Andrés Ricardo Romero
Brayan Ricardo Rojas
Carlos Hernán Porras
Catherine Cruz Pinzón
Cristian Gerardo Gil
Daniel Alejandro Melo
Diana Patricia García
Diego Fernando Rubio
Edwin Montaño
German David Riveros
Guillermo Alberto Ariza
Héctor Javier Cortés
Leydy Johana Poveda
Liliana Paola Rincón
Luis Alfonso Nieto
Luz Karina Ramos
Maria Teresa Mayorga
Martha Rubiela Guevara
Miller Giovanny Franco
Nubia Yolima Cucarian
Rafael Leonardo Saavedra
Sandra Liliana Barrios
Sandra Milena Cardenas
Sandra Mónica Bautista
Sonia Janeth Ramírez
Yaneth Adriana Cañón
Juan Felipe Rincón
Leidy Viviana Avilés
Este trabajo es resultado del esfuerzo de todo el equipo
perteneciente a la Unidad de Informática.
Se prohíbe la reproducción parcial o total de este
documento, por cualquier tipo de método fotomecánico y/o
electrónico, sin previa autorización de la Universidad
Nacional de Colombia.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
BOGOTÁ D.C.
DICIEMBRE 2005
ANALISIS ESTADISTICO EN MATLAB
TABLA DE CONTENIDO
TABLA DE CONTENIDO ................................................................................................................ 3
1.
RESUMEN ................................................................................................................................ 5
2.
ABSTRACT .............................................................................................................................. 5
3.
INTRODUCCIÓN.................................................................................................................. 7
Objetivo ............................................................................................................................................... 7
Justificación .......................................................................................................................................... 7
4.
STATISTICS TOOLBOX ................................................................................................... 8
Estructura de funciones .................................................................................................................... 9
5.
MANEJO DEL TOOLBOX ESTADISTICO ............................................................. 10
Estadística Descriptiva ................................................................................................................... 11
6.
5.1.1.
Medidas de localización ............................................................................ 11
5.1.2.
Medidas de dispersión ............................................................................... 17
5.1.3.
Grupos de datos ............................................................................................ 29
GRÁFICAS EN TOOLBOX ESTADÍSTICO........................................................... 37
Introducción ..................................................................................................................................... 38
Principales Funciones Utilizadas En Matlab Para Gráficas ...................................................... 38
7.
PROBABILIDAD ................................................................................................................ 63
Distribuciones De Probabilidad Discretas................................................................................. 63
7.1.1.
Distribución Binomial ................................................................................. 63
7.1.2.
Distribución Poisson.................................................................................... 68
7.1.3.
Distribución Hipergeometrica ............................................................... 74
Distribuciones De Probabilidad Continuas ............................................................................... 80
7.1.4.
Distribución Normal .................................................................................... 80
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
3
ANALISIS ESTADISTICO EN MATLAB
7.1.5.
Distribución Exponencial ......................................................................... 95
7.1.6.
Distribución Gamma ................................................................................. 103
7.1.7.
Distribución Chi-Cuadrado
7.1.8.
Distribución Beta ........................................................................................ 117
  ...................................................... 111
2
ANEXO 1 .......................................................................................................................................... 120
INNOVACIONES DE MATLAB 7 ................................................................................................ 120
NUEVAS CARACTERISTICAS .................................................................................................. 120
EDITOR AND DEBUGGER ....................................................................................................... 124
GRÁFICAS ...................................................................................................................................... 126
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
4
ANALISIS ESTADISTICO EN MATLAB
1. RESUMEN
Matlab es un software aplicativo que permite su utilización en diferentes
áreas del conocimiento, además permite la posibilidad de utilizar
Toolbox
especializados
que
facilitan
el
trabajo
y
aumentan
la
funcionalidad del programa, tal como es el caso del Toolbox estadístico
en el cual enfocamos este trabajo de investigación.
En el presente trabajo se pretenden dar a conocer algunas de las
funciones básicas manejadas en el Toolbox estadístico, con el propósito
de utilizar en la mayor medida posible, las herramientas proporcionadas
por el software y adecuarlas a las necesidades presentes en el área
estadística, complementando de esta forma las características básicas
del Software, con las presentadas en investigaciones anteriores, la
presente investigación y las posibles investigaciones futuras en el
programa.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
5
ANALISIS ESTADISTICO EN MATLAB
2. ABSTRACT
Matlab is applicative software that allows using in different areas of the
knowledge, in addition allows the possibility of using specialized Toolbox
that they facilitate the work and they increase the functionality of the
program, it is the case of the statistical Toolbox in which we focused this
work of investigation.
This work tried to present some basic functions handled in the statistical
Toolbox, in order to use in the greater possible measurement, the tools
provided by software and to adapt them to the present necessities in
the statistical area, complementing the Software‟s basic characteristics,
with the presented ones in previous investigations, the present
investigation and the future investigations possible in the program.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
6
ANALISIS ESTADISTICO EN MATLAB
3. INTRODUCCIÓN
Objetivo
Este trabajo se desarrolla con el objeto de continuar la investigación que
se viene realizando en la UIFCE con miras a ampliar el campo de
aplicación del programa MATLAB a las ciencias económicas, en este caso
con un énfasis estadístico, disponible en un paquete específico Statistics
Toolbox-
.
Teniendo
en
cuenta
lo
mencionado
con
anterioridad, se considera de gran importancia avanzar en este sentido
para llegar a consolidar un nivel adecuado en la aplicación de este
software que garantice la óptima utilidad del mismo.
De esta forma se busca desarrollar con esta investigación un manual
relacionado con el uso específico del paquete estadístico de MATLAB, de
tal manera que el mismo se encuentre disponible para los usuarios de la
UIFCE con conocimientos estadísticos básicos que quieran encontrar una
aplicabilidad suficiente del software.
Justificación
Durante el desarrollo de las carreras de la facultad de ciencias
económicas
se
destaca
la
gran
importancia
del
manejo
y
el
procesamiento de datos de tal forma que nos permitan establecer
conclusiones fiables que se acerquen en gran medida a las situaciones
reales, es por esta razón que se considera de gran
importancia
establecer
MATLAB
un
uso
adecuado
de
un
software,
como
y
específicamente del Statistics Toolbox, que facilite este proceso de
análisis de datos y además
permita complementar un proceso de
conocimiento en el área de la estadística.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
7
ANALISIS ESTADISTICO EN MATLAB
4. STATISTICS TOOLBOX
El paquete estadístico de MATLAB ha sido desarrollado para proveer
ayuda a cualquier tipo de área, desde las finanzas hasta la ingeniería,
con herramientas interactivas capaces de establecer análisis detallados
de datos, además viene acompañado de una completa serie de
funciones
para
desarrollar
desde
las
más
básicas
aplicaciones
estadísticas hasta un completo diseño y proceso de cualquier análisis
estadístico.
Este paquete provee dos completas categorías para este uso:
-
Una estructura de funciones.
-
Herramientas de diseño interactivo.
Este paquete es de gran funcionalidad puesto que permite combinar
poderosas funciones estadísticas con interfaces gráficas interactivas,
que han de generar un ambiente ideal para un completo montaje
estadístico.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
8
ANALISIS ESTADISTICO EN MATLAB
Estructura de funciones
MATLAB acompaña cada paquete de funciones con una completa guía de
ayuda disponible en diferentes temas específicos, que se muestran a
continuación. Las funciones que MATLAB incluye en este paquete las
agrupa dentro de las siguientes áreas:
Estadística descriptiva
30
Control de procesos estadísticos
7
Estadística multivariada
25
Regresión no Lineal
10
Gráficos estadísticos
26
Diseño de Experimentos
12
Distribuciones de probabilidad
138 Técnicas de árbol de decisión
5
Pruebas de distribución
4
Pruebas No Paramétricas
6
Modelos Lineales
27
Modelos Hidden Harkov
5
Importar/exportar archivos
5
Demostraciones
7
Pruebas de hipótesis
6
Utilidades
2
Es importante destacar como en MATLAB es posible acceder al código
fuente de las funciones predeterminadas (*.m), y amplia este capacidad
hasta el punto en el cual se puede crear y/o personalizar cualquier tipo
de función, ajustándolas a necesidades especificas.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
9
ANALISIS ESTADISTICO EN MATLAB
Diseño interactivo - Interfaz Grafica de Usuario
Además de la posibilidad de diseñar cualquier interfaz para un análisis
especifico, MATLAB viene acompañado de opciones predefinidas muy
útiles, una de estas es “The Distribution Fitting Tool” (Herramienta
apropiada para las distribuciones) una herramienta de gran utilidad que
permite
observar
el
comportamiento
de
16
diferentes
tipos
de
distribuciones de probabilidad con la opción de combinar distintas
condiciones para cada una de ellas.
INVESTIGACIÓN
Se ha planeado la investigación de tal manera que su resultado pueda
acompañar un proceso académico, en el cual se establezca una
interrelación entre la estadística y las ciencias económicas, es de esta
manera como sin olvidar la gran funcionalidad de este paquete de
herramientas, la investigación se va a enfocar en tres ejes temáticos,
que se consideran de primera importancia para iniciar un estudio tan
extenso.
5. MANEJO DEL TOOLBOX ESTADISTICO
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
10
ANALISIS ESTADISTICO EN MATLAB
En esta sección se explicará el uso de las funciones de más utilidad del
toolbox estadístico, con ejemplos básicos y útiles donde se destaquen la
aplicabilidad de cada una de ellas.
Estadística Descriptiva
5.1.1.
Medidas de localización
Mean ()
Descripción
Calcula la media aritmética de determinados valores.
Sintaxis
mean (a)
-
Si a es un vector, calcula la media de los valores.
Si a es una matriz, calcula la media de cada
columna.
mean (a, dim)
-
Ejemplo
Devuelve los valores medios de la
dimensión especificada de la matriz a.
La dimensión predefinida es 1.
a = [1:10]
Media = mean (a)
Media = 5.5000
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
11
ANALISIS ESTADISTICO EN MATLAB
m_columnas = mean (b)
m_columnas =
[5.0000
% media por columnas
5.2500
4.0000]
m_filas = mean (b, 2) % media por filas
m_filas = [2
6
5
6]
Nota
nanmean()
Calcula la media ignorando aquellos datos perdidos.
Descripción
Geomean ()
Descripción
Calcula la media geométrica de determinados valores.
Sintaxis
geomean (a)
-
Al igual que la función anterior, si a es un vector,
calcula la media de los valores.
Si a es una matriz, calcula la media de cada
columna.
Ejemplo
a = [1:10]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
12
ANALISIS ESTADISTICO EN MATLAB
m_geometrica = geomean (a)
m_geometrica = 4.5287
Media aritmética > Media geométrica
Nota
mean (x) > geomean(x)
Harmmean ()
Descripción
Calcula la media armónica de determinados valores, en
este caso representada por H, es igual al recíproco de una
cantidad finita de números, o inverso, de la media
aritmética de los recíprocos de dichos números
Sintaxis
harmmean (a)
- Su parámetro funciona de la misma manera que para
la media geométrica (mean).
Ejemplo
a = [1:10]
m_armonica = harmmean (a)
m_armonica = 3.4142
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
13
ANALISIS ESTADISTICO EN MATLAB
Trimmean ()
Calcula la media ajustada de una muestra determinada,
es decir excluye los y/2 percentiles mas bajos como los
mas altos, muy útil cuando encontramos datos atípicos en
la muestra.
Descripción
Sintaxis
trimmean (a, y)
-
Ejemplo
El parámetro a funciona de la misma manera que
las funciones anteriores, donde a es la muestra.
Mientras y representa el numero de percentiles
que se quieren obviar en los extremos.
a = [1:10]
%a = [1 2 3 4 5 6 7 8 9 10]
y = 20
m_ajustada = trimmean (a, y)
%Por el parámetro “y” la muestra que se calcula
es a = [2 3 4 5 6 7 8 9]
m_ajustada = 5.5000
%En este caso la media ajustada es igual a la media aritmética
por las características de la muestra.
b = [1 2 3 7 5 6 4 5 6 8 9 1]
z = 10
m_ajustada = trimmean (b, z)
m_ajustada = 5.5000
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
14
ANALISIS ESTADISTICO EN MATLAB
Max (); Min ()
Descripción
Devuelve los valores extremos de una determinada
muestra.
Sintaxis
max(a); min(a)
-
Si a es un vector, retorna el valor
máximo/mínimo.
Si a es una matriz, retorna máximo/mínimo de
cada columna.
max(a,[],dim); min(a[],2)
-
Ejemplo
Si a es una matriz, retorna máximo/mínimo según
dim ya especificada, cuando dim = 2 devuelve los
valores extremos para las filas.
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
%Devuelve los valores extremos por cada columna.
mx = max(b)
mx = [8
9
mi = min(b)
6]
mi = [1
2
1]
%Devuelve los valores extremos por cada fila.
mxf = max(b,[],2)
mif = min(b,[],2)
mxf = [
mif = [
3
7
5
6
4
9
Nota
]
1
nanmax() ; nanmin ()
Descripción
1
Devuelve los valores extremos de una determinada
muestra ignorando aquellos datos perdidos.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
15
]
ANALISIS ESTADISTICO EN MATLAB
Median ()
Descripción
Calcula la mediana de una muestra (matriz) especifica.
Sintaxis
median (a)
-
Si a es un vector, retorna la mediana de los
valores.
Si a es una matriz, retorna la mediana de cada
columna.
median (a, dim)
-
Ejemplo
Devuelve los valores medios de la
dimensión especificada.
La dimensión predefinida es 1.
a = [1:10]
Mediana = median (a)
Mediana = 5.5000
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
mediana_col = median (b)
mediana_col =
[
5.5000
% mediana por columnas
5.0000
4.5000]
mediana_fil = median (b, 2) % mediana por filas
mediana_fil = [2
6
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
16
ANALISIS ESTADISTICO EN MATLAB
5
8]
Nota
nanmedian()
5.1.2.
Descripción
Calcula la mediana ignorando aquellos datos perdidos.
Medidas de dispersión
Std ()
Descripción
Devuelve la desviación estándar de una matriz o muestra
específica.
Desviación estándar Corregida
Sintaxis
Desviación estándar sin Corregir
std (a)
-
Si a es un vector, retorna la desviación estándar
corregida de los valores.
Si a es una matriz, retorna la desviación estándar
corregida de los valores por columnas.
std (a, flag)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
17
ANALISIS ESTADISTICO EN MATLAB
-
Cuando flag = 0, std (a,0) se comporta de la
misma manera como std (a)
-
Cuando flag = 1, std (a, 1) devuelve la
desviación estándar sin corregir, y el segundo
momento de la muestra
std (a, flag, dim)
-
Ejemplo
obtenemos la desviación estándar de la dimensión
determinada.
Cuando dim = 0 obtenemos la desviación
estándar de las columnas.
Si dim = 1 se genera la desviación estándar de las
filas.
a = [1:10]
Des_std = std (a) % desviación estándar corregida
Des_std = 3.0277
Dstd = std (a, 1)% desviación estándar sin corregir
Dstd = 2.8723
% segundo momento
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
dstd_col= std (b)% desviación estándar por columnas
dstd_col =
[
3.1623
2.8723
2.4495]
dstd_fil = std (b,0,2)% desviación estándar por
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
18
filas
ANALISIS ESTADISTICO EN MATLAB
dstd_fil = [1.0000
1.0000
1.0000
4.3589 ]
Nota
nanstd()
perdidos.
Calcula
Descripción
la desviación estándar ignorando aquellos datos
Var ()
Descripción
Calcula la varianza de una muestra específica, es igual al
cuadro de la desviación estándar corregida.
Sintaxis
var (a)
-
Si a es un vector, retorna la varianza corregida de
los valores.
Si a es una matriz, retorna la varianza corregida
de cada
columna.
var (a,1)
-
Ejemplo
Si a es un vector, retorna la varianza sin corregir
de los valores, mientras si a es una matriz,
retorna la varianza sin corregir de cada columna.
a = [1:10]
Varz = var (a) % desviación estándar corregida
Varz = 9.1667
Recordemos que: std(a) = 3.0277.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
19
ANALISIS ESTADISTICO EN MATLAB
[ std(x) ]2= (3.0277) 2 = 9.167
=
var(x)
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
varc = var(b) % varianza por columnas
varc = [ 10.0000
8.2500
6.0000 ]
varf = var(b,1) % varianza por filas
varf = [ 7.5000
6.1875
Varianza corregida:
Nota
Varianza sin corregir:
nanvar()
Descripción
4.5000 ]
[ std(x) ] 2= var(x)
[ std(x,1) ] 2 = var(x,1)
Calcula la varianza ignorando aquellos datos perdidos.
Range ()
Descripción
Devuelve el rango de una determinada serie de datos, es
decir calcula la diferencia entre el dato máximo y el dato
mínimo.
Sintaxis
range (a)
-
Si a es un vector, calcula el rango del mismo.
Si a es una matriz, calcula el rango de cada
columna.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
20
ANALISIS ESTADISTICO EN MATLAB
Ejemplo
a = [1:10]
rango = range (a)
rango = 9
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
ran = range (b)
ran = [ 7
7
5]
Iqr ()
Calcula el rango intercuartil de una muestra especifica, es
decir, la diferencia entre el percentil 75 y el 25.
Descripción
Sintaxis
iqr (a)
-
Ejemplo
Si a es un vector, calcula el rango intercuartil del
mismo.
Si a es una matriz, calcula el rango intercuartil de
cada columna.
a = [1:10]
R_ intercuartil = iqr (a)
R_ intercuartil = 5
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
R_ intercuartil = iqr (a)
R_ intercuartil = [ 5.0000
3.5000
4.0000 ]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
21
ANALISIS ESTADISTICO EN MATLAB
Prctile ()
Descripción
Calcula el valor de un percentil determinado en el
intervalo de [0 100] en una muestra especifica.
Sintaxis
prctile (a, p)
-
“p”, corresponde al percentil que se busca, puede
-
ser un vector o escalar
“a”, es la muestra que se analiza, puede ser
vector o matriz.
a
p
Prctile (a , p)
Vector
Escalar
Calcula el percentil “p” de la muestra “a”.
Matriz
Escalar
Genera un vector con los percentiles “p” por
cada columna de la matriz “a”.
Vector
Vector
Genera un vector con los percentiles que
contiene “p” de la muestra “a”.
Matriz
Vector
Genera una matriz en la cual cada columna
corresponde a los percentiles especificados en
“p” de cada columna de la matriz “a”
Nota
Ejemplo
Percentil 50 = Mediana
a = [1:10]
b = [25 50 75]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
22
ANALISIS ESTADISTICO EN MATLAB
percentiles = prctile (a,b)
percentiles = [ 3.0000
5.5000
8.0000 ]
c = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
d = [25 50 75]
percent = prctile (c,d)
percent = [ 2.5000
5.5000
7.5000
3.5000
5.0000
7.0000
2.0000
4.5000
6.0000 ]
Quantile ()
Descripción
Calcula el valor de un quantiles de una muestra
especifica, aunque su resultado es muy similar al de la
función anterior – prctile() - .
Sintaxis
quantile (a, p, dim)
-
-
Nota
“p”, corresponde al quantil que se busca, puede
ser un vector o escalar y se encuentra entre el
rango [0 1] .
“a”, es la muestra que se analiza, puede ser
vector o matriz.
Su comportamiento hasta este punto es igual a la
función prctile().
Sin embargo el parámetro dim es muy útil ya que
nos permite buscar quantiles en otras dimensione.
dim=1, por columnas, dim=2, por filas
Prctile( x , 50) = quantile (x, .50) = mediana
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
23
ANALISIS ESTADISTICO EN MATLAB
Ejemplo
a = [1:10]
Q5 = quantile(a, .5) %Igual a la mediana
Q5 = 5.5000
Resume = quantile(a,[.025 .25 .50 .75 .975]
)
Resume = [1.0000 3.0000 5.5000 8.0000 10.0000 ]
b = magic(3)
b = [8
1
6
3
5
7
4
9
2]
MedianaC = quantile(b,.5,1) %Mediana por columnas
MedianaC = [ 4
5
6]
MedianaF = quantile(b,.5,1) %Mediana por filas
MedianaF = [
6
5
4
]
Skewness ()
Descripción
Calcula la oblicuidad de una determinada muestra,
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
24
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
skewness (a)
-
Si a es un vector, calcula la oblicuidad de los
valores.
Si a es una matriz, calcula la oblicuidad de cada
columna.
Ejemplo
X = randn([5 4])
%genera una matriz aleatoria con distribución normal
X = [ 0.2944
0.8580
-0.3999
0.6686
-1.3362
1.2540
0.6900
1.1908
0.7143
-1.5937
0.8156
-1.2025
1.6236
-1.4410
0.7119
-0.0198
-0.6918
0.5711
1.2902
-0.1567 ]
obl = skewness (X)
%En este caso la oblicuidad se acerca a cero
obl = [ -0.0040 -0.3136 -0.8865 -0.2652 ]
Nota
La oblicuidad (obl.) es una medida de asimetría de las muestras con distribución normal, se mide a
partir de la media.
Si obl. < 0, entonces la mayoría de los datos se encuentran a la izquierda de la media;
. Si obl.> 0, entonces la mayoría de los datos se encuentran a la derecha de la media; y
Si obl. = 0, entonces la muestra corresponde a una distribución normal con perfecta simetría.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
25
ANALISIS ESTADISTICO EN MATLAB
kurtosis ()
Descripción
Calcula la curtosis, removiendo los valores perdidos.
Sintaxis
kurtosis (a)
-
Cuando a es un vector, calcula la curtosis de los
elementos del mismo.
Cuando a es una matriz, calcula la curtosis para
cada columna.
kurtosis (a, flag)
- Especifica si se quiere corregir la diagonal (flag = 0)
o no (flag = 1, por defecto).
a = [1 5 9; 2 6 10; 3 7 11; 4 8 12]
Ejemplo
k=kurtosis (a)
k= [1.6400
1.6400
1.6400]
tabulate ()
Descripción
Devuelve una tabla con las frecuencias absolutas y
relativas de una muestra.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
26
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
tabulate (a)
-
Ejemplo
El parámetro a representa la muestra, y solo
puede ser un vector.
a = [4 1 4 4 2 3 4 3 1 2]
tabla = tabulate (a)
tabla =
Value
Count
Percent
1
2
20.00%
2
2
20.00%
3
2
20.00%
4
4
40.00%
mad ()
Descripción
Desviación absoluta media o mediana de una muestra.
Sintaxis
mad (a,flag,dim)
Si flag = 0 :
-
Si a es un vector, calcula la desviación absoluta
media de los valores.
Si a es una matriz, calcula la desviación absoluta
media de cada columna.
Si flag = 1:
-
Si a es un vector, calcula la desviación absoluta
mediana de los valores.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
27
ANALISIS ESTADISTICO EN MATLAB
-
Si a es una matriz, calcula la desviación absoluta
medina de cada columna.
- dim se usa para determinar la dimensión en la
cual se quiere calcular.(dim = 0, por defecto,
columnas, dim=1 por filas)
Ejemplo
a = [1:10]
DesvAbs = mad(a)
DesvAbs = 2.5000
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
dac = mad(b)
% desviación media por columnas
dac =[ 2.5000
1.8750
2.0000 ]
daf = mad(b,0,1)% desviación media por filas
daf =[ *
*
*]
Nota
Para una distribución normal 'mad ()' es menos eficiente que la desviación estándar 'std()' como medida de dispersión.
moment ()
Descripción
Devuelve los momentos centrales de cualquier orden (k).
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
28
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
moment(a, order, dim)
-
Ejemplo
Calcula el momento central de a según el entero
positivo order.
SI a es un vector, calcula el momento central por
cada columna.
dim especifica la dimensión con la cual se
calcularan los momentos centrales.
a = [1:10]
DesvAbs = mad(a)
DesvAbs = 2.5000
b = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
dac = mad(b)
% desviación media por columnas
dac =[ 2.5000
1.8750
2.0000 ]
daf = mad(b,0,1)% desviación media por filas
daf =[ *
5.1.3.
*
*]
Grupos de datos
cov()
Descripción
Devuelve una matriz de covarianza.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
29
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
cov (a)
-
Proceso
Cuando a es un vector, devuelve un valor con la
varianza del mismo.
Cuando a es una matriz, cada columna es una
observación y cada columna una variable.
El algoritmo para cov () es:
[n,p] = size(X);
X = X - ones(n,1) * mean(X);
Y = X'*X/(n-1);
Ejemplo
a = [1:10]
Covarianza = cov(a)
Covarianza = 9.1667
b = [1 2 3; 7 5 6; 4 5 6]
Covarianza = cov (b)
Covarianza =[ 9.0000
4.5000
4.5000
4.5000
3.0000
3.0000
4.5000
3.0000
3.0000 ]
corr()
Descripción
Devuelve una matriz de correlación linear.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
30
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
RHO = corr(a)
-
a debe ser una matriz, y devuelve un matriz de
correlacion entre columnas.
RHO = corr(a,b)
-
Genera una matriz de correlación entre las dos
matrices, las dimensiones
iguales a las de b.
de
a
deben
ser
RHO = corr(...,'param1', val1, 'param2',val2,...)
-
Especifica mas parámetros para determinar la
Correlación.
Parámetros
Valores
Descripción
'type'
'Pearson'
● Calcula el coeficiente de correlación
lineal de 'Pearson'.
(por defecto)
● Para los valores-P usa la distribución
T-Student
'rows'
'Kendall'
● Calcula “Kendall's tau”, otra medida de
correlación.
'Spearman'
● Calcula la correlación de 'Spearman'.
'all'
● Calcula usando todas las filas así
contengas valores perdidos.
(por defecto)
'complete'
● Calcula las filas que no tengan valores
perdidos.
'pairwise'
● Calcula RHO[i,j] usando las filas que
no tengan valores perdidos en las
columnas j e i .
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
31
ANALISIS ESTADISTICO EN MATLAB
'tail'
'ne'
● Correlación no es cero
(por defecto)
'gt'
● Correlación es mayor que cero
'lt'
● Correlación es menor que cero
(Cola – La hipótesis alternativa contraria
a la que deseamos comprobar.)
Ejemplo
a = [1 2 3; 7 5 6; 4 5 6; 8 9 1]
Rho = corr(a)
Rho =[
1.0000
0.8808
-0.1291
0.8808
1.0000
-0.4264
-0.1291
-0.4264
1.0000 ]
b=[1 2 3; 4 5 6; 7 8 9; 10 11 12]
RHO = corr(a)
RHO = [ 1 1 1
111
111]
corrcoef()
Descripción
Devuelve una matriz con los coeficientes de
correlación, en el cual las filas son observaciones y las
columnas son variables .
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
32
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
R = corrcoef (a)
-
a debe ser una matriz.
[R,P]= corrcoef (a)
- Devuelve además una matriz con los valores p
usados en las pruebas de hipótesis.
[R,P,RLO,RUP]=corrcoef(...)
- Además devuelve RLO y RUP que son los límites de
determinado intervalo a 95% de confianza.
[...]=corrcoef(...,'param1',val1,'param2',val2,...)
-Parámetros adicionales
Parámetros Descripción
'alpha'
Un numero entre 0 y 1 usado para especificar el nivel de
confianza de 100*(1-alpha)%
Ejemplo. Cuando alpha es 0.05, el intervalo de confianza esta a
95%
'rows'
Los valores se determinan de la misma manera que para corr().
crosstab()
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
33
ANALISIS ESTADISTICO EN MATLAB
Descripción
Genera una matriz con tabulación-cruzada entre
diferentes vectores.
Sintaxis
crosstab (col1 ,col2)
-
Se genera una matriz donde el elemento (i,j)
corresponde a la cuenta de todas las
observaciones donde col1=i y col2 =j.
Ejemplo
a=[1
2
3
4
5
6
7
8
9
10 ]
%Código de diez estudiantes
b=[2
4
4
3
1
5
3.5 2.5 3
2]
%Nota para los diez estudiantes respectivamente
tabla = crosstab(a,b)
tabla =
[
0
1
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
1
0
0
0
0
0
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
0
0
1
0
0
0
0
1
0
0
0
0
0
]
Puede interpretarse como:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
34
ANALISIS ESTADISTICO EN MATLAB
Nota
1
2
2.5
3
3.5
4
5
1
0
1
0
0
0
0
0
2
0
0
0
0
0
1
0
3
0
0
0
0
0
1
0
4
0
0
0
1
0
0
0
5
1
0
0
0
0
0
0
6
0
0
0
0
0
0
1
7
0
0
0
0
1
0
0
8
0
0
1
0
0
0
0
9
0
0
0
1
0
0
0
10
0
1
0
0
0
0
0
Alumno
grpstats ()
Descripción
Devuelve un resumen estadístico por grupo.
Sintaxis
grpstats (a, group)
-
Genera la media de cada columna de a por grupo,
el vector group define como se agruparan los
datos.
grpstats (a, group, alpha)
-
Genera un diagrama de las medias frente a un
índice 100(1 - alpha) % de intervalo de confianza
por cada media.
grpstats (a, group, whichstats)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
35
ANALISIS ESTADISTICO EN MATLAB
-
En este caso whichstats corresponde a otros estadísticos
que podemos calcular dentro de los siguientes:
'mean'
Promedio
'sem'
Error estándar
'numel'
Cuenta, del número de elementos.
'gname'
Nombre del grupo
'std'
Desviación Estándar
'var'
Varianza
'meanci'
Intervalo de confianza al 95%
'predci'
Intervalo de predicción a un 95% para una nueva observación
bootstr ()
Descripción
Permite
efectuar
características.
el
Bootstrap
con
determinadas
Nota
El Bootstrap es una metodología estadística que a tenido gran aplicación en los últimos años, y
consiste en obtener nuevas muestras con características similares a una primera muestra real (raíz),
y partir de los estadísticos de todas las muestras generadas establecer conclusiones mas precisas.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
36
ANALISIS ESTADISTICO EN MATLAB
bootstr (nboot, fboot,d1,d2,…)
Sintaxis
-
Ejemplo
nboot, es el numero de muestras que queremos
generar.
fboot, es la función que se quiere aplicar a las
muestras.
d1, d2, …. , son las muestras raíz.
X = [1:5] %Muestra raíz
B1 = bootstr(3,‟size‟,a)
B1 = [
5
1
5
1
5
1
]
B2 = bootstr(3,‟mean‟,a)
B2 = [
2.6000
2.2000
3.8000
]
6. GRÁFICAS EN TOOLBOX ESTADÍSTICO
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
37
ANALISIS ESTADISTICO EN MATLAB
Introducción
El Toolbox estadístico de MATLAB, proporciona grandes facilidades en lo
relacionado con gráficas, situación que permite automatizar y agilizar el
manejo y procesamiento de las mismas. Para ello dispone de una serie
de funciones que permiten modificar dentro de la figura los parámetros
que afectan el resultado de la misma. En el presente informe se
pretende dar a conocer algunas de estas ventajas con una ayuda que
permita una fácil utilización las funciones predefinidas para el programa.
Las gráficas estadísticas en las que basaremos el presente trabajo serán
algunas en las cuales se manejen las funciones de distribución básicas,
de tal manera que se adecue a las necesidades de los estudiantes de la
facultad de ciencias económicas, dando principal énfasis en funciones de
distribución como la T, Chi-cuadrado, F, Binomial, Poisson, entre otras.
Principales Funciones Utilizadas En Matlab Para Gráficas
Existen una serie de criterios generales para seleccionar gráficas de tipo
estadístico, criterios que corresponden a las posibilidades y
características que poseen las gráficas en el TOOLOBOX ESTADISTICO.
Algunas de las características de mayor importancia se encuentran
relacionadas con el entendimiento de las gráficas, como bien es
expresado en la siguiente frase “toda grafica debe explicarse por si
misma, por tanto debe llevar un titulo claro, la fuente de donde fueron
obtenidos los datos, rangos de escalas y leyendas o notas
explicatorios”1. Las gráficas en matlab permiten la posibilidad de
adecuarlas de tal forma que sean completamente entendibles para los
usuarios, por medio de las diferentes posibilidades existentes para
insertar en las graficas.
En el menú insertar, Matlab permite la posibilidad de agregar a la
gráfica etiquetas de diferentes tipos, de igual forma es posible colocar al
interior de la misma formas y cuadros, estas opciones proporcionadas
por el programa permiten responder a las características básicas para
graficas, y además colocar algunos elementos adicionales que dan un
toque personal y mejor entendimiento de las mismas.
1
Ciro Martínez Bencardino, ESTADISTICA
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
38
ANALISIS ESTADISTICO EN MATLAB
Para conocer algunas de las posibilidades de las gráficas en el Toolbox,
presentaremos algunas de las funciones relacionadas con graficas de
tipo estadístico en el programa. Las siguientes son las funciones básicas
de mayor importancia, relacionadas con los estudios de tipo estadístico:
RANDTOOL
Esta función permite generar de forma interactiva números al azar
mostrando los resultados gráficos por medio de un histograma. Instala
un interfaz gráfico que permite indagar los efectos al realizar cambios
en los parámetros que afectan la función que se desee graficar.
Algunas características de la interfaz (VER FIGURA 1)
La interfaz que se abre con la función, permite fijar valores de
parámetro para la distribución y para cambiar sus límites superiores e
inferiores en la generación de datos aleatorios.
Permite dibujar otra muestra con la misma distribución, con el mismo
tamaño y los parámetros, al igual que generar la grafica de otro tipo de
distribución con los parámetros seleccionados en primera instancia.
Permite exportar la muestra actual al workspace, para ello proporciona
la opción exportar la cual permite ver los datos aleatorios que generaron
la grafica y en general trabajar con estos como si hubiesen sido creados
en el command window.
Trae una barra de menús completa que permite realizar modificaciones
a las características de la grafica, compuesta por bastantes opciones
que permitirán adecuar la grafica a nuestros requerimientos y de igual
forma obtener todo tipo de información relacionado con la grafica
generada con datos aleatorios.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
39
Barra de menús
ANALISIS ESTADISTICO EN MATLAB
TAMAÑO DE LA
MUESTRA
FUNCIONES
DISTRIBUCION
DE
Limite superior e
inferior de los
datos
generados.
Valor
parámetro
del
Exportar datos al
workspace
FIGURA 1
DISTTOOL
Esta función permite generar de forma interactiva
diagramas de
diferentes distribuciones de probabilidad. La interfaz generada por esta
función permite escoger entre dos tipos de diagramas, el de cdf
(genera una función distribución acumulativa elegida) o el de pdf
(Función de densidad de probabilidad para una distribución especificada)
y al igual que la función presentada con anterioridad permite realizar
modificaciones a los parámetros relacionados con las características de
la misma interfaz generada.
Algunas características de la interfaz (VER FIGURA 2)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
40
ANALISIS ESTADISTICO EN MATLAB
 La interfaz que se abre con la función, permite fijar valores de
parámetro para la distribución y para cambiar sus límites superiores
e inferiores en la generación de datos aleatorios.
 En la interfaz se tiene la posibilidad de conocer los valores de X
correspondientes a un nivel de probabilidad, o viceversa. Estos
valores pueden ser modificados de acuerdo a nuestras necesidades y
varían automáticamente en la interfaz generada con esta función.
 Permite la posibilidad de generar un sin numero de gráficos, teniendo
en cuenta los 20 tipos de distribución existentes, y las dos
posibilidades de funciones que se pueden generar para cada tipo de
distribución.
TIPO
DE
FUNCION
FUNCIONES
DISTRIBUCION
DE
FUNCION
CDF O PDF
VALOR
DE
LA FUNCION
VALOR DE X
Limite superior
e inferior de los
datos
generados.
Valor del parámetro
FIGURA 2
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
41
TIPO
ANALISIS ESTADISTICO EN MATLAB
Lsline
Descripción
Esta función genera la línea de ajuste de los mínimos
cuadrados de una función predeterminada.
Sintaxis
lsline
x = lsline
Ejemplo
Se puede generar un vector x con cualquier tipo de
características (en este caso un vector que contiene 20
datos aleatorios con distribución normal), en este caso
utilizamos la función randn;
X = randn (20,1)
Graficamos la función y pedimos que nos señale los
valores al interior de la gráfica.
plot (X,‟+‟)
Por último utilizamos la función lsline para que nos
genere la línea de tendencia de los valores graficados.
lsline (ver FIGURA 3).
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
42
ANALISIS ESTADISTICO EN MATLAB
2
1.5
1
Línea de tendencia
0.5
Generada por la función
0
-0.5
-1
-1.5
-2
-2.5
0
2
4
6
8
10
12
14
16
18
20
FIGURA 3
Cdfplot
Descripción
Este comando permite ver la gráfica de una función de
distribución acumulativa empírica para datos en un
solo vector X. El cdf empírico se define como la
proporción de valores de X menor o igual a x. Este
diagrama, al igual que los generados por hist y
normplot, es útil para examinar la distribución de una
muestra de datos.
Sintaxis
cdfplot (X)
h = cdfplot(X)
[h, stats] = cdfplot(X)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
43
ANALISIS ESTADISTICO EN MATLAB
Ejemplo
En primer lugar generaremos un vector con media: 0,
desviación estándar: 1; con dimensiones m: 20 y n: 1.
Para
ello
utilizaremos
la
función
normrnd
estableciendo
los
parámetros
anteriormente
mencionados, así: x = normrnd (0,1,50,1);
Posteriormente utilizamos la función objetivo del
ejemplo de la siguiente forma: cdfplot (x) (VER
FIGURA 4)
Y por ultimo le pedimos que nos muestre el h y los
estadísticos básicos [h,stats] = cdfplot(X), así:
stats
values
min:
-1.7613
max:
2.7922
mean:
-0.1579
median:
-0.3096
std:
0.9138
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
44
ANALISIS ESTADISTICO EN MATLAB
Empirical CDF
1
0.9
0.8
0.7
F(x)
0.6
0.5
0.4
0.3
0.2
0.1
0
-2
-1.5
-1
-0.5
0
0.5
1
1.5
2
2.5
x
FIGURA 4
Boxplot
Descripción
Diagrama de caja de una muestra de los datos
Sintaxis
- Boxplot(X): produce un diagrama de caja y de “bigotes” para cada
columna de la matriz X. La caja tiene líneas en el cuartíl
superior, en el punto medio, y en el cuartíl inferior de la
caja.
Los “bigotes” son líneas que extienden de cada extremo de la caja
para mostrar la extensión de los datos que se encuentran fuera de los
limites de la caja. Los “mas” (+) son datos con valores más allá de los
extremos de los “bigotes”. Si no hay datos fuera de los “bigotes”, un
punto se coloca en el “bigote” inferior
-
-
boxplot (X,G): produce un diagrama de caja y bigotes para un vector
X, agrupado por G. G es un grupo de variables definidas
por un vector, una matriz o un conjunto de celdas
variables. G también puede ser un conjunto de variables
(tales como {G1 G2 G3} agrupando los valores en X por
cada combinación de grupo de variables.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
45
ANALISIS ESTADISTICO EN MATLAB
-
boxplot (...,'Param1', val1, 'Param2', val2,...): parámetros opcionales
específicos, tales como los descritos en el siguiente
cuadro:
Parameter
Name
Parameter Values
'notch'
'on' para incluir los cortes en la caja (por defecto es
'off')
'symbol'
Símbolo para usar fuera del limite del grafico (por
defecto es r+')
'orientation'
Orientación del diagrama 'vertical' (por defecto) o
'horizontal'
'whisker'
Máxima extensión de los “bigotes” en unidades de
rango de intercuartíl (por defecto 1.5)
'labels'
Etiquetas para la secuencia de columnas (se usa
solamente cuando X es una matriz, y la etiqueta
por defecto es el numero de la columna).
En un boxplot con cortes, dichos cortes representan un buen estimador
de la incertidumbre, en la comparación de las medianas de cada caja
graficada. Cuando los cortes no se traslapan indican que las medianas de
los dos grupos difieren con un 5 por ciento de nivel de significancia.
Ejemplo

Los siguientes comandos generan un diagrama de boxplot usando
una base de datos existente en el programa y que permite su
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
46
ANALISIS ESTADISTICO EN MATLAB
utilización para la explicación de varias funciones. Los siguientes
comandos crean un boxplot de la aceleración relacionada con el
año de fabricación de los carros.
load carsmall
boxplot (Acceleration, Model_Year)
Boxplot Acelaracion VS Modelo del carro
24
22
20
Values
18
16
14
12
10
8
70
76
82
En este ejemplo podemos ver un diagrama de caja para la aceleración
de los vehículos de acuerdo con el año de fabricación, y podemos
evaluar algunas de las características que evidencia la figura, tales como
la diferencia entre medianas y los datos que se encuentra fuera de los
límites del diagrama de caja.

Este ejemplo produce los diagramas de la caja para los datos de la
muestra, y acepta el defecto 1,5 * IQR para la longitud de las
barbas.
X1 = normrnd(6,1,60,1); % normrnd genera datos aleatorios con
distribución normal
X2 = normrnd(4,2,60,1);
x = [X1 X2];
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
47
ANALISIS ESTADISTICO EN MATLAB
boxplot(x, 1)
Boxplot para dos funciones con Dn normal
9
8
7
Values
6
5
4
3
2
1
0
1
2
Column Number
La diferencia entre los puntos medios de las dos columnas de x es
aproximadamente 1. Puesto que los cortes en el boxplot no se
traslapan, se puede concluir, con un nivel de significancia del 95%, que
las medianas de las dos muestras difieren.
Este diagrama tiene varios elementos gráficos:

Las líneas más bajas y superiores de la "caja" son el 25 y 75 por
ciento de la muestra. La distancia entre la tapa y fondo de la caja
es el rango de interquartile.

La línea en el centro de la caja es el punto medio de la muestra. Si
el punto medio no se centra en la caja, ésa es una indicación de la
oblicuidad.

Las " barbas" son líneas que extienden sobre y debajo de la caja.
Demuestran el grado del resto de la muestra (a menos que hay
afloramientos). No si se asume que ningún afloramiento, el
máximo de la muestra es la tapa de la barba superior. El mínimo
de la muestra es el fondo de la barba más baja. Por defecto, los
datos que se encuentran por fuera de los bigotes son más de 1,5
veces la gama interquartile que se encuentran fuera de los límites
de la caja.

El signo de más en la tapa del diagrama es una indicación de un
afloramiento en los datos. Este punto pudo ser el resultado de un
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
48
ANALISIS ESTADISTICO EN MATLAB
error de la entrada de datos, de una medida pobre, o de un
cambio en el sistema que generó datos de forma errónea.

Las cortes en la caja son un intervalo gráfico de la confianza sobre
el punto medio de una muestra. Los diagramas de la caja no
tienen cortes por defecto.
Qqplot
Descripción
Un diagrama del quantile-quantile es útil para determinarse
si dos muestras vienen de la misma distribución (si está
distribuido normalmente o no).
Sintaxis
-
qqplot(X) muestra una grafica de quantil-quantil para una
muestra de datos de X en relación a una distribución teórica
normal. Si la distribución de X es normal, la grafica será
lineal.
- qqplot(X, Y) muestra una grafica de quantil-quantil para
dos muestras de datos si las muestra vienen de la misma
distribución, la gráfica será lineal. Para una matriz X y Y,
qqplot muestra líneas separadas para cada pareja de
columnas, además la gráfica contiene la muestra de datos
mostrando los mismos por medio de signos (+).
- qqplot () este tipo de gráfico es usado para especificar los
cuartiles en el vector pvec.
Ejemplos
1.
El ejemplo demuestra un diagrama del quantile-quantile-quantile
de dos muestras de una distribución de Poisson.
x = poissrnd (15, 140,1); y = poissrnd (10, 80,1); qqplot(x, y););
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
49
ANALISIS ESTADISTICO EN MATLAB
QQPLOT para comparar dos dstribuciones Poisson
20
18
16
Y Quantiles
14
12
10
8
6
4
2
0
6
8
10
12
14
16
18
X Quantiles
20
22
24
26
Aunque los parámetros y los tamaños de muestra son diferentes, la
relación de línea recta demuestra que las dos muestras vienen de una
misma distribución.
2. El ejemplo debajo de demostraciones qué sucede cuando las
distribuciones subyacentes no son iguales.
x = normrnd(10,1,50,1); y = weibrnd(4,0.5,50,1); qqplot(x, y);
QQPLT Para distribuciones diferentes
0.8
0.7
0.6
Y Quantiles
0.5
0.4
0.3
0.2
0.1
0
-0.1
-0.2
7
7.5
8
8.5
9
9.5
10
X Quantiles
10.5
11
11.5
12
Estas muestras no son claramente de la misma distribución.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
50
ANALISIS ESTADISTICO EN MATLAB
Para determinar la validez de un procedimiento estadístico que dependa
de que las dos muestras vienen de la misma distribución (ej. ANOVA),
un diagrama linear del quantile-quantile-quantile debe ser suficiente.
Gname
Descripción
Etiqueta los puntos trazados con el respectivo nombre o
número, según el caso. Los datos que se ingresan para
utilizar a función deben ser datos que se encuentren
relacionados con un nombre específico, es decir que cada
punto al interior de la grafica corresponda a un nombre en
especial. Si se pulsa una vez un punto al interior de la gráfica,
automáticamente el grafico muestra el nombre al que
corresponde el punto seleccionado.
De forma alternativa si se desea conocer el nombre de
diferentes puntos se puede arrastrar el Mouse creando un
rectángulo que mostrara el nombre de cada uno de los puntos
que se encuentran al interior del mismo. Con el botón
derecho del Mouse se puede quitar la etiqueta colocada sobre
la gráfica. el gname sin discusiones etiqueta cada caja con su
número del caso. Se puede utilizar el gname para etiquetar
diagramas creados por funciones tales como plot, Scatter,
gscatter, plotmatrix, entre otras.
Sintaxis
gname() permite conocer la procedencia de los datos con solo
presionar el botón derecho del Mouse para gráficas realizadas
de
forma
previa.
h = gname(cases, line_handle)
Ejemplo
Este ejemplo utiliza información de ciudades estadounidenses
con el objetivo de revisar la relación entre gastos e ingresos,
y utilizando el comando gname para verificar a que ciudad
corresponde cada punto.
Load cities
gastos = ratings(:,1);
ingresos= ratings (:,4);
plot(Gastos, Ingresos,'+')
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
51
ANALISIS ESTADISTICO EN MATLAB
gname(names)
4
6
x 10
5
4
3
Los Angeles, Long Beach, CA
2
Philadelphia, PA-NJ
1
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
Para ver la procedencia de cualquier punto del grafico basta con dar clic
sobre alguno de ellos.
Refline
Descripción
Agregue una línea de referencia a la gráfica actual.
Sintaxis
refline(slope, intercept)
- agrega una línea de referencia con la
pendiente y a intercepción teniendo en
cuenta las condiciones actuales
refline(slope)
- agrega la línea de referencia al gráfico, y
utilizando únicamente la pendiente.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
52
ANALISIS ESTADISTICO EN MATLAB
h = refline(slope, intercept)
Ejemplo
Para este ejemplo creamos un vector Y, creando diferentes líneas de
referencia en la grafica de acuerdo a condiciones especificas.

Y = [1.2 5.2 1.9 4.5 4.0 3.2 3.9 1.9 2.6 2.4 2.8]';

plot (y,'+')

refline(1,3)

refline(0.5,3)

refline(2,3)

refline(0,2)
REFLINE
14
12
10
8
6
4
2
1
2
3
4
5
6
7
8
9
10
11
Gscatter
Diagrama de la dispersión del grupo
Sintaxis
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
53
ANALISIS ESTADISTICO EN MATLAB
gscatter(x,y,g)
gscatter(x,y,g,'clr','sym',siz)
gscatter(x,y,g,'clr','sym',siz,'doleg')
gscatter(x,y,g,'clr','sym',siz,'doleg','xnam','ynam')
h = gscatter(...)
Descripción
- gscatter(x, y, g)
Crea un diagrama de la dispersión de x y y, en el cual X y Y
son los vectores con el mismo tamaño y g es un grupo de
variables definidas por un vector, una matriz o un conjunto
de celdas variables. G también puede ser un conjunto de
variables (tales como {G1 G2 G3} agrupando los valores en
X por cada combinación de grupo de variables.
Los puntos con el mismo valor de g se colocan en el mismo
grupo, y aparecen en el gráfico con el mismo marcador y
color.
- gscatter(x, y, g, ' clr ', ' sym ', siz)
Esta función permite crear el diagrama de dispersión y
especificar el color, el tipo del marcador, y el tamaño para
cada grupo. ' clr ' es un conjunto de colores reconocidos por
la función plot.’sym ' son una serie de símbolos reconocidos
por el comando plot, con el símbolo por defecto de '.'. siz es
un vector de tamaños, con el defecto determinado por '
defaultlinemarkersize ' característico. Si no se especifican las
características deseadas, gscatter establece los valores
necesarios para el entendimiento de la gráfica.
- gscatter(x, y, g, ' clr ', ' sym ', siz, ' doleg ') controla si la
leyenda es mostrada en el gráfico ('doleg' = 'on', por
defecto) o no ('doleg' = 'off').
- gscatter(x, y, g, ' clr ', ' sym ', siz, ' doleg ', 'xnam',
'ynam ') especifica el nombre para utilizar en las etiquetas
del eje X y el eje Y. Si las etiquetas par x y Y son omitidas,
por defecto se coloca en el gráfico el nombre de las
variables.
Ejemplo
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
54
ANALISIS ESTADISTICO EN MATLAB
El siguiente ejercicio consistirá en realizar un diagrama de
dispersión para dos grupos el de salud y el de condiciones
económicas agrupándolas por medio de la información de la
columna group. Para ello se deben ingresar los siguientes
comandos:
Load discrim % carga tablas con información predefinida que
se encuentra en el programa
scatter(ratings(:,3),ratings(:,9),group,'rk','.*')
DIAGRAMA DE DISPERSION
10000
1
2
CONDICION ECONOMICA
9000
8000
7000
6000
5000
4000
3000
0
1000
2000
3000
4000
SALUD
5000
6000
7000
8000
Hist
Descripción
Grafico de histograma
Sintaxis
- hist(y)
Grafica un histograma con diez barras para los valores
contenidos en el vector y. las barras están igualmente
espaciados entre el valor mínimo y máximo que toma la
variable.
- hist(y, nb)
Las letras nb representan el número de barras que
queremos sean colocados en el gráfico final.
- hist(y, x)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
55
ANALISIS ESTADISTICO EN MATLAB
Grafica un histograma usando el numero de barras que
contiene el vector x.
- [n,x] = hist(y...) no realiza el gráfico de histograma,
pero retorna los vectores n y x, que contienen la
frecuencia y la localización de las barras de tal forma
que bar(x,n) grafica el histograma.
Ejemplos
1. Con los siguientes comandos se genera un histograma
con diez divisiones.
y = normrnd(0,0.5,500,1)
genera datos aleatorios.
%la
función
normrnd
Hist (y)
HISTOGRAMA
150
100
50
0
-1.5
-1
-0.5
0
0.5
1
1.5
2
2. Los siguientes comandos generan un histograma, en el
cual se utiliza una variable x, para elegir el número de
barras contenidas en el gráfico y elegir los valores del eje x.
y= normrnd(0,1,1500,1);
x= -4.5:0.7:4.5;
hist(y,x)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
56
ANALISIS ESTADISTICO EN MATLAB
HISTOGRAMA 2
200
180
160
140
120
100
80
60
40
20
0
-5
-4
-3
-2
-1
0
1
2
3
4
5
Errorbar
Descripción
Sintaxis
Grafica las barras de error a lo largo de una curva.
- errorbar(X,Y,L,U,symbol)
Grafica X versus Y con un largo especifico de las barras de
errores determinado por L(i)+U(i) que representan los
puntos superiores e inferiores del gráfico. X, Y, L, y U deben
ser de la misma longitud. Si X, Y, L, y U son matrices, cada
columna produce una línea por separado. Las barras de
error están graficadas a distancia de U(i) en la parte
superior y L(i) en la parte inferior de los puntos en (X,Y). El
símbolo (symbol) es una forma de controlar el tipo de línea,
el símbolo del gráfico y el color de las barras de error.
- errorbar(X,Y,L)
Grafica X versus Y con barras de errores simétricas en
relación a Y
- errorbar(Y,L)
Grafica Y con barras de error [Y-L Y+L].
Nota
La función errorbar hace parte del lenguaje estándar de MATLAB
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
57
ANALISIS ESTADISTICO EN MATLAB
Ejemplo
Con los comandos siguientes genere los vectores necesarios
para realizar la grafica de errorbar.
X =[1 2 3;6 5 4 ; 9 8 7];
Y =[5 4 9; 5 4 8 ; 1 8 6];
U =[3 6 7; 7 9 1; 8 9 2];
L =[2 8 6;7 9 5; 3 4 6]
errorbar (X, Y, L, U,'s')
ERRORBAR
20
15
10
5
0
-5
0
1
2
3
4
5
6
7
8
9
10
Ecdfhist
Propósito
Crea el histograma de salida de una distribución ecdf
Sintaxis
- n = ecdfhist (f, x)
Toma un vector f, de valores una
distribución acumulativa (cdf) y un
evaluación de los puntos de la
devuelve un vector n que contiene
altos del histograma para 10 barras
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
58
función de
vector de
función, y
los puntos
igualmente
ANALISIS ESTADISTICO EN MATLAB
espaciadas. La función computa las barras de
mayor altura desde el incremento en la función
empírica (cdf), y las normaliza de tal forma que el
área del histograma sea igual a 1. A diferencia el
comando hist genera barras que representan la
frecuencia en la muestra.
- n = ecdfhist(f, x, m)
En este caso m es un número escalar y
representa el numero de barras que deseamos
aparezcan en el gráfico. n = ecdfhist(f, x, c)
- n = ecdfhist(f, x, c)
En este caso c es un vector, que permite centrar
las barras específicamente en c.
- [n, c] = ecdfhist(...)
Devuelve la posición de las barras centradas en c.
- ecdfhist(...)
Sin argumentos produce un histograma de barras
de los resultados.
Ejemplo
El código siguiente genera tiempos de error aleatorios y
tiempos censurados , comparando la empírica pdf con una
pdf que se conoce que es verdadera.
“y = exprnd(10,50,1); % random failure times
d = exprnd(20,50,1); % drop-out times
t = min(y,d);
% observe the minimum of these
times
censored = (y>d); % observe whether the subject
failed
% Calculate the empirical cdf and plot a histogram
from it
[f,x] = ecdf(t,'censoring',censored);
ecdfhist(f,x);
% Superimpose a plot of the known true pdf
hold on;
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
59
ANALISIS ESTADISTICO EN MATLAB
xx = 0:.1:max(t); yy = exp(-xx/10)/10; plot(xx,yy,'g');
hold off;”2
ECDFHIST
0.1
0.09
0.08
0.07
0.06
0.05
0.04
0.03
0.02
0.01
0
0
5
10
15
20
25
GPLOTMATRIX
Descripción
Matriz diagramas de dispersión por grupo.
Sintaxis
-gplotmatrix(x,y,g)
Esta función crea una matriz de gráficos de dispersión.
Cada conjunto de ejes en la figura del resultado
contiene un diagrama de dispersión de una columna de
x contra una de y. Todos los gráficos están agrupados
por la variable g.
X y Y son matrices con el mismo número de filas. Si x
tiene p columnas y q filas la figura contiene una matriz
p * q de diagramas de dispersión. G es una variable
para agrupar que puede ser vector, una matriz o un
conjunto de celdas variables. G debe tener la misma
cantidad de filas que X y Y.
2
Tomado de MATLAB \ ESTATISTICS Toolbox\ HELP \ ecdfhist
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
60
ANALISIS ESTADISTICO EN MATLAB
- gplotmatrix(x,y,g,'clr','sym',siz)
Permite especificar el color, el tipo del marcador, y el
tamaño para cada grupo. ' clr ' es un
conjunto de
colores reconocidos por la función plot.’sym ' son una
serie de símbolos reconocidos por el comando plot, con
el símbolo por defecto de '.'. siz es un vector de
tamaños, con el defecto determinado por '
defaultlinemarkersize ' característico. Si no se
especifican las características deseadas, gscatter
establece los valores necesarios para el entendimiento
de la gráfica.
- gplotmatrix(x,y,g,'clr','sym',siz,'doleg')
Permite controlar si una leyenda está exhibida en el
gráfico (' doleg '=' on 'el defecto) o no (' doleg '=' off ')
-gplotmatrix(x,y,g,'clr' 'sym',siz,'doleg','dispopt')
Controla que aparezca alo largo de la diagonal del
gráfico de la matriz de x versus x permitiendo a los
valores nulos salir en la diagonal en blanco, 'hist'(por
defecto) en la gráfica de histogramas, o 'variable' para
graficar los nombres de las variables.
- gplotmatrix(x,y,g,'clr','sym',siz,...
'doleg','dispopt','xnam','ynam')
Especifica los nombres en las columnas en X y Y. Estos
nombres son usados para etiquetar los ejes. 'xnam' y
'ynam ' deben ser celdas contenidas por caracteres,
con una fila para cada columna de X y Y,
respectivamente.
Ejemplo
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
61
ANALISIS ESTADISTICO EN MATLAB
Con los comandos siguientes es posible realizar diagramas
de dispersión de las diferentes categorías que aparecen al
cargar los datos que aparecen en discrim. Los datos se
pueden agrupar por el código del tamaño de la ciudad.
load discrim
gplotmatrix(ratings(:, 2:5), ratings(:, 6:), group) %
en este caso lo que hacemos es seleccionar los datos
que deseemos sean graficados de acuerdo a la
información contenida en la matriz ratings.
transportation
8000
education
gplotmatrix(ratings(:,2:4),ratings(:,5:8),group,
'rk','.*'
,
[]
,
'on'
,
'',categories(2:4,:)
,categories(5:8,:))
%para
mayor
entendimiento
Colocamos en el gráfico marcadores, colores y lo
necesario para dar mas comprensibilidad
3500
3000
2500
2000 x 104
1
2
6000
arts
4000
2000
4
2
recreation
0
4000
2000
0.5
1
1.5
housing
2
0
4
x 10
2000 4000 6000 8000500 10001500 20002500
health
crime
El gráfico generado por esta función genera la posibilidad de combinar
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
62
ANALISIS ESTADISTICO EN MATLAB
diferentes análisis en un solo gráfico, lo que puede ahorrar tiempo y dar
mayor orden las diferentes gráficas de dispersión que muestra.
7. PROBABILIDAD
Distribuciones De Probabilidad Discretas
7.1.1.
Distribución Binomial
Recordemos como la distribución binomial responde a una muestra de n
eventos independientes, en los cuales solo es posible obtener dos
resultados.
Para este caso la función de densidad de probabilidad es:
 n  x 1 x 
y  f x n, p     p q , x  0,1, ,...n
x
Donde: x = [0 n] ,
p = [0 1] , q = 1- p
y
n!
n
 
 x  x!n  x !
.
Binofit ()
Descripción
Estimación del parámetro (x) o intervalos de confianza
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
63
ANALISIS ESTADISTICO EN MATLAB
para datos de tipo binomial. (Solo dos posibilidades)
Sintaxis
p = binofit (a, n)
-
Devuelve la máxima probabilidad estimada para a
suceso en n oportunidades.
a es una vector, entonces se devuelve un p(i) por
cada a(i).
Cuando n también es un vector de la misma
dimensión que a se calcula un p(i) para cada a(i)
según n(i).
[p, nc] = binofit (a, n, alpha)
-
Ejemplo
Devuelve la máxima probabilidad estimada para a
suceso en n oportunidades a un nivel de confianza
de 100(1-alpha)%.
Por defecto el nivel de confianza es 95%, por
ejemplo si queremos un nivel de confianza de
90% el valor de alpha debe ser 0.1.
p = binofit (2,5)
%Probabilidad de 2/5
p = 0.4000
a = [2 4 6 8]
%Probabilidad de a/8
p1 = binofit (a, 8)
p1 = [0.2500
0.5000
a = [2 4 6 8]
0.7500
1.0000]
%Probabilidad de a/n
n = [4 8 12 16]
p1 = binofit (a, n)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
64
ANALISIS ESTADISTICO EN MATLAB
p1 = [0.5000
0.5000
0.5000
0.5000]
Binocdf ()
Descripción
Función binomial de distribución acumulada.
n
y  F x n, p      p i q 1i  , i  0,1, ,...n
i 0  x 
x
Sintaxis
p = binocdf (x, n, p)
-
Ejemplo
Devuelve el valor de la función binomial de
distribución acumulada para estos parámetros.
x, n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales.
p = binocdf (3, 4 ,0.6)
p = 0.8704
Binopdf ()
Descripción
Función binomial de densidad de probabilidad.
n
y  f x n, p     p x q 1 x  , x  0,1, ,...n
 x
Sintaxis
p = binopdf (x, n, p)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
65
ANALISIS ESTADISTICO EN MATLAB
-
Ejemplo
Devuelve el valor de la función binomial de
densidad de probabilidad para estos parámetros.
x, n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales.
p = binopdf (3, 4 ,0.6)
p = 0.3456
Binoinv ()
Descripción
Función binomial de densidad de probabilidad inversa.
(Es la inversa de binocdf)
Sintaxis
x = binoinv (y, n, p)
-
Ejemplo
Devuelve el valor de la función binomial inversa
para estos parámetros.
y, n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales.
p = binopdf (2, 4 ,0.6)
p = 0.3456
x = binoinv (0.3456, 4 ,0.6)
x=2
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
66
ANALISIS ESTADISTICO EN MATLAB
Si la probabilidad de lanzar una moneda y obtener cara
frente a obtener sello es de 50-50, ¿Cual seria un rango
razonable de éxitos (cara) en 120 intentos?
Rango = [0.05 0.95]
Intentos = 120
P_Exito = 0.5
%Probabilidad exito
exitos = binoinv(Rango, Intentos, P_Exito)
exitos = [
51
69 ]
Binornd ()
Descripción
Genera una seria de números aleatorios a partir de una
función binomial y unos parámetros definidos.
Sintaxis
x = binornd (n, p)
-
Ejemplo
n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales
n = [10 20 30]
x = binornd (n ,0.6)
x = [ 8 8 17 ]
%Primera serie obtenida
x = [ 6 11 16
]
%Segunda serie obtenida
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
67
ANALISIS ESTADISTICO EN MATLAB
Binostat ()
Descripción
Sintaxis
Calcula la media y la varianza para una seria con
distribución binomial.
[m , v] = binostat (n, p)
-
Ejemplo
n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales
[m , v] = binostat (4 , 0.6)
m = 2.4000
v = 0.9600
%Media
%Varianza
Nota
Para una distribución binomial:
7.1.2.
- La media es:
med = np
- La varianza es:
var = npq , q=1–p
Distribución Poisson
La distribución Poisson es adecuada para eventos que involucren una
cantidad determinada de casos en un tiempo, distancia o área
determinada, solo es necesario un parámetro  que sea entero nonegativo, y el cual se considera como la media.
Para este caso la función de densidad de probabilidad es:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
68
ANALISIS ESTADISTICO EN MATLAB
y  f x   
x
x!
e  , x  0,1,...
poissfit ()
Descripción
Estimación del parámetro (x) o intervalos de confianza
para datos que se acomoden a las condiciones de una
Poisson.
1 n
̂   xi
n i1
Sintaxis
[lambda, linter] = poissfit (x, alpha)
Genera el parámetro lambda ( ̂ ) a partir de la
muestra x.
linter, muestra un intervalo con 100(1 - alpha)%
de confianza, sino se especifica este parámetro el
intervalo por defecto es de 95%.
-
Ejemplo
c = magic(3)
c=[8
1
6
3
5
7
4
9
2 ]
[d , intervalo ] = poissfit(c)
%Parámetro e intervalo al 90%
d=[5
5
5]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
69
ANALISIS ESTADISTICO EN MATLAB
intervalo = [ 2.7985
8.2467
2.7985
2.7985
8.2467
8.2467 ]
a = [1:10 ; 2:2:20]
a = [1
2
4
2
6
3
8
4
10
5
6
12 14
7
16
8
9
18
10
20 ]
b = poissfit (a)
b = [1.5 3.0 4.5 6.0 7.5 9.0 10.5 12.0 13.5 15.0]
Poisscdf ()
Descripción
Función de distribución poisson acumulada.
p  F x    e
Sintaxis

floor( x )
i
i 0
i!

p = poisscdf (x, lambda)
-
Calcula el valor de la sumatoria de los valores
Poisson para los respectivos parámetros, donde x
puede ser un vector o una matriz, sin embargo
lambda debe ser positivo.
Ejemplo
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
70
ANALISIS ESTADISTICO EN MATLAB
● Supongamos que en cierta área el número X de tornados observados
durante un año, tiene una distribución de Poisson con ̂ = 8, entonces
cual es la probabilidad de obtener:
a. A lo mucho 5 tornados?
P(X≤5) entonces a = poisscdf(5 , 8) = 0.1912
b. Entre 6 y 9 tornados?
P(6≤X≤9) entonces b
= poisscdf(9 ,8)- poisscdf(6 ,8)
= 0.7166 - 0.3134
= 0.4032
Poisspdf ()
Descripción
Función Poisson de densidad de probabilidad.
y  f x   
Sintaxis
x
x!
e  , x  0,1,...
p = poisspdf (x, lambda)
-
Calcula el valor de densidad Poisson para un
punto respectivo, donde x puede ser un vector o
una matriz, sin embargo lambda debe ser
positivo.
Ejemplo
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
71
ANALISIS ESTADISTICO EN MATLAB
Supongamos que en cierta área el número X de
tornados observados durante un año, tiene una
distribución de Poisson con ̂ = 8, entonces cual es la
probabilidad de obtener:
a. exactamente 5 tornados ?
P(X=5) entonces a = poisspdf (5 , 8) = 0.0916
Poissinv ()
Descripción
Función Poisson de densidad de probabilidad inversa.
(Es la inversa de poisscdf)
Sintaxis
x = poissinv (p, lambda)
-
Devuelve el valor de la función Poisson inversa
mas aproximado para estos parámetros.
p, y lambda, pueden ser un vector o una matriz,
sin embargo deben tener las dimensiones iguales.
Ejemplo
Supongamos que en cierta área el número X de tornados
observados durante un año, tiene una distribución de
Poisson con ̂ = 8; La afirmación de es falsa o verdadera :
a. La probabilidad de obtener a lo mas 5 tornados es
0.1912.
P(X≤5) = 0.1912 ?
X = poissinv (0.1912 , 8) = 5
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
72
ANALISIS ESTADISTICO EN MATLAB
Entonces la afirmación es verdadera.
b. La probabilidad de obtener a lo mas 9 tornados es 0.812.
P(X≤9) = 0.812 ?
X = poissinv (0.812 , 8) = 10
La afirmación es falsa, porque la probabilidad de 0.812 es
de
esperar 10 tornados
Poissrnd ()
Descripción
Genera una seria de números aleatorios a partir de una
función Poisson y unos parámetros definidos.
Sintaxis
x = poissrnd (lambda, n, p)
-
Ejemplo
Genera X con media aproximada a lambda, puede
ser un vector o una matriz según las dimensiones
del parámetro.
n y p, Serán las dimensiones de x.
x = poissrnd (5 , 6 ,1)
x = [2
7
8
3
5
4]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
73
ANALISIS ESTADISTICO EN MATLAB
Media = mean (x)
Media = 4.8333
Poisstat ()
Descripción
Sintaxis
Calcula la media y la varianza para una seria con
distribución Poisson.
[m , v] = poisstat (lambda)
-
Ejemplo
n y p, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales
[m , v] = binostat (8)
m = 8.0000
v = 8.0000
%Media
%Varianza
Nota
Para una distribución Poisson:
7.1.3.
La
- La media es:
med = ̂
- La varianza es:
var = ̂
Distribución Hipergeometrica
distribución
hipergeométrica
es
adecuada
para
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
74
determinar
ANALISIS ESTADISTICO EN MATLAB
probabilidad de que ocurra en un evento en las siguientes condiciones:
la cantidad total de la población (M) y de la cual escogemos una
muestra determinada (n) de donde se conoce un numero determinado
de fracasos y exitos.
Para este caso la función de densidad de probabilidad es:
 K  M  K 
 

x  n  x 

y  f x M , K , n  
M 
 
n
hygecdf ()
Descripción
Función de distribución hipergeométrica acumulada.
y  f x M , K , n   
x
i 0
Sintaxis
 K  M  K 
 

 i  n  i 
M 
 
n
h = hygecdf (x,M,n,K)
-
Calcula el valor de la sumatoria de los valores
para la distribución hipergeométrica para los
respectivos parámetros, donde x,M,n,k pueden
ser un vector o una matriz.
Ejemplo
Se tienen 100 microchips, y se sabe que 20 de estos están
dañados. ¿Cuál es la probabilidad de sacar entre 0 y 3
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
75
ANALISIS ESTADISTICO EN MATLAB
microchips dañados de una
microchips que escogemos?
muestra
aleatoria
de
10
p = hygecdf(3,100,20,10)
p = 0.8904
Hygepdf ()
Descripción
Función hipergeométrica de densidad de probabilidad.
 K  M  K 
 

x  n  x 

y  f x M , K , n  
M 
 
n
Sintaxis
p = hygepdf (x,M,n,K)
-
Calcula el valor para la distribución
hipergeométrica para los respectivos parámetros,
donde x,M,n,k pueden ser un vector o una matriz.
Donde M,n,k deben ser enteros positivos.
Ejemplo
Se tienen 100 microchips, y se sabe que 20 de estos están
dañados. ¿Cuál es la probabilidad de sacar entre 0 y 5
microchips respectivamente dañados de una muestra
aleatoria de 10 microchips que escogemos?
p2 = hygepdf(0:3,100,20,10)
p2 = [
0.0951
0.2679
0.3182
0.2092 ]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
76
ANALISIS ESTADISTICO EN MATLAB
suma = sum(p2)
suma =
0.8904
% Como se ve la suma de las probabilidades individuales
corresponde a la probabilidad acumulad calculada en el
ejemplo anterior (p = 0.8904)
Hygeinv ()
Descripción
Función Hipergeométrica de densidad
inversa.
(Es la inversa de hygecdf)
Sintaxis
X = hygeinv (P,M,K,N)
de
probabilidad
- Devuelve el valor de la función Hipergeométrica
inversa mas aproximado para estos parámetros.
- p puede ser observada como la probabilidad al
evaluar la función hipergeométrica con los
parámetros x, m, k, n.
Ejemplo
Se tienen 100 microchips, y se sabe que 20 de estos están
dañados. Obtengo una muestra aleatoria de 10 microchips
de los cuales se desea saber ¿cual es el número máximo de
microchips dañados cuando se aceptan el 90% de error?
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
77
ANALISIS ESTADISTICO EN MATLAB
y = hygeinv(0.9,100,20,10)
y=4
Si embargo si retomamos el primer ejemplo de esta sección
obtendremos que:
p = hygecdf(3,100,20,10)
p = 0.8904
x = hygeinv(p,100,20,10) = hygeinv(0.8904,100,20,10)
x=3
Hygernd ()
Descripción
Genera una seria de números aleatorios a partir de una
función hipergeométrica y unos parámetros definidos.
Sintaxis
x = hygernd (M,K,N, f,c)
-
-
Genera valores que se aproximen a una
distribución hipergeométrica con parámetros M, K
y N, pueden ser un vector o una matriz sin
embargo de las misma dimensiones.
Los parámetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.
x = hygernd (M,K,N,v)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
78
ANALISIS ESTADISTICO EN MATLAB
-
Ejemplo
Genera valores aleatorios en una matriz con
dimensiones v x v.
x = hygernd(1000,40,50)
x=2
x = hygernd(1000,40,50,2,3)
X=[3
4
2
2
2
3]
hygestat ()
Descripción
Sintaxis
Calcula la media y la varianza para una seria con
distribución Hipergeometrica.
[m , v] = hygestat (M,K,N)
-
Ejemplo
M, K y N, pueden ser un vector o una matriz, sin
embargo deben tener las dimensiones iguales, y
determinan los parámetros de la distribución que
se usa.
[m , v] = hygestat (8)
[m,v] = hygestat(10,1,9)
m = [ 0.9000 ]
%Media
v = [ 0.0900 ]
%Varianza
[m,v] = hygestat(10,3,9)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
79
ANALISIS ESTADISTICO EN MATLAB
m = [ 2.7000 ]
%Media
v = [ 0.2100 ]
%Varianza
Nota
Para una distribución Hipergeometrica: - La media es:
med =
NK
M
 K  M  K  M  N 
var = N  


 M  M  M  1 
- La varianza es:
Distribuciones De Probabilidad Continuas
7.1.4.
Distribución Normal
La distribución Gaussiana o comúnmente conocida como Normal por que
la mayoría de las variables continúas se ajustan a este tipo de
distribución, esta en función de dos parámetros: la media y la
desviación estándar.

X ~ N  , 2

La función de densidad de probabilidad para la normal es:
y  f x  ,   
1
e
 2
  x   2
2 2
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
80
ANALISIS ESTADISTICO EN MATLAB
La distribución normal estándar tiene una media
(  0) y la desviación estándar. (  1)
normcdf ()
Descripción
Función de distribución normal acumulada.
 t   2
1
y  f x  ,   
 2
Sintaxis
x
e
2 2
dt

p = normcdf (x,mu,sigma)
-
Calcula el valor de la integral para la distribución
normal con los respectivos parámetros, donde
x,mu,sigma pueden ser un vector o una matriz.
sigma debe ser positivo.
[p, plo, pup] = normcdf (x,mu,sigma,pcov, alpha)
-
-
Calcula el valor de un intervalo de confianza con
los parámetros estimados, donde pcov es la
covarianza estimada, y alpha especifica la
confianza 100(1-alpha)%.
Plo (PLow) Especifica el limite inferior.
Pup (PUp) Especifica el limite superior.
Ejemplo
La función normcdf puede ser usada de la misma
manera que una tabla de distribución normal estándar
en la cual especificamos la media y la desviación
estándar como:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
81
ANALISIS ESTADISTICO EN MATLAB
 0
y
  1.
mu = 0; sigma=1;
X = normcdf(0, mu, sigma)
X = 0.5000
Y = normcdf(-1, mu, sigma)
Y = 0.1587
Z = normcdf(1, mu, sigma)
Z = 0.8413
Podemos generar una completa tabla de la distribución
normal estándar usando el siguiente código:
mu = 0; sigma=1;z=(-3:0.1:3);
X = normcdf(z, mu, sigma);
Tabla = [z ; X]
Normpdf ()
Descripción
Función normal de densidad de probabilidad.
y  f x  ,   
Sintaxis
1
e
 2
  x   2
2 2
p = normpdf (x,mu,sigma)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
82
ANALISIS ESTADISTICO EN MATLAB
-
Calcula el valor de la función para la distribución
normal con los respectivos parámetros, donde
x,mu,sigma pueden ser un vector o una matriz.
sigma debe ser positivo.
Ejemplo
a = [-3:0.01:3];
p = normpdf(a,0,1);
% Función para una normal estándar
plot(a ,p)
% Grafica la probabilidad para cada
punto de la función normal estándar
0.4
0.35
0.3
0.25
0.2
0.15
0.1
0.05
0
-3
-2
-1
0
1
2
3
norminv ()
Descripción
Función Normal de densidad de probabilidad inversa. (Es
inversa de normcdf)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
83
la
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
X = norminv(P, mu, sigma)
- Devuelve el valor de la función Normal inversa mas
aproximado para estos parámetros.
- P es interpretada como la probabilidad al evaluar
la función normal con los parámetros mu y sigma
(debe ser positivo).
- Como P es una probabilidad debe estar dentro del
intervalo [0 1].
Ejemplo
Encuentre un intervalo que contenga el 95% de los valores
de una distribución normal estándar.
x = norminv([0.025 0.975],0,1)
% Intervalo para 95%
x=[
% Mas Compacto y
simétrico.
-1.9600
1.9600 ]
Nótese que el intervalo anterior no es el único que contiene
el 95% de los elementos de una distribución de este tipo,
por ejemplo:
xx = norminv([0.01 0.96],0,1)
xx = [
-2.3263
% Intervalo para 95%
1.7507 ]
Este intervalo también contiene el 95% de los datos de una
distribución normal estándar sin embargo no es tan
compacto.
A partir de la información anterior, los intervalos para 90% y
99% serian:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
84
ANALISIS ESTADISTICO EN MATLAB
X1 = norminv([0.05 0.95],0,1)
X1 = [ -1.6449
1.6449 ]
X2 = norminv([0.005 0.995],0,1)
X2 = [ -2.5758
% Intervalo para 90%
% Intervalo para 99%
2.5758 ]
Normrnd ()
Descripción
Genera una seria de números aleatorios a partir de una
función normal y unos parámetros definidos.
Sintaxis
x = normrnd (mu, sigma , f, c)
-
-
Genera valores que se aproximen a una
distribución normal con parámetros mu y sigma,
pueden ser un vector o una matriz sin embargo
de las misma dimensiones.
Los parámetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.
x = normrnd (mu, sigma,v)
-
Ejemplo
Genera valores aleatorios en una matriz con
dimensiones v x v.
x = normrnd(0,1,3)
% Con una distribución normal estándar
x = [ 0.1326
-1.5804
-1.0246
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
85
ANALISIS ESTADISTICO EN MATLAB
1.5929
-0.0787
1.0184
-0.6817
-1.2344
0.2888 ]
x = normrnd(0,1,2,5)
% Con una distribución normal estándar
x = [ 1.0378
-0.3898
-1.3813
0.3155
1.5532
0.7079
1.9574
0.5045
1.8645
-0.3398 ]
x = normrnd(5,0.5,1,5)
% Con una distribución normal de media igual a 5 y
desviación estándar igual a 0.5
x = [ 4.7535
5.2310
4.8395
5.6183
4.6844 ]
Normstat ()
Descripción
Sintaxis
Calcula la media y la varianza para una seria con
distribución Normal.
[m , v] = normstat (mu, sigma)
-
Mu y sigma, pueden ser un vector o una matriz,
sin embargo deben tener las dimensiones iguales,
y determinan los parámetro de la distribución que
se usa.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
86
ANALISIS ESTADISTICO EN MATLAB
[m , v] = normstat (0,1)
Ejemplo
m=[0]
v=[1]
n = 1:3
m= [ 1 2 ; 3 4]
n = [1 2 3]
m=[1
2
3
4 ]
[m,v] = normstat(n , n)
m= [1
v= [1
2
4
3 ]
[m,v] = normstat(m, m)
9 ]
m=[1
2
3
v=[1
9
4]
4
16 ]
Nota
Para una distribución Normal:
- La media es:
med = 
- La varianza es:
var =  2
Normfit ()
Descripción
Devuelve una estimación de los parámetros e intervalos de
confianza para una muestra con distribución normal.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
87
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
[mu , sigma] = normfit (muestra)
-
Retorna la estimación de la media (  ) y la
desviación estándar (  ) para muestra, la cual
puede es una matriz.
[mu,sigma,muint,sigmaint] = normfit(muestra, alpha)
-
-
-
Retorna la estimación de la media (  ) y la
desviación estándar (  ) para muestra, la cual
puede es una matriz. Además de generar
intervalos a un nivel de confianza alpha para cada
parámetro.
muint y sigmaint, son matrices en las cuales la
primera fila corresponde al intervalo del limite
inferior y la segunda fila corresponde a un
intervalo para el limite superior de la estimación
del parámetro respectivo.
Si no se incluye el argumento alpha en la función
se toma el nivel alpha por defecto que es 0.05, es
decir un nivel de confianza de 95%. Pero si lo
incluimos alpha, el nivel de confianza será 100(1 alpha) %.
Ejemplo
En este ejemplo tenemos una muestra aleatoria con 10
elementos, con media (µ)= 15 y desviación estándar (  )
= 2.
muestra = normrnd(15,2,10,1)
muestra =
15.9710
14.9900
14.4476
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
88
ANALISIS ESTADISTICO EN MATLAB
17.5529
18.7268
13.9549
15.2068
13.3847
16.3609
10.2708
[mu,sigma,muint,sigmaint] = normfit(muestra)
mu =
15.0866
sigma =
2.3462
muint =
13.4083
16.7650
sigmaint = 1.6138
4.2832
En este caso los valores mu y sigma corresponden a la
media y la desviación estándar de la muestra, sin embargo
nótese que los valores reales se encuentran dentro de los
intervalo respectivos.
Normplot()
Descripción
Genera un grafico de distribución normal para una prueba
grafica.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
89
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
normplot (muestra)
-
-
Devuelve el grafico de la muestra ubicando cada
elemento como „+‟, junto con una línea que
representa el primer y el tercer cuartil, útil para
identificar la linealidad de la muestra.
Entre mas normal se comporte la muestra mas
lineal debe ser, sobreponiéndose sobre la línea de
referencia.
Ejemplo
muestra = normrnd(0,1,10,2)
muestra =
0.8115
-0.6547
0.6363
-1.0807
1.3101
-0.0477
0.3271
0.3793
-0.6730
-0.3304
-0.1493
-0.4999
-2.4490
-0.0360
0.4733
-0.1748
0.1169
-0.9573
-0.5911
1.2925
normplot(muestra)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
90
ANALISIS ESTADISTICO EN MATLAB
Normal Probability Plot
0.95
0.90
Probability
0.75
0.50
0.25
0.10
0.05
-2.5
-2
-1.5
-1
-0.5
Data
0
0.5
1
x = normrnd(0,1,50,1);
Normal Probability Plot
0.99
0.98
0.95
0.90
Probability
0.75
0.50
0.25
0.10
0.05
0.02
0.01
-2
-1.5
-1
-0.5
0
0.5
1
1.5
Data
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
91
2
ANALISIS ESTADISTICO EN MATLAB
normspec()
Descripción
Sintaxis
Genera un grafico de densidad para una distribución normal.
p = normspec (limites, mu, sigma)
-
-
Devuelve el grafico junto con la probabilidad p,
correspondiente al área de interés, es decir, la
ubicada dentro de los limites definidos en el
vector que lleva el mismo nombre.
Dentro del vector limites al menos uno de los
valores debe ser real, no se acepta que el
intervalo vaya desde infinito a infinito.
Error: limites = [-Inf Inf]
-
Mu y sigma, corresponden a los parámetros
propios de cada muestra.
Ejemplo
Tenemos una distribución normal estándar,
deseamos saber cuanta probabilidad existe:
a. antes de 0.5
a = normspec([-Inf 0.5],0,1)
a = 0.6915
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
92
y
ANALISIS ESTADISTICO EN MATLAB
Probability Less than Upper Bound is 0.69146
0.4
0.35
0.3
Density
0.25
0.2
0.15
0.1
0.05
0
-4
-3
-2
-1
0
Critical Value
1
2
3
4
3
4
a. después de - 0.3
b = normspec([-0.3 Inf],0,1)
b= 0.6179
Probability Greater than Lower Bound is 0.61791
0.4
0.35
0.3
Density
0.25
0.2
0.15
0.1
0.05
0
-4
-3
-2
-1
0
Critical Value
1
2
b. entre - 0.3 y 0.5
c = normspec([-0.3 0.5],0,1)
c = 0.3094
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
93
ANALISIS ESTADISTICO EN MATLAB
Probability Between Limits is 0.30937
0.4
0.35
0.3
Density
0.25
0.2
0.15
0.1
0.05
0
-4
-3
-2
-1
0
Critical Value
1
2
3
4
Suponga que un productor de cereal desea saber: ¿ cual es
el porcentaje de cajas de cereal con más de 10 onzas ?.
Suponemos que el contenido de las cajas tiene una
distribución normal con media en 11.5 onzas y una
desviación estándar de 1.25 onzas.
P = normspec([10 Inf],11.5,1.25)
P = 0.89849
Probability Greater than Lower Bound is 0.88493
0.35
0.3
0.25
Density
0.2
0.15
0.1
0.05
0
7
8
9
10
11
12
Critical Value
13
14
15
16
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
94
ANALISIS ESTADISTICO EN MATLAB
7.1.5.
Distribución Exponencial
La distribución Exponencial es un caso específico de la distribución
gamma (con a=1), y es la siguiente:
x
x
1
1
y  f x a, b   a
x a 1e b  e b
b ( a )
b
Donde
.
es la función Gamma.
La distribución exponencial es especial para modelar
recurrentes durante un intervalo de tiempo determinado.
La distribución exponencial acumulada es:
y  f x   
1

x
e  , donde µ es la media observada.
Expcdf ()
Descripción
Función de distribución exponencial acumulada.
t
x
y  F x    
0
1


x
e dt 1  e 
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
95
eventos
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
p = expcdf (x,mu)
-
-
Calcula el valor de la integral para la distribución
exponencial con los respectivos parámetros,
donde x,mu pueden ser un vector o una matriz.
mu debe ser positivo.
P será el resultado correspondiente a una
probabilidad de que una observación de una
distribución exponencial se ubicara dentro del
intervalo [0 x].
[p, plo, pup] = normcdf (x,mu,sigma,pcov, alpha)
-
-
Calcula el valor de un intervalo de confianza con
los parámetros estimados, donde pcov es la
varianza del estimado mu, y alpha especifica la
confianza 100(1-alpha)%.
Plo (PLow) Especifica el limite inferior.
Pup (PUp) Especifica el limite superior.
Ejemplo
En una línea de atención al cliente el tiempo de espera(X) entre
la llamada y la atención de la misma tiene una distribución
exponencial con un tiempo esperado de 5 segundos. ¿ Cual es
la probabilidad de que el tiempo de espera:
a. sea a lo sumo 10 segundos?
P(X≤10) ››
p = expcdf(10,5)
p = 0.8647
b. sea Mayor de 10 segundos?
P(X>10) = 1 - P(X≤10) ››
p = 1 – expcdf(10,5)
p = 0.1353
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
96
ANALISIS ESTADISTICO EN MATLAB
c. Se encuentre entre 5 y 10 segundos?
P(5>X>10) = P(X≤10) - P(X≤5) ››
P= expcdf(10,5) - expcdf(5,5)
p = 0.8647 - 0.6321
p = 0.2325
Exppdf ()
Descripción
Función exponencial de densidad de probabilidad.
y  f x   
Sintaxis
1

x
e
p = exppdf (x,mu)
-
Calcula el valor de la función para la distribución
normal con los respectivos parámetros, donde
x,mu pueden ser un vector o una matriz. mu debe
ser positivo.
Ejemplo
Retomando el ejemplo anterior tenemos que:
En una línea de atención al cliente el tiempo de espera(X)
entre la llamada y la atención de la misma tiene una
distribución exponencial con un tiempo esperado de 5
segundos. ¿ Cual es la probabilidad de que el tiempo de
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
97
ANALISIS ESTADISTICO EN MATLAB
espera:
a. sea 10 segundos?
P(X=10) ›› p = exppdf (10,5) = 0.0271
b. sea 5 segundos?
P(X=5) ›› p = exppdf(5,5) = 0.0736
c. sea 3 segundos?
P(X=3) ›› p = exppdf(3,5) = 0.1098
Si deseamos ver la grafica completa de nuestra distribución
exponencial tenemos que:
a = [0:0.01:30];
y = exppdf(a,5);
plot (a,y)
Y se generará una grafica como la siguiente:
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
Expinv ()
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
98
ANALISIS ESTADISTICO EN MATLAB
Descripción
Función Exponencial de densidad de probabilidad inversa.
(Es la inversa de expcdf)
Sintaxis
X = expinv(P, mu)
- Devuelve el valor de la función Exponencial inversa
mas aproximado para estos parámetros.
- Como P es una probabilidad debe estar dentro del
intervalo [0 1]. mu debe ser positivo.
Ejemplo
Retomando, en una línea de atención al cliente el tiempo de
espera(X) entre la llamada y la atención de la misma tiene
una distribución exponencial con un tiempo esperado de 5
segundos.
¿ Con una probabilidad P, a cuantas llamadas se aproxima?
a. P = 0.9
X = expinv(0.9, 5) =
11.5129
b. P = 0.8
X = expinv(0.8, 5) =
8.0472
c. P = 0.5
X = expinv(0.5, 5) =
3.4657
d. P = 0.8647
%Como en el ejemplo anterior vimos que esta era la
probabilidad para a lo sumo recibir 10 llamadas.
X = expinv(0.8647, 5) =
10.0013
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
99
ANALISIS ESTADISTICO EN MATLAB
exprnd ()
Descripción
Genera una seria de números aleatorios a partir de una
distribución exponencial y unos parámetros definidos.
Sintaxis
x = exprnd (mu, f, c)
-
Genera valores que se aproximen a una
distribución exponencial con parámetros mu
Los parámetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.
x = normrnd (mu, v)
-
Genera valores aleatorios en una matriz con
dimensiones v x v.
Ejemplo
x = exprnd(2.5,1,5) % Muestra aleatoria de 1 fila y 5
columnas a partir de distribución exponencial de
µ = 2.5
x = 2.0259
1.2136
0.5832
0.2035
0.7588
x = exprnd(3,3) % Muestra aleatoria de 3x3 a partir de
distribución exponencial de µ = 3
x=
[0.3373
8.5476
0.6205
4.7871
13.8574
4.8475
3.1250 5.9222 1.5136 ]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
100
ANALISIS ESTADISTICO EN MATLAB
Expstat ()
Descripción
Sintaxis
Calcula la media y la varianza para una serie con
distribución Exponencial.
[m , v] = expstat (mu)
- Mu, puede ser un vector o una matriz, sin
embargo debe ser positivo.
Ejemplo
[m , v] = expstat ([1:5])
m=[1 2 3
v=[1 4 9
4
5 ]
16 25 ]
Nota
Para una distribución Exponencial:
- La media es:
med = 
- La varianza es:
var =  2
expfit ()
Descripción
Devuelve una estimación de los parámetros e intervalos de
confianza para una muestra con distribución exponencial.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
101
ANALISIS ESTADISTICO EN MATLAB
Sintaxis
[mu] = normfit (muestra)
-
Retorna la estimación del parámetro (  -media –
valor esperado) para muestra, la cual puede es
una matriz.
[mu,muint] = normfit(muestra, alpha)
-
-
-
Retorna la estimación de la media (  ) para
muestra, la cual puede es una matriz. Además de
generar intervalos a un nivel de confianza alpha
para cada parámetro.
muint, es un vector en el cual la primera fila
corresponde al limite inferior y la segunda fila
corresponde al limite superior de un intervalo de
estimación del parámetro respectivo.
Si no se incluye el argumento alpha en la función
se toma el nivel alpha por defecto que es 0.05, es
decir un nivel de confianza de 95%. Pero si lo
incluimos alpha, el nivel de confianza será 100(1 alpha) %.
Ejemplo
En este ejemplo tenemos una muestra aleatoria con 10
elementos, con media (µ)= 5.
muestra = exprnd(5,10,1)
muestra = 2.4272
1.1664
0.4071
1.5177
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
102
ANALISIS ESTADISTICO EN MATLAB
8.6788
4.5106
0.3335
0.4338
4.4547
0.5622
[mu,muint] = expfit(muestra)
mu = 2.4492
muint =
1.4335
5.1074
En este caso el valor mu y corresponde a la media de la
muestra, sin embargo, aunque dista mucho del parámetro
original este se encuentre en el intervalo.
7.1.6.
Distribución Gamma
La distribución Gamma es una familia de curvas que dependen de dos
parámetros, a partir de esta obtenemos otras distribuciones como la
exponencial o la Chi-cuadrado. La función de densidad gamma esta
definida como:
x
1
y  f x a, b   a
x a 1e b
b ( a )
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
103
ANALISIS ESTADISTICO EN MATLAB
Donde
.
es la función Gamma.
gamcdf ()
Descripción
Función de distribución gamma acumulada.
p  f x a, b  
Sintaxis
x
t
b
1
a 1
t
e dt
a

b ( a ) 0
p = gamcdf (x,a,b)
-
Calcula el valor de la integral para la distribución
normal con los respectivos parámetros, donde
x,a,b pueden ser un vector o una matriz. a y b
deben ser positivos.
Ejemplo
P1 = gamcdf(10,1,5)= 0.8647 %Como vemos la gamma con
a = 1,
P2 = expcdf(10,5)= 0.8647
es la exponencial.
Suponga que el tiempo de supervivencia en minutos de un
ratón de laboratorio, que ha ingerido cierta clase de veneno
tiene una distribución gamma con a = 5 y b = 7.¿ Cual es la
probabilidad de que el ratón sobreviva:
a. menos de 30 minutos?
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
104
ANALISIS ESTADISTICO EN MATLAB
P(X≤30) ›› P = gamcdf(30,5,7) = 0.4268
b. mas de 60 minutos?
P(X>60) = 1 – P(X≤60) ›› P = 1 - gamcdf(60,5,7) = 1
- 0.9287
= 0.0713
c. entre 30 y 60 minutos?
P(30<X<60) = P(X≤60) - P(X≤30) ››
P = gamcdf(60,5,7) - gamcdf(30,5,7)= 0.9287 0.4268
= 0.5019
gampdf ()
Descripción
Función gamma de densidad de probabilidad.
x
1
y  f x a, b   a
x a 1e b
b ( a )
Sintaxis
p = gampdf (x,a,b)
-
Calcula el valor para la distribución gamma con
los respectivos parámetros, donde x,a,b pueden
ser un vector o una matriz.
a y b deben ser positivos, mientras x debe estar
en el intervalo [0  ].
Ejemplo
Vamos a graficar la función completa para cada punto del
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
105
ANALISIS ESTADISTICO EN MATLAB
ejemplo anterior.
Suponga que el tiempo de supervivencia en minutos de un
ratón de laboratorio, que ha ingerido cierta clase de veneno
tiene una distribución gamma con a = 5 y b = 7.
X =[0:0.1:100];
P = gampdf(X,5,7);
plot(X,P)
0.03
0.025
0.02
0.015
0.01
0.005
0
0
10
20
30
40
50
60
70
80
90
100
gaminv ()
Descripción
Función Gamma de densidad de probabilidad inversa. (Es
inversa de gamcdf)
Sintaxis
X = gaminv(P, mu, sigma)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
106
la
ANALISIS ESTADISTICO EN MATLAB
- Devuelve el valor de la función Gamma inversa mas
aproximado para estos parámetros.
- P es interpretada como la probabilidad al evaluar
la función gamma con los parámetros a y b
(deben ser positivo).
- Como P es una probabilidad debe estar dentro del
intervalo [0 1].
Ejemplo
Suponga que el tiempo de supervivencia en minutos de un
ratón de laboratorio, que ha ingerido cierta clase de veneno
tiene una distribución gamma con a = 5 y b = 7.¿Con una
probabilidad de P cuantos minutos aproximadamente pueden
sobrevivir:
a. P = 0.3?
X = gaminv(0.3,5,7) = 25.4353
b. P = 0.5?
X = gaminv(0.5,5,7) = 32.6964
c. P = 0.9?
X = gaminv(0.9,5,7) = 55.9551
d. P = 0.4268?
%Comprobamos la respuesta obtenida en el ejemplo de
gamcdf.
X = gaminv(0.4268,5,7) = 30
gamrnd ()
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
107
ANALISIS ESTADISTICO EN MATLAB
Descripción
Genera una seria de números aleatorios a partir de una
función gamma y unos parámetros definidos.
Sintaxis
x = gamrnd (a, b , f, c)
-
-
Genera valores que se aproximen a una
distribución gamma con parámetros a y b, pueden
ser un vector o una matriz sin embargo de las
misma dimensiones.
Los parámetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.
x = gamrnd (a, b ,v)
-
Ejemplo
Genera valores aleatorios en una matriz con
dimensiones v x v.
x = gamrnd(5,7,3)
% Genera una matriz de 3x3 con a=5 y b=7.
x = [26.5524
37.2128
54.1503
13.3987
18.2161
32.1009
34.5988
54.1874
37.8700]
x = gamrnd(3,2,2,4)
% Genera una matriz de 2x4 con a=3 y b=2.
x = [ 5.0270
3.0506
6.3538
2.0514
8.0230
12.5873
3.3780
8.6550]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
108
ANALISIS ESTADISTICO EN MATLAB
Gamstat ()
Descripción
Calcula la media y la varianza para una seria con
distribución gamma.
[m , v] = gamstat (a,b)
Sintaxis
-
Ejemplo
a y b, pueden ser un vector o una matriz y
determinan los parámetros de la distribución que
se usa.
[m , v] = gamstat (3, 2)
m=[6]
v = [ 12 ]
[m,v]= gamstat([3 5 8 9],2)
m=[6
10
16
18 ]
v = [ 12
20
32
36 ]
Nota
Para una distribución Gamma: - La media es:
- La varianza es:
med = ab
var = ab2
Gamfit ()
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
109
ANALISIS ESTADISTICO EN MATLAB
Descripción
Sintaxis
Devuelve una estimación de los parámetros e intervalos de
confianza para una muestra con distribución gamma.
[parámetros] = gamfit (muestra)
-
Retorna la estimación de los parámetros(a y b)
para esta distribución según muestra, la cual
puede es una matriz.
[parámetros, intervalos] = gamfit(muestra, alpha)
-
-
-
Retorna la estimación de la media (  ) y la
desviación estándar (  ) para muestra, la cual
puede es una matriz. Además de generar
intervalos a un nivel de confianza alpha para cada
parámetro.
intervalos, es una matriz en las cuales la primera
fila corresponde al limite inferior y la segunda fila
corresponde a al limite superior de la estimación
del parámetro respectivo.
Si no se incluye el argumento alpha en la función
se toma el nivel alpha por defecto que es 0.05, es
decir un nivel de confianza de 95%. Pero si lo
incluimos alpha, el nivel de confianza será 100(1 alpha) %.
Ejemplo
En este ejemplo tenemos una muestra aleatoria con 10
elementos, con a = 3 y b = 5.
muestra = gamrnd(3,5,10,1)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
110
ANALISIS ESTADISTICO EN MATLAB
muestra =
6.4338
28.5470
7.7809
18.1332
15.2054
7.1337
2.3030
12.8559
6.6668
19.0060
[parámetros, intervalos] = gamfit(muestra)
parámetros = [ 2.5314
intervalos = [ 1.1090
5.7782
4.9010 ]
1.9676
12.2078 ]
En este caso los valores a y b corresponden a una estimación a
partir de la muestra, sin embargo nótese que los valores reales se
encuentran dentro de los intervalo respectivos.
7.1.7.
Distribución Chi-Cuadrado
 
2
La distribución Chi-Cuadrado es un caso específico de la distribución
gamma (con b=2), y es la siguiente:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
111
ANALISIS ESTADISTICO EN MATLAB
x
x
1
1
y  f x a, b   a
x a 1e b  a
x a 1e 2
b ( a )
2 ( a )
Donde
.
es la función Gamma y se incluye v que representa los


grados de libertad. a  2 .Entonces tenemos que la distribución ChiCuadrado acumulada es:
v
 v 2 
x 2 e x2
y  f x v   v
2 2 ( v 2 )
chi2cdf ()
Descripción
Función de distribución Chi-Cuadrado acumulada.
x
 v2 
t 2 e t 2
y  F x v    v
dt
2
v
0 2 ( 2 )
Sintaxis
p = chi2cdf (x,v)
-
-
Calcula el valor de la integral para la distribución
Chi-cuadrado con los respectivos parámetros,
donde x,v pueden ser un vector o una matriz. v
son los grados de libertad y junto con x deben ser
positivo.
P será el resultado correspondiente a una
probabilidad de que una observación de una
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
112
ANALISIS ESTADISTICO EN MATLAB
distribución exponencial se ubicara dentro del
intervalo [0 x].
Ejemplo
P1 = chi2cdf (10,8)
0.7350
%Como vemos la distribución Chi se P1 =
comporta de la misma manera que
P2 = gamcdf (10,4,2)
0.7350
una gamma con parámetros a=v/2 es
decir 4 y b=2.
p2 =
chi2pdf ()
Descripción
Función Chi-cuadrado de densidad de probabilidad.
 v 2 
x 2 e x2
y  f x v   v
2 2 ( v 2 )
Sintaxis
p = exppdf (x,v)
-
Calcula el valor de la función para la distribución
normal con los respectivos parámetros, donde
x,mu pueden ser un vector o una matriz. v son los
grados de libertad y junto con x deben ser
positivo.
Ejemplo
x = (0:0.1:50);
%Parámetros
v1 = 4; v2 = 8; v3 = 16;v4 = 32; %Grados de libertad
p1 = chi2pdf(x,v1);
%Primera Función – Color AZUL
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
113
ANALISIS ESTADISTICO EN MATLAB
p2 = chi2pdf(x,v2);
%Segunda Función – Color VERDE
p3 = chi2pdf(x,v3);
%Tercera Función – Color ROJA
p4 = chi2pdf(x,v4);
%Cuarta Función – Color CYAN
plot(x,p1, x,p2, x,p3,x,p4)
0.2
0.18
0.16
0.14
0.12
0.1
0.08
0.06
0.04
0.02
0
0
5
10
15
20
25
30
35
40
45
50
chi2inv ()
Descripción
Función chi-cuadrado de densidad de probabilidad inversa.
(Es la inversa de chi2cdf)
Sintaxis
X = chi2inv(P, v)
- Devuelve el valor de la función chi-cuadrado
inversa mas aproximado para estos parámetros.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
114
ANALISIS ESTADISTICO EN MATLAB
-
Como P es una probabilidad debe estar dentro del
intervalo [0 1]. v debe ser positivo.
Ejemplo
● Con esta función podemos comprobar el resultado obtenido en el
ejemplo de chi2cdf. ( P1 = chi2cdf (10,8)=0.7350 ) Entonces:
X1=chi2inv(0.735,8)
X1=10.0004
● Supongamos que tenemos una muestra con distribución Chi-cuadrado
y 5 grados de libertad. ¿Qué valor excedería al 90% de la muestra?
x = chi2inv(0.95,5)
x = 11.0705
Entonces solo se observaran
oportunidad del 5%.
valores
mayores
de
11
con
chi2rnd ()
Descripción
Genera una seria de números aleatorios a partir de una
distribución Chi-cuadrado y unos parámetros definidos.
Sintaxis
x = chi2rnd (v, f, c)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
115
una
ANALISIS ESTADISTICO EN MATLAB
-
Genera valores que se aproximen a una
distribución exponencial con parámetro v.
Los parámetros f y c son opcionales y permiten
generan un matriz aleatoria de dimensiones (ffilas, c - columnas) con las especificaciones
previas.
x = normrnd (mu, v)
-
Genera valores aleatorios en una matriz con
dimensiones v x v.
Ejemplo
x = chi2rnd(10,4,2) % Muestra aleatoria de 4 fila y 2
columnas a partir de distribución Chicuadrado de v = 10
x=[
10.1084
22.3001
8.5497
8.7564
12.8334
9.8343
7.0153
14.7426 ]
x = chi2rnd(10,3) % Muestra aleatoria de 3x3 a partir de distribución
Chi-cuadrado de v = 10
x = [ 7.5864
10.6322
3.8282
5.2046
9.8854
15.4715
9.1717
15.4821
10.8200
]
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
116
ANALISIS ESTADISTICO EN MATLAB
chi2stat ()
Descripción
Sintaxis
Calcula la media y la varianza para una serie con
distribución Chi-cuadrado.
[m , v] = chi2stat (V)
- v, puede ser un vector o una matriz, sin embargo
debe ser positivo.
Ejemplo
[m,v] = chi2stat([1:5])
m=[1 2 3 4 5]
v = [ 2 4 6 8 10]
Nota
Para una distribución Chi-cuadrado:
7.1.8.
- La media es:
med = v
- La varianza es:
var = 2v
Distribución Beta
La distribución Beta es una familia de curvas que se encuentran dentro
del intervalo (0 1], esta función de densidad beta esta definida como:
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
117
ANALISIS ESTADISTICO EN MATLAB
y  f x a, b  
1
b 1
x a 1 1  x  I 0,1 x 
B ( a , b)
I ( 0,1) x  significa que el valor de x se ubicara dentro del intervalo (0 1).
Donde
B.
es la función Beta.
1
Ba, b    t a 1 1  t  dt 
b 1
0
Donde
.
a b 
a  b 
es la función Gamma.
betacdf ()
Descripción
Función de distribución beta acumulada.
x
1
b 1
a 1


y  f x a, b  
t
1

t
dt

B ( a , b) 0
Sintaxis
p = betacdf (x,a,b)
-
Calcula el valor de la integral para la distribución
normal con los respectivos parámetros, donde
x,a,b pueden ser un vector o una matriz. a y b
deben ser positivos, mientras x debe estar en el
intervalo [0 1].
Ejemplo
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
118
ANALISIS ESTADISTICO EN MATLAB
x = [0:0.1:1];
p=betacdf(x,5,4)
0
0.0004
0.0104
0.0580
0.9437 0.9950 1.0000
0.1737
0.3633
0.5941 0.8059
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
119
ANALISIS ESTADISTICO EN MATLAB
ANEXO 1
INNOVACIONES DE MATLAB 7
MATLAB es un software muy utilizado en diferentes áreas en las que
resulta aplicable el lenguaje matemático, debido a este importante
factor y a que es necesario innovar y mejorar las condiciones de trabajo,
el software ha tenido una serie de modificaciones que permiten trabajar
en un escenario que se adecua a las necesidades para este tipo de
programas. Teniendo en cuenta lo anterior es de vital importancia tener
conocimiento de estas nuevas características; para ello hemos tomado
algunas de ellas con el objetivo que los usuarios del presente informe, al
igual que nosotros como sus creadores, tengamos la posibilidad de
conocer las facilidades presentadas por el programa y encontremos la
mejor forma de aplicarlas a las labores especificas que realizamos.
NUEVAS CARACTERISTICAS
1. El desktop en MATLAB 7 ha sido rediseñado para tener una
mayor funcionalidad y sensibilidad que facilite el entendimiento y
agilidad para llevar a cabo diferentes operaciones. Las nuevas
características del desktop permiten trabajar en diferentes
documentos al interior de MATLAB de forma simultánea, además
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
120
ANALISIS ESTADISTICO EN MATLAB
de la posibilidad de guardar customs layout y definir shortcuts
que facilitan el uso de los comandos.
2. En MATLAB 7 podemos crear algunas variables de de diferentes
características simplemente llamando las mismas con la función
create, cuando presionamos Tab después de escribir el comando
se despliega una lista de todos los posibles comandos y funciones
y variables que comienzan con caracteres de este tipo (create).
3. Una de las grandes ventajas del MATLAB 7 es que permite la
realización de gráficos desde la ventana del workspace, en la cual
con un simple click en el icono (
) que aparece esta ventana
podemos escoger el tipo de gráfica que deseamos realizar con la
variable seleccionada.
4. Permite la posibilidad de ver las gráficas realizadas al interior del
desktop y no en una ventana aparte como lo realiza por defecto,
para ello basta con presionar en la parte superior derecha de la
ventana de figuras en la flecha dirigida hacia la parte de abajo( ),
esta nueva característica aplica para otras ventanas, por ejemplo
la ventana del Editor.
5. Se tiene la posibilidad de
trabajar con diferentes documentos
como arrays, m-files, figuras y otros,
en una misma ventana,
para ello debemos guardar y aplicar la opción desktop layouts que
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
121
ANALISIS ESTADISTICO EN MATLAB
se encuentra dentro del desktop de la barra de menús, en la cual
utilizando la opción de large documents Windows (gráfica 1).
GRAFICA 1
6. Después de habilitar la opción mencionada con anterioridad, el
programa permite además manipular la forma en la cual se
muestran los archivos, funciones o demás en la respectiva
ventana, es decir la cantidad de archivos que queremos que nos
muestre en la misma (ver gráfica 2). Esta nueva característica de
MATLAB 7 facilita el trabajo, dándonos la oportunidad de un mejor
entorno de trabajo que agilice el trabajo en el programa.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
122
ANALISIS ESTADISTICO EN MATLAB
GRAFICA 2
7. Es posible en este modo abrir y editar cell arrays y estructuras
desde
el
workspace,
para
diferentes
tipos
de
información
almacenada, desde la ventana del array editor es posible modificar
los datos, al igual que graficar la totalidad o parte de los datos a
parte de ellos con un simple clic en el icono (
).
8. Otras de las grandes ventajas que presenta MATLAB 7 es la
relacionada con la creación de shortcuts, que permiten usar de
manera cómoda y ágil algunos de los comandos ejecutados en el
programa, para ello basta con seleccionar en el desktop la opción
de shortcuts toolbar y arrastrar con el Mouse hasta
la parte
superior derecha en frente de los shortcuts que aparecen por
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
123
ANALISIS ESTADISTICO EN MATLAB
defecto
algún
comando
existente
en
el
Comand History,
automáticamente nos pide una etiqueta y después de guardar el
mismo comando que llevamos se ejecuta de forma ágil dando un
solo clic sobre el nombre que le hallamos colocado
EDITOR AND DEBUGGER
9. Para revisar los M-files MATLAB 7 ofrece gran facilidad, basta con
abrir el archivo desde el current directory y dirigirse a la opción
cell de la barra de menús y habilitar el cell mode; en el editor
las celdas aparecen separadas por doble comentario (%%),
además es posible ejecutar y avanzar a la otra celda con un solo
clic en el icono (
), lo que realiza este botón es ejecutar las
celdas y avanzar a la siguiente que encuentre basándose en los
dos %%, esta nueva característica agiliza el trabajo y la revisión
de los M-files que en ocasiones pueden llegar a ser muy extensos.
10.
En MATLAB 7 es posible de forma automática pasar o
publicar el M-code a formato HTML, WORD,
u otros formatos a
documentos de trabajo o a partes de los mismos, con un solo clic
(
11.
).
El editor ahora identifica otros lenguajes importantes como
c/ c++, html, and Java Code. Basta únicamente con dirigirse al
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
124
ANALISIS ESTADISTICO EN MATLAB
curren directory que ya reconoce este tipo de archivos y al dar clic
derecho, escoger la opción de abrir texto.
12.
Condicional breakpoints: En primer lugar se debe escoger la
opción disable cell mode en el menú cell (ver gráfica 3),
después de esto es posible colocar breakpoints dando clic en el
icono que posee el programa para desarrollar esta tarea (
). Esta
posibilidad nos permite trabajar y evaluar nuestros M-files hasta el
punto de quiebre definido lo que facilita la detección de posibles
errores, y el establecimiento de condiciones que debe cumplir el
archivos en este punto.
GRAFICA 3
13.
Otra de las nuevas ventajas de MATLAB 7 es la de colocar
bloques completos de comentarios, para ello basta
es posible
colocar bloques de comentarios colocando simplemente el símbolo
porcentaje (%), acompañado de un corchete abierto; el bloque de
comentarios se cierra de la misma forma como se abrió y cerrando
el corchete correspondiente. Esta nueva característica agiliza el
trabajo en el programa y permite la posibilidad de escribir grandes
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
125
ANALISIS ESTADISTICO EN MATLAB
cantidades de ayudas en el M-file que pueden orientar mejor la
posterior revisión de los mismos.
GRÁFICAS
14.
MATLAB 7 tiene bastantes innovaciones en este aspecto, y
en su mayoría son enfocadas a incrementar el manejo de las
gráficas por medio de iconos y disminuir en alguna medida la
programación necesaria para la realización, y principalmente la
modificación de las mismas. Cuando abrimos un archivo tenemos
la posibilidad de valuar puntos específicos simplemente dando clic
en
el
icono
data
automáticamente
el
cursor
(
),
valor
de
las
y
el
cursos
variables
en
nos
indica
el
punto
seleccionado dentro de la gráfica. Si queremos que nos muestre
en una ventana aparte el valor de las variables en el punto
especifico simplemente damos clic derecho y escogemos la opción
Display Style y en esta damos clic en Window Incide Figure.
(ver gráfica 4)
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
126
ANALISIS ESTADISTICO EN MATLAB
FIGURA 4
15.
Otra de las innovaciones presentadas por MATLAB 7 es la
posibilidad de realizar anotaciones al interior de las gráficas, para
ello basta con pulsar en la flecha que aparece en la barra de
herramientas del dibujo (
), y seleccionando la opción
Insert
Text Arrow (ver gráfica 5) podemos colocar al interior del grafico
la
flecha
que
deseamos,
el
programa
por
defecto
coloca
anotaciones correspondientes a la gráfica en general y no al punto
que se esta señalando.
16.
También es posible agregar otros pequeños gráficos como
rectángulos, elipses, cuadros de texto simplemente escogiendo la
opción insertar y seleccionando lo que deseamos insertar en la
gráfica. Existe también la posibilidad de modificar las propiedades
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
127
ANALISIS ESTADISTICO EN MATLAB
de las imágenes realizadas simplemente dando doble clic en el
objeto que deseamos modificar; automáticamente el programa
nos muestra en cuadro en el cual aparecen las propiedades del
objeto seleccionado y en el cual podemos modificar a nuestro
parecer.(ver gráfica 5)
GRAFICA 5
17.
Es posible crear y modificar gráficas interactivamente con un
solo clic en el icono show plot tools (
), esta opción
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
128
ANALISIS ESTADISTICO EN MATLAB
automáticamente permite modificar algunas de las propiedades de
la
gráfica,
además
de
trabajar
interactivamente
con
otras
variables o gráficas ya creadas, de una manera sencilla y práctica.
Para esto debemos
arrastrar las mismas hacia la gráfica ya
creada, o cuadrante vacío. De esta forma tenemos la posibilidad
de comparar las gráficas y cambiar propiedades de las gráficas al
mismo tiempo.
Para
agregar
gráficas
en
otros
cuadrantes
y
trabajar
simultáneamente en varias gráficas nos a la ventana de Figure
Palette (figura 5) y creamos la cantidad de cuadrantes que
queremos que nos muestre en la ventana, automáticamente nos
aparece en la ventana el numero de cuadrantes que hallamos
seleccionado (por ejemplo en una fila y dos columnas).
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
129
ANALISIS ESTADISTICO EN MATLAB
GRAFICA 6
18.
Desde el panel mencionado en el punto anterior es posible
acceder a las anotaciones del mismo, para ello nos dirigimos al
icono(
) que aparece
en la barra de herramientas, cuando
habilitamos esta opción se genera la posibilidad de generar el
código-M que dio origen a las gráficas creada de una manera
rápida, para ello vamos a la barra de menús y en File
escogemos la opción Genérate M-File, y de forma automática nos
muestra en el Editor los comandos que se deberían utilizar para la
creación de esta gráfica, la cual es posible de almacenar como
cualquier otro archivo-M.
Después de revisar algunas de las nuevas características del
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
130
ANALISIS ESTADISTICO EN MATLAB
programa en esta versión, hemos encontrado que las ventajas e
innovaciones en lo relacionado con las gráficas son en las que mas
se trabaja, y que las mismas permiten trabajar en una forma
mucho más rápida que permite agilizar y optimizar las actividades
en el programa.
van
Sin embargo todas las innovaciones realizadas
encaminadas
a
mejorar
el
entorno
del
contribuyen a la optimización de tareas en el mismo.
UNIVERSIDAD NACIONAL COLOMBIA
FACULTAD DE CIENCIAS ECONÓMICAS
UNIDAD DE INFORMÁTICA Y COMUNICACIONES
131
programa
y
Descargar