Módulo de ESTADISTICA Classpad 330 (6286)

Anuncio
ClassPad 330
Aplicación Estadística
casio ClassPad 330
Prof. Jean-Pierre Marcaillou
unidad 1: Primer contacto con la
calculadora
ClassPad 330
Contenido
9 Introducción
10 Estadísticas descriptivas
11 ¿Cómo acceder a la Aplicación Estadística?
12 ¿Cómo acceder a la Aplicación Estadística?
13 ¿Cómo acceder a la Aplicación Estadística?
14 ¿Cómo acceder a la Aplicación Estadística?
15 Barra de herramientas
16 Barra de herramientas
17 Barra de estado
18 ¿Cómo acceder al menú Edit?
19 ¿Cómo acceder al menú Edit?
20 ¿Cómo acceder al menú Edit?
21 ¿Qué es una lista?
22 ¿Cómo realizar cálculos estadísticos de una sola variable?
23 ¿Cómo realizar cálculos estadísticos de una sola variable?
ClassPad 330
Contenido
24 ¿Cómo realizar cálculos estadísticos de una sola variable?
25 Ejemplo: Ingreso familiar
26 ¿Qué es una tabla estadística?
27 Agrupación de los datos en una tabla estadística
28 Agrupación de los datos en una tabla estadística
29 Agrupación de los datos en una tabla estadística
30 Observaciones sobre la tabla estadística
31 Estadísticos de centralización: Media, Mediana, Moda
32 Fórmulas: Media y Mediana
33 Fórmula: Moda
34 Cálculos estadísticos: Media
35 Cálculos estadísticos: Mediana
36 Cálculos estadísticos: Mediana
37 Cálculos estadísticos: Moda
38 Estadísticos de posición: cuantiles
ClassPad 330
Contenido
39
40
41
42
43
44
Estadísticos de posición: cuartiles
Estadísticos de posición: deciles
Estadísticos de posición: percentiles
Fórmulas: percentiles
Cálculos cuartiles Q1 , Q2, Q3
Cálculos deciles D1, D2, D3
45 Cálculos percentiles
46 Estadísticos de dispersión: Varianza y Desviación estándar
47 Fórmulas: Varianza y Desviación Estándar
48 Fórmulas: Varianza y Desviación Estándar
49 Cálculos estadísticos: Varianza y Desviación Estándar
50 Cálculos estadísticos Calculadora
51 ¿Cómo realizar cálculos estadísticos de dos variables?
52 ¿Cómo realizar cálculos estadísticos de dos variables?
53 ¿Cómo realizar cálculos estadísticos de dos variables?
ClassPad 330
Contenido
54
55
56
57
58
59
60
61
62
63
64
65
66
¿Qué es un histograma?
¿Cómo graficar un histograma?
¿Cómo graficar un histograma?
¿Cómo graficar un histograma?
¿Cómo graficar un histograma?
¿Cómo graficar un histograma?
¿Cómo graficar un histograma?
¿Qué es un gráfico de línea a trazos?
¿Qué es un gráfico de línea a trazos?
¿Cómo graficar un gráfico de línea a trazos?
¿Cómo graficar un gráfico de línea a trazos?
¿Cómo graficar un gráfico de línea a trazos?
¿Qué es un Diagrama de Caja?
67 Construcción del Diagrama de Caja
68 Ejemplo: Diagrama de Caja del Ingreso familiar
ClassPad 330
Contenido
69 ¿Cómo mejorar un Diagrama de Caja?
70 ¿Cómo mejorar un Diagrama de Caja?
71 ¿Cómo graficar un Diagrama de Caja?
72 ¿Cómo graficar un Diagrama de Caja?
73 ¿Cómo graficar un Diagrama de Caja?
74 ¿Cómo graficar un Diagrama de Caja?
75 ¿Cómo graficar un Diagrama de Caja?
76 ¿Cómo graficar un Diagrama de Caja?
77 ¿Cómo graficar un Diagrama de Caja?
78 ¿Cómo graficar un Diagrama de Caja?
79 ¿Cómo calcular intervalo de confianza para la media de una población?
80 Cálculo del intervalo de confianza para la media de una población
81 ¿Cómo calcular intervalo de confianza con la calculadora?
82 ¿Cómo calcular intervalo de confianza con la calculadora?
83 ¿Qué es un diagrama de dispersión?
ClassPad 330
Contenido
84
85
86
87
88
¿Qué es la covarianza entre dos variables?
¿Qué es el coeficiente de correlación?
Interpretación del coeficiente de correlación
Modelo de regresión lineal y ecuación de regresión lineal
Modelo de regresión lineal y ecuación de regresión lineal
89 ¿Qué es el coeficiente de determinación r2?
90 ¿Qué es el coeficiente de determinación r2?
91
92
93
94
95
96
97
98
¿Qué es el error estándar de la estimación?
¿Qué es el error estándar de la estimación?
¿Cómo graficar un diagrama de dispersión?
¿Cómo graficar un diagrama de dispersión?
¿Cómo graficar un diagrama de dispersión?
¿Cómo graficar un diagrama de dispersión?
¿Cómo graficar un diagrama de dispersión?
¿Cómo graficar la recta de regresión lineal?
ClassPad 330
Contenido
99 ¿Cómo graficar la recta de regresión lineal?
100 ¿Cómo graficar la recta de regresión lineal?
101 ¿Cómo extrapolar?
102 ¿Cómo calcular la ecuación de la recta de regresión
lineal a través de la
Aplicación Principal?
103
¿Cómo calcular la ecuación de la recta de regresión lineal a través de la
Aplicación Principal?
104
¿Cómo calcular la ecuación de la recta de regresión lineal a través de la
Aplicación Principal?
105 Ejercicio 1
106 Ejercicio 1
107 Ejercicio 2
108 Ejercicio 2
109
110
111
112
ClassPad 330
Introducción
Este material describe brevemente la configuración de la
ventana de la Aplicación Estadística y proporciona
información básica sobre sus menús y comandos.
La Aplicación Estadística permite realizar cálculos
estadísticos de centralización, posición, dispersión, y
gráficos estadísticos a través de Gráfico de Probabilidad
Normal, Gráfico de barras de Histograma, Diagrama de
Caja, Gráfico de líneas a trazos.
índice
ClassPad 330
Estadísticas descriptivas
Las técnicas para la organización y procesamiento - tanto
numérico como gráfico - de datos forman parte de lo que se
conoce como estadística descriptiva
índice
ClassPad 330
¿Cómo acceder a la Aplicación Estadística?
(1)
Presione la tecla [ON/OFF] y toque el icono
del
panel de iconos para mostrar las diferentes Aplicaciones.
(2)
Utilice la barra (botón) de desplazamiento e identifique
la Aplicación Estadística.
índice
ClassPad 330
¿Cómo acceder a la Aplicación Estadística?
(3) Toque el icono
y se activa la pantalla de la
Aplicación Estadística.
(4) Toque en la barra de menús [Edit] / [Borrar todo] con la
finalidad de limpiar todas las páginas de la Aplicación
Estadística.
índice
ClassPad 330
¿Cómo acceder a la Aplicación Estadística?
(5) Toque [Acep.] y aparece la pantalla inicial de dicha
Aplicación con sus seis listas vacías: list1, list2, list3, list4,
list5 y list6.
Barra de menús
Barra de herramientas
Listas
Número de línea
Barra (botones) de desplazamiento de las listas
Barra de estado
índice
ClassPad 330
¿Cómo acceder a la Aplicación Estadística?
(6)
Toque la fila 6 de la lista 1 cuya celda se resalta en color
negro y observe que en la parte inferior de la pantalla
aparece el número de línea seleccionada [
6];
posicione el cursor en el recuadro adyacente y aparece
en la fila 6 de la lista 1 el símbolo >; escriba en el
recuadro el valor 54.
(7)
Toque la tecla [EXE] para registrar dicho valor en el lugar
seleccionado y observe como la fila siguiente queda
resaltada en color negro.
índice
ClassPad 330
Barra de herramientas
Toque en la barra de herramientas
de los botones.
cada uno
Dibuja un gráfico estadístico.
Muestra la ventana del editor de gráficos.
Muestra la ventana de área de trabajo de la Aplicación Principal.
Convierte una expresión matemática a un valor.
Muestra el cuadro de diálogo de configuración de gráficos
estadísticos.
Muestra el cuadro de diálogo de la ventana de visualización.
Muestra 4 columnas en la ventana del editor de estadísticas.
Da acceso a los restantes botones.
Borra una celda.
índice
ClassPad 330
Barra de herramientas
Borrar todos los datos de una lista.
Insertar una celda en una lista.
Ordenar los datos de una lista en orden ascendente.
Ordenar los datos de una lista en orden descendente.
Dar acceso a los botones anteriores.
Vuelve a dibujar el gráfico visualizado.
Inicia una operación de trazo.
Inicia una operación de zoom de cuadro.
Amplía y reduce la imagen en pantalla.
Panea la ventana.
Alterna la opción entre automático y manual.
índice
ClassPad 330
Barra de estado
Toque en la barra de estado
tres botones.
cada uno de los
1
2
3
Gra
La configuración de la unidad angular está en grados.
Rad
La configuración de la unidad angular está en radianes.
Grad
La configuración de la unidad angular está en grados
centesimales.
Auto
Las opciones de la ventana de visualización de estadísticas se
configuran automáticamente.
<en
blanco>
Las opciones de la ventana de visualización de estadísticas deben
ser configuradas manualmente.
Decimal
Convierte el resultado a un número decimal.
Estándar
Convierte el resultado bajo la forma exacta es decir bajo la forma de
un número fraccionario.
Al tocar los botones 1 y 3 las opciones se cambian inmediatamente.
Para realizar los cambios en el botón 2 se debe acudir a la lengüeta Especial
de Formato de gráfico de Settings.
índice
ClassPad 330
¿Cómo acceder al menú Edit?
Toque en la barra de menús [Edit] y aparecen los comandos
que se describen a continuación.
Cortar
Hace aparecer en la ventana del editor de estadística una
determinada lista existente.
Abrir lista
Hace desaparecer en la ventana del editor de estadística una
determinada lista.
Cerrar lista
Se ubica en la línea 1 de la lista actual seleccionada.
Ir al
principio
Se ubica después de la última línea de la lista actual
seleccionada.
Ir al final
Ordena los datos de una lista en orden ascendente.
Ordenar
(Asc.)
índice
ClassPad 330
¿Cómo acceder al menú Edit?
Toque en la barra de menús [Edit] y aparecen los comandos
que se describen a continuación.
Ordena los datos de una lista en orden descendente.
Ordenar
(Desc.)
Borra o una celda, o una columna, o una variable lista de
una determinada lista.
Borrar
Inserta una celda en una determinada lista.
Insertar
celda
Corta el valor actualmente seleccionado y lo coloca en el
portapapeles.
Cortar
Copia el valor actualmente seleccionado y lo coloca en el
portapapeles.
Copiar
índice
ClassPad 330
¿Cómo acceder al menú Edit?
Toque en la barra de menús [Edit] y aparecen los comandos
que se describen a continuación.
Cortar
Pega el contenido actual del portapapeles en la posición
actual del cursor.
Pegar
Borra el valor actualmente seleccionado.
Seleccionar
todo
Borra todas las páginas de la Aplicación Estadística y
visualiza la pantalla inicial de la Aplicación Estadística.
Borrar todo
índice
ClassPad 330
¿Qué es una lista?
Una lista es una matriz de datos que permite manipular
múltiples elementos de datos como un grupo.
Un lista tiene una columna y puede contener hasta 9.999
filas.
La ventana del editor de estadísticas muestra por defecto
6 listas: list1, list2, ..., y list6. Se pueden ver hasta 99 listas.
Las listas son tratadas como variables y, al igual que las
variables, son almacenadas en una carpeta en la memoria y
pueden manipularse usando el administrador de variables.
Si se borra una lista de la pantalla, dicha lista todavía existe
en la memoria como una variable y puede ser recuperada
cuando sea necesario.
índice
ClassPad 330
¿Cómo realizar cálculos estadísticos de una sola variable?
(1)
Toque en la barra de menús de la Aplicación Estadística
[Cálc.] / [Una variable] y aparece el cuadro de diálogo
para cálculos estadísticos de una sola variable.
(2)
Toque el botón flecha abajo
justo al mismo ListaX: y
seleccione la lista 1 la cual queda resaltada en negro.
índice
ClassPad 330
¿Cómo realizar cálculos estadísticos de una sola variable?
(3)
(4)
Toque list1 para validar dicha selección en ListaX:.
Toque el botón flecha abajo justo al mismo Frec.: y
seleccione 1.
(5)
Toque 1 para validar dicha selección en Frec.:.
índice
ClassPad 330
¿Cómo realizar cálculos estadísticos de una sola variable?
(6)
Toque [Acep.] y aparecen los cálculos estadísticos
correspondientes a la lista 1:
x,  x,  x 2 ,xn,xn  1,n,minx,Q1
(7)
Toque la barra de desplazamiento con la finalidad de
hacer aparecer los restantes cálculos estadísticos:
Med,Q3,max x,Mode,ModeN,ModeF
índice
ClassPad 330
Ejemplo: Ingreso familiar
Muchos estudios socioeconómicos incluyen la estimación
del ingreso familiar en una población. Suponga que con
este propósito se toma una muestra de 20 familias en cierto
sector residencial del área metropolitana de Caracas con el
siguiente resultado (en miles de Bs. mensuales):
500, 280, 140, 240, 400, 900, 840, 440, 260, 700, 120, 380,
340, 320, 420, 480, 160, 490, 300, 290
La información presentada en esta forma no dice
prácticamente nada, de donde el interés de presentarla de
manera más útil, a través del uso de tablas estadísticas.
índice
ClassPad 330
¿Qué es una tabla estadística?
Una tabla estadística sirve para presentar en forma
ordenada las distribuciones de frecuencias que
representan el conjunto de clases junto a sus frecuencias
correspondientes a cada una de ellas.
No existe un criterio único para fijar el número de clases k;
en nuestro caso se considera una valor de k que nos
permita trabajar cómodamente como k = 1 + 3,322 log10n.
Se llama Recorrido Re al rango de la variable, es decir
Re = xmáx – xmín
Se llama Amplitud de la clase i a ai = li – li-1
Se llama Amplitud de cada clase a h = Re / k
índice
ClassPad 330
Agrupación de los datos en una tabla estadística
n  número de observaciones en la muestra
k  número de clases
l j1  l j  l j1  l j  intervalo de clase j
h  l j  l j1 ampitud de la clase j
xc j  marca de la clase j 
l j 1  l j
2
fjabs  frecuencia absoluta de la clase j
fj  frecuencia relativa de la clase j 
fjabs
n
j
abs
j
F
abs
f
i
 frecuencia absoluta acumulada 
i1
j
Fj  frecuencia relativa acumulada 
f
i
i1
índice
ClassPad 330
Agrupación de los datos en una tabla estadística
Se tiene:
n  20
k  1  3,322log10 20  5,32  5
x mín  120
x má x  900
R e  x má x  x mín  900  120  780
Re 780
a

 156
k
5
Entonces se considera k = 5 intervalos de amplitud h = 156
empezando por el valor l0 = 120 y terminando por el valor
l5 = 900 como se muestra a continuación.
índice
ClassPad 330
Agrupación de los datos en una tabla estadística
Intervalos
Marcas
de clase
Frecuencias
Frecuencias acumuladas
Absolutas
Relativas
Absolutas
Relativas
li-1- li
xci
fiabs
fi
Fiabs
Fi
i=1
120 - 276
198
5
0,25
5
0,25
i=2
276 - 432
354
8
0,40
13
0,65
i=3
432 - 588
510
4
0,20
17
0,85
i=4
588 - 744
666
1
0,05
18
0,90
i=5
744 - 900
822
2
0,10
20
1,00
20
1
índice
ClassPad 330
Observaciones sobre la tabla estadística
La clase con mayor número de observaciones es la que
corresponde a los ingresos entre 276 mil y 432 mil Bs.
El 60% de las familias de la muestra tienen ingresos entre
276 mil y 588 mil Bs.
El 25% tienen ingresos inferiores a 276 mil Bs.
El 10% tienen ingresos superiores a 744 mil Bs.
Se podrá apreciar más adelante la potencialidad de la
Aplicación Estadística en estudiar la sensibilidad de la
construcción de dicha tabla como función del número de
clases k.
índice
ClassPad 330
Estadísticos de centralización: Media, Mediana y Moda
La Media de una muestra representa el promedio
aritmético de las observaciones y se representa por el
símbolo X.
La Mediana de una muestra es un valor tal que las primeras
n 
 2  observaciones
 
n 
 2  últimas
 
son menores o iguales a dicho valor, y las
son mayores o iguales y se representa por Me.
La Moda de una muestra es el valor de las observaciones
que se presenta con más frecuencia y se representa por Mo
cuando los datos son no agrupados. En el caso de datos
agrupados se habla de Clase Modal o clase que ocurre con
mayor frecuencia en la muestra.
índice
ClassPad 330
Fórmulas: Media y Mediana
1 n
x   xi
n i1
Media de la muestra en datos sin agrupar
Media de la muestra en datos agrupados
1
x
n
k
 xc f
abs
i i

i1
k
 xc f
i i
i 1
Me  x  n 1 con n impar


 2 
Mediana de la muestra en datos sin
agrupar
x n   x n
Me 

  1
2 
 
2
2
con n par
 0,5  Fj1 
Me  l j1  
 h

fj


Mediana de la muestra en datos
agrupados
l j1  límite inferior de la clase Me
h  tamaño de la clase Me
fj  frecuencia relativa de la clase Me
Fj1  frecuencia relativa acumulada en las
j  1 clases anteriores a la Me
índice
ClassPad 330
Fórmula: Moda
F
R
E
C
U
E
N
C
I
A
S
fj
fj+1
fj -1
VALORES
lj -1
Mo  l j1 
Mo lj
fj  1
f j  1  fj  1
h
índice
ClassPad 330
Cálculos estadísticos: Media
La Media del ingreso familiar a partir de los datos no agrupados es:
1
x
 500  280  140  ...  490  300  290   400 mil Bs.
20
La Media del ingreso familiar a partir de los datos agrupados es:
 utilizando las frecuencias relativas
x  198  0,25  354  0, 40  510  0,20  666  0,05  822  0,10  408,6 mil Bs.
 utilizando las frecuencias absolutas
x
1
198  5  354  8  510  4  666  1  822  2   408,6 mil Bs.
20
Se observa que el valor obtenido con los datos agrupados es diferente
al valor exacto, 400 mil Bs., obtenido con los datos sin agrupar, en vista
de que se pierde información al considerar que todos los valores de una
clase son iguales al valor del punto medio de la misma.
índice
ClassPad 330
Cálculos estadísticos: Mediana
Primero se ordenan los datos no agrupados en orden creciente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
120
140
160
240
260
280
290
300
320
340
380
400
420
440
480
490
500
700
840
900
Como el número de observaciones es par (20), la Mediana Me será la
observación ficticia
x n   x n 
 
  1
x  x11 340  380
2
2 
x  n 1  
 10

 360
2
2
2


 2 
Me  x  n 1   360 mil Bs.


 2 
Se dice entonces que las 10 primeras observaciones son menores o
iguales a 360 mil, y las restantes 10 son mayores o iguales a 360 mil.
índice
ClassPad 330
Cálculos estadísticos: Mediana
Primero se ordenan los datos no agrupados en orden creciente y se
agrupan
intervalos
Marcas de
clase
Frecuencias
li-1 - li
xci
fiabs
fi
Fiabs
Fi
i=1
120-276
198
5
0,25
5
0,25
i=2
276-432
354
8
0,40
13
0,65
i=3
432-588
510
4
0,20
17
0,85
i=4
588-744
666
1
0,05
18
0,90
i=5
744-900
822
2
0,10
20
1
Se puede observar que la clase que contiene la Mediana es la segunda
20
5
0,5  0,25
2
Me  276 
 156  276 
 156  373,5 mil Bs.
8
0, 40
La diferencia con el valor obtenido para datos no agrupados es debida a
la pérdida de información en que se incurre al trabajar con datos
agrupados
índice
ClassPad 330
Cálculos estadísticos: Moda
Se puede observar que la clase modal corresponde a
ingresos entre 276 mil y 432 mil Bs.
Se tiene que:
l j1  276
fjabs
5
1
fjabs
4
1
h  156
Mo  l j1 
fjabs
1
fjabs
1
4
h  276 
156  345,333 mil Bs.
abs
 fj  1
54
índice
ClassPad 330
Estadísticos de posición: cuantiles
Los cuantiles son aquellos valores de la variable, que
ordenados de menor a mayor, dividen un conjunto ordenado
de datos en grupos con la misma cantidad de
observaciones.
Se define al cuantil de orden α como un valor de la
variable por debajo del cual se encuentra una frecuencia
acumulada α.
Los cuantiles más conocidos son: cuartiles, deciles y
percentiles.
índice
ClassPad 330
Estadísticos de posición: cuartiles
Son valores de la variable que dividen al conjunto de datos
ordenado en forma creciente en 4 partes iguales, cada una
de las cuales engloba el 25 % de las mismas.
 Q1 es el primer cuartil que deja a su izquierda el 25% de
los datos,
 Q2 (Me) es el segundo cuartil que deja a su izquierda el
50% de los datos, y
 Q3 es el tercer cuartil que deja a su izquierda el 75% de
los datos.
El intervalo intercuartil Q3 – Q1 representa el intervalo en
el cual están el 50% de las observaciones centrales de la
muestra, quedando 25% antes del intervalo y 25% después
índice
ClassPad 330
Estadísticos de posición: deciles
Son los valores de la variable que dividen al conjunto de
datos ordenado en forma creciente en 10 partes iguales,
cada una de las cuales engloba el 10 % de los datos.
En total hay 9 deciles D1, D2, D3, D4, D5, D6, D7, D8 y D9 que
corresponden a 10%, 20%, 30%, 40%, 50%, 60%, 70%,
80% y 90%.
índice
ClassPad 330
Cálculos estadísticos: percentiles
Son los valores de la variable que dividen al conjunto de
datos ordenado en forma creciente en 100 partes iguales,
cada una de las cuales engloba el 1% de los datos.
Luego el Percentil-p, Pp, es un valor tal que las primeras
[np] observaciones son menores o iguales a dicho
valor, y las últimas n – [np] observaciones son mayores
o iguales a dicho valor.
En total hay 99 percentiles P1, P2, P3, ..., y P99 que
corresponden a 1%, 2%, 3%, ..., y 99%.
índice
ClassPad 330
Fórmulas: percentiles
Percentiles en datos
no agrupados
Si  (n  1)p   0 entonces Pp  x 1
Si  (n  1)p   1entonces Pp  x(n 1)p

 (n  1)p   (n  1)p  x(n 1)p  1  x(n 1)p
Pp  l j1 
Percentiles en datos agrupados
p  Fj1
fj

h
j  clase que contiene a Pp
l j1  límite inferior de la clase j
j1
Fj1 
f
i
i1
fi  frecuencia relativa de la clase i
fj  frecuencia relativa de la clase j
h  tamaño de la clase j
índice
ClassPad 330
Cálculos Cuartiles Q1 , Q2 y Q3
Primero se ordenan los datos no agrupados en orden creciente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
120
140
160
240
260
280
290
300
320
340
380
400
420
440
480
490
500
700
840
900
Q1
Q2
Q3

Q1  P25  x 210,25  21 0,25   21 0,25  x 210,251  x 210,25

 x 5  5,25  5 x 6  x 5   260  0,25 280  260  265

Q 2  P50  x 210,50  21 0,50   21 0,50  x 210,501  x 210,50

 x 10  10,5  10 x 11  x 10   340  0,50 380  340  360

Q 3  P75  x 210,75  21 0,75   21 0,75  x 210,751  x 210,75

 x 15  15,75  15 x 16  x 15   480  0,75 490  480  487,5
índice
ClassPad 330
Cálculos Deciles D1 , D3 y D9
Primero se ordenan los datos no agrupados en orden creciente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
120
140
160
240
260
280
290
300
320
340
380
400
420
440
480
490
500
700
840
900
D1
D3
D9

D1  P10  x 210,10  21 0,10   21 0,10  x 210,101  x 210,10

 x 2  2,10  2 x 3  x 2   140  0,10 160  140  142

D3  P30  x 210,30  21 0,30   21 0,30  x 210,301  x 210,30

 x 6  6,30  6 x 7  x 6   280  0,30 290  280  283

D9  P90  x 210,90  21 0,90   21 0,90 x 210,901  x 210,90

 x 18  18,90  18 x 19  x 18   700  0,90 840  700  826
índice
ClassPad 330
Cálculos Percentiles
Primero se ordenan los datos no agrupados en forma creciente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
120
140
160
240
260
280
290
300
320
340
380
400
420
440
480
490
500
700
840
900
P12
P48
P84

P12  x 210,12  21 0,12   21 0,12  x 210,121  x 210,12

 x 2  2,52  2 x 3  x 2   140  0,52 160  140  150,4

P48  x 210,48  21 0,48   21 0,48  x 210,481  x 210,48

 x 10  10,08  10 x 11  x 10   340  0,08 380  340  343,2

P84  x 210,84  21 0,84   21 0,84  x 210,841  x 210,84

 x 17  17,64  17 x 18  x 17   500  0,64 700  500  628
índice
ClassPad 330
Estadísticos de dispersión: Varianza y Desviación Estándar
La Varianza de una muestra es la Desviación Media
Cuadrática de la muestra y trata de sintetizar la tendencia de
los datos a desviarse de la Media de la muestra.
La Desviación estándar se define como la raíz cuadrada de
la varianza.
índice
ClassPad 330
Fórmulas: Varianza y Desviación Estándar
n
 (x  x)
2
i
s2 
Varianza de la muestra en datos no
agrupados
i1
n1
xi  valor de la observación i
x  media de la muestra
n  número de observaciones
k

k

1
s 
(xci  x) fi 
(xci  x)2 fiabs
n  1 i1
i1
2
Varianza de la muestra en datos
agrupados
2
xci  punto medio de la clase i
x  media de la muestra
fi  frecuencia relativa de la clase i
fiabs  frecuencia absoluta de la clase i
k  número de clases
n  número de observaciones
índice
ClassPad 330
Fórmulas: Varianza y Desviación Estándar
n
Varianza de la muestra en datos no
agrupados
Varianza de la muestra en datos
agrupados
s 
2

(xi  x)2
i1
n1
k
s 
2

(xci  x)2 fi
i1
n
 (x  x)
2
Desviación estándar de la muestra en
datos no agrupados
i
s
i1
n1
k
Desviación estándar de la muestra en
datos agrupados
s
 (xc  x) f
2
i
i
i1
índice
ClassPad 330
Cálculos estadísticos: Varianza y Desviación Estándar
n
Varianza de la
muestra en datos
no agrupados

s2  i  1
(xi  x)2
n1

1
(120  400)2  (140  400)2  (160  400)2  ...  (900  400)2
20  1
k
s2 
(xci  x)2 fi  34.739,640(mil Bs.)2

Varianza de la
muestra en datos
agrupados
Desviación
estándar de la
muestra en datos
no agrupados
Desviación
estándar de la
muestra en datos
agrupados
 45.042,105(mil Bs.)2


j1
 (198  408,6)2  0,25  (354  408,6)2  0,40  ...  (822  408,6)2  0,10
n
 (x  x)
2
i
s
i1
n1
 45.042,105  213,23 miles de Bs.
k
s
 (xc  x) f
2
i
i
 34.739,640  186,39 miles de Bs.
i1
índice
ClassPad 330
Cálculos estadísticos Calculadora
x
Media
x
Suma de los datos

Suma de cuadrados
x2
xn
Desviación estándar de la
población
Desviación estándar de la
xn  1 muestra
n
min x
Q1
Med
Q3
Primer cuartil
Mediana
Tercer cuartil
max x Máximo
Mode
Moda
Tamaño de la muestra
Número de elementos
ModeN iguales a la moda de los
datos
Mínimo
ModeF
Frecuencia de la moda de
los datos
índice
ClassPad 330
¿Cómo realizar cálculos estadísticos de dos variables?
(1)
Toque el icono
y se activa la pantalla de la
Aplicación Estadística.
(2)
Toque en la barra de menús [Edit] / [Borrar todo] /
[Acep.] con la finalidad de limpiar todas las páginas de
la Aplicación Estadística y aparece la pantalla inicial
de dicha Aplicación.
(3) Presione [▼] / [5] / [0] / [0] / [EXE] / [2] / [8] / [0] / [EXE]
/ [1] / [4] / [0] / [EXE] / [2] / [4] / [0] / [EXE] / [4] / [0] / [0] /
[EXE] / [9] / [0] / [0] / [EXE] / [8] / [4] / [0] / [EXE] / [4] /
[4] / [0] / [EXE] / [2] / [6] / [0] / [EXE] / [7] / [0] / [0] /
[EXE] / [1] / [2] / [0] / [EXE] / [3] / [8] / [0] / [EXE] / [3] /
[4] / [0] / [EXE] / [3] / [2] / [0] / [EXE] [4] / [2] / [0] / [EXE]
/ [4] / [8] / [0] / [EXE] / [1] / [6] / [0] / [EXE] / [4] / [9] / [0] /
[EXE] / [3] / [0] / [0] / [EXE] / [2] / [9] / [0] / [EXE] para
introducir todos los datos en la lista 1.
índice
ClassPad 330
¿Cómo realizar cálculos estadísticos de dos variables?
(4)
(5)
(6)
(7)
Toque en la barra de menús de la Aplicación
Estadística [Cálc.] / [Una variable] y aparece el
cuadro de diálogo para cálculos estadísticos de una
sola variable.
Toque el botón flecha abajo justo al mismo ListaX: y
seleccione list1.
Toque el botón flecha abajo justo al mismo Frec.: y
seleccione 1.
Toque [Acep.] y aparece el cuadro de diálogo de los
cálculos estadísticos correspondientes a la lista 1.
índice
ClassPad 330
¿Cómo realizar cálculos estadísticos de dos variables?
(8)
Toque el botón
de la barra de desplazamiento y
aparecen los siguientes resultados de los cálculos
estadísticos.
Existe una pequeña diferencia en los resultados de Q1
y Q3 encontrados de manera analítica y los valores
dados por la calculadora.
(9)
Toque el botón
de la barra de desplazamiento y
aparecen los restantes resultados de los cálculos
estadísticos.
índice
ClassPad 330
¿Qué es un Histograma?
La representación de una Tabla igual que la anterior en un
gráfico de barras con alturas proporcionales a la frecuencia
de cada clase y ancho igual a la amplitud de la misma se
llama Histograma.
La observación del Histograma permite tener una visión
cualitativa del comportamiento de la muestra.
En nuestro ejemplo existe una clase más “popular” que se
denomina clase modal, y que corresponde a ingresos entre
276 mil y 432 mil.
Además se observa que los valores tienen cierta tendencia
a agruparse en las clases entre 276 mil y 588 mil.
índice
ClassPad 330
¿Cómo graficar un Histograma?
(1)
Toque en la barra de menús de la Aplicación Estadística
[ConfGráf] / [Opciones...] y aparece el cuadro de diálogo
para configurar gráficos estadísticos.
(2)
Toque el comando on en Dibujo: para activar la
representación gráfica estadística.
(3)
Toque el botón flecha abajo justo al mismo Tipo: y
seleccione Histogr. como tipo de gráfico.
(4)
Toque el botón flecha abajo justo al mismo ListaX: y
seleccione la lista list1 que se representará gráficamente.
(5)
Toque el botón flecha abajo justo al mismo Frec.: y
seleccione 1 como frecuencia de los datos.
índice
ClassPad 330
¿Cómo graficar un Histograma?
(6)
(7)
Toque en el cuadro de diálogo [Def.] / para validar los
cambios realizados.
Toque sucesivamente en la barra de herramientas
para realizar el gráfico estadístico.
Se despliega un cuadro de diálogo donde el valor inicial
está fijado en 120 y la amplitud en 86,667.
(8)
Toque en el cuadro de diálogo [Acep.] para validar los
cambios realizados y aparece en la parte inferior de la
ventana del editor estadístico el histograma
correspondiente.
Por defecto la calculadora considera 9 intervalos y la
amplitud da cada uno es igual al cociente del recorrido
entre dicho número de intervalos, es decir (900–120)/9, o
sea 86,667. El valor mínimo de los datos, 120, es el límite
inferior de la primera clase, y cada límite inferior de cada
clase siguiente se infiere sumando el PasoH = 86,667.
índice
ClassPad 330
¿Cómo graficar un Histograma?
(9)
Toque en la barra de menús [Análisis] / [Trazo] y aparece
en la parte inferior de la pantalla el cursor posicionado en
el punto medio de la base superior correspondiente a la
clase 1, cuyo límite inferior es 120, y cuya frecuencia
absoluta correspondiente es 3.
(10) Toque la tecla direccional [►] y el cursor se ubica en el
punto medio de la base superior correspondiente a la clase
2, cuyo límite inferior es 206,67, y cuya frecuencia absoluta
correspondiente es 4.
índice
ClassPad 330
¿Cómo graficar un Histograma?
(11) Presione la tecla direccional [►] tantas veces como sea
necesario hasta que el cursor se ubique en el límite
inferior de la última clase.
(12) Toque en la barra de herramientas
para regresar al
cuadro de diálogo de definición del intervalo y presione
[▼] / [1] / [5] / [6] / [EXE] para introducir el nuevo valor de
la amplitud 156.
A través del cuadro de diálogo “definir intervalo” de un
histograma se puede estudiar la sensibilidad del
histograma a su número de clases.
índice
ClassPad 330
¿Cómo graficar un Histograma?
(13) Toque en el cuadro de diálogo [Acep.] / para validar los
cambios realizados y aparece en la parte inferior de la
ventana del editor estadístico el histograma
correspondiente.
¿Por qué razón, el histograma diseñado en la parte inferior
de la pantalla, no corresponde exactamente al histograma
obtenido al inicio desde el punto de vista analítico.
(14) Toque en la barra de herramientas
para regresar al
cuadro de diálogo de definición del intervalo y presione [0]
/ [EXE] / [2] / [0] / [0] / [EXE] para introducir el nuevo valor
inicial 0 y la amplitud 200.
índice
ClassPad 330
¿Cómo graficar un Histograma?
(15) Toque en el cuadro de diálogo [Acep.] / para validar los
cambios realizados y aparece en la parte inferior de la
ventana del editor estadístico el histograma
correspondiente.
índice
ClassPad 330
¿Qué es un gráfico de línea a trazos?
Un gráfico de línea a trazos llamado también polígono de
frecuencias se construye a partir del histograma, y consiste
en juntar mediante líneas rectas los puntos medios de las
bases superiores del histograma que corresponden a las
marcas de clase.
índice
ClassPad 330
¿Cómo graficar un gráfico de línea a trazos ?
(1)
Toque en la barra de herramientas de la Aplicación
Estadística
y aparece el cuadro de diálogo para
configurar gráficos estadísticos.
(2)
Toque el comando [on] en Dibujo: para activar la
representación gráfica estadística.
(3)
Toque el botón flecha abajo justo al mismo Tipo: y
seleccione Histogr. como tipo de gráfico.
(4)
Toque el botón flecha abajo justo al mismo ListaX: y
seleccione la lista list1 que se representará gráficamente.
(5)
Toque el botón flecha abajo justo al mismo Frec.: y
seleccione 1 como frecuencia de los datos.
índice
ClassPad 330
¿Cómo graficar un gráfico de línea a trazos ?
(6)
(7)
Toque en el cuadro de diálogo [Def.] / para validar los
cambios realizados.
Toque sucesivamente en la barra de herramientas
para realizar el gráfico estadístico Histogr..
Se despliega un cuadro de diálogo donde el valor inicial
está fijado en 120 y la amplitud en 86,667.
(8)
Presione [▼] / [1] / [5] / [6] / [EXE] para actualizar en 156
el valor de la amplitud de cada intervalo.
índice
ClassPad 330
¿Cómo graficar un gráfico de línea a trazos ?
(9)
Toque en el cuadro de diálogo [Acep.] / para validar los
cambios realizados y aparece en la parte inferior de la
ventana del editor estadístico el Histograma
correspondiente.
(10) Toque en la barra de herramientas
y aparece el cuadro
de diálogo para configurar gráficos estadísticos.
(11) Toque la lengüeta [2] para activar el segundo gráfico
estadístico.
(12) Toque el comando on en Dibujo: para activar la
representación gráfica estadística.
(13) Toque el botón flecha abajo justo al mismo Tipo: y
seleccione L. Trazos como tipo de gráfico.
índice
ClassPad 330
¿Cómo graficar un gráfico de línea a trazos ?
(14) Toque en el cuadro de diálogo [Def.] / para validar los
cambios realizados.
(15) Toque sucesivamente en la barra de herramientas
para realizar el gráfico estadístico Histogr..
(16) Toque [▼] / [1] / [5] / [6] / [EXE] para actualizar en 156 el
valor de la amplitud de cada intervalo.
(17) Toque en el cuadro de diálogo [Acep.] / para validar los
cambios realizados y aparece en la parte inferior de la
ventana del editor estadístico el gráfico de línea a trazos
superpuesto al Histograma.
Se puede observar que el gráfico de línea a trazos junta los
puntos medio de las bases superiores de cada barra del
histograma.
índice
ClassPad 330
¿Qué es un Diagrama de Caja?
Una medida de dispersión, denominada Resumen de 5números, es la constituida por el mínimo valor en la
muestra xmín, el primer cuartil Q1, la mediana Me, el tercer
cuartil Q3 y el máximo valor de la muestra xmáx.
Esta medida de dispersión, usualmente representada
gráficamente en el denominado Diagrama de Caja, es de
gran utilidad, particularmente cuando se comparan muestras
de diferentes poblaciones.
Las cinco cantidades que la definen marcan la dispersión
alrededor de la Mediana; sin embargo, al igual que sucede
con las Tablas, su interpretación es más rica cuando se
presenta en forma gráfica.
El Diagrama de Caja es al Resumen de 5-números lo que
el Histograma es a la Tabla de frecuencias.
índice
ClassPad 330
Construcción del Diagrama de Caja
mín
Q1
Me
Q3
máx
índice
ClassPad 330
Ejemplo: Diagrama de Caja del Ingreso familiar
Primero se ordenan los datos no agrupados en orden creciente
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
120
140
160
240
260
280
290
300
320
340
380
400
420
440
480
490
500
700
840
900
El Resumen de 5-números para estos datos es el siguiente:
Mín  120;Q1  265;Mediana  360;Q3  487,5;Máx  900
120
265
360
487,5
900
índice
ClassPad 330
¿Cómo mejorar un Diagrama de Caja?
Cuando los valores de las barres verticales que identifican los valores
mínimo y máximo de la muestra están muy alejados de Q1 y Q3, se las
ubica a una distancia de éstos no mayores de 1,5 veces el rango
intercuartil Q3 – Q1 y se toma en consecuencia la siguiente decisión:
 si L s  Q 3  1,50(Q 3  Q1 )  x máx entonces L s  x máx

 si L s  Q 3  1,50(Q 3  Q1 )  x máx entonces se eliminan
 todas las observaciones mayores a y L s y L s se ubica
 en el máximo de las que quedan
 si Li  Q1  1,50(Q 3  Q 1 )  x mín entonces Li  x mín

 si Li  Q1  1,50(Q 3  Q 1 )  x mín entonces se eliminan
 todas las observaciones menores a Li y Li se ubica
 en el mínimo de las que quedan
índice
ClassPad 330
¿Cómo mejorar un Diagrama de Caja?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
120
140
160
240
260
280
290
300
320
340
380
400
420
440
480
490
500
700
840
900
Mín  120;Q1  265;Mediana  360;Q 3  487,5;Máx  900
L s  487,5  1,5  (487,5  265)  821,25  900  L s  700
Li  265  1,5  (487,5  265)  68,75  120  Li  120
120
265
360
487,5
700
índice
ClassPad 330
¿Cómo graficar un Diagrama de Caja?
(1)
Toque en la barra de menús de la Aplicación Estadística
[ConfGráf] / [Opciones...] y aparece el cuadro de diálogo
para configurar gráficos estadísticos.
Elimine, si es necesario, todas las ilustraciones gráficas
registradas anteriormente antes de empezar nuevas
representaciones.
(2)
Toque el comando on en Dibujo: para activar la
representación gráfica estadística.
(3)
Toque el botón flecha abajo justo al mismo Tipo: y
seleccione CajaMed como tipo de gráfico.
(4)
Toque el botón flecha abajo justo al mismo ListaX: y
seleccione la lista list1 que se representará gráficamente.
(5)
Toque el botón flecha abajo justo al mismo Frec.: y
seleccione 1 como frecuencia de los datos.
índice
ClassPad 330
¿Cómo graficar un Diagrama de Caja?
(6)
(7)
(8)
Toque en el cuadro de diálogo [Def.] para validar los
cambios realizados.
Toque sucesivamente en la barra de herramientas
para realizar el gráfico estadístico CajaMed en la parte
inferior de la pantalla.
Toque en la barra de menús [Análisis] / [Trazo] y aparece
en la parte inferior de la pantalla el cursor
posicionado
en el valor mínimo de los datos 120.
índice
ClassPad 330
¿Cómo graficar un Diagrama de Caja?
(9)
Presione la tecla direccional [►] y el cursor se ubica en
el primer cuartil Q1 cuyo valor es igual a 270.
(10) Presione la tecla direccional [►] y el cursor se ubica en
el segundo cuartil Q2 (Med) cuyo valor es igual a 360.
índice
ClassPad 330
¿Cómo graficar un Diagrama de Caja?
(11) Presione la tecla direccional [►] y el cursor se ubica en
el tercer cuartil Q3 cuyo valor es igual a 485.
(12) Presione la tecla direccional [►] y el cursor
el valor máximo de los datos 900.
se ubica en
índice
ClassPad 330
¿Cómo graficar un Diagrama de Caja?
(13) Toque en la barra de herramientas
para regresar al
cuadro de diálogo de configuración de gráficos
estadísticos.
(14) Toque el cuadro
para hacer aparecer los
valores atípicos.
(15) Toque en el cuadro de diálogo [Def.] / para validar los
cambios realizados y aparece en la parte inferior de la
pantalla el gráfico estadístico CajaMed modificado con los
nuevos valores de los límites inferior y superior.
índice
ClassPad 330
¿Cómo graficar un Diagrama de Caja?
(16) Toque en la barra de menús [Análisis] / [Trazo] y aparece
en la parte inferior de la pantalla el cursor posicionado
en el valor mínimo de los datos 120.
(17) Presione la tecla direccional [►] y el cursor
se ubica en
el primer cuartil Q1 cuyo valor es igual a 270.
(18) Presione la tecla direccional [►] y el cursor
se ubica en
el segundo cuartil Q2 (Med) cuyo valor es igual a 360.
índice
ClassPad 330
¿Cómo graficar un Diagrama de Caja?
(19) Presione la tecla direccional [►] y el cursor se ubica en
el tercer cuartil Q3 cuyo valor es igual a 485.
(20) Presione la tecla direccional [►] y el cursor
el valor máximo de los datos 700.
se ubica en
(21) Presione la tecla direccional [►] y el cursor
se ubica en
el primer valor que se ha rechazado en el estudio: 840.
(22) Presione la tecla direccional [►] y el cursor
se ubica en
el segundo y último valor que se ha rechazado en el
estudio: 900.
índice
ClassPad 330
¿Cómo graficar un Diagrama de Caja?
(23) Toque en la barra de herramientas
para regresar al
cuadro de diálogo de configuración de gráficos
estadísticos.
(24) Toque la lengüeta [2] para activar el gráfico estadístico 2.
(25) Toque el comando [on] en Dibujo: para activar la
representación gráfica estadística 2.
(26) Toque el cuadro
para hacer desaparecer los
límites inferior y superior en el diagrama de caja.
(27) Toque en el cuadro de diálogo [Def.] y aparece en la parte
inferior de la pantalla el diagrama de caja anterior con sus
límites inferior y superior superpuesto al diagrama de caja
original.
índice
ClassPad 330
¿Cómo calcular intervalo de confianza para la media de una población?
Para estimar un intervalo de confianza para la media de la
población , a partir de la media de la muestra obtenida con
reemplazo, se utiliza la siguiente relación:
x
x
k,n s
n
 x
k,n s
n
 x
k,n s
n
x = media de la muestra;
s = desviación estándar de la muestra;
n = tamaño de la muestra;
kβ,n = factor que depende de la confianza β y del tamaño n
de la muestra.
índice
ClassPad 330
Cálculo del intervalo de confianza para la media de una población
x
x 400 
k,n s
n
2,093  212,23
20
 x
   400 
k,n s
n
 x
2,093  212,23
20
k,n s
n

 300,67    499,33
En consecuencia, se puede decir, con un 95% de confianza,
que la media de la población (desconocida) está en el
intervalo .
índice
ClassPad 330
¿Cómo calcular intervalo de confianza con la calculadora?
(1)
(2)
(3)
(4)
(5)
(6)
Toque en la barra de herramientas
para regresar a la
ventana original del editor de estadísticas.
Toque en la barra de herramientas [Calc.] / [Intervalo].
Toque el botón flecha abajo
justo al mismo Zint
muestra única y seleccione Tint muestra única.
Toque Lista.
Toque el cuadro
para mostrar lo que hace dicho
comando.
Toque la barra de desplazamiento hacia abajo para
mostrar la parte final de dicho comando.
índice
ClassPad 330
¿Cómo calcular intervalo de confianza con la calculadora?
(7)
(8)
(9)
Toque
y aparece el cursor I en Nivel-C (nivel de
confianza); presione [0] / [.] / [9] / [5] / [EXE] para
introducir y validar el nivel de confianza.
Toque el botón flecha abajo
justo al mismo Lista y
seleccione list1 como lista.
Toque el botón flecha abajo
justo al mismo Frec y
seleccione 1 como frecuencia.
(10) Toque





y aparece en la pantalla:
el límite inferior (izquierdo) del intervalo de confianza;
el límite superior (derecho) del intervalo de confianza;
la media de las observaciones de la muestra;
la desviación estándar de la muestra;
el tamaño de la muestra.
índice
ClassPad 330
¿Qué es un diagrama de dispersión?
El diagrama de dispersión de una muestra con observaciones
pareadas es su representación en un gráfico de dos ejes, en
el cual cada observación está representada por un punto
cuyas coordenadas son los valores de las dos variables
correspondientes.
El objetivo principal al diseñar un diagrama de dispersión de
dos variables, es explorar la posible relación que existe entre
ellas.
índice
ClassPad 330
¿Qué es la covarianza entre dos variables?
Cuantifica la covariación entre dos variables de la siguiente
manera:

n
 1 
Cov(X, Y)  

 n  1
 Xi  X   Yi  Y 
i 1
 Si Cov(X,Y)>0 hay una tendencia que a mayores valores de
X correspondan mayores valores de Y.
 Si Cov(X,Y)<0 hay una tendencia que a mayores valores de
X correspondan menores valores de Y.
 Si Cov(X,Y)=0 no se puede concluir que no exista relación
entre ambas variables.
índice
ClassPad 330
¿Qué es el coeficiente de correlación?
Mide la fuerza de asociación lineal entre dos variables de la
siguiente manera:

n
rXY
1

n1
i 1
 Xi  X   Yi  Y 

 

 sX   sY 

Es adimensional

1  rXY  1

rXY  0 no existe correlación lineal entre ambas variables
índice
ClassPad 330
Interpretación del coeficiente de correlación
Tamaño de r
Tipo de relación
r  1
Relación perfecta
0,80  r  0,99
Relación muy alta
0,60  r  0,79
Relación alta
0,40  r  0,59
Relación moderada
0,20  r  0,39
Relación baja
0,10  r  0,19
Relación muy baja
r0
Relación nula
índice
ClassPad 330
Modelo de regresión lineal y ecuación de regresión lineal
Modelo de regresión lineal
Ecuación de regresión lineal
Y    X  e
Ŷ  a  bX
  ordenada al origen
Ŷ  estimado de Y
  pendiente de la recta
a  estimado de 
e  error aleatorio en Y
b  estimado de 

n
Calcular a y b tal que
i1


n
  Yi  Y 
i 1

sea mínima
i


Xi Yi  nXY

n
i 1

2
n
Xi  X
b


2


Yi  Yˆ i 
Y

a

bX


i 
 i


Ŷi
i1 

e2
n
Xi  X

2
i 1
n
a  Y  bX
Xi2  nX2
i 1
índice
ClassPad 330
Modelo de regresión lineal y ecuación de regresión lineal
Yi
Y
ˆ  desviación no explicada
Yi  Y
i
Yi  Y  desviación total
Ŷi
Ŷi  Y  desviación explicada
Y
X
n
  Yi  Y 
i 1
SCT
2
n


ˆ Y
Y
i
i 1
n
  
2
ˆ
Yi  Y
i
i 1
SCR

2
SCE
índice
ClassPad 330
¿Qué es el coeficiente de determinación r2?
 r2 indica el porcentaje de la suma total de cuadrados que
se puede explicar aplicando la ecuación de regresión
lineal.
 Indica la proporción de variación en la variable
dependiente Y, explicado por la variable independiente X.

r2 
SCR Error Explicado

SCT
Error Total
evalúa la bondad de ajuste
para la ecuación de regresión.
índice
ClassPad 330
¿Qué es el coeficiente de determinación r2?
 En un extremo, cuando r2 = 1, la variable independiente X
explica completamente la variación en la variable
dependiente Y. Todas las observaciones caen sobre la
recta de regresión, por lo tanto conocer X permite
predecir Y sin ningún error.
 En el otro extremo, cuando r2 = 0, la variable
independiente X no explica ninguna variación en la
variable dependiente Y. Conocer X no ayuda en la
predicción de Y, ya que las dos variables son totalmente
independientes una de otra.
 Mientras más cerca está r2 al valor 1, mejor es el ajuste
de la recta de regresión a los puntos y más de la variación
en Y explicada por X.
índice
ClassPad 330
¿Qué es el error estándar de la estimación?
 La ecuación no es perfecta sino que está sujeta a error.
 Medida de variabilidad en torno a la recta de regresión.
 El error estándar es la forma de medir la confianza de la
ecuación de estimación que se ha desarrollado.
 El error estándar del estimado mide la variabilidad o
dispersión de los valores observados alrededor de la recta
de regresión.
 En realidad es un promedio de las desviaciones entre el
valor real (Y) y el valor estimado ( Ŷ).
 Representa una medida de variación en torno a la recta
ajustada de regresión.
índice
ClassPad 330
¿Qué es el error estándar de la estimación?

n
sY.X 
1
n2
i 1

n
ˆ
Yi  Y
i

2

1
n2
 Yi   a  bXi  
2
i 1
 Es un error promedio para la predicción de la variable dependiente Y
a partir de la variable independiente X.
 Mientras menor sea el error estándar del estimado, los puntos estarán
más cerca de la recta de regresión y la predicción será mejor.
 Mientras mayor sea el error estándar del estimado, mayor será la
dispersión de los puntos alrededor de la recta de regresión y menor
será su poder de predecir Y, de un valor de X dado.
 Si sY.X = 0, se espera que la ecuación de regresión sea un estimador
perfecto de la variable dependiente. En este caso, todos los datos
puntuales quedarán directamente sobre la recta de regresión y no
habrá puntos fuera de ella. Esto sólo se da cuando la relación es
perfecta, es decir r = 1.
índice
ClassPad 330
¿Cómo graficar un diagrama de dispersión?
(1)
(2)
(3)
(4)
(5)
(6)
Toque en la barra de herramientas
para regresar a la
ventana original del editor de estadísticas.
Presione [2] / [EXE] / [1] / [EXE] / [0] / [EXE] / [0] / [EXE] /
[1] / [EXE] / [5] / [EXE] / [5] / [EXE] / [1] / [EXE] / [2] / [EXE] /
[3] / [EXE] / [0] / [EXE] / [0] / [EXE] / [1] / [EXE] / [2] / [EXE] /
[1] / [EXE] / [3] / [EXE] / [2] / [EXE] / [2] / [EXE] / [2] / [EXE] /
[1] / [EXE] para introducir en la lista 2 todos los datos del
número de automóviles correspondientes a cada ingreso
familiar ya registrado en la lista 1.
Toque en la barra de menús de la Aplicación Estadística
[Cálc.] / [Dos variables] y aparece el cuadro de diálogo
para cálculos estadísticos de una sola variable.
Toque el botón flecha abajo
justo al mismo ListaX: y
seleccione list1.
Toque el botón flecha abajo
justo al mismo ListaY: y
seleccione list2.
Toque el botón flecha abajo
justo al mismo Frec.: y
seleccione 1.
índice
ClassPad 330
¿Cómo graficar un diagrama de dispersión?
(7)
Toque [Acep.] y aparece el cuadro de diálogo con los
resultados de los cálculos estadísticos de dos variables
correspondientes a las listas 1 y 2.
(8)
Toque el botón
de la barra de desplazamiento y
aparecen los siguientes resultados de los cálculos
estadísticos.
índice
ClassPad 330
¿Cómo graficar un diagrama de dispersión?
(9)
Toque el botón
de la barra de desplazamiento y
aparecen los restantes resultados de los cálculos
estadísticos.
(10) Toque [Acep.] para regresar a la pantalla original antes de
realizar los cálculos estadísticos con dos variables.
(11) Toque en la barra de menús de la Aplicación Estadística
[ConfGráf] / [Opciones...] y aparece el cuadro de diálogo
para configurar gráficos estadísticos.
(12) Toque el comando on en Dibujo: para activar la
representación gráfica estadística.
(13) Toque el botón flecha abajo justo al mismo Tipo: y
seleccione Disper. como tipo de gráfico.
índice
ClassPad 330
¿Cómo graficar un diagrama de dispersión?
(14) Toque el botón flecha abajo
justo al mismo ListaX: y
seleccione la lista list1.
(15) Toque el botón flecha abajo
justo al mismo ListaY: y
seleccione la lista list2.
(16) Toque el botón flecha abajo
justo al mismo Frec.: y
seleccione 1 como frecuencia de los datos.
(17) Toque el botón flecha abajo
justo al mismo Marca: y
seleccione Cuadrado como forma de representación de los
puntos en el diagrama de dispersión.
(18) Toque [Def.] /
y aparece en la parte inferior de la
pantalla el gráfico de dispersión.
índice
ClassPad 330
¿Cómo graficar un diagrama de dispersión?
(19) Toque en la barra de menús [Análisis] / [Trazo] y aparece
en la parte inferior de la pantalla el cursor posicionado en
el primer punto de coordenadas (500, 2).
(20) Presione la tecla direccional [►] tantas veces como sea
necesario hasta que el cursor se ubique en el último punto
de coordenadas (290,1).
índice
ClassPad 330
¿Cómo graficar la recta de regresión lineal?
(21) Toque en la barra de menús de la Aplicación Estadística
[Cálc.] / [Regresión lineal] y aparece el cuadro de
diálogo para cálculos estadísticos.
(22) Toque el botón flecha abajo
seleccione la lista list1.
justo al mismo ListaX: y
(23) Toque el botón flecha abajo
seleccione la lista list2.
justo al mismo ListaY: y
(24) Toque el botón flecha abajo justo al mismo Frec.: y
seleccione 1 como frecuencia de los datos.
(25) Toque el botón flecha abajo justo al mismo Copiar
fórmula: y seleccione y1 como función.
(26) Toque el botón flecha abajo justo al mismo Copia
residual: y seleccione list3 como lista que contendrá los
cálculos residuales.
índice
ClassPad 330
¿Cómo graficar la recta de regresión lineal?
(27) Toque [Acep.] y aparecen en la pantalla los resultados
correspondientes a los cálculos de la regresión lineal: la
pendiente de la recta de regresión lineal (a); el término
constante (b); el coeficiente de correlación (r); el coeficiente
de determinación (r2 ); el error cuadrático medio (MSe).
(28) Toque [Acep.] y aparece en la pantalla de la parte inferior
la recta de regresión lineal, y en la lista 3 todos los
cálculos de los residuos correspondientes a Yi  Yˆi .
índice
ClassPad 330
¿Cómo graficar la recta de regresión lineal?
(29) Toque la parte inferior de la pantalla para activarla,
seguidamente toque en la barra de herramientas [Análisis]
/ [Trazo] / [6] / [0] / [0] / [EXE] / [Acep.] con la finalidad de
estimar el valor de la variable dependiente Y para un valor
determinado 600 de la variable independiente X. En la
parte baja de la pantalla aparece el valor de Y: 2,81.
Si se realiza el mismo procedimiento, pero con el valor
1.000, aparece en la pantalla el mensaje “argumento
erróneo”, en vista de que la calculadora no permite realizar
extrapolaciones fuer del rango [120,900]. Se puede realizar
el cálculo del valor de Y cuando la variable X toma el valor
1.000 a través de la Aplicación Principal y de la función y1
donde se registró la ecuación de la recta de regresión.
índice
ClassPad 330
¿Cómo extrapolar?
(30) Toque en el panel de iconos
para activar la Aplicación
Principal.
(31) Toque en la barra de herramientas
para hacer aparecer
el registro de las funciones.
(32) Toque en la barra de menús [Edit] / [Seleccionar todo] /
[Edit] / [Copiar].
(33) Toque el rectángulo y seguidamente [Edit] / [Pegar] con la
finalidad de copiar la función y1.
(34) Presione el teclado virtual y toque [OPC] / [I] / [X] / [=] / [1] /
[0] / [0] / [0] / [EXE] y aparece en la pantalla el resultado del
cálculo.
Se muestra a continuación los cálculos que conllevan a la ecuación de
la recta de regresión lineal a partir de la Aplicación Principal con la
finalidad de verificar los resultados obtenidos a través de la Aplicación
Estadística.
índice
ClassPad 330
¿Cálculo de la ecuación de la recta de regresión lineal a través de la
Aplicación Principal?
Toque el icono
del panel de iconos y se abre
la Aplicación Principal. Toque en la barra de
menús [Edit] / [Borrar todo] / [Acep.] con la
finalidad de limpiar la pantalla de dicha
Aplicación. A través del teclado de catálogo
del teclado virtual
introduzca list 1 y list 2
donde están almacenados los valores de las
variables X e Y respectivamente, tocando
inmediatamente después de la introducción de
cada lista el comando
.
índice
ClassPad 330
¿Cálculo de la ecuación de la recta de regresión lineal a través de la
Aplicación Principal?
La instrucción
calcula y reduce
a su mínima expresión
la suma de los
n

2
cuadrados de L  S    Yi   aXi  b   .

i 1

La instrucción
calcula y
reduce a su mínima expresión la derivada
parcial de S con respecto a la variable a.
La instrucción
calcula y
reduce a su mínima expresión la derivada
parcial de S con respecto a la variable b.
índice
ClassPad 330
¿Cálculo de la ecuación de la recta de regresión lineal a través de la
Aplicación Principal?
La instrucción
calcula el par de
valores (a,b) que anulan ambas derivadas
parciales.
Se trabaja la inicio con dos cifras decimales, y
luego se aumenta a cinco cifras decimales para
tener más precisión.
Se puede verificar que se encuentran los
mismos valores que en la Aplicación
Estadística.
índice
ClassPad 330
Ejercicio 1
La siguiente tabla contiene información sobre volúmenes
de vehículos en cierta carretera turística durante 52 días
domingo:
Volumen de vehículos
2.084
551
977
1.301
2.004
951
1.848
11.018
2.479
570
1.650
1.752
22.008
25.010
3.098
653
2.098
949
900
1.503
1.579
2.280
604
638
2.299
2.231
882
2.344
4.302
3.472
3.614
3.792
4.501
5.040
3.404
591
1.509
974
1.051
1.199
1.221
2.418
3.250
2.499
699
638
3.303
2.998
3.152
16.140
16.753
15.250
índice
ClassPad 330
Ejercicio 1
a) Construya un histograma, polígono de frecuencias
acumuladas, diagrama de tallo.
b) Calcule la media, la mediana, la varianza, la desviación
estándar, el percentil-10, el percentil-20, Q1, Q3, el
coeficiente de asimetría, el diagrama de caja y el
resumen de 5 números.
c) Agrupe los datos en las siguientes 11 clases: 0-1.999;
2.000-3.999; 3.000-4.999;.....; 18.000-19.999; 20.000 o
más. Considere que esta información agrupada es la
única disponible y determine las cuatro medidas
anteriores. Compare estos resultados con los obtenidos
en la pregunta anterior. Y explique a qué se debe la
diferencia.
Nota: Para los puntos medios de las clases considere los
valores 1.000, 3.000, etc.
índice
ClassPad 330
Ejercicio 2
Los inversores en acciones tienden a diversificar sus
carteras de valores (es lo que se conoce como “no poner
todos los huevos en un mismo cesto”). Una entidad
bancaria desea comprobar si esa tendencia se da entre
ocho de sus clientes, y para ello recaba información sobre
los diferentes tipos de acciones que tienen y los millones de
pesetas que han invertido en las mismas. Se obtienen los
siguientes resultados:
X = tipos de
acciones
Y = millones de
pesetas
12
8
10
11
7
7
10
14
58
42
51
54
40
39
49
56
índice
ClassPad 330
Ejercicio 2
a) Existe una asociación lineal entre las variables?
b) Calcule la recta de regresión lineal de Y (millones de
pesetas) sobre X (tipos de acciones).
c) Dé una interpretación verbal a los valores de a y b
encontrados en la pregunta anterior.
d) Calcule la recta de regresión lineal de X (tipos de
acciones) sobre Y (millones de pesetas).
e) Dé una interpretación verbal a los valores de a y b
encontrados en la pregunta anterior.
f)
Si el modelo lineal fuese adecuado para hacer
predicciones, ¿cuántos millones de pesetas podría
invertir un cliente que quisiera diversificar su cartera con
nueve tipos de acciones?
índice
Descargar