Estadística I - Instituto Wiener

Anuncio
INSTITUTO SUPERIOR
TECNOLÓGICO
NORBERT WIENER
Manual del Alumno
ASIGNATURA:
Estadística I
Lima-Perú
2
Manual del Alumno
Los hombres dudan muchas veces antes de dar el
primer paso, porque piensan que no podrán alcanzar la
meta que se han propuesto. Esta actitud es el principal
obstáculo que se opone a su progreso, y que cada uno
de nosotros con un pequeño esfuerzo de voluntad puede
vencer.
Mahatma Gandhi
CURSO: ESTADISTICA I
CICLO III
3
Manual del Alumno
ESTADISTICA I
Índice General
Pag N°
1. Estadística General ............................................................ 5
2. Estadística Descriptiva....................................................... 7
3. Las Variables Estadísticas..................................................10
4. La Organización de los Datos…….....................................11
5. Práctica Calificada……..........................................................
6. Presentación de los Datos...................................................24
7. Estadígrafos de Tendencia Central.................................... 25
8. Estadígrafos de Tendencia Central .................................. 29
9. Estadígrafos de Tendencia No Central.…………..………35
11 Estadígrafos de Dispersión………………………….........41
CURSO: ESTADISTICA I
CICLO III
4
Manual del Alumno
12. Distribución Bidimensional ............................................. .34
14. Regresión Lineal…....……….............................................45
15. Regresión Lineal - Análisis de Correlación ……...............49
16. Análisis de Regresión Lineal .............................................65
17. Números Indices ................................................................75
Problemas resueltos……..…………... ...................................83
10.
Problemas propuestos…..…….………………………….90
CURSO: ESTADISTICA I
CICLO III
5
Manual del Alumno
SESION #1
CAPITULO I – ESTADISTICA GENERAL
DEFINICION Y CLASIFICACION DE LA ESTADISITICA
ESTADISTICA:
Es una ciencia aplicada a cualquier tema del
saber humano y se encarga de recopilar, ordenar, clasificar y
presentar una información llamada Muestra, con el fin de inferir
acerca del comportamiento de una población.
La Estadística se clasifica en:
1. Estadística Descriptiva; es la que se encarga de recopilar,
ordenar, clasificar y presenta una información, llamada muestra
aleatoria.
2. Estadística Inferencial; es la parte de la Estadística que se
encarga de inferir sobre el comportamiento de una población a
partir de una muestra, bajo un margen de error o incertidumbre
que es cuantificado por la teoría de probabilidades.
CONCEPTOS FUNDAMENTALES EN ESTADISTICA
POBLACION:
Es un conjunto de observaciones que tienen
una característica en común la cual se desea estudiar, la población
representa la totalidad de elementos de un determinado estudio y
puede ser finita o infinita.
Ejemplos:
1. Habitantes de Lima (aptos para el sufragio).
Infinita
CURSO: ESTADISTICA I
CICLO III
Población
6
Manual del Alumno
2. Alumnos de WIENER (altura en mts.)
Población Finita
Una población si es infinita no se puede estudiar en forma completa;
aún si es finita es muy engorroso estudiarla en forma completa por
que involucra pérdida de tiempo, dinero, etc., por esta razón nos
basamos en una muestra aleatoria.
MUESTRA
Es un subconjunto de la población y para que la muestra sea
representativa debe ser aleatoria o no sesgada.
Una muestra es aleatoria cuando cada elemento de la población tiene la
misma posibilidad de ser seleccionado en la muestra.
La demostraremos por: n= tamaño de la muestra ó número total de
observaciones en la muestra.
Ejemplos:
1. Encuesta a 900 personas de Lima aptos para el sufragio.
n = 900
2. Altura (mts) de 45 alumnos de WIENER
n = 45.
PARAMETRO
Número que representa a la población. Este valor generalmente es
estimado a partir de una muestra, porque para que sea calculado
exactamente se requiere de la información completa de una población lo
cual es muy difícil (los procesos de estimación de parámetros será tema
de estudio en Estadística Inferencial).
ESTADIGRAFO
Llamado también estadístico o estimador. Número que representa a la
muestra y que puede ser calculado teniendo la información de una
muestra. Los Estadígrafos se dividen en:
CURSO: ESTADISTICA I
CICLO III
7
Manual del Alumno
1. Estadígrafos de Posición o Tendencia Central: Son aquellos
números que tienden al centro de las observaciones.
2. Es tadígrafos de Dispersión: Son aquellos números que
cuantifican la variabilidad de las observaciones de una muestra.
DATO:
Es la recopilación o anotación de cada característica de las observaciones
de una muestra.
Ejemplo:
Altura (mts) de n=5 alumnos de WIENER: 1.65, 1.59, 1.68, 1.63,
1.69.
SESION # 2
CAPITULO II – ESTADISTICA DESCRIPTIVA
La Estadística Descriptiva, se encarga de recopilar la información
de una muestra aleatoria, esta información tiene que ser ordenada
para una buena presentación; Esta ordenación se basa en las
llamadas Tablas de Frecuencias y también en los Gráficos
Estadísticos.
RECOPILACION DE DATOS
Es el momento en el cual el investigador se pone en contacto con los
objetos o elementos sometidos a estudio, con el propósito de obtener
datos o respuestas de las variables consideradas; a partir de estos
CURSO: ESTADISTICA I
CICLO III
8
Manual del Alumno
datos o respuestas se calculan los Estadígrafos o indicadores
estadísticos.
FUENTES DE DATOS
La fuente de datos, es el lugar, la institución, las personas o
elementos donde están o que poseen los datos que se necesitan para
cada uno de las variables o aspectos de la investigación o estudio.
En general, se puede disponer de cinco tipos de fuentes de datos:
1.
Las Oficinas de Estadística.- Como instituciones responsables
de recopilar, procesar y publicar las estadísticas sociales o
nacionales.
2. Archivos o Registros Administrativos.- Como el Registro Civil,
Electoral, Escalafón o Personal, Padrón de Contribuyentes, etc..
Estos registros no tienen fines Estadísticos, su función es de
tipo legal y administrativo, sin embargo pueden utilizarse como
fuentes de datos estadísticos.
3. Documentos.- Boletines, e informes estadísticos que son las
publicaciones o estudios que preparan los organismos
especializados.
4. Encuestas y Censos.- Son fuentes directas y especiales, que se
construyen en un momento determinado, recopilando datos de
una parte o de la totalidad de una población.
5. Los Elementos o Sujetos.- Son aquellos que están sometidos a
un estudio, pueden ser personas, instituciones, animales u
objetos.
CURSO: ESTADISTICA I
CICLO III
9
Manual del Alumno
TECNICAS DE RECOPILACION O RECOLECCION DE
DATOS
Es el conjunto de métodos y procedimientos que se llevan a cabo
para recolectar los datos.
Las más frecuentes técnicas utilizadas son:
1. La Observación.- Es la acción de mirar de mirar en forma
sistemática y profunda, con el interés de descubrir la importancia
de aquello que se observa.
2. La Técnica Documental.- Es aquella que busca datos a través de
documentos, fuentes escritas o gráficas de todo tipo. Ejm.:
Libros, Informes, Autobiografías, fotografías, planos, videos, etc.
3. La Entrevista.- Es la interrelación o diálogo entre personas,
donde una de ellas se llama Entrevistador o Encuestador quien
solicita a otra persona llamada Entrevistado o Encuestado le
proporcione algunos datos o información.
4. El Cuestionario.- Es un instrumento constituido por un conjunto
de preguntas sistemáticamente elaboradas, que se formulan al
Entrevistado o Encuestado, con el propósito de obtener los datos
de las variables consideradas en el estudio. El Cuestionario se
desarrolla en el Formulario o Cédula, en donde las preguntas
están debidamente organizadas.
5. La Encuesta.- Es la técnica por la cual se obtiene la información
tal como se necesita, preparada exprofesamente y con objetivo
estadístico. Permite observar y registrar características en las
unidades de análisis de una determinada población o muestra,
CURSO: ESTADISTICA I
CICLO III
10
Manual del Alumno
delimitada en el tiempo y en el espacio. El Entrevistado da
respuesta a las preguntas en el formulario o Cédula..
SESION # 3
CAPITULO III – LAS VARIABLES ESTADISTICAS
LA VARIABLE:
Es la representación simbólica de los datos.
Ejemplo:
Sea X: altura de 5 alumnos de WIENER Donde:
X1= 1.65 mts., X4 = 1.63 mts.
Xi, i= 1 a 5
Las variables se clasifican en:
I.
Variable Cualitativa: Es aquella variable que representa a
datos que indican cualidades, características, propiedades,
etc., no son numéricas (no medibles).
Ejemplos:
X=
Control de calidad de productos de una industria. Bueno,
Malo, Regular, Muy Bueno.
Y=
Estado Civil de una muestra de 200 personas. Soltero, Casado,
Viudo, Divorciado.
II.
Variable Cuantitativa: Es aquella variable que representa a
datos que indican valores numéricos (son medibles), y se
clasifican en:
CURSO: ESTADISTICA I
CICLO III
11
Manual del Alumno
Variable Discreta: Es aquella que representa a datos
numéricos que no se pueden fraccionar, sirven para contar o
enumerar (pertenecen a los reales).
Variable Continua: Es aquella variable que representa a
datos que pueden ser fraccionados (pertenecen a los reales).
Ejemplo:
El Peso (Kg.) de 6 personas.
65, 56, 59, 70, 63.
La variable continua es la que más utilizamos, especialmente para los
estudios correspondientes en Ingeniería (Volumen, Temperatura,
Pesos, Mediciones, etc.).
SESION # 4
CAPITULO IV – LA ORGANIZACIÓN DE LOS DATOS
Distribución o Tablas de Frecuencias: Es la condensación,
simplificación, ordenación, del conjunto de observaciones que
forman la muestra; la característica principal es no perder ningún
dato de la muestra.
También se puede decir que la Distribución de Frecuencia es la
representación estructurada, en forma de tabla, de toda la
información que se ha recogido sobre la variable que se estudia.
Categorías o Clases.- Son los datos que están agrupados por sus
características comunes.
CURSO: ESTADISTICA I
CICLO III
12
Manual del Alumno
Frecuencia de Clases.- Es el número o cantidad de datos que
componen una Categoría o Clase. Las Frecuencias se clasifican en :
1. Frecuencia Absoluta (Simple).- Representa a la cantidad de datos
de cada Clase.
2. Frecuencia Absoluta Acumulada.- Representa a la suma en
forma acumulativa de Clase en Clase de sus respectivas
Frecuencias Absolutas.
3. Frecuencia Relativa (Simple) .- Es el % que representa a la
cantidad de datos de una Clase con respecto al total de datos.
4. Frecuencia Relativa Acumulada.- Representa a la suma en forma
acumulativa de Clase en Clase de sus respectivas Frecuencias
Relativas.
Veamos un ejemplo (4.1) :
Medimos la altura de los niños de una clase y obtenemos los
siguientes resultados (cm):
Alumno Estatura Alumno Estatura Alumno Estatura
x
x
X
x
x
x
Alumno 1
1,25
Alumno 11
1,23
Alumno 21
1,21
Alumno 2
1,28
Alumno 12
1,26
Alumno 22
1,29
Alumno 3
1,27
Alumno 13
1,30
Alumno 23
1,26
Alumno 4
1,21
Alumno 14
1,21
Alumno 24
1,22
Alumno 5
1,22
Alumno 15
1,28
Alumno 25
1,28
Alumno 6
1,29
Alumno 16
1,30
Alumno 26
1,27
Alumno 7
1,30
Alumno 17
1,22
Alumno 27
1,26
Alumno 8
1,24
Alumno 18
1,25
Alumno 28
1,23
Alumno 9
1,27
Alumno 19
1,20
Alumno 29
1,22
Alumno 10
1,29
Alumno 20
1,28
Alumno 30
1,21
Si presentamos esta información estructurada obtendríamos la
siguiente Tabla de Frecuencias:
CURSO: ESTADISTICA I
CICLO III
13
Manual del Alumno
Variable
(Valor)
X
Frecuencias Absolutas
Frecuencias Relativas
Simple
Acumulada
Simple
Acumulada
X
X
X
x
1,20
1
1
3,3%
3,3%
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
4
4
2
1
2
3
3
4
3
3
5
9
11
12
14
17
20
24
27
30
13,3%
13,3%
6,6%
3,3%
6,6%
10,0%
10,0%
13,3%
10,0%
10,0%
16,6%
30,0%
36,6%
40,0%
46,6%
56,6%
66,6%
80,0%
90,0%
100,0%
Si los valores que toma la variable son muy diversos y cada uno de
ellos se repite muy pocas veces, entonces conviene agruparlos por
intervalos, ya que de otra manera obtendríamos una tabla de
frecuencia muy extensa que aportaría muy poco valor a efectos de
síntesis.
Según los tipos de variables y formas de la tabla de frecuencias,
tendremos las siguientes Tablas de frecuencias
1ER. CASO: Tablas de Frecuencias para la variable Cualitativa:
En este caso como la variable cualitativa indica cualidades, propiedades,
etc., y no son medibles; entonces se agrupa de acuerdo a cada categoría
que se diferencia en la variable cualitativa. (Sin un orden establecido).
Ejemplo: (4.2).
CURSO: ESTADISTICA I
CICLO III
14
Manual del Alumno
Se tiene la siguiente información que representa el Estado Civil de 50
personas encuestadas (edad; 20-30 años).
Estado Civil
Soltero
Casado
Viudo
Divorciado
Conviviente
No. de personas
25
10
1
6
8
%
50%
20%
2%
12%
16%
Los gráficos que se presentan en este caso son los siguientes:
30
25
20
15
ESTADO CIVIL
CURSO: ESTADISTICA I
CICLO III
Divorciado
Viudo
Casado
5
0
Conviviente
10
Soltero
N° DE PERSONAS
1). Diagrama de barra:
15
Manual del Alumno
2. Gráfico por Sectores Circulares.
PORCENTAJES
Soltero
Conviviente
Divorciado
Viudo
Casado
2DO. CASO: Tabla de frecuencia para la variable discreta y n < 30 :
En este caso la variable es discreta y la muestra pequeña, además hay
que considerar que no haya muchos datos diferentes. La Tabla de
frecuencias es por CLASES, donde cada clase representa el valor
numérico de la variable.
CURSO: ESTADISTICA I
CICLO III
16
Manual del Alumno
La tdf es de la sgte. forma general:
Clase Xi
x1
x2
.
.
.
Xm
Fi
f1
f2
.
.
.
Fm
Fi
F1
F2
.
.
.
Fm=n
hi
h1
h2
.
.
.
hm
Hi
H1
H2
.
.
.
.Hm=1
Donde:
n = numero de clases o intervalos de clase.
fi = frecuencia absoluta: es el número de observaciones que hay en
cada clase o intervalo de clase. Además:
fi+f2+f3+. ...+ fm =n
m
fi = n
i=1
Fi = frecuencia absoluta acumulada: es el numero de observaciones
acumuladas hasta la clase i, es decir:
F1=f1
F2=f1+f2
.
.
CURSO: ESTADISTICA I
CICLO III
17
Manual del Alumno
Fm=f1+f2+f3...+fm =
hi = frecuencia relativa: representa la relación que existe entre la
frecuencia absoluta y el número total de observaciones:
hi
fi
n
Generalmente la frecuencia relativa se expresa en forma porcentual:
hi % = 100%.
Hi = frecuencia relativa
acumuladas hasta la clase i.
acumulada:
Hi=h1
H2=h1+h2
.
.
Hm=h1+h2+....hm=1
También :
Hi
Fi
n
Se expresa en forma porcentual. Hi x 100%
Ejemplo:
CURSO: ESTADISTICA I
CICLO III
frecuencias
relativas
18
Manual del Alumno
Los siguientes datos representan el numero de defectos en 15
diskettes: 5, 10, 5, 11,6,6,3,3,3,5,5,5,10,6,3.
Agrupar en tabla de frecuencias:
Solución:
Como la muestra es pequeña y la variable representa a datos
discretos, entonces agrupamos en clases:
No de
Defectos
Xi
3
5
6
10
11
No. diskettes
fi
Fi
hi%
Hi%
4
5
3
2
1
4
9
12
14
15
26.7
33.3
20.0
13.3
6.7
23.7
60.0
80.0
93.3
100.0
Los gráficos que se presentan en este 2do. Caso son:
1. Histograma de frecuencias: En el sistema de coordenadas
rectangulares comparamos Xi vs. fi (o hi%).
CURSO: ESTADISTICA I
CICLO III
19
Manual del Alumno
N° DE DISKETTES
HISTOGRAMA
6
4
2
0
3´
5´
6´
10´
11´
DEFECTOS
3ER. CASO: Tabla de frecuencias por intervalos de clase:
En este caso generalmente la variable es continua, también puede ser
usado para la variable discreta siendo la muestra grande
(generalmente n >= 30).
La tdf tiene la siguiente forma:
Intervalos
(Li - Ls)
[X’o - X’1>
[X’1 -
X’2>
.
.
.
.
.
[X’m-1- X’m]
Donde:
CURSO: ESTADISTICA I
CICLO III
Xi
Fi
Fi
hi
Hi
X1
X2
.
.
.
.
.
Xm
f1
f2
.
.
.
.
.
Fm
F1
F2
.
.
.
.
.
Fm
h1
h2
.
.
.
.
.
hm
H1
H2
.
.
.
.
.
Hm
20
Manual del Alumno
X i= marca de clase o punto medio de cada intervalo de clase, se
obtiene mediante la semisuma de los limites de cada intervalo.
X i = Ls + Li
2
fi , Fi, hi, Hi ; representan las frecuencias definidas en el caso
anterior.
Procedimiento para construir una tdf por intervalos de clase:
1er. Paso:
Calcular el número de intervalos de clase (K):
Para calcular el valor de K, tenemos dos criterios:
a) Criterio personal; de acuerdo a la experiencia del investigador se
puede asumir un valor de m para un tamaño de muestra determinado.
b) Mediante la Regla de Sturges:
K =1 +3.3 log. n
2do. Paso:
Calcular la amplitud o tamaño del intervalo de clase:(A)
Para calcular la amplitud del intervalo (A) nos basaremos en la siguiente
expresión:
CURSO: ESTADISTICA I
CICLO III
21
Manual del Alumno
A = Rango de la muestra
K
donde: Rango de la muestra = Valor Mayor – Valor Menor
Con este procedimiento calculamos una amplitud que será constante
para cada intervalo, y lo mismo ocurrirá entre cada marca de clase.
Los intervalos serán de la forma: [Li Ls], pudiendo ser considerado
cerrado en el último intervalo.
La amplitud A es preferible que sea redondeada considerando la
misma cantidad de decimales que tengan los dato de la muestra.
3er. Paso: Tabulaciones
Tabular y presentar los datos agrupados en la tdf.,
Ejemplos: (2.3)
Los siguientes datos representan el peso (gr.) de 35 sobrecitos de
unas sustancias: 68, 73, 61, 46, 49, 96, 68, 90, 97, 53, 75, 93, 72, 60,
71, 75, 74, 75, 71, 77, 83, 68, 85, 76, 88, 59, 78, 62, 55, 48, 43, 47,
60, 84, 80. Agrupar en tdf.
Solución:
1) Calculamos K = 1 +3,3 Log 35 = 6.095 = 6
2) Calcula la amplitud del intervalo A:
CURSO: ESTADISTICA I
CICLO III
22
Manual del Alumno
A
3) Tabular en tdf:
Peso (grs)
[43 – 52>
[52 – 61>
[61 – 70>
[70 – 79>
[79 – 88>
[88 – 97]
Xi
47.5
56.5
65.5
74.5
83.5
92.5
97 43
6
A
=
9
9
fi
5
5
5
11
4
5
Fi
5
10
15
26
30
35
hi%
14.3
14.3
14.3
31.4
11.4
14.3
Hi%
14.3
28.6
42.9
74.3
85.7
100.0
Se observa por ejemplo que: 11 sobrecitos tienen un peso
comprendido en el intervalo [70-79> grs. y representan el 31.4% del
total.
También vemos que 15 sobrecitos pesan menos de 70 grs. y
representan el 42.9% del total.
CURSO: ESTADISTICA I
CICLO III
23
Manual del Alumno
SESION # 5
PRIMERA PRACTICA CALIFICADA
SESION # 6
PRESENTACION DE DATOS
LOS GRAFICOS
Los gráficos son representaciones en forma de figuras geométricas,
de superficie o volumen con el objeto de ilustrar los cambios o
dimensión de una variable, para comparar visualmente dos o más
variables similares o relacionadas. Para una rápida comprensión de
situaciones o variaciones en cantidades, es muy útil traducir los
números en gráficos o imágenes. Por su naturaleza, un gráfico no
toma en cuenta los detalles y no tiene la misma precisión que una
tabla estadística.
Veamos algunos tipos de Gráficos :
1. Histograma de frecuencias: Representa un conjunto de
rectángulos levantados desde cada intervalo de clase hasta la
frecuencia correspondiente (absoluta ó relativa).
2. Polígono de frecuencias: Consiste en unir los puntos medios ó
marcas de clase levantadas hasta cada frecuencia correspondientes,
generalmente para su construcción nos podemos basar del
Histograma de frecuencias.
Propiedad: Area del Histograma = Area del Polígono de
frecuencia.
CURSO: ESTADISTICA I
CICLO III
24
Manual del Alumno
3. Ojiva: Se construye basándose en un diagrama escalonado, es
decir considerando las frecuencias acumuladas (absoluta ó relativa),
y uniendo los límites de cada intervalo.
HISTOGRAMA Y POLIGONO DE FRECUENCIAS
HISTOGRAMA DE FRECUENCIAS
fi
12.00
10.00
8.00
6.00
4.00
2.00
0.00
.47.5 .56.5 .65.5 .74.5 .83.5 .92.5
Xi
SESION # 7
LOS ESTADIGRAFOS DE TENDENCIA CENTRAL
Se llaman así, porque tienden a ubicar el centro de las observaciones;
Estos estadígrafos de posición son: media, mediana, moda, media
geométrica, media armónica, etc. Estudiaremos los más importantes:
CURSO: ESTADISTICA I
CICLO III
25
Manual del Alumno
X
1. La Media Aritmética
Llamada también promedio, es el estadigrafo de posición más
simple y fácil de calcular, por eso es el más común.
Se calcula teniendo en cuenta los siguientes casos:
1er. Caso: Datos no agrupados en tablas de frecuencias:
Sean X1, X2............, Xn variables que representan los n datos de una
muestra, la media aritmética se calcula:
n
X
i
Xi
1 n
2do. Caso: Datos Agrupados en tabla de frecuencias:
En este caso se calcula mediante la siguiente fórmula:
Xi * fi
X
n
fi = frec. Absoluta
hi = frec. Relativa
.
O
también:
X
CURSO: ESTADISTICA I
CICLO III
Xi * hi
26
Manual del Alumno
hi = frec. Relativa
PROPIEDADES DE LA MEDIA ARITMETICA
1. La media de los datos todos iguales a una misma constante es
igual a la constante:
Sea K = cte.
y cada Xi = k -----------------
X
X (K )
2. Si a cada dato e le suma o resta una constante k, la media queda
sumada o restada por dicha constante:
Si Xi = Xi + K -------------------- X(Y) = X(X+k) = X (X) + k
3. Si a cada dato se le multiplica o divide por una constante k, la
media queda multiplicada o dividida por dicha constante.
4. Sí Yi = Xi* k ------------------------- X(Y) = X(X* k) = X (X) * k
NOTA. Todas las propiedades cumplen para datos agrupados y
no agrupados
CURSO: ESTADISTICA I
CICLO III
K
27
Manual del Alumno
( Xi X )
Datos no agrupados
0
( Xi X ) * fi
0
Datos agrupados
5. La suma de las desviaciones respecto a la media
CURSO: ESTADISTICA I
CICLO III
es igual a cero.
28
Manual del Alumno
SESION # 8
ESTADIGRAFOS DE TENDENCIA CENTRAL
2. Media Geométrica: se eleva cada valor al número de veces que
se ha repetido. Se multiplican todo estos resultados y al producto
final se le calcula la raíz "n" (siendo "n" el total de datos de la
muestra).
Según el tipo de datos que se analice será más apropiado utilizar la
media aritmética o la media geométrica.
La media geométrica se suele utilizar en series de datos como tipos
de interés anuales, inflación, etc., donde el valor de cada año tiene un
efecto multiplicador sobre el de los años anteriores. En todo caso, la
media aritmética es la medida de posición central más utilizada.
Lo más positivo de la media es que en su cálculo se utilizan todos los
valores de la serie, por lo que no se pierde ninguna información.
Sin embargo, presenta el problema de que su valor (tanto en el caso
de la media aritmética como geométrica) se puede ver muy influido
por valores extremos, que se aparten en exceso del resto de la serie.
Estos valores anómalos podrían condicionar en gran medida el valor
de la media, perdiendo ésta representatividad.
CURSO: ESTADISTICA I
CICLO III
29
Manual del Alumno
3. La Mediana (Me) :
Es aquel estadígrafo de posición que divide en dos partes
iguales al conjunto de observaciones; es decir la mediana
representa el valor central de una distribución de datos
ordenados en forma creciente o decreciente.
1er. Caso: Datos No agrupados en TDF:
Primero se ordena los datos en forma creciente o decreciente
y luego se tiene en cuenta sí:
a) n es impar. La mediana es el valor central.
Me
X
n 1
2
Es el elemento que ocupa la
posición (n+1) /2
Ejemplo: Calcular la Me de los siguientes valores:
32, 34, 31, 42, 36, 41, 32, 45, 37,
n=9
Ordenando: 31, 32, 32, 34, 34, 36, 37, 41, 42, 45.
Observamos el valor central:
Me=36 (representa el 5to. dato)
b) n es par.La mediana es igual al promedio o la
semisuma de los valores centrales.
CURSO: ESTADISTICA I
CICLO III
30
Manual del Alumno
Ejemplo: la Me de 12,21,16,18,20,19,16,15,16,17.
Ordenando:
12,15,16,16,16,17,18,19,20,21,
Me
16 17
2
16.5
2do. Caso: Datos Agrupados en TD:
En este caso la Se me calcula mediante la siguiente fórmula:
Me
Li
Ame * n
2
f me
Fme
1
Donde:
Li
=
Ame :=
Fme-1 =
mediana.
fme =
limite inferior de la clase mediana.
tamaño del intervalo de la clase mediana.
Frec. Abs. Acumulada anterior a la clase
Frecuencia absoluta de la clase mediana.
Clase Mediana: Es aquel intervalo que contiene el valor que
ocupa la posición media, es decir contiene a la mediana. Se
calcula mediante:
El primer valor Fi mayor o igual que n/2
CURSO: ESTADISTICA I
CICLO III
31
Manual del Alumno
4. LA MODA (Mo)
Representa al valor que más se repite en un conjunto de
observaciones:
-
Si la distribución de frecuencias tiene un solo valor
máximo, entonces: UNIMODAL.
- Si la distribución presenta más de un valor máximo: ,
entonces: POLIMODAL.
Si no hay algún valor que se repita con más
frecuencia: DISTRIBUCION UNIFORME
1er. Caso: Datos no agrupadas
Señalar el valor que más se repite.
Ej.
4,5,6,7,4,5,4,6,5,5,4,5,5
UNIMODAL
Ej.
Mo = 5
7,7,6,8,8,6,8,7,7,9,12,11,10,8 Mo = 8 BIMODAL
2do. Caso: Datos Agrupados en Tablas de Frecuencias_
Mo
CURSO: ESTADISTICA I
CICLO III
Li
Amo *
D1
D1 D 2
32
Manual del Alumno
Donde:
Li
=
Amo =
D1
=
D2
=
limite inferior de la clase modal.
Amplitud de la clase modal.
Diferencia ente la Frec. Absoluta de la clase
modal menos la frecuencia absoluta anterior.
Diferencia ente la Frec. Absoluta de
la clase modal menos la siguiente.
Clase Modal: Representa el intervalo con la mayor
frecuencia absoluta.
Ejemplos. (3.1)
CURSO: ESTADISTICA I
CICLO III
33
Manual del Alumno
Calcular la Media Aritmética, Mediana y Moda de la Tabla de
frecuencias del ejemplo (2.3).
X
47.5 * 5 56.5 * 5 .... 92.5 * 5
35
70.336
gramos
Para calcular la mediana, la clase mediana es el 4to. intervalo:
35
Me
70 9 *
2
11
15
72.05
gramos
Para calcular la Moda, la clase modal es el 4to. intervalo, por
que presenta la mayor frecuencia absoluta.
D1=11 - 5 = 6
D2=11 – 4 =7
Mo
70 9 *
6
6 7
74 .15
Gramos
Nota: La media =mediana = moda, si la distribución es
simétrica.
SESION # 9
CURSO: ESTADISTICA I
CICLO III
34
Manual del Alumno
ESTADIGRAFOS DE TENDENCIA NO CENTRAL
Las medidas de Posición o de Tendencia no centrales
permiten conocer otros puntos característicos de la
distribución que no son los valores centrales. Entre otros
indicadores, se suelen utilizar una serie de valores que
dividen la muestra en tramos iguales:
Cuartiles: son 3 valores que distribuyen la
serie de datos, ordenada de forma creciente
o decreciente, en cuatro tramos iguales, en
los que cada uno de ellos concentra el 25%
de los resultados.
Deciles: son 9 valores que distribuyen la
serie de datos, ordenada de forma creciente
o decreciente, en diez tramos iguales, en los
que cada uno de ellos concentra el 10% de
los resultados.
Percentiles: son 99 valores que distribuyen
la serie de datos, ordenada de forma
creciente o decreciente, en cien tramos
iguales, en los que cada uno de ellos
concentra el 1% de los resultados.
Ejemplo: Vamos a calcular los cuartiles de la serie de
datos referidos a la estatura de un grupo de alumnos).
Los deciles y percentiles se calculan de igual manera,
CURSO: ESTADISTICA I
CICLO III
35
Manual del Alumno
aunque haría falta distribuciones con mayor número de
datos.
Variable
(Valor)
X
x
Frecuencias absolutas
Simple
Acumulada
x
x
Frecuencias relativas
Simple
Acumulada
X
1,20
1
1
3,3%
3,3%
1,21
1,22
1,23
1,24
1,25
1,26
1,27
1,28
1,29
1,30
4
4
2
1
2
3
3
4
3
3
5
9
11
12
14
17
20
24
27
30
13,3%
13,3%
6,6%
3,3%
6,6%
10,0%
10,0%
13,3%
10,0%
10,0%
16,6%
30,0%
36,6%
40,0%
46,6%
56,6%
66,6%
80,0%
90,0%
100,0%
1º cuartil: es el valor 1,22 cm, ya que por
debajo suya se situa el 25% de la frecuencia
(tal como se puede ver en la columna de la
frecuencia relativa acumulada).
2º cuartil: es el valor 1,26 cm, ya que entre
este valor y el 1º cuartil se situa otro 25% de
la frecuencia.
3º cuartil: es el valor 1,28 cm, ya que entre
este valor y el 2º cuartil se sitúa otro 25% de
la frecuencia. Además, por encima suya
queda el restante 25% de la frecuencia.
CURSO: ESTADISTICA I
CICLO III
36
Manual del Alumno
Atención: cuando un cuartil recae en un valor que se ha
repetido más de una vez (como ocurre en el ejemplo en
los tres cuartiles) la medida de posición no central sería
realmente una de las repeticiones
Fórmulas para calcular los Cuartiles
Para calcular el Primer Cuartil
Q1
n
4
Li
F1 i
F2
Para calcular el Segundo Cuartil
Q2
Li
n
2
F1 i
F2
Para calcular el Tercer Cuartil
Q3
DONDE:
Q1 = Primer Cuartil
Q2 = Segundo Cuartil
Q3 = Tercer Cuartil
CURSO: ESTADISTICA I
CICLO III
Li
3n
4
F1 i
F2
37
Manual del Alumno
Li = Límite Real inferior de la Clase que contiene el Cuartil
n = Número de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil
F2 = Frecuencia absoluta de la Clase del Cuartil
i = Intervalo de Clase
Ejemplo: Calcular el Primer Cuartil de la siguiente
distribución de frecuencias, referente al consumo de
energía eléctrica de un grupo de usuarios
Consumo
Kw Hora
05 - 24
25 - 44
45 - 64
65 - 84
85 - 104
105 - 124
125 - 144
145 - 164
Q1
Número de Frecuencia
Consumidor Acumulada
4
4
6
10
14
24
22
46
14
60
5
65
7
72
3
75
75
44 .5
75
4
Límites Reales
4.5
24.5
44.5
64.5
84.5
104.5
124.5
144.5
- 24.5
- 44.5
- 64.5
- 84.5
- 104.5
- 124.5
- 144.5
- 164.5
10 20
14
57 KwHora
Como cada Cuartil representa el 25%, entonces el Primer Percerntil
será el 25%.
Respuesta.- El 25% de los usuarios consume 57 KW Hora.
Fórmula para calcular los Deciles
CURSO: ESTADISTICA I
CICLO III
38
Manual del Alumno
D = El Decil
Li = Límite Real inferior de la Clase que contiene el Decil
D # = El número de Decil que se quiere hallar
n = Número de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Cuartil
F2 = Frecuencia absoluta de la Clase del Cuartil
i = Intervalo de Clase
Utilizando el ejemplo: Calcular el Cuarto Decil de la
distribución de frecuencias, referente al consumo de
energía eléctrica del grupo de usuarios
Como cada Decil representa el 10%, entonces el Cuarto Decil será
el 40%..
Respuesta.- El 40% de los usuarios consume 69.95 KW Hora.
Fórmula para calcular los Percentiles
P = El Percentil
Li = Límite Real inferior de la Clase que contiene el Percentil
CURSO: ESTADISTICA I
CICLO III
39
Manual del Alumno
P # = El número de Percentil que se quiere hallar
n = Número de datos
F1 = Frec. Acumulada de la clase anterior a la clase del Percentil
F2 = Frecuencia absoluta de la Clase del Percentil
i = Intervalo de Clase
Utilizando el ejemplo: Calcular el Percentil 79 de la
distribución de frecuencias, referente al consumo de
energía eléctrica del grupo de usuarios
Como cada Percentil representa el 1%, entonces el Percerntil 79
será el 79%..
Respuesta.- El 79% de los usuarios consume 103.43 KW Hora.
SESION # 10
EXAMEN PARCIAL
SESION # 11
ESTADIGRAFOS DE DISPERSION O VARIABILIDAD
Son aquellos números que miden o cuantifican la variabilidad de las
observaciones, con respecto a un estadígrafo posición (generalmente
la media aritmética). Los principales estadígrafos de dispersión son los
siguientes:
1.
LA VARIANZA: V (X)
CURSO: ESTADISTICA I
CICLO III
40
Manual del Alumno
Se define como el promedio del cuadrado de las desviaciones con
respecto a la media.
Cuando la varianza es muestral, entonces V(x) se puede denotar
como
y si la varianza es poblacional, entonces
V(x) se denota como .En este capítulo estudiaremos la varianza
muestral.
La varianza se calcula, teniendo en cuenta los siguientes casos:
1er. Caso: Datos no agrupados en tablas de frecuencia:
Desarrollando esta sumatoria, obtenemos una forma más simple
para calcular la varianza:
2do. Caso: Datos agrupados en tablas de frecuencias:
CURSO: ESTADISTICA I
CICLO III
41
Manual del Alumno
O también:
CURSO: ESTADISTICA I
CICLO III
42
Manual del Alumno
Desarrollando esta sumatoria, obtenemos:
O también:
Donde:
Xi
fi
hi
=
=
=
marca de clases.
frecuencia absoluta
frecuencia relativa
Propiedades de la Varianza:
1.
V(X)
2,
3.
V(K) = 0
V(X+/- K) = V(X)
una constante K
4.
CURSO: ESTADISTICA I
CICLO III
>= 0
(siempre la varianza es positiva ó
igual a cero).
Esto es si cada Xi = k (constante).
si a cada Xi se le suma (o resta),
entonces la varianza no varia.
si a cada dato se multiplica (o por
una constante K, entonces la
constante sale elevada cuadrado).
Siendo a y b constantes, X e
Y variables independientes
43
Manual del Alumno
5.
2. DESVIACION STANDART O TIPICA : S(X)
Se define como la raíz cuadrada positiva de la varianza, y como la
varianza esta expresada en unidades cuadradas, la desviación
standart (que esta expresada en las mismas unidades de los
datos), representa mejor la variabilidad de las observaciones.
3. COEFICIENTE DE VARIACION: C.V.
Representa la relación que existe entre la desviación standart y el
promedio de un conjunto de observaciones. El C.V. como no tiene
unidades se debe expresar en porcentaje y sirve como medios de
comparación con otras distribuciones de cualquier tipo de unidad.
Se calcula:
Donde:
S(x)
=
X
=
CURSO: ESTADISTICA I
CICLO III
desviación típica
promedio aritmético ó
44
Manual del Alumno
Ejemplos:
1. Los siguiente datos son temperaturas en grados Fahrenheit
415,500,480,490,476,500,432,479,489,497,496,478,453.
Sin ordenar en tablas de frecuencias:
a) Calcular la varianza.
b) Si a cada dato se le divide entre 5 y luego se suma 10. Hallar la
nueva varianza.
Solución:
a) Primero tenemos que calcular el promedio para datos no
agrupados:
°F
Entonces, calculamos la varianza:
CURSO: ESTADISTICA I
CICLO III
45
Manual del Alumno
b) Es decir:
Esto se resuelve usando propiedades:
2. Dada la siguiente tabla de frecuencias, que representa el peso
(grs), de 34 sobres de cartas:
Intervalos
[ 7 – 8>
[ 8 – 9>
[ 9 – 10>
[10 – 11>
[11 – 12>
[12 – 13]
Xi
7.5
8.5
9.5
10.5
11.5
12.5
fi
1
2
8
11
6
6
a) Calcular el peso promedio y la mediana.
b) Calcular el Coeficiente de Variación (C.V.)
CURSO: ESTADISTICA I
CICLO III
Fi
1
3
11
22
28
34
46
Manual del Alumno
Solución:
a) Calculando el promedio:
Gramos
Calculando la mediana:
Gramos
b)
Para calcular el C.V. debemos primero calcular la
varianza
Calculamos la desviación standart: S(X)=-1.2708 grs. Entonces:
3. Se tiene dos muestras:
En qué muestra cree Ud. Que halla menos variabilidad?
CURSO: ESTADISTICA I
CICLO III
47
Manual del Alumno
Solución:
Primero hay que tener en cuenta que no se puede comparar las
desviaciones standares de cada nuestra, porque están
expresadas en diferente unidades, pero si podemos compararlas
con sus C.V. respectivos:
Entonces, comprando ambos coeficientes nos damos cuenta que
existe menor dispersión en los datos de la primera muestra.
CURSO: ESTADISTICA I
CICLO III
48
Manual del Alumno
NOTA: Un C.V. ideal debe estar:
SESION # 12
CAPITULO V: DISTRIBUCION BIDIMENSIONAL
ANALISIS DE REGRESION Y CORRELACION LINEAL
SIMPLE
Los métodos estadísticos presentados lo hemos referido hasta
Ahora a una sola variable, muchos de los problemas de trabajo
estadístico, sin embargo involucran 2 ó más variables. En algunos
casos las variables se estudian Simultáneamente, para ver la
forma en que se encuentran interrelacionadas, también si se
desea estudiar una variable de interés particular. Estos dos casos
de problemas se conocen por lo general con los nombres de
correlación y regresión.
Antes de
definir estos casos hablaremos sobre aspectos
importantes que involucran 2 variables: Distribución Bidimensional.
5.1. Cálculo de la Covarianza: S (XY)
La varianza, es la medida que estudia la dispersión de dos
variables, se calcula teniendo en cuenta:
1er. Caso: Datos no agrupados en tablas de frecuencia: En
este caso, las variables X é Y se toman en forma simultánea; es
decir se considera no agrupados porque se toman los valores
CURSO: ESTADISTICA I
CICLO III
49
Manual del Alumno
como puntos cartesianos (pares
(X2,Y2)..........(Xm,Ym). Esto es:
X
Y
X1
Y1
X2
Y2
de
X3
Y3
valores).
(X1,Y2),
.......... XN
.......... YN
N: número de observaciones ó total de pares de valores.
De cada observación se analiza dos variables Simultáneamente.
Las Covarianza; S (XY) se define:
............................. ( I )
desarrollando la sumatoria y simplificando:
.........................( II)
CURSO: ESTADISTICA I
CICLO III
50
Manual del Alumno
Para calcular la covarianza S(XY), es preferible utilizar la ec. (II).
Los promedios de X y de Y, así como las desviaciones standares
S(X) Y S(Y), se calculan como en los capítulos 3 y 4.
2do. Caso: Datos Agrupados en tablas de frecuencias:
En este caso cada variable X e Y, están agrupados en tablas de
frecuencias presentándose
lo que se llama: Distribución
Bidimensional o Tabla de Doble Entrada.
En forma tabular:
X
Y
:
:
agrupado en K intervalos (y = 1... k)
agrupado en m intervalos (j = 1.. m).
:
:
marca de clase (variable X)
marca de clase (variable Y)
frecuencia absoluta conjunta, corresponde al
número de observaciones que existe en el I-ésimo
intervalo de X con el j-ésimo intervalo de Y.
Donde:
Xi
Yj
fij
:
Observaciones:
(1)
(2)
(3)
Según la definición de la covarianza (tanto para datos
agrupados como no agrupados), la covarianza puede ser
negativa.
La covarianza presenta unidades de cada una de las
variables involucradas.
La covarianza S(XY), también se denota: Cov (X,Y)
CURSO: ESTADISTICA I
CICLO III
51
Manual del Alumno
Ejemplos:
(5.1) Dada la siguiente tabla, que representa la medida (X) en cm.
De 8 barretas de metal y el peso (Y) en libras de cada una de
ellas, calcular:
X
Y
a) S(X) b) S(Y) c) S(XY)
1
3
4
6
1
2
4
4
8
5
9
7
11
8
14
9
Solución:
Este ejemplo, corresponde a datos no agrupados en tabla de
frecuencias.
2
a)
(X)
S
=
S (X) = 4.06
cm.
2
b) S
(Y)
CURSO: ESTADISTICA I
CICLO III
S (Y) = 2.65
lbs
52
Manual del Alumno
S (XY) = 10.5 cm. lbs
(5.2)
Dada la siguiente tabla en el cual se estudia las alturas (pulg) y
los pesos (libras) de 300 estudiantes hombres en una
Universidad:
X
Y
Y
:
:
X
90-110
100-120
130-140
50-160
170-180
190-200
210-220
Total
Fx
altura (pulgadas).
peso (libras).
58-62
62-66
2
7
5
2
1
8
15
12
7
2
16
45
Calcular:
CURSO: ESTADISTICA I
CICLO III
66-70
70-74
74-78
Total
fy
4
22
63
28
10
1
2
7
19
32
20
4
1
5
12
7
2
3
21
50
101
79
39
7
128
84
27
300
53
Manual del Alumno
S (X)
, S(Y)
,
S (XY)
Solución:
Como la tabla es Bidimensional, podemos formar tablas de
frecuencias para cada una de las variables por separado, a este
proceso se le conoce como TABLAS MARGINALES.
CURSO: ESTADISTICA I
CICLO III
54
Manual del Alumno
Tabla marginal para x::
Intervalos
Xi
58 – 62
60
62 – 66
64
66 – 70
68
70 – 74
72
74 – 78
76
Tabla Marginal para Yi:
Intervalos
Yj
90 – 110
100
110 – 130
120
130 – 150
140
150 – 170
160
170 – 190
180
190 – 210
200
210 – 230
220
Fi
16
45
128
84
27
300
f.j.
3
21
50
101
79
39
7
300
La variable X presenta 5 intervalos ( i = 1 .....5)
La variable Y presenta 7 intervalos ( j = 1 .....7)
Calculando:
CURSO: ESTADISTICA I
CICLO III
55
Manual del Alumno
S (X) = 3.929 pulgadas
S (Y) = 24.202 Lbs.
Calculando la Covarianza:
S(XY) =51.370 pulg/lib.
CURSO: ESTADISTICA I
CICLO III
56
Manual del Alumno
CURSO: ESTADISTICA I
CICLO III
57
Manual del Alumno
SESION # 14
REGRESION LINEAL
5.2. Diagrama de Puntos y Curvas de Ajuste:
Representan los puntos (X1, Y1), (X2, Y2)..... (XN, YN) en un
sistema de coordenadas rectangulares, donde al sistema de
puntos resultantes lo llamaremos Diagrama de Dispersión o
Diagrama de Puntos: Con el diagrama de dispersión es posible
representar una curva que se aproxime a los datos: Curva de
Aproximación.
Entonces, encontrar ecuaciones de curvas de aproximaciones que
se ajusten a los datos, es buscar una: Curva de Ajuste.
Tenemos:
a) Conjunto de puntos que se ajustan a una línea recta (ajuste
lineal o relación lineal).
*
*
*
* *
*
*
*
*
Observamos que el diagrama de puntos gira alrededor de una recta: Y =
a+ bX
CURSO: ESTADISTICA I
CICLO III
58
Manual del Alumno
b)
Conjunto de puntos o diagrama de puntos cuya relación no es
lineal.
***
***
***
***
***
Algunas de las ecuaciones de curvas de aproximación:
CURSO: ESTADISTICA I
CICLO III
59
Manual del Alumno
Relación lineal
Parábola o curva cadratica
Curva Polinomial
Hipérbola
O log Y= log(a) + X* log(b)
Curva Exponencial
Entonces, lo que se desea es encontrar una curva de aproximación que
se ajuste mejor a los datos, y así mostrar la ecuación de la curva
respectiva.
El tipo más sencillo de una curva de aproximación es la línea recta cuya
ecuación puede escribirse: Y = a +b*X
CURSO: ESTADISTICA I
CICLO III
60
Manual del Alumno
5.3 Método de mínimos Cuadrados:
De todas las curvas de aproximación a una serie de datos puntuales, la
curva tiene la propiedad de que:
sea mínimo
Se conoce como la mejor curva de ajuste por el método de mínimos
cuadrados.
Di= desviación de cada punto con respecto ala línea recta.
Este método consiste en minimizar la suma de los cuadrados de las
desviaciones Di.
Entonces para ajustar un diagrama de dispersión a la línea recta,
utilizaremos este método de los MINIMOS CUADRADOS. Es decir una
recta de aproximación de mínimos cuadrados del conjunto de puntos (x1,
y1), (x2,y2),......,(xn,yn), tiene la ecuación: Y = a+b*X , donde a y b se
determinan mediante el sistema de ecuaciones normales, son las
siguientes:
Donde al desarrollar y despejar a y b se obtienen:
CURSO: ESTADISTICA I
CICLO III
61
Manual del Alumno
Otras ecuaciones más practicas para calcular los valores de a y b de la
ecuación aproximada Y = a +b*X son las siguientes:
Ejemplo:
Sean los valores:
x
3
y
2
1
1
4
4
6
4
8
5
a) Construye el diagrama de puntos
b) Encuentra las ecuaciones normales
c) Encuentra la ecuación de la curva de ajuste.
CURSO: ESTADISTICA I
CICLO III
9
7
11
8
14
9
62
Manual del Alumno
Solución:
a) Llevando los puntos al sistemas de coordenadas rectangulares.
DISPERSION
10
8
6
Y 4
2
0
0
2
4
6
8
10
12
14
X
b) Al observar el diagrama de puntos, notamos que se aproxima o ajusta
a una línea recta, cuya ecuación es: Y = a+b*X
c) Para encontrar las ecuaciones normales:
CURSO: ESTADISTICA I
CICLO III
63
Manual del Alumno
Entonces las ecuaciones normales son:
40 = 8*a +b* 56
364 = 56*a +b*524
Resolviendo el sistema (Método de Mínimos Cuadrados)
a= 6/11 = 0.545
b=7/11=0.636
d) La ecuación resultante será : Y = 0.545 + 0.636X
nota : Si la ecuación es Y = a +b*X entonces b mide la pendiente de la
línea recta.
CURSO: ESTADISTICA I
CICLO III
64
Manual del Alumno
SESION # 15
SEGUNDA PRACTICA CALIFICADA
SESION # 16
5.4 Análisis de correlación lineal simple:
Definición: Estudia el grado de asociación que existe entre las variables
en estudio, el coeficiente que mide la mutua asociación se denomina:
Coeficiente de Correlación (r).
Las asociaciones que se pueden presentar son:
1) Correlación o asociación Positiva (+), es decir a medidas altas de
una variable, le corresponden medidas altas de otra variable, cambios
en el mismo sentido (Relación Directamente Proporcional)
X
entonces Y
X
entonces Y
Ejemplo :
altura y peso
2) Correlación o Asociación Negativa (-), En este caso, a valores altos
de una variable, corresponden valores bajos de la otra variable y
viceversa. (Relación inversamente proporcional).
3) Medidas no Correlaciónales; No existe ninguna asociación entre las
variables.
Características de Coeficiente de Correlación Lineal Simple
CURSO: ESTADISTICA I
CICLO III
65
Manual del Alumno
1) r se calcula mediante la siguiente fórmula:
S (XY) :
S (X) :
S (Y) :
covarianza de X e Y
desviación standart de X
desviación standart de Y
2) r es un número abstracto
decir:
(sin unidades) y oscila entre –1 y 1, es
3) - Si r es positivo (Correlación Positiva), entonces las dos
características tienden a variar en el mismo sentido.
-
Si r es negativo (Correlación Negativa), las dos características tienden
a variar en sentido contrario.
4) Si r=+1 ó r=-1, entonces la asociación es perfecta.
5) Si r = 0, no existe asociación entre las variables:
6) La asociación, tiende a ser más estrecha, cuando r:
CURSO: ESTADISTICA I
CICLO III
66
Manual del Alumno
Ejemplo:
(5.4)
Calcula el coeficiente de correlación, del ejemplo (5.1); donde:
S(X) =4.06;
S(Y) =2.65; S(XY)=10.5
Interpretación.- Existe una alta asociación entre las variables estudiadas.
(5.5)
del ejemplo (5.2), donde: S(X)=3.929 pulgadas S(Y)=24.202
libras, S(XY)=51.370 pulg/lbs
Interpretación.- Existe asociación entre las alturas y pesos de los
estudiantes de la Universidad dada, esta asociación es directamente
proporcional.
CURSO: ESTADISTICA I
CICLO III
67
Manual del Alumno
5.4 Análisis de Regresión Lineal Simple:
En las relaciones entre las variables se pueden presentar los siguientes
casos:
i)
X influye en Y :
X
Y
:
:
Ejemplo:
Edad
ii)
X
Y
variable independiente
variable dependiente
agilidad mental
Y influye en X
Y: variable independiente
X: Variable dependiente
Y
X
X = f(Y)
III) Las dos están influenciadas entre si:
X
Y
X
Y
Ejemplo : precio y producción de un articulo.
Definición: La regresión permite estudiar la dependencia de una
característica respecto a la otra, para establecer como varía el promedio
de la primera característica al variar la segunda en una unidad de su
medida.
Se dice regresión lineal, porque las variaciones de la variable
independiente, pueden provocar variaciones proporcionales en las
variables dependientes (ajuste a la línea recta).
Se dice que la regresión es simple, si una variable independiente influye
sobre otra variable dependiente.
CURSO: ESTADISTICA I
CICLO III
68
Manual del Alumno
Ejemplo:
Proteína de harina
volumen de pan
Ecuación de Regresión Lineal Simple.
Es una ecuación para estimar una variable dependiente a partir de la
variable independiente.
Si X : Variable independiente
Y : Variable dependiente
Donde :
Y = variable dependiente estimada
: b = coeficiente de R.L.S.
Características del Coeficiente de R.L.S. (b)
1) b :
indica el número de unidades en que varía la variable
dependiente al variar la independiente en una unidad de su medida.
2) Si b es positivo los cambios son directamente proporcionales.
Si b es negativo entonces los cambios son inversamente proporcional
3) b : mide la pendiente de la línea de regresión.
4) b, esta dado en unidades de la variable dependiente.
5) b y r siempre tienen el mismo signo.
6) b se calcula:
CURSO: ESTADISTICA I
CICLO III
69
Manual del Alumno
Sí Y = f(X), entonces:
Y el valor de la constante a:
Si X= f (Y)
(se realiza cambio de X por Y y viceversa)
Línea de Regresión.- consiste en el trazo o gráfica de la ecuación de
regresión lineal simple, es decir el gráfico de los
puntos
si la ecuación es:
Regresión de Y sobre X; o el gráfico de los puntos (X,Y) si la ecuación
es X= a+ bY : Regresión de X sobre Y.
Ejemplo:
selecciona al azar cuatro meses de un año y se registra tanto los
ingresos como los gastos, en miles de dólares, de cierta empresa:
Ingreso (miles de dólares)
Egresos (miles de dólares)
I.
10
4
11
5
12
9
13
10
Efectuar un estudio de Regresión Lineal Simple, asumiendo que
los egresos están en función de los Ingresos:
1) Calculando el coeficiente de Regresión b e interpretándolo
2) Calculando el coeficiente de intersección a
CURSO: ESTADISTICA I
CICLO III
70
Manual del Alumno
3) Encontrando la ecuación
trazar la línea de Regresión.
II.
de Regresión Lineal Simple y
Realiza un análisis de Correlación Lineal Simple, e interprete el
valor de r.
Solución:
I.
Como el egreso está en función de los ingresos:
Egresos: variable dependiente: Y
Ingresos: variable independiente: X
1) Calculando b
Primero calculamos:
Entonces:
Mil
es
CURSO: ESTADISTICA I
CICLO III
71
Manual del Alumno
Interpretación.- Por cada mil dólares adicional en el Ingreso de dicha
empresa, habrá un aumento en el Egreso de 2.2 miles de dólares en
promedio.
2) Para calcular a :
3) Ecuación de Regresión Lineal Simple:
Como Y es variable dependiente, entonces:
Para el trazo en el sistema de ejes cartesianos se tendrá que reemplazar
en la ecuación de Regresión, los diferentes valores de X:
Y=-18.30 +2.2. (10) = 3.7
Y=-18.30 +2.2 (11) = 5.9
Y=-18.30 +2.2 (12) = 8.1
Y=-18.30 +2.2 (13) =10.30
También se puede estimar nuevos valores de los Egresos (Yi) a partir de
un valor Xi.
Ejemplo:
Para un ingreso de 15mil dólares, se espera tener en promedio un Egreso
de:
Y =-18.30 + (2.2) (15) = 14.7 miles de dólares
La línea de Regresión: unión de puntos (Xi,Yi)
II.
Análisis de Correlación:
CURSO: ESTADISTICA I
CICLO III
72
Manual del Alumno
Interpretación.- Existe una alta asociación entre los ingresos y los
egresos, siendo los cambios directamente proporcionales.
CURSO: ESTADISTICA I
CICLO III
73
Manual del Alumno
SESION #17
CAPITULO VI: NUMEROS INDICES
Definición.- Un número índice es una medida estadística diseñada para
mostrar los cambios en una variable (o en un grupo de variables) con
respecto al tiempo, situación geográfica, renta, profesión, etc.
Aplicaciones:
1. Comparar el costo de alimentos en otros costos de vida durante un
año o período con respecto al año o período anterior.
2. En negocios y Economía.
Tipos de Indice:
(6.1)
Indices Simples: Cambios en un solo bien determinado
1) Indices de Precios Relativos.- uno de los ejemplos más
sencillos de número índice es un precio relativo, que
representa la razón del precio de un bien determinado en un
período con respecto a otro período llamado base.
Indice de Precio Relativo: IPR
Po : precio de un bien en período base
Pn : precio de un bien en período dado
Sí
Pa: precio de un bien en el período a
Pb : precio de un bien en el período b
Ejemplo:
CURSO: ESTADISTICA I
CICLO III
74
Manual del Alumno
(6.1) Supóngase que los precios de consumo de 1 tarro de leche en junio
de 1990 es de 22,000 intis y en junio de 1989 fue de 5,000 intis,
tomando 89 como base.
El IPR Simple:
Es decir: en 1990 el precio de leche fue el 440% del que tenía en
el año 89, es decir se incrementó en un 340%
Observación: IPR Simple es un bien en un período a (Pa), con
respecto al mismo período a (Pa) =1
2) Indices de Cantidades (o volumen) Relativos.- En lugar de
comparar precios de un bien, se puede también comparar
cantidades de un bien (cantidad de producción, consumo,
exportación, etc.) calculemos la cantidad o volumen relativo
(suponiendo que las cantidades dentro de cualquier otro
período son constantes).
Indice de Cantidad Relativo: IQR
qn : cantidad de un bien en el período n
qo : cantidad de un bien en el período base
3) Valor Relativo.- Si p es precio de un bien durante un período
y la cantidad o volumen producido, vendido, etc., durante ese
período.
Valor total = p * q
Ejemplo:
Si se han vendido 1000 tarros de leche a $0.75 c/u
Valor total = 0.75 * 1000 = $ 750
CURSO: ESTADISTICA I
CICLO III
75
Manual del Alumno
Si Po Y qo denotan precio y cantidad de un bien durante un
período base y pn y qn denotan el precio correspondiente durante
un período dado, los valores totales durante estos períodos son
Vo y Vn respectivamente y el valor relativo (VR) se define:
(6.2)
Indices Compuestos:
En la práctica, no se esta tan interesada en comparaciones de
precios, cantidades etc., de bienes individualmente considerados,
como en comparaciones de grandes grupos de tales bienes, es
decir es preferible considerar un grupo de bienes para medir los
cambios respectivos.
Los principales Indices compuestos se calculan teniendo en
cuenta los siguientes métodos:
1) Método de Agregación Simple.- Este método de cálculo de
un índice de precio (o cantidad), expresa el total de los
precios (o cantidades) de bienes en el período dado, como
porcentaje del total de los precios (o cantidades de bienes en
el período base.
Tenemos:
Indice de Precios de Agregación Simple: IPAS
CURSO: ESTADISTICA I
CICLO III
76
Manual del Alumno
Donde:
Pn = suma total de precios de bienes empleados en el periodo dado.
Po = suma total de precios de bienes empleados en el año base.
Desventaja: No tiene en cuenta la importancia relativa de las cantidades
de los diferentes bienes.
2)
método de Media de Relativo Simple. En este método
existen varias posibilidades dependiendo del procedimiento empleado
para promediar los precios relativos (o cantidades relativas), tal como
la media aritmética, media geométrica, Mediana, etc.
Tenemos :
Indice de precios de Media de Relativo Simple: IPMRS (Promedio de los
precios relativos de cada uno de los bienes empleados):
Donde:
(Pn/Po) = suma de los precios relativos de bienes.
N
= número total de bienes empleados.
CURSO: ESTADISTICA I
CICLO III
77
Manual del Alumno
Método de Agregación Ponderada. Para salvar algún inconveniente del
método de agregación simple, se da un peso al precio de cada bien
mediante un factor adecuado, tomando a menudo una cantidad o volumen
del bien determinado durante el periodo dado, o algún periodo típico (que
puede ser una media de varios años). Tales pesos indican la importancia
de cada bien particular.
Aparecen así, los tres siguientes índices para precios:
(I). Indice de Precios de Laspeyres (o método del año
base): IPL
Pondera los precios considerando como factor de
ponderación a las cantidades en el periodo base.
Cuando los bienes empleados corresponden a la canasta
familiar, el IPL se denomina índice de Precios del
Consumidor o Indice del Costo de Vida, y se utiliza para
medir el nivel de inflación.
(II) Indice de Precios de Paasche (o método del año dado):
IPP
Pondera los precios de cada bien, considerando como
factor de ponderación a las cantidades del periodo dado.
CURSO: ESTADISTICA I
CICLO III
78
Manual del Alumno
(III). Indice Ideal de Fisher
Representa la media geométrica de los índices de
Laspeyres y
Paasche (promedio de los índices
ponderados).
Ejemplo:
(6.3)
La tabla muestra los precios y cantidades consumidas de cierto
país de distintos productos férreos en los años 79, 86 y 87.
Año
Precios ($/Lbs)
1979
1986
Plata
Cobre
Plomo
Staño
Zinc
CURSO: ESTADISTICA I
CICLO III
17.00
19.36
15.18
99.32
12.15
26.01
41.88
15.81
101.26
13.49
1987
27.52
29.99
14.46
96.17
11.40
79
Manual del Alumno
Año
Cantidad (Mills de bls)
1979
1986
Plata
Cobre
Plomo
Staño
Zinc
1357
2144
1916
161
1872
3707
2734
2420
202
2018
1987
3698
2478
2276
186
1424
a) Calcular Indice de Precios de Agregación Simple para el año 86,
considerando como año base 1979
b) Calcular el IPL para el año 87, con base en el año 79
c) Calcular el IPP para el año 87, con año 86
Solución
Esto significa, que los precios del conjunto de productos férreos, en el año
86, representa el 121.7% de los precios que tenían en el año 79, es decir
se incrementaron en 21%.
Nota:
Las fórmulas descritas anteriormente para obtener números índice de
precios se modifican fácilmente para obtener números índices de cantidad
o volumen, con el simple intercambio de p y q.
CURSO: ESTADISTICA I
CICLO III
80
Manual del Alumno
Ejemplo : Indice de cantidad de Agregación Simple: IQAS
(6.4)
Deflación
Aunque los ingresos de las personas pueden elevarse
teóricamente en un período de dos años, su ingreso real puede
netamente ser inferior, debido al incremento del costo de vida y
por consiguiente su poder de adquisición.
Ejemplo (5.3)
Si el ingreso de una persona en 1990 es el 150% de su ingreso
en 1989 (es decir a aumentado en 50%) mientras que el ICV es
el 500% del año 89, el salario real de la persona será en 1990
Salario Real
El salario real de la persona en 1990 es el 30% del que tenía en
1989, es decir el poder adquisitivo de esta persona ha disminuido
en 70%.
CURSO: ESTADISTICA I
CICLO III
81
Manual del Alumno
ANEXOS
PROBLEMAS RESUELTOS
a) tablas de frecuencia y Estadigrafos de posición:
1) La siguiente distribución muestra el peso en gramos de 30
paquetes de
un determinado producto:
Gramos
hi
[10 14.5>
M/2
[14.5 19.5>
0.17
[19.5 24.5>
2M
Se pide completar la tabla:
Solución
Si la sumatoria de las hi = 1
Sabemos que :
M/2 + 0.17 +2M +M +0.13 = 1
M/2 +3M = 1-0.30
M/2 +3M = 0.7
7M = 1.4
M = 0.2
sabemos que
Por lo tanto fi = hi * n
Remplazando valores de hi
CURSO: ESTADISTICA I
CICLO III
hi
fi
n
[24.5 29.5>
M
82
Manual del Alumno
hi
M/2
0.17
2M
M
0.13
Completando el cuadro:
Intervalos
Xi
[10.5 14.5>
12.25
[14.5 19.5>
17
[19.5 24.5>
22
[24.5 29.5>
27
[29.5 35>
32.25
hi
0.10
0.17
0.40
0.20
0.13
fi
3
5
12
6
4
Fi
3
5
12
6
4
1.00
30
hi
0.10
0.17
0.40
0.20
0.13
Hi
0.10
0.17
0.67
0.87
1.00
2)Los siguientes datos son los puntajes obtenidos por 50 estudiantes en
un examen de Estadística I:
33,
50,
61,
69,
80,
35,
52,
64,
71,
81,
35,
53,
65,
73,
84,
39,
54,
65,
73,
85,
41,
55,
65,
74,
85,
41,
55,
66,
74,
88,
42,
57,
66,
76,
89,
45,
59,
66,
77,
91,
47,
60,
67,
77,
94,
48,
60,
68,
78,
97.
Clasificar estos datos convenientemente en intervalos de clase de igual
amplitud y construir los gráficos respectivos.
Solución
I)
Rango = 97-33 = 64
II)
K = 1+3.32 * log (10) = 1+ 3.22 (1.699) = 6.47
CURSO: ESTADISTICA I
CICLO III
83
Manual del Alumno
Redondeando al entero inmediato superior
intervalos)
K = 7 (siete
III) La amplitud de Clase A = 64 / 7 = 9.14, aproximando al entero mayor
(recuerda que la amplitud debe tener la característica de los datos)
A = 10
Para facilitar el conteo de las frecuencias, tomaremos como límite inferior
de la primera clase 30.
clases
[30, 40>
[40, 50>
[50, 60>
[60, 70 >
[70, 80>
[80, 90>
[90, 100>
TOTAL
xi
35
45
55
65
75
85
95
fi
4
6
8
13
9
7
3
50
Fi
4
10
18
31
40
47
50
hI
0.08
0.12
0.16
0.26
0.18
0.14
0.06
1.00
HI
0.08
0.20
0.36
0.62
0.80
0.94
1.00
Nótese que en el ultimo intervalo el límite superior puede ser abierto ya
que sobrepasa al valor más alto de los datos.
GRAFICOS
CURSO: ESTADISTICA I
CICLO III
84
Manual del Alumno
CURSO: ESTADISTICA I
CICLO III
85
Manual del Alumno
2) El supervisor de una planta de producción desea comprobar si los
pesos netos de las latas de conserva de durazno tienen el peso
reglamentario (18 onzas) para lo cual registra el peso de 36 latas
obteniendo los siguientes datos:
17.0,
17.6,
18.1,
18.4,
17.5, 18.5, 18.1, 17.5, 18.0, 17.5, 17.3, 18.0, 18.0, 18.0,
18.2, 17.6, 18.4, 17.7, 17.7, 17.9, 18.3, 17.1, 17.8, 17.3,
17.6, 17.7, 18.2, 18.4, 18.0, 18.2, 17.1, 18.6, 18.1, 18.5,
17.9, 18.2.
Se pide :
a)
b)
c)
d)
Presentar los datos en una tabla de frecuencia.
Determine el peso promedio.
Determine el peso central (la mediana).
Determine el peso Modal.
CURSO: ESTADISTICA I
CICLO III
86
Manual del Alumno
Solución
i)
Rango = 18.6 – 17.0 =1.6
ii)
K = 1+ 3.32 * log (36) = 6.17 redondeamos a 6 intervalos
iii)
A = 1.6 / 6 = 0.266 lo aproximamos a 0.3 (recuerden
siempre se redondea A hacia el mayor respetando la
característica de los datos, en este caso con un digito
decimal). A = 0.3
a) La tabla queda:
Clases
[17.0, 17.3>
[17.3, 17.6>
[17.6, 17.9>
[17.9, 18.2>
[18.2, 18.5>
[18.5, 18.8>
TOTAL
Xi
17.15
17.45
17.75
18.05
18.35
18.65
fi
3
5
7
11
8
2
36
Fi
3
8
15
26
34
36
hi
0.08
0.14
0.19
0.31
0.22
0.06
1.00
Hi
0.08
0.22
0.42
0.72
0.94
1.00
Xi*fi
51
87
124
199
147
37
645.6
Clase modal
Clase mediana
b)
onzas
c) Para la mediana buscar en Fi aquel que sea igual o mayor que
n/2, es decir
CURSO: ESTADISTICA I
CICLO III
87
Manual del Alumno
Fi>= 36/2 =18.
Onzas
d) Para calcular la moda usamos el intervalo de mayor fi
Onzas
CURSO: ESTADISTICA I
CICLO III
88
Manual del Alumno
PROBLEMAS PROPUESTOS:
1) La siguiente tabla muestra las frecuencias relativas de 200 alumnos.
EDADES
Hi%
16
10
19
15
22
37
25
75
28
85
31
100
a) Muestra los límites de cada intervalo de clase.
b) Que tanto por ciento de los estudiantes tienen edades entre 12 y 26
años.
2) Los siguientes datos son las velocidades en Km./h. De 30 carros que
pasaron por un punto de control de velocidades.
60,
49,
a)
b)
c)
30, 38, 60, 45, 20, 35, 20, 40, 54, 38, 35, 40, 10, 45, 60, 49,
30, 55, 46, 105, 29, 38, 80, 40, 28, 15, 82, 72.
Calcular la media de los datos sin clasificar.
Agrupa estos datos convenientemente.
Calcule la media, mediana y moda.
3)Un grupo de 50 empleados de sistemas de una gran compañía recibe un
curso intensivo de Programación de Ordenadores. De los varios
ejercicios distribuidos durante el curso, se muestra el número de
ejercicios completados satisfactoriamente por los miembros del grupo:
13, 9, 8, 14, 16, 15, 6, 15, 11, 5, 3, 11, 11, 9, 18, 18,
5, 1,15, 12, 16, 12, 14, 9, 6, 10, 5, 12, 17, 11, 12, 13,
8, 19, 12, 11, 18, 15, 13, 9, 10, 9, 10, 7, 21, 16, 12, 9,
2, 13.
a) Agrupar estas cifras en una tabla de distribución de frecuencias,
usando el método de Sturges.
b) Calcula la media, mediana y moda.
c) Estima la desviación típica para datos no agrupados.
4) Sean los siguientes datos: f1=3, F2=8, F3=18, f5=2, x4=3, K=6,
H4=0.875, A=2, n=24. Completa la tabla de distribución de frecuencias
y calcular la Varianza.
CURSO: ESTADISTICA I
CICLO III
89
Manual del Alumno
5)
y
dada la siguiente tdf:
[0.5
[2.5
[4.5
[6.5
[8.5
[10.5
[12.5
a)Calcula h3% y h5%
b)Calcula la Varianza.
intervalos
2.5>
4.5>
6.5>
8.5>
10.5>
12.5>
14.5>
hi%
2%
10%
h3%
16%
h5%
10%
2%
7) Se tiene una distribución simétrica de frecuencias con 7 intervalos de
igual amplitud A =20 y considerando los siguientes datos:
X3*f3 = 1260, f2 + f5 = 62, H6% = 96%, f1 = 8, h3% = 21%.
a) Calcula la media, mediana y moda
b) Calcula el C.V.
8) Se conocen los siguientes datos del peso de un grupo de estudiantes:
Intervalos
[20 30>
[30 40>
[40 50>
[50 60>
[60 70>
fi
Hi
fi = 50
5
0.96
si se sabe que:
h1=h3 y
h2=h4
Determina:
a) La media, mediana y desviación típica.
b) Presenta los datos en un Histograma y polígono de frecuencias.
CURSO: ESTADISTICA I
CICLO III
90
Manual del Alumno
9) Sabiendo que la tabla de frecuencias, es simétrica, completarla con
los datos, dados, si además se sabe que la mediana es igual a 27.5.
Luego calcula la media, la moda y la desviación estándar.
Intervalo
L0 L1
L1 L2
L2 L3
L3 L4
L4 L5
L5 50
50 L7
Xi
fi
Fi
hi
Hi
0.20
0.65
0.95
fi = 60
10) Una fabrica tiene dos departamentos uno de producción y otro de
ventas. Las siguientes tablas de frecuencias presentan los haberes
percibidos hasta fines de abril en cada uno de los departamentos.
CURSO: ESTADISTICA I
CICLO III
91
Manual del Alumno
Haberes semanales en
dólares
[10 15>
[15 20>
[20 25>
[25 30>
[30 35>
[35 40
[40 45
Total
N°de trabajadores dpto.
de producción
15
25
30
20
5
5
0
100
Haberes mensuales en N° de trabajadores
dólares
Dpto. de Ventas
[20 60>
0
[60 80>
5
[80 100>
5
[100 120>
15
[120 140>
20
[140 160>
5
total
50
Calcule:
a) El haber promedio mensual y la desviación típica correspondiente a
cada departamento.
b) El haber promedio mensual y la desviación típica del conjunto de
trabajadores de ambos departamentos.
11) Se ha recibido una muestra compuesta de 100 probetas de concreto
con el objetivo de analizarlas. Una de las pruebas consistió en
determinar la carga de rotura de dichas probetas, encontrándose los
siguientes resultados:
CURSO: ESTADISTICA I
CICLO III
92
Manual del Alumno
Intervalo de rotura
[120 125>
[125 130>
[130 135>
[135 140>
[140 145>
N° de probetas
10
20
38
25
7
Determine :
a) La carga media de rotura.
b) La carga mediana de rotura.
Regresión lineal
1) La tabla muestra alturas con aproximación de pulgadas y los pesos
con aproximación de libras de una muestra seleccionada al azar:
altura
70
63
72
60
66
70
74
65
62
67
65
68
peso
155
150
180
135
156
168
178
160
132
145
139
152
a) Hallar la ecuación de la recta de ajuste usando mínimos cuadrados.
b) Estimar el peso de un estudiante cuya altura es de 61 pulgadas.
c) Estimar la altura de un estudiante cuyo peso es de 170 libras.
CURSO: ESTADISTICA I
CICLO III
93
Manual del Alumno
Solución:
X
70
63
72
60
66
70
74
65
62
67
65
68
X = 802
Calculando a y b:
CURSO: ESTADISTICA I
CICLO III
Y
155
150
180
135
156
168
178
160
132
145
139
152
Y=1850
4900
3969
5184
3600
4356
4900
5476
4225
3844
4489
4225
4624
= 53792
X*Y
10850
9450
12960
8100
10296
11760
13172
10400
8184
9715
9035
10336
X*Y
124258
=
94
Manual del Alumno
a = -60.75
b = 3.22
a)
Y = -60.75 + 3.22 X
b)Y = -60.75 + 3.22(61) = 135.67 libras. Redondeando Y =136 libras.
c) 170 = -60.75 + 3.22 X
Pulgadas, redondeando X = 72 pulgadas
2) La producción de acero en Estados Unidos en millones de toneladas
cortas (una tonelada corta = 2000 libras), durante los años 1946 –
1956 aparecen en la siguiente tabla:
CURSO: ESTADISTICA I
CICLO III
95
Manual del Alumno
Años
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
Producción en
Ton. cortas
66.6
84.9
88.6
78.0
96.8
105.2
93.2
111.6
88.3
117.0
115.2
a) Halla la ecuación de ajuste (recta de mínimos cuadrados).
b) Estima la producción de acero durante los años 1957 y 1958.
c) Estima la producción de acero durante los años 1945 y 1944.
CURSO: ESTADISTICA I
CICLO III
96
Manual del Alumno
Solución:
Para poder trabajar con los años se debe colocar una escala paralela que
inicie en cero (pues las fechas no sirven para estos cálculos).
Años
1946
1947
1948
1949
1950
1951
1952
1953
1954
1955
1956
TOTALES
X
Y
0
1
2
3
4
5
6
7
8
9
10
55
66.6
84.9
88.6
78.0
96.8
105.2
93.2
111.6
88.3
117.0
115.2
1045.4
X*Y
0
1
4
9
16
25
36
49
64
81
100
385
a) Hallando la recta de ajuste
a = 75.30
b = 3.95
Y = 75.30 + 3.95 X
CURSO: ESTADISTICA I
CICLO III
0
84.9
177.2
234.0
387.2
526.0
559.2
781.2
706.4
1053
1152
5661.1
97
Manual del Alumno
b y c) Estimando la producción:
Años
1944
1945
1957
1958
X
-2
-1
11
12
CURSO: ESTADISTICA I
CICLO III
Producción
67.40
71.35
118.75
122.70
98
Manual del Alumno
PROBLEMAS PROPUESTOS
1) Construir una línea recta que aproxime los datos de la tabla:
X
Y
2
1
3
3
5
7
7
11
9
15
10
17
a) estimar los
valores de
y para:
x= 11, x= 15,
x=4, x= 6
b) estimar los
valores de
x
para:
y= 2, y=5,
y= 18, y=
2)La producción de acero en Estados Unidos en millones de 15
toneladas cortas(1 tonelada corta = 2000 libras) durante los años
1986 – 1996 aparece en la tabla:
CURSO: ESTADISTICA I
CICLO III
99
Manual del Alumno
Año
Producción de acero en
EE.UU.(millones de
toneladas cortas)
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
66.6
84.9
88.6
78.0
96.2
105.2
93.2
111.6
88.3
117.0
115.2
a) Realiza el diagrama de
dispersión.
b) Determina la ecuación
de la recta de ajuste.
c) Estima la producción
de acero durante los
años: 1997 y 1998.
d) Estima la producción
de acero durante los
años: 1985 y1984
e) Halla r e interpreta.
3)Se desea encontrar una ecuación que estime los ingresos anuales en
función de los salarios mensuales,con este fin se ha recopilado los
salarios mensuales e ingresos anuales de 8 trabajadores de una
empresa.
Salarios
mensuales
Ingresos anuales
100
150
200
275
300
325
350
375
1200
1800
2400
3300
3600
3900
4200
4500
a) Crea el diagrama de dispersión respectivo.
b) Determina
la recta
CURSO:
ESTADISTICA
I de mínimos cuadrados.
CICLO
III
c) Estima los salarios mensuales para aquellos
trabajadores cuyo ingreso anual es de 5700.
d) Calcula el coeficiente de Correlación (interpretar).
100
Manual del Alumno
4)La producción de cigarrillos en Perú durante los años 1985 –1992 fue:
Año
N°cigarrillos
(millones)
a)
b)
c)
d)
1985
98.2
1986
92.3
1987
80.0
1988
89.1
1989
83.5
1990
68.9
1991
69.2
1992
7.1
Representa el diagrama de dispersión con recta de aproximación.
Halla la ecuación de mínimos cuadrados.
Determina e interpretar el coeficiente de Correlación
Estima la producción de cigarrillos para los años 1995 y 1998.
Números índices
Problemas propuestos:
1) La siguiente tabla muestra los precio y cantidades de alguno cereales
en los años 1989 y 1998.
CURSO: ESTADISTICA I
CICLO III
101
Manual del Alumno
1989
producto
Cebada
Maíz
Avena
Arroz
Centeno
Trigo
Precio
1.39
1.24
0.72
0.086
1.42
2.24
Cantidad
237
3238
1220
4077
18.1
1098
1998
producto
Cebada
Maíz
Avena
Arroz
Centeno
Trigo
Precio
1.24
1.15
0.65
0.097
1.27
2.23
Cantidad
470
3800
1422
4702
32.5
1462
A) Tomando como base a 1989 hallar el índice de Laspeyres,
El índice de Paashe, el índice ideal de Fisher. Para el año 1998.
B)
Tomando como base a 1989 hallar el índice de Laspeyres,
El índice de Paashe, el índice ideal de Fisher. Para el año 1989.
C) Determine el índice de agregación simple para los años 1989 y 1998.
2) La tabla muestra los precios al por menor y producciones medias de
antracita y gasolina en EE.UU. durante los años 1949 y 1958.
precios
producto
CURSO: ESTADISTICA I
CICLO III
1949
1958
102
Manual del Alumno
$20.13 por tonelada corta 28.20 por tonelada corta
20.3 cent. Por tonelada 21.4 cent. Por tonelada
corta.
corta
antracita
gasolina
cantidades
producto
antracita
gasolina
1949
1958
3559
millones
de 1821
millones
de
toneladas cortas
toneladas cortas
80.2 millones de barriles * 118.6 millones de barriles
*
Cada barril contiene 42 galones.
a) Determina el índice de agregación simple para 1958 con base en
1949.
b) Determina el índice de agregación simple para 1949 con base en
1958.
c) Halla el índice de Laspeyres, Paashe, Fisher para el año 1958 con
respecto a 1949. Interpretar.
CURSO: ESTADISTICA I
CICLO III
Descargar