Estadística - Nuestros Apuntes

Anuncio
Matemáticas
Estadística
Adrián de la Torre Isidoro
1 POBLACIÓN Y MUESTRA
Estadística.- es la rama de las matemáticas que se encarga de describir y analizar
datos de un estudio, y obtener consecuencias válidas del estudio.
Población.- es el conjunto de elementos sujetos al estudio.
Muestra.- es un subconjunto de elementos de la población.
Individuo.- cada elemento de la población o de la muestra
2 VARIABLES ESTADÍSTICAS
Es cada uno de los aspectos que se desea estudiar en la población.
Cuantitativa.- sus valores son nos o cantidades.
― Discreta.- toma valores aislados.
― Continua.- puede tomar todos los valores de un intervalo.
Cualitativa.- no toma valores numéricos.
Ej.:
Población:
Muestra:
V. Cuantitativa discreta:
V. Cuantitativa continua:
V. Cualitativa
Videoconsolas en Aragón
Videoconsolas en Zaragoza
Edad
Nº de consolas en una casa
Marca videoconsola
3 INTERVALOS Y MARCAS DE CLASE
Determinadas las variables, se deben recoger os datos de la población o muestra.
Cuando el número de datos o valores de una variable es muy grande, lo que se hace para
poder trabajar bien, es agruparlos en intervalos, que es un tramo comprendido entre dos números.
1er paso.- localizar los valores extremos (a,b) Ej.: [-2,3]
2º paso.- hayamos la diferencia. (d=b-a)
3er paso.- decimos cuántos intervalos vamos a formar, a mayor nº de datos,
mayor nº de intervalos.
4º paso.- buscamos el múltiplo del nº de intervalos más próximo a la diferencia y
mayor que la diferencia.
5º paso.- formamos los intervalos comenzando por un nº más pequeño que el nº
“a” y de forma que todos los intervalos tengan la misma longitud.
Llamamos marca de clase al punto medio de cada intervalo.
1
Matemáticas
Estadística
Ej.:
87 85 61 51
80 79 82 74
67 71 88 76
Nº de datos
1º
2º
3º
4º
5º
Adrián de la Torre Isidoro
64 75 80 70 69 82
90 76 72 73 63 65
68 73 70 76 71 86
30
a=51 , b=90 [a,b]=[51,90]
d=b-a=90-51=39
6 intervalos
6 7=42 longitud intermedia=7
Intervalos
[49’5, 56’5]
[56’5, 63’5]
[63’5, 70’5]
[70’5, 77’5]
[77’5, 84’5]
[84’5, 91’5]
Marcas de clase
53
60
67
74
81
88
4 TABLA DE FRECUENCIAS
4.1. LAS TABLAS DE FRECUENCIAS
Sirve para organizar y ordenar los datos que tenemos.
Frecuencia absoluta.- es el número de veces que aparece cada valor de la
variable y se representa por fi.
Frecuencia absoluta acumulada.- es la suma de todas las frecuencias
absolutas de los datos anteriores más la frecuencia absoluta del dato actual
y se representa con Fi.
Frecuencia relativa.- es el cociente entre la frecuencia absoluta y el nº total
de datos y se representa con fri.
Frecuencia relativa acumulada.- es el cociente entre la frecuencia absoluta
acumulada y el nº total de datos. Se representa con Fri.
4.2. TABLAS DE FRECUENCIAS CON DATOS AISLADOS
x1, x2, x3,…
Ej.:
datos distintos que toma la variable.
xi
fi
fri
N
1
Fi
Fri
N
1
x1
x2
x3
.
.
Suma
2
Matemáticas
4.3.
Estadística
Adrián de la Torre Isidoro
TABLA DE FRECUENCIAS CON DATOS AGRUPADOS EN INTERVALOS
Estas tablas se utilizan cuando el nº de valores de la variable es muy grande.
Ii
cada una de los intervalos (I1, I2…)
xi
marca de clase de cada intervalo.
fi
el nº de elementos que están dentro de cada intervalo.
xi
Ii
fi
fri
Fi
Fri
Ej.: el peso de 30 personas encuestadas es el siguiente:
86
65
82
71
63
69
76
73
70
70
72
80
73
76
75
68
90
64
76
74
51
88
82
61
71
79
85
N=30
1º
2º
3º
4º
a=51, b=90
d=90-51=39
5 intervalos
5 8=40 long. Int.=8
Ii
xi
fi
fri
Fi
Fri
[50,58]
54
1
0’03
1
0’033
[58,66]
62
4
0’133
5
0’166
[66,74]
70
10
0’333
15
0’499
[74,82]
78
8
0’266
23
0’765
[82,90]
86
7
0’233
30
1
30
1
3
67
80
87
Matemáticas
Estadística
Adrián de la Torre Isidoro
5 GRÁFICOS
5.1. DIAGRAMA DE BARRAS
Estos gráficos se utilizan para representar tabla de frecuencias de variables
cualitativas discretas o variables cualitativas.
Ej.: nº de hermanos de una clase; y del nº de pie
5.2. HISTOGRAMA
Estos gráficos se utilizan para representar tabla de frecuencias de variables
cuantitativas continua.
5.3.
POLÍGONO DE FRECUENCIAS
a) Diagrama de barras.- el polígono de frecuencias se
construye uniendo los puntos superiores de cada barra y
prolongando al principio y al final hasta llegar al eje de
las xi.
b) Histograma.- se construye uniendo los puntos medios de
los segmentos superiores de los rectángulos y Prolongando
al principio y al final, hasta llegar al eje de las xi.
4
Matemáticas
Estadística
Adrián de la Torre Isidoro
5.4.
DIAGRAMA DE SECTORES
El ángulo de cada sector es proporcional a la frecuencia correspondiente.
Grados Frecuencia (fi)
360°
N
x
fi
Ej.: color preferido de una clase.
Total de
datos
Datos:
N
x1
x2
f1
f2
Rojo:
Azul y Negro:
Verde:
Blanco:
R 8
N 2
A 2
V 3
B 1
360
x
360
x
360
x
360
x
16
8
16
2
16
3
16
1
}
}
}
}
x=
x=
x=
x=
6 PARÁMETROS ESTADÍSTICOS
Sirven para dar información de tablas o gráficas.
6.1.
MEDIDAS DE CENTRALIZACIÓN
Indican a qué valor se acercan todos los valores de la variable:

MEDIA
o 1ªforma.- a partir de los datos. Si x1, x2, x3… son los datos y “n” es el nº
de datos.
media=
Ej.: Calcular la media sabiendo que sus datos son:
3 7
5 6
5
3 4
5 6
7 7
7 5
Matemáticas
Estadística
o
2ª forma.- a partir de la tabla de frecuencias. Sean x1, x2, x3… los datos
distintos de la variable y f1, f2, f3… las frecuencias absolutas
correspondientes a cada uno de los datos.
Ej.:

xi
3
4
5
6
7
fi
2
1
3
2
4
12
fi xi
6
4
15
12
28
65
MEDIANA
Sea n el nº de datos:
1º Ordenar de menor a mayor los datos.
2º La mediana se calcula de dos formas:
Me

Adrián de la Torre Isidoro
Si n es impar: Me es el valor
del dato central.
{
Ej.:
Me=6
Si n es par: Me es la semisuma
de los dos valores centrales.
Ej.:
Me=
CUARTILES
Primero (inferior) (Q1) es el valor de la variable que deja por debajo del
25% y por encima, el 75%
Segundo (Q2)=Me
Tercero (superior) (Q3) es el valor de la variable que deja por debajo del
75% y por encima del 25%.

MODA
Es el dato con mayor frecuencia. Se escribe Mo.
6
Matemáticas
6.2.
Estadística
Adrián de la Torre Isidoro
MEDIDAS DE DISPERSIÓN

RECORRIDO O RANGO
El rango de una variable es la diferencia entre el dato mayor y menor, es decir,
es la longitud del intervalo donde están todos los datos.

DESVIACIÓN MEDIA
Es el promedio de las distancias de los datos a la media.

VARIANZA
Es el promedio de los cuadrados de las distancias de los datos a la media.

DESVIACIÓN TÍPICA
Es la raíz cuadrada de la varianza.
Ej.:
3
―
―
―
―
n=12
Rango
DM=
7
5
6
3
4
5
6
7
7
7
5
7-3=4
―
DM
xi
3
4
5
6
7
SUMA
fi
2
1
3
2
4
12
Σfi
2
xi
9
16
25
36
49
xi fi
6
4
15
12
28
65
7
2
fi xi
18
16
75
72
196
377
2’42
1’42
0’42
0’58
1’58
4’84
1’42
1’26
1’16
6’32
15
Matemáticas
6.3.
6.4.
Estadística
Adrián de la Torre Isidoro
MEDIA Y DESVIACIÓN TÍPICA
―
―
―
Nos permiten conocer como se distribuyen los datos de una variable.
―
Cuanto mayor es la desviación típica, más alejados están los datos de la media.
La media nos dice dónde está su centro.
La desviación típica nos indica cómo de alejados o dispersos están los datos
respecto de la media.
COEFICIENTE DE VARIACIÓN
Si deseamos estudiar una misma variable en poblaciones distintas, los valores
difieren bastante entre sí, no es suficiente con estudiar su media y su desviación típica,
pues la desviación típica no permite comparar dispersiones tan distintas, para ello
definimos un nuevo parámetro.
Coeficiente de variación:
Se puede con un nº decimal o con un tanto por ciento.
A mayor coeficiente de variación, mayor dispersión habrá de los datos.
Ej.: precios de pianos, flautas y armónicas.
Pianos
943 €
148€
Flautas
132€
22€
Armónicas
37€
12€
Pianos
100=15’7%
Flautas
100=16’7%
Armónicas
100=32’4%
8
Descargar