Matemáticas Estadística Adrián de la Torre Isidoro 1 POBLACIÓN Y MUESTRA Estadística.- es la rama de las matemáticas que se encarga de describir y analizar datos de un estudio, y obtener consecuencias válidas del estudio. Población.- es el conjunto de elementos sujetos al estudio. Muestra.- es un subconjunto de elementos de la población. Individuo.- cada elemento de la población o de la muestra 2 VARIABLES ESTADÍSTICAS Es cada uno de los aspectos que se desea estudiar en la población. Cuantitativa.- sus valores son nos o cantidades. ― Discreta.- toma valores aislados. ― Continua.- puede tomar todos los valores de un intervalo. Cualitativa.- no toma valores numéricos. Ej.: Población: Muestra: V. Cuantitativa discreta: V. Cuantitativa continua: V. Cualitativa Videoconsolas en Aragón Videoconsolas en Zaragoza Edad Nº de consolas en una casa Marca videoconsola 3 INTERVALOS Y MARCAS DE CLASE Determinadas las variables, se deben recoger os datos de la población o muestra. Cuando el número de datos o valores de una variable es muy grande, lo que se hace para poder trabajar bien, es agruparlos en intervalos, que es un tramo comprendido entre dos números. 1er paso.- localizar los valores extremos (a,b) Ej.: [-2,3] 2º paso.- hayamos la diferencia. (d=b-a) 3er paso.- decimos cuántos intervalos vamos a formar, a mayor nº de datos, mayor nº de intervalos. 4º paso.- buscamos el múltiplo del nº de intervalos más próximo a la diferencia y mayor que la diferencia. 5º paso.- formamos los intervalos comenzando por un nº más pequeño que el nº “a” y de forma que todos los intervalos tengan la misma longitud. Llamamos marca de clase al punto medio de cada intervalo. 1 Matemáticas Estadística Ej.: 87 85 61 51 80 79 82 74 67 71 88 76 Nº de datos 1º 2º 3º 4º 5º Adrián de la Torre Isidoro 64 75 80 70 69 82 90 76 72 73 63 65 68 73 70 76 71 86 30 a=51 , b=90 [a,b]=[51,90] d=b-a=90-51=39 6 intervalos 6 7=42 longitud intermedia=7 Intervalos [49’5, 56’5] [56’5, 63’5] [63’5, 70’5] [70’5, 77’5] [77’5, 84’5] [84’5, 91’5] Marcas de clase 53 60 67 74 81 88 4 TABLA DE FRECUENCIAS 4.1. LAS TABLAS DE FRECUENCIAS Sirve para organizar y ordenar los datos que tenemos. Frecuencia absoluta.- es el número de veces que aparece cada valor de la variable y se representa por fi. Frecuencia absoluta acumulada.- es la suma de todas las frecuencias absolutas de los datos anteriores más la frecuencia absoluta del dato actual y se representa con Fi. Frecuencia relativa.- es el cociente entre la frecuencia absoluta y el nº total de datos y se representa con fri. Frecuencia relativa acumulada.- es el cociente entre la frecuencia absoluta acumulada y el nº total de datos. Se representa con Fri. 4.2. TABLAS DE FRECUENCIAS CON DATOS AISLADOS x1, x2, x3,… Ej.: datos distintos que toma la variable. xi fi fri N 1 Fi Fri N 1 x1 x2 x3 . . Suma 2 Matemáticas 4.3. Estadística Adrián de la Torre Isidoro TABLA DE FRECUENCIAS CON DATOS AGRUPADOS EN INTERVALOS Estas tablas se utilizan cuando el nº de valores de la variable es muy grande. Ii cada una de los intervalos (I1, I2…) xi marca de clase de cada intervalo. fi el nº de elementos que están dentro de cada intervalo. xi Ii fi fri Fi Fri Ej.: el peso de 30 personas encuestadas es el siguiente: 86 65 82 71 63 69 76 73 70 70 72 80 73 76 75 68 90 64 76 74 51 88 82 61 71 79 85 N=30 1º 2º 3º 4º a=51, b=90 d=90-51=39 5 intervalos 5 8=40 long. Int.=8 Ii xi fi fri Fi Fri [50,58] 54 1 0’03 1 0’033 [58,66] 62 4 0’133 5 0’166 [66,74] 70 10 0’333 15 0’499 [74,82] 78 8 0’266 23 0’765 [82,90] 86 7 0’233 30 1 30 1 3 67 80 87 Matemáticas Estadística Adrián de la Torre Isidoro 5 GRÁFICOS 5.1. DIAGRAMA DE BARRAS Estos gráficos se utilizan para representar tabla de frecuencias de variables cualitativas discretas o variables cualitativas. Ej.: nº de hermanos de una clase; y del nº de pie 5.2. HISTOGRAMA Estos gráficos se utilizan para representar tabla de frecuencias de variables cuantitativas continua. 5.3. POLÍGONO DE FRECUENCIAS a) Diagrama de barras.- el polígono de frecuencias se construye uniendo los puntos superiores de cada barra y prolongando al principio y al final hasta llegar al eje de las xi. b) Histograma.- se construye uniendo los puntos medios de los segmentos superiores de los rectángulos y Prolongando al principio y al final, hasta llegar al eje de las xi. 4 Matemáticas Estadística Adrián de la Torre Isidoro 5.4. DIAGRAMA DE SECTORES El ángulo de cada sector es proporcional a la frecuencia correspondiente. Grados Frecuencia (fi) 360° N x fi Ej.: color preferido de una clase. Total de datos Datos: N x1 x2 f1 f2 Rojo: Azul y Negro: Verde: Blanco: R 8 N 2 A 2 V 3 B 1 360 x 360 x 360 x 360 x 16 8 16 2 16 3 16 1 } } } } x= x= x= x= 6 PARÁMETROS ESTADÍSTICOS Sirven para dar información de tablas o gráficas. 6.1. MEDIDAS DE CENTRALIZACIÓN Indican a qué valor se acercan todos los valores de la variable: MEDIA o 1ªforma.- a partir de los datos. Si x1, x2, x3… son los datos y “n” es el nº de datos. media= Ej.: Calcular la media sabiendo que sus datos son: 3 7 5 6 5 3 4 5 6 7 7 7 5 Matemáticas Estadística o 2ª forma.- a partir de la tabla de frecuencias. Sean x1, x2, x3… los datos distintos de la variable y f1, f2, f3… las frecuencias absolutas correspondientes a cada uno de los datos. Ej.: xi 3 4 5 6 7 fi 2 1 3 2 4 12 fi xi 6 4 15 12 28 65 MEDIANA Sea n el nº de datos: 1º Ordenar de menor a mayor los datos. 2º La mediana se calcula de dos formas: Me Adrián de la Torre Isidoro Si n es impar: Me es el valor del dato central. { Ej.: Me=6 Si n es par: Me es la semisuma de los dos valores centrales. Ej.: Me= CUARTILES Primero (inferior) (Q1) es el valor de la variable que deja por debajo del 25% y por encima, el 75% Segundo (Q2)=Me Tercero (superior) (Q3) es el valor de la variable que deja por debajo del 75% y por encima del 25%. MODA Es el dato con mayor frecuencia. Se escribe Mo. 6 Matemáticas 6.2. Estadística Adrián de la Torre Isidoro MEDIDAS DE DISPERSIÓN RECORRIDO O RANGO El rango de una variable es la diferencia entre el dato mayor y menor, es decir, es la longitud del intervalo donde están todos los datos. DESVIACIÓN MEDIA Es el promedio de las distancias de los datos a la media. VARIANZA Es el promedio de los cuadrados de las distancias de los datos a la media. DESVIACIÓN TÍPICA Es la raíz cuadrada de la varianza. Ej.: 3 ― ― ― ― n=12 Rango DM= 7 5 6 3 4 5 6 7 7 7 5 7-3=4 ― DM xi 3 4 5 6 7 SUMA fi 2 1 3 2 4 12 Σfi 2 xi 9 16 25 36 49 xi fi 6 4 15 12 28 65 7 2 fi xi 18 16 75 72 196 377 2’42 1’42 0’42 0’58 1’58 4’84 1’42 1’26 1’16 6’32 15 Matemáticas 6.3. 6.4. Estadística Adrián de la Torre Isidoro MEDIA Y DESVIACIÓN TÍPICA ― ― ― Nos permiten conocer como se distribuyen los datos de una variable. ― Cuanto mayor es la desviación típica, más alejados están los datos de la media. La media nos dice dónde está su centro. La desviación típica nos indica cómo de alejados o dispersos están los datos respecto de la media. COEFICIENTE DE VARIACIÓN Si deseamos estudiar una misma variable en poblaciones distintas, los valores difieren bastante entre sí, no es suficiente con estudiar su media y su desviación típica, pues la desviación típica no permite comparar dispersiones tan distintas, para ello definimos un nuevo parámetro. Coeficiente de variación: Se puede con un nº decimal o con un tanto por ciento. A mayor coeficiente de variación, mayor dispersión habrá de los datos. Ej.: precios de pianos, flautas y armónicas. Pianos 943 € 148€ Flautas 132€ 22€ Armónicas 37€ 12€ Pianos 100=15’7% Flautas 100=16’7% Armónicas 100=32’4% 8