ESTADÍSTICA ÍNDICE 1. 2. 3. 4. 5. 6. 7. 8. Introducción. Población y muestra. Variables estadísticas: 3.1.- Cualitativas. 3.2.- Cuantitativas: discretas y continuas. Etapas de un estudio estadístico Frecuencias. Tablas de frecuencias. Gráficos estadísticos. Medidas de centralización. Medidas de dispersión. INTRODUCCIÓN La estadística se ocupa de recoger, resumir, representar y analizar los datos obtenidos de un conjunto de personas o cosas con la finalidad de extraer consecuencias de tipo práctico. Es la parte de las Matemáticas que estudia como recopilar y resumir gran cantidad de información para extraer conclusiones. POBLACIÒN Y MUESTRA. Población. Es el conjunto de todos los elementos cuyo conocimiento nos interesa. Ejemplo: Deseamos estudiar el número de hermanos, la estatura y el lugar de procedencia de los alumnos de secundaria de Colombia. Muestra. Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir características de toda la población. Ejemplo: Es muy laborioso entrevistar a todos los estudiantes de secundaria. Seleccionaríamos una muestra representativa. VARIABLES ESTADÍSTICAS Se llama variable estadística a cada una de las características que se estudian en una población. Las variables estadísticas se clasifican en: Cualitativas son las que no toman valores numéricos. Por ejemplo: el color del pelo, el lugar de nacimiento, el signo del Zodiaco,… Cuantitativa son las que toman valores numéricos. Entre ellas distinguimos dos tipos: Discretas; cuando sólo puede tomar valores aislados. Por ejemplo el número de hermanos. Continua; es una variable que puede tomar cualquier valor dentro de un intervalo. Por ejemplo el peso o la estatura de los alumnos. Variables estadísticas Variables estadísticas Variable cualitativa o atributo Variable cuantitativa Variable discreta Variable continua En el siguiente cuadro se muestran algunos ejemplos de estudios estadísticos: Estudio estadístico Población ¿Es necesario tomar muestra? Variable estadística Tipo de variable. Color del coche de los ciudadanos. Coches de los ciudadanos Sí Color Cualitativa Altura de los alumnos de la clase. Alumnos de la clase No Altura Cuantitativa continua Edad de los miembros de una familia Miembros de la familia No Edad Cuantitativa discreta. Pasos en un estudio estadístico Selección de caracteres dignos de estudio. Selección de la muestra. Recogida de datos. Ordenación de datos. Recuento de frecuencias. Agrupación de datos. Elaboración de tablas estadísticas. Representación gráfica de la distribución. Cálculo de parámetros. Sacar consecuencias válidas para la población, a partir de la muestra. Estadística inferencial. Frecuencias absolutas La frecuencia absoluta, fi, de un valor xi de una variable estadística es el número de veces que tomamos dicho valor. Ejemplo: xi: número de hijos fi: número de parejas que tienen ese número de hijos xi fi 0 1 2 3 4 5 6 4 18 41 32 11 3 1 Frecuencias relativas La frecuencia relativa, hi, de un valor xi determinado de una variable estadística es igual al cociente entre la frecuencia absoluta fi del valor y el número n de individuos de la población o muestra: fi n % hi 100 hi xi fi hi % 0 1 2 3 4 5 6 4 18 41 32 11 3 1 0,036 0,164 0,373 0,291 0,1 0,027 0,009 3,6 16,4 37,3 29,1 10,0 2,7 0,9 110 1,000 100 Frecuencias absolutas acumuladas La frecuencia absoluta acumulada, Fi correspondiente a un valor xi es la suma de las frecuencias absolutas de los valores menores o iguales que el dado: Fi = f1+f2+…fn = f i La frecuencia relativa acumulada, Hi correspondiente a un valor xi es la suma de las frecuencias relativas de los valores menores o iguales que el dado: Hi = h1+h2+…+hn= h i Tabla de distribución de frecuencias xi fi Fi hi 0 1 2 3 4 5 6 4 18 41 32 11 3 1 4 22 63 95 106 109 110 0,036 0,164 0,373 0,291 0,1 0,027 0,009 110 1,000 Hi 0,036 0,2 0,573 0,864 0,964 0,991 1 % 3,6 16,4 37,3 29,1 10,0 2,7 0,9 100 Tabla con datos agrupados en intervalos: Variable continua Número de valores que toma la variable es muy numeroso. 1.-Determinamos el número de intervalos: N 2.- Localizamos los valores extremos y se halla su diferencia: r=b–a 3.- Amplitud del intervalo: recorrido nº de int ervalos 4.- Marca de clase, es el punto medio del intervalo Estatura de 40 adolescentes 168 167 178 162 160 161 170 165 160 168 166 165 165 162 165 173 167 158 158 163 154 166 150 164 175 149 163 156 163 163 167 169 175 160 171 174 165 159 164 170 Menor = 149 Mayor = 178 R = 178 – 149 =29 Nº de intervalos: Redondeamos al entero más próximo. Tomamos 6 intervalos. 40 Amplitud =29/6 Redondeamos = 5 Intervalos [148,5-153,5) [153,5-158,5) [158,5-163,5) [163,5-168,5) [168,5-173,5) [173,5-178,5) Marcas de clase 151 156 161 166 171 176 Frecuencias 2 4 11 14 5 4 Gráficos estadísticos Diagrama de barras Modalidad A B O AB Frecuencia absoluta 11 7 6 1 25 Gráficos estadísticos Histogramas Gráficos estadísticos Polígonos de frecuencias Gráficos estadísticos Diagramas de sectores Medidas de centralización Media: Es la medida de posición central más utilizada. Para calcularla se utiliza la siguiente expresión: xi · f i x n Mediana: La mediana es el dato que ocupa la posición intermedia de la distribución, está después del 50% de los datos y precediendo al otro 50% Moda: La moda es el valor de la variable que tiene más frecuencia, es decir, que se ha obtenido más veces. Medidas de dispersión Desviaciones con respecto a la media. Se llama desviación respecto a la media de un dato xi a la diferencia: xi x Varianza y desviación típica s2 2 x x i ·fi n x x · f 2 s i n i Ejemplo: xi fi Fi xi · f i ( xi x ) 2 2 ( xi x ) ( xi x ) · f i 4 5 5 20 -1,92 3,6864 18,432 5 6 11 30 -0,92 0,8464 5,0784 6 8 19 48 0,08 0,0064 0,0512 8 4 23 32 2,08 4,3264 17,3056 9 2 25 18 3,08 9,4864 18,9728 25 148 59,84 Calculo de media, varianza y desviación típica: 148 x 5,92 25 59,84 s 2,3936 25 s 2,3936 1,547 2