Tema 2: Parámetros estadísticos. 1. PARÁMETROS ESTADÍSTICOS: En estadística, un parámetro es un número que resume la cantidad de datos que pueden derivarse del estudio de una variable estadística. 1.1 MEDIDAS DE CENTRALIZACIÓN: *MODA: La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Puede hallarse para variables cuantitativas y para variables cualitativas Ejemplo: halla la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5, ---> Mo= 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución es bimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, --->9Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8--->Mo = 4 *MEDIANA: Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo para variables cuantitativas. Cálculo de la mediana 1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un número par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5 *MEDIAS: -Media aritmética: Media aritmética La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos. es el símbolo de la media aritmética. Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio. -Media geométrica: En estadística, la media geométrica de una cantidad arbitraria de números (por decir n números) es la raíz n-ésima del producto de todos los números, es recomendada para datos de progresión geométrica, para promediar razones, interés compuesto y números índices. Por ejemplo, la media geométrica de 2 y 18 es -Media ponderada: La media ponderada es una medida de tendencia central, se construye asignándole a cada clase un peso, y obteniendo un promedio para los pesos. donde Ejemplo: En una materia dada se asignan pesos de importancia, de la siguiente forma: Unida I (20% del curso), Unidad II (25% del curso), Unidad III (20% del curso), Unidad IV (15% de la calificación), Unidad V (20% de la calificación ). Si las calificaciones de un alumno son 8 en la primera unidad, 5 en la segunda, 8 en la tercera unidad, 10 en la cuarta unidad y 8 en la última unidad. Es decir, se tienen la siguiente tabla: Unidad Ponderacion (Wi) Datos (Wi) I 20% = 0.2 8 II 25% = 0.35 5 III 20% = 0.2 8 IV 15% = 0.15 10 V 20% = 0.10 8 1.2. MEDIDAS DE POSICIÓN: *CUARTILES: Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. Cálculo de los cuarteles 1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresión . Número impar de datos 2, 5, 3, 6, 7, 4, 9 Número par de datos 2, 5, 3, 4, 6, 7, 1, 9 *DECILES: Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana. Cálculo de los deciles En primer lugar buscamos la clase donde se encuentra las frecuencias acumuladas. , en la tabla de Li es el límite inferior de la clase donde se encuentra el decil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase el decil.. ai es la amplitud de la clase. *CENTILES: Los centiles o percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana. Cálculo de los percentiles: En primer lugar buscamos la clase donde se encuentra de las frecuencias acumuladas. , en la tabla Li es el límite inferior de la clase donde se encuentra el percentil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase del percentil. ai es la amplitud de la clase. 1.3 MEDIDAS DE DISPERSIÓN: *RANGO: Se denomina rango o recorrido de una función al conjunto de los valores reales que toma la variable y o f(x). Para calcular el rango de una función tenemos que hallar el dominio de su función inversa. R= − {2} *RANGO INTERCUARTÍLICO: El rango intercuartílico es una medida de variabilidad adecuada cuando la medida de posición central empleada ha sido la mediana. Se define como la diferencia entre el tercer cuartil (Q3) y el primer cuartil (Q1), es decir: RQ = Q3 - Q1. A la mitad del rango intercuartil se le conoce como desviación cuartil (DQ): DQ = RQ/2= (Q3 - Q1)/2. *DESVIACIÓN MEDIA: Desviación media La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media. La desviación media se representa por Ejemplo Calcular la desviación media de la distribución: 9, 3, 8, 8, 9, 8, 9, 18 *VARIANZA: La varianza es la media aritmética del cuadrado de las desviaciones respecto a la media de una distribución estadística. La varianza se representa por . *DESVIACIÓN TÍPICA: La desviación típica es la raíz cuadrada de la varianza. Es decir, la raíz cuadrada de la media de los cuadrados de las puntuaciones de desviación. La desviación típica se representa por σ. 1.4 MEDIDAS DE FORMA: *COEFICIENTE DE APUNTAMIENTO: Hemos de tomar una referencia para ver si la distribución de los datos es apuntada o no. Esa referencia será la distribución normal, distinguiremos tres casos que la distribución sea más picuda que la normal, igual a ella o más aplastada. Si la distribución se llama Leptocúrtica, las frecuencias son más apuntadas que la normal. Si la distribución se llama Mesocúrtica, la distribución tiene el mismo apuntamiento que la normal. Si se denomina Platicúrtica , es menos apuntada que la normal. *CURTOSIS: En ocasiones se emplea esta otra definición del coeficiente de curtosis: donde al final se ha sustraido 3 (que es la curtosis de la Normal) con objeto de generar un coeficiente que valga 0 para la Normal y tome a ésta como referencia de apuntamiento: Tomando, pues, la distribución normal como referencia, una distribución puede ser: más apuntada y con colas más anchas que la normal –leptocúrtica. menos apuntada y con colas menos anchas que la normal- platicúrtica. la distribución normal es mesocúrtica. En la distribución normal se verifica que respecto a la media y la desviación típica. , donde es el momento de orden 4 Así tendremos que: Si la distribución es leptocúrtica Si la distribución es platicúrtica Si la distribución es mesocúrtica y y y Otra forma de medir la curtosis se obtiene examinando la fórmula de la curtosis de la suma de variables aleatorias. Si Y es la suma de n variables aleatorias estadísticamente independientes, todas con igual distribución X, entonces , complicándose la fórmula si la curtosis se hubiese definido como . 2. INTERPRETACIÓN DE LA MEDIA Y DE LA DESVIACIÓN TÍPICA. 2.1. DESIGUALDAD DE TCHEBICHEFF En probabilidad, la desigualdad de Chebyshov (también escrito como "Tchebycheff") es un resultado que ofrece una cota inferior a la probabilidad de que el valor de una variable aleatoria con varianza finita esté a una cierta distancia de su esperanza matemática. Formulación Sea que una variable aleatoria no negativa y una función . Entonces creciente tal se da la desigualdad siguiente: Casos particulares de la desigualdad Algunas formulaciones menos generales que se desprenden de la primera son las siguientes: Sea variable aleatoria con momento de orden siendo Sea y . con momento centrado de orden siendo finito, entonces , finito, entonces , y Sea real . variable aleatoria de media , Sólo en caso de que y varianza finita , entonces, para todo número la desigualdad proporciona una cota no trivial. 2.2. Transformaciones (suma y producto) en un conjunto de datos estadísticos. La transformación persigue la consecución de una distribución aproximada a la normal. Tipos: -Lineales: suma, resta, división, multiplicación---> cambian los valores brutos (datos obtenidos) de la variable sin alterar nada más. -No lineales monotónicas: cambian los valores originales y también sus distancias pero no el orden. 3. COEFICIENTE DE VARIACIÓN: Es en realidad una Medida de Dispersión relativa, pero de gran importancia, y de gran versatilidad, ya que su interpretación está basada en porcentajes, y nos da la relación existente entre la medida de posición o centraje y su precisión. Se suele expresar en “tanto” por ciento. Mide la variabilidad relativa a la media. Expresa la proporción de variabilidad de una característica por cada unidad de la Media. Se calcula: Donde es la desviación típica. Se puede dar en tanto por ciento calculando: ALICIA SOLER OLIVA Y AMALIO LUCEÑO BORRERO, 2º BACH.