Tema 2 ESTADÍSTICA DESCRIPTIVA 1.- DISTRIBUCIONES UNIDIMENSIONALES. CÁLCULO DE PARÁMETROS PARÁMETROS DE CENTRALIZACIÓN En la búsqueda de la concreción y la simplificación, la información recogida en una tabla o gráfica estadística suele resumirse en unos pocos valores que nos informan del comportamiento de todos los individuos del colectivo estudiado. Estos valores, representativos de todos los datos de una distribución, se llaman parámetros o medidas de centralización. MEDIA ARITMÉTICA Media aritmética de una variable estadística es el cociente que resulta de dividir la suma de todos los valores por el número total de éstos. Se representa por x . Su cálculo se realiza, según las expresiones que siguen, atendiendo a la presentación de los datos. Para datos sin frecuencias Si la variable toma los N valores x1, x2,...,xn la media aritmética adopta la expresión: x x1 x2 ... xn xi N N Para datos con frecuencias Si la variable toma los valores o marcas de clase x1, x2 , xn, siendo f1, f2,.... fn las frecuencias absolutas correspondientes de la distribución, la media aritmética se calcula con la expresión: x x1 f1 x2 f 2 ... xn f n xi f i xi f i f1 f 2 ... f n f i N Pg. nº 1/17 Tema 2 Para datos ponderados La media ponderada se calcula cuando todos los valores de la variable no tienen el mismo “peso”. Su fórmula es análoga a la vista con anterioridad, cambiando las frecuencias f i, por los pesos pi, y, en el denominador, N por la suma de todos los pesos pi , por lo que resulta: x x1 p1 x2 p2 ... xn pn xi pi p1 p2 ... p n pi Consideraciones sobre la media aritmética. La media aritmética es el parámetro de centralización más utilizado. Presenta la ventaja de tener en cuenta todos los datos de la distribución, además de resultar muy sencillo su cálculo. Tiene el inconveniente de que si la distribución posee valores extremos, excepcionalmente raros y pocos significativos, éstos producen una distorsión sobre el valor de la media. No siempre es posible calcular la media aritmética y, a veces, aunque sea posible calcularla, carece de significado como sucede en las variables cualitativas o se trata de intervalos abiertos. En estos casos deben utilizarse otras medidas de centralización. Si se suma una constante a todos los valores de la variable, la media aritmética aumenta en el mismo valor. Si se multiplican todos los valores de la variable por un mismo número, la media queda multiplicada por el mismo número. MODA Se denomina moda de una variable estadística al valor de la variable que tiene mayor frecuencia absoluta. Se representa por Mo. La moda de una variable discreta es fácil de calcular, basta buscar el valor de la variable que presenta mayor frecuencia. Puede ocurrir que la moda no sea única, es decir, la distribución puede tener 2, 3 o más modas, recibiendo el nombre de bimodal, trimodal, etc. En el caso de que los datos se encuentren agrupados en intervalos, la clase con mayor frecuencia se denomina clase modal. Puede tomarse como moda la marca de clase de la clase modal. Si se desea mayor precisión en el cálculo de la moda, ésta puede obtenerse mediante la expresión: M o Li c D D D Li= Límite inferior del intervalo. C= Amplitud del intervalo. D=Diferencia entre la frecuencia absoluta del intervalo modal y los vecinos. Pg. nº 2/17 Tema 2 Cálculo de la moda por el método gráfico. Para las distribuciones que se encuentran agrupadas en intervalos existe un método gráfico muy sencillo que permite obtener la moda con bastante aproximación. Para ello se representa el histograma de frecuencias absolutas, al ser posible en papel milimetrado, con el fin de poder obtener mayor precisión. Seguidamente se unen, con líneas los extremos de la clase modal con las contiguas. La moda viene dada por la abscisa del punto de corte. Consideraciones sobre la moda. Puede ocurrir que existan distribuciones que no tengan moda; eso ocurre cuando las frecuencias de todos los datos, o casi todos, son iguales. Puede ser muy útil cuando se trata de variables cualitativas. En su cálculo no intervienen todos los datos de la distribución. Aun cuando es una medida de centralización, es relativamente frecuente encontrar modas situadas en los extremos de la distribución. MEDIANA La mediana de una distribución estadística es el valor de la variable, tal que el número de datos menores que él es igual al número de datos mayores que él. Se representa por Me. Si la distribución es de una variable discreta y el número de datos es impar, la mediana es el valor central, y si el número de datos es par, la mediana es la media de los valores centrales. Si la distribución es de una variable continua, el intervalo que contiene a la mediana se denomina clase mediana o intervalo mediano. Puede tomarse como mediana, en una primera aproximación, la marca del intervalo mediano. Si se desea mayor precisión en el cálculo de la mediana, ésta se obtiene, dentro del intervalo mediano, mediante la expresión: N Fi 1 M e Li c 2 fi Variable discreta: N impar Me X( n 1)/ 2 N par Me Xn / 2 Xn / 21 / 2 Li= Límite inferior del intervalo. C= Amplitud del intervalo. N= Número total de datos Fi-1= Frecuencia absoluta acumulada de la clase anterior a la clase mediana. fi= Frecuencia absoluta de la clase mediana. Pg. nº 3/17 Tema 2 Consideraciones sobre la mediana. La mediana es particularmente útil en los siguientes casos: Cuando entre los datos existen valores ostensiblemente extremos. Cuando los datos están agrupados en intervalos y alguno es abierto. La mediana depende del orden de los datos y no de su valor. Cuando en su cálculo, el valor N/2 cae justo en el límite de un intervalo, se hace la media entre la frecuencia de este y del posterior. Relación entre Media, Mediana y Moda. Si una distribución es simétrica o ligeramente asimétrica, experimentalmente que se cumple la siguiente relación: se puede comprobar Media – Moda = 3 (Media – Mediana) Gracias a esta relación se puede obtener, con un cierto error, alguno de estos parámetros en función de los otros dos. Veamos a continuación tres distribuciones en las que se sitúan los parámetros: CUANTILES La mediana de los valores de una variable estadística divide a la distribución en dos partes iguales. Es decir, la mediana parte la distribución en dos mitades, cada una corresponde al 50% de los datos. Generalizando la idea anterior, se puede pensar en obtener valores que dividan a distribución en diversas partes iguales, dando lugar a los cuantiles. Los más importantes y usados, sobretodos en las ciencias sociales y médicas, son: CUARTILES Se llaman cuartiles a tres valores que dividen la distribución en cuatro partes iguales. Se representan y designan como cuartil primero (Q1), segundo (Q2 ) y tercero (Q3). Cada parte agrupa, por tanto, al 25%, al 50% y al 75% de los datos de la distribución. Pg. nº 4/17 Tema 2 Es obvio que el segundo cuartil, por definición, coincide con la mediana. El cálculo de los otros cuartiles sigue las pautas de la mediana y se obtienen a través de las expresiones: N Fi 1 Q1 Li c 4 fi 3N Fi 1 4 Q3 Li c fi DECILES Análogamente, se llaman deciles a nueve valores de la variable que dividen a la distribución en diez partes iguales. Es decir, los deciles agrupan a los datos en diez partes correspondientes cada una con el 10% de la distribución. Se representan por D 1, D2, ..., D9 y la expresión que permite calcularlos es: kN Fi 1 Dk Li c 10 fi K=1, 2, 3,...,9 PERCENTILES De la misma manera, decimos que se llaman percentiles a 99 valores que divide la distribución en 100 partes iguales Se representa por P1, P2, ..., P99 y se calculan a través de la expresión xN Fi 1 100 Px Li c fi X=1, 2, 3,...,99 Cálculo gráfico de los cuantiles Para calcular gráficamente los cuantiles de una distribución existe un método muy sencillo que consiste en representar el polígono de frecuencias porcentuales acumuladas (Pi), situando en el eje abscisa la variable discreta o los intervalos, y en el eje de ordenadas los porcentajes correspondientes. Convine realizar la representación en papel milimetrado para mayor precisión. Pg. nº 5/17 Tema 2 Ejemplo. Pg. nº 6/17 Tema 2 PARÁMETROS DE DISPERSIÓN Las medidas de centralización vistas con anterioridad necesitan de otras que las complementen en el estudio de las distribuciones de frecuencias de las variables estadísticas. Estas nuevas medidas, que denominamos parámetros de dispersión, informan de las desviaciones que sufren los datos respecto de los valores centrales, en especial con relación a la media aritmética. Los parámetros de dispersión más usuales son: RECORRIDO Recorrido o rango de una variable estadística es la diferencia entre el mayor y el menor valor de los datos observados. Se representa por R. Así, se tiene: R = Xmax - Xmin VARIANZA Varianza de una variable estadística es la media aritmética de los cuadrados de las desviaciones de todos los datos o marcas de clase respecto de la media. Se representa por σ2 ó S2 Las expresiones equivalentes que permiten calcular la varianza son: 2 f (x i i x )2 N 2 fx 2 i i N x2 Es importante conocer que la varianza es siempre positiva, o nula en caso de que todos los valores de la variable sean iguales. DESVIACION TIPICA Se denomina desviación típica de una variable estadística a la raíz cuadrada positiva de la varianza. Se representa por σ ó S. f (x i i x )2 N fx i N 2 i x2 Consideraciones sobre la desviación típica La desviación típica es el parámetro de dispersión más utilizado. Si se suma una constante a todos los valores de la variable, la desviación típica no varía. Si se multiplican todos los valores de la variable por un mismo número, la desviación típica queda multiplicada por el mismo número. No se puede calcular, es obvio, en el caso de que no se pueda calcular la media. Pg. nº 7/17 Tema 2 ESTUDIO CONJUNTO DE x y σ La media aritmética, x , y la desviación típica, σ , son los parámetros estadísticos por antonomasia. La media es la medida central más utilizada y la desviación típica es la medida de dispersión o variabilidad por excelencia. En toda distribución estadística, el estudio del comportamiento conjunto de la media aritmética y la desviación típica nos aporta numerosa información sobre la distribución de frecuencias estudiada. En casi todas las distribuciones estadísticas de comportamiento normal se verifican de forma aproximada los porcentajes descritos a continuación que, referidos a la media y la desviación típica, expresan la distribución de datos. Para una distribución estadística de comportamiento normal, se cumple: En ( x -σ x +σ ) está el 68% del total de individuos. En ( x -2σ x +2σ) está el 95% del total de individuos. En ( x -3σ x +3σ) está el 99% del total de individuos. Coeficiente de variación de Pearson Para comparar el grado de dispersión de dos o más distribuciones no podemos confrontar simplemente las desviaciones típicas, puesto que esas medidas de dispersión vienen afectadas por la escala de la medida representativa de la variable. Es necesario por lo tanto eliminar esa influencia convirtiendo dichas medidas en números abstractos. Para ello utilizaremos el coeficiente de variación de Pearson: cv x 100 Como sabemos que las medidas de centralización son más representativas cuanto más concentrada estén, vamos a establecer las siguientes condiciones: Menos de 30% representativa. Entre 30% y 45% MEDIA concentración, y por lo tanto la media es medianamente representativa. Mayor de un 45% BAJA concentración, y por lo tanto la media es poco o muy poco representativa. ALTA concentración, y por lo tanto la media es altamente El inconveniente que tiene C.V. es que deja de ser útil cuando la media es igual a 0. Pg. nº 8/17 Tema 2 Coeficiente de asimetría de Pearson Una distribución será simétrica o asimétrica, según lo sea su representación gráfica. Será asimétrica hacia la derecha (asimetría positiva), o a la izquierda (asimetría negativa), si su representación gráfica está más estirada hacia la derecha o izquierda. La medida de asimetría más utilizada es el coeficiente de asimetría de Pearson: x - Mo As = σ Si As = 0 No existe asimetría y por lo tanto la distribución es Simétrica. Si As > 0 Existe Asimetría positiva o a la derecha. Si As < 0 Existe Asimetría negativa o a la izquierda. Ahora bien, por diversas razones, este coeficiente no se puede aplicar en los siguientes casos: Cuando la distribución no es unimodal. En este caso, se puede solucionar aplicando la relación empírica: Media – Moda = 3 (Media – Mediana) Por lo que el coeficiente quedaría: 3 ( x – Mediana) As = σ Cuando la distribución no es campaniforme, y especialmente cuando adopta forma de U. En este caso abría que aplicar el coeficiente G1, que no veremos. Pg. nº 9/17 Tema 2 2.- Puntuaciones típicas o normalizadas Para poder comparar dos datos correspondientes a dos distribuciones distintas, hay que “tipificar o normalizar” dichos valores, es decir, calcular los valores “z” de cada uno de ellos por medio de: z (x x) Una vez obtenidos dichos valores se pueden comparar, ya que las distintas distribuciones están pasadas a unidades de desviación estándar, y por lo tanto perfectamente comparables. Las puntuaciones típicas o normalizadas, también llamadas puntuaciones z, tienen las siguientes propiedades: Si se transforma una distribución en puntuaciones típicas, no varía la forma de la distribución original. La media aritmética de las puntuaciones normalizadas es cero, es decir, z 0 . La desviación típica de las puntuaciones típicas es la unidad, es decir, z 1 Pg. nº 10/17 Tema 2 EJERCICIOS RESUELTOS 1. La estación meteorológica del Roque de los Muchachos registró 88 días de lluvia el pasado año, según muestra la tabla siguiente: Litros/m2 [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) Nº de días 3 7 19 23 18 12 6 Calcula la precipitación media durante los días de lluvia. Litros/m2 [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) 2. Xi fi Fi 2,5 7,5 12,5 17,5 22,5 27,5 32,5 Σ 3 7 19 23 18 12 6 88 3 10 29 52 70 82 88 Xifi 7,5 52,5 237,5 402,5 405 330 195 1630 x i N i ; x 1630 18,523 88 Por tanto, el año pasado la precipitación media durante los días de lluvia fue de 18,523 l/m 2. La calificación media que han obtenido los alumnos de Ingeniería Técnica Agrícola de cierta Universidad, en la asignatura de Estadística durante los cuatro últimos cursos han sido: 5,8; 6,3; 6,7 y 7,2, respectivamente. En el primero de estos cursos se examinaron 180 alumnos, en el segundo 200, en el tercero 275 y en el cuarto 220. ¿Cuál es la calificación media de estos cursos en dicha asignatura? Nota media N" de alumnos Xi fi 5,8 180 6,3 200 6,7 275 7,2 220 Σ 875 xifi 1 044 1 260 1 842,5 1 584 5 730,5 Calcularemos la media aritmética ponderada, en la que el número de alumnos son los pesos correspondientes a las calificaciones medias de cada año. x xf f i i i 3. x f ; x 5730,5 6,55 875 Calcula la moda y la mediana correspondiente a la variable litros/m2 durante los días de lluvia en la estación meteorológica del Roque de los Muchachos, según la distribución citada en el ejercicio 1. La moda El mayor valor de la frecuencia, 23, corresponde al intervalo [15, 20) que recibe el nombre de intervalo modal. En una primera aproximación se puede tomar la moda como la marca de clase, es decir, Mo=17,5. Para obtener una mayor precisión utilizamos la fórmula: M o Li c D ; D D M o 15 5 23 19 17,22 (23 19) (23 18) El dato que más se repite es de 17,22 litros/m2 La mediana El intervalo mediano es [15, 20), ya que contiene el dato 88/2=44. 88 N 29 Fi 1 2 2 ; M 15 5 18,26 M e Li c e 23 fi El 50% de los días de lluvia se recogieron más de 18,26 Litros/m 2 y el otro 50% de los días por debajo. Pg. nº 11/17 Tema 2 4. Se ha pasado un test de 80 preguntas a 600 personas. El número de respuestas correctas se refleja en la siguiente tabla: RESPUESTAS CORRECTAS NÚMEROS DE PERSONAS a) b) c) d) e) f) g) [0, 10) [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70) [70, 80] 40 60 75 90 105 85 80 65 Efectuar la tabla de frecuencias y porcentajes. Determinar el primer y tercer cuartil. Determinar el tercer decil. Determinar el percentil 45. Una persona que respondió 64 preguntas, ¿qué percentil tiene? Se desea seleccionar a los 24 mejores, ¿a partir de cuántas preguntas se encuentran? Se selecciona al 40% de los mejores, ¿cuántas personas son y a partir de que puntuación se encuentran? Respuestas correctas [0, 10) [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70) [70, 80] ∑ Marca clase Xi 5 15 25 35 45 55 65 75 fi Fi hi Hi pi Pi 40 60 75 90 105 85 80 65 40 100 175 265 370 455 535 600 0,067 0,100 0,125 0,150 0,175 0,142 0,133 0,108 0,067 0,167 0,292 0,441 0,617 0,758 0,892 1 6,7 10 12,5 15 17,5 14,2 13,3 10,8 6,7 16,7 29,2 44,1 61,7 75,8 89,2 100 600 1 3 600 175 c) D3 30 10 10 30,55 ; 90 45 600 265 d) P45 40 10 100 40,48 ; 105 x 600 455 e) 64 60 10 100 80 100 N Fi 1 Q1 Li c 4 fi 150 100 Q1 20 10 26.67 75 b) El 25% de las personas acertaron menos de 27 preguntas. 450 370 Q3 50 10 59,41 85 El 75% de las personas acertaron menos de 59 preguntas. El 30% de las personas acertaron menos de 31 pregunta, o el 70% acertaron más de 31 preguntas. El 45% de las personas con menos aciertos contestaron correctamente como máximo 40 preguntas. ; x=81,17% Tiene un percentil 81. También que el 19% de las personas contestaron correctamente más de 64 preguntas. f) 24 personas equivale al 4%; como se toman de la parte superior de la distribución trabajamos con: 96 600 535 P96 70 10 100 76,31 65 Los 24 mejores tienen más de 76 preguntas contestadas correctamente. 60 600 265 g) El 40% de las personas son 240 personas. P60 40 10 100 49,05 ; 105 Esto quiere decir que el 40% de las personas que contestaron mejor, respondieron correctamente más de 49 preguntas. Pg. nº 12/17 Tema 2 5. Completar la tabla del ejercicio 4 y determinar: a) La media. b) La moda. c) La mediana. d) La desviación típica. e) El grado de concentración de la distribución. f) Si consideramos que la distribución tiene un comportamiento “normal”, ¿entre qué valores se encuentra el 95% de las personas que ocupan el centro de la distribución? Marca Respuestas clase correctas Xi [0, 10) 5 fi Fi 40 40 pi Pi xifi Xi2fi 0,067 0,067 6,7 6,7 200 1000 hi Hi [10, 20) 15 60 100 0,100 0,167 10 16,7 900 13500 [20, 30) 25 75 175 0,125 0,292 12,5 29,2 1875 46875 [30, 40) 35 90 265 0,150 0,441 15 44,1 3150 110250 [40, 50) 45 105 370 0,175 0,617 17,5 61,7 4725 212625 [50, 60) 55 85 455 0,142 0,758 14,2 75,8 4675 257125 [60, 70) 65 80 535 0,133 0,892 13,3 89,2 5200 338000 [70, 80] 75 65 600 0,108 10,8 100 4875 365625 ∑ a) x 600 x f i i N b) M o Li c x ; D ; D D 1 1 100 25600 1345000 25600 42,6 ; 600 M o 40 10 15 44,286 15 20 El número de preguntas acertadas que más se repite es 44. 600 N 265 Fi 1 2 c) M L c 2 ; M 40 10 43,3 e e i 105 fi El 50% de las personas respondieron correctamente menos 43 de preguntas. fx d) i 2 i N e) cv x 100 ; x2 ; cv 1345000 42,6 2 20,524 600 20,525 100 48,105 42,6 Como es mayor de 45 se considera que tiene una concentración más bien baja. f) Teniendo en cuenta que en el intervalo ( x -σ x +σ ) está el 68% del total de individuos (42,6 20,524;42,6 20524 ) (22,14;63,19) Esto quiere decir, que el 68% de las personas del centro de la distribución contestaron entre 22 y 63 preguntas correctamente. Pg. nº 13/17 Tema 2 6. Dadas las siguientes distribuciones: Los pesos de los toros de lidia de una ganadería se distribuyen con una x1 510 kg y una 1 25 kg Los pesos de los perros de una exposición canina se distribuyen con una x 2 19 kg y una 2 10 kg. Determinar cuál de las dos distribuciones está más dispersa. La desviación típica de los pesos de la manada de los toros bravos es superior que la de los perros. Sin embargo, esos 25 kg son poca cosa para el enorme peso de los toros (es decir, los toros de esa manada son muy parecidos en peso), mientras que 10 kg en relación con el peso del perro es mucho (imaginamos que en la exposición canina habrá perros muy dispares: caniches, "salchichas", dogos, mastines... Comparando los coeficientes de variación: CVtoros=(25/510)100=4,9% CVperros=(10/19)100=52,6%. Con estos parámetros se ve claramente que el peso de los perros de la exposición canina es mucho más disperso que el de los toros de la manada. 7. Una empresa debe cubrir un cierto número de puestos de trabajo de dos tipos A, y B. Se somete a los aspirantes a dos pruebas, ambas puntuables de 0 a 50, diseñadas para valorar sus aptitudes en uno y otro tipo de trabajo. En la Prueba A, la media de calificaciones ha sido x A 28 , y la desviación típica A 3,4 . En la B han sido, respectivamente, x B 24 y B 2,1 . Dígase: ¿Qué tipo de puesto de trabajo asignaríamos a un aspirante que hubiera obtenido 33 puntos en la prueba A y 28 en la B? En ambos casos se halla por encima de la media. Su puntuación es más alta en la prueba A (33 frente a 28), así como su desviación respecto de la media (+5 frente a +4). No obstante, valorar igual los puntos obtenidos en ambas pruebas puede ser un error de apreciación". En efecto: Las desviaciones típicas indican que los resultados de la prueba B se hallan más agrupados que los de la A. En esas condiciones, "cuatro puntos sobre la media" en la prueba B puede indicar mayor aptitud para el trabajo B, frente a los demás aspirantes, de lo que indican "cinco puntos sobre la media" en la prueba para el trabajo A. Saldremos de dudas calculando e interpretando las puntuaciones típicas del aspirante en ambas pruebas. Son ZA 33 28 1,471 3,4 ZB 28 24 1,905 2,1 Esto significa que su calificación en la prueba A se halla "1,471 desviaciones" sobre la medía y, en la prueba B, "1,905 desviaciones” sobre la media. Por tanto, está más cualificado para ocupar un puesto de trabajo tipo B que un puesto tipo A, si lo comparamos con el resto de los aspirantes. Pg. nº 14/17 Tema 2 EJERCICIOS 1. Se ha tallado a los alumnos de un cierto curso y se ha llegado a los siguientes resultados, que se dan en el orden en que se obtuvieron (en centímetros): 173, 177, 170, 184, 174, 169, 174, 166, 156, 166, 179, 168, 173, 177, 177, 167, 165, 162, 162, 172, 171, 171, 173, 185, 159, 164, 154, 176, 153, 178, 169, 183, 171, 174, 163, 179, 172, 172, 163, 174, 173, 171. 169, 169, 180, 172, 185, 170, 174, 174, 186, 163, 166, 175, 162, 180, 167, 174, 156, 172, 173, 159, 172, 164, 175, 176, 1 70 182, 166, 171, 188, 174, 173, 168, 162, 163, 167, 169, 175, 169, 170, 173, 171, 157, 166, 161, 158, 170, 151, 160, Determinar: a) La media. b) La moda. c) La mediana. d) El primer cuartil. e) El segundo decil. f) El percentil 65. g) El porcentaje de alumnos con una estatura superior a 176. h) Un alumno tiene una estatura de 168 cm. ¿qué percentil tiene? i) La desviación típica. j) ¿Están los datos muy dispersos? k) Si se desea seleccionar el 68% de los alumnos que forman la parte central de la distribución ¿entre qué estaturas estarán los alumnos? l) Representa los datos con una gráfica adecuada. 2. Los pesos (en kilogramos) de los enfermos de una cierta residencia sanitaria son: 64, 92, 71, 63, 83, 84, 50, 63, 66, 80, 67, 78, 66, 44, 48, 64, 52, 85, 94, 60, 81, 78, 51, 65, 80, 98, 70, 57, 44, 71, 78, 62, 65, 89, 53, 77, 61, 76, 71, 55, 48, 62, 59, 68, 85, 76, 70, 81, 58, 75, 65, 56, 43, 51, 69, 47, 69, 74, 65, 84, 55, 90, 69, 87, 67, 60, 67, 55, 96, 68, 73, 57, 63, 50, 53, 67, 60, 90, 53, 72 42, 75, 52, 61, Determinar: a) La media. b) La moda. c) La mediana. d) El primer cuartil. e) El segundo decil. f) El percentil 65. g) El porcentaje de enfermos con un peso superior a 82 kg. h) Un enfermo tiene un peso de 68 kg. ¿qué percentil tiene? i) La desviación típica. j) ¿Están los datos muy dispersos? k) Si se desea seleccionar el 68% de los enfermos que forman la parte central de la distribución ¿entre qué pesos estarán? l) Representa los datos con una gráfica adecuada. 3. Se ha pasado un test de 80 preguntas a 600 personas. El número de respuestas correctas se refleja en la siguiente tabla: RESPUESTAS CORRECTAS [0, 10) [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, 70) [70, 80) NUMERO DE PERSONAS 40 60 75 90 105 85 80 65 Determinar: a) La media. b) La moda. c) La mediana. d) El primer cuartil. e) El percentil 65. f) El porcentaje de personas con más de 58 respuestas correctas. g) Una persona que responde correctamente 66 preguntas, ¿qué percentil tiene? h) La desviación típica. i) ¿Están los datos muy dispersos? Pg. nº 15/17 Tema 2 EJERCICIOS 1. Se ha tallado a los alumnos de un cierto curso y se ha llegado a los siguientes resultados, que se dan en el orden en que se obtuvieron (en centímetros): 173, 177, 170, 184, 174, 169, 174, 166, 156, 166, 179, 168, 173, 177, 177, 167, 165, 162, 162, 172, 171, 171, 173, 185, 159, 164, 154, 176, 153, 178, 169, 183, 171, 174, 163, 179, 172, 172, 163, 174, 173, 171. 169, 169, 180, 172, 185, 170, 174, 174, 186, 163, 166, 175, 162, 180, 167, 174, 156, 172, 173, 159, 172, 164, 175, 176, 1 70 182, 166, 171, 188, 174, 173, 168, 162, 163, 167, 169, 175, 169, 170, 173, 171, 157, 166, 161, 158, 170, 151, 160, Determinar: a) La media. b) La moda. c) La mediana. d) El primer cuartil. e) El segundo decil. f) El percentil 65. g) El porcentaje de alumnos con una estatura superior a 176. h) Un alumno tiene una estatura de 168 cm. ¿qué percentil tiene? i) La desviación típica. j) ¿Están los datos muy dispersos? k) Si se desea seleccionar el 68% de los alumnos que forman la parte central de la distribución ¿entre qué estaturas estarán los alumnos? l) Representa los datos con una gráfica adecuada. Estatura xi fi Fi hi Hi en cm. [150 155) 152,5 3 3 0,033 0,0333 [155 160) 157,5 6 9 0,067 0,1000 [160 165) 162,5 12 21 0,133 0,2333 [165 170) 167,5 17 38 0,189 0,4222 [170 175) 172,5 32 70 0,356 0,7778 [175 180) 177,5 11 81 0,122 0,9000 [180 185) 182,5 5 86 0,056 0,9556 [185 190) 187,5 4 90 0,044 1,0000 90 1,000 xifi 457,50 945,00 1950,00 2847,50 5520,00 1952,50 912,50 750,00 Xi2fi 69768,75 148837,50 316875,00 476956,25 952200,00 346568,75 166531,25 140625,00 35 [150 155) 30 [155 160) 25 [160 165) 20 [165 170) 15 [170 175) 10 [175 180) [180 185) 5 [185 190) 0 1 15335,00 2618362,50 15335 170,39 cm 90 15 172,08 cm 15 21 90 21 45 38 4 171,09 cm 165,44 cm c) M e 170 5 d) Q1 165 5 32 17 65 90 2 90 38 9 100 10 163,75 cm 173,20 cm e) D2 160 5 f) P65 170 5 32 12 x 90 x 90 70 21 100 100 x 80,22 ; El 20% aprox. h) 168 165 5 x 34,6 ; El perc. 35 g) 176 175 5 11 17 a) x i) 2618362 ,5 170,39 2 7,75658 90 b) M o 170 5 j) CV 7,75658 100 4,55 Muy concentrado 170,39 Pg. nº 16/17 Tema 2 2. Los pesos (en kilogramos) de los enfermos de una cierta residencia sanitaria son: 64, 92, 71, 63, 83, 84, 50, 63, 66, 80, 67, 78, 66, 44, 48, 64, 52, 85, 94, 60, 81, 78, 51, 65, 80, 98, 70, 57, 44, 71, 78, 62, 65, 89, 53, 77, 61, 76, 71, 55, 48, 62, 59, 68, 85, 76, 70, 81, 58, 75, 65, 56, 43, 51, 69, 47, 69, 74, 65, 84, 55, 90, 69, 87, 67, 60, 67, 55, 96, 68, 73, 57, 63, 50, 53, 67, 60, 90, 53, 72 42, 75, 52, 61, Determinar: La media. La moda. La mediana. El tercer cuartil. El sexto decil. El percentil 35. El porcentaje de enfermos con un peso superior a 82 kg. Un enfermo tiene un peso de 68 kg. ¿qué percentil tiene? La desviación típica. ¿Están los datos muy dispersos? Si se desea seleccionar el 95% de los enfermos que forman la parte central de la distribución ¿entre qué pesos estarán? Representa los datos con una gráfica adecuada. a) b) c) d) e) f) g) h) i) j) k) l) Pesos en kg [40 45) [45 50) [50 55) [55 60) [60 65) [65 70) [70 75) [75 80) [80 85) [85 90) [90 95) 95 100) xi fi Fi hi Hi xifi Xi2fi 42,5 4 4 0,048 0,048 170 7225 47,5 3 7 0,036 0,083 142,5 6768,75 52,5 9 16 0,107 0,190 472,5 24806,25 57,5 8 24 0,095 0,286 460 26450 62,5 12 36 0,143 0,429 750 46875 67,5 15 51 0,179 0,607 1012,5 68343,75 72,5 8 59 0,095 0,702 580 42050 77,5 8 67 0,095 0,798 620 48050 82,5 7 74 0,083 0,881 577,5 47643,75 87,5 4 78 0,048 0,929 350 30625 92,5 4 82 0,048 0,976 370 34225 97,5 2 84 0,024 1,000 195 19012,5 a) x= 84 1,000 5700 67,857 kg 84 d ) Q3 75 5 5700 b) M o 65 5 63 59 77,5 kg 8 29, 4 24 62,25 kg 12 x 84 36 100 h) 68=65+5 ; x=54 15 f ) P35 60 5 j ) CV= 402075 13,492 100 20% No 67,857 3 66,5 kg 3 7 e) D6 65 c) M e 65 5 42 36 67 kg 15 50, 4 36 69,8 kg 15 x 84 67 100 g ) 82=80+5 x=83,09 kg; 100-83,09=16,9117% 7 i) = 402075 67,857 2 13,492 kg 84 k ) (X 2 , X 2 ) 95%; (40,87; 94,84) entre 41 y 95 kg. Pg. nº 17/17