PROBLEMAS DE ESTADÍSTICA DESCRIPTIVA Rosario Cintas del Río Escuela Universitaria de Estadística Universidad Complutense ESTADÍSTICA DESCRIPTIVA HOJA 1 1. Una serie de n observaciones está agrupada en k clases de extremos e 0 ,...,e k y frecuencias n i i=1...k y todas ellas de la misma amplitud h. Hallar una expresión para la media aritmética en función de la primera marca de clase c 1 , de la amplitud h y de las frecuencias absolutas. 2. Un viajante ha hecho 7 viajes en el mes pasado y los gastos se indican a continuación: Viaje 1 2 3 4 5 6 7 Duración(días) 0,5 2 3,5 1 9 0,5 8,5 25 Gasto 675 600 875 450 1350 450 850 5250 Gasto por día 1350 300 250 450 150 900 100 3500 El jefe del viajante dice que los gastos han sido excesivos porque el gasto medio por día ha sido (3500/7)=500 ptas. y el viajante dice que el gasto medio ha sido (5250/25)=210 ptas. ¿Quién tiene razón? 3. Cada uno de los componentes de un equipo de relevos de 4x100 alcanzó en competición la siguiente velocidad: 10,16 m/sg 10,35 m/sg 10,40 m/sg 10,52 m/sg ¿Cuál fue la velocidad media desarrollada por el testigo que se entregan los corredores? 4. Un inversor en bolsa ha comprado acciones de una misma empresa en cinco ocasiones: los precios respectivos por acción han sido de 2048, 2304, 1920, 2560 y 3072 ptas. Calcúlese el precio medio de las acciones que ha comprado en los supuestos siguientes: a) Las cinco veces adquirió igual número N de acciones. b) En todas las compras empleó igual cantidad C de dinero. ESTADÍSTICA DESCRIPTIVA HOJA 2 1. En un reclutamiento militar se ha tomado una muestra de 16 jóvenes, obteniéndose las siguientes estaturas(en cms.): 160 172,4 168 167 175 179 180 198 164 166 174 177 182,5 185 191 173,5 a) Agrupar los datos en cuatro intervalos de amplitud constante. b) Calcular la media aritmética, la geométrica y la armónica. Indicar cuál sería la más apropiada para representar un valor promedio de esta serie. 2. Las siguientes muestras se tomaron para comparar las edades de los alumnos de una clase en 1970 y 1976: 1970: 23,18,44,19,18,33,19,19,21,23,21,18,20,18,19,19,22,22,36,18,22,19,20,21,17 1976: 28,18,46,18,55,18,20,19,19,18,21,20,19,20,24,20,20,20,19,20,18,19,18,29,26 18,19,22,27,19 a) Representar cada serie en un diagrama de tallos y hojas. b) Hallar para cada variable la media, mediana y moda. 3. Hallar la mediana de las siguientes distribuciones de frecuencias: xi 1 ni 2 3 4 5 10 12 7 7 3 xi 2 6 ni 12 10 8 xi 10 20 30 40 ni 18 13 10 9 4 8 10 12 14 7 5 8 10 4. Hallar la mediana de la siguiente distribución de frecuencias: ei (0,1] (1,2] (2,3] (3,4] (4,5] ni 10 12 12 10 7 5. Se ha observado la vida de 280 bombillas, obteniéndose la siguiente distribución: Vida en horas (0,500] (500,1000] (1000,1500] (1500,2000] (2000,2500] (2500,3000] Nº de bombillas 4 21 109 78 44 24 ¿Cuál es la duración más frecuente de una cualquiera de estas bombillas? 6. En una pista de 50 Kms. de largo, un ciclista circula a 40 Kms/h durante los 10 primeros Kms., a 25 Kms/h durante los 25 Kms. siguientes y a 20 Kms/h durante los 15 últimos. Calcular la velocidad media a lo largo de los 50 Kms. 7. Sea una serie {x i } i=1...k de observaciones positivas ( x i >0 ) con frecuencias absolutas {n i } i=1...k. La media de orden r para esta serie viene definida por: 1 k M r = ∑ n i x ir n i =1 Determinar las media de orden r=1 y r=-1. 1/ r HOJA 3 ESTADÍSTICA DESCRIPTIVA 1. Se tomaron medidas del contenido en cobre de 20 moldeajes de bronce, obteniéndose: 790,4 801,3 796,7 802,9 812,9 800,6 794,7 805,4 801,9 810,2 804,6 824,5 799,3 797,1 802,4 774,7 798,1 784,4 788,1 815,3 a) b) c) d) Hallar la media aritmética y la desviación típica. Calcular la mediana y los cuartiles. Hallar los recorridos semiintercuartílico e intercuartílico. Representar e interpretar el gráfico caja. 2. Los sueldos de cinco obreros son (en miles de ptas.): 62 104 92 86 78 Hallar la desviación absoluta media respecto a la media. 3. Sumando 4 a cada número de la serie 2,6,5,9,1 se obtiene la serie 6,10,9,13,5. Comprobar que ambas series tienen la misma varianza y distintas medias. ¿Se podría haber hecho esta afirmación sin hacer cálculos? 4. En una cierta distribución con 400 casos, la mediana es 58,833 y el límite inferior del intervalo que la contiene es 50,5. Si este intervalo tiene por encima de sí al 47,5% de los casos y por debajo el 37,5%: a) ¿Qué amplitud tienen los intervalos de esta distribución, sabiendo que ésta es constante? b) ¿Cuál es el límite superior del intervalo que contiene a la mediana? 5. Determinar cuál de las dos distribuciones, A o B, tiene mayor grado de dispersión: A ei (0,2] (2,4] (4,6] (6,8] ni 4 6 5 3 B ei (4,8] (8,12] (12,16] (16,20] (20,24] ni 10 12 14 20 21 6. Una distribución A tiene una media aritmética que es el doble de la de una distribución B, y una desviación típica que es la mitad de B. ¿Cuál tiene mayor dispersión? 7. En una muestra de 1000 individuos, la media de un cierto tipo de test es 14,5 y la desviación típica 2,5. ¿Cuántos individuos, como mínimo, tienen puntuaciones entre 11 y 8?¿Cuántos tendrán, como máximo, más de 18?¿Y menos de 8?. 8. Se estudia una variable X en un grupo de 50 individuos, obteniéndose la siguiente distribución: ei ni 108 8 102 11 96 16 90 10 85 5 70 a) Calcular los percentiles 25, 36 y 75. b) ¿Tiene que ser igual la distancia existente entre dos percentiles consecutivos que la existente entre otro par cualquiera de percentiles también consecutivos? c) ¿Los percentiles son valores esencialmente positivos? 9. Los tipos de cambio medio oficial del dólar USA en pesetas durante los días de cotización del año 1.987 se dan agrupados en la forma siguiente: Cotización Días (108,112] (112,116] (116,120] (120,124] (124,128] (128,132] (132,136] 17 29 7 41 96 59 1 Calcúlese el cambio medio a lo largo del año y estúdiese su representatividad. 10. Una empresa A ha cotizado en bolsa a una media anual de 750 enteros, con una desviación típica de valor 80. Otra empresa B, durante el mismo periodo, lo ha hecho con una media anual de 1025 y una desviación típica de 125. Un inversor compró ese año acciones de la empresa A a una cotización de 758 enteros y de la empresa B a 1035. ¿En cuál de las dos empresas fue más interesante invertir?. 11. Se ha efectuado un examen de comportamiento agresivo a un grupo de adolescentes. El examen constaba de dos pruebas llamadas A y B. De la información obtenida se han hecho los cálculos siguientes: x A = 15,5 x B = 75 S A = 2,5 S B = 30,6 Dos adolescentes, denominados 1 y 2, han obtenido como resultado de cada prueba: x1, A = 16,7 x 2, A = 14 x1, B = 77,5 x 2, B = 82,4 Transformar los resultados de cada adolescente en un resultado global y decir cuál de los dos supera al otro en agresividad. 12. En cierta distribución, el percentil 45 vale 15. Si el intervalo que lo contiene deja por debajo de sí 45 casos y contiene a su vez 10 observaciones, ¿qué número de casos tendrá la distribución si los límites inferior y superior de ese intervalo son 10,5 y 15,5 respectivamente? HOJA 4 ESTADÍSTICA DESCRIPTIVA 1. Se han recogido datos sobre la puntuación que en una encuesta dieron los alumnos de cuatro grupos a un profesor. Se sabe que el grupo A y el B tienen el mismo número de alumnos, el D tiene ¾ de los del C y el C el doble que el A. La distribución de puntuaciones en cada grupo fue: Nota A B C D 0,2 0,1 0,3 2 0,3 0,3 0,2 0,3 4 0,3 0,4 0,4 0,2 6 0,1 0,2 0,1 0,2 8 0,1 0,2 10 0,1 a) b) c) d) ¿En qué grupo tuvo el profesor mejor calificación media? ¿Qué nota media global obtuvo? ¿En cual de los grupos hubo menos divergencia de opiniones? Calcular la desviación típica global en función de las de cada grupo, como medida global de la divergencia de opiniones. 2. Se estudia la cantidad de transaminasas en sangre de un grupo de 40 individuos antes y después de un tratamiento. Los resultados obtenidos son: Tabla A: resultados antes del tratamiento Tabla B: resultados después del tratamiento Tabla A ei 0 ni Tabla B ei 0 3 0 2 2 5 3 4 4 8 6 6 6 10 15 8 8 12 12 10 10 2 4 12 ni 12 a) Calcular las medianas en cada una de las tablas. Compararlas e interpretarlas. b) Para cada una de las distribuciones, ¿entre qué valores está el 50% central de los individuos? ¿Qué distancia ocupa en unidades de la variable ese 50%? 3. Calcular e interpretar el coeficiente de asimetría de Pearson de la siguiente distribución de frecuencias: xi ni 400 500 600 700 800 900 1000 3 1 4 2 5 3 2 4. En una distribución de frecuencias la diferencia entre el primer cuartil y la mediana es el doble de la que existe entre la mediana y el tercer cuartil, y la diferencia entre el primer valor de la variable y el primer cuartil es igual a la existente entre el tercer cuartil y el último valor de la variable. Razonar cuál será el signo de la asimetría de esta distribución. 5. Determinar el signo de la asimetría de una distribución sabiendo que su media aritmética coincide con la raíz cuadrada positiva de su moda, siendo ésta mayor que la unidad. 6. Calcular m 0 , m 1 , m 2 , M 0 , M 1 , M 2 de la siguiente distribución: xi ni 20 30 40 50 60 70 80 2 4 7 3 2 1 1 7. La distribución de edades de los alumnos de un centro universitario es la indicada en la siguiente tabla: Edad ni 240 (17,19] 320 (19,21] 240 (21,23] 170 (23,25] 130 (25,27] Más de 27 80 Se desea saber la edad promedio del 40% de alumnos con edades más bajas. 8. Se desea transformar las puntuaciones 8, 13, 9, 15, 10 en otras sumándoles a todas la misma constante, de modo que su media valga 26. ¿Cuál debe ser esa constante? 9. Supongamos que en una distribución simétrica el percentil 25 vale 6,5, n=12, x =9,5 y k ∑n x i 2 i =1259. Calcular el percentil 75 y el coeficiente de i =1 variación. 10. En el cuadro siguiente se recoge el detalle de los riesgos asumidos por una firma financiera en descuentos, créditos y préstamos dinerarios o de firma, ordenados por tramos a nivel de cliente: Tramos (millones) (0,4] (4,20] (20,100] (100,200] (200,260] % clientes 55,28 21,01 19,31 3,55 0,85 Calcúlese la curva de concentración y el porcentaje de clientes cuyos riesgos están por debajo de la media. 11. En el diseño de encuestas de presupuestos familiares es crucial, entre otros datos, el número de hijos menores de edad en las familias del país. Una encuesta sobre una muestra piloto de 200 familias con matrimonios que llevaban casados menos de 10 años, proporcionaba los siguientes datos: Nº Hijos 0 1 2 3 4 Nº Familias 23 84 69 19 5 Calcular: a) Los cuatro primeros momentos no centrados. b) Los cuatro primeros momentos centrados. c) Las medidas que se deducen de ellos. 12. El precio de compra del litro de leche ha presentado en la última campaña una distribución unimodal con momentos no centrados: m 1 =16,2 m 2 =321,8 m =1240,2 3 m 4 =104210,1 a) Calcular los coeficientes de Fisher de asimetría y apuntamiento. b) Si en la siguiente campaña subió 2 ptas. el litro en todo el territorio nacional, ¿cómo se veran afectados los dos coeficientes anteriores? 13. La media de las horas de estudio de los alumnos de una cierta universidad es de 2,58 horas diarias (n=2130). De acuerdo con los datos de la tabla siguiente, ¿cuál es la media de horas de estudio diario de los alumnos de las facultades de Letras? x nj Medicina Derecho Ciencias Letras 2,5 3 4 580 250 350 Total 2,58 2130 14. El censo de establecimientos de bebidas que hay en una circunscripción se ha dividido en cuatro partes. La primera tiene el triple de establecimientos que la segunda y ésta el doble que cada una de las dos restantes. El número de empleados registrados presentaba los siguientes parámetros por estratos: xj s 2j 1ª Parte 2ª Parte 3ª Parte 4ª Parte 3,6 4,8 5,2 4 1,2 1,6 1,6 1,8 Calcúlese para toda la circunscripción: a) La media del número de empleados por establecimiento. b) La varianza del número de empleados por establecimiento. ESTADÍSTICA DESCRIPTIVA HOJA 5 1. A un grupo de 24 sujetos se les han aplicado dos pruebas (rapidez de cálculo y aptitudes administrativas) con vistas a su selección para un determinado puesto. Si el criterio de la selección es que los individuos tengan en la prueba de rapidez de cálculo puntuaciones entre 13 y 15 y que en el test de aptitudes administrativas superen el 75% del total, ¿qué puntuación mínima han de obtener en el test de aptitudes administrativas para ser seleccionados?. X Y 9-11 11-13 13-15 15-16 75-77 4 77-79 79-81 81-82 X= Aptitudes administrativas Y= Rapidez de cálculo 1 6 2 - 1 2 5 1 2 2. Según cierto autor, la capacidad de autocontrol de un individuo está en función de : X 1 = su grado de introversión X 2 = su madurez afectiva X 3 = su capacidad de comprensión X 4 = su estabilidad emocional Si el autor considera que X 4 influye el doble que cualquiera de las otras tres variables y que un promedio de las puntuaciones obtenidas en pruebas evaluadoras de estas variables indicará la capacidad de autocontrol de un sujeto, ¿qué puntuación se adjudicará a un sujeto con X 1 =10, X 2 =2, X 3 =-1 y X 4 =7?. 3. Se tienen dos circunferencias de radios 12 y 2 centímetros, respectivamente. Se construye otra circunferencia cuya longitud es la media de las longitudes de las circunferencias dadas. ¿Será su radio también la media de los radios dados?. Razonarlo. ¿Y si en lugar de considerar longitudes consideramos áreas?. 4. El siguiente modelo teórico corresponde al número de piezas defectuosas encontradas en dos muestras aleatorias de tres unidades con X= Unidades defectuosas en la primera muestra Y= Unidades defectuosas en la segunda muestra Se dispone de la siguiente estructura conjunta: X Y 0 1 2 0 0,047 0,093 0,062 1 0,093 0,187 0,124 2 0,062 0,124 0,084 3 0,014 0,028 0,018 f(Y) 0,216 0,432 0,288 Comprobar que X e Y son independientes. 3 f(X) 0,014 0,028 0,018 0,004 0,064 0,216 0,432 0,288 0,064 1 5. Una cartera de valores puede estar compuesta por dos tipos de acciones con rentabilidades que presentan la siguiente distribución conjunta: X Y 0-5 5-10 10-15 5-10 10-15 0,06 0,14 0,30 0,02 0,38 0,10 a) ¿Cuál de las dos acciones presenta mayor rentabilidad media? b) ¿Cuál de las dos acciones es más variable en su rentabilidad? c) Calcular la covarianza de las dos rentabilidades. HOJA 6 ESTADÍSTICA DESCRIPTIVA 1. Barcelona es ciudad de tránsito de vuelos regulares con el siguiente movimiento de pasajeros en el último año: X Y 0-10 10-20 20-30 0-10 10-20 20-30 0,14 0,04 0,01 0,07 0,41 0,10 0,04 0,08 0,11 X= Pasajeros que hacen escala en Barcelona Y= Pasajeros que salen de Barcelona (excepto los procedentes de origen) Calcular: a) Distribución de X supuesto Y>20. b) Distribución de Y supuesto X ∈ (10, 20] . c) Distribución conjunta de (X,Y) supuestas independientes las variables. 2. La siguiente tabla recoge, en frecuencias relativas, la distribución del número de controles a que son sometidas las unidades acabadas en un proceso. Los controles corresponden a inspecciones de la calidad y son realizados por dos equipos, del modo siguiente: B A 0 1 2 3 0 0,02 0,08 0,08 0,06 1 0,11 0,12 0,14 0,03 2 0,30 0,03 0,02 0,01 a) Representar gráficamente la distribución conjunta. b) Calcular la covarianza entre los controles realizados por cada equipo. c) Distribución del número de controles efectuados por el equipo B condicionada a las unidades que no se habían inspeccionado en A. d) Número de controles realizados por el equipo A en un mayor número de piezas. e) Distribución total de controles realizados en las unidades por ambos equipos, simultáneamente. 3. La siguiente tabla recoge la distribución de los ingresos y las reediciones hechos de una veintena de libros por una editorial: X Y 1 2 3 4 1 6 1 - 1,5 4 3 - 2 2 2 1 2,5 1 Y= Ingresos (en millones) X= Número de reediciones Obtener: a) Línea general de regresión de los ingresos en función del número de reediciones. b) Una medida de la bondad del ajuste. 4. Se quiere investigar la relación del peso (en Kgs.) de los niños con su edad (en meses), obteniéndose la siguiente tabla: Edad 1 2 3 4 5 6 4,5 5,9 6,3 7,2 9,1 10 3,9 6 6 7,6 8,9 9,9 4,7 5,8 5,9 6,9 8,7 9,8 Pesos 4,9 5,7 6,4 7,5 9,5 10,1 3,3 5,2 5,3 7,1 9,6 10,5 10,7 Calcular la curva general de regresión del peso en función de la edad, así como una medida de este ajuste. 5. Un psicólogo afirma, en base a los datos obtenidos, que a medida que un niño crece es menor el número de respuestas inadecuadas que da en el transcurso de una situación experimental: Edad Nºrespuestas inadecuadas 2 3 4 4 5 5 6 7 7 9 9 10 11 11 12 11 12 10 13 11 9 10 7 12 8 7 3 6 5 5 a) Determinar la validez de la conclusión. b) Alberto, de 10 años y medio, participa en el experimento. ¿Cuál es el número de respuestas inadecuadas que se puede predecir para él?. ESTADÍSTICA DESCRIPTIVA HOJA 7 6. Se ha medido el contenido en oxígeno, Y, de un lago de Austria a una profundidad de X metros, obteniéndose los siguientes datos: X 15 20 30 40 50 60 70 Y 6,5 5,6 5,4 6,0 4,6 1,4 0,1 a) Ajustar una recta por el método de mínimos cuadrados (Y=aX+b). b) Estudiar la correlación de ambas variables. c) Para una profundidad comprendida entre 75 y 80 metros, ¿Qué contenido en oxígeno se podría predecir?. 7. Una factoría de una cierta marca de refrescos ha tomado al azar 10 semanas al año, observando la temperatura mediacorrespondiente a cada una de ellas y la cantidad de refrescos pedidos durante cadauno de esos periodos. La información obtenida es la siguiente: Temperatura Cantidad de refrescos 21 10 65 28 19 12 72 31 75 30 39 19 67 24 11 5 12 9 24 15 ¿ Puede la factoría planificar la producción en función de la temperatura esperada? ¿De qué forma?. 8. De una distribución de dos variables se conocen los siguientes datos: S x = 1, 20 r=0,90 SY = 2,10 x =5 y = 10 Obtener las rectas de regresión de Y sobre X y de X sobre Y. 9. La siguiente distribución corresponde a las calificaciones obtenidas en un parcial de Estadística y en el examen final por 10 alumnos: P 6 7,7 4,7 7,7 6,9 3,7 7,5 8,1 9,2 5,3 F 5 7,8 4 8,1 7 4 9 7,5 8,7 3,2 a) Hallar la recta de regresión de las calificaciones finales en función de las parciales. b) Hallar el coeficiente de correlación lineal. 10. Si transformamos los valores de X e Y de la siguiente forma: X’=aX+b Y’=cY+d ¿Qué relación existe entre la recta de regresión de Y’ sobre X’ y la de Y sobre X? ¿Y entre los coeficientes de correlación? 11. Dada la siguiente tabla, correspondiente a 50 observaciones conjuntas de los precios de un mismo producto en supermercados distintos: X Y 80 90 96 60 7 8 2 70 3 12 8 80 2 8 a) Calcular la recta de regresión de Y sobre X y el coeficiente de correlación. b) Si los precios sufren una variación del tipo: Y’=0,8Y X’=10+1,1X ¿Cuál será la nueva recta de regresión? ¿Y el coeficiente de correlación lineal? 12. Las ecuaciones 2x+y+1=0 5x+3y+4=0 representan las rectas de regresión lineal de una distribución estadística bidimensional. Hállense los coeficientes de determinación y de correlación entre las correspondientes variables unidimensionales. 13. Sea (X,Y) una variable estadística bidimensional: Se definen las variables Z=X+Y y W=X-Y. Calcular la COV(X,Z) y la COV(X,W). 14. Sea una variable estadística bidimensional (X,Y) para la cual X toma los valores x1 , x2 e Y los valores y1 , y2 . Demostrar que si n1. xn.1 = nxn11 entonces X e Y son independientes. ESTADÍSTICA DESCRIPTIVA HOJA 8 1. A una serie de valores de X e Y quiere ajustarse una función potencial del tipo y = ax b . Obtener las ecuaciones normales necesarias para estimar a y b por el método de mínimos cuadrados. 2. La elasticidad de una variable Y con respecto a una variable X viene dada por la expresión E= dy / y dx / x Demostrar que puede obtenerse el valor de E mediante la estimación del parámetro b de una función potencial del tipo y = x b . 3. Dados los siguientes modelos de regresión: y = be ax (Exponencial) y = bx a (Potencial) y = b + a ln x (Logarítmica) a) ¿Cómo se puede transformar cada uno de ellos en un modelo lineal? b) Hallar las transformaciones necesarias en la muestra (x i ,y i ) para poder utilizar los modelos anteriores. 4. Dos variables X e Y están ligadas exactamente según la función de una circunferencia, ¿cuál será el ángulo que formarán las dos rectas de regresión mínimo cuadráticas? 5. Ajústese por el método de mínimos cuadrados una función del tipo y = aebx a la siguiente distribución bidimensional: xi yi 1 1,5 2 2,5 3 4 2,2 6 16 44,5 121 895 6. a) Estimar el parámetro k por el método de mínimos cuadrados, para ajustar una nube de puntos al modelo XY=k. b) Obtener el error mínimo cuadrático en función de los resultados obtenidos. c) Dadas las observaciones de la tabla adjunta, con frecuencias unitarias, ajustar el anterior modelo, así como una recta de regresión del tipo Y/X y sacar las conclusiones pertinentes. X 1 -1 1 -1 Y 1 2 2 -1 7. Se tiene la creencia de que el gasto en esparcimiento y ocio de las familias está muy vinculado a su composición. Elegidas 12 familias como muestra piloto, se obtuvieron los siguientes datos. Integrantes (X) 2 3 3 4 4 2 2 5 3 6 2 3 Gasto miles/mes 11,1 11,4 11 10,6 10,2 11,6 12 9,1 9,8 10,5 10,9 8,6 (Y) Estimar el modelo de regresión lineal y el exponencial. ¿Cuál de los dos se ajusta mejor?. (Tomar como modelo exponencial y = ca x ). 8. Un tribunal de oposición ha ordenado los opositores A,B,C y D de mejor a peor, según un examen teórico y otro práctico. Determinar la dependencia entre las dos ordenaciones. Examen Práctico A B C D Examen teórico C B A D BIBLIOGRAFÍA BARÓ LLIANS, “Estadística Descriptiva” Ed. Parramón. BYRKIT, “Statistics Today. A comprehensive introduction” The Benjamin Cummings Publ. Co. Inc. California. CALOT, “Curso de Estadística Descriptiva”, Ed. Paraninfo. CRAMER, “Métodos matemáticos de Estadística”, Ed. Aguilar. DURÁ PEIRÓ-LÓPEZ CUÑAT, “Fundamentos de Estadística. Estadística Descriptiva y Modelos Probabilísticos para la inferencia”. Ed. Ariel PEÑA-ROMO, “Introducción a la Estadística para ciencias sociales” Ed. Mcgraw-Hill QUESADA-ISIDORO LÓPEZ, “Curso y Ejercicios de Estadística” Ed. Alambra.