Cartilla 2 Unidad 1: Estadística descriptiva 1) a) Diámetro de la tubería (pulgadas): Variable cuantitativa continua b) Material de la tubería: Variable cualitativa nominal c) Edad (Año de instalación): Variable cuantitativa continua d) Longitud de la tubería: Variable cuantitativa continua e) Estabilidad del suelo: Variable cualitativa ordinal f) Corrosividad del suelo circundante: Variable cualitativa nominal 2) Variables: Ubicación, Cualitativa nominal Nivel de PCB, Cuantitativa continua 3) a) X = “Tiempo de vida de cierto tipo de baterías” Rec X = [0,∞). Variable Cuantitativa continua b) Distribución de Frecuencias para el tiempo de vida de cierto tipo de batería: Clases (100, 115] (115, 130] (130, 145] (145, 160] (160, 175] Total Frec. 5 9 3 2 1 20 c) 30% de las baterías duraron más de 130 horas. d) 25% 4) a) V = “tiempo en minutos que tarda una persona en dormirse” Variable cuantitativa continua C = “Condición de fumador” Variable cualitativa nominal b) Distribución de Frecuencia para el tiempo en minutos que tarda un Fumador en quedar dormido: Clases (10, 25] (25, 40] (40, 55] (55, 70] Total Frec. 3 1 5 3 12 1 Cartilla 2 Distribución de Frecuencia para el tiempo en minutos que tarda un NO Fumador en quedar dormido: Clases (20, 25] (25, 30] (30, 35] (35, 40] (40, 45] Total Frec. 1 5 4 3 1 14 c) Para el Grupo de Fumadores el 66% tardó más de 40 minutos para quedarse dormido y en el grupo de los NO Fumadores el 7%. d) Según los datos analizados, los Fumadores tardan mas en dormirse que los NO Fumadores. 5) T = “Causas subyacentes por las que fracasan empresas” Variable cualitativa nominal. Distribución de Frecuencias porcentual de las causas subyacentes por las que fracasan las empresas. Causas Subyacentes Incompetencia Experiencia desequilibrada Falta de experiencia gerencial Falta de experiencia de línea Causas desconocidas Otras causas Porcentaje (%) 48 22 16 8 6 0.1 b) El 6 % de las empresas fracasaron debido a causas desconocidas c) La causa que más fracasos ha producido fue la incompetencia. 8) 2 Cartilla 2 b) Distribución de Frecuencias de la duración de baterías (en horas). Duración de baterías presentada en ejercicio 8 Clases (100, 115] (115,130] (130, 145] (145, 160] (160, 175] Frecuencia 5 9 3 2 1 Fuente: Datos del Ejercicio 8 Duración de las baterías 9 8 Frequency 7 6 5 4 3 2 1 0 107.5 122.5 137.5 152.5 167.5 Datos c) X = 126, ~ X = 119 x−~ x × 100 = 40 σˆ Por lo que la diferencia se debe a que la muestra no es simétrica (Asimétrica positiva). d) Para eso analizamos el coeficiente de Asimetría: 9) a) Distribución de Frecuencias del tiempo (en segundos) que 20 trabajos estuvieron en control en un CPU: Clases frecuencia [0, 1) 6 [1, 2) 6 [2, 3) 4 [3, 4) 3 [4, 5) 1 3 Cartilla 2 Histograma del tiempo (en segundo), que 20 trabajos estuvieron en control en un CPU 6 5 Frecuencia 4 3 2 1 0 0.5 1.5 2.5 3.5 4.5 tiempo (en segundos) b) Datos redondeados: 1.2, 1.6, 1.2, 3.5, 2.0, 0.9, 0.7, 2.6, 1.2, 3.1, 3.8, 1.4, 1.9, 1. 4.8, 2.4, 0.8, 0.8, 0.5, 2.2, Ordeno y calculo Q1 y Q3. Se debe analizar si hay valores alejados para realizar el diagrama de tallo y hojas: Q1= 0.95, Q3= 2.5 Q1 -1.5 (Q3- Q1) = -1.375 ⇒ no hay valores alejados por defecto Q3 +1.5 (Q3- Q1) = 4.825 ⇒ no hay valores alejados por exceso Diagrama de Tallo y Hoja del tiempo en segundos, que 20 trabajos estuvieron en control en un CPU: Tiempo [seg] Unidad 0.1 0 1 2 3 4 57889 0222469 0246 158 8 c) Obtenido de los datos sin redondear: ~ x = 1.871, x = 1.505 , en los datos sin redondear no hay moda. Obtenido de los datos redondeados: ~ x = 1.9, x = 1.5 , Moda = 1.2 2 d) σˆ = 1.30, σˆ = 1.14 s2 = 1.37, s = 1.17 Estas medidas de dispersión están asociadas a la media, ya que la utilizan como centro de la distribución. 4 Cartilla 2 RI= 1.55 Meda = 0.7 Estas medidas de dispersión están asociadas a la mediana, ya que la utilizan como centro de la distribución. e) Para esto analizamos la simetría de los datos: x−~ x × 100 = 35 ⇒ Por lo tanto es asimétrica, con lo que la mediana y la meda o el Rango σˆ intercuartil, describen mejor este conjunto de datos, porque sabemos que la mediana no se ve afectada por asimetría. 10) a) Tiempo que tardan en quedarse dormido fumadores y no fumadores Condicion No f umadores Fumadores 20 30 40 50 60 70 tiempo en quedarse dormido ~ b) Para Fumadores: x = 43.7, x = 48, σˆ = 16.18 , Meda: 10 ~ x−x × 100 = 26 ⇒ Asimetría. σˆ Las medidas que describen mejor este conjunto de datos son Mediana y Meda. No hay valores alejados. ~ Para NO Fumadores: x = 31.57 x = 30.50, σˆ = 5.65 , ~ x−x ×100 = 19 ⇒ con este valor, y observando el gráfico decimos que es simétrica. σˆ No hay valores alejados. Por lo tanto las medidas que describen mejor este conjunto de datos son Media y σ̂ . 5 Cartilla 2 c) INFORME: Se estudió el tiempo que tardan en quedarse dormido un grupo de 12 personas fumadoras y 14 personas no fumadoras, con el objetivo de investigar el efecto del hábito de fumar sobre los patrones de sueño. En el grupo de fumadores se observaron tiempos entre 14 y 69 minutos, mientras que en el grupo de no fumadores los tiempos estuvieron entre 21 y 42 minutos. El 50% de los tiempos en el grupo de fumadores fue mayor o igual a 48 minutos, y en el grupo de no fumadores solo a 30.5 Observamos entonces que los datos en el grupo fumador están centrados en un valor mayor que en el grupo de no fumadores y que están además más dispersos. En el grupo de no fumadores los datos se encuentran simétricamente distribuidos alrededor del valor central, mientras que en el grupo de fumadores los tiempos menores a 48 minutos están más dispersos que los mayores. 11) a) Para realizar los diagrama tipo caja se debe analizar si hay valores alejados: Para la ubicación antigua: Q1=9.91; Q3=10.135; Q1 -1.5 (Q3- Q1) = 9.57 ⇒ no hay valores alejados por defecto Q3 +1.5 (Q3- Q1) = 10.47 ⇒ no hay valores alejados por exceso Para la ubicación nueva: Q1=8.98 ; Q3= 9.93 Q1 -1.5 (Q3- Q1) = 7.55 ⇒ no hay valores alejados por defecto Q3 +1.5 (Q3- Q1) = 11.35 ⇒ no hay valores alejados por exceso Lecturas de Voltaje de un proceso: 10.5 10.0 9.5 LECTURAS 9.0 8.5 8.0 N= 15 15 1.00 2.00 UBIC Ubicación 1: Corresponde a Antigua y Ubicación 2 a Nueva. 6 Cartilla 2 ~ b) Para la ubicación antigua: x = 10.018, x = 10.03, σˆ = 0.16 ~ x−x × 100 =6 ⇒ Simétrica, y no hay valores alejados, por lo tanto la media y σ̂ describen σˆ mejor el conjunto de datos. ~ Para la ubicación nueva: x = 9.45, x = 9.63 σˆ = 0.54 , Meda = 0.44, Q1 = 8.98, Q3 = 9.93, por lo tanto RI = 0.95 x−~ x × 100 =33 ⇒ Asimétrica, por lo tanto la mediana y la meda o el rango intercuartil σˆ describen mejor el conjunto de datos. c)CVANTIG= 0.16 = 0.016 10.018 CVNUEVA= 0.54 = 0.057 9.45 d) El proceso nuevo no es tan bueno como el anterior ya que tiene media más baja y variabilidad más alta, y el coeficiente de variación también es mayor. 12) Porcentajes de Hierro de 25 muestras de mineral recolectados en cierta zona: ~ x = 62.64, x = 61 σˆ = 10.07 , Q1= 53, Q3= 72, x ± 2σ = ( 42.4,82.8) ~ x−x × 100 =16 ⇒ Del valor coeficiente y observando el gráfico decimos que es simétrica, σˆ por lo tanto la media y el desvío estándar describen mejor el conjunto de datos. De nuevo debemos analizar primero la presencia de valores alejados: Q1= 54.26 ; Q3= 71.01; Q1 -1.5 (Q3- Q1) = 29.14 ⇒ no hay valores alejados por defecto Q3 +1.5 (Q3- Q1) = 96.14 ⇒ no hay valores alejados por exceso 80 datos 70 60 50 7 Cartilla 2 INFORME: Se estudió el porcentaje de hierro de 25 muestras de mineral recolectados en determinada zona. Se observaron que los porcentajes varían entre 45 y 80 %. El porcentaje promedio de hierro encontrado en la muestra es de 62.6%. Los porcentajes observados se encuentran muy concentrados y en forma simétrica alrededor de ese valor promedio. 14) a) Trabajadores de la fábrica XX en el año XX clasificados de acuerdo a la tasa de defectos Tasa de Defectos Cantidad de trabajadores Alta 24 Baja 76 Total 100 Trabajadores de la fábrica XX en el año XX clasificados de acuerdo a sus años de experiencia Años de Exp. Cantidad de trabajadores [0, 2) 22 [2, 6) 36 [6,10) 42 Total 100 b) 42% c) 7% d) 32% e) 19% Para responder e) y d) calculamos los porcentajes en el sentido apropiado: Tasa de def./Años de exp. Alta Baja [0,2) 32% 68% 100% [2,6) 25% 75% 100% [6,10) 19% 81% 100% Por lo que se puede decir que existe relación ya que a mayor años de experiencia disminuye el porcentaje de trabajadores con tasa alta de defectos, y por ende aumenta el porcentaje con tasa baja de defectos. 15) a) Empresas de la Provincia XX en el año XX clasificados según el nivel de Tecnología: Tecnología Cantidad de Empresas Alta 161 No alta 596 Total 757 8 Cartilla 2 Empresas de la Provincia XX en el año XX clasificadas según la conversión al sistema métrico de medición: Convirtió Cantidad de Empresas Si 377 No 380 Total 757 b) Convirtió/Nivel Tecnolog. Si No Alta No alta 50% 50% 100% 50% 50% 100% Por lo que podemos decir que las empresas de alta tecnología no presentan una mayor tendencia a convertirse que las empresas de baja tecnología, en otras palabras no influye el nivel de tecnología en la decisión de convertir al sistema métrico de medición. 9