I.T.Industrial Métodos Estadísticos Problemas de Repaso 1. Para analizar la degradación de la señal emitida por una antena, se tomaron los siguientes datos: la frecuencia de la señal en el momento de ser emitida (X) y la frecuencia de la señal al ser recibida (Y). Los resultados medidos en Megahercios fueron: X Y 1.75 1.56 1.8 1.45 1.78 1.75 2.01 0.84 2.48 2.02 2.58 2.41 2.98 2.75 2.65 1.44 2.01 1.55 3.87 2.02 a. Calcula la media, mediana y moda de ambas variables. b. De las señales emitidas entre 2 y 3 Megahercios ¿Cuál es la proporción de ocasiones en las que la frecuencia recibida fue menor que 2.5 Megahercios? c. Determina el intervalo en el que se encuentra el 50% central de la variable Y. d. Estudia el grado de asociación lineal entre las variables. e. ¿Qué frecuencia se predice en la señal al ser recibida si al ser emitida es de 3.5 Megahercios?. ¿Es fiable la predicción?. 2. Una industria ha vertido a un río próximo una cantidad cercana a los 3500 litros de sustancia contaminante. Por experiencias anteriores se sabe que la Administración ha impuesto las siguientes sanciones (X en miles de litros) por vertidos de similares características y por las cantidades (Y en miles de euros) que a continuación se indican: X (miles de litros) Y (miles de euros) 0.5 6 1 18 1.5 30 2 45 2.5 66 3 90 4 144 a. Obtener medidas de tendencia central (media, mediana, moda) para ambas variables. b. ¿Qué variable es más homogénea con respecto a su media?. Razonar la respuesta. c. Estudiar el grado de asociación lineal entre las variables. d. Estimar la cuantía de la sanción que la Administración impondrá a dicha industria. ¿Te parece fiable tal estimación?. Razona la respuesta. 3. El tiempo T (en segundos) que una máquina tarda en perforar un material de tipo 1 es una variable aleatoria continua con función de densidad dada por: 1 f (t) = ½ k(t2 − 4t) 0 si 0 ≤ t ≤ 4 en otro caso Se pide: a. Calcular el valor de k. b. ¿Qué probabilidad hay de que tarde menos de tres segundos en perforar una placa de material tipo 1?. c. Calcular el tiempo medio que tarda en perforar placas de tipo 1. Supongamos que el tiempo que esta misma máquina tarda en perforar un material de tipo 2 es una variable aleatoria con distribución normal de media 2 y desviación típica 0.5. Además, de todas las placas que perfora la máquina en un mismo día, el 20% son de material tipo 1 y el 80% son de material tipo 2. d. Si elegimos una placa al azar, ¿cúal es la probabilidad de que la máquina tarde más de tres segundos en perforarla?. e. Si la máquina tardó más de tres segundos en perforar una placa, ¿cúal es la probabilidad de que sea de material tipo 1?. 4. El alumbrado de Navidad de una avenida se establece en filas paralelas de 3 bombillas, y las 3 bombillas de cada fila están conectadas en serie. El tiempo de fallo de cada bombilla (en horas) sigue una distribución exponencial de parámetro λ y los tiempos de fallo de las bombillas son independientes. Una muestra de 10 bombillas proporciona los siguientes tiempos de fallo en horas: 166.6 163 170.2 168.2 158.9 169.2 167 170 164.5 168.5 a. Estima el valor de λ haciendo uso del método de máxima verosimilitud o del método de los momentos. b. Calcula la probabilidad de que una fila deje de iluminar pasados 10 días desde su inaguración. Suponer para este apartado y para los siguientes que cada día las bombillas se encienden durante 7 horas. c. Determina el número de filas de bombillas que deberá haber en la avenida para que con una probabilidad de 0.95 al menos una de las filas ilumine durante diez días desde su inaguración. d. Supongamos que hay 60 filas de bombillas en la avenida. Consideremos para cada fila i (i=1,...,60) una variable aleatoria Xi que toma el valor 1 si luce en un instante dado, y toma el valor 0 en caso contrario. Toma el valor 1 con probabilidad 0.65. Calcula la probabilidad de que en un instante dado al menos 40 de las 60 filas luzcan. 2 5. Tres miembros de un club privado han sido nominados para la presidencia del mismo: Luis, Pedro y Ana.La probabilidad de que Luis sea elegido es de 0.3, la probabilidad de que Pedro sea elegido es de 0.5 y la probabilidad de que Ana lo sea es de 0.2. En el caso de que Luis sea elegido, la probabilidad de un incremento en las cuotas es de 0.8. En el caso de que Pedro o Ana sean elegidos, las correspondientes probabilidades de incremento en las cuotas son de 0.1 y 0.4 respectivamente. Si se ha observado un incremento en las cuotas, ¿cuál es la probabilidad de que Luis haya sido el candidato elegido?. 6. Una empresa oferta puestos de trabajo. A los aspirantes se les realiza una prueba de selección siendo contratados el 6%. a) De un grupo de 10 aspirantes, calcular la probabilidad de que a lo sumo un aspirante haya sido seleccionado. b) De un grupo de 80 aspirantes, calcular la probabilidad de que fuesen seleccionados exactamente 9 aspirantes. c) De un grupo de 1000 aspirantes, calcular la probabilidad de que el no de seleccionados esté entre 60 y 100. 7. Se estima que el número medio de accidentes que ocurren en una determinada zona es de 20 por año. Si se sabe que en lo que llevamos de año ya han ocurrido 5, calcular la probabilidad de que al finalizar el año se hayan contabilizado en esta zona entre 15 y 30 accidentes. 8. En un estudio sobre ciertas características de unas vigas se determinó que el 60% eran de tipo A. De entre éstas el 25% presentaba una concentración demasiado baja de acero, y de las que presentaban las dos características anteriores el 35% presentaba aluminosis. Si se elige al azar una viga, ¿cuál es la probabilidad de que presente las tres características?. 9. En tres regiones de un país, A,B,C, se declaró una epidemia de cólera. La probabilidad de que una persona que visita una de las regiones se contagie es de 0.15 para la región A, 0.08 para la B y 0.24 para la C. Los turistas que están visitando cada una de las tres regiones se reparte en las siguientes proporciones: el 30% para la región A, el 50% para la B y el 20% para la C. a) ¿Cuál es la probabilidad de que un turista presente cólera?. b) ¿Qué porcentaje del total de turistas con cólera corresponde a cada una de las regiones?. 10. El tiempo T en horas que una máquina tarda en producir un artículo sigue una distribución Exponencial con media 18 horas. La máquina puede desajustarse durante la producción del artículo, y en tal caso el artículo resulta defectuoso. Esto ocurre generalmente cuando la máquina tarda más de 30 horas en la producción del artículo. 3 Los artículos producidos han de pasar por un control de la calidad antes de su venta. Para ello, se hacen lotes de 100 artículos cada uno, tolerándose un máximo de 25 artículos defectuosos por lote. Si un lote contiene más de 25 defectuosos no pasa el control de la calidad. a. Obtener la función de distribución del tiempo de producción T. b. ¿Qué porcentaje de artículos tardan en ser producidos más de 16 horas pero menos de 18 horas?. c. Calcular el tiempo de producción t tal que la probabilidad de excederlo sea de 0.05. d. Calcular la probabilidad de que la máquina se desajuste durante la producción de un artículo, y éste resulte por lo tanto defectuoso. e. Calcular la probabilidad de que un lote no pase el control de la calidad. En la venta de los lotes, el fabricante asegura que no presentan más de un 20% de defectuosos, y esto sabemos que no siempre es cierto. Si se muestrean 50 artículos de un lote vendido y se detectan 11 defectuosos, f. Obtener un Intervalo de Confianza al 95% para la proporción de defectuosos en un lote vendido. g. Contrastar al 5% de significación si puede considerarse superior al 20% el porcentaje de defectuosos en un lote vendido. 11. Un sistema está sometido a dos tipos de fallo: tipo I y tipo II. La probabilidad de que ocurra un fallo en el sistema es de 0.25. Si ocurre un fallo en el sistema, la probabilidad de que sea tipo I es de 0.3. Cuando ocurre un fallo de este tipo el sistema se sustituye por uno nuevo e idéntico, pero si ocurre un fallo tipo II (menos grave) éste pasa a un canal de reparación, con la variante de que el sistema una vez reparado no habrá quedado ”tan bueno como nuevo”. Es decir, el tiempo de vida (en años) del sistema cuando es nuevo se modeliza mediante una distribución exponencial de parámetro 0.5, mientras que el tiempo de vida del sistema después de haber sufrido un fallo tipo II sigue una distribución exponencial de parámetro 1 (se reduce el tiempo medio de vida en un año). Calcular a) Probabilidad de que el sistema funcione durante al menos seis meses después de la ocurrencia de un fallo. b) Si suponemos que los fallos tipo I llegan al sistema según un proceso de Poisson a razón de 1 fallo por año, calcular la probabilidad de que a los 3 años de poner inicialmente el sistema en funcionamiento hayan ocurrido exactamente 4 fallos de este tipo. c) Si hasta un momento dado se han contabilizado 50 fallos en el sistema, calcula la probabilidad de que de entre ellos al menos 16 sean de tipo I. 4 Nota: No pueden ocurrir simultáneamente un fallo tipo I y tipo II. 12. Dada Q una m.a.s. X1 , X2 ......, Xn con función de verosimilitud L(x1 , x2 , ...., xn ) = an [ (1 − xi )a−1 ], 0 ≤ xi ≤ 1, i = 1, 2, ...., n Calcular el estimador máximo verosímil del parámetro a. 13. Se desea estudiar cómo afecta la concentración de un compuesto a la velocidad de una reacción química. De forma independiente y bajo las mismas condiciones, se llevó a cabo la reacción 15 veces para una concentración baja. Se obtuvo una velocidad media de 7.5 micromoles por cada 30 minutos, con una desviación típica de 1.5. Además, también se llevó a cabo 12 veces la reacción para una concentración alta. En este caso se obtuvo una velocidad media de 8.8 micromoles por cada 30 minutos, con una desviación típica de 1.42. a. Obtén un intervalo de confianza al 90% para el cociente de varianzas. ¿Pueden considerarse las varianzas iguales?. Razona la respuesta. b. ¿Existe suficiente evidencia para concluir que la velocidad media es mayor cuando la concentración es alta?. Realizar el contraste al 5% de significación. Nota: Suponer que sendas muestras proceden de poblaciones normales e independientes. 14. Se sabe que el 70% de las personas a las que se aplica una determinada prueba requieren algún tipo de explicación adicional.Para determinar si un nuevo método reduce el porcentaje de explicaciones, se aplica éste a 30 personas de los cuales 17 requieren alguna explicación adicional. a) Obtener los valores entre los que estará el porcentaje (proporción * 100) de explicaciones adicionales necesarias con este nuevo método, con un nivel de confianza del 95%. Interpretar resultados. b) Contrastar la eficacia del nuevo método, es decir, si el nuevo método reduce la proporción de explicaciones necesarias con respecto al método anterior. Tomar α = 0.05. 15. Con un cierto método de enseñanza para niños retrasados se obtiene una desviación típica de 8 en las puntuaciones de los test finales realizados por 26 niños seleccionados. Se pone a prueba un nuevo método y se ensaya con 31 niños diferentes . Las calificaciones obtenidas en los test finales dan una desviación típica de 10.¿Puede asegurarse que el nuevo método produce distinta variación en las puntuaciones con un nivel de significación del 10% ?. Nota: Se supone normalidad en las calificaciones obtenidas por ambos métodos. 5 16. En una muestra aleatoria de 150 jóvenes , 115 declararon conocer todas las medidas de prevención del sida, mientras que en otra muestra de 150 adultos, 60 reconocieron no estar suficientemente informados respecto a dicho tema. ¿Podemos afirmar que los jóvenes están más informados que los adultos respecto a la prevención del sida?. Realizar el contraste con un nivel de significación del 5%. Se supone que sendas muestras proceden de poblaciones normales e independientes. 17. La tabla siguiente presenta los valores observados de un índice de rendimiento, en un proceso químico, para dos niveles de concentración de una de las materias primas utilizadas. Nivel A 120 106 109 103 122 105 107 111 115 106 Nivel B 140 125 152 162 156 146 133 149 158 162 ¿Puede considerarse significativamente mayor el índice de rendimiento obtenido con el nivel de concentracion B?. Realizar el contraste con un nivel de significacion α = 0.05. 18. Un laboratorio farmaceutico investiga sobre animales de laboratorio el efecto de dos nuevos fármacos para el tratamiento de una misma enfermedad. El experimento consiste en medir el tiempo de reacción después de la inyección de una dosis de fármaco en el animal. Para ello se seleccionan 18 animales, biológicamente equivalentes, y se les aplica aleatoriamente a 10 de ellos el fármaco A y a resto el fármaco B. Los tiempos de reacción observados (en minutos) son: Fármaco A 8.3 7.6 8.4 8.3 7.5 8.2 7.6 8.3 8.4 7.9 6 Fármaco B 7.3 7.4 7.3 8.1 7.3 6.8 7.1 7.3 Si el farmaceutico espera que el individuo reaccione a estos fármacos en un tiempo inferior a 8 minutos, ¿será significativamente mayor la proporción individuos que lo hacen con el fármaco B que con el A?. Realizar el contraste para un nivel de significación del 5%. 19. Los siguientes datos son valores de presion en un resorte de torsión para varios ajustes del angulo entre las vueltas del resorte en una posición libre: Angulo 71o 87 85 85 86 86 86 87 Angulo 75o 86 87 87 87 88 88 87 86 88 Angulo 79o 89 90 90 91 91 ¿Es significativo el efecto del ángulo sobre la presión del resorte?. Realizar el contraste al 5% de significación. 20. Los siguientes datos corresponden al consumo de enegía eléctrica (Megavatios/10−3 hora) en el año 1998 de sendas muestras de 10 pueblos seleccionados al azar en las provincias de Jaén, Granada y Sevilla. Jaén 1,881 64,147 25,710 0,842 113,537 8,969 6,998 3,882 45,120 80,328 Consumo energía elect. Granada 0,675 0,775 44,417 2,025 0,4 10,518 1,003 0,759 6,462 4,067 Sevilla 3,914 5,515 1,819 25,500 17,299 31,799 13,971 1,584 2,390 4,524 Contrastar con un nivel de significación del 5% si existen diferencias significativas entre las tres provincias en el consumo de enegía eléctrica. Nota: Se supone que las tres muestras proceden de distribuciones normales e independientes con la misma varianza. 7