Solución Prueba de Cátedra 1. Ejercicio 4 4. La hoja “Problema 4” del libro Datos_PC1_503_1°2014.xlsx contiene diversas observaciones del tiempo entre fallas de una máquina (medidas en horas). Se supone que el tiempo entre fallas sigue una distribución Erlang con parámetro 𝒓 = 𝟐, y parámetro desconocido. a) Encuentre el MLE de , y estímelo a partir de los datos suministrados. Empezamos por la función de máxima verosimilitud 𝐿 = ∏ 𝜆2 𝑥𝑖 𝑒 −𝜆𝑥𝑖 = 𝜆2𝑛 𝑒 −𝜆 ∑ 𝑥𝑖 ∏ 𝑥𝑖 ∀𝑖 Logaritmo 𝑙𝑛𝐿 = 2𝑛𝑙𝑛𝜆 − 𝜆 ∑ 𝑥𝑖 + ∑ 𝑙𝑛𝑥𝑖 derivo respecto al parámetro 2𝑛 − ∑ 𝑥𝑖 = 0 𝜆 Por tanto, 𝜆̂ = 2𝑛 ∑ 𝑥𝑖 Con los datos incluidos en la hoja de cálculo el estimador es igual a 2,855 b) Determinar un intervalo de confianza del 95% para el valor del parámetro . Empezaremos con la cota de Crámer-Rao 1 𝑛𝐸 [ 2 𝜕 𝑙𝑛𝑓𝑥 (𝑥, 𝜆)] 𝜕𝜆 Primero, determinamos el logaritmo: 𝑙𝑛𝑓𝑥 (𝑥, 𝜆) = 2𝑙𝑛𝜆 + 𝑙𝑛𝑥 − 𝜆𝑥 Derivamos: 2⁄𝜆 − 𝑥 Elevamos al cuadrado 4⁄𝜆2 − 4𝑥⁄𝜆 + 𝑥 2 Determino la esperanza: 4⁄𝜆2 − 4𝐸(𝑥)⁄ 2 𝜆 + 𝐸(𝑥 ) Como r=2, sustituyendo E(x) y E(x2), disponible en formulario de distribuciones, la esperanza es: 2⁄𝜆2 . ̂2 Por tanto, la varianza del estimador es: 𝜆 ⁄2𝑛 y el intervalo de confianza puede obtenerse ̂2 como: 𝐼𝐶 = 𝜆̂ ± 𝑧𝛼/2 ∙ 𝜆 ⁄2𝑛. Sustituyendo: ̂2 𝜆̂ ± 𝑧𝛼/2 ∙ √𝜆 ⁄2𝑛 Utilizando z0,025=1,96 obtenemos un intervalo: 2,855 ± 1,96 ∙ 0,202 c) Para verificar la adecuación de la distribución anterior, se debe verificar el ajuste en el centro de la distribución. Proponga y utilice un gráfico para detectar errores en dichas estimaciones. Justifique su elección y explique los resultados obtenidos. Debemos realizar una gráfica P-P (véase Excel) 1.2 1 0.8 Ac Real respecto teórico 0.6 Recta Linear (Recta) 0.4 0.2 0 0 0.2 0.4 0.6 0.8 1 1.2 La gráfica muestra en el eje X la función de probabilidad acumulada empírica, mientras que el eje Y muestra la función de probabilidad acumulada teórica. Aunque hay variaciones en el centro de la muestra, éstas no deberían considerarse lo suficientemente importantes como para descartar que la distribución original fuera una Erlang con los parámetros indicados. En todo caso es conveniente saber que el valor acumulado empírico es un poco inferior al valor acumulado teórico en el centro de la distribución, lo que indica que la distribución teórica ofrece valores superiores a los observados empíricamente. d) Para verificar la adecuación de la distribución anterior, decide verificar el ajuste en las colas de la distribución. Tras consultar la literatura (“A modified Anderson Darling goodness-of-fit test for the gamma distribution with unknown scale and location parameters”) detecta que el valor crítico para el caso con r=2 sigue la siguiente fórmula: 𝑽𝑪 = 𝟎, 𝟗𝟖𝟑𝟕𝟗 + 𝟎, 𝟎𝟏𝟐𝟐𝟓𝒏 − 𝟔, 𝟐𝟕𝟏𝟑𝟗𝜶 − 𝟎, 𝟎𝟏𝟗𝟕𝟒𝒏𝜶 − 𝟎, 𝟎𝟎𝟎𝟏𝟓𝟔𝒏𝟐 + 𝟏𝟗, 𝟎𝟑𝟐𝟕𝜶𝟐 dónde VC es el valor crítico, n es el tamaño de la muestra y 𝛂 es nivel de significación. Determine si la prueba descarta la hipótesis nula con un nivel de significación del 10%. El cálculo del valor crítico incluye el tamaño de la muestra como parámetro, por lo que no es necesario rectificar el estadístico. anexar hoja Excel con solución Utilizamos Excel para determinar el índice y el valor crítico. El valor calculado es 0,594 y el valor crítico es 1,269, por lo que se acepta la hipótesis nula.