Q-Q Plots El cuantil q de F(x) es el número xq tal que F(xq) = q. Si F-1 es la inversa de F, entonces xq = F-1(q) Un estimado razonable de la función de distribución F(x) de una variable aleatoria X es F’n(x) definida una proporción de las muestras que son más pequeñas que xi, es decir F’(xi) = i/n. No obstante, i/n, es igual a 1 cuando i = n, mientras que la mayoría de las distribuciones teóricas tienden a 1 cuando x va a infinito. De modo que se usa: F’’(xi) = F’(xi) – 0.5/n = (i – 0.5)/n Para n grande el ajuste es bastante pequeño. ?? Una forma fácil de ver si los datos (xi) se ajustan a una función de distribución teórica determinada es graficando los puntos (x1, 0.5/n), (x2,1.5/n), ...,(xn, (n-0.5)/n) y comparando este resultado con el gráfico de la función de distribución teórica que creemos que se ajusta a nuestros datos. El problema es que muchas funciones de distribución tienen forma de S y es muy difícil para el ojo humano ver qué tan parecidas son las S´s ?? La segunda forma es usando un qqplot. Sea qi=(i-0.5)/n para i=1,2,....,n, 0< qi < 1. Para cualquier conjunto de datos continuo un qqplot es un gráfico de los cuantiles de la función de distribución teórica xqiT que se obtienen como: xqiT = F-1(qi), versus los cuantiles de la distribución muestral F’’(x), llamados xqiM = F-1(qi), para i = 1, 2, ..., n. Si las funciones de distribución tienen una inversa, es muy fácil determinar los xqi. En otros casos, se tienen que usar tablas e interpolar los valores si es necesario. Por ejemplo, para una normal (0,1), se usa la siguiente aproximación: xqi = 4.9[qi 0.14 – (1 - qi) 0.14 ] Ejemplo: La diferencia entre los valores medidos y aquellos que predice un modelo son llamados errores. Los errores para 8 predicciones de un modelo fueron: -0.04, -0.19, 0.14, -0.09, -0.14, 0.19, 0.04 y 0.09. Compruebe que los errores se distribuyen normal (0,1). i xi S qi = (i - .5)/n 1 -0.19 .06 2 -0.14 0.19 3 -0.09 0.32 4 -0.04 0.44 5 0.04 0.56 6 0.09 0.69 7 0.14 0.81 8 0.19 0.94 Finalmente, usando una distribución teórica calculamos los cuantiles téoricos xqiT i xqi S xqi t qi = (i - .5)/n 1 -0.19 -1.54 .06 2 -0.14 -0.89 0.19 3 -0.09 -0.49 0.32 4 -0.04 -0.16 0.44 5 0.04 0.16 0.56 6 0.09 0.49 0.69 7 0.14 0.89 0.81 8 0.19 1.54 0.94 El qqplot queda como sigue: QQPlot Valores Medidos 0.3 0.2 0.1 0 -2 -1 -0.1 0 1 2 -0.2 -0.3 Valores Teóricos Notas: ?? La distribución teórica es una normal (0, 1). ?? Si la línea no tiene intersección con 0 en el eje y, y pendiente 1, las funciones de distribución son distintas. Si la línea tiene pendiente 1 (y no se intercepta con 0 en el eje y), la diferencia de las dos distribuciones es constante. ?? Aunque las dos funciones de distribución sean iguales, la línea puede no ser recta si se tienen pocas muestras.