Cálculo y EstadísTICa. Primer Semestre. EstadísTICa Curso Primero Graduado en Geomática y Topografía Escuela Técnica Superior de Ingenieros en Topografía, Geodesia y Cartografía. Universidad Politécnica de Madrid Capítulo IV DISTRIBUCIONES CONTINUAS NOTABLES. Manuel Barrero Ripoll. Mª Ángeles Castejón Solanas. Mª Luisa Casado Fuente. Luis Sebastián Lorente. Departamento de Ingeniería Topográfica y Cartografía Universidad Politécnica de Madrid 2-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES 4 Distribuciones continuas. 4.1 Distribución Uniforme 4 4.2 Distribución exponencial 5 4.2.1 Propiedades 4.2.2 La función de Excel para la Distribución Exponencial. Exp(λ). 4.3 4.4 Distribución Normal 4.3.1 Definición 4.3.2 Propiedades de f(x) 4.3.3 Distribución Normal Estandar 4.3.4 Las funciones de Excel para la Distribución Normal 4.3.5 Resumen de funciones de Excel Normalidad. Métodos descriptivos 4.4.1 4.5 4.6 4.7 7 12 Ajuste de una distribución experimental mediante una Distribución Normal Distribución χ 2 de Pearson 14 4.5.1 Propiedades de la Distribución Chi-Cuadrado de n grados de libertad 4.5.2 Las funciones de Excel para la Distribución Chi-Cuadrado Distribución t_Student 16 4.6.1 Propiedades básicas de la distribución t_Student 4.6.2 Las funciones de Excel para la distribución t_Student Distribución Fisher_Snedecor 18 4.7.1 Propiedades de la distribución de Fisher-Snedecor 4.7.2 Las funciones de Excel para la distribución de Fisher-Snedecor Universidad Politécnica de Madrid 3-IV 4.1 Distribución Uniforme. U( a, b ) Sea X una variable aleatoria que toma valores en el intervalo real [ a, b] . Decimos que X sigue una distribución uniforme U(a, b) cuando su función de densidad es: 1 b−a ⎧ 1 si a ≤ x ≤ b ⎪ f (x) = ⎨b − a ⎪⎩ 0 en otro caso a b Función de densidad de la v.a. U(a,b). Figura 4.1.1 La función de distribución de la variable U(a, b) y su gráfica son por tanto ⎧ 0 ⎪ x-a ⎪ P (X ≤ x) = F(x) = ⎨ ⎪ b-a ⎪⎩ 1 si x<a 1 si a ≤ x ≤ b si b<x a b Función de distribución de la v.a. U(a,b) Figura 4.1.2 La media y varianza de la variable aleatoria X ∈ U(a, b) son: a+b μ = E [ X] = 2 σ = V [ X] 2 (b − a) = 2 12 Ejemplo. De una estación parte un tren cada 10 minutos. Si designamos por X la variable aleatoria “tiempo de espera desde que un viajero entra en el andén hasta que parte”, calcular: - La función de densidad de X. - La probabilidad de esperar menos de dos minutos. - El tiempo medio de espera. - La probabilidad de esperar dos minutos y medio. Si el viajero llega en cualquier momento y todos los momentos tienen la misma probabilidad, la variable aleatoria tiempo de espera sigue una distribución U(0,10). - Por tanto, la función de densidad de la variable X es ⎧1 ⎪ f (x) = ⎨10 ⎪⎩ 0 si 0 ≤ x ≤ 10 en otro caso - La probabilidad de esperar menos de dos minutos será: - El tiempo medio de espera es μ = E [ X ] = 1 2 dx = = 0.2 10 10 0 P(X < 2) = ∫ 10 = 5 minutos. 2 lu_seb@topografia.upm.es 4-IV 2 Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES - Si el reloj aprecia hasta los segundos, el viajero espera dos minutos y medio si el tren 2.31 llega entre 2,29 y 2.31 minutos, por tanto P(2.29 < x < 2.31) = 1 ∫ 10 dx = 0.002 . 2.29 4.2 Distribución Exponencial. Exp(λ) La variable aleatoria exponencial describe frecuentemente el tiempo (o espacio) entre sucesos consecutivos de Poisson, donde λ representa el número de sucesos de Poisson por unidad de tiempo (o espacio). Una variable aleatoria continua X que toma valores no negativos sigue una distribución exponencial de parámetro λ>0 cuando su función de densidad es: f (x) = λe−λx con x >0 λ=1 λ=3 λ=5 λ=10 Figura 4.2.1 Su función de distribución es: x F ( x ) = P [ X ≤ x ] = ∫ λe−λt dt = 1 − e − λx , con x > 0 0 4.2.1 Propiedades - - La media y la varianza de la variable aleatoria exponencial son: 2 2 ∞ ∞ ⎡⎛ 1 1⎞ ⎤ 1⎞ 1 ⎛ −λt 2 μ = E [ X ] = ∫ xλe dt = ; σ = V [ X ] = E ⎢⎜ x − ⎟ ⎥ = ∫ ⎜ x − ⎟ λe−λt dt = 2 λ λ ⎠ ⎦⎥ 0 ⎝ λ⎠ λ 0 ⎣⎢⎝ Se dice que la distribución exponencial no tiene memoria. Para cualquier valor de a>0 y de b>0 se verifica: ( P X >a+b P ( X > a ∩ X > a + b ) e −λ( a + b ) = −λa = e −λb = P ( X > b ) . = X>a P (X > a ) e ) Ejemplo. El tiempo de reparación de cierta avería mecánica tiene una distribución exponencial de media 50 minutos. a) Calcular la probabilidad de que el tiempo de reparación sea menor que 40 minutos. manuel.barrero@topografia.upm.es Universidad Politécnica de Madrid 5-IV b) Si el coste de mano de obra es de 50 euros por hora y se factura por intervalos de 10 minutos. ¿Cuál es la probabilidad de que una reparación cueste 100 euros? Si definimos una variable aleatoria T que representa el tiempo (en minutos) de reparación y T 1 sigue una distribución exponencial de media μ = = 50 entonces, su función de densidad es: λ 1 1 − t f ( t ) = e 50 , t>0 . 50 a) La probabilidad de que un tiempo de reparación sea menor de 40 minutos es: 40 1 − 501 t P ( t < 40 ) = F(40) = ∫ e dt ≈ 0.55067 50 0 b) Una reparación costará 100€ cuando la duración de la reparación sea mayor que 110’ y menor que 120’. Así pues: P (110 < t < 120 ) = F(120) − F(110) = 120 1 − 501 t ∫ 50 e dt ≈ 0.02009 110 4.2.2 La función de Excel para la Distribución Exponencial. Exp(λ). En Excel, existe una función para el cálculo de F(x) = P( X ≤ x) en una distribución Exp(λ): “DISTR.EXP(x;λ;1)” siendo x el valor de la variable y λ el parámetro de la distribución. Veamos con un ejemplo la forma de utilizar esta función. En una distribución exponencial de parámetro λ=0.1 calcular el valor de P(X ≤ 2) . Pulsando el botón insertar función y en este caso al resaltar de la categoría “Estadísticas” con la opción “DISTR.EXP” se despliega una ventana como la de la figura 4.2.2, donde debemos rellenar el valor de la variable (x > 0) de la cual se desea conocer su probabilidad, el valor del parámetro (λ > 0) y en “acum” escribimos el valor uno para obtener la probabilidad, o un “0” para obtener el valor de la ordenada de ( f(x) ) para el valor x dado. P(X ≤ 2) = 0.18127 Figura 4.2.2 lu_seb@topografia.upm.es 6-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES 4.3 Distribución Normal. N ( μ , σ ) La distribución normal es el modelo más utilizado e importante de la teoría estadística moderna. Existen multitud de experimentos cuyos resultados se ajustan a esta distribución. 4.3.1 Definición. Una variable aleatoria X sigue una distribución normal de parámetros µ y σ que representamos de forma abreviada por N ( μ, σ ) , si y sólo si, su función de densidad es: 1 ( x −μ ) − 1 f (x) = e 2 σ 2π σ 2 2 , con −∞ < x < ∞ ; −∞ < μ < ∞ y σ > 0 . 4.3.2 Propiedades de f(x). Existe una serie de propiedades básicas que debemos conocer acerca de la función de densidad y de la función de distribución de una variable aleatoria normal: • 1. La función de densidad es no negativa ( f ( x ) ≥ 0 ). ∞ • 2. El área encerrada por f(x) y el eje X es la unidad ( ∫ f (x)dx = 1 ). −∞ • 3. La función f(x) tiene la asíntota horizontal y=0 . • 4. Por ser una función exponencial f (x) es una función continua en − ∞ < x < ∞ . • 5. Es una función simétrica respecto de la recta x = μ ; ( f ( μ + x ) = f ( μ − x ) . • 6. Existe un máximo en x = μ = Mo . • 7. En los valores x = μ ± σ existe un punto de inflexión . • 8. La media es el propio parámetro μ ; ∞ ∞ − 1 E [ x ] = ∫ xf (x)dx = xe ∫ σ 2π −∞ −∞ (x −μ )2 2 σ2 dx = μ • 9. La desviación típica es el parámetro σ ; V[x] = ∞ ∫ ( x − μ) 2 f (x)dx = σ 2 , por tanto la desviación típica es σ . −∞ • 10. De las propiedades 8 y 9 se deduce que la función de densidad de una distribución normal queda perfectamente determinada conocidos los valores de μ y σ. • 11. De las propiedades 5 y 6 se deduce que M = μ = Mo . • 12. La función de distribución de la variable aleatoria X ∈ N(μ, σ) es: x − 1 F ( x ) = P(X ≤ x) = ∫ e −∞ σ 2π ( t −μ )2 2 σ2 dt manuel.barrero@topografia.upm.es Universidad Politécnica de Madrid 7-IV • 13 La forma de la función de densidad puede observarse en la figura (4.3.1). Figura 4.3.1 • 14. En las siguientes figuras podemos observar cómo cambia la gráfica de la función de densidad f(x) según los valores de σ y µ. Normales con igual media y diferente varianza. μ=1 fija y σ=1,2,3. Normales con diferente media e igual varianza. μ=0,1,2 y σ=1. Figura 4.3.2 • 15. La combinación lineal de variables aleatorias normales e independientes es una variable aleatoria normal. Si X1~ N(μ1 , σ1 ) , X2 ~ N(μ2 , σ2 ) ,…, Xn ~ N(μn , σn ) son independientes, entonces: ( X= X1 ± X2 ± ... ± Xn ≈ N μ1 ± μ 2 ± ... ± μn , lu_seb@topografia.upm.es 8-IV ) σ12 + σ22 + ... + σn2 . Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES 4.3.3 Distribución Normal Estandar. N(0,1). Si X es una variable aleatoria N(μ, σ), x −μ es una distribución normal de media μ=0 y σ desviación típica σ=1, por tanto, su función de densidad viene dada por: entonces, la variable aleatoria Z = 1 − 12 z2 f (z) = e y −∞ < z <∞. 2π En efecto, ⎞ ⎡x −μ⎤ 1 ⎛ E [ z] = E ⎢ E x E = − μ [ ] [ ] ⎜ ⎟=0 ⎣ σ ⎥⎦ σ ⎝ =μ =μ ⎠ ⎞ 1 ⎛ ⎡x −μ⎤ 1 V x V + μ V [z] = V ⎢ V x = − μ = [ ] [ ] [ ] ⎜ ⎟ =1. 2 2 σ ⎝ =σ2 ⎣ σ ⎥⎦ σ =0 ⎠ X −μ resultado de aplicar una traslación y un cambio de escala σ a la variable X, se le denomina tipificación de la variable. Este cambio de variable, Z = 4.3.4 Las funciones de Excel para la distribución normal. Mediante Excel, podemos utilizar dos formas distintas para obtener la probabilidad de un valor en una variable normal: • Distribución Normal Estándar: X ≈ N(0,1) . • Distribución Normal: X ≈ N(μ, σ) . La diferencia radica en cómo debemos ingresar los datos, y es por ello, por lo que utilizamos ejemplos aclaratorios. Ejemplo. Calcular P(Z ≤ 2.5) en una distribución N(0,1). En este caso al resaltar de la categoría “Estadísticas” la opción “DISTR.NORM.ESTAND” se despliega una ventana en la que debemos rellenar el valor de la variable z del cual se desea conocer su probabilidad. P(X ≤ 2.5) Figura 4.3.3 manuel.barrero@topografia.upm.es Universidad Politécnica de Madrid 9-IV Otra forma de proceder es escribir directamente la función Excel: =DISTR.NORM.ESTAND(2,5) P(Z ≤ 2.5) = 0.9937903 Figura 4.3.4 Ejemplo. Calcular P(X ≤ 2.5) en una distribución N(2,3). En este caso existen dos posibilidades de calcular la probabilidad. • 1º Tipificamos la variable y procedemos de la forma anterior. • 2º Directamente con la ventana o función “DISTR.NORM(µ,σ)”. Veamos la primera forma, en este caso debemos calcular primero el valor tipificado Z: X −μ 2.5 − 2 ⎞ 1⎞ ⎛ ⎛ Z= ⇒ P ( X ≤ 2.5 ) = P ⎜ Z ≤ ⎟ = P⎜Z ≤ ⎟ 3 ⎠ 6⎠ σ ⎝ ⎝ Por tanto FUNCIÓN ⎛1⎞ F ⎜ ⎟ = 0.56618 ⎝6⎠ Figura 4.3.5 Si procedemos directamente utilizando la ventana de diálogo de la función “DISTR:NORM”, esta ventana nos solicita, el valor de la variable del cual deseamos conocer su probabilidad y los parámetros de la distribución, es decir, media y desviación típica. Además, P(X ≤ 2.5) debemos poner un uno en la casilla “Acum” ya que en este caso deseamos calcular la probabilidad acumulada hasta 2.5. Figura 4.3.6 En el caso del problema inverso, es decir, hallar el valor de la variable aleatoria (percentil) a partir de la probabilidad del valor buscado, conocidas la media y la desviación típica, también podemos elegir entre las dos siguientes alternativas: lu_seb@topografia.upm.es 10-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES • “ =Distribución Normal Estándar Inversa”; Z ≈ N(0,1) . • “ =Distribución Normal Inversa”; X ≈ N(μ, σ) . Como en el caso anterior la diferencia radica en como debemos ingresar los datos. Ejemplo. En una distribución N(0,1), hallar el valor de x que verifica P(Z ≤ x) = 0.5333 . FUNCIÓN F(0.0835)=0.5333 Figura 4.3.7 Ejemplo. En una distribución N(2,3) hallar el valor de x que verifica P(X ≤ x) = 0.5333 . La función Excel correspondiente en este caso es: FUNCIÓN =DISTR.NORM.INV(0,5333; 2; 3) x=2.25093 es el valor de la variable cuya probabilidad es 0.5333 Figura 4.3.8 La ventana de dialogo correspondiente a la función DISTR.NORM.INV es: FUNCIÓN P(X ≤ x ) = 0.5333 Figura 4.3.9 manuel.barrero@topografia.upm.es Universidad Politécnica de Madrid 11-IV 4.3.5 Resumen de funciones de EXCEL Función Excel Sintaxis. DISTR.NORM(x; µ;σ;acum) x: valor de la variable. acum.= “1” para obtener F( x) = P(X ≤ x) . DISTR.NORM. X ≈ N(μ, σ) F(x) = P(X ≤ x) Acum.= “0” para obtener la ordenada en x. DISTR.NORM.ESTAND. Z ≈ N(0,1) F(z) = P(Z ≤ z) DISTR.NORM.ESTAND(z) z: valor de la variable normalizada. DISTR.NORM.INV. p = P(X ≤ x) DISTR.NORM.INV(p;µ;σ) DISTR.NORM.ESTAND.INV. p = P(Z ≤ z) DISTR.NORM.ESTAND.INV(p). Tabla 4.3.1 4.4 Normalidad. Métodos descriptivos Más adelante, harán inferencias estadísticas acerca de la población a partir de la información obtenida de una muestra. En la mayoría de las técnicas que estudiarán se supone que la muestra o muestras han sido obtenidas de una población normal. Por tanto, antes de aplicar dichas técnicas aprenderemos varios métodos descriptivos para verificar si los datos de la muestra proceden de una distribución aproximadamente normal. • 1º Construimos un histograma de frecuencias relativas para los datos. Si los datos son aproximadamente normales, la gráfica será similar a la de la curva normal y simétrica respecto de la media. • 2º Calculamos el intervalo intercuartílico y la desviación típica muestral, S, si los datos son aproximadamente normales, entonces, Q 3 − Q1 ≈ 1, 3 S Estas verificaciones de normalidad son fáciles de aplicar y de gran utilidad, pero, sólo son métodos descriptivos. Es posible aunque poco probable, que los datos no sean normales aunque se verifiquen las condiciones anteriores. Así pues, con estos métodos sólo podemos decir que es razonable pensar que los datos provienen de una distribución normal. Existen métodos analíticos para el estudio de la normalidad y que estudiaran en otras asignaturas. 4.4.1 Ajuste de una distribución experimental con una distribución normal. Más adelante estudiaran que: • Si la población es normal, la media muestral es el estimador centrado más eficiente de la media poblacional ( μ = X ). lu_seb@topografia.upm.es 12-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES • Si la población es normal, la varianza muestral o cuasivarianza es el estimador centrado más eficiente de la varianza de la población ( σ 2 = S2 ) . • De los apartados anteriores se deduce que la distribución normal que mejor se aproxima es aquella que tiene por media y varianza, X y S2 , respectivamente. Población Muestra N(μ, σ) ( X,S N X, S ) Figura 4.4.1 Ejemplo. De un experimento se ha obtenido la siguiente distribución de frecuencias. x 0a1 1a2 2a3 3a4 4a5 5a6 6a7 7a8 8a9 9 a 10 ni 1 4 19 91 202 217 95 16 4 1 Si admitimos que se distribuye según una distribución normal, realizar el mejor ajuste para dicha distribución. Solución. Podemos observar que el polígono de frecuencias absolutas tiene la forma acampanada de una distribución normal. His tograma 250 202 200 150 0 95 91 100 50 217 1 4 19 16 4 1 0 a 1 1 a 2 2 a 3 3 a 4 4 a 5 5 a 6 6 a 7 7 a 8 8 a 9 9 a 10 Figura 4.4.2 Si calculamos la media, la cuasivarianza y los cuartiles obtenemos: X = 5.01 ; por tanto S2 = 1.35 ; S = 1.16 ; Q1 = 4.24 ; Q3 = 5.79 ; Q 3 − Q1 = 1.34 S observamos que también se verifica la segunda condición de las dadas para aceptar la normalidad de la muestra y por tanto la distribución normal que mejor se ajusta es: N(5.01, 1.16). manuel.barrero@topografia.upm.es Universidad Politécnica de Madrid 13-IV 4.5 Distribución χ de Pearson 2 Sean Z1, Z2,….,Zn, n variables aleatorias independientes entre sí, todas ellas con distribuciones 2 N(0, 1). La variable χ n = n ∑Z i =1 2 i es una variable aleatoria que recibe el nombre de chi- cuadrado con n grados de libertad. − Su función de densidad viene dada por f (x) = x e 2 ⋅x n −2 2 n 2 ⎛n⎞ 2 ⋅Γ ⎜ ⎟ ⎝2⎠ siendo 0 < x < ∞ Y n>2 . Figura 4.5.1 En la figura 4.5.1 notamos cómo cambia la forma de la función de densidad según sea el valor 2 de “n” en la distribución χn . 4.5.1 Propiedades de la distribución Chi-cuadrado de n grados de libertad 1. La distribución χ n sólo depende del parámetro n. 2 2. El dominio de la variable es [0, ∞ ) . 3. Su media, varianza y desviación típica son respectivamente ∞ μ = E [ x ] = ∫ xf (x)dx = n ; σ2 = V [ x ] = ∞ ∫ ( x − μ) 2 f (x)dx = 2n ⇒ σ = 2n . −∞ 0 8 12 , y de curtosis g 2 = . n n Note que, a medida que n aumente, la gráfica de la función de densidad se hará más 4. Son sus coeficientes de asimetría g1 = ( ) simétrica y menos apuntada y χ 2n ⎯⎯ → N n, 2n . 5. Si χ n1 y χ n 2 son independientes entonces χn1 + χn 2 es una distribución χ n1 + n 2 . 2 2 2 2 2 Esta propiedad se generaliza para la suma de n variables aleatorias independientes chicuadrado. lu_seb@topografia.upm.es 14-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES 4.5.2 Las funciones de Excel para la Distribución Chi-cuadrado. χ2n Debido a que esta distribución es muy usada en estimación y contrastes de hipótesis, lo que más nos interesa en este curso, es el cálculo de la P(X ≤ x) y del valor x de la variable que verifica F(x)=α. Función Excel Sintaxis DISTR.CHI Calcula la probabilidad acumulada a la derecha de un valor x, en una distribución χ 2n . P(χ 2n ≥ x) = α DISTR.CHI(x;gl) x: valor de la variable. gl: grados de libertad. PRUEBA.CHI.INV Devuelve el percentil x que acumula a su derecha una determinada probabilidad α. P(χ 2n ≥ x) = α PRUEBA.CHI.INV(α;gl) α: probabilidad. gl: nº de grados de libertad. Observe que las funciones DISTR.CHI y PRUEBA.CHI.INV proporcionan el área α situada a la derecha del valor x y el valor x que deja a su derecha un área α, respectivamente. α x Figura 4.5.2 2 Ejemplo. Calcular: a) P(χ11 > 4.575) , 2 2 b) P(4,865 < χ10 < 15.987) , c) P(χ11 < 10.1) , 2 d) hallar el valor de x tal que P(χ10 < x) = 0.5 Utilizaremos la función “ =DISTR.CHI ” para los apartados a, b y c, “=PRUEBA.CHI.INV” para el apartado d) para obtener: y la función 2 P(χ11 > 4.575) = 0.949992 2 P(4.865 < χ10 < 15.987) = 0.800007 2 2 P(χ11 < 10,1) = 1 − P(χ11 > 10,1) =0.478505 2 2 2 P(χ10 < x) = 0.5 ⇒ 1 − P(χ10 > x) = 0.5 ⇒ P(χ10 > x) = 0.5 ⇒ x = 9.341816 Figura 4.5.3 Universidad Politécnica de Madrid manuel.barrero@topografia.upm.es 15-IV Otra alternativa es usar las ventanas de diálogo para las funciones anteriores. Así, para los apartados a) y d) se obtienen las siguientes ventanas: Figura 4.5.4 4.6 Distribución t de Student. tn Sean Z y χ dos variables aleatorias independientes, la variable Z con distribución N(0,1) y χ con distribución χ n entonces, la variable aleatoria t n = 2 Z χ 2n n sigue una distribución “t de student ” con n grados de libertad (abreviadamente t n ). Su función de densidad es: ⎛ n +1 ⎞ n +1 Γ⎜ ⎟ 2 − 2 ⎠ ⎛ n + x ⎞ 2 , siendo, n > 1 y −∞ < x < ∞ . ⎝ f (x) = ⋅⎜ ⎟ ⎛n⎞ ⎝ n ⎠ nπΓ ⎜ ⎟ ⎝2⎠ 4.6.1 Propiedades básicas de la distribución t_Student. tn • Su distribución sólo depende del parámetro “n”, llamado grados de libertad. • El dominio de la variable es ( −∞, ∞ ) . • Es simétrica respecto del valor x = 0. • Su media y varianza son: n si n > 2 respectivamente. n−2 5 Son sus coeficientes de asimetría y curtosis g1 = 0 y g 2 = respectivamente. n−4 μ = E [ x ] = 0 si n > 1 y σ 2 = V [ x ] = • • Para n grande (n>30), la distribución t_student se aproxima a una distribución N(0,1) . • El caso particular de t1 se conoce con el nombre de Distribución de Cauchy. lu_seb@topografia.upm.es 16-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES 4.6.2 Las funciones de Excel para la distribución t_Student. Las funciones que proporciona Excel para el cálculo de la P(X ≤ x) y del valor x de la variable aleatoria que x verifica F(x)=α= ∫ f (t)dt , son las siguientes: 0 Función Excel Sintaxis DISTR.T Calcula el valor de P(t n > t) si elegimos una cola, o el valor de P( t n ≥ t) si elegimos dos colas. DISTR.T(t;n;colas) t: valor de la v. a. -n el nº de grados de libertad. DISTR.T.INV Devuelve el valor “t” de DISTR.T.INV(α;n) α α; En esta función siempre es la la variable, tal que P ( t n > t ) = . probabilidad acumulada en dos colas. 2 Tabla 4.6.1 Ejemplo Calcular las probabilidades: a) P(t 9 ≥ 1.37) P(t 9 ≥ 1.37) ≈ 1 cola 0.101945 Figura 4.6.2 b) P(t 9 ≤ 1.2); P(t 9 ≤ 1.2) = 1 − P(t 9 ≥ 1.2) ≈ ≈ 0.869613 1 cola Figura 4.6.3 c) P( t11 > 2.5) P (t 11 > 2 . 5 ) 2 colas 0 . 029506 Figura 4.6.4 d) El valor de t, tal que P(t16 ≥ t) = 0.20 Siempre 2 colas P ( t16 ≥ t ) = 0.2 ⇒ ⇒ t ≈ 0.864667 Figura 4.6.5 manuel.barrero@topografia.upm.es Universidad Politécnica de Madrid 17-IV e) El valor de t, tal que P(t10 ≤ t) = 0.9 P(t10 ≤ t) = 0.9 ⇒ P(t10 > t) = 0.1 ⇒ P( t10 > t) = 0.2 P( t10 > t) = 0.2 Por tanto t ≈ 1.372184 Figura 4.6.6 La ventana de diálogo para la distribución “DISTR.T” y el ejercicio a) será: P(t 9 ≥ 1.37) Figura 4.6.7 La ventana de diálogo para la distribución “DISTR.T.INV” y el ejercicio d) será: P(t16 ≥ t) = 0.20 0.2 Resultado t 0.2 Figura 4.6.8 lu_seb@topografia.upm.es 18-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía IV DISTRIBUCIONES CONTINUAS NOTABLES 4.7 Distribución de Fisher-Snedecor. F(n,m) Sean X e Y dos variables aleatorias independientes con funciones de distribución χ 2m y χ 2n , respectivamente. La variable aleatoria Fm,n = X Y m sigue una distribución de Fisher-Snedecor n con m y n grados de libertad. La función de densidad viene determinada por la función ⎧ ⎛m+n⎞ n m ⎪ Γ⎜ 2 ⎟ 2 2 n (mx) ⎠ ⎪⎪ ⎝ si x > 0 m+n f (x) = ⎨ ⎛ m ⎞ ⎛ n ⎞ 2 x ( mx + n ) Γ Γ ⎪ ⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠ ⎪ 0 si x ≤ 0 ⎪⎩ 4.7.1 Propiedades de la Distribución de Fisher-Snedecor. Algunas de las propiedades más importantes de la distribución de Fisher-Snedecor son: • Si X ≈ Fm,n entonces la variable 1 ≈ Fn,m . X • Si X ≈ t n entonces X 2 ≈ F1,n . • La media de la distribución F(m, n) es: μ = m , siendo m > 2. (m − 2) • La varianza de la distribución F(m, n) es: σ2 = 2m 2 (m + n − 2) , siendo m > 4. n(m − 4)(m − 2)2 Sintaxis g1=n; grados de libertad en el numerador. g2=m; grados de libertad en el denominador. Función DISTR.F Conocido el valor de la v. a. X, devuelve el valor del área α situada a la derecha de x, es decir: P(X > x) = α DISTR.F(x;g1;g2) x: valor de la variable. DISTR.F.INV Conocida el área α , DISTR.F.INV(p:g1;g2) halla el valor de la variable que deja a P: probabilidad que deja a su derecha el valor x. su derecha un área α ; P(X > x) = α Tabla 4.7.1 manuel.barrero@topografia.upm.es Universidad Politécnica de Madrid 19-IV 9.7.2 Las funciones de Excel para la Distribución de Fisher-Snedecor. X ≈ Fn,m . Al igual que en las distribuciones anteriores estudiaremos el cálculo de la P(X ≤ x) , y el valor x x, de la variable aleatoria que verifica F(x)= α = ∫ f (t)dt . 0 Ejemplo. Hallar P ( F4,9 < 2.8 ) . P ( F4,9 < 2.8 ) = 1 − P ( F4,9 ≥ 2.8 ) Función Excel: =1-DISTR.F(2,8;4;9) P ( F4,9 < 2.8 ) ≈ 0.908069 Figura 4.7.1 La ventana de diálogo para esta función es: x = 2.8 n=4 m=9 P ( F4,9 < 2.8 ) = 1 − P ( F4,9 ≥ 2.8 ) = = 1 − 0.09193 = = 0.90807 Figura 4.7.2 Ejemplo. Hallar el valor k tal que P(X<k)=0.95, siendo X ≈ F4,9 . Función Excel: =DISTR.F.INV(0.05;4;9) P(X < k) = 0.95 ⇒ P ( F > k ) = 0.05 ⇒ F(K) = 0.05 k ≈ 3.633089 Figura 4.7.3 lu_seb@topografia.upm.es 20-IV Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía