Distribucion normal en cartografia

Anuncio
Cálculo y EstadísTICa. Primer Semestre.
EstadísTICa
Curso Primero
Graduado en Geomática y Topografía
Escuela Técnica Superior de Ingenieros en Topografía, Geodesia y Cartografía.
Universidad Politécnica de Madrid
Capítulo IV
DISTRIBUCIONES CONTINUAS NOTABLES.
Manuel Barrero Ripoll.
Mª Ángeles Castejón Solanas.
Mª Luisa Casado Fuente.
Luis Sebastián Lorente.
Departamento de Ingeniería Topográfica y Cartografía
Universidad Politécnica de Madrid
2-IV
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
4
Distribuciones continuas.
4.1
Distribución Uniforme
4
4.2
Distribución exponencial
5
4.2.1 Propiedades
4.2.2 La función de Excel para la Distribución Exponencial. Exp(λ).
4.3
4.4
Distribución Normal
4.3.1
Definición
4.3.2
Propiedades de f(x)
4.3.3
Distribución Normal Estandar
4.3.4
Las funciones de Excel para la Distribución Normal
4.3.5
Resumen de funciones de Excel
Normalidad. Métodos descriptivos
4.4.1
4.5
4.6
4.7
7
12
Ajuste de una distribución experimental mediante una Distribución Normal
Distribución χ 2 de Pearson
14
4.5.1
Propiedades de la Distribución Chi-Cuadrado de n grados de libertad
4.5.2
Las funciones de Excel para la Distribución Chi-Cuadrado
Distribución t_Student
16
4.6.1
Propiedades básicas de la distribución t_Student
4.6.2
Las funciones de Excel para la distribución t_Student
Distribución Fisher_Snedecor
18
4.7.1
Propiedades de la distribución de Fisher-Snedecor
4.7.2
Las funciones de Excel para la distribución de Fisher-Snedecor
Universidad Politécnica de Madrid
3-IV
4.1 Distribución Uniforme. U( a, b )
Sea X una variable aleatoria que toma valores en el intervalo real [ a, b] . Decimos que X sigue
una distribución uniforme U(a, b) cuando su función de densidad es:
1
b−a
⎧ 1
si a ≤ x ≤ b
⎪
f (x) = ⎨b − a
⎪⎩ 0
en otro caso
a
b
Función de densidad de la v.a. U(a,b).
Figura 4.1.1
La función de distribución de la variable U(a, b) y su gráfica son por tanto
⎧ 0
⎪ x-a
⎪
P (X ≤ x) = F(x) = ⎨
⎪ b-a
⎪⎩ 1
si
x<a
1
si a ≤ x ≤ b
si
b<x
a
b
Función de distribución de la v.a. U(a,b)
Figura 4.1.2
La media y varianza de la variable aleatoria X ∈ U(a, b) son:
a+b
μ = E [ X] =
2
σ = V [ X]
2
(b − a)
=
2
12
Ejemplo. De una estación parte un tren cada 10 minutos. Si designamos por X la variable
aleatoria “tiempo de espera desde que un viajero entra en el andén hasta que parte”, calcular:
- La función de densidad de X.
- La probabilidad de esperar menos de dos minutos.
- El tiempo medio de espera.
- La probabilidad de esperar dos minutos y medio.
Si el viajero llega en cualquier momento y todos los momentos tienen la misma probabilidad,
la variable aleatoria tiempo de espera sigue una distribución U(0,10).
- Por tanto, la función de densidad de la variable X es
⎧1
⎪
f (x) = ⎨10
⎪⎩ 0
si
0 ≤ x ≤ 10
en otro caso
- La probabilidad de esperar menos de dos minutos será:
- El tiempo medio de espera es μ = E [ X ] =
1
2
dx = = 0.2
10
10
0
P(X < 2) = ∫
10
= 5 minutos.
2
lu_seb@topografia.upm.es
4-IV
2
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
- Si el reloj aprecia hasta los segundos, el viajero espera dos minutos y medio si el tren
2.31
llega entre 2,29 y 2.31 minutos, por tanto P(2.29 < x < 2.31) =
1
∫ 10 dx = 0.002 .
2.29
4.2 Distribución Exponencial. Exp(λ)
La variable aleatoria exponencial describe frecuentemente el tiempo (o espacio) entre sucesos
consecutivos de Poisson, donde λ representa el número de sucesos de Poisson por unidad de
tiempo (o espacio).
Una variable aleatoria continua X que toma valores no negativos sigue una distribución
exponencial de parámetro λ>0 cuando su función de densidad es:
f (x) = λe−λx con x >0
λ=1
λ=3
λ=5
λ=10
Figura 4.2.1
Su función de distribución es:
x
F ( x ) = P [ X ≤ x ] = ∫ λe−λt dt = 1 − e − λx , con x > 0
0
4.2.1 Propiedades
-
-
La media y la varianza de la variable aleatoria exponencial son:
2
2
∞
∞
⎡⎛
1
1⎞ ⎤
1⎞
1
⎛
−λt
2
μ = E [ X ] = ∫ xλe dt = ;
σ = V [ X ] = E ⎢⎜ x − ⎟ ⎥ = ∫ ⎜ x − ⎟ λe−λt dt = 2
λ
λ ⎠ ⎦⎥ 0 ⎝
λ⎠
λ
0
⎣⎢⎝
Se dice que la distribución exponencial no tiene memoria. Para cualquier valor de
a>0 y de b>0 se verifica:
(
P X >a+b
P ( X > a ∩ X > a + b ) e −λ( a + b )
= −λa = e −λb = P ( X > b ) .
=
X>a
P (X > a )
e
)
Ejemplo. El tiempo de reparación de cierta avería mecánica tiene una distribución
exponencial de media 50 minutos.
a) Calcular la probabilidad de que el tiempo de reparación sea menor que 40 minutos.
manuel.barrero@topografia.upm.es
Universidad Politécnica de Madrid
5-IV
b) Si el coste de mano de obra es de 50 euros por hora y se factura por intervalos de 10
minutos. ¿Cuál es la probabilidad de que una reparación cueste 100 euros?
Si definimos una variable aleatoria T que representa el tiempo (en minutos) de reparación y T
1
sigue una distribución exponencial de media μ = = 50 entonces, su función de densidad es:
λ
1
1 − t
f ( t ) = e 50 , t>0 .
50
a) La probabilidad de que un tiempo de reparación sea menor de 40 minutos es:
40
1 − 501 t
P ( t < 40 ) = F(40) = ∫ e dt ≈ 0.55067
50
0
b) Una reparación costará 100€ cuando la duración de la reparación sea mayor que 110’ y
menor que 120’. Así pues:
P (110 < t < 120 ) = F(120) − F(110) =
120
1 − 501 t
∫ 50 e dt ≈ 0.02009
110
4.2.2 La función de Excel para la Distribución Exponencial. Exp(λ).
En Excel, existe una función para el cálculo de F(x) = P( X ≤ x) en una distribución Exp(λ):
“DISTR.EXP(x;λ;1)” siendo x el valor de la variable y λ el parámetro de la distribución.
Veamos con un ejemplo la forma de utilizar esta función.
En una distribución exponencial de parámetro λ=0.1 calcular el valor de P(X ≤ 2) .
Pulsando el botón insertar función y
en este caso al resaltar de la
categoría “Estadísticas”
con la
opción “DISTR.EXP” se despliega
una ventana como la de la figura
4.2.2, donde debemos rellenar el
valor de la variable (x > 0) de la cual
se desea conocer su probabilidad, el
valor del parámetro (λ > 0) y en
“acum” escribimos el valor uno para
obtener la probabilidad, o un “0”
para obtener el valor de la ordenada
de ( f(x) ) para el valor x dado.
P(X ≤ 2) = 0.18127
Figura 4.2.2
lu_seb@topografia.upm.es
6-IV
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
4.3 Distribución Normal. N ( μ , σ )
La distribución normal es el modelo más utilizado e importante de la teoría estadística
moderna. Existen multitud de experimentos cuyos resultados se ajustan a esta distribución.
4.3.1 Definición. Una variable aleatoria X sigue una distribución normal de parámetros µ y
σ que representamos de forma abreviada por N ( μ, σ ) , si y sólo si, su función de densidad es:
1 ( x −μ )
−
1
f (x) =
e 2
σ 2π
σ
2
2
, con −∞ < x < ∞ ; −∞ < μ < ∞ y σ > 0 .
4.3.2 Propiedades de f(x). Existe una serie de propiedades básicas que debemos conocer
acerca de la función de densidad y de la función de distribución de una variable aleatoria
normal:
• 1. La función de densidad es no negativa ( f ( x ) ≥ 0 ).
∞
• 2. El área encerrada por f(x) y el eje X es la unidad (
∫ f (x)dx = 1 ).
−∞
• 3. La función f(x) tiene la asíntota horizontal y=0 .
• 4. Por ser una función exponencial f (x) es una función continua en − ∞ < x < ∞ .
• 5. Es una función simétrica respecto de la recta x = μ ; ( f ( μ + x ) = f ( μ − x ) .
• 6. Existe un máximo en x = μ = Mo .
• 7. En los valores x = μ ± σ existe un punto de inflexión .
• 8. La media es el propio parámetro μ ;
∞
∞
−
1
E [ x ] = ∫ xf (x)dx =
xe
∫
σ 2π −∞
−∞
(x −μ )2
2 σ2
dx = μ
• 9. La desviación típica es el parámetro σ ;
V[x] =
∞
∫ ( x − μ)
2
f (x)dx = σ 2 , por tanto la desviación típica es σ .
−∞
• 10. De las propiedades 8 y 9 se deduce que la función de densidad de una distribución
normal queda perfectamente determinada conocidos los valores de μ y σ.
• 11. De las propiedades 5 y 6 se deduce que M = μ = Mo .
• 12. La función de distribución de la variable aleatoria X ∈ N(μ, σ) es:
x
−
1
F ( x ) = P(X ≤ x) = ∫
e
−∞ σ 2π
( t −μ )2
2 σ2
dt
manuel.barrero@topografia.upm.es
Universidad Politécnica de Madrid
7-IV
• 13 La forma de la función de densidad puede observarse en la figura (4.3.1).
Figura 4.3.1
• 14. En las siguientes figuras podemos observar cómo cambia la gráfica de la función de
densidad f(x) según los valores de σ y µ.
Normales con igual media y diferente varianza. μ=1 fija y σ=1,2,3.
Normales con diferente media e igual varianza. μ=0,1,2 y σ=1.
Figura 4.3.2
• 15. La combinación lineal de variables aleatorias normales e independientes es una
variable aleatoria normal.
Si X1~ N(μ1 , σ1 ) , X2 ~ N(μ2 , σ2 ) ,…, Xn ~ N(μn , σn ) son independientes, entonces:
(
X= X1 ± X2 ± ... ± Xn ≈ N μ1 ± μ 2 ± ... ± μn ,
lu_seb@topografia.upm.es
8-IV
)
σ12 + σ22 + ... + σn2 .
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
4.3.3 Distribución Normal Estandar. N(0,1). Si X es una variable aleatoria N(μ, σ),
x −μ
es una distribución normal de media μ=0 y
σ
desviación típica σ=1, por tanto, su función de densidad viene dada por:
entonces, la variable aleatoria Z =
1 − 12 z2
f (z) =
e
y −∞ < z <∞.
2π
En efecto,
⎞
⎡x −μ⎤ 1 ⎛
E [ z] = E ⎢
E
x
E
=
−
μ
[
]
[
]
⎜
⎟=0
⎣ σ ⎥⎦ σ ⎝ =μ
=μ ⎠
⎞
1 ⎛
⎡x −μ⎤ 1
V
x
V
+
μ
V [z] = V ⎢
V
x
=
−
μ
=
[
]
[
]
[
]
⎜
⎟ =1.
2
2
σ ⎝ =σ2
⎣ σ ⎥⎦ σ
=0 ⎠
X −μ
resultado de aplicar una traslación y un cambio de escala
σ
a la variable X, se le denomina tipificación de la variable.
Este cambio de variable, Z =
4.3.4 Las funciones de Excel para la distribución normal. Mediante Excel, podemos utilizar
dos formas distintas para obtener la probabilidad de un valor en una variable normal:
• Distribución Normal Estándar: X ≈ N(0,1) .
• Distribución Normal: X ≈ N(μ, σ) .
La diferencia radica en cómo debemos ingresar los datos, y es por ello, por lo que utilizamos
ejemplos aclaratorios.
Ejemplo. Calcular P(Z ≤ 2.5) en una distribución N(0,1).
En este caso al resaltar de la categoría “Estadísticas” la opción “DISTR.NORM.ESTAND”
se despliega una ventana en la que debemos rellenar el valor de la variable z del cual se desea
conocer su probabilidad.
P(X ≤ 2.5)
Figura 4.3.3
manuel.barrero@topografia.upm.es
Universidad Politécnica de Madrid
9-IV
Otra forma de proceder es escribir directamente la función Excel:
=DISTR.NORM.ESTAND(2,5)
P(Z ≤ 2.5) = 0.9937903
Figura 4.3.4
Ejemplo. Calcular P(X ≤ 2.5) en una distribución N(2,3).
En este caso existen dos posibilidades de calcular la probabilidad.
• 1º Tipificamos la variable y procedemos de la forma anterior.
• 2º Directamente con la ventana o función “DISTR.NORM(µ,σ)”.
Veamos la primera forma, en este caso debemos calcular primero el valor tipificado Z:
X −μ
2.5 − 2 ⎞
1⎞
⎛
⎛
Z=
⇒ P ( X ≤ 2.5 ) = P ⎜ Z ≤
⎟ = P⎜Z ≤ ⎟
3 ⎠
6⎠
σ
⎝
⎝
Por tanto
FUNCIÓN
⎛1⎞
F ⎜ ⎟ = 0.56618
⎝6⎠
Figura 4.3.5
Si procedemos directamente utilizando la ventana de diálogo de la función “DISTR:NORM”,
esta ventana nos solicita, el valor de la variable del cual deseamos conocer su probabilidad y
los
parámetros
de
la
distribución, es decir, media
y desviación típica. Además,
P(X ≤ 2.5)
debemos poner un uno en la
casilla “Acum” ya que en
este caso deseamos calcular
la probabilidad acumulada
hasta 2.5.
Figura 4.3.6
En el caso del problema inverso, es decir, hallar el valor de la variable aleatoria (percentil) a
partir de la probabilidad del valor buscado, conocidas la media y la desviación típica, también
podemos elegir entre las dos siguientes alternativas:
lu_seb@topografia.upm.es
10-IV
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
• “ =Distribución Normal Estándar Inversa”; Z ≈ N(0,1) .
• “ =Distribución Normal Inversa”; X ≈ N(μ, σ) .
Como en el caso anterior la diferencia radica en como debemos ingresar los datos.
Ejemplo. En una distribución N(0,1), hallar el valor de x que verifica P(Z ≤ x) = 0.5333 .
FUNCIÓN
F(0.0835)=0.5333
Figura 4.3.7
Ejemplo. En una distribución N(2,3) hallar el valor de x que verifica P(X ≤ x) = 0.5333 .
La función Excel correspondiente en este caso es:
FUNCIÓN
=DISTR.NORM.INV(0,5333; 2; 3)
x=2.25093
es el valor de la variable cuya
probabilidad es 0.5333
Figura 4.3.8
La ventana de dialogo correspondiente a la función DISTR.NORM.INV es:
FUNCIÓN
P(X ≤ x ) = 0.5333
Figura 4.3.9
manuel.barrero@topografia.upm.es
Universidad Politécnica de Madrid
11-IV
4.3.5 Resumen de funciones de EXCEL
Función Excel
Sintaxis.
DISTR.NORM(x; µ;σ;acum)
x: valor de la variable.
acum.= “1” para obtener F( x) = P(X ≤ x) .
DISTR.NORM. X ≈ N(μ, σ)
F(x) = P(X ≤ x)
Acum.= “0” para obtener la ordenada en x.
DISTR.NORM.ESTAND. Z ≈ N(0,1)
F(z) = P(Z ≤ z)
DISTR.NORM.ESTAND(z)
z: valor de la variable normalizada.
DISTR.NORM.INV.
p = P(X ≤ x)
DISTR.NORM.INV(p;µ;σ)
DISTR.NORM.ESTAND.INV.
p = P(Z ≤ z)
DISTR.NORM.ESTAND.INV(p).
Tabla 4.3.1
4.4 Normalidad. Métodos descriptivos
Más adelante, harán inferencias estadísticas acerca de la población a partir de la información
obtenida de una muestra. En la mayoría de las técnicas que estudiarán se supone que la
muestra o muestras han sido obtenidas de una población normal. Por tanto, antes de aplicar
dichas técnicas aprenderemos varios métodos descriptivos para verificar si los datos de la
muestra proceden de una distribución aproximadamente normal.
• 1º Construimos un histograma de frecuencias relativas para los datos. Si los datos son
aproximadamente normales, la gráfica será similar a la de la curva normal y simétrica respecto
de la media.
• 2º Calculamos el intervalo intercuartílico y la desviación típica muestral, S, si los
datos son aproximadamente normales, entonces,
Q 3 − Q1
≈ 1, 3
S
Estas verificaciones de normalidad son fáciles de aplicar y de gran utilidad, pero, sólo son
métodos descriptivos. Es posible aunque poco probable, que los datos no sean normales
aunque se verifiquen las condiciones anteriores. Así pues, con estos métodos sólo podemos
decir que es razonable pensar que los datos provienen de una distribución normal. Existen
métodos analíticos para el estudio de la normalidad y que estudiaran en otras asignaturas.
4.4.1 Ajuste de una distribución experimental con una distribución normal.
Más adelante estudiaran que:
• Si la población es normal, la media muestral es el estimador centrado más eficiente de la
media poblacional
( μ = X ).
lu_seb@topografia.upm.es
12-IV
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
• Si la población es normal, la varianza muestral o cuasivarianza es el estimador centrado
más eficiente de la varianza de la población ( σ 2 = S2 ) .
• De los apartados anteriores se deduce que la distribución normal que mejor se aproxima
es aquella que tiene por media y varianza, X y S2 , respectivamente.
Población
Muestra
N(μ, σ)
(
X,S
N X, S
)
Figura 4.4.1
Ejemplo. De un experimento se ha obtenido la siguiente distribución de frecuencias.
x
0a1
1a2
2a3
3a4
4a5
5a6
6a7
7a8
8a9
9 a 10
ni
1
4
19
91
202
217
95
16
4
1
Si admitimos que se distribuye según una distribución normal, realizar el mejor ajuste para
dicha distribución.
Solución. Podemos observar que el polígono de frecuencias absolutas tiene la forma
acampanada de una distribución normal.
His tograma
250
202
200
150
0
95
91
100
50
217
1
4
19
16
4
1
0 a 1 1 a 2 2 a 3 3 a 4 4 a 5 5 a 6 6 a 7 7 a 8 8 a 9 9 a 10
Figura 4.4.2
Si calculamos la media, la cuasivarianza y los cuartiles obtenemos:
X = 5.01 ;
por tanto
S2 = 1.35 ;
S = 1.16 ;
Q1 = 4.24 ;
Q3 = 5.79 ;
Q 3 − Q1
= 1.34
S
observamos que también se verifica la segunda condición de las dadas para aceptar la
normalidad de la muestra y por tanto la distribución normal que mejor se ajusta es:
N(5.01, 1.16).
manuel.barrero@topografia.upm.es
Universidad Politécnica de Madrid
13-IV
4.5 Distribución χ de Pearson
2
Sean Z1, Z2,….,Zn, n variables aleatorias independientes entre sí, todas ellas con distribuciones
2
N(0, 1). La variable χ n =
n
∑Z
i =1
2
i
es una variable aleatoria que recibe el nombre de chi-
cuadrado con n grados de libertad.
−
Su función de densidad viene dada por f (x) =
x
e 2 ⋅x
n −2
2
n
2
⎛n⎞
2 ⋅Γ ⎜ ⎟
⎝2⎠
siendo 0 < x < ∞ Y n>2 .
Figura 4.5.1
En la figura 4.5.1 notamos cómo cambia la forma de la función de densidad según sea el valor
2
de “n” en la distribución χn .
4.5.1 Propiedades de la distribución Chi-cuadrado de n grados de libertad
1. La distribución χ n sólo depende del parámetro n.
2
2. El dominio de la variable es [0, ∞ ) .
3. Su media, varianza y desviación típica son respectivamente
∞
μ = E [ x ] = ∫ xf (x)dx = n ;
σ2 = V [ x ] =
∞
∫ ( x − μ)
2
f (x)dx = 2n ⇒ σ = 2n .
−∞
0
8
12
, y de curtosis g 2 = .
n
n
Note que, a medida que n aumente, la gráfica de la función de densidad se hará más
4. Son sus coeficientes de asimetría g1 =
(
)
simétrica y menos apuntada y χ 2n ⎯⎯
→ N n,
2n .
5. Si χ n1 y χ n 2 son independientes entonces χn1 + χn 2 es una distribución χ n1 + n 2 .
2
2
2
2
2
Esta propiedad se generaliza para la suma de n variables aleatorias independientes chicuadrado.
lu_seb@topografia.upm.es
14-IV
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
4.5.2 Las funciones de Excel para la Distribución Chi-cuadrado.
χ2n
Debido a que esta distribución es muy usada en estimación y contrastes de hipótesis, lo que
más nos interesa en este curso, es el cálculo de la P(X ≤ x) y del valor x de la variable que
verifica F(x)=α.
Función Excel
Sintaxis
DISTR.CHI
Calcula la probabilidad acumulada a la derecha de un
valor x, en una distribución χ 2n . P(χ 2n ≥ x) = α
DISTR.CHI(x;gl)
x: valor de la variable.
gl: grados de libertad.
PRUEBA.CHI.INV
Devuelve el percentil x que acumula a su derecha
una determinada probabilidad α. P(χ 2n ≥ x) = α
PRUEBA.CHI.INV(α;gl)
α: probabilidad.
gl: nº de grados de libertad.
Observe que las funciones
DISTR.CHI
y
PRUEBA.CHI.INV
proporcionan el área α situada
a la derecha del valor x y el
valor x que deja a su derecha
un área α, respectivamente.
α
x
Figura 4.5.2
2
Ejemplo. Calcular: a) P(χ11
> 4.575) ,
2
2
b) P(4,865 < χ10
< 15.987) , c) P(χ11 < 10.1) ,
2
d) hallar el valor de x tal que P(χ10 < x) = 0.5
Utilizaremos la función “ =DISTR.CHI ” para los apartados a, b y c,
“=PRUEBA.CHI.INV” para el apartado d) para obtener:
y la función
2
P(χ11
> 4.575) = 0.949992
2
P(4.865 < χ10
< 15.987) = 0.800007
2
2
P(χ11
< 10,1) = 1 − P(χ11
> 10,1)
=0.478505
2
2
2
P(χ10
< x) = 0.5 ⇒ 1 − P(χ10
> x) = 0.5 ⇒ P(χ10
> x) = 0.5 ⇒ x = 9.341816
Figura 4.5.3
Universidad Politécnica de Madrid
manuel.barrero@topografia.upm.es
15-IV
Otra alternativa es usar las ventanas de diálogo para las funciones anteriores. Así, para los
apartados a) y d) se obtienen las siguientes ventanas:
Figura 4.5.4
4.6 Distribución t de Student. tn
Sean Z y
χ dos variables aleatorias independientes, la variable Z con distribución N(0,1) y χ
con distribución χ n entonces, la variable aleatoria t n =
2
Z
χ 2n
n
sigue una distribución “t de
student ” con n grados de libertad (abreviadamente t n ).
Su función de densidad es:
⎛ n +1 ⎞
n +1
Γ⎜
⎟
2 −
2 ⎠ ⎛ n + x ⎞ 2 , siendo, n > 1 y −∞ < x < ∞ .
⎝
f (x) =
⋅⎜
⎟
⎛n⎞ ⎝ n ⎠
nπΓ ⎜ ⎟
⎝2⎠
4.6.1 Propiedades básicas de la distribución t_Student. tn
• Su distribución sólo depende del parámetro “n”, llamado grados de libertad.
• El dominio de la variable es ( −∞, ∞ ) .
• Es simétrica respecto del valor x = 0.
• Su media y varianza son:
n
si n > 2 respectivamente.
n−2
5
Son sus coeficientes de asimetría y curtosis g1 = 0 y g 2 =
respectivamente.
n−4
μ = E [ x ] = 0 si n > 1 y σ 2 = V [ x ] =
•
•
Para n grande (n>30), la distribución t_student se aproxima a una distribución N(0,1) .
•
El caso particular de t1 se conoce con el nombre de Distribución de Cauchy.
lu_seb@topografia.upm.es
16-IV
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
4.6.2 Las funciones de Excel para la distribución t_Student. Las funciones que
proporciona Excel para el cálculo de la P(X ≤ x) y del valor x de la variable aleatoria que
x
verifica F(x)=α= ∫ f (t)dt , son las siguientes:
0
Función Excel
Sintaxis
DISTR.T Calcula el valor de P(t n > t)
si elegimos una cola, o el valor de
P( t n ≥ t) si elegimos dos colas.
DISTR.T(t;n;colas)
t: valor de la v. a.
-n el nº de grados de libertad.
DISTR.T.INV Devuelve el valor “t” de
DISTR.T.INV(α;n)
α
α; En esta función siempre es la
la variable, tal que P ( t n > t ) = .
probabilidad acumulada en dos colas.
2
Tabla 4.6.1
Ejemplo
Calcular las probabilidades:
a) P(t 9 ≥ 1.37)
P(t 9 ≥ 1.37) ≈
1 cola
0.101945
Figura 4.6.2
b) P(t 9 ≤ 1.2);
P(t 9 ≤ 1.2) = 1 − P(t 9 ≥ 1.2) ≈
≈ 0.869613
1 cola
Figura 4.6.3
c) P( t11 > 2.5)
P (t
11 > 2 . 5 )
2 colas
0 . 029506
Figura 4.6.4
d) El valor de t, tal que
P(t16 ≥ t) = 0.20
Siempre
2 colas
P ( t16 ≥ t ) = 0.2 ⇒
⇒ t ≈ 0.864667
Figura 4.6.5
manuel.barrero@topografia.upm.es
Universidad Politécnica de Madrid
17-IV
e) El valor de t, tal que P(t10 ≤ t) = 0.9
P(t10 ≤ t) = 0.9 ⇒ P(t10 > t) = 0.1 ⇒ P( t10 > t) = 0.2
P( t10 > t) = 0.2
Por tanto
t ≈ 1.372184
Figura 4.6.6
La ventana de diálogo para la distribución “DISTR.T” y el ejercicio a) será:
P(t 9 ≥ 1.37)
Figura 4.6.7
La ventana de diálogo para la distribución “DISTR.T.INV” y el ejercicio d) será:
P(t16 ≥ t) = 0.20
0.2
Resultado t
0.2
Figura 4.6.8
lu_seb@topografia.upm.es
18-IV
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
IV DISTRIBUCIONES CONTINUAS NOTABLES
4.7 Distribución de Fisher-Snedecor. F(n,m)
Sean X e Y dos variables aleatorias independientes con funciones de distribución χ 2m y χ 2n ,
respectivamente. La variable aleatoria Fm,n =
X
Y
m sigue una distribución de Fisher-Snedecor
n
con m y n grados de libertad.
La función de densidad viene determinada por la función
⎧ ⎛m+n⎞
n
m
⎪ Γ⎜ 2 ⎟
2
2
n
(mx)
⎠
⎪⎪ ⎝
si x > 0
m+n
f (x) = ⎨ ⎛ m ⎞ ⎛ n ⎞
2
x ( mx + n )
Γ
Γ
⎪ ⎜⎝ 2 ⎟⎠ ⎜⎝ 2 ⎟⎠
⎪
0
si x ≤ 0
⎪⎩
4.7.1 Propiedades de la Distribución de Fisher-Snedecor. Algunas de las propiedades
más importantes de la distribución de Fisher-Snedecor son:
• Si X ≈ Fm,n entonces la variable
1
≈ Fn,m .
X
• Si X ≈ t n entonces X 2 ≈ F1,n .
• La media de la distribución F(m, n) es: μ =
m
, siendo m > 2.
(m − 2)
• La varianza de la distribución F(m, n) es: σ2 =
2m 2 (m + n − 2)
, siendo m > 4.
n(m − 4)(m − 2)2
Sintaxis
g1=n; grados de libertad en el numerador.
g2=m; grados de libertad en el denominador.
Función
DISTR.F Conocido el valor de la v. a.
X, devuelve el valor del área α situada
a la derecha de x, es decir:
P(X > x) = α
DISTR.F(x;g1;g2)
x: valor de la variable.
DISTR.F.INV Conocida el área α ,
DISTR.F.INV(p:g1;g2)
halla el valor de la variable que deja a
P: probabilidad que deja a su derecha el valor x.
su derecha un área α ; P(X > x) = α
Tabla 4.7.1
manuel.barrero@topografia.upm.es
Universidad Politécnica de Madrid
19-IV
9.7.2 Las funciones de Excel para la Distribución de Fisher-Snedecor. X ≈ Fn,m .
Al igual que en las distribuciones anteriores estudiaremos el cálculo de la P(X ≤ x) , y el valor
x
x, de la variable aleatoria que verifica F(x)= α = ∫ f (t)dt .
0
Ejemplo. Hallar P ( F4,9 < 2.8 ) .
P ( F4,9 < 2.8 ) = 1 − P ( F4,9 ≥ 2.8 )
Función Excel: =1-DISTR.F(2,8;4;9)
P ( F4,9 < 2.8 ) ≈ 0.908069
Figura 4.7.1
La ventana de diálogo para esta función es:
x = 2.8
n=4
m=9
P ( F4,9 < 2.8 ) = 1 − P ( F4,9 ≥ 2.8 ) =
= 1 − 0.09193 =
= 0.90807
Figura 4.7.2
Ejemplo. Hallar el valor k tal que P(X<k)=0.95, siendo X ≈ F4,9 .
Función Excel: =DISTR.F.INV(0.05;4;9)
P(X < k) = 0.95 ⇒ P ( F > k ) = 0.05 ⇒ F(K) = 0.05
k ≈ 3.633089
Figura 4.7.3
lu_seb@topografia.upm.es
20-IV
Escuela Técnica Superior de Ingenieros en Topografía Geodesia y Cartografía
Descargar