Varianza

Anuncio
ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/
El siguiente material se encuentra en etapa de corrección y no deberá
ser considerado una versión final.
Alejandro D. Zylberberg <alejandro@probabilidad.com.ar>
Versión Actualizada al: 4 de mayo de 2004
Varianza
Vimos que la media o esperanza nos da una idea de qué valor podríamos esperar
que asuma una determinada variable aleatoria, si se lleva a cabo el experimento al
cual está asociada. Es decir, la media es una medida de posición .
Asimismo, vimos que la esperanza no nos proporciona información acerca de si los
valores que puede tomar la variable aleatoria se encuentran cercanos o espaciados.
Por eso utilizaremos otra herramienta matemática denominada varianza. La varianza
es una medida de cuánto tienden los valores de una variable aleatoria a alejarse de la
media de la misma. La varianza es una medida de dispersión .
Dada X una variable aleatoria, si su varianza σX2 existe, vale:
∞
Var ( X ) = σ X = E(( X − E( X )) ) = ∫ ( x − µ X ) 2 f X ( x) dx
2
2
−∞
Vemos que la varianza es la esperanza de los cuadrados de las distancias entre los
valores de la variable y el valor medio de la distribución. Si los valores de X están
muy dispersos, los E(X)-X tenderán a ser más grandes, y la varianza tiende a ser
mayor. Observamos también que como las diferencias están al cuadrado, no
importa si son positivas (X a la derecha de la media) o negativas (X a la izquierda de
la media). O sea que todas "suman".
Operando con la fórmula de arriba se llega a otra fórmula para la varianza, que a
menudo resulta más práctica:
σ X 2 = E( X 2 ) − E( X ) 2
La varianza también presenta la siguiente propiedad:
σ 2 (aX + b) = a 2σ X 2
con a, b ∈ ℜ
Mas adelante en esta misma sección se demuestran las fórmulas y propiedades.
ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/
Comentarios
• La varianza es una medida de cuánto tienden los valores de una variable aleatoria a
alejarse de la media de la misma. Es decir que si la varianza es chica, la distribución
se encuentra concentrada alrededor de la media, y si es grande, se encuentra más
esparcida, más dispersa.
• Como la varianza se define a partir de la media, puede, al igual que esta, no existir.
Ejemplo
Volvamos al ejemplo 5 de la media:
Tenemos la distribución de X e Y, y calculamos sus medias:
0,2
x=3 


x=4 
0,3

PX ( x) = 0,3
x=5 


x=6 
0,2
 0 ∀ otro x 
0,2
x=2 


+∞
x=3 
0,3
 E ( X ) = ∑ x PX ( x) = 3.0,2 + 4.0,3 + 5.0,3 + 6.0,2 = 4,5
PY ( y ) = 0,3
x=6 
−∞

+∞
=7 
0
,
2
x


=
=
+
+
+
=
 0 ∀ otro x  E (Y ) ∑ y PY ( y ) 2.0,2 3.0,3 6.0,3 7.0,2 4,5
−∞
Habíamos observado que las medias de X e Y son iguales, a pesar de que Y está
más dispersa que X:
Veamos qué sucede con las varianzas:
+∞
E ( X 2 ) = ∑ x 2 PX ( x) = 3 2 .0,2 + 4 2 .0,3 + 5 2 .0,3 + 6 2 .0,2 = 21,3
−∞
+∞
E (Y 2 ) = ∑ y 2 PY ( y ) = 2 2 .0,2 + 3 2 .0,3 + 6 2 .0,3 + 7 2 .0,2 = 24,1
−∞
σx 2 = E ( X 2 ) − E ( X ) 2 = 21,3 − 4,5 2 = 1,05
σy 2 = E (Y 2 ) − E (Y ) 2 = 24,1 − 4,5 2 = 3,85
Vemos que la varianza de Y es casi 4 veces mayor que la varianza de X.
Esto refleja que las probabilidades de los valores de Y se encuentan más alejados
ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/
de la media que los de X.
Desvío estándar
El desvío estándar σX de una variable aleatoria X se define como la raíz cuadrada
positiva de su varianza.
σx = σx 2
Unidades
Si X es la longitud de los tornillos fabricados por una máquina, entonces las
unidades de X podrían ser, por ejemplo, cm.
A su vez, como la media o esperanza es el valor esperado de X, tiene la misma
forma que X (sea un valor posible realmente o no). Entonces las unidades de E(X)
deben ser las mismas que las de X, es decir, cm.
σ
2
= E( X 2 ) − E( X )2
La varianza se puede obtener, por ejemplo, X
, donde se ve
2
claramente que las unidades de la varianza son cm .
Y como el desvío estándar se define como la raíz cuadrada de la varianza, entonces
sus unidades vuelven a ser las de X, es decir, cm.
Demostraciones
Comenzaremos por probar que:
∞
σ X = E(( X − E( X )) 2 ) = ∫ ( x − µ X ) 2 f X ( x) dx = E( X 2 ) − E( X ) 2
2
−∞
Partimos de:
σ X 2 = E(( X − E( X )) 2 )
Como dada una distribución, su esperanza es una constante, vamos a escribir, por
claridad, µ X en vez de E(X).
σ X 2 = E(( X − µ X ) 2 )
Notemos que (X - µ X)2 es una función de X. Luego su esperanza vale:
∞
σ X = ∫ ( x − µ X ) 2 f X ( x) dx
2
−∞
Con lo cual llegamos a la segunda fórmula dada. Ahora desarrollemos el cuadrado:
ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/
∞
∫ (x
2
+ µ X 2 − 2xµ X ) f X ( x) dx
−∞
Abrimos la integral en tres:
∞
∫x
∞
2
−∞
∞
f X ( x) dx + ∫ µ X f X ( x) dx − ∫ 2xµ X f X ( x) dx
2
−∞
−∞
Como 2 y µ X son constantes, salen de las integrales:
∞
∫x
2
f X ( x) dx + µ X
∞
2
−∞
∫
−∞
∞
f X ( x) dx − 2µ X ∫ x f X ( x) dx
−∞
El primer término es, por definición de esperanza de una función, E(X 2). En el
segundo término, la integral da uno. La integral del tercer término es por definición
la esperanza de X, es decir, µ X. Queda:
E( X 2 ) + µ X 2 − 2µ X 2
Con lo cual llegamos a la tercera fórmula dada:
σ X 2 = E( X 2 ) − E( X ) 2
Ahora vamos a demostrar la propiedad:
σ 2 (aX + b) = a 2σ X 2
Llamaremos Y = a X + b. Luego por definición de varianza:
σ Y 2 = E (( Y − E (Y )) 2 )
Reemplazando Y por a X + b obtenemos:
2
σ aX
= E (( aX + b − E ( aX + b )) 2 ) = E (( aX + b − aE ( X ) − b ) 2 ) = E (( aX − a µ X ) 2 )
+b
Sacando factor común a, y sacándola del cuadrado y de la esperanza, queda:
2
σ aX
= E ( a 2 ( X − µ X ) 2 ) = a 2 E (( X − µ X ) 2 )
+b
El segundo factor es por definición la varianza de X. Luego, como queríamos
demostrar:
σ 2 ( aX + b ) = a 2 σ
2
X
Puede parecer extraño que la b no aparezca en la varianza de a X + b, pero no lo es.
La constante b no tiene ninguna influencia en la varianza porque es una constante
que aparece sumando, y que a lo sumo puede correr la distribución hacia la
izquierda o hacia la derecha, es decir, cambiar la posición , pero no la dispersión .
Además podemos hacer el comentario de que la varianza de una constante es cero,
porque la varianza es una medida de dispersión, y como una constante es un punto,
no tiene dispersión. Luego su varianza es cero.
Problemas típicos
ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/processtext/
1) Halle varianza y el desvío estándar de X, donde X está distribuida según:
0,4 x = −1 


x =1 
 0,1

PX ( x) = 0,3
x=2 


x=3 
0,2
 0 ∀ otro x 
Resolución:
+∞
E ( X ) = ∑ x PX ( x ) = ( −1). 0,4 + 1.0,1 + 2.0,3 + 3.0,2 = 0,9
−∞
+∞
E ( X 2 ) = ∑ x 2 PX ( x ) = ( −1) 2 .0,4 + 12 .0,1 + 2 2 .0,3 + 3 2 .0,2 = 3,5
−∞
σx = E ( X 2 ) − E ( X ) 2 = 2,69
2
σx = σx 2
=1,64
2) La longitud en cm. de las varillas fabricadas por una máquina es la
variable aleatoria X distribuida según:
x 2
1
fX ( x ) = 
3
0
0 ≤ x ≤ 1

1 ≤ x ≤ 3

∀ otro x 
a) ¿Cuál es la varianza de la longitud media de las varillas?
b) Si a las varillas se las corta a la mitad y se les agrega una punta de 1
cm., ¿Cuál es la varianza de la longitud de las nuevas varillas?
Resolución:
E( X ) =
+∞
∫x f
−∞
a)
E( X ) =
2
+∞
∫x
−∞
2
X
1
3
1
( x) dx = ∫ x x 2 dx + ∫ x dx = 1,583
3
0
1
1
3
0
1
fX ( x) dx = ∫ x 2 x 2 dx + ∫ x 2
1
dx = 3,089
3
σx = E ( X ) − E ( X ) = 0,582
2
b)
2
2
1
  1 2
σ 2 ( aX + b) = a 2σx 2 => σ 2  x + 1 =   σx 2 = 0,145
2
 2
3) Si dos máquinas producen piezas cuyas longitudes son variables aleatorias
de igual media, pero la varianza de la longitud de las piezas fabricadas por la
máquina A es mayor que la varianza de las de B, y es importante que todas
las piezas sean lo más parecidas posibles, ¿cuál máquina decidiría comprar?
ABC Amber Text Converter Trial version, http://www.thebeatlesforever.com/process
Resolución:
Como la varianza es una medida de la tendencia de los valores de la variable a
alejarse de la media, eligiendo la máquina B las piezas fabricadas tenderán a ser de
longitudes más parecidas.
Descargar