LEY DE LOS GRANDES NÚMEROS Desigualdad de Tchebyshev ¿Hasta qué grado la media y la varianza caracterizan la distribución de una variable aleatoria ? Esta desigualdad brinda un medio para entender cómo la varianza mide la variabilidad alrededor de la esperanza matemática de la variable. Dicha desigualdad afirma que: “Si la Esperanza y la varianza de la variable X son finitas, para cualquier número positivo k, la probabilidad de que la variable aleatoria X esté en el intervalo k ; k 1 es mayor o igual que 1- 2 es decir k Es decir : P P k ; x k k 1 1- 2 k 1 1- 2 k ó La probabilidad de que X asuma un valor que está dentro de las k dispersiones de su esperanza, es por lo menos 1 1 2 k k 0 Consideraciones 1) Ya que x Son sucesos complementarios, 2) Si k<1 1 1- 2 k k y x k la P x 1 0 y 2 k k 1 k2 1 Entonces la desigualdad de Tchebyshev es trivial para valores de k < 1, ya que 0< p < 1 3) El significado de esta desigualdad reside en su completa universalidad, ya que puede ser aplicada a cualquier variable aleatoria . En particular es útil , pues proporciona una sencilla demostración de la ley de los grandes números Otra utilidad Si conocemos la distribución de probabilidades de una variable aleatoria discreta o continua, podemos calcular su E(x) y V(x), si existen, pero el recíproco no es cierto, es decir, conociendo E(x) y V(x), no podemos reconstruir la distribución de probabilidades, por lo tanto no podemos calcular la probabilidad de que la diferencia entre la variable aleatoria y su media , en valor absoluto , se mantengan menor que un valor c, pero con esta desigualdad podemos dar una cota superior o inferior. Ejemplo ¿Cuál es la probabilidad que se asocia con valores de x hasta 2 Es decir,¿ Cuál es la P x xi 0 P(xi) 0,05 2 1 2 3 4 0,2 0,4 0,25 0,1 ? ? Solución E( x ) 2,15 5,65 2,15 2 V (x) 1,0275 ( x ) 1,0136 Como conocemos la distribución de X, podemos calcular lo pedido exactamente. P x 2 P x 2,15 P x 2,15 2,0272 P( x 1) P( x 2.1,0136 P 0,1228 2) P( x x 3) P( x 0,2 + 0,4 + 0,25 + 0,1 = 0,95 4,1772 4) Supongamos no conocer la distribución de X, pero conocemos su esperanza y varianza, y aplicamos la desigualdad de Tchebyshev Sólo podemos obtener una cota de la probabilidad P x P x 2,15 2 2.1,0136 1 1 2 k 1 1 2 2 3 4 0,75 Y efectivamente 0,95 > 0,75 Vimos que Cuando el número de repeticiones de un experimento aleatorio aumenta considerablemente, la frecuencia relativa del suceso A converge en sentido probabilístico a la probabilidad teórica. fA P ( A) para n Teoremas conocidos con el nombre de: “leyes de los grandes números” 1)Teorema de Bernoulli lím P fA p 0 0 n En una sucesión de pruebas de Bernoulli, dado un número positivo arbitrario, la probabilidad de que la frecuencia relativa del éxito en n pruebas, difiera de la probabilidad p en una cantidad mayor que , tiende a cero cuando n tiende a infinito. O lim también n P fA p 1 0 Demostración en el pizarrón Otra forma de enunciar el Teorema de Bernoulli En toda sucesión de pruebas de Bernoulli, la frecuencia relativa converge en sentido probabilístico a p. lím P fA p 1 0 lim P fA p 0 0 n n Teorema de Bernoulli generalizado • Dada una sucesión x1 , x2 , x3 ,.............,xn de variables aleatorias, dos a dos independientes, con una misma distribución de probabilidades y con 2 esperanza y varianza se verifica que para todo épsilon >0 lím P x n 1 ó lím P x n 0 • En otras palabras :el límite , en probabilidad, de la media muestral para n tendiendo a infinito , es igual a la esperanza matemática. • Demostración Teorema del límite central ó Teorema central del límite • Enunciado: • “Si S es la suma de un gran número de variables aleatorias idénticamente distribuidas e independientes , cada una de ellas con esperanza y varianza 2 ,entonces la fdp de la variable S n n Es la distribución normal estándar cuando n tiende a infinito • Este teorema también es válido (bajo ciertas condiciones) cuando las variables aleatorias no están idénticamente distribuidas. Esta generalización es válida cuando las variables aleatorias individuales solo hacen una contribución relativamente pequeña a la suma total. n n • En estos casos se reemplaza por i n • Y por i 1 n 2 i 1 i • Luego la fda de S es función de N(0,1) del siguiente modo s PS s0 s0 n 0 n n ó PS s0 i i 1 n 2 i i 1 Observación • Cuando la variable aleatoria es discreta hay que aplicar la corrección de continuidad que consiste en ampliar el intervalo en una unidad , es decir , si • Entonces el intervalo se amplia de la siguiente manera: a a 1 2 X b 1 2 X b Aplicaciones del Teorema Ejemplo 1:Supóngase que una fábrica produce cafeteras eléctricas de las cuales, alrededor del 5% son defectuosas. Si se inspeccionan 100 cafeteras ¿Cuál es la probabilidad de que haya entre 2 y 6 defectuosas? P 2 100 3 x 0,053.0,9597 6 P x 100 4 3 0,05 4.0,9596 P( x 100 5 4) P( x 0,055.0,9595 5) 0,4977 Comparemos el resultado del cálculo directo con el cálculo aproximado, es decir, aplicando el TCL: Aplicamos el TCL Calculamos E(x)=np=100.0,05=5 V(x)= np(1-p)=100.0,05.0,95= 4,75 P 2 x 6 0,6772 0,0838 6 5 2 5 4,75 4,75 0,46 1,38 0,5934 Comparamos con el resultado exacto 0,4977. No es una buena aproximación. Por ser x una variable discreta, calculemos P (3 x 0 5) 0,92 5 5 3 5 4,75 4,75 0,5 0,1788 0,3212 Tampoco es buena aproximación Aplicamos la corrección por continuidad Si a x b a 1 2 x b 1 2 p(x) a a -0.5 b b + 0.5 Corrección por continuidad Para variables discretas, consiste en ampliar el intervalo en una unidad, es decir: Si a P 2,5 x x 0,23 b 5,5 1,15 a 1 2 x b 1 2 5,5 5 2,5 5 4,75 4,75 0,591 0,1251 Es una buena aproximación 0,4659 Ejemplo 2 Una fábrica de productos alimenticios produce carne enlatada, con un peso medio de 250 grs y una varianza de 900 grs cuadrados por lata. Si los pesos de las latas son estadísticamente independientes. Las cajas contienen 60 latas. Se elige una al azar, hallar la probabilidad de que: a) El peso de la caja sea a lo sumo 14,5 kg. b) El peso de la caja sea al menos 15,3 kg. xi : es el peso de cada lata C: es el peso de la caja E ( xi ) 250grs. V ( xi ) 60 C 60 xi E C E 60 xi i 1 E ( xi ) i 1 60 V C V 60.250 15.000grs 15kg. i 1 60 xi i 1 (C ) 302 grs 60.900 V ( xi ) 60.900 54.000grs 2 i 1 60.30 232,38grs 0,23238kg Observaciones • El n que se requiere para aplicar el TCL en gran parte depende de la forma de la distribución de la var. aleatoria individuales que se suman • Si los sumandos están distribuidos normalmente entonces al aplicar el TCL da probabilidades exactas (no importa el n) • Si no se sabe nada de cómo están distribuidos los sumandos entonces el n e mayor o igual que 25 para obtener buenas aproximaciones. • Si las variables aleatorias se distribuyen binomialmente n > 10 si p es aproximadamente 0,5 Si p es aproximadamente 0 o p aproximadamente 1 n debe ser bastante mayor