REPÚBLICA BOLIVARIANA DE VENEZUELA UNIVERSIDAD EXPERIMENTAL POLITÉCNICA DE LA FUERZA ARMADA NACIONAL (UNEFA) Probabilidades y Estadística Ing° Luis Castellanos MSc UNEFA. Probabilidades y Estadística. ii Índice 1 INTRODUCCIÓN A LA ESTADÍSTICA.......................................................................................................1 1.1 1.2 1.3 1.4 1.5 1.6 1.7 1.8 1.9 1.10 1.11 1.12 1.13 2 TEOREMAS DE PROBABILIDADES. ......................................................................................................10 2.1 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3 DEFINICIONES VARIAS. ..........................................................................................................................26 PROPIEDADES O LEYES DE LA ESPERANZA MATEMÁTICA.........................................................................27 VARIANZA DE UNA VARIABLE ALEATORIA.................................................................................................27 TEOREMA DE CHEBYSHEV. ....................................................................................................................28 EJERCICIOS. .........................................................................................................................................29 DISTRIBUCIONES DE PROBABILIDAD..................................................................................................31 5.1 5.2 5.3 5.4 6 DEFINICIONES VARIAS............................................................................................................................21 FUNCIÓN DE DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE ALEATORIA DISCRETA. ..........................22 DISTRIBUCIÓN ACUMULATIVA DE UNA VARIABLE ALEATORIA DISCRETA ....................................................22 FUNCIÓN O DISTRIBUCIÓN DE PROBABILIDAD DE UNA VARIABLE...............................................................23 DISTRIBUCIÓN ACUMULATIVA DE UNA VARIABLE ALEATORIA CONTINUA....................................................24 EJERCICIOS. .........................................................................................................................................24 ESPERANZA MATEMÁTICA....................................................................................................................26 4.1 4.2 4.3 4.4 4.5 5 DEFINICIONES. ......................................................................................................................................10 PRINCIPIO DE ENUMERACIÓN O CONTEO. ...............................................................................................12 PRINCIPIO DE ADICIÓN ...........................................................................................................................13 PROBABILIDAD DE UN EVENTO ...............................................................................................................15 TEOREMA DE PROBABILIDAD COMPLETA (TEOREMA ADITIVO):.................................................................16 TEOREMA DE PROBABILIDAD COMPUESTA (TEOREMA DE MULTIPLICACIÓN)..............................................16 PROBABILIDAD CONDICIONAL .................................................................................................................17 TEOREMA DE BAYES ..............................................................................................................................18 EJERCICIOS ..........................................................................................................................................19 VARIABLE ALEATORIA Y FUNCIÓN DE PROBABILIDADES. .............................................................21 3.1 3.2 3.3 3.4 3.5 3.6 4 DEFINICIÓN DE ESTADÍSTICA. ...................................................................................................................1 DIVISIÓN DE MÉTODOS ESTADÍSTICOS......................................................................................................1 MEDIDAS USADAS EN LA ESTADÍSTICA DESCRIPTIVA ..................................................................................1 MEDIDAS USADAS EN ESTADÍSTICA INDUCTIVA: .........................................................................................2 MEDIDAS USADAS EN MÉTODOS COMPLEJOS ............................................................................................2 PASOS PARA SEGUIR EN UN MÉTODO ESTADÍSTICO ...................................................................................2 MÉTODOS DE RECOLECCIÓN DE DATOS ...................................................................................................2 POBLACIÓN Y MUESTRA ...........................................................................................................................2 DISTRIBUCIÓN DE FRECUENCIAS ..............................................................................................................3 GRÁFICAS DE FRECUENCIAS ....................................................................................................................5 ESTADÍSTICOS IMPORTANTES ...................................................................................................................6 RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODO EN UN POLÍGONO DE FRECUENCIAS ...................................8 EJERCICIOS ............................................................................................................................................9 DISTRIBUCIÓN BINOMIAL........................................................................................................................31 DISTRIBUCIÓN DE POISSON ....................................................................................................................32 DISTRIBUCIÓN NORMAL .........................................................................................................................33 EJERCICIOS ..........................................................................................................................................35 DISTRIBUCIÓN EN EL MUESTREO ........................................................................................................38 6.1 6.2 6.3 6.4 TEORÍA DEL MUESTREO .........................................................................................................................38 DISTRIBUCIÓN MUESTRAL DE MEDIA ARITMÉTICA....................................................................................42 DISTRIBUCIÓN MUESTRAL DE MEDIA ARITMÉTICA CON DOS MUESTRAS ...................................................42 DISTRIBUCIÓN MUESTRAL χ2 / CHI 2 / JI 2 ................................................................................................43 Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 6.5 6.6 6.7 7 iii DISTRIBUCIÓN “T” DE STUDENT ..............................................................................................................43 DISTRIBUCIÓN F (DE FISCHER)...............................................................................................................45 EJERCICIOS ..........................................................................................................................................46 TEORÍA DE LA ESTIMACIÓN ..................................................................................................................47 7.1 7.2 7.3 7.4 7.5 7.6 7.7 7.8 7.9 7.10 8 GENERALIDADES. ..................................................................................................................................47 ESTIMACIÓN PUNTUAL O LOCAL .............................................................................................................47 ESTIMACIÓN POR INTERVALOS ...............................................................................................................48 ERROR MUESTRAL ................................................................................................................................48 ESTIMACIÓN DE LA MEDIA ......................................................................................................................49 ¿CÓMO SE CALCULA EL TAMAÑO DE UNA MUESTRA?...............................................................................50 LÍMITE DE TOLERANCIA ..........................................................................................................................51 DISTINCIÓN ENTRE LÍMITES DE CONFIANZA Y LÍMITES DE TOLERANCIA .....................................................52 ESTIMACIÓN DE LA VARIANZA .................................................................................................................52 EJERCICIOS ..........................................................................................................................................52 ENSAYOS DE HIPÓTESIS Y SIGNIFICACIÓN........................................................................................54 8.1 8.2 8.3 8.4 8.5 9 HIPÓTESIS ESTADÍSTICA ........................................................................................................................54 HIPÓTESIS NULA (H0) ............................................................................................................................54 PRUEBA DE HIPÓTESIS ESTADÍSTICA ......................................................................................................54 PRUEBA DE MEDIAS Y VARIANZAS ..........................................................................................................57 EJERCICIOS ..........................................................................................................................................59 ANÁLISIS DE CORRELACIÓN Y REGRESIÓN ......................................................................................61 9.1 9.2 9.3 ANÁLISIS DE REGRESIÓN PARA DOS VARIABLES.......................................................................................61 ANÁLISIS DE CORRELACIÓN PARA DOS VARIABLES ...................................................................................64 EJERCICIOS ..........................................................................................................................................66 10 BIBLIOGRAFÍA......................................................................................................................................68 11 ANEXOS.................................................................................................................................................69 11.1 11.2 11.3 11.4 11.5 ÁREAS BAJO LA CURVA NORMAL ............................................................................................................69 VALORES CRÍTICOS DE LA DISTRIBUCIÓN Χ2............................................................................................70 VALORES CRÍTICOS DE LA DISTRIBUCIÓN T .............................................................................................71 SUMAS DE DISTRIBUCIÓN BINOMIAL .......................................................................................................72 FACTORES DE TOLERANCIA PARA DISTRIBUCIONES NORMALES ...............................................................73 luiscastellanos@yahoo.com Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 1 1 Introducción a la Estadística 1.1 Definición de Estadística. • Técnica especial apta para el estudio cuantitativo de los fenómenos de masa o colectivos, cuya medición requiere una masa de observaciones de otros fenómenos (Conrado Gini) • Ciencia que trata de la recolección, clasificación y presentación de los hechos sujetos a una apreciación numérica como base a la explicación, descripción y comparación de un fenómeno (G. Vany Yule) • Basa sus leyes, no en el estudio de una observación aislada o individual, sino en el estudio de un gran número de observaciones. • Dato Estadístico: aquel que mide un fenómeno colectivo (Tasa de Mortalidad de Venezuela en últimos 10 años, Producción de Petróleo en Venezuela durante los últimos 5 años, etc.). 1.2 División de Métodos Estadísticos. • Métodos Descriptivos (o Estadística Descriptiva): resumen o condensan todos los datos de una serie de valores para describir determinados aspectos de la serie. • Métodos Inductivos (o Estadística Inferencial): tratan de estimar las características del universo estadístico o población total a través del estudio de una parte de ese universo. • Métodos Simples: se refieren al estudio de una sola característica o variable. • Métodos Complejos: se refieren al estudio de dos o más características o variables, determinando la relación entre ellas. 1.3 Medidas usadas en la Estadística Descriptiva • Razones, tasas y porcentajes • Distribución de frecuencias • Medidas de Tendencia Central (Media, Mediana, Modo) Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 1.4 1.5 1.6 1.7 1.8 • Medidas de Dispersión (Desviación cuartel, quintil, decil, percentil) • Momentos, Asimetría, Kurtosis 2 Medidas usadas en Estadística Inductiva: • Probabilidades • Distribuciones • Pruebas de Significación Medidas usadas en Métodos Complejos • Dispersión • Correlación • Regresión Pasos para seguir en un Método Estadístico • Formulación del Problema • Desarrollo del Método de Recolección de Datos • Recolección de Datos • Clasificación de Datos • Análisis Estadístico • Presentación de Resultados • Interpretación de los Resultados Métodos de Recolección de Datos • Entrevista Personal • Cuestionario • Observación Directa • Experimentos Estadísticos Población y Muestra • Población: conjunto de individuos, objetos o cosas que se van a analizar. Es el Universo Estadístico. Es el TODO. Puede ser: Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 3 o Finita: se pueden contar todos sus elementos o Infinita: el número de elementos es ilimitado. • Muestra: parte representativa de la población. Puede ser: o Probabilística: sus elementos tienen una probabilidad conocida y no nula de ser seleccionados usando un método de selección aleatorio. o No Probabilística: sus elementos son escogidos de acuerdo al criterio del investigador y no al azar. • Estudio Poblacional: análisis deductivo. Lo que es válido para el todo, es válido para uno. • Estudio Muestral: análisis deductivo. Lo que es válido para uno, podría ser válido para el todo. 1.9 Distribución de Frecuencias • Componentes: o Intervalo Total (o Rango): diferencia entre Límite Superior y el Límite Inferior. (IT) o Clases: fraccionamiento de la amplitud total o Rango. o Intervalo de Clase: diferencia entre los Límites Inferior y Superior de una Clase. (IC) o Punto Medio del Intervalo de Clase. (xi) o Frecuencia de Clase: número de casos en que la variable está comprendida entre los límites de una clase. (fi) • Organización: o Determinar el Intervalo Total • IT = LS - LI o Determinar el número de Clases (se recomiendan entre 3 y 25) o Determinar el Intervalo de Clase IC = IT N º Clases IC = IT 1 + 3,322 x log n (Ecuación de Sturges) Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 4 o Determinar Límites de Clase, de acuerdo a los IC definidos. Series Discretas Series Continuas 10 – 19 10 – 19,99 20 – 29 20 – 29,99 30 – 39 30 – 39,99 o Determinar las frecuencias: registrar el número de datos u ocurrencias en cada clase. • Ejemplo: o Agrupar en Distribución de Frecuencias las notas obtenidas por la Sección J en Matemática II: • 16, 8, 6, 10, 12, 10, 10, 10, 11, 7, 10, 8, 14, 10, 11, 11, 8, 17, 8, 6, 10, 2, 10. Se recomienda primero ordenar los datos: 2, 6, 6, 7, 8, 8, 8, 8, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 12, 14, 16, 17. n=3 IT = LS - LI Æ IT = 17 – 2 Æ IT = 15 IC = IT 15 → IC = → I C = 2,72 → I C = 3 1 + 3,322 x log n 1 + 3,322 x log 23 Sin embargo, se recomienda tomar IC = 4, para que se incluya en el Límite Inferior de la primera clase, el número menor, y en el Límite Superior de la última clase, el número mayor. Frecuencia Clases Punto Medio Frecuencia 2–5 3,5 1 1 6–9 7,5 7 8 10 – 13 11,5 12 20 14 – 17 15,5 3 23 Ing° Luis Castellanos (Versión 1.20) Acumulada UNEFA. Probabilidades y Estadística. 5 1.10 Gráficas de Frecuencias • Polígono de Frecuencias: diagrama de líneas que representa los puntos medios y sus respectivas frecuencias de una distribución. Frecuencias Polìgono de Frecuencias 15 10 5 0 2-5 6-9 10 - 13 14 - 17 Clases • Histograma de Frecuencias: serie de rectángulos paralelos, cuya base representa el Intervalo de Clase y su altura la magnitud de la frecuencia de la clase respectiva. Histograma de Frecuencias Frecuencias 15 10 5 0 2-5 6-9 10 - 13 14 - 17 Clases • Histograma de Frecuencias Acumuladas: serie de rectángulos paralelos, cuya base representa el Intervalo de Clase y su altura la magnitud de la frecuencia acumulada. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 6 Histograma de Frecuencias Acumuladas Frecuencias 30 20 10 0 2-5 6-9 10 - 13 14 - 17 Clases 1.11 Estadísticos Importantes • Estadístico: Medida que se calcula para describir la característica de una sola muestra (, s, s2, p). • Media Aritmética: n x = ∑ f i .x i=1 n ∑ i=1 • i f i Media Geométrica: n ∑ f i . log x i G = 10 • i =1 n Desviación Estándar: ∑ (x n s = i =1 i − x ) 2 n A mayor desviación, mayor dispersión. En una Distribución Normal (ver Unidad correspondiente), el porcentaje de los datos muestrales se agrupan de acuerdo a la siguiente proporción: o ± s Æ 68,27% (Zona Normal) o ± 2 s Æ 95,45% o ± 3 s Æ 99,73% Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 7 • Varianza (s2) • Moda: valor que más se repite o más típico. Mo= Li + • f sig f ant + f sig Ic Mediana: valor que divide una distribución de tal manera que quede a cada lado un número igual de términos. n ∑f i=1 i Md = Li + 2 • − f ant Ic fi Ejemplo: o Añadimos unas columnas a la tabla del Ejercicio del Ejemplo anterior, para facilitar los cálculos. Clases xi fi facum fi xi fi log xi (xi - )2 2–5 3,5 1 1 3,50 0,54 48,39 6–9 7,5 7 8 52,50 6,13 8,74 10 – 13 11,5 12 20 138,00 12,73 1,09 14 – 17 15,5 3 23 46,50 3,57 25,44 240,50 22,97 83,66 Totales 23 n o x = ∑ f i .x i i =1 n ∑ i=1 → x = fi 240 , 50 → x = 10 , 4565 23 n ∑ f i . log x i o G = 10 i =1 ∑ (x n o s = i =1 → G = 10 n i n − x ) 22 , 97 23 → G = 9 , 9689 2 → s = 83 , 66 23 o s2 = ( 1,9072) 2 Æ s2 = 3,6374 Ing° Luis Castellanos (Versión 1.20) → s = 1 , 9072 UNEFA. Probabilidades y Estadística. o Mo= Li + 8 f sig f ant + f sig Ic → Mo= 10+ 3 4 → Mo= 11,20 7 +3 n ∑f i=1 o Md = Li + 2 i − f ant fi 23 −7 2 Ic → Md = 10+ 4 → Md = 11,50 12 1.12 Relación entre la Media, Mediana y Modo en un Polígono de Frecuencias • Curva Simétrica: = Md = Mo • Curva Asimétrica Positiva: Mo < Md < • Curva Asimétrica Negativa: < Md < Mo Simétrica Asimétrica Positiva Asimétrica Negativa Aparte, pueden variar, de acuerdo a su Kurtosis: Leptokùrtica Mesokùrtica Ing° Luis Castellanos (Versión 1.20) Platikùrtica UNEFA. Probabilidades y Estadística. 9 1.13 Ejercicios • Sean las medidas de peso de un grupo de personas: 56, 55, 40, 47, 73, 75, 81, 60, 65, 53, 52, 43, 56, 69, 67, 55, 52, 43, 52, 56, 69, 56. Con los datos agrupados halle: Media, Media Geométrica, Mediana, Modo, Desviación Estándar, Varianza Grafique Polígono de Frecuencias, Histograma de Frecuencias e Histograma de Frecuencias Acumuladas Determine si la gráfica es Simétrica o Asimétrica (Positiva o Negativa) Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 10 2 Teoremas de Probabilidades. 2.1 Definiciones. • Tipos de Modelos: o Determinísticos (Ej. v = d ) t o Probabilísticos (Ej. Lanzamiento de dados) • Experimento Aleatorio: registra los resultados al azar, que ocurren en un estudio planificado o en una investigación científica. Ej.: lanzar una moneda. • Datos Iniciales: información registrada en la forma en que se recoge, ya sean cuentas o mediciones. Ej.: cara, sello, cara, cara. • Cualquier recolección de información debe tener un propósito específico y ser seguido por acciones. • Sugerencias para la Recolección de Datos: o Registrar claramente el origen de los datos o Registrar para usar los datos fácilmente o Si se van a registrar datos de manera continua, se pueden preparar y usar formatos para ello • Métodos de Recolección de Datos: o Entrevistas o Cuestionarios o Observación Directa o Experimentos Estadísticos • Conjunto: agrupación de elementos que comparten una propiedad común. • Espacio Muestral: conjunto de todos los resultados posibles de un experimento aleatorio (s). o Cada resultado se llama elemento, o miembro del Espacio Muestral, o Punto Muestral. o El Espacio Muestral puede ser Finito o Infinito. • Ejemplo: o Sea el lanzamiento de una moneda Æ Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 11 s = { cara, sello } o Ciudades con más de 1 millón de Habitantes Æ s = { x / x es ciudad con Población > 1.000.000 } o Puntos (x,y) dentro de un círculo de radio 2 y centro en el origen Æ • s = { (x,y) / x2 + y2 ≤ 4 } Ejercicios: o Halle el Espacio Muestral al tirar un Dado. o Halle el Espacio Muestral al seleccionar 3 piezas al azar en un proceso de producción. Cada pieza se inspecciona y clasifica como Defectuosa (D) o No Defectuosa (N). • Suceso o Evento: cualquier subconjunto del Espacio Muestral (A). o Ejemplo: Determine el evento al lanzar el dado y observar números pares que salen. • A = { 2, 4, 6 } Evento Simple: contiene sólo un elemento del Espacio Muestral. o Ejemplo: A = { t / t < 5 } del S = { t / t ≥ 0 } o (Donde t es la vida en años de un componente electrónico. A es el evento de que falle antes del 5to año). • Conjunto Vacío: subconjunto del Espacio Muestral que no contiene elementos (Ø). • Evento Compuesto: proviene de la unión de dos o más eventos simples. o Ejemplo. Tomemos el evento de sacar corazón de un Mazo de Cartas. • A = { corazón } del S = { corazón, pica, trébol, diamante } Ahora tomemos el evento de sacar una carta roja del mismo mazo: • • B = { corazón, diamante } (B = { corazón o diamante }) Eventos Mutuamente Excluyentes o Exclusivos: cuando su intersección es Conjunto Vacío. o Sean A = { 2, 4, 6 }; B = { 1, 3, 5 }; C = { 1, 2 } A ∩ C = { 2 } ; B ∩ C = { 1 }; A ∩ B = Ø Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 12 Repaso: o Intersección (∩): evento que contiene todos los elementos comunes a A y a B (A ∩ B). o Unión (U): evento que contiene todos los elementos que pertenecen a A, a B, o a ambos. (A U B). • Complemento de un Evento A con respecto a S: es el conjunto de todos los elementos de S que no están en A (A’). o Ejemplo. Sea Q el evento de que una persona seleccionada al azar en un salón de clases fume. Entonces Q’ es el evento de que la persona No Fume. 2.2 Principio de Enumeración o Conteo. • Si una operación se puede efectuar en n1 formas, y si para cada una de ellas se puede efectuar una segunda operación en n2 formas, y si para cada una de las dos primeras se puede efectuar una tercera operación en n3 formas, y así sucesivamente, entonces la secuencia de k operaciones se podrá realizar n3 en n1.n2.n3. … nk formas. n2 n1 o Ejemplo: ¿Cuántos almuerzos que contengan Sopa, Seco, Postre y Jugo, se pueden preparar si se puede escoger entre cuatro (04) sopas, tres (03) secos, cinco (05) postres y cuatro (04) jugos? k = 4.3.5.4. Æ k = 240 almuerzos Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 2.3 13 Principio de Adición • T = n1 + n2 n1 n2 • Frecuentemente nos interesamos en un Espacio Muestral que contenga como elementos a todos los órdenes o arreglos posibles de un grupo de objetos. o Permutaciones Æ importa el orden o Combinaciones Æ no importa el orden • Permutaciones de n elementos: o • n! ( n − r )! n P c = ( n − 1)! Permutaciones de n elementos en k clases: o • n Pr = Permutaciones en forma circular: o • P n = n! Permutaciones de n elementos tomados r a la vez: o • n n Pk = n! n1! n2 ! n3!...nk ! Combinaciones de n elementos tomados r a la vez: o nC r= n! r!( n − r )! Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 14 Ejemplos: o Consideremos las letras a, b, c. ¿Cuántos objetos distintos se pueden obtener si las agrupamos en 3 letras? P 3 = 3!→ 3 P 3 = 3.2.1→ 3 P 3 = 6 3 S = { abc, acb, bca, cab, bac, cba } o Consideremos las letras a, b, c, d. ¿Cuántos objetos distintos se pueden obtener, si las agrupamos en 2 letras? 4 P2= 4! 4.3.2! →4 P2= → 4 P 2 = 12 ( 4 − 2)! 2! o Consideremos a cuatro (4) jugadores de cartas. ¿Cuántas formas distintas de ubicar a los jugadores se pueden obtener? 4 P c = ( 4 − 1)!→ 4 P c = 3!→ 4 P c = 3.2.1→ 4 P c = 6 o ¿En cuántas formas diferentes pueden arreglarse 3 bombillos rojos, 4 bombillos amarillos y 2 bombillos azules en una extensión navideña de 9 bombillos? 9 Pk = 9! → 9 P k = 1.260 3!4!2! o ¿De cuántas formas se pueden alojar 7 ingenieros en un cuarto triple y en dos cuartos dobles de un Hotel? 7 Pk = 7! → 7 P k = 210 3!2!2! o Consideremos a 8 alumnos. ¿Cuántos comités de 3 alumnos se pueden formar? 8 C 3= 8! → 8 C 3 = 56 3!(8 − 3)! o ¿De cuántas formas puede salir el billete ganador de un Kino? Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 2.4 15 25 C15 = 25! → 25 C 15 = 3.268 .760 15!( 25 − 15)! Probabilidad de un Evento • La Probabilidad de cualquier evento A es la suma de los pesos de todos los puntos muestrales en A, con valor entre 0 y 1. o 0 ≤ p(A) ≤ 1 • Un peso cercano a 0 indica que el evento tiene poca posibilidad de ocurrir, y un peso cercano a 1 indica que tiene mucha posibilidad de ocurrir. • Otra definición de Probabilidad: número que se le asigna a un evento que determinará las veces que el mismo puede ocurrir. • P( A) = n N • P ( A) = A S • Si un evento puede ocurrir de a maneras, y deja de ocurrir de b maneras, siendo todos los casos posibles, P ( A) = a a+b • p + q = 1 (probabilidad de ocurrencia + probabilidad de no ocurrencia) • Ejemplo: o Probabilidad que al lanzar un dado salga un “2”. S = { 1, 2, 3, 4, 5, 6 } ; A = { 2 } 1 5 p(2) = ; q(2) = 6 6 o Probabilidad que al lanzar dos monedas salga una cara. S = { cc, cs, ss, sc } ; A = { cs, sc } p( A) = 2 1 ; p( A) = 4 2 o Si se sacan tres (3) cartas de un mazo de barajas españolas, ¿cuál es la probabilidad que éstas sean as, dos y tres? Primero se halla el número de maneras que pueden salir 3 cartas de 40: Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 16 40! → 40 C 3 = 9.880 3!( 40 − 3)! 40 C 3 = S = { 9.880 maneras } ; A = { 4 ases, 4 dos, 4 tres } p( A) = 4.4.4 ; p( A) = 0,0065 9.880 o Si se saca una carta de un mazo de barajas, ¿cuál es la probabilidad que la carta sea diamante? 2.5 S = { 52 } ; A = { 13 } p( A) = 13 ; p( A) = 0,25 52 Teorema de Probabilidad Completa (Teorema Aditivo): • En dos eventos mutuamente excluyentes A y B, A tiene p1 probabilidades de ocurrir, y B tiene p2 probabilidades de ocurrir. La probabilidad de ocurrir A o B es igual a p1 + p2. o P(A U B) = P(A) + P(B) o P(A+B) = P(A) + P(B) • Ejemplo: Si tenemos en una caja 12 bolas blancas, 10 bolas azules y 8 bolas rojas, ¿cuál es la probabilidad de que al sacar una bola, ésta sea blanca o roja? 2.6 12 8 ; P (r ) = 30 30 o P(b) = o P(b + r ) = 12 8 20 + → P(b + r ) = → P(b + r ) = 0,66 30 30 30 Teorema de Probabilidad Compuesta (Teorema de Multiplicación) • Si un evento A tiene p1 probabilidades de ocurrir y otro evento B tiene p2 probabilidades de ocurrir, simultáneamente o después de A, entonces la probabilidad de ocurrir A y B es igual a p1. p2. o P(A ∩ B) = P(A). P(B) o P(AB) = P(A). P(B) Eventos Independientes Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 17 o P(AB) = P(A).P(B/A) Probabilidad Condicional Eventos Independientes o P(BA) = P(B).P(A/B) • Eventos Independientes: ocurre un evento sin importar el resultado del evento anterior. • Eventos Dependientes: la probabilidad de ocurrencia de un evento depende de la ocurrencia del evento anterior. • Ejemplo: o Si tenemos en una caja 12 bolas blancas, 10 bolas azules, y 8 bolas rojas, ¿cuál es la probabilidad de que al realizar dos extracciones de la caja, la primera sea blanca y la segunda roja? 2.7 12 8 ; P(r ) = 30 30 − 1 o P(b) = o P (br ) = 12 8 . → P(br ) = 0,1103 30 29 Probabilidad Condicional • Es la probabilidad de que ocurra un evento B cuando se conoce que ha ocurrido un evento A. P(B/A). o • P ( B / A) = P( A ∩ B ) P( AB) = P( A) P( A) Probabilidad Condicional Eventos Dependientes Ejemplo: o Sea la probabilidad de que aumenten las ventas de carros el próximo mes p(A) = 0,40. Sea la probabilidad de que aumenten las ventas de repuestos el próximo mes p(R) = 0,50. Sea p(AR) = 0,10. Calcule la probabilidad que aumente “A” dado que aumentará “R”, y la probabilidad que aumente “R” dado que aumentó “A”. P( A / R) = P( RA) → P( R) P( A / R) = 0,10 → 0,50 P ( A / R) = 0,20 Ing° Luis Castellanos (Versión 1.20) P ( R / A) = P( AR) → P( A) P ( R / A) = 0,10 → 0,40 P ( A / R) = 0,25 UNEFA. Probabilidades y Estadística. 2.8 18 Teorema de Bayes • Se emplea para conocer las probabilidades de causas que hayan actuado sobre sucesos ya constatados. • Enunciado: si un suceso puede ser originado por varias causas, las cuales a priori son igualmente probables, la probabilidad de que el suceso sea debido a una determinada causa es igual a la probabilidad compuesta correspondiente a dicha causa, dividida entre la suma de las probabilidad compuestas, según las cuales el suceso pudiere derivarse de todas y cada una de ellas. o P( Ak / B) = P( Ak ).P( B / Ak ) n ∑ P( A )P( B / A ) i =1 o P( Bk / A) = i P( Bk ).P( A / Bk ) n ∑ P( B )P( A / B ) i =1 • i i i Ejemplo: o Se tienen 3 cajas: A1 Æ 5 bolas blancas + 2 bolas negras A2 Æ 6 bolas blancas + 5 bolas negras A3 Æ 8 bolas blancas + 3 bolas negras o Se saca una bola blanca. ¿Cuál es la probabilidad de que sea de la primera caja? 1 = 0,3333 3 p( A1 ) = p ( A2 ) = p( A3 ) = P( A1 / B) = 1 5 . 55 3 7 P( A1 / B) = → P( A1 / B) = → P( A1 / B) = 0,3595 1 5 1 6 1 8 153 . + . + . 3 7 3 11 3 11 P( A1 ).P( B / A1 ) P( A1 ) P( B / A1 ) + P( A2 ) P( B / A2 ) + P( A3 ) P( B / A3 ) Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 2.9 19 Ejercicios • Encuentre la Probabilidad de que en el lanzamiento sencillo de un dado, resulte un número menor a 4. • Las probabilidades de que un marido y su esposa estén vivos durante 20 años a partir de ahora está dada por 0.8 y 0.9 respectivamente. Encuentre la posibilidad de que en 20 años: o Ambos estén vivos o Ninguno esté vivo o Al menos uno de ellos esté vivo • Se saca al azar una carta de un mazo de 52 cartas. Encuentre la probabilidad de que la carta sea: o J de Corazones (J♥) o 3 de Trébol (3♣) ó 6 de Diamantes (6♦) o Un Corazón (♥) o Cualquier carta que no sea Corazón. o Ni 4 ni Trébol (♣) • Se saca al azar una bola de una caja que contiene 6 bolas rojas, 4 blancas y 5 azules. Determine la probabilidad de que la bola sea: o Roja o Blanca o Azul o No Roja o Roja o Blanca • Un dado balanceado se lanza dos (2) veces. Encuentre la probabilidad de obtener 4, 5 ó 6 en el primer lanzamiento, y 1, 2, 3 ó 4 en el segundo lanzamiento. • Determine la Probabilidad de obtener 3 “seis” al lanzar 5 veces un dado balanceado • Se sacan 2 cartas de un mazo de 52 cartas. Encuentre la probabilidad de que ambas cartas sean Ases. o Con reemplazo Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 20 o Sin reemplazo • Sea un mazo de 52 cartas, y un jugador de “Blackjack” desea saber la probabilidad de tener “Blackjack”: o Con 2 cartas o Con 3 cartas o Con 4 cartas • ¿De cuántas maneras se pueden ordenar 5 personas en una rueda de reconocimiento de testigos? • ¿De cuántas maneras se pueden sentar 10 personas en una banca, si sólo hay 4 puestos disponibles? • ¿De cuántas maneras posibles se pueden sentar 7 personas alrededor de una mesa redonda, si o Se pueden sentar en cualquier lugar? o 2 personas en particular no se pueden sentar juntas? • ¿De cuántas maneras se puede formar un comité de 5 personas a partir de un grupo de 9? • Se va a formar un comité de 2 matemáticos y 3 físicos a partir de 5 matemáticos y 7 físicos. ¿De cuántas maneras se puede hacer si o Se puede incluir cualquier matemáticos y cualquier físico? o Un físico en particular debe estar en el comité? o Dos matemáticos en particular no pueden pertenecer al comité? • Empleando Teorema de Bayes: o La Caja 1 tiene 3 metras rojas y 2 metras azules. La Caja 2 tiene 2 metras rojas y 8 metras azules. Se lanza una moneda balanceada. Si se obtiene cara, se saca una metra de la Caja 1. Si se obtiene sello, se saca una metra de la Caja 2. o Si no se revela si se obtiene Cara o Sello, pero se dice que se sacó una metra roja, ¿Cuál es la probabilidad de que la metra haya sido sacada de la Caja1? Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 21 3 Variable Aleatoria y Función de Probabilidades. 3.1 Definiciones varias. • Variable: cualquier característica de cada elemento de una población o muestra. • Algunas Clasificaciones: o Variables Cualitativas: miden cualidades (género, etc.) o Variables Cuantitativas: se miden a través de cantidades cuantificables (estatura, peso, etc.) o Variables dependientes: aquella cuyo resultado es afectado por el efecto producido por otra variable o Variables Independientes: aquella cuyo valor no depende de otra variable. • Variable Aleatoria: es la función cuyo valor es un número real determinado por cada elemento en el Espacio Muestral. Se usa letra mayúscula para representarla, y letra minúscula para representar sus resultados. • Espacio Muestral Discreto: contiene una cantidad finita de posibilidades. • Variable Aleatoria Discreta: variable aleatoria definida sobre un Espacio Muestral Discreto. • Espacio Muestral Continuo: contiene una cantidad infinita de posibilidades. • Variable Aleatoria Continua: variable aleatoria definida sobre un Espacio Muestral Continuo. También se llama Función de Densidad. • Generalmente las Variables Aleatorias Discretas representan datos contados, y las Continuas datos medidos (alturas, pesos, temperaturas, distancias). • Ejemplo: o De una caja que contiene 4 bolas rojas y 3 blancas, se toman sucesivamente 2 bolas sin reemplazarlas. Los resultados posibles z los valores y de la Variable Aleatoria Z (Nº de bolas rojas) es: z RR Æ 2 RB Æ 1 BR Æ 1 BB Æ 0 Z = { 2, 1 , 1, 0 } Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 22 o Se conduce una investigación para medir las distancias que recorre un vehículo con 5 litros de gasolina (W). 3.2 Función de Distribución de Probabilidad de una Variable Aleatoria Discreta. • La Función ƒ(x) es una función de probabilidad de la Variable Aleatoria X si, para cada x resultado posible: o ƒ(x) ≥ 0 o ∑ ƒ(x) = 1 o P(X = x) = ƒ(x) • Ejemplo: o Encuentre la distribución de Probabilidad de la suma de los números cuando se lanzan 2 dados. x 2 3 4 5 6 7 8 9 10 11 12 ƒ(x) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36 3.3 2 dados pueden caer en 6x6 = 36 formas. ƒ(x) = x −1 36 x≤7 13 − x 36 x>7 Distribución Acumulativa de una Variable Aleatoria Discreta • F(x) = P(X≤x) = • Ejemplo: ∑ f (t ) t≤x o F(2) = ƒ(2) = 1/36 o F(3) = ƒ(2) + ƒ(3) = 3/36 o F(4) = ƒ(2) + ƒ(3) + ƒ(4) = 3/36 o … o F(12) = ƒ(2) + ƒ(3) + ƒ(4) + … + ƒ(12) = 36/36 Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 23 Histograma de Probabilidad 0,2 0,15 0,1 0,05 0 2 • 3 4 5 6 7 8 9 10 11 12 9 10 11 12 Histograma de Distribución Acumulada Discreta 1,2 1 0,8 0,6 0,4 0,2 0 3.4 2 3 4 5 6 7 8 Función o Distribución de Probabilidad de una Variable. • La función ƒ(x) es una función de Probabilidad de la Variable Aleatoria Continua X (Función de Densidad), definida en R, si: o ƒ(x) ≥ 0; ∀x ∈ R ∞ o ∫ f ( x)dx = 1 −∞ b o P(a<X<b) = ∫ f ( x)dx a Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 24 Ejemplo: o Sea X, con una Función de Densidad: ƒ(x) = x2/3 ; -1 < x < 2 0 ; en otro valor Verifique si ƒ(x) es función de Probabilidad y halle P(0≤X≤1). x2 x3 ∫−1 3 dx = 9 2 1 1 2 • • ∫ 0 3.5 x2 x3 dx = 3 9 = 8 1 + =1 9 9 = 1 9 −1 0 Distribución Acumulativa de una Variable Aleatoria Continua. x • F ( x) = P( X ≤ x) = ∫ f (t )dt −∞ • Ejemplo: t2 t3 o F ( x) = ∫ dt = 3 9 −1 x 3.6 x −1 x 3+ 1 = 9 Ejercicios. • Se lanza una moneda dos veces. Halle la Función de Probabilidad y la Función de Densidad de X (N° de Caras). • Se lanza una moneda tres veces. Halle la Función de Probabilidad y la Función de Densidad de X (N° de Caras). • Una caja tiene 5 metras blancas y 3 metras negras. Si se sacan 2 metras al azar, sin reemplazo, y X indica el número de metras blancas, halle la Función de Probabilidad y la Función de Densidad de X. • Sea X una Variable Aleatoria que indica el número de Ases al retirar 4 cartas al azar de un mazo de 52 barajas. Halle la Función de Probabilidad y la Función de Densidad de X. • Halle la constante “c” de manera que la siguiente función sea una Función de Densidad: Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. o ƒ(x) = 25 c x2 ; 0<x<3 0 ; en otro valor o Halle P(1<X<2) • Una Variable Aleatoria X tiene la siguiente Función de Densidad: o ƒ(x) = c x2 ; 0≤x≤2 cx ; 2<x<3 0 ; en otro valor o Halle c o Halle P(X>2) o Halle P( ½ < X < 3/2 ) • La Función de Distribución de una Variable Aleatoria X está dada por: o ƒ(x) = c x3 ; 0≤x<3 1 ; x≥3 0 ; x<0 o Si P(X=3) = 0, halle c o Halle P(1<X<2) • Sea X una Variable Aleatoria con Función de Densidad: o ƒ(x) = cx ; 0≤x≤2 0 ; en otro valor o Halle c o Halle P(1/2 < X < 3/2) Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 26 4 Esperanza Matemática 4.1 Definiciones Varias. • El Valor Esperado, o la Esperanza Matemática, de una Variable Aleatoria X, con una Función de Probabilidad ƒ(x) es: o E(X) = ∑ x ƒ(x) (X Discreta) ∞ ∫ xf ( x)dx o E(X) = (X Continua) −∞ • Ejemplo: o Calcule la Esperanza de los siguientes Experimentos Aleatorios: Dos monedas se lanzan 16 veces al aire, donde X es el número de caras por lanzamiento. X = { 0, 1, 2 }. Se obtienen 0, 1 y 2 caras, 4, 7 y 5 veces respectivamente. • ⎛ 4⎞ ⎛ 7⎞ ⎛ 5⎞ E ( X ) = ⎜ 0. ⎟ + ⎜1. ⎟ + ⎜ 2. ⎟ → E ( X ) = 1,06 ⎝ 16 ⎠ ⎝ 16 ⎠ ⎝ 16 ⎠ Sea X la vida en horas de una válvula electrónica. La Función de Densidad de Probabilidad es: ƒ(x) = 20.000 ; x3 x > 100 0; x ≤ 100 ∞ ∞ • 20.000 E ( X ) = ∫ x. dx →E ( X ) = ∫ 20.000 x − 2 dx → 3 x 100 100 • 20.000 20.000 ⎛ 20.000 ⎞ → E( X ) = − −⎜− E( X ) = − ⎟ ∞ x 100 ⎝ 100 ⎠ • E(X) = 200 ∞ • Sea X una variable aleatoria con distribución de probabilidad ƒ(x). El valor esperado de la función g(X) es: o E[g(X)] = ∑ g(x) ƒ(x) (X Discreta) Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 27 ∞ o E[g(X)] = ∫ g (x ) f ( x)dx (X Continua) −∞ • Ejemplo: o Calcule la Esperanza de los siguientes Experimentos Aleatorios: Sea X una variable aleatoria con la siguiente distribución de probabilidad: x 0 1 2 3 ƒ(x) 1/3 1/2 0 1/6 Encuentre el valor de Y = (X – 1)2 • E[(X – 1)2] = ∑ (X – 1)2 ƒ(x) • E[(X – 1)2] = (– 1)2 (1/3) + (0)2 (1/2) + (1)2 (0) + (2)2 (1/6) • E[(X – 1)2] = 1 Sea X una variable aleatoria con función de densidad: ƒ(x) = x2/3 ; -1 < x < 2 0 ; en otro valor Encuentre el valor de g(X) = 2X -1 2 • 4.2 4.3 2 (2 x − 1) x 2 1 3 E (2 X − 1) = ∫ dx = ∫ (2 x 3 − x 2 )dx = 3 3 −1 2 −1 Propiedades o Leyes de la Esperanza Matemática. • E (aX + b) = a E(X) + b Æ a y b constantes • E [ƒ(X) ± g(X)] = E [ƒ(X)] ± E [g(X)] • E [ƒ(X,Y) ± g(X,Y)] = E [ƒ(X,Y)] ± E [g(X,Y)] • E (X,Y) = E (X) . E (Y) Varianza de una Variable Aleatoria • La varianza de una variable aleatoria X está dada por: o σ2 = E (X2) - µ2 • Ejemplo: Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 28 o Calcule la varianza de X, donde X es el número de Ingenieros de Sistema en un comité de tres personas seleccionadas al azar entre un grupo de cuatro Ingenieros de Sistema y tres Ingenieros Mecánicos. 3 3-x 4 x f(x) = 7 3 4.4 E(X) = (0)(1/35)+(1)(12/35)+(2)(18/35)+(3)(4/35) E(X) = 1,7 E(X2) = (0)(1/35)+(1)(12/35)+(4)(18/35)+(9)(4/35) E(X2) = 24/7 σ2 = 24/7 – (12/7)2 Æ σ2 = 24/49 Teorema de Chebyshev. • La varianza de una variable aleatoria indica acerca de la variabilidad de las observaciones con respecto a la media. • Si una variable aleatoria tiene una varianza o desviación estándar pequeña, se puede esperar que la mayoría de los valores estén agrupados alrededor de la media. • Por ello, la probabilidad de que una variable aleatoria tome un valor dentro de cierto intervalo, alrededor de la media, es mayor que para una variable similar con una desviación estándar mayor. • Si se considera a la probabilidad en términos de área (bajo la curva), en una distribución continua con una desviación estándar pequeña que tenga la mayor parte de su área cercana a µ. • Un valor mayor de σ indica una mayor variabilidad, y por lo tanto se espera que el área estará más extendida. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 29 El matemático ruso Chebyshev descubrió que hay una relación entre la desviación estándar y la fracción del área que se encuentra entre dos valores cualesquiera, simétricos con respecto a la media: • Teorema de Chebyshev: o La probabilidad de que cualquier variable aleatoria X caiga dentro de k desviaciones estándar de la media, es al menos (1 – 1/k2). o P ( µ - k σ < X < µ + k σ ) ≥ 1 - 1 / k2 • Ejemplo: o Una variable aleatoria X tiene una media µ=8, una varianza σ2=9, y una distribución de probabilidad desconocida. Encuentre P (-4 < X < 20). 4.5 P (-4<X<20) = P ( 8 – (4)(3) < X < 8 + (4)(3)) ≥ 1 - 1 / 42 P (-4 < X < 20) ≥ 15/16. Ejercicios. • Se rifan 200 premios de Bs. 1.000, 20 premios de Bs. 2.000 y 5 premios de Bs. 5.000. Suponiendo que se elaboran y venden 10.000 tickets, ¿cuál es el precio justo por cada ticket (sin incluir ganancia)? • En un juego de apuesta, un hombre recibe Bs 5.000 si al tirar 3 monedas al aire se obtienen todas caras o todas sellos, y paga Bs. 3.000 si resultan 1 ó dos caras. ¿Cuál es la ganancia esperada? • Un hombre, al invertir en una mercancía, puede tener una ganancia de Bs. 3.000.000 en un año con una probabilidad de 0,3, o puede perder Bs. 1.000.000 con una probabilidad de 0,7 en el mismo lapso. ¿Cuál es su Esperanza Matemática? • Un hombre desea asegurar su vehículo en Bs. 20 millones. La Compañía de Seguros estima que una Pérdida Total puede ocurrir con una probabilidad de 0,002; una pérdida del 50% con una probabilidad de 0,01 y una pérdida del 25% con una probabilidad de Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 30 0,1. Si se ignoran las demás pérdidas parciales, ¿que prima anual debe cobrar la aseguradora para tener una ganancia del 10%? • Suponga que X es una Variable Aleatoria con media igual a 100 y desviación estándar igual a 5. o Halle la conclusión que se puede derivar de la Desigualdad de Chebyshev para k=2 y k=3 o Estime la posibilidad de que X se encuentre entre 100 ± 20. o Encuentre un intervalo [a,b] alrededor de la media, para el cual la probabilidad de que X se encuentre en el intervalo sea por lo menos de 99%. • Sea X una variable aleatoria con media igual a 40 y desviación estándar igual a 5. Use la Desigualdad de Chebyshev para encontrar un valor b para el cual P(40 – b ≤ X ≤ 40 + b) ≥ 0,95. • Sea X una variable aleatoria continua con media igual a 80 y desviación estándar desconocida. Use la desigualdad de Chebyshev para encontrar un valor de σ para el cual P(75 ≤ X ≤ 85) ≥ 0,95. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 31 5 Distribuciones de Probabilidad 5.1 Distribución Binomial. • Es una Distribución Discreta, llamada también Distribución de Bernoulli. Sus frecuencias son proporcionales a los términos del Binomio de Newton o Binomio de Pascal. • Propiedades: o El experimento consta de n intentos repetidos. o Cada intento tiene un resultado que puede ser éxito o fracaso. o La probabilidad de un éxito, indicado por p, permanece constante. o Las repeticiones del ensayo son independientes. • Variable Aleatoria Binomial: o Es el número de éxitos en n ensayos de un Experimento Binomial. • Ecuación: o b( x; n; p) = • n x px.qn-x; x = 0, 1, 2, …, n n = N° ensayos p = Probab. éxito Media o Esperanza: o =n.p • Aplicación: o En experimentos que pueden arrojar dos resultados posibles. • Ejemplo: o La probabilidad de que cierto componente resista una prueba de impacto es de ¾. Encuentre la probabilidad de que exactamente 2 de los 4 componentes siguientes la resistan. p = 3/4 ; q = ¼ ; x = 2; n = 4 b (2, 4, ¾) = 4 2 3 4 2 1 4 2 Æ b (2, 4, ¾) = 0,21094 Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 5.2 32 Distribución de Poisson • Distribución Discreta. • Propiedades de un Experimento de Poisson: o El número de éxitos que ocurren en un intervalo de tiempo o en una región especificada son independientes de los que ocurren en cualquier otro intervalo de tiempo o región del espacio disjuntos. o La probabilidad de un solo éxito que ocurre durante un intervalo de tiempo muy corto o en una pequeña región, es proporcional a la duración del intervalo de tiempo o al tamaño de la región, y no depende del número de éxitos que ocurran fuera de este intervalo de tiempo o región. o La probabilidad de que ocurra más de un éxito en dicho intervalo de tiempo corto o de caer en dicha región pequeña, es insignificante. • Variable Aleatoria de Poisson: o Es el número X de éxitos en un Experimento de Poisson. • Ecuación: e −u µ x o p ( X, µ ) = x! • µ = promedio de éxitos en intervalo de tiempo o región e = 2,71828 Aplicación: o Se emplea cuando se trata de un suceso de probabilidad muy pequeña en cada observación y se desea obtener la probabilidad de que suceda cierto número de veces en un gran número de observaciones. o También se llama Ley de los Sucesos Raros. • Ejemplo: o En un experimento, el promedio de partículas radioactivas que pasan por un contador durante 1 milisegundo es de 4. ¿Cuál es Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 33 la probabilidad de que 6 partículas pasen por el contador en 1 milisegundo dado? X = 6, µ = 4 e −4 4 6 o p ( 6, 4 ) = Æ p ( 6, 4 ) = 0,1042 6! 5.3 Distribución Normal • Distribución Continua. Su nombre se debe a que al principio, se consideraba que todos los fenómenos en su estado normal debían seguir esta Distribución. Fue desarrollada por De Moivre en 1733, y luego por Gauss. • Propiedades de un Experimento Normal: o Las fuerzas causales que afectan los sucesos individuales deben ser numerosas y aproximadamente de igual ponderación. o Las fuerzas causales deben ser independientes unas de otras. o Existe equilibrio entre las desviaciones por encima y por debajo de la media. o La curva originada es simétrica. • Teorema del Límite Central: o La Distribución de una Media Muestral de una población que tiene una varianza finita, tiende a distribuirse normalmente a medida que el tamaño de la muestra tiende hacia el infinito. • Variable Aleatoria Normal: o Tiene una Distribución en forma de campana (de Gauss) • Ecuación: o p ( x, µ , σ ) = 1 2πσ e ⎛ 1 ⎞⎛ x − µ ⎞ ⎜ − ⎟⎜ ⎟ ⎝ 2 ⎠⎝ σ ⎠ 2 Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 34 Aplicación: o Se emplea comúnmente en fenómenos biológicos y antropológicos. • Área bajo la Curva Normal: o El área limitada por las ordenadas x = x1 ∧ x = x2 es igual a la probabilidad de que la Variable Aleatoria X tome un valor entre x = x1 ∧ x = x2. x2 P ( x1 < X < x2 ) = 1 ∫ n( x, µ ,σ )dx ≈ 2πσ x1 x2 ∫e ⎛ 1 ⎞⎛ x − µ ⎞ ⎜ − ⎟⎜ ⎟ ⎝ 2 ⎠⎝ σ ⎠ 2 dx x1 o Como quiera que la Distribución Normal es continua, se deben transformar todas las observaciones de cualquier Variable Aleatoria en un nuevo conjunto de observaciones de una Variable Aleatoria Normal con media cero y varianza 1, mediante la transformación: Z= X −µ σ o Con ello se obtiene que z2 P ( x1 < X < x2 ) = P ( z1 < Z < z2 ) = ∫ n( z,0,1)dz z1 o Con los valores de zn, se pueden emplear las Tablas de Datos. • Ejemplo: o Dada una Distribución Normal con µ = 50 y σ = 10, encuentre la probabilidad de que X tome un valor entre 45 y 62. z1 = 45 − 50 ⇒ z1 = −0,5 10 z2 = 62 − 50 ⇒ z 2 = 1,2 10 P ( 45 < X < 62 ) = P ( -0,5 < Z < 1,2 ) = = P (Z < 1,2 ) – P (Z < 0,5) = 0,8849 – 0,3085 = 0,5764. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 5.4 35 Ejercicios • Aplique Distribución Binomial para calcular: o Probabilidad de que al lanzar 3 veces una moneda balanceada aparezcan: 3 caras 2 sellos y 1 cara Al menos 1 cara o Probabilidad de que en una familia de 4 hijos haya: Al menos 1 varón Al menos 1 varón y al menos 1 hembra (Probabilidad de nacimiento de varón Æ pv = 0,5). o Si el 20% de los tornillos producidos por una máquina son defectuosos. Determine la probabilidad de que de 4 tornillos escogidos al azar: 1 sea defectuoso 0 sean defectuosos Menos de 2 sean defectuosos o Probabilidad de obtener, al menos una vez, un total de 7 en 3 lanzamientos de un par de dados balanceados. • Aplique Distribución de Poisson para calcular (µ = n x p): o El 10% de las herramientas producidas son defectuosas. Encuentre la probabilidad de que en una muestra de 10 herramientas, seleccionadas al azar, exactamente 2 sean defectuosas. o Sea la probabilidad de que una persona tenga una mala reacción a la inyección de determinado suero es 0,001. Determine la posibilidad de que de cada 2.000 individuos: 3 tengan mala reacción Más de 2 tengan mala reacción o 10 personas por hora en promedio utilizan una oficina de información al público. Cuál es la probabilidad de que: 6 ó menos usen el servicio Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 12 ó más lo usen en una hora Nadie lo use. 36 Aplique Distribución Normal para calcular: o El peso promedio de 500 estudiantes varones en cierta universidad es de 151 libras, y la desviación estándar es de 15 libras. Cuántos estudiantes pesan: Entre 120 y 155 libras Más de 185 libras o La media del diámetro interior de una muestra de 200 empaques es de 0,502 cms y la desviación estándar es de 0,005 cms. El propósito para el cual se hicieron estos empaques permite un máximo de tolerancia en el diámetro de 0,496 a 0,508 cms., o de lo contrario se considera que los mismos son defectuosos. Determine el porcentaje de empaques defectuosos producidos. o La vida útil de los cauchos de un autobús es de 50.000 Kms en promedio, con una desviación estándar de 4.200 Kms. Cuál es la probabilidad que uno de estos cauchos dure: Menos de 38.000 Kms. Entre 55.000 y 60.000 Kms. Más de 45.000 Kms. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. Ing° Luis Castellanos (Versión 1.20) 37 UNEFA. Probabilidades y Estadística. 38 6 Distribución en el Muestreo 6.1 Teoría del Muestreo • Concepto: o Es la rama de la Estadística, que trata de los métodos y teorías para seleccionar muestras, del uso de los datos obtenidos a partir de las muestras para estimar características de la población, y de la evaluación de los estimadores. • Criterios para la Selección de una Muestra: o Que la muestra represente a la población o Que el costo de la selección de la muestra sea pequeño o Que los estimadores de las características de la población a partir de la muestra sean precisos. • Ventajas del Muestreo: o Reducción de costos o Reducción de trabajo o Mayor rapidez o Atención individual o Mayores posibilidades de obtener la información o Mayor exactitud • Limitaciones en el uso del Muestreo: o Se usa cuando se requieren datos para áreas o grupos pequeños de la población o Se usa cuando se requieren datos en instantes regulares de tiempo y se quieren medir cambios pequeños entre períodos consecutivos o Los costos de una encuesta por muestreo son muy altos (selección de muestra, control, significancia, etc.). • Categorías del Muestreo: o Muestreo Simple al Azar: Permite a cada muestra posible una probabilidad igual de ser elegida, y a cada elemento de la Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 39 población completa una oportunidad igual de ser incluido en la muestra. o Muestreo Sistemático: los elementos que se muestran se seleccionan de la población en un intervalo uniforme que se mide con respecto al tiempo, orden o espacio. o Muestreo Estratificado: la población se divide en grupos homogéneos o estratos, y los elementos dentro de cada estrato se seleccionan al azar. o Muestreo por Agrupación: la población se divide en grupos y se selecciona una muestra aleatoria de cada grupo. • Concepto de Estadístico: o Un valor calculado a partir de una muestra, se llama “Estadístico”. o Medida que se calcula para describir la característica de una sola muestra (, s, s2, p). o El Estadístico varía de acuerdo a la muestra, y por lo tanto, es una variable aleatoria que depende de la muestra aleatoria observada. o La Distribución de Probabilidad de una Estadístico se llama Distribución Muestral. n Media Muestral (No agrupada): x = • ∑ i =1 xi n Dadas las observaciones 20, 27 y 25, halle la Media Muestral. 20 + 27 + 25 ⇒ x = 24 3 ~ Mediana Muestral: (n es impar) x = X n +1 o x = 2 X = Ing° Luis Castellanos (Versión 1.20) n 2 + X 2 n +1 2 (n es par) UNEFA. Probabilidades y Estadística. • 40 Dadas las observaciones 8, 3, 9, 5, 6, 8, 5, halle la Mediana Muestral. o 3, 5, 5, 6, 8, 8, 9 (n = 7) o ~ x = X 7 +1 ⇒ ~ x = X4 ⇒ ~ x = 6 2 • Dadas las observaciones 10, 8, 4 y 7, halle la Mediana Muestral. o 4, 7, 8, 10 (n = 4) X o ~ x = o ⇒~ x= 4 2 + X 4 +1 2 2 X x = ⇒ ~ 2 + X3 ⇒ 2 7+8 ⇒~ x = 7,5 2 Modo Muestral: Valor que se repite con mayor frecuencia • Dadas las observaciones, Halle el Modo: o 2, 4, 4, 5, 6, 6, 6, 7, 7, 8 Æ Mo= 6 o 3, 4, 4, 4, 4, 6, 7, 7, 8, 8, 8, 8, 9 Æ Mo1 = 4; Mo2 = 8 (Bimodal) Rango Muestral: r = Xn – X1 Varianza Muestral: considera la posición de cada ∑ (x observación con respecto a la media. S 2 = n o S 2 = ( ) n n∑ x − ∑ (x i ) i =1 2 i 2 i =1 n(n − 1) Desviación o Error Estándar: S = S 2 Ing° Luis Castellanos (Versión 1.20) i =1 ) 2 n i −x n −1 UNEFA. Probabilidades y Estadística. 41 o Dadas 2 compañías que envasan Jugo de Naranja. Haga un análisis estadístico de las muestras observadas: A B A B 75 86 74 69 80 80 Æ 75 71 74 69 Datos 80 80 83 71 Ordenados 83 86 86 94 86 94 A = 79,6; B = 80,0 ~ x A = 80,0; ~ x B = 80,0 MoA = MoB = Ø Hasta acá, esos datos no aportan mucha información, y ambas muestras tienen resultados muy parecidos. Analicemos ahora el Rango y la Dispersión. rA = 12; rB = 25 5.31786 − 398 2 S = ⇒ S A2 = 26,3 ; 5.4 2 A S B2 = 5.32434 − 400 2 ⇒ S B2 = 108,5 5.4 SA = 5,1284; SB = 10,4163 La Compañía A tiene un contenido más uniforme que la Compañía B (tiene menos dispersión y menos rango o picos). • Concepto de Parámetros: o Medida que se calcula para describir la característica de una población completa (µ, σ, σ 2, P). • Estadísticos y Parámetros Muestral Poblacional Media µ Desviación S σ Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 6.2 42 Distribución Muestral de Media Aritmética • La aproximación normal para será confiable para n≥30. Si n<30, la aproximación será confiable ssi la población se aproxima a Población Normal. • Z= x−µ σ n • Ejemplo: o Una firma eléctrica fabrica bombillos, cuya vida se distribuye en forma normal aproximadamente, con Media de 800 hrs y Desviación Estándar de 40 hrs. ¿Cuál es la probabilidad de que una muestra aleatoria de 16 bombillos tenga vida promedio inferior a 775 hrs? Z= 75 − 800 ⇒ Z = −2,5 40 16 P(<775) = P(Z< -2,5) = 0,0062 6.3 Distribución Muestral de Media Aritmética con Dos Muestras • Z= (x 1 ) − x 2 − (µ1 − µ 2 ) σ 12 n1 • + σ 22 n2 Ejemplo: o Los Monitores para PC de la Compañía A tienen una vida media de 6,5 años y una Desviación Estándar de 0,9 años. Los de la Compañía B tienen una vida media de 6 años y una Desviación Estándar de 0,8 años. ¿Cuál es la probabilidad de que una muestra aleatoria de 36 monitores del fabricante A tenga una vida media de la menos 1 año mayor que la vida media de una muestra de 49 monitores de la Compañía B? Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 43 A B µ 6,5 6,0 σ 0,9 0,8 n 36 49 1 - 2 = 1 Z= (1) − (0,5) ⇒ Z = 2,646 0,189 P(1 - 2 ≥1) = (Z > 2,2,646) = 1 - (Z < 2,2,646) = 0,0041 6.4 Distribución Muestral χ2 / Chi 2 / Ji 2 (n − 1)S 2 • χ2 = • Ejemplo: σ2 (con n-1 Grados de Libertad <GL>) o Un fabricante de Baterías para carros garantiza que su producto durará, en promedio, 3 años con una Desviación Estándar de 1 año. Si 5 de las Baterías tienen duraciones de 1.9, 2.4, 3.0, 3.5, y 4.2 años, ¿qué tan cierta será esa garantía de duración? n = 5; σ2 = 1 S2 = 5.(48,26) − 15 2 ⇒ S 2 = 0,815 5.4 χ2 = (5 − 1).0,815 ⇒ χ 2 = 3,26 Con 4GL Æ 3,26 є [0.484,11.143] 1 α 6.5 con 4GL є [0.025,0.975] (95% de los datos) Distribución “t” de Student • Fue publicada por W.S. Gosset (irlandés), en 1908, bajo el seudónimo “Student”. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • T= 44 X −µ (Variable Aleatoria) S n • Distribución “t”: o h(t ) = Γ[(v + 1) / 2] ⎛ t ⎜⎜1 + v Γ(v / 2) π .v ⎝ 2 ⎞ ⎟⎟ ⎠ ⎛ v +1 ⎞ −⎜ ⎟ ⎝ 2 ⎠ o v Æ Grados de Libertad ( v = n – 1) ∞ o Función Gamma Æ Γ(α ) = ∫ xα −1e x dx 0 • Aplicación: o En problemas que tienen que ver con inferencia acerca de la media de la población o en problemas que implican muestras comparativas. o 95% de los valores de una Distribución “t” caen entre -t0,025 y t0,025. Un valor por debajo de -t0,025 o por encima de t0,025 es motivado generalmente por mala definición de µ, o que sea improbable dicho valor. • Ejemplo: o Encuentre k tal que P (k < T < -1,761) = 0,045 para una muestra de 15 elementos. V = 15 – 1 Æ v = 14 Por tabla Æ 1,761 corresponde a t0,005 Æ - t0,005 = - 1,761 0,045 = 0,05 - α Æ α = 0,005 t0,005 = 2,977 - t0,005 = - 2,977 P ( -2,977 < T < -1,761 ) = 0,045 • Otro ejemplo: o Un Ingeniero Químico afirma que el rendimiento medio de la Población de cierto proceso en lotes de de 500 gr. por mm de materia prima. Para verificar, muestrea 25 lotes cada mes. Si el Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 45 valor de t calculado cae entre - t0,005 y t0,005 queda satisfecho con su afirmación. ¿Qué conclusión extraería de una muestra con una media de 518 gr. x mm y una Desviación Estándar Muestral de 40 gr.? v = 25 – 1 Æ v = 24 S = 40; = 518; n = 25; µ = 500 Por tabla Æ t0,05 = 1,711, para v = 24 t= 518 − 500 ⇒ t = 2,25 40 25 Por tabla Æ 2,25 corresponde aproximadamente a t0,02 o t0,015. El Proceso produce un mejor producto del que se piensa. 6.6 Distribución F (de Fischer) U v1 • F= V v2 U y V son Variables Aleatorias independientes con Distribuciones χ2 con v1 y v2 GL v1 • ⎛v ⎞ Γ [(v1 + v 2 ) / 2 ]⎜⎜ 1 ⎟⎟ ⎝ v2 ⎠ Γ ⎛⎜ v1 ⎞⎟.Γ ⎛⎜ v 2 ⎞⎟ ⎝ 2⎠ ⎝ 2⎠ h(f) = 0 • 2 . f ⎛ v1 ⎞ ⎜⎜ −1 ⎟⎟ ⎝ 2 ⎠ ⎛ v1 f ⎜⎜ 1 + v2 ⎝ ⎞ ⎟⎟ ⎠ v1 + v 2 2 ;0<f<∞ ; en cualquier otro caso Aplicación: o En situaciones de dos muestras para extraer inferencias acerca de las varianzas de población. De hecho, la Distribución “f” se llama también la Distribución de Razón de Varianzas. • Ejemplo: o Se toman dos muestras y se hallan sus estadísticos para comparar , S2 y S. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 6.7 46 Ejercicios • Empleando la Distribución χ2 calcule: o Suponga que los tiempos requeridos por un cierto autobús para alcanzar uno de sus destinos en una ciudad grande forman una Distribución Normal con una desviación estándar de 1 minuto. Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza muestral sea mayor que 2. o Los siguientes son los pesos en gramos de 10 paquetes de semillas distribuidas por la Compañía Acme: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2, y 46.0. Encuentre un Intervalo de Confianza de 95% para la Varianza de todos los paquetes de semilla. • Empleando la Distribución t de Student calcule: o Un fabricante de bombillos anuncia que su producto alumbrará en promedio durante 500 horas. Para mantener este promedio, prueba 25 bombillos cada mes. Si el valor t calculado cae entre –t0,05 y t0,05, ¿queda satisfecho con su publicidad? ¿Qué conclusión debe sacar de una muestra que tiene media de 518 horas y desviación estándar de 40 horas? • Empleando la Distribución F de Fischer calcule: o Si S 12 y S 22 son las Varianzas de Muestras Aleatorias independientes de tamaño n1 = 8 y n2 = 12, de poblaciones normales P( S 12 S 22 con σ 12 = σ 22 . Determine la probabilidad > 1,26 )=?. o Si tomamos 2 muestras independientes de tamaño n1 = 6 y n2 = 10 de 2 poblaciones normales con la misma varianza poblacional. Halle b tal que: P( S 12 S 22 ≤ b ) = 0,95. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 47 7 Teoría de la Estimación 7.1 Generalidades. • Inferencia Estadística: métodos por los que se realizan inferencias o generalizaciones acerca de una población. Puede ser: o Estimación o Prueba de Hipótesis • Espacio de Decisión: conjunto de todas las decisiones posibles que pueden tomarse en un problema de estimación. • La Estimación conlleva a determinar o inferir parámetros poblacionales, en base a estadísticas muestrales. Puede ser: o Puntual o Por Intervalo 7.2 Estimación Puntual o Local • Una estimación puntual de algún parámetro de la población ϑ es un solo valor ϑ de una Estadística Θ. • Por ejemplo, el valor de la Estadística , que se calcula a partir de la muestra de tamaño n, es una estimación puntual del parámetro poblacional µ. • No se espera que un estimador realice la estimación sin error o exactamente, pero sí que no esté muy alejado. • Estimador Insesgado: una Estadística Θ es un estimador insesgado del parámetro ϑ si µΘ = E ( Θ ) = ϑ o (Si la Distribución Muestral tiene una media igual al parámetro estimado). • Varianza de un Estimador Puntual: si consideramos todos los posibles estimadores insesgados de algún parámetro ϑ, el de menor varianza se llama el estimador más eficiente de ϑ. • Ejemplo: Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 48 o Si Θ1 y Θ2 son estimadores insesgados del mismo parámetro poblacional ϑ, se elegiría el estimador cuya distribución muestral tuviera la menor varianza. Si σ2Θ1 < σ2Θ2, decimos que Θ1 es un estimador más eficiente de ϑ que Θ2. 7.3 Estimación por Intervalos • Es un intervalo de anchura finita, centrado en la estimación puntual del parámetro, que se espera contenga el verdadero valor del parámetro ϑ–E<ϑ< ϑ+E ϑI < ϑ < ϑS • El intervalo estimado indica, por su longitud, la precisión de la estimación puntual. • El intervalo calculado se llama Intervalo de Confianza (IC) del (1- α ) 100%. La fracción (1- α ) es el Coeficiente o Grado de Confianza. Los extremos ϑI y ϑS son los Límites de Confianza Inferior y Superior. o P(ΘI < ϑ < ΘS ) = 1 – α o Si α = 0,05, tenemos un IC de 95%. o Si α = 0,01, tenemos un IC de 99%. • 7.4 Es preferible un IC corto pero con alto grado de confianza. Error Muestral • Es un error o variación entre Estadísticas de Muestra debido al azar, o diferencias entre cada Muestra y la Población, y entre varias Muestras (E). o E = σx Z o σx = σ n Sx = σ n −1 Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 7.5 49 Estimación de la Media • P ( - Z α • Ejemplo: σ 2 n < µ < + Zα σ 2 n ) = (1- α ) o En una población, considerada con tendencia normal, se ha hecho un estudio muestral (n=15) donde el rendimiento o promedio de vida útil de los bombillos es de = 9000 horas, con una desviación S = 610 hrs. De estudios anteriores, se toma que la Desviación Poblacional σ = 500 hrs. Determine la Media Poblacional, considerando IC de 90% y 95%. Método 1: • n = 15; = 9000; S = 610; σ = 500 • σx = σ n ⇒σx = 500 15 ⇒ σ x = 129,1hrs • IC1 = 90% Æ P(0,90) Æ Z = 1,65 • E1 = 129,1 x 1,65 Æ E1 = 213 • LI1 = 9000 – 213 Æ LI1 = 8787 • LS1 = 9000 + 213 Æ LS1 = 9243 • 8833 ≤ µ1 ≤ 9167 • IC2 = 95% Æ P(0,95) Æ Z = 1,96 • E2 = 129,1 x 1,96 Æ E2 = 253 • LI2 = 9000 – 253 Æ LI2 = 8747 • LS2 = 9000 + 253 Æ LS2 = 9253 • 8787 ≤ µ2 ≤ 9213 Método 2: • IC 90% P(9000–Z0,05 500 15 < µ < 9000+ Z0,05 500 15 ) = 0,90 P (9000 – 213 < µ < 9000 + 213) = 0,90 Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 50 P(8787 < µ < 9213) = 0,90 • IC 95% 500 P(9000–Z0,05/2 15 <µ<9000+ Z0,05/2 500 15 ) = 0,95 P (9000 – 253 <µ< 9000 + 253) = 0,95 P(8747 < µ < 9253) = 0,95 • IC 99% P(9000–Z0,005 500 15 <µ<9000+ Z0,005 500 15 ) = 0,99 P (9000 – 333 <µ< 9000 + 333) = 0,99 P(8667 < µ < 9333) = 0,99 8667 8747 8787 9213 90% 95% 99% 7.6 ¿Cómo se calcula el tamaño de una Muestra? • ⎛ Zα σ ⎞ n=⎜ 2 ⎟ ⎜ error ⎟ ⎝ ⎠ • Ejemplo: 2 o IC = 95%; σ = 0,3 2 o • IC con σ desconocida (con “t” de Student) o • ⎛ 1,96 x0,3 ⎞ n=⎜ ⎟ ⇒ n = 138,3 ⎝ 0,05 ⎠ x − tα S 2 n < µ < x + tα S 2 n Ejemplo: Ing° Luis Castellanos (Versión 1.20) 9253 9333 UNEFA. Probabilidades y Estadística. 51 o El contenido de 7 contenedores similares de Ácido Sulfúrico son: 9,8; 10,2; 10,4; 9,8; 10,0; 10,2; 9,6 litros. Encuentre la Media en un IC de 95%. 7.7 = 10,0; S = 0,283 10,0 – 2,477 (0,283/√7) < µ < 10,0 + 2,477 (0,283/√7) 9,74 < µ < 10,26 Límite de Tolerancia • En una Distribución Normal, los datos están agrupados de acuerdo a las siguientes proporciones: o ± s Æ 68,27% (Zona Normal) o ± 2 s Æ 95,45% o ± 3 s Æ 99,73% • Ello nos ofrece un Límite de Tolerancia, de acuerdo a los Porcentajes requeridos. Como no siempre se tiene a mano el valor σ, se emplea: o X ± k.S • Siendo k el valor tomado de la tabla de Factores de Tolerancia para Distribuciones Normales. • Ejemplo: o Una Máquina produce piezas de metal de forma cilíndrica. Se toma una muestra de estas piezas y se encuentran los diámetros 1.01; 0.97; 1.03; 1.04; 0.99; 0.98; 0.99; 1.01 y 1.03 cms. Encuentre los Límites de Tolerancia del 99% que contendrán el 95% de las piezas, en una Distribución Normal. = 1,0056 S = 0,0245 1,0056 ± 0,1115 ( 0,8941 ; 1,1171) Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 7.8 52 Distinción entre Límites de Confianza y Límites de Tolerancia • El Intervalo de Confianza sirve cuando interesa hallar la Media Poblacional. El Intervalo de Tolerancia sirve para precisar dónde caen las observaciones individuales. 7.9 Estimación de la Varianza • Si S2 es la Varianza de una Muestra Aleatoria de tamaño n de una Población Normal, un Intervalo de Confianza de (1- α ) 100% para σ2 es: o • (n − 1)s 2 χ α2 <σ 2 < (n − 1)s 2 2 χ 12−α 2 Ejemplo: o A continuación se muestran los pesos de 10 paquetes de semillas: 46,4; 46,1; 45,8; 47,0; 46,1; 45,9; 45,8; 46,9; 45,2;46,0. Encuentre un IC de 95% para la Varianza, suponiendo una Distribución Normal. n∑ x i2 − (∑ x i ) 2 (10 x 21273,12) − (461,2) ⇒ S 2 = 0,286 10(9) 2 S = Si IC = 95%, α = 0,05, para V = 9 GL Æ 2 n(n − 1) ⇒ S2 = • χ α2 = χ 02, 025 = 19,023; χ 02,975 = 2700 • 0,135 < σ2 < 0,953 2 7.10 Ejercicios • Se ha calculado que la media y la desviación estándar, para los promedios de puntuación de una muestra aleatoria de 36 estudiantes, son 2.6 y 0.3 respectivamente. Encuentre la media poblacional con un 90, 95 y 99% de Intervalo de Confianza. • Una empresa eléctrica fabrica bombillos que tienen una vida con una Distribución aproximadamente Normal que tiene una desviación estándar de 40 horas. Si una muestra de 30 bombillos tiene una vida promedio de Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 53 780 horas, encuentre la media poblacional con un Intervalo de Confianza del 96%. • Las estaturas de una Muestra Aleatoria de 50 estudiantes mostró una media de 174.5 cms y una desviación estándar de 6.9 cms. Halle la media poblacional con un Intervalo de Confianza del 98%. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 54 8 Ensayos de Hipótesis y Significación 8.1 Hipótesis Estadística • Aseveración o conjetura con respecto a una o más poblaciones. • La prueba de una Hipótesis Estadística sobre toda la Población nos dará la verdad o falsedad de la misma. • Ello es poco práctico, por lo cual se escogerá una muestra aleatoria “Significativa”. • La aceptación de una Hipótesis simplemente implica que los datos no dan suficiente evidencia para rechazarla. 8.2 Hipótesis Nula (H0) • Es cualquier Hipótesis que deseamos probar. • Su rechazo conduce a la aceptación de una Hipótesis Alternativa (H1). • Una Hipótesis Nula con respecto a un Parámetro Poblacional siempre se establecerá de modo que especifique un valor exacto del parámetro (Ej. H0 Æ p = 0,5), mientras que la Hipótesis Alternativa puede tomar uno o varios valores (H1 Æ p≠ 0,5; p < 0,5; p > 0,5). (Si H1 toma un valor, se habla de Hipótesis con una Cola. Si puede tomar dos valores, se habla de dos colas).♠ 8.3 ♠ Prueba de Hipótesis Estadística • Error Tipo I: Se rechaza H0 cuando es Verdad. • Error Tipo II: Se acepta H0 cuando es Falsa. • Al probar cualquier Hipótesis Estadística, hay cuatro situaciones posibles: H0 es Verdad H0 es Falsa Aceptar H0 Correcto Error Tipo II Rechazar H0 Error Tipo I Correcto Con dos colas, se usa α/2. Con una cola se usa α. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 55 La probabilidad de cometer un error Tipo I se denomina nivel de significancia (α). • La probabilidad de cometer un error Tipo II (β) no puede calcularse a menos que se plantee una Hipótesis Alternativa específica. • Ejemplo: o Una vacuna contra la gripe sólo es eficaz un 25% a los 2 años. Para probar si una vacuna nueva ofrece mayor protección, se inoculan 20 personas al azar. Si 9 ó más personas rebasan ese lapso sin contraer gripe, la nueva vacuna es superior a la actual. Plantee y compruebe la Hipótesis dada. H0 : p = ¼ (25%) H1 : p > ¼ α = P (error Tipo I) • α = P(X ≥ 9 p = ¼ ) (una cola) • α= 20 ∑ b( x;20; 1 4) x =9 • α=1- 8 ∑ b( x;20; 1 4) x =0 • α = 1 – 0,9591 • α = 0,0409 β = P (error Tipo II) (Tomemos H1 Æ p = ½ ) • β = P (X < 9 p = ½ ) • β= 8 ∑ b( x;20; 1 2) x =0 • β = 0,2517 A medida que H1 se aproxima a la unidad, β disminuye hacia cero. • β = P (error Tipo II) (Tomemos H1 Æ p = 0,7 ) • β = P (X < 9 p = 0,7 ) • β= 8 ∑ b( x;20;0,7) x =0 Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. • 56 β = 0,0051 Los valores por encima del valor que divide las 2 regiones (valor crítico) constituyen la región crítica. Los menores constituyen la región de aceptación. • x = 8,5 Æ Valor crítico • x ≥ 8,5 Æ Región Crítica • x ≤ 8,5 Æ Región de Aceptación Si la estadística X cae en la región crítica, se rechaza H0 a favor de H1. • Si cae en la zona de aceptación, H0 se acepta. Otro Ejemplo: o Considere la Hipótesis Nula de que el Peso Promedio de los estudiantes varones de una Universidad es de 68 Kgr., contra la Hipótesis alternativa de que no es igual a 678 Kgr. Supóngase σ = 3,6, y una muestra n = 36. H0 : µ = 68 H1 : µ ≠ 68 ( con µ < 68 ó µ > 68) (2 colas). σx = σ n ⇒σx = 3,6 36 ⇒ σ x = 0,6 Se escoge una Región Crítica arbitraria: α/2 α/2 67 µ = 68 69 α = P ( < 67 H0 es verdad) + P ( > 69 H0 es verdad) Siendo entonces 1 = 67 y 2 = 69. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 57 z1 = 67 − 68 ⇒ z1 = - 1,67 0,6 z2 = 69 − 68 ⇒ z2 = 1,67 0,6 α = P(Z < -1,67) + P(Z > 1,67) α = 2 P(Z < -1,67) α = 0,0950 El 9,5% de las muestras de tamaño 36 conducirá al rechazo de µ = 68, cuando H0 es verdadera. • Para reducir α, se puede aumentar el tamaño de la muestra o ampliar la región de aceptación. • Ejercicio: o Haga el Ejercicio Anterior, pero con n = 64. 8.4 Prueba de Medias y Varianzas • Se debe probar la Hipótesis de que la media µ de una población, con varianza σ2 conocida, sea igual a un valor especificado µ0 contra la alternativa de que la media no es igual a µ0. o H0 : µ = µ0 o H1 : µ ≠ µ0 σ2 • Sea la variable aleatoria con media µ = µ y varianza σ x2 = • Si se emplea un nivel de significancia de α, se deben encontrar dos valores n . críticos 1 y 2, tales que el intervalo 1 < < 2, defina la región de aceptación y < 1 y > 2 constituyan la región crítica, empleando: o z= x − µ0 σ n • Se hallan los valores críticos de Z correspondientes a 1 y 2. De la población se extrae una muestra aleatoria de tamaño α y se calcula la media de la muestra . Si cae en la región de aceptación 1 < < 2, se Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 58 concluye que µ = µ0. De lo contrario, se rechaza H0 y se acepta H1 : µ ≠ µ0 . • Ejemplo: o Un fabricante de artículos deportivos ha inventado una nueva cuerda sintética para pescar, con una resistencia media de 8 Kg. a la ruptura y una desviación estándar de 0,5 Kg. Pruebe la Hipótesis de que µ = 8 Kg contra la alternativa de que µ ≠ 8 Kg, si se toma una muestra aleatoria de 50 cuerdas y se encuentra que tienen una resistencia media a la ruptura de 7,8 Kg. Emplee nivel de significancia de 0,01. H0 : µ = 8 Kg H1 : µ ≠ 8 Kg α = 0,01 (α/2 = 0,005) z1 = - 2,58 z2 = 2,58 Por lo tanto, -2,58 < Z < 2,58 = 7,8 Kg n = 50 z= -2,828 no pertenece al intervalo [-2,58; 2,58], por lo tanto se 7,8 − 8 0,5 50 ⇒ z = −2,828 rechaza H0. Se concluye que la resistencia a la ruptura promedio no es igual a 8 Kg sino menor. • Otra manera de efectuar una Prueba de Hipótesis es aplicando la Distribución “t” de Student, con la fórmula: o T= x − µ0 ; v = n -1 S n • Ejemplo: o El tiempo promedio empleado para inscribir a los alumnos de una Universidad ha sido de 50 minutos con una desviación estándar de Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 59 10 minutos. Se está ensayando un nuevo procedimiento de inscripción a través de computadores. Si una muestra aleatoria de 12 estudiantes obtiene un tiempo promedio en inscribirse de 42 minutos con una desviación estándar de 11,9 minutos con el nuevo sistema. Prueba la Hipótesis de que la media de la población es ahora menor de 50, usando un nivel de significancia de: a) 0,05 b) 0,01. H0 : µ = 50 min H1 : µ < 50 min S = 11,9 min = 42 n = 12; v = 11 GL α1=0,05 α2=0,01 T < - 1,796 T < - 2,718 T= x − µ0 42 − 50 ⇒T = ⇒ T = −2,33 11,9 S n 12 α1=0,05 Se rechaza H0 8.5 α2=0,01 Se acepta H0 Ejercicios • Para probar la hipótesis de que una moneda es balanceada, se debe adoptar la regla de decisión: (1) aceptar la hipótesis si el número de caras en una muestra sencilla de 100 lanzamientos está entre 40 y 60 inclusive, (2) rechazar la hipótesis en otros casos. o Encuentre la probabilidad de rechazar la Hipótesis cuando en realidad es correcta. • El fabricante de un medicamento patentado sostiene que tiene una eficacia del 90% en aliviar cierta alergia durante un período de 8 horas. En una muestra de 200 personas con dicha alergia, el medicamento mejoró a 160 personas. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 60 o Determine si la afirmación del fabricante es verdad, usando un nivel de significancia de 0,001. • Se calculó que el tiempo de vida promedio de una muestra de 100 bombillos fluorescentes producidos por una compañía es de 1570 horas, con una desviación estándar de 120 horas. Si µ es el tiempo de vida promedio de todos los bombillos producidos por la compañía, pruebe la Hipótesis µ = 1600 horas en contra de una Hipótesis Alterna µ ≠ 1600 horas, usando un nivel de significancia de o 0,05 o 0,01 • La resistencia al rompimiento de los cables producidos por un fabricante tienen media de 1800 libras y desviación estándar de 100 libras. Se afirma que con ayuda de una técnica nueva introducida en el proceso, se puede aumentar dicha resistencia. Para probar esa afirmación, se probó una muestra de 50 cables y se encontró que la resistencia promedio al rompimiento es de 1850 libras. ¿Se acepta la Hipótesis con significancia de 0,001? Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 61 9 Análisis de Correlación y Regresión 9.1 Análisis de Regresión para dos variables Definición o El Análisis de Regresión busca hallar la relación que existe entre dos ó más variables. Al graficar los puntos correspondientes a todas las variables, se obtiene un Diagrama de Dispersión. La Curva que aproxima los datos se conoce como Curva de Aproximación o Curva de Ajuste. Esa curva puede ser lineal o no lineal. y . . . . . . .... y .. . .... x x Regresión Lineal Regresión No Lineal o Uno los principales propósitos de la Curva de Ajuste es estimar una de las variables (la variable dependiente) a partir de la otra (variable independiente). Ese proceso de estimación se denomina “Regresión”. o Regresión Lineal significa que la Media de Y|x está relacionada linealmente con x, y que la ecuación que las relaciona es la de la recta en su forma usual dada por: µ Y|x = α + β x donde α y β son parámetros por estimar a partir de los datos de la muestra. Indicando a sus estimaciones por a y b respectivamente, la respuesta estimada ŷ se obtiene de la línea de regresión muestral: ŷ=a+bx o En la Regresión No Lineal se utiliza la ecuación de parábola: Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 62 y = a + b x + c x2 o Regresión Simple considera sólo una Variable Independiente. o Regresión Múltiple considera más de una Variable Independiente, normalmente dos (2). Usa la ecuación: z=a+bx+cy o Generalmente la Regresión se calcula mediante el Método de Mínimos Cuadrados. Cálculo o La Regresión a calcular será la Regresión Lineal Simple, con dos valores, mediante las fórmulas (Ecuaciones Normales): ∑ y = a.n + b∑ x ∑ x. y = a∑ x + b∑ x 2 o Luego de desarrollar las ecuaciones, se obtiene: n∑ xy − (∑ x )(∑ y ) b= =a+bÆa=-b n∑ x 2 − (∑ x ) 2 Selección de un Modelo de Regresión o Todo lo señalado anteriormente se basa en el supuesto que el modelo escogido es el correcto, donde y está relacionada efectivamente con x. No se puede esperar que la predicción de la respuesta sea buena si hay varias variables independientes, no consideradas en el modelo, que afectan la respuesta y están variando en el sistema. De igual manera, la predicción será inadecuada si la estructura verdadera que relaciona a y con x es extremadamente no lineal en el rango de las variables consideradas. o Con frecuencia se usa el modelo de Regresión Lineal Simple, a pesar que se sabe que el modelo no es exactamente lineal o de que la estructura verdadera es desconocida. Esta aproximación es bastante acertada, sobre todo cuando el rango de x es angosto. Así, Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 63 el modelo usado se convierte en una función de aproximación, que se espera sea una representación adecuada de la región de interés. Ejemplo: o I xi yi Dados los siguientes datos experimentales: 1 1.5 4.8 2 1.8 5.7 3 2.4 7.0 4 3.0 8.3 5 3.5 10.9 6 3.9 12.4 7 4.4 13.1 8 4.8 13.6 9 5.0 15.3 Estime la línea de Regresión Lineal. • n=9 • • = 3,3667 • ∑ y = 91,1 ∑ xy = 345,09 • = 10,1222 • ∑x • ∑ x = 30,3 2 = 115,11 9.(345,09) − (30,3)(91,1) ⇒ b = 2,9303 2 9.(115,11) − (30,3) b= a = 10,1222 – (2,9303)(3,3667) Æ a = 0,2568 ŷ = 0,2568 + 2,9303 x Significación Estadística de la Regresión o Un Diagrama de Dispersión es una representación gráfica de los puntos de datos para una muestra en particular. Si se escoge una muestra diferente o se agranda la muestra original, se obtendrá seguramente un Diagrama de Dispersión diferente. Y cada Diagrama originará Rectas (o Curvas) de Regresión diferentes (aunque no deben ser muy diferentes si las muestras se toman de la misma población). o La dispersión de puntos alrededor de la Recta (o Curva) de Regresión indica que para un valor particular de x, hay varios valores de y distribuidos alrededor de la Recta (o Curva). Por lo tanto, de ese concepto de distribución se desprende que hay conexión entre la Recta o Curva y la probabilidad. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 64 o La conexión se suministra al introducir las variables aleatorias X y Y, las cuales pueden asumir valores muestrales diferentes x y y, respectivamente. o Dada la función de densidad conjunta o función de probabilidad, f(x,y), de dos variables aleatorias X y Y, entonces existe una Recta (o Curva) de Regresión de Mínimos Cuadrados de Y en X dada por y = g(x) = E (Y|X=x), siempre y cuando X y Y tengan varianza finita, y se cumple que E {[Y-g(X)]2} = un mínimo. 9.2 Análisis de Correlación para dos variables Definición o Al hablar de Regresión, se ha supuesto que la variable independiente x está controlada y que, en consecuencia, no es una variable aleatoria. Dentro de ese contexto, x se llama frecuentemente variable matemática, la cual, en el proceso muestral, se mide con un error despreciable e insignificante. En muchas aplicaciones en técnicas de Regresión, es más realista suponer que tanto X como Y son variables aleatorias y que las mediciones {(xi,yi); i = 1, 2, …, n} son observaciones tomadas de una función de densidad conjunta ƒ(x,y). Cálculo o Formalmente, el Coeficiente de Correlación Muestral se halla: r= S xy SxS y [∑ (x − x )(y − y )] ∑ (x − x ) ∑ (y − y ) o r= 2 2 o Otra manera de expresarlo es a través del Coeficiente de Determinación: ∑ (y − y ) = ∑ (y − y ) 2 r 2 est 2 • ⇒ (var iación _ exp licada ) (var iación _ total ) La Variación total se compone de Variación Explicada (tiende a seguir patrones definidos por la recta de Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 65 regresión de mínimos cuadrados) y Variación No Explicada (se comporta de manera aleatoria o impredecible). El Coeficiente r2 se puede interpretar como la relación • de la variación total que se explica por la recta de regresión de mínimos cuadrados. • El Coeficiente r mide que tan bien se ajusta la recta de regresión de mínimos cuadrados a los datos muestrales. Si r2 = 1 o r = ±1, se dice que hay Correlación Lineal • Perfecta o Regresión Lineal Perfecta (respectivamente). o El Coeficiente de Correlación Poblacional se halla: 2 σ xy σ2 2 σX = o ρ= β 2 2 σY σY σ xσ y ρ = 1− Los valores de ρ = ±1 ocurren cuando σ2 = 0, y existe una relación perfecta entre las dos variables. Los valores cercanos a cero (0) indican poca o nula correlación. Los valores cercanos a +1 implica relación lineal perfecta con pendiente positiva. Los valores cercanos a -1 implica relación lineal perfecta con pendiente negativa. El Coeficiente de Correlación Poblacional ofrece una medida de qué tan bien se ajusta la Curva de Regresión de una Población dada, a los datos de la Población. Significación Estadística de la Correlación o El Coeficiente de Correlación de la Población debe ser una medida de qué tan bien se ajusta una Recta o Curva de Regresión de una Población dada a los datos de dicha Población. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 66 Ejemplo: o Dadas las estaturas de los Padres y de sus Hijos Mayores en pulgadas (x,y respectivamente): i xi yi 1 65 68 2 63 66 3 67 68 4 64 65 5 68 69 6 62 66 7 70 68 8 66 65 9 68 71 10 67 67 11 69 68 12 71 70 Estime la línea de Regresión Lineal y Halle el Coeficiente de Correlación. n∑ xy − (∑ x )(∑ y ) • b= • =a+bÆa=-b • ∑x = 800; ∑y = 811; ∑x.y = 54107; ∑x2 = 53418 • = 66,667; = 67,583 • b = 0,4764 • a = 35,8248 • ŷ = 35,8248 + 0,4764 x (Recta de Regresión) • ∑(x-).(y-) = 40,3333; ∑(x-)2 = 84,6667; ∑(y-)2 = n∑ x 2 − (∑ x ) 2 38,9167 9.3 [∑ (x − x )(y − y )] ∑ (x − x ) ∑ (y − y ) • r= • r = 0,7027 2 2 (Muy cercano a 1) Ejercicios Dados los siguientes datos experimentales: i xi yi 1 1 1 2 3 2 3 4 4 4 6 4 5 8 5 6 9 7 7 11 8 8 14 9 o Estime la línea de Regresión Lineal, Grafique el Diagrama de Dispersión y Halle el Coeficiente de Correlación. En un Estudio de Correlación entre la Precipitación Pluvial y de la contaminación del aire arrastrada, se obtuvieron los siguientes datos (x,y respectivamente): Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. i xi yi 1 4.3 126 2 4.5 121 67 3 5.9 116 4 5.6 118 5 6.1 114 6 5.2 118 7 3.8 132 8 2.1 141 9 7.5 108 o Estime la línea de Regresión Lineal, Grafique el Diagrama de Dispersión y halle el Coeficiente de Correlación. Se hizo un estudio sobre la cantidad de azúcar transformada en cierto proceso, a varias temperaturas (y, x respectivamente): i xi yi 1 1.0 8.1 2 1.1 7.8 3 1.2 8.5 4 1.3 9.8 5 1.4 9.5 6 1.5 8.9 7 1.6 8.6 8 1.7 10.2 9 1.8 9.3 10 1.9 9.2 11 2.0 10.5 o Estime la línea de Regresión Lineal, Grafique el Diagrama de Dispersión y Halle el Coeficiente de Correlación. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 68 10 Bibliografía • KUME, Hitoshi: “Herramientas Estadísticas Básicas para el Mejoramiento de la Calidad”. Ed Norma. Bogotá, 1992. • RIVAS G, Ernesto: “Estadística General”. UCV. Caracas, 1985. • SPIEGEL, SCHILLER & SRINIVASAN: “Probabilidad y Estadística”. Ed McGraw Hill. Serie Schaum. México, 2005. • WALPOLE & MYERS: “Probabilidad y Estadística para Ingenieros”. 2da Edición. Ed Interamericana. México 1984. • WALPOLE, MYERS & MYERS: “Probabilidad y Estadística para Ingenieros”. Editorial Pearson. México 1999. Ing° Luis Castellanos (Versión 1.20) UNEFA. Probabilidades y Estadística. 11 Anexos 11.1 Áreas bajo la Curva Normal Ing° Luis Castellanos (Versión 1.20) 69 UNEFA. Probabilidades y Estadística. 11.2 Valores Críticos de la Distribución χ2. Ing° Luis Castellanos (Versión 1.20) 70 UNEFA. Probabilidades y Estadística. 11.3 Valores Críticos de la Distribución t Ing° Luis Castellanos (Versión 1.20) 71 UNEFA. Probabilidades y Estadística. 11.4 Sumas de Distribución Binomial Ing° Luis Castellanos (Versión 1.20) 72 UNEFA. Probabilidades y Estadística. 11.5 Factores de Tolerancia para Distribuciones Normales Ing° Luis Castellanos (Versión 1.20) 73 UNEFA. Probabilidades y Estadística. Ing° Luis Castellanos (Versión 1.20) 74 UNEFA “Excelencia Educativa”