PROBABILIDAD Y ESTADISTICA 1.1 Conceptos básicos Estadística descriptiva Teoría de decisión Población Muestra aleatoria Es la técnica que se va a encargar de la recopilación, resentación, tratamiento y análisis de los datos, con el objeto de resumir, describir las características de un conjunto de datos y por lo general toman forma de tablas y gráficas. Implica “escoger” o “seleccionar" una alternativa o curso de acción entre un conjunto de ellas. La teoría de la decisión se enfoca como una técnica cuantitativa que sirve de apoyo a la toma de decisiones. "Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales intentamos sacar conclusiones". Levan & Rubin (1996). Muestra elegida independientemente de todas las demás, con la misma probabilidad que cualquier otra y cuyos elementos están elegidos independientemente unos de otros y con la misma probabilidad. Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 1.2 Datos no agrupados Los datos no agrupados es un conjunto de información sin ningún orden que no nos establece relación clara con lo que se pretende desarrollar a lo largo de un problema, esto se soluciona mediante una tabulación que nos conduce a una tabla de frecuencia 1.2.1 Medidas de Tendencia Central Existen tres medidas comunes para identificar el centro de un conjunto de datos: la media, mediana y moda. En cada caso, se ubican alrededor del punto en donde se aglomeran los datos. Media Medida de tendencia central usualmente llamada promedio, se define como la división de la suma de todos los valores entre el número de datos. Ejemplo: Se tienen las edades de cinco estudiantes universitarios de 1° año, a saber: 28,23, 27,34, 25, para calcular la media aritmética (promedio de las edades), se tiene que: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 𝑋̅ = 28 + 23 + 27 + 34 + 25 137 = = 27.4 𝑎ñ𝑜𝑠 5 5 Mediana La mediana es un valor de la variable que deja por debajo de sí a la mitad de los datos, una vez que éstos están ordenados de menor a mayor.7 Por ejemplo, la mediana del número de hijos de un conjunto de trece familias, cuyos respectivos hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posición central es 2: En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los dos valores centrales. Por ejemplo, en el caso de doce datos como los siguientes: Se toma como mediana Ejercicio: Dados los siguientes 8 datos ordenados de manera ascendente calcula la mediana: 5, 8, 8, 11, 11,11, 14,16 (me) = (11+11) / 2 = 11 Por lo que la mediana está ubicada entre el dato 4 y 5; el valor del dato 4 es “11” y del dato 5 es “11”, por lo que al sacar el promedio, da que la mediana de la muestra estudiada es 11 Moda Es el dato que ocurre con mayor frecuencia en un conjunto de elementos estudiados. Del ejemplo anterior donde los datos recopilados son: 5, 8, 8, 11, 11, 11, 14,16; Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA El dato que ocurre con mayor frecuencia es el valor 11, siendo este valor la moda. Ejercicios unidad 1 Calcula la madia aritmética, mediana y moda Media: Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio . 𝑥̅ = 84+91+72+68+87+78 6 = 80 𝐾𝑔 Mediana: 68, 72, 78, 84, 87, 91 (𝑀𝑒) = (78 + 84) 162 = = 81 2 2 Moda: no hay moda Calcula la media, mediana y la moda de las siguientes series: * 2, 3 , 4, 4 , 5 , 5, 5 , 6, 6 Me= 5 * 7, 8 , 9, 1 0, 1 1, 1 2 Me = 9 . 5 1.2.2 Medidas de Dispersión Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA También llamadas medidas de variabilidad, muestran la variabilidad de una distribución, indicando por medio de un número si las diferentes puntuaciones de una variable están muy alejadas de la media. Cuanto mayor sea ese valor, mayor será la variabilidad, y cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos. Las medidas de dispersión son: Rango: Es la medida de variabilidad más fácil de calcular. Se define como la diferencia que existe entre el valor mayor y el valor menor de una distribución, Se indica como R. Se calcula de la siguiente forma: R = Valor Mayor – Valor Menor Varianza: Específicamente, la varianza es una medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza; cuando más cerca estén las Xi a su medio menos es la varianza. La denotaremos por S2x o también por σ2. Fórmulas Varianza muestral 2 𝑆 = 𝑥𝑖 − 𝑋̅ 𝑛−1 Varianza poblacional 2 σ2 = 𝑥𝑖 − 𝑋̅ 𝑁 2 Xi = Es el valor de las observaciones en la muestra o de la población. = Media aritmética ƒi = Es la frecuencia absoluta de los intervalos de clase. N = Es el número de observaciones en la población. Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA n = Es el número de observaciones en la muestra. Desviación Estándar o típica Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la media. Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva de esta. A la desviación se le representa por la letra minúscula griega "sigma" (σ) o por la letra S mayúscula, según otros analistas. Desviación Estándar 𝑆= 𝑥−𝑋 2 𝑛−1 Ejemplo: Las ventas diarias de un almacén durante una semana cualquiera son las siguientes (en millones de pesos). Hallar el promedio de las venta y la desviación estándar Lunes Martes Miércoles Jueves Viernes Sábado Total 600 800 880 980 1.060 1.200 5520 *Media 5520 6 = 920 Solución. Elaboramos una tabla para facilitar los cálculos. Xi fi 𝒙𝒊 − 𝑿 𝟐 𝒇𝒊 Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 600 0 (600-920)2=102,400 800 0 (800-920)2=14,400 880 0 (880-920)2=1,600 980 0 (980-920)2=3,600 1060 0 (1060-920)2=19,600 1200 0 (1200-920)2=78,400 Total 220,000 Varianza 𝑆2 = 220,000 6−1 = 44000 Desviación estándar 𝑆= 44000=209.76 • Primero calculamos la media aritmética (promedio) El promedio de las ventas semanales es de $920.000.000 • Segundo, hallamos la desviación estándar La desviación estándar de las ventas es de $191.48 xi 600 (600920)2=102.400 800 (800920)2=14.400 880 (880920)2=1.600 980 (980920)2=3.600 1.060 (1.060920)2=19.600 1.200 (1.200920)2=78.400 5.520 220.000 Sumatoria, Σ = Ejercicio Calcula la varianza y desviación estándar de los siguientes valores * 3, 10, 2, 8, 7 Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA * 1, 2, 4, 5, 8, 10 1.2.3 Medidas de Posición También conocidas como Otras Medidas de Dispersión, son otras medidas o métodos que resultan ser más prácticos para precisar ciertas situaciones en las que se busca describir la variación o dispersión en un conjunto de datos. Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor . Cuartiles Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Q 1 , Q 2 y Q 3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q 2 coincide con la mediana. Ejemplo Buscamos el lugar que ocupa cada cuartil mediante la expresión 𝑘⋅𝑁 4 , 𝐾= 1,2,3 Número impar de datos 2, 5, 3, 6, 7, 4, 9 Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Número par de datos 2, 5, 3, 4, 6, 7, 1, 9 Deciles (Di) Son los valores de la variable que dividen a la distribución en las partes iguales, cada una de las cuales engloba el 10 % de los datos. En total habrá 9 deciles. (Q2 = D5 = Me). Si se tienen una serie de valores X1, X2, X3... Xn, se localiza mediante las siguientes formulas: Cuando n es par. Cuando n es impar. 1.2.4 Representaciones Graficas 1. Diagrama de barras: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Consiste en levantar, para cada valor de la variable, una barra cuya altura sea su frecuencia absoluta o relativa, dependiendo de la distribución de frecuencias que estemos representando. Así, la representación gráfica de la distribución de frecuencias del ejemplo del nº de hijos será: 2. Diagrama de frecuencias acumuladas: Esta representación gráfica se corresponde con la de una función constante entre cada dos valores de la variable a representar, e igual en cada tramo a la frecuencia relativa acumulada (o absoluta acumulada si se trata de representar una distribución de frecuencias absolutas) hasta el menor de los dos valores de la variable que construyen el tramo en el que es constante. También para el ejemplo del Número de Hijos, se tendrá un diagrama de frecuencias acumuladas como el del siguiente gráfico: Representaciones Gráficas Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Tras la recogida de datos, su ordenación y cuantificación, es útil la representación gráfica, ésta nos permite con un simple vistazo obtener información relevante de la población o la muestra. Hay distintos tipos de representación de datos, dependiendo de qué tipo de carácter estemos estudiando (cualitativo, cuantitativo discreto o continuo) e incluso dentro de un tipo hay representaciones que resumen mejor un determinado concepto que otro. En el siguiente cuadro resumiremos los distintos tipos de representación gráfica y a qué tipo de carácter se aplica. Gráfica Diagrama de sectores Diagrama de barras Diagrama de barras acumulado Histograma Poligonal de frecuencias Pictograma Cartograma Tipo de datos Caracteres cualitativos y cuantitativos Caracteres cualitativos y cuantitavos discretos Caracteres cuantitativos discretos Caracteres cuantitativos continuos Caracteres cuantitativos discretos y continuos Caracteres cualitativos y cuantitativos Caracteres cualitativos y cuantitativos Diagrama de sectores. Se toma un círculo y se divide en tantos sectores como clases tengamos, siendo el arco del círculo proporcional a las frecuencias absolutas (también lo podemos hacer con las frecuencias relativas o porcentajes). Para determinar el arco circular que corresponde a cada clase relacionamos el total de observaciones con los 360º grados de la circunferencia. Los grados de cada clase vendrán dados por Ejemplo Los resultados en la primera evaluación de un curso de Bachillerato son los siguientes: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA aprobados 1 suspenso 2 suspensos 3 suspensos 4 o más 7 8 9 5 3 Polígono de frecuencias Se obtiene uniendo con segmento los puntos de coordenadas (xi, ni) en el caso en que tomemos las frecuencias absolutas, si fuesen las relativas cambiaríamos n i por f i. El número de habitantes por vivienda en Andalucía en 2001, según el Instituto Andaluz de Estadística, es el que se adjunta en la tabla, vamos a representar un polígono de frecuencias. Nº Residentes Viviendas 1 persona 444.390 2 personas 551.618 3 personas 477.622 4 personas 573.254 5 personas 244.544 6 personas 81.973 Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 7 personas 26.793 8 personas 9.989 9 personas 3.712 10 o más personas 3.284 1.3 Datos agrupados Los datos agrupados son como lo indica su nombre, una cantidad dada de datos que puede clasificarse, ya sea por sus cualidades cualitativas o cuantitativas, y por tal agruparse para su análisis. Estos datos por lo general son aconsejable agruparles cuando su población cuenta con alrededor de 20 o más elementos que comparten una característica y caben dentro de una categorización (repeticiones de un valor). Tablas de frecuencia: http://www.portaleducativo.net/pais/es/octavo- basico/791/Tablas-de-frecuencias-con-datos-agrupados 1.3.1 Medidas de tendencia central Media Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Ejemplo: En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la media. Xi fi fi Xi (10, 20) 15 1 15 (20, 30) 25 8 200 (30, 40) 35 10 350 (40, 50) 45 9 405 (50, 60) 55 8 440 (60, 70) 65 4 260 (70, 80) 75 2 150 42 1820 𝑋̅ = 1820 = 43.33 42 Mediana La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre. N / 2 Luego calculamos según la siguiente fórmula: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Li-1 :es el límite inferior de la clase donde se encuentra la mediana N / 2 :es la semisuma de las frecuencias absolutas. Fi-1 :es la frecuencia acumulada anterior a la clase mediana. fi : es la frecuencia absoluta del intervalo mediano. ti :es la amplitud de los intervalos. Moda Es el valor que representa la mayor frecuencia absoluta. La moda se representa por Mo Li: Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta). fi : Frecuencia absoluta del intervalo modal. fi-1 : Frecuencia absoluta del intervalo anterior al modal. fi+1 : Frecuencia absoluta del intervalo posterior al modal. t : amplitud de los intervalos. EJEMPLO En la siguiente tabla se muestran las edades de un grupo de personas. 1°Calculemos la media aritmética: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 2°Ahora calculemos la mediana (Me) N / 2 = 31 / 2 ⇒ 15,5 Ahora debemos buscar el intervalo donde la frecuencia acumulada (Fi ) contenga el valor obtenido (15,5). Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 3° Calculemos la moda Mo : Lo primero que debemos hacer es identificar el intervalo modal: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 1.3.2 Medidas de dispersión Varianza 2 𝑆 = 𝑛 ̅ 2 𝑖=1 𝑓𝑖 (𝑥𝑖 𝑋 ) 𝑛−1 Desviación estándar 𝑆= 𝑛 ̅ 2 𝑖=1 𝑓𝑖 (𝑥𝑖 𝑋 ) 𝑛−1 Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 1.3.3 Medidas de posición Las medidas de posición nos facilitan información sobre la serie de datos que estamos analizando. La descripción de un conjunto de datos, incluye como un elemento de importancia la ubicación de éstos dentro de un contexto de valores posible. Las más usadas son: los cuartiles (cuartas partes), los deciles (decimas partes) y los centiles o percentiles (centésimas partes). Cuartiles El cálculo para los cuartiles se determina a través de la siguiente expresión: Donde k Orden del cuartil Límite inferior del intervalo que contiene al cuartil Frecuencia acumulada considerada al intervalo donde se encuentra Frecuencia del intervalo que contiene el cuartil n A Número de mediciones Amplitud del intervalo Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Considere el siguiente ejemplo: Un reporte de laboratorio indica el número de pacientes que en los primeros 100 días del año recibieron peticiones por parte de una clínica, de reportes clínicos para realizar estudios de glucosa. Intervalos Promedio de días Número de pacientes Frecuencia acumulada 1 día a 9 días 5 5 5 10 día a 19 días 14.5 6 11 20 día a 29 días 24.5 8 19 30 día a 39 días 34.5 8 27 40 día a 49 días 44.5 4 31 50 día a 59 días 54.5 5 36 60 día a 69 días 64.5 7 43 70 día a 79 días 74.5 8 51 80 día a 89 días 84.5 4 55 90día a 100 días 94.5 8 63 Nota: La clase donde se ubica el segundo cuartil está marcado por El tercer cuartil está marcado por El número de datos a considerar son 63 pacientes. Para la obtención del primer cuartil tenemos k=1, obteniendo: Lo que representa que el primer cuartil se encuentre en la tercera clase, sus datos están dados como por lo que el primer cuartil es igual a Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Lo que indica que 25 % de los pacientes fueron mandados a valoración de glucosa en 25.34 días y el 75% de los pacientes atendidos lo hicieron después de 25.34 días. *Nótese que la consideración para elegir la consideración del primer cuartil se hizo considerando la frecuencia acumulada y de esta manera se utilizara para el resto. Para la obtención del segundo cuartil consideraremos k=2 por lo que Deciles Representación para los deciles La ecuación para el cálculo de los deciles se modifica ligeramente, en la fórmula empleada para los cuartiles se cambia por y en la expresión se cambia el cuatro por 10, quedando: Para el caso del cuarto decil realicemos: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Intervalos Promedio de días Número de pacientes Frecuencia acumulada 1 día a 9 días 5 5 5 10 día a 19 días 14.5 6 11 20 día a 29 días 24.5 8 19 30 día a 39 días 34.5 8 27 40 día a 49 días 44.5 4 31 50 día a 59 días 54.5 5 36 60 día a 69 días 64.5 7 43 70 día a 79 días 74.5 8 51 80 día a 89 días 84.5 4 55 90día a 100 días 94.5 8 63 Nota: El cuarto decil se localiza en la clase marcada con El quinto decil que corresponde a la mediana o segundo cuartil es marcado por Considerando Sustituyendo en la fórmula tenemos: Lo que indica que el 40% de los pacientes atendidos a petición de la clínica, para análisis de glucosa, se realizó en 36.975 días. Percentiles Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA La generalización para m divisiones de la información de puede dar como: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 2.1 Teoría de conjuntos 2.1.1Definición y operaciones básicas con conjuntos Conjunto: Es una colección de elementos considerada en sí misma como un objeto. Los elementos de un conjunto pueden ser cualquier cosa: personas, números, colores, letras, figuras, etc. Existen unas operaciones básicas que permiten manipular los conjuntos y sus elementos, similares a las operaciones aritméticas, constituyendo el álgebra de conjuntos: Unión. La unión de dos conjuntos A y B es el conjunto A ∪ B que contiene cada elemento que está por lo menos en uno de ellos. Ejemplo: Sean los conjuntos A={ 1, 3, 5, 7, 9 } y B={ 10, 11, 12 } A È B ={ 1, 3, 5, 7, 9, 10, 11, 12 } Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Intersección. La intersección de dos conjuntos A y B es el conjunto A ∩ B que contiene todos los elementos comunes de A y B. Ejemplo: Sean Q={ a, n, p, y, q, s, r, o, b, k } y P={ l, u, a, o, s, r, b, v, y, z } Q P={ a, b, o, r, s, y } Diferencia. La diferencia entre dos conjuntos A y B es el conjunto A \ B que contiene todos los elementos de A que no pertenecen a B. Complemento. El complemento de un conjunto A es el conjunto A∁ que contiene todos los elementos (respecto de algún conjunto referencial) que no pertenecen a A. Ejemplo: Sea U = { 1, 2, 3, 4, 5, 6, 7, 8, 9 } A= { 1, 3, 5, 7, 9 } donde A Ì U Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA El complemento de A estará dado por: A'= { 2, 4, 6, 8 } Diferencia simétrica La diferencia simétrica de dos conjuntos A y B es el conjunto A Δ B con todos los elementos que pertenecen, o bien a A, o bien a B, pero no a ambos a la vez. Ejemplo: Sea A= { a, b, c, d } y B= { a, b, c, g, h, i } A - B= { d } En el ejemplo anterior se observa que solo interesan los elementos del conjunto A que no estén en B. Si la operación fuera B – A el resultado es B – A = { g, h, i } E indica los elementos que están en B y no en A. Producto cartesiano. El producto conjunto A × B que contiene cartesiano de todos los pares dos conjuntos A y B es ordenados (a, b) cuyo el primer elemento a pertenece a A y su segundo elemento b pertenece a B. Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 1.2.2 Técnicas de conteo (permutaciones y combinaciones) Principio multiplicativo: El principio multiplicativo es aplicable cuando el experimento se puede descomponer en un conjunto de acciones secuenciales o independientes, de modo que cada resultado del experimento se conforma con una posibilidad de cada una de esas acciones. Diagramas de árbol: Es una herramienta gráfica que permite enumerar todas las posibles maneras de realizar un conjunto de acciones secuenciales o independientes. Ejemplo: MONEDAS. Considere el experimento consistente en lanzar una moneda tres veces consecutivas y observar, cada vez, la cara que queda hacia arriba. La primera vez que se lanza la moneda, la cara que queda hacia arriba puede ser águila o sol; la segunda vez que se lanza, también la cara que queda hacia arriba puede ser águila o sol, sin importar lo que haya caído la primera vez; lo mismo puede ocurrir la tercera vez que se lanza la moneda. Entonces, el diagrama de árbol correspondiente es: El número de maneras en que puede caer la moneda tres veces consecutivas es: 222 = 8 Factorial de un número Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Es el producto consecutivo de todos los números enteros, desde el uno hasta el número dado n, inclusive. Notación: n! Ejemplo: Permutación: Se llaman permutaciones de n objetos a las diferentes maneras en que se pueden ordenar esos n objetos; todas las permutaciones constan de los mismos n elementos, pero se consideran diferentes, por el orden en que se colocan éstos. Notación: P (el orden importa) 𝒏𝑷𝒓 = 𝒏! (𝒏 − 𝒓)! Donde: n= es el número de cosas que puedes elegir r= es el número de cosas que eliges de n Ejemplos: Nuestro "ejemplo de elegir en orden 3 bolas de 16" sería: 16! 16! = (16-3)! 20,922,789,888,000 = 13! = 3360 6,227,020,800 ¿De cuántas maneras se pueden dar primer y segundo premio entre 10 personas? Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 10! 10! 3,628,800 = = (10-2)! = 90 8! 40,320 (que es lo mismo que: 10 × 9 = 90) Combinación: También hay dos tipos de combinaciones (recuerda que ahora el orden no importa): Se puede repetir: como monedas en tu bolsillo (5,5,5,10,10) Sin repetición: como números de lotería (2,14,15,27,30,33) Combinaciones sin repetición Ya sabemos que 3 de 16 dan 3360 permutaciones. Ejemplo Entonces, nuestro ejemplo de bolas de billar (ahora sin orden) es: 16! 16! = 3!(16-3)! 20,922,789,888,000 = = 560 3!×13! 6×6,227,020,800 O lo puedes hacer así: 16×15×14 3360 = 3×2×1 = 560 6 da las mismas combinaciones que elegir 13 bolas de 16. Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 16! 16! = 3!(16-3)! 16! = 13!(16-13)! = 560 3!×13! 2.2 Teoría elemental de la probabilidad de eventos 2.2.1 Conceptos de probabilidad, espacio muestral, eventos. Probabilidad (http://www.jfinternational.com/mf/ejercicios- probabilidades.html) El concepto de probabilidad proviene del término latino probabilĭtas. Se entiende por probabilidad como aquella posibilidad que hay entre diversas posibilidades de que un determinado hecho suceda. Es decir que es aquello que puede suceder o pasar. Espacio muestral Se llama espacio muestral (E) asociado a un experimento aleatorio, el conjunto de todos los resultados posibles de dicho experimento. Al lanzar una moneda, el espacio muestral es E = {sale cara, sale sello} o E = {c, s}. Al lanzar un dado de seis caras, el espacio muestral es: E = {sale 1, sale 2, sale 3, sale 4, sale 5, sale 6} o E = {1, 2, 3, 4, 5, 6} Al lanzar dos monedas, el espacio muestral es Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA E = {(c,c), (c,s), (s,c), (s,s)}. Al lanzar tres monedas, el espacio muestral es: E = {(c,c,c), (c,c,s), (c,s,c), (c,s,s), (s,c,c), (s,c,s), (s,s,c), (s,s,s)} Eventos Se llama evento o suceso a todo subconjunto de un espacio muestral. Por ejemplo en el espacio muestral E = {1, 2, 3, 4, 5, 6} del lanzamiento de un dado, los siguientes son eventos: 1. Obtener un número primo A = {2, 3, 5} 2. Obtener un número primo y par B = {2} 3. Obtener un número mayor o igual a 5 C = {5, 6} 2.2.2 Axiomas y teoremas Los axiomas de probabilidad son las condiciones mínimas que deben verificarse para que una función definida sobre un conjunto de sucesos determine consistentemente sus probabilidades. Fueron formulados por Kolmogórov en 1933. Dado un conjunto de sucesos elementales, Ω, sobre el que se ha definida una σálgebra (léase sigma-álgebra) σ de subconjuntos de Ω y una función P que asigna valores reales a los miembros de σ, a los que denominamos "sucesos", se dice que P es una probabilidad sobre (Ω,σ) si se cumplen los siguientes tres axiomas. [P1]Primer axioma La probabilidad de un suceso es un número real mayor o igual que 0. [P2]Segundo axioma La probabilidad del total, , es igual a 1, es decir, Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA [P3]Tercer axioma Si son sucesos mutuamente excluyentes (incompatibles dos a dos, disjuntos o de intersección vacía dos a dos), entonces: . Según este axioma se puede calcular la probabilidad de un suceso compuesto de varias alternativas mutuamente excluyentes sumando las probabilidades de sus componentes. Los siguientes teoremas se deducen directamente de los axiomas anteriores. Teorema 1: Si P(Ø)=0 Demostración: Sea A un conjunto, entonces A y Ø son disyuntos y AUØ = A Por [P3], P(A)= P(AUØ)= P(A)+P(Ø), restando P(A) de ambos lados obtenemos el resultado. Teorema 2: Si Ac es el complemento de un evento A, entonces P(Ac)= 1 – P(A) Demostración: El espacio muestral S se puede descomponer en los eventos A y Ac mutuamente exclusivos, esto es, S= A U Ac. Por [P2] y [P3] se obtiene: 1 = P(S) = P(A U Ac) = P(A) + P(Ac) de lo cual se desprende el resultado. Teorema 3: Si A C B , entonces B se puede descomponer en los eventos A y B\A mutuamente exclusivos. Así: P(B) = P(A) + P(B\A), con lo cual se comprueba el enunciado puesto que P(B\A) ≥ 0. Teorema 4: Si A y B son dos eventos, entonces P(A\B) = P(A) – P(A ∩ B) Demostración: A se puede descomponer en los eventos mutuamente exclusivos A\B y A ∩ B: esto es, A= (A\B) U (A ∩ B). Por consiguiente, por Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA [P3], P(A) = P (A\B) + P(A∩ B) de lo cual se obtiene el resultado. Teorema 5: Si A y B son dos eventos, entonces P(A U B) = P(A)+ P(B) – P(A∩ B) Demostración: Obsérvese que AUB se puede descomponer en los eventos A\B y B mutuamente exclusivos; esto es, AUB= (A\B)UB. Entonces por [P3] y el teorema 4, P(AUB)= P(A\B)+ P(B) =P(A) – P(A∩ B) + P(B) = P(A) + P(B) – P(A∩ B) , que es el resultado buscado. Aplicando el teorema anterior por segunda vez obtenemos el Corolario 6: Para los eventos A,B y C. P(AUBUC)=P(A)+P(B)+P(C)–P(A∩B)-P(A∩C) – P(B∩C) + P(A∩B∩C) 2.2.3 Regla de adición La regla de la adición o regla de la suma establece que la probabilidad de ocurrencia de cualquier evento en particular es igual a la suma de las probabilidades individuales, si es que los eventos son mutuamente excluyentes, es decir, que dos no pueden ocurrir al mismo tiempo. P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B P(A o B) = P(A) + P(B) − P(A y B) si A y B son mutuamente excluyente. son no excluyentes. Siendo: P(A) = probabilidad de ocurrencia del evento A. P(B) = probabilidad de ocurrencia del evento B. P(A y B) = probabilidad de ocurrencia simultánea de los eventos A y B. 2.2.4 Regla de multiplicación Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Establece que la probabilidad de ocurrencia de dos o más eventos estadísticamente independientes es igual al producto de sus probabilidades individuales. P(A y B) = P(A ∩ B) = P(A)xP(B) si A y B son independientes. P(A y B) = P(A ∩ B) = P(A)xP(B|A) si A y B son dependientes. Ejemplo: Un lote contiene "100" objetos de los cuales "20" son defectuosos. Los objetos son seleccionados uno después del otro para ver si ellos son defectuosos. Suponga que dos objetos son seleccionados sin reemplazamiento (significa que el objeto que se selecciona al azar se deja por fuera del lote). ¿Cuál es la probabilidad de que los dos objetos seleccionados sean defectuosos? Solución: Sea los eventos A1 = {primer objeto defectuoso}, A2 {segundo objeto defectuoso} Entonces dos objetos seleccionados serán defectuosos, cuando ocurre el evento A1∩ A2 que es la intersección entre los eventos A1 y A2. De la información dada se tiene que: P(A1) = 20/100 ; P(A2/A1) = 19/99 así probabilidad de que los dos objetos seleccionados sean defectuosos es P(A1 ∩ A2) = P(A1) P(A2/A1) (20/100)(19/99) 19/495 = 0.038 Ahora suponga que selecciona un tercer objeto, entonces la probabilidad de que los tres objetos seleccionados sean defectuosos es P(A1 ∩ A2 ∩ A3) = P(A1) P(A2/A1) P(A3/A1∩A2) Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA (20/100)(19/99)(18/98) 19/2695 = 0.007 2.2.5 Probabilidad condicional “Probabilidad de que ocurra el suceso A, condicionado a que el suceso B haya ocurrido ya” Sean dos sucesos A y B ∈ β, con P ( B ) > 0 Si P ( A ) > 0 Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 2.2.6 Teorema de Bayes El Teorema de Bayes nos expresa la probabilidad de que ocurra un suceso determinado, Aj , condicionado a que el suceso B ya ha ocurrido. Las probabilidades P( Aj ) se designan probabilidades a “priori”, o probabilidades de las causas. Las probabilidades P ( Aj / B ) se designan probabilidades a “posteriori”, si el suceso B ya ha ocurrido, probabilidad de que sea debido a la causa. Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Ejemplo. Una empresa farmacéutica tiene tres delegaciones, Madrid, Barcelona y Granada. De un determinado fármaco se produce el 45% en la delegación de Madrid, el 30% en Barcelona, y el 25% en Granada. Del total de los fármacos, son defectuosos el 5% de los producidos en Madrid, el 3% en Barcelona y el 4% en Granada. Calcular: 1. Probabilidad de que un fármaco sea defectuoso 2. Si un fármaco es defectuoso, ¿cuál es la probabilidad de que haya sido producido por la delegación de Granada? A1 : “Producido Madrid”, A2 : “Producido Barcelona” A3 : “Producido Granada”, B : “Defectuoso” P( A1) = 0.45; P( A2 ) = 0.30; P( A3) = 0.25 P(B/A1 ) = 0.05; P(B /A2 ) = 0.03; P(B /A3 ) = 0.04 1.- 2.- Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Ejemplo. En una población el 51% de las personas son mujeres, el 18% tienen la tensión alta y el 10% ambas cosas. Obtener: 1. Probabilidad de que una persona tenga la tensión alta si es mujer 2. Probabilidad de ser hombre si se tiene la tensión alta 3. Probabilidad de ser mujer si no se tiene la tensión alta A : “Ser Mujer”, B : “Tener la tensión alta” P ( A ) = 0.51; P ( B ) = 0.18; P ( A ® B ) = 0.10 Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 3.1 Definición de variable aleatoria (v.a.) Una variable aleatoria (v.a.) es un número real asociado al resultado de un experimento aleatorio, es decir, una función real en el espacio muestral. Variable Aleatoria Discreta. Una variable aleatoria discreta es aquella que sólo puede tomar valores enteros. Ejemplos: - El número de hijos de una familia, la puntuación obtenida al lanzar un dado. Variable Aleatoria Continua Es aquella que puede tomar todos los valores posibles dentro de un cierto intervalo de la recta real. Ejemplos: - La altura de los alumnos de una clase -Las horas de duración de una pila. 3.2 Propiedades de la variable aleatoria 3.2.1 Valor esperado. La esperanza matemática o valor esperado es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Si todos los sucesos son de igual probabilidad la esperanza es la media aritmética. La esperanza también se suele simbolizar con Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 3.2.2 Varianza. 3.2.3 Desviación estándar 3.3 Distribución Binomial En estadística, la distribución binomial es una distribución de probabilidad discreta que cuenta el número de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad fija p de ocurrencia del éxito entre los ensayos. Su función de probabilidad es donde Siendo de en las combinaciones de en ( elementos tomados ) Ejemplo Supongamos que se lanza un dado (con 6 caras) 50 veces y queremos conocer la probabilidad de que el número 3 salga 20 veces. En este caso tenemos una X ~ B(50, 1/6) y la probabilidad sería P(X=20): Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Propiedades de la distribución: 𝑬[𝒙] = 𝝁 = 𝑛 ⋅ 𝑝 𝝈𝟐 = 𝑛 ⋅ 𝑝 ∙ 𝑞 𝝈= 𝑑𝑜𝑛𝑑𝑒 𝑞 = (1 − 𝑝) 𝑛⋅𝑝∙𝑞 3.4 Distribución Hipergeométrica Es una distribución discreta relacionada con muestreos aleatorios y sin reemplazo. La diferencia más simple con la binomial es la forma de aplicar el muestreo. En efecto, en: Binomial: Muestreo con reemplazamiento e independencia de pruebas ó ensayos. Hipergeométrica: Muestreo sin reemplazamiento y sin independencia entre pruebas o ensayos. Sus aplicaciones están en áreas con uso considerable de muestreo de aceptación, pruebas electrónicas y de aseguramiento de la calidad, fabricación de piezas, etc. Propiedades de la distribución: 𝒂 Media de X = 𝜇 = (𝒏) (𝒏) 𝑉𝑎𝑟. 𝑑𝑒 𝑋 = 𝜎 2 = (𝒏)(𝒂)(𝑵 − 𝒂)(𝑵 − 𝒏) (𝑵𝟐 )(𝑵 − 𝟏) 𝐷𝑒𝑠𝑣. 𝐸𝑠𝑡. = 𝝈 = √𝑽𝒂𝒓 𝒅𝒆 𝑿 Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Ejemplo: Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos? Solución: N = 10 objetos en total a = 3 objetos defectuosos n = 4 objetos seleccionados en muestra x = 2 objetos defectuosos deseados en la muestra Donde: Probabilidad asociada a cada muestra de 4 objetos que se seleccionaron, con lo que se demuestra que las probabilidades no son constantes Formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados = muestras de 4 objetos entre los que 2 son defectuosos Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Como se observa en el desarrollo de la solución del problema, la pretensión es demostrar que las probabilidades asociadas a cada uno de los resultados no son constantes. Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar sería: Ejemplos: Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos? Solución: a) N = 9+6 =15 total de tabletas a = 6 tabletas de narcótico n = 3 tabletas seleccionadas x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de narcótico que se puede encontrar al seleccionar las 3 tabletas p(viajero sea arrestado por posesión de narcóticos) = p(de que entre las 3 tabletas seleccionadas haya 1 o más tabletas de narcótico). a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión de narcóticos? Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Otra forma de resolver; p(el viajero sea arrestado por posesión de narcóticos) = 1 – p(de que entre las tabletas seleccionadas no haya una sola de narcótico) b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos? Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 3.5 Distribución Poisson Es una distribución de probabilidad discreta que expresa, a partir de una frecuencia de ocurrencia media, la probabilidad de que ocurra un determinado número de eventos durante cierto período de tiempo. Concretamente, se especializa en la probabilidad de ocurrencia de sucesos con probabilidades muy pequeñas, o sucesos "raros". La función de masa o probabilidad de la distribución de Poisson es donde k es el número de ocurrencias del evento o fenómeno λ es un parámetro positivo que representa el número de veces que se espera que ocurra el fenómeno durante un intervalo dado. e es la base de los logaritmos naturales (e = 2,71828...) Propiedades de la distribución: Media: λ Var(x): λ Desv. Est: 𝛌 3.6 Distribución Uniforme Ejemplo: Si el 2% de los libros encuadernados en cierto taller tiene encuadernación defectuosa, para obtener la probabilidad de que 5 de 400 libros encuadernados en este taller tengan encuadernaciones defectuosas usamos la distribución de Poisson. En este caso concreto, k es 5 y, λ, el valor esperado de libros defectuosos es el 2% de 400, es decir, 8. Por lo tanto, la probabilidad buscada es Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 3.6 Distribución Geométrica La distribución Geométrica también está relacionada con una secuencia de ensayos de Bernoulli, excepto que el número de ensayos no es fijo. En consecuencia, la distribución geométrica hereda las características de la distribución binomial, a excepción del concepto del cual se quiere calcular la probabilidad. En este caso la variable aleatoria de interés, denotada mediante X, se define como el número de ensayos requeridos para lograr el primer éxito. Es obvio que para obtener el primer éxito se debe realizar el experimento cuando menos una vez, por lo que los valores que puede tomar la variable aleatoria X son 1, 2, 3, ... , n, esto es, no puede tomar el valor cero. En este caso se cumple que (X = x) si y sólo si los primeros (x – 1) ensayos son fracasos (q) y el x-ésimoensayo es éxito (p), por lo que: P(X = x) = Ejemplo. Se lanza un dado hasta que aparece el número 6. ¿Cuál es la probabilidad de que el número de lanzamientos sean 3? Solución. En este problema el éxito es la aparición del número 6 y la probabilidad de que salga el número 6 al lanzar un dado es 1/6, por lo que p = 1/6 y q = 5/6. Como nos interesa calcular la probabilidad de que el 6 aparezca en el tercer lanzamiento, entonces: P(X = 3) = ( )3-1 ( ) = ( )2 ( ) = 0.1157 Ejemplo. La probabilidad de que cierto análisis clínico dé una reacción positiva es 0.4. Los resultados de los análisis son independientes unos de otros ¿Cuál es la probabilidad de que la primera reacción positiva ocurra antes del tercer análisis? Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Solución. Aquí el éxito es que salga una reacción positiva, por lo que p = 0.4 y q = 0.6. Si la primera reacción positiva debe aparecer antes del tercer análisis, entonces: P(X < 3) = P(X = 1) + P(X = 2) = (0.6) 1-1 (0.4) + (0.6)2-1 (0.4) = 0.64 Ejemplo Se tienen 4 llaves de las cuales sólo una abre un candado. Se prueban las llaves una tras otra, con reemplazo, hasta encontrar la que abre el candado. Calcular la probabilidad de que el candado se abra después del segundo intento. Solución. Si seleccionamos una llave al azar, la probabilidad de que éste abra el candado es ¼ y como el éxito es que se abra el candado, entonces p = ¼ = 0.25 y q = 0.75. Deseamos encontrar P(X>2). Sabemos que P(X>2) = 1 – P(X 2) y que: P(X 2) = P(X = 1) + P(X = 2) = [(0.75) 1-1 (0.25) + (0.75)2-1(0.25)] = 0.4375 Por lo tanto: P(X>2) = 1 – 0.4375 = 0.5625 Ejemplo Tres personas lanzan una moneda y el disparejo paga el café. Si los tres resultados son iguales, las monedas se lanzan nuevamente. Encontrar la probabilidad de que se necesiten menos de 4 intentos para saber quién paga el café. Solución. En este problema el éxito consiste en sacar el disparejo. Lo primero que debemos hacer para resolver el problema, es encontrar el espacio muetral correspondiente al lanzamiento de 3 monedas: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA S = {(c, c, c) (c, c, +) (c, +, c) (+, c, c) (c, +, +) (+, c, +) (+, +, c) (+, +, +)} Podemos apreciar que la magnitud del espacio muestral es 8 y que es un espacio equiprobable. El número de resultados en que aparece el disparejo es 6, por lo que p = 6/8 = 0.75 y q = 0.25. Si queremos obtener la probabilidad de que se necesiten menos de 4 intentos para saber quién paga el café, entonces: P(x<4) = P(x = 1) + P(x = 2) + P(x = 3) = (0.25)1-0 (0.75) + (0.25)2-1 (0.75) + (0.25)3-1 (0.75) = 0.9844 Media y Variancia La media y la variancia de la distribución Geométrica se obtiene en la forma siguiente: Ejemplo Se lanzan 2 dados hasta que la suma de los números que aparecen sea 7. Calcular: a) La esperanza del número de lanzamientos que se necesiten. b) La variancia del número de lanzamientos que se necesiten. Solución. El éxito en este experimento es que la suma de los números que aparecen sea 7, por lo que el primer paso es el cálculo de su probabilidad. En problemas anteriores hemos visto que la magnitud del espacio muestral de este experimento es 36. Ahora calculemos el número de formas posibles en que aparece el 7. Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Los posibles resultados son: {(1, 6) (2, 5) (3, 4) (4, 3) (5, 2) (6, 1)} y aplicando la función de conjunto aditivo vemos que son 6 resultados, por lo que p = 6/36 = 1/6 y q = 5/6. a) Sabemos que para calcular el valor esperado utilizamos el modelo matemático que dice y sustituyendo valores b) La variancia del número de lanzamientos se calcula con: 3.7 Distribución Uniforme La distribución Uniforme es el modelo (absolutamente) continuo más simple. Corresponde al caso de una variable aleatoria que sólo puede tomar valores comprendidos entre dos extremos a y b, de manera que todos los intervalos de una misma longitud (dentro de (a, b)) tienen la misma probabilidad. También puede expresarse como el modelo probabilístico correspondiente a tomar un número al azar dentro de un intervalo (a, b). De la anterior definición se desprende que la función de densidad debe tomar el mismo valor para todos los puntos dentro del intervalo (a, b) (y cero fuera del intervalo). Es decir: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Propiedades de la distribución: Ejemplo.. Se sabe que el peso X de ciertos bloques de acero, es una variable aleatoria continua distribuida uniformemente en el intervalo [50,70] toneladas. Encontrar: a) La función de densidad de la variable. Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 4.1 Definición de variable continua Variable Continua Una variable continua es una variable cuantitativa que puede tomar valores comprendidos entre dos números. Un atributo esencial de una variable continua es que, a diferencia de una variable discreta, nunca puede ser medida con exactitud; el valor observado depende en gran medida de la precisión de los instrumentos de medición. Con una variable continua hay inevitablemente un error de medida. Como ejemplo, la estatura de una persona (1.71m, 1.719m, 1.7154m....) 4.2 Propiedades de la variable aleatoria continua 4.2.1 Valor esperado. La esperanza matemática o valor esperado es la suma del producto de la probabilidad de cada suceso por el valor de dicho suceso. Si todos los sucesos son de igual probabilidad la esperanza es la media aritmética. La esperanza también se suele simbolizar con 4.2.2 Varianza. Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 4.2.3 Desviación estándar 4.3 Distribuciones 4.3.1 Distribución uniforme Una de las distribuciones continuas más simples en Estadística es la Distribución Uniforme Continua. Esta se caracteriza por una función de densidad que es plana, y por esto la probabilidad es uniforme en un intervalo cerrado [A,B]. La función de densidad de la v.a.c. X en el intervalo [A,B] es Esta densidad forma un rectángulo con base B-A y altura 1/(B-A). A esta distribución a menudo se llama distribución rectangular. La media y la varianza de la distribución uniforme son Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 4.3.2 Distribución normal La Normal es la distribución de probabilidad más importante. Multitud de variables aleatorias continuas siguen una distribución normal o aproximadamente normal. Una de sus características más importantes es que casi cualquier distribución de probabilidad, tanto discreta como continua, se puede aproximar por una normal bajo ciertas condiciones. La distribución de probabilidad normal y la curva normal que la representa, tienen las siguientes características: La curva normal tiene forma de campana y un solo pico en el centro de la distribución. De esta manera, la media aritmética, la mediana y la moda de la distribución son iguales y se localizan en el pico. Así, la mitad del área bajo la curva se encuentra a la derecha de este punto central y la otra mitad está a la izquierda de dicho punto. La distribución de probabilidad normal es simétrica alrededor de su media. La curva normal desciende suavemente en ambas direcciones a partir del valor central. Es asintótica, lo que quiere decir que la curva se acerca cada vez más al eje X pero jamás llega a tocarlo. Es decir, las “colas” de la curva se extienden de manera indefinida en ambas direcciones. t Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 4.3.3 Distribución normal estándar (ejercicios http://www.academia.edu/4948120/EJERCICIOS_DISTRIBUCI%C3%93N_NORMAL_ESTANDAR) Si X tiene distribución normal con parámetros m y s, entonces: Z X Ejemplos: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 4.3.4 Aproximación de la binomial a la normal Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA 4.3.5 Aproximación de la poisson a la normal La distribución Poisson es aplicable a variables aleatorias discretas. Cuando el parámetro 𝜆 es mayor de 10, se puede aproximar a una distribución normal con 𝜇 = 𝜆 𝑦 𝜎 = √𝜆 . Teniendo en cuenta que la variable aleatoria X es discreta, al realizar la aproximación a la normal debe hacerse la corrección por continuidad. Ejemplo: En un hospital el número medio de pacientes con dolor abdominal atenidos por día es 16. Calcula la probabilidad de que un día determinado haya más de 25 pacientes con dolor abdominal. El número de pacientes con dolor abdominal puede considerarse un suceso de Poisson con 𝜆 = 16, teniendo en cuenta que 𝜆 > 10 se puede hacer una aproximación a una normal con 𝜇 = 16 𝑦 𝜎 = 4. La Probabilidad pedida es: Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Al realizar la aproximación a la normal hay que hacer la corrección por continuidad, por lo tanto, la probabilidad anterior queda de la siguiente manera: 4.3.6 Distribución exponencial Es una distribución de probabilidad continua con un parámetro cuya función de densidad es: Su función de distribución acumulada es: Donde representa el número e. El valor esperado y la varianza de una variable aleatoria X con distribución exponencial son: La distribución exponencial es un caso particular de distribución gamma con k = 1. Además la suma de variables aleatorias que siguen una misma distribución exponencial es una variable aleatoria expresable en términos de la distribución gamma. 4.3.7 Teorema de chebysheff Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Si X ∼ N(µ,σ) , entonces i.e., el 68% (aproximadamente) de los valores que tome la v.a. X estarán situados a una distancia de la media inferior a una desviación estándar. Análogamente, el 95% de los valores estarán situados a menos de 2 veces la desviación estándar, y un 99,7% de dichos valores se encontrarán dentro un radio de 3 sigma. Por lo tanto, para una distribución normal, la mayor parte de todos los valores yacen a tres desviaciones standard de la media. Los applets que aparecen a continuación permiten identificar los respectivos porcentajes del área bajo la curva: Unidad 5: Técnicas de Pérez Moreno Rogelio Jesús Muestreo PROBABILIDAD Y ESTADISTICA 5.1 Definición de muestreo probabilístico y no probabilístico Muestreo Es la rama de la Estadística que se encarga de definir las reglas para tomar muestras de una población específica, el tamaño de dichas muestras y los parámetros que indicarán la representatividad de éstas. La primera finalidad del muestreo es obtener muestras representativas de la población en estudio. Una muestra es representativa si es obtenida aleatoriamente. Se dice que el Muestreo es Aleatorio si cumple las siguientes características: 2. Todos los posibles resultados del experimento deben tener la misma posibilidad de ocurrir. 3. Los resultados deben ser independientes entre sí. 4. Muestreo probabilístico Los métodos de muestreo probabilísticos son aquellos que se basan en el principio de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente, todas las posibles muestras de tamaño n tienen la misma probabilidad de ser seleccionadas. Sólo estos métodos de muestreo probabilísticos nos aseguran la representatividad de la muestra extraída y son, por tanto, los más recomendables. Muestreo no probabilístico Es aquél para el que no se puede calcular la probabilidad de extracción de una determinada muestra. Por tal motivo, se busca seleccionar a individuos que tienen Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA un conocimiento profundo del tema bajo estudio y se considera que la información aportada por esas personas es vital para la toma de decisiones. 5.2 Determinación del tamaño de la muestra 𝜎 = Nivel de confianza. N = Población. p = Probabilidad a favor. q = Probabilidad en contra. e = Error de estimación. n= Muestra 5.3 Muestreo aleatorio simple Cuando se selecciona un grupo de n unidades muestrales de tal manera que cada muestra de tamaño n tenga la misma posibilidad de ser seleccionada. Este tipo de muestreos se aplica cuando todos los elementos de la población bajo estudio se encuentran agrupados de la misma forma, sin distingos de ninguna especie. Por ejemplo, un lote de artículos agrupados a granel en un solo contenedor. 5.4 Muestreo estratificado Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Consiste en separar los elementos de la población en grupos que no presenten traslapes, llamados estratos, y la selección posterior de una muestra aleatoria simple de cada estrato. La estratificación es la separación de los datos en grupos de la misma especie o que tienen el mismo origen. Se usa el término estratificación por una similitud con la manera en que las capas terrestres o estratos, forman la corteza de la tierra; por lo que cuando un grupo de datos con características importantes comunes se separa del total de datos disponibles, se dice que se estratifica. Algunos ejemplos de estratificación pueden ser: por turno, por proveedor de materia prima, por operario, por máquina, por semana, por método de trabajo, por molde, etcétera. Por ejemplo, los seres humanos pueden ser estratificados por sexo, por edad, por lugar de origen, etcétera. El muestreo aleatorio estratificado es aplicable cuando la población bajo estudio se encuentra agrupada en bloques perfectamente distinguibles y sin traslapes; por ejemplo, un lote de artículos que llega en m cajas. Un grupo de alumnos en un salón no es homogéneo, está dividido por el sexo de cada alumno, la carrera que estén estudiando, el semestre de avance, la edad, etcétera; en este caso, si se va a realizar un estudio con ellos, conviene estratificarlos. 5.5Muestreo por conglomerados Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA Cuando cada unidad de muestreo aleatorio es a su vez una colección o conglomerado de elementos. Las colonias de la Zona Metropolitana de la Ciudad de México, no pueden considerarse como estratos, porque las características de los habitantes en cada una de ellas, no pueden considerarse como semejantes; por ejemplo, el nivel socioeconómico de las familias no puede analizarse tomando a las colonias como estratos, porque en cada colonia existen niveles socioeconómicos diversos. Se utiliza cuando las unidades de la población presentan alguna forma de agrupamiento, que permite elegir grupos en lugar de individuos. 5.6 Muestreo sistemático Se obtiene al seleccionar aleatoriamente un elemento de los primeros k elementos en el marco y después seleccionar cada k-ésimo elemento a partir del primero. El muestreo sistemático es aplicable cuando la población bajo estudio se encuentra ordenada de alguna forma sistemática; por ejemplo, si al hacer un experimento, la característica que se está analizando, depende de la estatura de los miembros, es conveniente entonces, antes de aplicar el muestreo, ordenar a los miembros de la población por estatura (puede ser de mayor a menor o de menor a mayor) y aplicar el muestreo sistemático. También es aplicable el muestreo sistemático, cuando la población bajo estudio está surgiendo de una línea de producción; por ejemplo, si están saliendo de la línea de producción 10000 contactos de plata por hora y deseamos obtener una muestra de tamaño n=100, que sea representativa de la población producida en todo un turno Pérez Moreno Rogelio Jesús PROBABILIDAD Y ESTADISTICA de trabajo de 8 horas; entonces, tendríamos que sacar un contacto cada 800 producidos, lo cual significa sacar un contacto cada 5 minutos aproximadamente, a lo largo de todo el turno. Pérez Moreno Rogelio Jesús