Probabilidad TEMA 1: PROBABILIDAD Índice del tema 1 Índice del tema 1 _______________________________________________ 1 1.1. Introducción _______________________________________________ 2 1.2. Definición de probabilidad____________________________________ 3 1.2.1. Propiedades inmediatas ________________________________________ 3 Ejemplo 1 ______________________________________________________________ 7 Ejemplo 2 ______________________________________________________________ 8 Ejemplo 3 ______________________________________________________________ 9 1.3. Probabilidad condicionada __________________________________ 10 1.3.1. Introducción _________________________________________________ 10 1.3.2. Definición ___________________________________________________ 10 Ejemplo 4 _____________________________________________________________ 11 1.3.3. Sucesos independientes_______________________________________ 12 1.3.4. Teorema de las probabilidades totales ___________________________ 12 1.3.5. Teorema de Bayes ____________________________________________ 13 Ejemplo 5 _____________________________________________________________ 14 Ejemplo 6 _____________________________________________________________ 15 Ejemplo 7 _____________________________________________________________ 16 Ejemplo 8 _____________________________________________________________ 17 © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 1 Probabilidad 1.1. Introducción La probabilidad, desde un punto de vista conceptual, es la medida del grado de confianza en la verificación de determinado enunciado al realizar una experiencia. Por lo tanto, ya desde la misma introducción conceptual, podemos observar la probabilidad como una medida. Veamos los ejemplos siguientes: Ejemplo 1: Experiencia: Lanzamiento de un dado regular. Enunciado A: Obtener una puntuación igual o superior a cinco. La probabilidad de A será el grado de confianza que tenemos de obtener una puntuación mayor o igual a cinco al lanzar un dado regular. Ejemplo 2: Experiencia: Observación de la longitud del cuerpo de un individuo de la Especie Diplodus cervinus en una zona protegida del Mediterráneo. Enunciado A: Longitud por encima de los 35 cm. La probabilidad de A será el grado de confianza de que al observar un individuo de la especie supere los 35 cm, o lo que es equivalente, la proporción de individuos de la especie en la zona con longitud superior a 35 cm. Una vez introducida la idea intuitiva de probabilidad, es necesario construir una teoría matemática que permita desarrollar la idea y dotarla de la potencia y rigor suficientes con el fin de tener una herramienta útil en la solución tanto de problemas de aplicación como teóricos. Desde el punto de vista histórico, se han planteado varias formulaciones. Citemos brevemente las más interesantes. • Laplace define probabilidad de un suceso como el cociente del número de casos favorables entre el número de casos posibles, siempre que estos sean igualmente plausibles. Evidentemente, igualmente plausibles es sinónimo de equiprobables (con igual probabilidad) y ello da lugar a que en la definición ya se utilice el término a definir. Por otro lado esta definición da lugar a paradojas, como por ejemplo la paradoja de Bartrand. • Siguiendo con la idea de regularidad en la aparición de un resultado al realizar una larga serie de experimentos, se intenta (Venn, 1887 y Von Mises, 1918) definir la probabilidad de un suceso como el límite de las frecuencias relativas. Esta vía, si bien es muy intuitiva, resulta muy complicada de desarrollar desde el punto de vista teórico. • Finalmente, gracias al importante desarrollo del análisis matemático de principios de siglo, se adapta la probabilidad a la teoría de la medida, y se obtiene la axiomática de Kolmogorov (1933), que puede considerarse como el punto real de partida de la Teoría de la Probabilidad tal y como se estudia actualmente. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 2 Probabilidad De un modo sencillo, se puede decir que la probabilidad debe cumplir con ciertos requisitos (axiomas) para que realmente sea considerada como medida de la probabilidad. Como posteriormente se podrá comprobar, estos requisitos son muy lógicos y elementales, y permiten enlazar fácilmente la definición axiomática como tal con la idea intuitiva expuesta al principio. 1.2. Definición de probabilidad Sea Ω el conjunto de resultados ligados a la experiencia. Los enunciados sobre los que nos interesa medir el grado de confianza en su verificación se pueden asociar a las partes del conjunto de resultados y serán, por tanto, sucesos ligados a la experiencia. Por notación, S será el conjunto de sucesos. Diremos entonces que P: S → P A → P( A) es función de probabilidad, si se verifican las condiciones siguientes: P1) P( A) ≥ 0 ∀A ∈ S P2) P(Ω) = 1 P3) Para A1 , A2 ,... ∈ S siendo Ai ∩ A j = ∅ para todo i, j se cumple: ∞ ∞ P U Ai = ∑ P( Ai ) i =1 i =1 Por lo tanto, la probabilidad se trata de una medida positiva que se mueve entre 0 y 1 de tal modo que al tener la unión de sucesos incompatibles (sin resultados en común) la probabilidad del nuevo suceso es justo la suma de las probabilidades de los sucesos que forman la unión. 1.2.1. Propiedades inmediatas Algunas propiedades se pueden deducir directamente de la definición de probabilidad. Entre estas propiedades podemos destacar las siguientes: 1. P( ∅ ) = 0 La probabilidad del suceso imposible debe ser el mínimo del recorrido de la función de probabilidad. La explicación es muy lógica puesto que, al realizar la experiencia, es de esperar que se verifique algún resultado. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 3 Probabilidad 2. Si A y B son sucesos tales que A está contenido en B, se deduce que P ( A) ≤ P ( B ) Evidentemente, puesto que B contiene más resultados que A, y por tanto el grado de confianza que podemos depositar en B debe ser mayor que el grado de confianza que podemos depositar en A. 3. Si A es el suceso complementario de A (elementos de Ω que no pertenecen a A), se deduce que P( A ) = 1 - P(A). 4. Dados A y B sucesos, se verifica que: P ( A ∪ B) = P( A) + P( B) − P( A ∩ B ) 5. En caso de que los sucesos formados únicamente por un resultado sean equiprobables, la probabilidad de un suceso cualquiera es el cociente entre el número de resultados que contiene el suceso (casos favorables) respecto del número total de resultados posibles (casos posibles). 6. Dados A1 , A2 ,...., An ∈ S , se verifica: n n P I Ai ≥ 1 − ∑ P Ai i =1 i =1 ( ) Vamos a demostrar algunas de estas propiedades: Demostración de 1: Puesto que Ω = Ω ∪ ∅ siendo Ω ∩ ∅ = ∅ , por el axioma P3 P (Ω) = P (Ω) + P(∅) y, por el axioma P2, 1 = 1 + P(∅) con lo cual se deduce que P(∅) = 0 , tal y como queríamos demostrar. Demostración de 2: Podemos escribir B como © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 4 Probabilidad B = A ∪ ( B ∩ A) con lo cual, por el axioma P3, P ( B) = P( A) + P ( B ∩ A) y, por el axioma P1, P ( B ∩ A) ≥ 0 i obtenemos, P ( A ) ≤ P ( B) tal y como queríamos demostrar. Demostración de 3: Podemos escribir Ω como Ω = A∪ A y, por el axioma P3, P (Ω) = P ( A) + P( A) y, como que por el axioma P2 se verifica que P( Ω ) = 1 , se obtiene que P ( A) = 1 − P( A) Demostración de 4: Podemos escribir A ∪ B como, A ∪ B = A ∪ ( B ∩ A) De este modo, P ( A ∪ B) = P ( A) + P( B ∩ A) (*) y puesto que B = ( B ∩ A) ∪ ( B ∩ A) resulta P ( B ∩ A) = P ( B) − P ( B ∩ A) de donde sustituyendo en (*), P( A ∪ B) = P( A) + P( B) − P( A ∩ B) Demostración de 5: © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 5 Probabilidad Es una consecuencia directa de los axiomas P2 y P3. Se propone resolver la demostración al lector. Demostración de 6: Puesto que k A A = I i U i i =1 i =1 k según la propiedad 3, k k P I Ai = 1 − P U Ai i =1 i =1 y como ( ) k k P U Ai ≤ ∑ P Ai i =1 i =1 se verifica que ( ) k k P I Ai ≥ 1 − ∑ P Ai i =1 i =1 tal y como queríamos demostrar. Veamos algunos ejemplos en que se utilizan las propiedades anteriores. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 6 Probabilidad Ejemplo 1 Supongamos que se estudia la distribución de dos contaminantes A y B en un terreno. Sabemos que el 40 % de terreno padece el efecto de alguno de los contaminantes, que el 10 % padece el efecto de A y que el 5% padece el efecto de los dos. Deseamos saber el porcentaje de terreno bajo el efecto de B, el porcentaje sin efecto ni de A ni de B y el porcentaje de terreno que presenta contaminación por A pero no por B. Se calcula primero el porcentaje bajo el efecto de B. Para ello, se utiliza la propiedad 4: P ( A ∪ B) = P ( A) + P( B) − P( A ∩ B) 0.4 = 0.1 + P(B) - 0.05 y P(B) = 0.35 con lo cual se deduce que el 35 % del terreno presenta el contaminante B. Se calcula ahora el porcentaje de terreno sin contaminación por A o B. En este sentido, se debe calcular: P ( A ∩ B) = 1 − P ( A ∪ B) = 1-0.4 = 0.6 y resulta que el 60 % de terreno no está contaminado ni por A ni por B. Por último, se calcula el porcentaje de terreno que presenta contaminación por A, pero no por B. Se debe calcular: P ( A ∩ B) = P( A) − P( A ∩ B) = 0.1 - 0.05 = 0.05 de donde se deduce que el 5 % de terreno presenta contaminación por A pero no por B. Se ha visto en este ejemplo cómo, utilizando correctamente las propiedades inmediatas, se obtienen probabilidades de sucesos que no aparecen de entrada. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 7 Probabilidad Ejemplo 2 Supongamos que en una determinada zona localizada en la costa se encuentran N focas. Se capturan r focas y se marcan, y al cabo de 1 mes se capturan s focas contando el número de focas marcadas de entre las capturadas. Calcularemos la probabilidad de que hayan sido recapturadas exactamente k focas de entre las marcadas (se supone k menor que el mínimo entre r y s). En este caso la probabilidad será el número de casos favorables dividido por el número de casos posibles. Número de casos posibles: hay tantos casos posibles como subconjuntos de s elementos en un conjunto de N. Número de casos favorables: de entre los s debe haber k marcados y s-k no marcados; por tanto, el número de maneras posibles será el producto del número de subconjuntos de entre los r marcados de k elementos por el número de subconjuntos de entre los N-r no marcados de s-k elementos. Por tanto, r N − r x P(k focas marcadas) = k s − k N s Como nota complementaria podemos indicar que el número de focas de la zona se puede estimar mediante la fórmula: (r·s /k, aunque ello se podrá entender mejor a partir del capítulo de estimación. Para más detalles se puede buscar información en textos y artículos sobre estimación de contajes en marcaje-recaptura. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 8 Probabilidad Ejemplo 3 Una agencia de transporte de viajeros por carretera dispone de veinte autocares. Decide hacer un control mensual del servicio y, para ello, decide seleccionar dos autocares aleatoriamente de entre los veinte. Si realmente hay dos autocares con irregularides, ¿cual es la probabilidad de que se detecte con este control? ¿Y si son cinco los autocares con irregularidades? De entre los dos autocares que se examinan, se pueden encontrar 0,1 o 2 con irregularidades. El hecho de detectar irregularidades se puede asociar con el suceso A = Se hallan 1 o 2 irregularidades. Lo más sencillo será calcular la probabilidad del suceso complementario, y así, 18 2 P(0 irregularidades) = = 0.8 20 2 Por tanto la probabilidad de detectar irregularidades con el control propuesto será 0.20. Si son cinco los autocares con irregularidades, es fácil comprobar que la probabilidad de no detectar ninguna (mediante un cálculo idéntico al anterior) es 0.55 y, por tanto, la probabilidad de detectar irregularidades con el control propuesto pasa a ser de 0.45. Ejercicio Se propone al lector demostrar que para A1 ,..., Ak sucesos, se verifica: k k P U Ai = ∑ P( Ai ) − ∑ P( Ai ∩ A j ) + ∑ P( Ai ∩ A j ∩ Ak ) + ... + (−1) k +1 .P( A1 ∩ .. ∩ Ak ) i< j i =1 i =1 © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 9 Probabilidad 1.3. Probabilidad condicionada 1.3.1. Introducción Imaginemos que al realizar la experiencia descrita en el Ejemplo 1, supiéramos de antemano que el número resultante es un número par. Si nos fijamos, como en el ejemplo, en el suceso A = Obtener número mayor o igual que cuatro, se observa que la probabilidad de este suceso, es decir, el grado de confianza de que se haya verificado A, se ha alterado y, en nuestro caso, realmente ha aumentado. Si antes la probabilidad de A era de 1/2 ahora ha pasado a ser de 2/3. Por lo tanto la verificación del suceso B = Obtener número par ha modificado la probabilidad sobre A. Igualmente en el ejemplo 2, si consideramos, por ejemplo, que se verifica el suceso B = Medir más de 25 cm. no será la mismo la probabilidad de A, ya que se entenderá ahora como el tanto por uno de individuos con longitud superior a 35 cm. de entre aquellos cuya longitud supera los 25 cm. Este será el sentido en dicho ejemplo de la probabilidad de A condicionada a B. Dicho de otro modo, será la probabilidad de que un individuo cuya longitud sabemos supera los 25 cm, mida más de 35 cm. Así pues, hemos visto como, de forma intuitiva, se llega al concepto de probabilidad condicionada. Sin embargo, se debe formular con precisión el concepto para poder desarrollarlo. 1.3.2. Definición Dado un suceso B, se define la probabilidad de A condicionada a B como: ( B ) = P(PA(∩B)B) PA La nueva función resulta ser también una función de probabilidad. Se verifica: ( B) ≥ 0 P1) Para todo suceso A, P A ( B) = 1 P2) P Ω ∞ A ∞ A P3) P U i = ∑ P i B B i =1 i =1 Se sugiere comprobar las tres propiedades. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 10 Probabilidad Ejemplo 4 El 40% de las mujeres gestantes que acuden a un hospital padecen trastornos de circulación sanguínea, y el 20% problemas relacionadas con el nivel de glucosa. El 5% padecen ambos tipos de problemas. Se pide calcular: a) Porcentaje de mujeres gestantes sin ninguno de los trastornos anteriores. b) Entre las mujeres que padecen problemas con el nivel de glucosa, el porcentaje de las que padecen además problemas con la circulación sanguínea. Sean los sucesos, C = problemas con la circulación sanguínea G = problemas con el nivel de glucosa Para obtener el porcentaje de mujeres sin ninguno de los trastornos anteriores, se debe calcular: P (C ∩ G ) = 1 − P(C ∪ G ) = 1 − P(C ) − P(G ) + P(C ∩ G ) = 1 - 0.4 - 0.2 + 0.05 = 0.45 Por lo tanto, se deduce que el 45 % de las mujeres no presenta los problemas anteriores. Para obtener el porcentaje de las que padecen problemas con la circulación sanguínea de entre las que presentan problemas con la glucosa se debe calcular: ( G ) = P(PC(∩G)G) = 00..052 = 0.25 PC con lo cual se obtiene que el porcentaje buscado es del 25 %. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 11 Probabilidad 1.3.3. Sucesos independientes Lógicamente, si ( B ) = P( A) PA se deduce que B no modifica el grado de confianza sobre la verificación de A. Se dice entonces que A y B son sucesos independientes. Es fácil comprobar de forma inmediata que se cumplen las propiedades siguientes: a) A y B independientes si y sólo si P(A ∩ B) = P(A) P(B) . b) A y B son independientes si y sólo si A y B son independientes. c) A y B son independientes si y sólo si A y B son independientes. d) A y B son independientes si y sólo si A y B son independientes. Se sugiere como ejercicio al lector que realice la demostración de las propiedades anteriores. 1.3.4. Teorema de las probabilidades totales Si Ω = H 1 ∪ ..... ∪ H n , siendo los sucesos Hi incompatibles (sin ningún resultado en común) entre si, se verifica que P(A) = n ∑ P ( A Hi ). P ( Hi ) i =1 para cualquier suceso A. Demostración Se puede escribir A como n A = A ∩ Ω = A ∩ ( H 1 ∪ ...... ∪ H n ) = U ( A ∩ H i ) i =1 Además, ( A ∩ Hi ) ∩ ( A ∩ H j ) = ∅ para cualquier par i, j. Aplicando el axioma 3 de la definición de probabilidad, P(A) = n ∑ P ( A ∩ Hi ) i =1 © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 12 Probabilidad y aplicando la definición de probabilidad condicionada en la expresión anterior, tenemos el resultado propuesto en el teorema. Una consecuencia inmediata es el teorema de Bayes, que se explica a continuación. 1.3.5. Teorema de Bayes En las mismas condiciones que el teorema de las probabilidades totales, se verifica que P Hi = A P A .P(H i ) Hi n ∑ P A H .P(H ) i =1 i i La demostración es elemental, puesto que P A .P(H i ) Hi ∩ P(A H ) H i = P i = A P(A) P(A) y, aplicando a P(A) el teorema de las probabilidades totales, queda demostrado el teorema de Bayes. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 13 Probabilidad Ejemplo 5 En una facultad el 30 % de los estudiantes pertenece a la ciudad donde está ubicada la misma, y el 70 % restantes se desplazan diariamente desde diversos puntos hasta la ciudad. El porcentaje de aprobados resulta ser respectivamente del 60 % y del 50 %. Determinar: a) Probabilidad de que un alumno escogido al azar apruebe. b) Si consideramos un alumno que ha aprobado, determinar la probabilidad de que pertenezca a la ciudad. Se observa como la población se halla dividida en dos partes: Estudiantes de la ciudad, y estudiantes foráneos. Por tanto podemos considerar: Ω = H1 ∪ H2 donde Ω = Estudiantes de la facultad H1 = Estudiantes que pertenecen a la ciudad H2 = Estudiantes foráneos Sea además el suceso: A = Aprobar Se debe calcular la probabilidad de A. Para ello se utiliza directamente el teorema de las probabilidades totales. P ( A) = P( A H1 ).P( H 1 ) + P( A H2 ).P( H 2 ) = 0.6 x 0.3 + 0.5 x 0.7 = 0.53 De este modo obtenemos una tasa total del 53 % de alumnos aprobados. Por otro lado, se desea obtener la probabilidad de que un alumno, que sabemos que ha aprobado, sea de la ciudad. Viendo el enunciado del teorema de Bayes, se observa que una aplicación directa del teorema nos resolverá el problema. Así pues, deseamos calcular: P H 1 = A P( A ).P ( H 1 ) H1 0 .6 x 0 .3 = = 0.34 P ( A) 0.53 y de este modo se obtiene que la probabilidad de que un aprobado pertenezca a la ciudad es de 0.34. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 14 Probabilidad Ejemplo 6 Respecto a un determinado carácter, los genotipos de los individuos de determinada especie pueden ser AA, Aa, o aa con probabilidades 1/4, 1/2 y 1/4 respectivamente. Para detectar la presencia del gen A en un individuo se fa una prueba que resulta positiva con probabilidad 0.95 si el genotipo del individuo es AA, 0.5 si es Aa y 0.02 si es aa. Calculemos la probabilidad que un individuo sea aa si la prueba ha resultado positiva. Estamos ante una aplicación del teorema de Bayes. Sea el suceso + = Prueba positiva. Se trata de calcular P ( aa ) + La probabilidad anterior se puede calcular si se aplica directamente el teorema de Bayes: P ( aa ) = + P( + P( + aa ). P ( aa ) ). P ( AA) + P ( + ). P ( Aa ) + P ( + ). P ( aa ) AA Aa aa 0.02 x 0.25 = = 0.01 0.95 x 0.25 + 0.5 x 0.5 + 0.02 x 0.25 Por lo tanto, sólo el 1 % de las veces en que la prueba haya resultado positiva estaremos ante individuos aa. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 15 Probabilidad Ejemplo 7 Un geólogo sabe que la probabilidad de que el tratamiento de una muestra provoque daños en la misma muestra es aproximadamente de 0.25. Si el conjunto de muestras constituye un conjunto independiente de experiencias, ¿al cabo de cuántas muestras la probabilidad de haber provocado daños en alguna será o superará el valor de 0.8? Sea x el número potencial de muestras. La probabilidad de no provocar daños en x muestras es, 0.75 x dado que los sucesos provocar daños en una muestra, para las x muestras son independientes. La situación planteada en el problema nos pide que: x 1 − ( 0.75) ≥ 0.8 y, por tanto, resolviendo la ecuación, obtenemos: x ≥ 5. 8 Por lo tanto, al cabo de seis muestras ya se superará la probabilidad planteada en el problema. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 16 Probabilidad Ejemplo 8 Al decidir sobre la presencia (E) o ausencia (A) de una enfermedad, es usual realizar una o varias pruebas en base a las cuales tendremos un punto más en que apoyar nuestro diagnóstico. Considerando el caso en que la prueba pueda dar positivo (+) o negativo (-), hay que tener en cuenta que en individuos con la enfermedad, el test a veces dará positivo y a veces negativo, e igual ocurrirá con individuos que no presentan la enfermedad. Así pues, es conveniente cuantificar tales probabilidades. Sean, P(+/E) = Probabilidad de test positivo en individuos enfermos (sensibilidad del test). P(+/A) = Probabilidad de test positivo en individuos sanos (probabilidad de falsopositivo). P(-/A) = Probabilidad de test negativo en individuos sanos (especificidad del test). P(-/E) = Probabilidad de test negativo en individuos enfermos (probabilidad de falsonegativo). P(E) = Probabilidad de presentar la enfermedad (prevalencia de la enfermedad). El valor predictivo del test se obtiene calculando P(E/+) y P(A/-), es decir, las probabilidades de padecer la enfermedad si el test da positivo, y de no padecer la enfermedad si el test da negativo. Veamos la aplicación de lo anterior en el siguiente problema: Un investigador desarrolla una prueba exploratoria para el cáncer y observa un 5 % de resultados positivos en pacientes no cancerosos y un 20 % de resultados negativos en pacientes cancerosos. Aplica esta prueba a una población en la que sabe que el 2 % adolece de cáncer no detectado. Vamos a determinar el valor predictivo del test. Vemos que la prevalencia de la enfermedad es 0.02, una probabilidad de falso positivo de 0.05, una probabilidad de falso negativo de 0.2, y por tanto con una sensibilidad de 0.8 y una especificidad de 0.95. Calcularemos el poder predictivo del test utilizando el teorema de Bayes, y obtenemos: P( E + ) = P ( + E ). P ( E ) = 0.246 P ( + E ). P ( E ) + P ( + A ). P ( A ) De igual manera se puede calcular P(E/-) y se obtiene 0.00427, de donde P(A/-) = 1 - 0.00427 = 0.99573 El resultado se interpreta en el sentido que el 24.6 % de los individuos con test positivo padecerán la enfermedad y el 99.573 % de los individuos con test negativo no padecerán la enfermedad. Por lo tanto, la prueba resulta mas útil cuando se trata de descartar la enfermedad. © Statmedia. ISBN: 84-8338-443-4, Edicions UB pág. 17