BLOQUE I: ESTADÍSTICA DESCRIPTIVA E INTRODUCCIÓN A LA PROBABILIDAD TEMA 1. ESTADÍSTICA DESCRIPTIVA 1. Generalidades Estadística: Conjunto de teorías y técnicas para la recopilación, el análisis, la interpretación y la presentación de conjuntos de datos Etapas en un estudio estadístico: Recogida de datos, incluyendo el diseño de cómo se ha de realizar dicha recogida Ordenación y representación de los datos obtenidos Descripción de las características más importantes Análisis estadístico formal de dichos datos, que permitirá extraer conclusiones así como tomar decisiones Estadística Descriptiva: Parte de la Estadística que tiene por objeto el estudio de conjuntos numerosos de datos con el fin de dar una descripción numérica, ordenación y simplificación de la información recogida en los datos Población: conjunto de individuos o elementos sobre el que recaen las observaciones y objeto de nuestro estudio Muestra: subconjunto representativo de toda la población. Se suele considerar una muestra de la población porque no siempre es posible estudiar exhaustivamente la población por motivos de tiempo, coste excesivo u otro tipo de dificultad Carácter: propiedad que deseamos observar sobre los elementos de la población Modalidad: cada uno de los estados diferentes que puede presentar un carácter. Las modalidades de un carácter deben ser exhaustivas e incompatibles. Cada elemento debe pertenecer a una y solamente a una modalidad Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 1 P … M1 Mk M2 P M1 M 2 M k M i M j ,i j Atendiendo a sus modalidades, los caracteres se pueden clasificar en Caracteres cualitativos: sus modalidades no están sujetas a medida Caracteres cuantitativos: sus distintas modalidades son medibles Los caracteres cualitativos se denominan también atributos Los caracteres cuantitativos se denominan también variables estadísticas y se dividen en Variables estadísticas discretas: número finito o infinito numerable de modalidades Variables estadísticas continuas: número de modalidades no numerable A veces la distinción entre variables estadísticas discretas y continuas es arbitraria. Variables discretas con un gran número de valores se pueden aproximar por continuas y, a su vez, variables continuas pueden tratarse como discretas debido, por ejemplo, a la imprecisión de los instrumentos de medida. Ejemplos. Para los habitantes de un cierto municipio se pueden estudiar los siguientes caracteres: sexo, estado civil, profesión, número de hermanos, edad, estatura, nivel de estudios,... En este curso nos centraremos en el estudio de variables estadísticas. Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 2 Distribución de frecuencias Población: P Número de individuos observados: n Carácter: C Modalidades: M1,M2,...,Mk Frecuencia absoluta de la modalidad Mi, ni: número de individuos observados que presentan dicha modalidad Y se cumple que n1+...+nk=n Frecuencia relativa de la modalidad Mi, fi: proporción de individuos observados que presentan dicha modalidad, se obtiene como fi ni n Y se verifica que f1+...+fk=1 Se definen las frecuencias absolutas acumuladas y las frecuencias relativas acumuladas, respectivamente, como Ni=n1+...+ni Fi=f1+...+fi Distribución de frecuencias: conjunto de modalidades que presenta un carácter junto con sus frecuencias (relativas o absolutas) Distribución de frecuencias absolutas: {(Mi,ni): i=1,..., k)} Distribución de frecuencias relativas: {(Mi,fi): i=1,..., k)} Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 3 2. Tabla de frecuencias A continuación veremos cómo representar los datos en tablas estadísticas de manera que se resuma la información observada Variables estadísticas discretas X: x1, x2,..., xk, donde x1 <x2<...<xk Los datos se representan en una tabla como sigue Valor xi Frecuencias absolutas ni Ni n1 N1 n2 N2 . . . . . . nk Nk=n n x1 x2 . . . xk Frecuencias relativas fi Fi f1 F1 f2 F2 . . . . . . fk Fk=1 1 Ejemplo. Número de piezas defectuosas producidas diariamente en una fábrica (variable estadística discreta) Valor xi 0 1 2 3 4 5 6 Frecuencias absolutas ni Ni 40 40 66 26 80 14 86 6 89 3 89 0 90 1 90 Frecuencias relativas fi Fi 0.444 0.444 0.733 0.289 0.889 0.156 0.956 0.067 0.989 0.033 0.989 0.000 1 0.011 1 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 4 Variables estadísticas continuas X: [e0,e1], (e1,e2],..., (ek-1,ek], con e0<...<ek (ei-1,ei]: clase i-ésima ei-1, ei: extremo inferior y extremo superior respectivamente de la clase i-ésima ai= ei - ei-1: amplitud de la clase i-ésima xi=( ei-1 + ei)/2: marca de la clase i-ésima hi=ni/ai: densidad de frecuencia para la clase i-ésima (número de observaciones por unidad de intervalo) Los datos se representan en una tabla como sigue Intervalo (ei-1,ei] [e0,e1] (e1,e2] . . . (ek-1,ek] Frecuencias absolutas ni Ni n1 N1 n2 N2 . . . . . . nk Nk=n n Frecuencias relativas fi Fi f1 F1 f2 F2 . . . . . . fk Fk=1 1 Ejemplo. Tiempo de vida en horas de unas determinadas componentes de una máquina (variable estadística continua) Intervalo Marcas (ei-1,ei] de clase xi 10 [0,20] 60 (20,100] 125 (100,150] 200 (150,250] 325 (250,400] Frecuencias absolutas ni Ni 7 7 22 15 44 22 63 19 70 7 70 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. Frecuencias relativas fi Fi 0.1 0.1 0.214 0.314 0.314 0.628 0.271 0.899 1 0.1 1 5 3. Representación gráfica Las representaciones gráficas tiene por objeto proporcionar una síntesis visual de la distribución de frecuencias Todas las representaciones gráficas se basan en el principio de hacer proporcional las frecuencias a alguna magnitud de la figura representada, generalmente el área encerrada Atendiendo al tipo de variable estadística en estudio se utilizan diferentes tipos de representación Variables estadísticas discretas Variables estadísticas Variables estadísticas continuas Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. Diagrama de barras Polígono de frecuencias Curva acumulativa o de distribución Histograma Polígono de frecuencias Curva acumulativa o de distribución 6 Variables estadísticas discretas Diagrama de barras: En un sistema de ejes cartesianos se representa el conjunto de puntos {(xi,ni): i=1,...,k} ó {(xi,fi): i=1,...,k}, y posteriormente se unen con el eje de abscisas mediante segmentos verticales n5 n2 n1 n3 n4 x1 x2 x3 x4 x5 Polígono de frecuencias: Se construye uniendo con segmentos los extremos superiores de los segmentos verticales en el diagrama de barras n5 n2 n1 n3 n4 x1 x2 x3 x4 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. x5 7 Curva acumulativa o de distribución: Consiste en la representación gráfica de la función de distribución definida de la siguiente forma: F(x)=proporción de individuos con valor de la variable menor o igual a x 0 F1 F2 F(x) ... Fk 1 1 si si si ... si si x x1 x1 x x2 x 2 x x3 ... xk 1 x xk x xk Propiedades: Se mantiene constante entre cada par de valores de la variable Función no decreciente en toda la recta real Función continua en todo punto de la recta real que no sea un valor de la variable Función continua a la derecha en los valores de la variable lim F(x) 0 x - lim F(x) 1 x F5=1 F4 F3 F2 F1 x1 x2 x3 x4 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. x5 8 Variables estadísticas continuas Histograma: Se representan sobre el eje de abscisas los extremos de los intervalos de clase de la variable y sobre cada uno de ellos se construye un rectángulo cuya área sea proporcional a su frecuencia absoluta (con el mismo factor de proporcionalidad para todas las clases); por tanto, su altura será igual a su densidad de frecuencia hi h2 h3 h4 h1 h5 e0 e1 e2 e3 e4 e5 Polígono de frecuencias: Se construye uniendo con segmentos los puntos medios de los lados superiores de los rectángulos que forman el histograma h2 h3 h4 h1 h5 e0 e1 e2 e3 e4 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. e5 9 Curva acumulativa o de distribución: Consiste en la representación gráfica de la función de distribución definida de la siguiente forma: F(x)=proporción de individuos con valor de la variable menor o igual a x En este caso, se conoce la función de distribución para los extremos de los intervalos (ei-1,ei] 0 F1 F2 F(x) ... Fk 1 1 si x e0 si x e1 si ... x e2 ... si x ek si x ek 1 Como no se conocen los valores de F(x) supondremos que esta función aumenta de forma lineal entre los extremos de los intervalos Propiedades: Función no decreciente en toda la recta real Función continua en todo punto de la recta real lim F(x) 0 x - lim F(x) 1 x F5=1 F4 F3 F2 F1 e0 e1 e2 e3 e4 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. e5 10 4. Síntesis numérica de una variable estadística unidimensional Nos centraremos a partir de ahora en el estudio de variables estadísticas A continuación definimos cantidades numéricas, denominadas características o medidas, que representan o sintetizan determinados aspectos de la distribución de la variable estadística. En particular, nos centraremos en las siguientes medidas: Medidas de posición o localización: describen cómo se comportan globalmente los datos observados y localizan la distribución de frecuencias Medidas de dispersión: miden la desviación o variabilidad de las observaciones entre sí o en relación con un valor de referencia, generalmente con respecto a una medida de posición central informando sobre la representatividad de dicha medida Medidas de forma: resumen características relativas a la forma de la distribución. Cuantifican aspectos sobre la posible simetría de la distribución (medidas de asimetría) y sobre la concentración de las observaciones más centrales con respecto a una distribución de referencia (medidas de curtosis o apuntamiento) Medidas de posición Medidas de posición central Media aritmética: Suma de los datos observados ponderados por sus frecuencias relativas k x x i fi i 1 1 k x i ni n i 1 Moda: Valor de la variable que se presenta con mayor frecuencia Para variables estadísticas discretas el cálculo de la moda es inmediato. No tiene por qué ser única Para variables estadísticas continuas se define el intervalo modal como el intervalo que presenta mayor densidad de frecuencia. Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 11 h2 h3 h4 h1 h5 e0 e1 e2 Intervalo modal e3 e4 e5 Mediana: La mediana como medida de tendencia central es el valor que divide al conjunto de todas las observaciones (supuestas ordenadas en orden creciente o decreciente) en dos subconjuntos con el mismo número de observaciones cada uno, de manera que uno está formado por todas las observaciones menores o iguales que la mediana y el otro por las mayores Se define como el valor de la variable estadística, Me, tal que la ordenada en la función de distribución vale 0.5, es decir, la solución de la ecuación F(Me)=0.5 Cálculo de la mediana: Se ordenan los datos de menor a mayor 1. Si n es impar, se considera como mediana el valor que ocupa la posición central 2. Si n es par, se considera como mediana el punto medio de los valores que ocupan las dos posiciones centrales Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 12 Medidas de posición no central Cuantiles. Se define el cuantil de orden (0<<1) como el valor de la variable x tal que su ordenada en la función de distribución vale , es decir, la solución de la ecuación F(x)= Casos particulares de cuantiles para valores concretos de : Cuartiles: Q1, Q2 y Q3, para =0.25, 0.5 y 0.75, respectivamente F(Q1)=0.25, F(Q2)=0.5 y F(Q3)=0.75 Deciles: D1, D2, ..., D9, para =0.1, 0.2 ,..., y 0.9, respectivamente F(D1)=0.1, F(D2)=0.2,..., y F(D9)=0.9 Percentiles: P1, P2, ..., P99, para =0.01, 0.02 , ..., y 0.99, respectivamente F(P1)=0.01, F(P2)=0.02,..., y F(P99)=0.99 Cálculo del cuantil de orden : El cuantil de orden es el valor que deja por debajo n· observaciones Para su cálculo, se ordenan los datos de menor a mayor 1. Si n· no es un número entero, se considera como cuantil de orden el valor que ocupa la posición [n·]+1, donde [n·] denota la parte entera de n· 2. Si n· es un número entero, se considera como cuantil de orden el punto medio de los valores que ocupan las posiciones [n·] y [n·]+1 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 13 Medidas de dispersión Medidas de dispersión absoluta. Miden la dispersión o variabilidad en las mismas unidades que la variable en estudio. No sirven para comparar la variabilidad o dispersión de distribuciones distintas Rango: Amplitud del intervalo donde se encuentran distribuidas todas las observaciones R = Max xi – Min xi Rango intercuartílico: Amplitud del intervalo donde se encuentran distribuidas el 50% de las observaciones centrales RI = Q3 - Q1 Desviación absoluta media respecto a un valor ‘a’: Media aritmética de las desviaciones en valor absoluto entre los valores observados y ‘a’ k Da | xi a | fi i 1 1 n k |x a| n i i i 1 Desviación cuadrática media respecto a un valor ‘a’: Media aritmética de los cuadrados de las desviaciones entre los valores observados y ‘a’ k Qa ( xi a) 2 fi i 1 1 n k ( x a) i 2 ni i 1 Caso particular: desviación cuadrática media respecto a la media aritmética, denominada varianza (denotada por 2 o por Var X) k Var X ( xi x) 2 fi i 1 1 n k (x x) i 2 ni i 1 A la raíz cuadrada positiva de la varianza se le denomina desviación típica (denotada por ) Nota: La varianza se puede descomponer como la media de los cuadrados de los valores menos el cuadrado de la media. k Var X ( xi x) 2 fi i 1 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. k x i 2 fi x 2 i 1 14 Medidas de dispersión relativa. Son medidas adimensionales que permiten comparar la variabilidad de distintas distribuciones y la representatividad de sus promedios Coeficiente de variación de Pearson: Cociente entre la desviación típica y la media aritmética Cv σ x Interpretación: mide la representatividad de la media como medida que resume toda la información de la variable al comparar distintas distribuciones de frecuencias. Cuanto menor sea el valor de dicho coeficiente mayor representatividad de la media, más agrupados están los valores observados en torno a su valor medio Medidas de forma Medidas de asimetría: Miden el grado de asimetría de la distribución de frecuencias Una distribución de frecuencias es simétrica si su correspondiente representación gráfica (diagrama de barras o histograma, según sea la variable discreta o continua, respectivamente) es simétrica respecto a un eje vertical Distribución asimétrica a la derecha o asimétrica positiva si las observaciones están desplazadas hacia la derecha Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 15 Distribución asimétrica a la izquierda o asimétrica negativa si las observaciones están desplazadas hacia la izquierda Sesgo a la izquierda Sesgo a la derecha Coeficientes de asimetría de Pearson: aP 3 (x - Me) σ a'P x - Mo σ Coeficiente de asimetría de Fisher: g1 m3 σ3 k m3 ( xi x) 3 fi i 1 Interpretación del signo de los coeficientes: Signo positivo Asimetría a la derecha o positiva Signo negativo Asimetría a la izquierda o negativa Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 16 Medidas de curtosis o apuntamiento: Se aplican a distribuciones unimodales y simétricas o levemente asimétricas para estudiar la mayor o menor concentración de los valores en torno a la media y cómo se comportan las colas, comparándose con la distribución de probabilidad normal o curva de Gauss Coeficiente de curtosis de Fisher: g2 m4 3 σ4 k m 4 ( xi x) 4 fi i 1 Coeficiente nulo Igual de apuntada que la distribución normal Interpretación del signo del coeficiente: Signo positivo Más apuntada que la distribución normal Signo negativo Menos apuntada que la distribución normal Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 17 Diagrama de caja-bigotes (Box-Whisker) Representación gráfica de una distribución en la que intervienen las siguientes medidas: mediana (Me), primer y tercer cuartil (Q1 y Q3), mínimo y máximo (min y max) Sobre una escala se dibuja un rectángulo que se extiende desde el primer cuartil hasta el tercer cuartil Se divide el rectángulo en la posición que ocupa la mediana Se obtienen aquellos valores que distan del rectángulo más de 1.5 veces el recorrido intercuartílico (RI=Q3-Q1), denominados valores anómalos o atípicos, es decir, aquellos valores que están fuera del intervalo (Q1 - 1.5 · RI, Q3 + 1.5 · RI) Se traza un segmento desde el primer cuartil hasta el menor valor observado que no sea anómalo y otro segmento desde el tercer cuartil hasta el mayor valor observado que no sea anómalo Los valores anómalos se añaden a la representación como puntos aislados Ejemplo. Representar con un diagrama de caja-bigotes (Box-Whisker) los siguientes datos: 15, 15, 17, 18, 19, 19, 19, 20, 20, 20, 23, 24, 25, 30, 32, 32, 38, 41, 61, 63, 64, 67, 80, 99, 132, 137, 140 n=27 Me=30 Q1=19 RI = Q3 - Q1 = 64 - 19 = 45 Q1 - 1.5 RI = 19 - 67.5 = - 48.5 Q3=64 1.5 RI=67.5 Q3 + 1.5 RI = 64 + 67.5 = 131.5 Valores anómalos: 132, 137, 140 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 18 TEMA 2. FUNDAMENTOS DE LA PROBABILIDAD 1. Espacio muestral Experimento aleatorio: un experimento se dice aleatorio si no se puede predecir el resultado del mismo antes de realizarlo, aunque sean conocidas las condiciones iniciales de realización Ejemplos. Lanzamiento de un dado, elección al azar de un número real dentro del intervalo [0,1], lanzamiento de una moneda hasta que aparezcan dos caras,... Teoría de la probabilidad: se ocupa de describir y estudiar los fenómenos aleatorios proporcionando métodos de análisis para su tratamiento Espacio muestral: conjunto de todos los posibles resultados asociados a un experimento aleatorio, se denota por E Atendiendo al número de posibles resultados del experimento, los espacios muestrales se pueden clasificar en Espacios muestrales finitos Espacios muestrales infinitos numerables Espacios muestrales infinitos no numerables Ejemplo. Construir el espacio muestral asociado a los siguientes experimentos aleatorios: a) Lanzamiento de un dado compuesto por 6 lados E={1, 2, 3, 4, 5, 6} b) Lanzamiento de una moneda hasta obtener una cara E={C, +C, ++C, +++C, ...} c) La elección al azar de un número real perteneciente al intervalo [0,1] E=[0,1] Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 19 Suceso: conjunto formado por resultados del experimento aleatorio Sucesos elementales: cada uno de los resultados posibles del experimento aleatorio que no se pueden descomponer en otros más simples que puedan obtenerse al realizar el experimento aleatorio Suceso seguro: suceso que siempre ocurre. Está formado por todos los sucesos elementales Suceso imposible: suceso que no ocurre nunca, denotado por Operaciones con sucesos: Sean A y B, sucesos asociados a un experimento aleatorio Unión de sucesos, AUB: suceso formado por todos los posibles resultados de A y de B, sin repetir los resultados comunes Intersección de sucesos, A∩B: suceso formado por todos los resultados comunes de A y de B Propiedades: Conmutativa AUB = BUA A∩B = B∩A Asociativa AU(BUC) = (AUB)UC A∩(B∩C) = (A∩B)∩C Distributiva AU(B∩C) = (AUB)∩(AUC) A∩(BUC) = (A∩B)U(A∩C) Existencia de elemento neutro AUØ = A A∩E = A Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 20 Complementario de un suceso A con respecto al espacio muestral E, Ā: suceso que contiene todos los resultados de E que no se encuentran en A, verificándose que AUĀ = E A∩Ā = Ø Leyes de Morgan: A B A B A B A B Diferencia de dos sucesos, A-B: suceso formado por los resultados de A que no están en B y se obtiene como AB AB Sucesos incompatibles: A y B son sucesos incompatibles si no tienen resultados en común, es decir, A∩B = Ø Ejemplo. Sean A, B y C tres sucesos cualesquiera. Expresar formalmente los siguientes sucesos: a) b) c) d) e) Ocurren A y B, pero no ocurre C Ocurren al menos dos Ocurre solamente uno de los tres Ocurre al menos uno de los tres No ocurre ninguno de los tres Solución a) A B C b) (A B) (A C) (B C) c) (A B C) (A B C) (A B C) d) A B C e) A B C Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 21 -álgebra de sucesos: Sea un experimento aleatorio y su espacio muestral asociado E. Una -álgebra de sucesos es una clase A formada por subconjuntos de E que verifica las propiedades 1. E A 2. Si Ai A, i=1, 2, ... A A i i 1 3. Si A A A A A (E, A) se le denomina espacio probabilizable 2. Concepto de probabilidad. Definición axiomática La probabilidad de un suceso es una medida del grado de incertidumbre asociado a dicho suceso Regla de Laplace. Si el conjunto de sucesos elementales es finito y todos los sucesos elementales son equiprobables (todos los sucesos elementales tienen la misma probabilidad de ocurrir), entonces la probabilidad de un suceso A se calcula como P(A) k casos favorables n casos posibles donde k es el número de sucesos elementales que favorecen la ocurrencia de A y n es el número total de sucesos elementales Ejemplo. Una urna contiene 3 bolas blancas, 2 negras y 6 rojas. a) ¿Cuál es la probabilidad de que una bola extraída al azar sea roja? b) ¿Y que no sea negra? Solución a) P(R) 6 0.5454 11 b) P(N) 9 0.8181 11 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 22 Definición axiomática: Sea (E, A) un espacio probabilizable, se dice que una aplicación P: (E, A) A A P(A) es una función de probabilidad si verifica los siguientes axiomas (axiomas de Kolmogorov): Axioma 1. P(E) = 1 Axioma 2. P(A) 0, AA Axioma 3. Ai A, i=1,2,..., tales que Ai∩Aj=, para ij, entonces P A i P(A i ) i 1 i 1 A la terna (E, A, P(·)) se le denomina espacio de probabilidad y al número P(A), para cada suceso A, probabilidad del suceso A Consecuencias de los axiomas 1. La probabilidad asociada al suceso imposible es nula, P() = 0 2. Sean A1,..., AnA tales que Ai∩ Aj=, para ij, entonces n n P A i P(A i ) i 1 i 1 3. P(Ā) = 1 – P(A), AA 4. P(B) = P(Ā∩B) + P(A∩B), A, B A 5. Sean A, B A tales que A B, entonces P(A) ≤ P(B) 6. Sean A, B A, entonces P(AUB) = P(A) + P(B) – P(A∩B) Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 23 7. Sean A, B, C A, entonces P(AUBUC) =P(A)+ P(B)+P(C) –P(A∩B)–P(A∩C) –P(B∩C) + P(A∩B∩C) 8. Sean A, B A, entonces P(AUB) ≤ P(A) + P(B) Ejemplo. Sean A, B y C tres sucesos de un espacio probabilístico (E, A, P(·)) tales que P(A)=0.2, P(B)=0.4, P(C)=0.3, P(A∩B)=0.1 y (AUB) ∩C=. Calcular las probabilidades de los siguientes sucesos: a) b) c) d) e) f) g) h) Sólo ocurre A Los tres sucesos ocurren Ocurren A y B, pero no C Por lo menos dos ocurren Ocurren dos y no más No ocurren más de dos Ocurre por lo menos uno No ocurre ninguno Solución Como (AUB) ∩C= (A∩C)U(B∩C)= (A∩C)= y (B∩C)=, entonces P(A∩C)=0 y P(B∩C)=0 a) P(A B C ) P(A ( B C)) P(A) P(A (B C)) P(A) P((A B) (A C)) P(A) P(A B) P(A C) P(A B C) 0.2 0.1 0.1 b) P(A∩B∩C)=P()=0 c) P(A B C) P(A B) P(A B C) 0.1 0 0.1 d) P((A B) (A C) (B C)) P(A B) 0.1 e) P((A B C ) (A B C) (A B C)) P(A B C) P(A B C) P(A B C) P(A B) - P(A B C) 0.1 - 0 0.1 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 24 f) P( A B C) 1 P(A B C) 1 0 1 g) P(A B C) P(A) P(B) P(C) - P(A B) - P(A C) - P(B C) P(A B C) 0.2 0.4 0.3 - 0.1 0.8 h) P(A B C) P( A B C) 1 P(A B C) 1 0.8 0.2 3. Probabilidad condicionada. Independencia de sucesos En ciertas ocasiones es necesario encontrar la probabilidad de sucesos bajo la condición de que un cierto suceso B, con P(B) > 0, ha ocurrido Ejemplo. Consideremos el experimento aleatorio de lanzar dos monedas. El espacio muestral asociado a dicho experimento vendrá dado por E={CC, C+, +C, ++} Y sean los sucesos A: obtener dos cruces B: obtener al menos una cruz Entonces P(A) = 1/4 y P(B)=3/4. Si se sabe que B ha ocurrido entonces el espacio muestral queda reducido a EB={C+, +C, ++} En este caso, P(A|B)=1/3 Se define la probabilidad condicionada de un suceso A al suceso B como P(A | B) P(A B) , P(B) > 0 P(B) que es la probabilidad de que ocurra el suceso A supuesto que el suceso B ha ocurrido. Se puede comprobar que la aplicación P(·|B): (E, A) A A P(A|B) cumple los axiomas de la probabilidad y es, por tanto, una función de probabilidad. Con lo cual, (E, A, P(·|B)) es un espacio de probabilidad Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 25 Todas las propiedades de una función de probabilidad se cumplen, en particular, para P(·|B). Por ejemplo, para sucesos cualesquiera A y C, se verificará 0 ≤ P(A|B) ≤ 1 P(Ā|B) = 1 – P(A|B) P(AUC|B) = P(A|B) + P(C|B) – P(A∩C|B) Ejemplo. En el ejemplo anterior, utilizando la definición de de probabilidad condicionada, la probabilidad P(A|B) se calcula como 1 P(A B) 4 1 P(A | B) 3 3 P(B) 4 que coincide con el valor obtenido previamente Regla del producto. 1. Sean A y B sucesos cualesquiera, con P(A) > 0 y P(B) > 0, entonces se verifica P(A∩ B) = P(A|B) P(B) P(A∩ B) = P(B|A) P(A) 2. Sean A , B y C sucesos cualesquiera, con P(C) > 0, P(B∩C) > 0, entonces se verifica P(A∩ B∩C) = P(A|B∩C) P(B|C) P(C) Independencia de dos sucesos. Sean A y B sucesos cualesquiera, se dice que A y B son independientes si se verifica que P(A|B) = P(A) O, equivalentemente, P(B|A)=P(B) O sea, la ocurrencia del suceso B no tiene ningún efecto en la ocurrencia del suceso A y la ocurrencia del suceso A no tiene influencia sobre la ocurrencia del suceso B Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 26 Consecuencias: A y B son independientes P(A∩ B) = P(A) P(B) Si A y B son independientes, entonces a) A y B son independientes b) A y B son independientes c) A y B son independientes Independencia de n sucesos. Sean A1, A2, …, An , sucesos cualesquiera, se dice que A1, A2, …, An son mutuamente independientes si para cualquier subconjunto de sucesos Ai1, Ai2, …, Aik se cumple que P (Ai1∩ Ai2 ∩ …∩ Aik ) = P(Ai1) P(Ai2) · · · P(Aik) Ejemplo. En una batalla naval, tres destructores localizan simultáneamente a un submarino. Sean P(A), P(B) y P(C), respectivamente, las probabilidades de que el primer, el segundo y el tercer destructor hundan al submarino. Se pide determinar la probabilidad de que el submarino sea hundido, sabiendo que P(A)=0.6, P(B)=0.3 y P(C)=0.2. Solución. Supongamos que el hecho de hundir el submarino cada uno de los destructores es independiente si le impacta o no el proyectil lanzado por los otros destructores. Entonces, P(sea hundido) = 1- P(no sea hundido) = 1 - P(ninguno de los tres impacta) = 1 P(A B C ) 1 - P(A) P(B) P( C ) 1 - 0.4 0.7 0.8 0.776 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 27 4. Teorema de la Probabilidad Total. Teorema de Bayes Se dice que los sucesos A1,..., AnA forman una partición del espacio muestral si son sucesos incompatibles y exhaustivos, i.e., Ai∩ Aj=, para ij, n y A i E i 1 Teorema de la Probabilidad Total Sean A1,..., AnA, sucesos que forman una partición del espacio muestral y sea BA un suceso cualquiera. Supongamos que se conocen las probabilidades P(Ai) y P(B|Ai), para i=1,...,n, entonces n P(B) P(B | A i )P(A i ) i 1 -DemostraciónUtilizando que A1,..., An forman una partición del espacio muestral se puede expresar B como una unión finita de sucesos incompatibles dos a dos, esto es, B = B ∩ E = B ∩ (A1U … U An) = (B ∩ A1) U … U (B ∩ An) donde (B ∩ Ai ) ∩ (B ∩ Aj ) =, para ij , con lo cual P (B) = P(B ∩ A1) + … + P(B ∩ An) Usando ahora que P(B ∩ Ai ) = P(B | Ai ) P(Ai) se tiene el resultado deseado ■ Teorema de Bayes Sean A1,..., AnA, sucesos que forman una partición del espacio muestral y sea BA un suceso cualquiera. Supongamos que se conocen las probabilidades P(Ai) y P(B|Ai), para i=1,...,n, entonces P(A i | B) P(B | A i )P(A i ) n P(B | A )P(A ) j1 j , para i=1,...,n j -DemostraciónPor la definición de probabilidad condicionada y utilizando la regla del producto P(A i | B) P(B A i ) P(B | A i )P(A i ) P(B) P(B) para i=1,…, n. Y aplicando el Teorema de la Probabilidad Total se obtiene el resultado deseado ■ Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 28 Ejemplo. En un proceso de tratamiento de cierto mineral se utilizan tres técnicas A, B y C. El 50% del total se trata con la técnica A, mientras que B y C son utilizadas en un 25% del total cada una. Las probabilidades de cometer algún fallo en su aplicación para las técnicas A, B y C son 0.15, 0.10 y 0.05, respectivamente. Determinar la probabilidad de que el proceso no se realice de forma correcta. Solución Sean los sucesos A: la técnica A se utiliza en el proceso de tratamiento B: la técnica B se utiliza en el proceso de tratamiento C: la técnica C se utiliza en el proceso de tratamiento y el suceso F: cometer algún en la aplicación Con la información que se proporciona se sabe que P(A)=0.50 P(F|A)=0.15 P(B)=0.25 P(F|B)=0.10 P(C)=0.25 P(F|C)=0.05 y que los sucesos A, B y C forman una partición Se pide la probabilidad P(F), que se calcula utilizando el Teorema de la Probabilidad Total P(F) = P(F|A)P(A) + P(F|B)P(B) + P(F|C)P(C) = 0.15·0.50 + 0.10·0.25 + 0.05·0.25 = 0.1125 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 29 Ejemplo. Supóngase que en un centro médico, de todos los fumadores de quienes se sospecha que tenían cáncer de pulmón, el 90% lo tenía, mientras que únicamente el 5% de los no fumadores lo padecía. Si la proporción de fumadores es de 0.45. Se pide: a) ¿Cuál es la probabilidad de un paciente, seleccionado al azar padezca cáncer de pulmón? b) ¿Cuál es la probabilidad de un paciente con cáncer pulmonar, seleccionado al azar, sea fumador? Solución Sean los sucesos F: ser fumador F : ser no fumador C: padecer cáncer de pulmón C : no padecer cáncer de pulmón Por los datos que se proporcionan se sabe que P(F)=0.45 P(C|F)=0.90 P(F) 1 - 0.45 0.55 P(C | F) 0.05 a) Aplicando directamente el Teorema de la Probabilidad Total se tiene que P(C) P(C | F)P(F) P(C | F)P(F) 0.90 0.45 0.05 0.55 0.4325 b) Aplicando ahora el Teorema de Bayes se tiene que P(F | C) P(F C) P(C | F)P(F) 0.90 0.45 0.9364 P(C) P(C | F)P(F) P(C | F)P(F) 0.90 0.45 0.05 0.55 Estadística Aplicada. Grado en Ingeniería Civil. UPCT. Curso Académico 2015-2016. 30