Asignatura: Matemáticas Cotidianas Aula de Mayores, UMU Félix Belzunce Torregrosa Dpto. Estadı́stica e Investigación Operativa Universidad de Murcia UMU 2009/2010 1 Caras, cruces y campanas A la pregunta de qué posibilidades hay de sacar cara si lanzamos una moneda, la respuestas usuales son “un 50%”, ”la mitad“... ¿Qué quiere decir que esa posibilidad o probabilidad sea del 50 por ciento ó 0.5? Otras afirmaciones de ese estilo y que podemos encontrar en la prensa o internet son las siguientes: • Los jóvenes tienen más probabilidades de fumar si viven rodeados de fumadores. • La que fuera jefa del servicio de Epidemiologı́a de la Consellerı́a de Sanidad en 1998, aseguró este jueves durante el juicio que se celebra contra el anestesista acusado, Juan Maeso, que la probabilidad de estar infectado por el virus de la hepatitis C si se habı́a sido anestesiado por este facultativo era ”28 veces más”, según se reflejaba en los estudios realizados. • La probabilidad de que Dios exista es del 62 por ciento, según el cálculo realizado por el ensayista alemán Thomas Vasek. Para analizar correctamente las afirmaciones anteriores necesitamos adentrarnos en el mundo del azar y en concreto en un mundo de CARAS, CRUCES y CAMPANAS......... El estudio y cálculo probabilidades surge dentro del estudio de fenómenos o experimentos aleatorios. Un fenómeno se llama aleatorio si los resultados son inciertos, imprevisibles o impredecibles. ¿Cómo se puede estudiar o cuantificar algo que es imprevisible, impredicible? Para ello vamos a analizar los resultados de un serie de lanzamientos de una moneda. Un fenómeno aleatorio clásico y disponible a una inmediata observación es el del resultado del lanzamiento de una moneda. En este caso el resultado es imprevisible, y los posibles resultados son: CARA y CRUZ Nota técnica: El conjunto de todos los resultados posible de un experimento o fenómeno aleatorio se llama espacio muestral. Consideremos ahora que realizamos un experimento aleatorio un número n de veces y que de esas n veces, un número s de veces se produce el suceso A. Consideremos el cociente s/n, es decir la frecuencia relativa con que ocurre el suceso A en esas n veces. Para este cociente la práctica demuestra, para una amplia clase de sucesos, que cuando el número n de experimentos se va haciendo cada vez mayor el cociente se va haciendo cada vez más estable en el sentido de que se aproxima cada vez más a un número fijo, que denotaremos como p(A). A partir de aquı́ se toma como hipótesis que a cada suceso aleatorio A es posible asignarle un numero fijo p(A), en el intervalo [0,1], y que llamaremos probabilidad del suceso A. Podemos ver lo anterior en la siguiente gráfica en la que se ha procedido a realizar una serie de lanzamientos (1000) y se observa como la frecuencia relativa del suceso cara se va aproximando a 0.5. 1 Algunas reglas de cálculo básico: Regla de Laplace: Si los sucesos (elementales) observables tienen todos la misma probabilidad (equiprobables), entonces la probabilidad de un suceso S, se obtiene como el cociente entre el número de sucesos elementales favorables al suceso S y el número total de suceso elementales. Ejemplo: Consideremos la situación en que lanzamos dos monedas los sucesos elementales son: {cara,cruz}, {cruz,cara}, {cara,cara} y {cruz,cruz}. Todos los sucesos tiene la misma probabilidad en este caso 1/4. Consideremos ahora la probabilidad de que al lanzar las dos monedas obtengamos al menos una cara. Según la regla de Laplace calcuları́amos: casos en el que sale al menos una cara 3 = = 0.75 casos posibles 4 Probabilidades de sucesos opuestos: La probabilidad del suceso opuesto al suceso S es igual a 1 menos la probabilidad del suceso S. Ejemplo: En el caso anterior la probabilidad de que no salga ninguna cara serı́a 1 menos la probabilidad de su suceso opuesto, es decir que al menos salga una cara, y que en el ejemplo anterior hemos calculado como 0.75, es decir 1-0.75=0.25. Veamos como se aplica el cálculo probabilı́stico a un estudio de coincidencias. ¿Cuantas personas son necesarias reunir para que con una certeza o seguridad del 50 por ciento por lo menos dos de ellas hayan nacido el mismo dı́a? La respuesta es 23 y vamos a 2 ver una breve deducción de este cálculo. Hacemos el cálculo mediante las reglas anteriores. Calculamos la probabilidad del suceso opuesto. Es decir la probabilidad de que en una reunión de 23 personas ninguna tenga una fecha coincidente. Para ello utilizamos la regla de Laplace. Los casos posibles se obtienen de multiplicar 365 un total de 23 veces, es decir 36523 . Los casos favorables de esos 36523 son en total 365 × 364 × 363 × . . . × 343. Por tanto la probabilidad de que no haya ninguna fecha coincidente es 365 × 364 × 363 × . . . × 343 ' 0.5 36523 por tanto la probabilidad del suceso opuesto, es decir de que haya alguna coincidencia es 1-0.5=0.5. Probabilidades condicionadas: La probabilidad de un suceso puede ser modificada si disponemos de información. Ejemplo: Probabilidad de sacar un cuatro si en el lanzamiento de un dado sabemos que el número que ha salido es par. En este caso la probabilidad es de 1/3. Ejemplo: Probabilidad de sacar un cuatro si en el lanzamiento de un dado sabemos que el número que ha salido es impar. En este caso es 0. Ejemplo: Probabilidad de sacar un cuatro si el lanzamiento lo ha realizado el profesor de la asignatura. En este caso es 1/6. Este tipo de probabilidades es la que se considera en afirmaciones como: • Los jóvenes tienen más probabilidades de fumar si viven rodeados de fumadores. • La que fuera jefa del servicio de Epidemiologı́a de la conselleria de Sanidad en 1998, aseguró este jueves durante el juicio que se celebra contra el anestesista acusado, Juan Maeso, que la probabilidad de estar infectado por el virus de la hepatitis C si habı́a sido anestesiado por este facultativo era ”28 veces más”, según se reflejaba en los estudios realizados. La probabilidad también se puede utilizar para expresar el grado de creencia sobre algo. Este uso es el que se utiliza en la afirmación: La probabilidad de que Dios exista es del 62 por ciento, según el cálculo realizado por el ensayista alemán Thomas Vasek. Las mediciones de valores aleatorios presentan, usualmente, un comportamiento en forma de campana (campana de Gauss), cuando analizamos la frecuencia con que se observan dichos valores. La gráfica podemos observarla en la siguiente página. Esto queda reflejado en la forma en que se distribuye un conjunto de datos procedentes de una población con distribución normal como podemos ver en el siguiente ejemplo donde observamos la distribución en forma de campana de Gauss de las alturas de un grupo de soldados del ejército ruso. 3 2 La información del azar En la prensa y los medios de comunicación encontramos con frecuencia información en términos de números sobre distintos temas de interés, como puede ser el IPC, bajada en la venta de los coches, el promedio por familia en gastos de hipoteca, etc. También es muy común encontrarnos resultados de encuestas. Generalmente estas informaciones van acompañadas del término estadı́stica. Hay que distinguir dos usos de la palabra estadı́stica: • Se puede usar para referirnos al resumen de la información contenida en un conjunto de datos. Se trata entonces de la estadı́stica en términos descriptivos (estadı́stica descriptiva). • Se puede usar para referirnos a la información que obtenemos de un conjunto (grande) de datos, a partir de una parte de este conjunto de datos. Se trata entonces de la estadı́stica en terminos de inferencia (inferencia estadı́stica). Es muy importante distinguir la diferencia entre ambas. En el primer caso disponemos de todos los datos (censo) y la estadı́stica lo que pretende es resumir la información de todos 4 esos datos en unos cuantos números (usualmente medias y proporciones) o representaciones gráficas. En el segundo caso disponemos de una parte del total (muestra) y se pretende obtener información del total a partir de esta muestra. Este procedimiento es válido si la muestra se toma de la forma más imparcial posible. La forma de ser imparcial es elegir los datos al azar. A menudo los datos que se manejan proceden de instituciones públicas que se dedican a la elaboración de estudios estadı́sticos, como pueden ser el INE, CIS, CREM, etc. La seriedad y profesionalidad de estos entes públicos está avalada por los resultados de muchos años y podemos confiar, en principio, en ellos. El problema puede surgir en resultados de encuestas que aparecen usualmente en medios de comunicación, incluso en programas concurso donde las personas votan a través de Internet o mensajes de móvil. Para que una muestra nos facilite información fiable de la población, necesita tener dos caracterı́sticas: • Que sea representativa de la población. • Que su tamaño sea lo suficientemente grande para que las estimaciones sean precisas. La forma en que trabaja la estadı́stica la podemos ver al final del texto donde analizamos el ejemplo visto en clase en el cual extraemos muestras de tamaño distinto a las que le calculamos la media de los ingresos anuales de una supuesta población. Como se observa los valores de las medias muestrales se encuentran alrededor de la media de la población, y la cercanı́a a este valor poblacional es mayor cuanto mayor es el tamaño de muestra. 3 Estadı́stica de bolsillo: El IPC El IPC está considerado como un buen indicador de la variación de los precios de bienes y servicios. Sindicatos y directivos de empresas utilizan el IPC para las negociaciones de convenios salariales. El IPC es uno de los principales indicadores que se utilizan en economı́a. Según el INE: El Índice de Precios de Consumo (IPC) es una medida estadı́stica de la evolución de los precios de los bienes y servicios que consume la población residente en viviendas familiares en España. El conjunto de bienes y servicios, que conforman la cesta de la compra, se obtiene básicamente del consumo de las familias y la importancia de cada uno de ellos en el cálculo del IPC está determinada por dicho consumo. ¿Cómo se calcula? Empezamos con el caso más sencillo en el que yo quiero ver como ha cambiado el precio de un producto. Consideremos que quiero ver como ha cambiado el precio del litro de leche del mes pasado a este. Supongamos que el precio de la leche el mes pasado era de 86 céntimos y este mes de 88, podemos expresar la variación del precio en tanto por ciento como 88 × 100 = 102, 32. 86 5 Lo que se corresponde con un aumento del 2,32% del precio. Sin embargo este no es el único producto que una familia puede comprar. Por lo que serı́a razonable calcular la variación de la suma de precios de todos los productos actual, en comparación con la misma suma para los precios del mes anterior. Por ejemplo si compramos leche, carne y un producto de limpieza, el mes pasado, a 0,86, 6 y 3, respectivamente y este mes están a 0,88, 6,2 y 2,9, entonces calculamos la variación total como 0, 88 + 6, 2 + 2, 9 × 100 = 101, 12. 0, 86 + 6 + 3 Un primer problema en esta idea es que no todos los productos que compramos tiene la misma importancia en la cesta de la compra. Si se produce un cambio alto en un producto, no es lo mismo que este suponga un parte importante, en cuanto a gasto, del consumo que no. Para ello lo que debemos hacer es ponderar cada uno de los precios por el peso que pueda tener en la compra. Si en el ejemplo anterior el consumo de leche supone el 30% del consumo total, la carne el 50% y el producto de limpieza el restante 20%, entonces realizarı́amos el siguiente cálculo: 0, 88 × 0, 3 + 6, 2 × 0, 5 + 2, 9 × 0, 2 3.944 × 100 = × 100 = 102.22. 0, 86 × 0, 3 + 6 × 0, 5 + 3 × 0, 2 3.858 El IPC se calcula como en el caso anterior pero extendiendo el cálculo a un mayor número de productos. Aunque parezca sencillo, nos podemos plantear la siguiente serie de preguntas: • 1. ¿Cuál es la lista de productos que se consideran? • 2. ¿Cuál es el precio con el que comparamos el precio actual? • 3. ¿Cómo podemos asignar un precio a un producto? • 4. ¿Cómo sabemos la ponderación que debemos aplicarle a cada producto? La respuesta a las dos primeras preguntas son una cuestión de acuerdo. Las respuesta a las dos últimas se resuelven dentro de la estadı́stica y plantean nuevas preguntas. El precio que le asignamos a un producto es el precio promedio del producto en todo el pais. La ponderación será, igualmente, la ponderación promedio de las familias del pais. Lo cual nos plantea la pregunta: ¿Cómo podemos conocer esos valores en la población española? En el documento sobre metodologı́a para la elaboración del IPC podemos dar respuesta a esas preguntas. 6