Posibilidad o Probabilidad

Anuncio
Asignatura: Matemáticas Cotidianas
Aula de Mayores, UMU
Félix Belzunce Torregrosa
Dpto. Estadı́stica e Investigación Operativa
Universidad de Murcia
UMU 2009/2010
1
Caras, cruces y campanas
A la pregunta de qué posibilidades hay de sacar cara si lanzamos una moneda, la respuestas
usuales son “un 50%”, ”la mitad“... ¿Qué quiere decir que esa posibilidad o probabilidad
sea del 50 por ciento ó 0.5? Otras afirmaciones de ese estilo y que podemos encontrar en la
prensa o internet son las siguientes:
• Los jóvenes tienen más probabilidades de fumar si viven rodeados de fumadores.
• La que fuera jefa del servicio de Epidemiologı́a de la Consellerı́a de Sanidad en 1998,
aseguró este jueves durante el juicio que se celebra contra el anestesista acusado, Juan
Maeso, que la probabilidad de estar infectado por el virus de la hepatitis C si se habı́a
sido anestesiado por este facultativo era ”28 veces más”, según se reflejaba en los
estudios realizados.
• La probabilidad de que Dios exista es del 62 por ciento, según el cálculo realizado por
el ensayista alemán Thomas Vasek.
Para analizar correctamente las afirmaciones anteriores necesitamos adentrarnos en el
mundo del azar y en concreto en un mundo de CARAS, CRUCES y CAMPANAS.........
El estudio y cálculo probabilidades surge dentro del estudio de fenómenos o experimentos
aleatorios. Un fenómeno se llama aleatorio si los resultados son inciertos, imprevisibles o
impredecibles. ¿Cómo se puede estudiar o cuantificar algo que es imprevisible, impredicible?
Para ello vamos a analizar los resultados de un serie de lanzamientos de una moneda.
Un fenómeno aleatorio clásico y disponible a una inmediata observación es el del resultado
del lanzamiento de una moneda. En este caso el resultado es imprevisible, y los posibles
resultados son: CARA y CRUZ
Nota técnica: El conjunto de todos los resultados posible de un experimento o fenómeno
aleatorio se llama espacio muestral.
Consideremos ahora que realizamos un experimento aleatorio un número n de veces y
que de esas n veces, un número s de veces se produce el suceso A. Consideremos el cociente
s/n, es decir la frecuencia relativa con que ocurre el suceso A en esas n veces. Para este
cociente la práctica demuestra, para una amplia clase de sucesos, que cuando el número n de
experimentos se va haciendo cada vez mayor el cociente se va haciendo cada vez más estable
en el sentido de que se aproxima cada vez más a un número fijo, que denotaremos como p(A).
A partir de aquı́ se toma como hipótesis que a cada suceso aleatorio A es posible asignarle
un numero fijo p(A), en el intervalo [0,1], y que llamaremos probabilidad del suceso A.
Podemos ver lo anterior en la siguiente gráfica en la que se ha procedido a realizar una
serie de lanzamientos (1000) y se observa como la frecuencia relativa del suceso cara se va
aproximando a 0.5.
1
Algunas reglas de cálculo básico:
Regla de Laplace: Si los sucesos (elementales) observables tienen todos la misma probabilidad (equiprobables), entonces la probabilidad de un suceso S, se obtiene como el cociente
entre el número de sucesos elementales favorables al suceso S y el número total de suceso
elementales.
Ejemplo: Consideremos la situación en que lanzamos dos monedas los sucesos elementales son: {cara,cruz}, {cruz,cara}, {cara,cara} y {cruz,cruz}. Todos los sucesos tiene la
misma probabilidad en este caso 1/4. Consideremos ahora la probabilidad de que al lanzar
las dos monedas obtengamos al menos una cara. Según la regla de Laplace calcuları́amos:
casos en el que sale al menos una cara
3
= = 0.75
casos posibles
4
Probabilidades de sucesos opuestos: La probabilidad del suceso opuesto al suceso S
es igual a 1 menos la probabilidad del suceso S.
Ejemplo: En el caso anterior la probabilidad de que no salga ninguna cara serı́a 1 menos
la probabilidad de su suceso opuesto, es decir que al menos salga una cara, y que en el ejemplo
anterior hemos calculado como 0.75, es decir 1-0.75=0.25.
Veamos como se aplica el cálculo probabilı́stico a un estudio de coincidencias.
¿Cuantas personas son necesarias reunir para que con una certeza o seguridad del 50 por
ciento por lo menos dos de ellas hayan nacido el mismo dı́a? La respuesta es 23 y vamos a
2
ver una breve deducción de este cálculo. Hacemos el cálculo mediante las reglas anteriores.
Calculamos la probabilidad del suceso opuesto. Es decir la probabilidad de que en una
reunión de 23 personas ninguna tenga una fecha coincidente. Para ello utilizamos la regla
de Laplace. Los casos posibles se obtienen de multiplicar 365 un total de 23 veces, es decir
36523 . Los casos favorables de esos 36523 son en total 365 × 364 × 363 × . . . × 343. Por tanto
la probabilidad de que no haya ninguna fecha coincidente es
365 × 364 × 363 × . . . × 343
' 0.5
36523
por tanto la probabilidad del suceso opuesto, es decir de que haya alguna coincidencia es
1-0.5=0.5.
Probabilidades condicionadas: La probabilidad de un suceso puede ser modificada si
disponemos de información.
Ejemplo: Probabilidad de sacar un cuatro si en el lanzamiento de un dado sabemos que
el número que ha salido es par. En este caso la probabilidad es de 1/3.
Ejemplo: Probabilidad de sacar un cuatro si en el lanzamiento de un dado sabemos que
el número que ha salido es impar. En este caso es 0.
Ejemplo: Probabilidad de sacar un cuatro si el lanzamiento lo ha realizado el profesor
de la asignatura. En este caso es 1/6.
Este tipo de probabilidades es la que se considera en afirmaciones como:
• Los jóvenes tienen más probabilidades de fumar si viven rodeados de fumadores.
• La que fuera jefa del servicio de Epidemiologı́a de la conselleria de Sanidad en 1998,
aseguró este jueves durante el juicio que se celebra contra el anestesista acusado, Juan
Maeso, que la probabilidad de estar infectado por el virus de la hepatitis C si habı́a sido
anestesiado por este facultativo era ”28 veces más”, según se reflejaba en los estudios
realizados.
La probabilidad también se puede utilizar para expresar el grado de creencia sobre algo.
Este uso es el que se utiliza en la afirmación: La probabilidad de que Dios exista es del
62 por ciento, según el cálculo realizado por el ensayista alemán Thomas Vasek.
Las mediciones de valores aleatorios presentan, usualmente, un comportamiento en forma
de campana (campana de Gauss), cuando analizamos la frecuencia con que se observan dichos
valores. La gráfica podemos observarla en la siguiente página.
Esto queda reflejado en la forma en que se distribuye un conjunto de datos procedentes
de una población con distribución normal como podemos ver en el siguiente ejemplo donde
observamos la distribución en forma de campana de Gauss de las alturas de un grupo de
soldados del ejército ruso.
3
2
La información del azar
En la prensa y los medios de comunicación encontramos con frecuencia información en
términos de números sobre distintos temas de interés, como puede ser el IPC, bajada en
la venta de los coches, el promedio por familia en gastos de hipoteca, etc. También es
muy común encontrarnos resultados de encuestas. Generalmente estas informaciones van
acompañadas del término estadı́stica.
Hay que distinguir dos usos de la palabra estadı́stica:
• Se puede usar para referirnos al resumen de la información contenida en un conjunto
de datos. Se trata entonces de la estadı́stica en términos descriptivos (estadı́stica
descriptiva).
• Se puede usar para referirnos a la información que obtenemos de un conjunto (grande)
de datos, a partir de una parte de este conjunto de datos. Se trata entonces de la
estadı́stica en terminos de inferencia (inferencia estadı́stica).
Es muy importante distinguir la diferencia entre ambas. En el primer caso disponemos
de todos los datos (censo) y la estadı́stica lo que pretende es resumir la información de todos
4
esos datos en unos cuantos números (usualmente medias y proporciones) o representaciones
gráficas. En el segundo caso disponemos de una parte del total (muestra) y se pretende
obtener información del total a partir de esta muestra. Este procedimiento es válido si la
muestra se toma de la forma más imparcial posible.
La forma de ser imparcial es elegir los datos al azar.
A menudo los datos que se manejan proceden de instituciones públicas que se dedican a la
elaboración de estudios estadı́sticos, como pueden ser el INE, CIS, CREM, etc. La seriedad
y profesionalidad de estos entes públicos está avalada por los resultados de muchos años y
podemos confiar, en principio, en ellos. El problema puede surgir en resultados de encuestas
que aparecen usualmente en medios de comunicación, incluso en programas concurso donde
las personas votan a través de Internet o mensajes de móvil. Para que una muestra nos
facilite información fiable de la población, necesita tener dos caracterı́sticas:
• Que sea representativa de la población.
• Que su tamaño sea lo suficientemente grande para que las estimaciones sean precisas.
La forma en que trabaja la estadı́stica la podemos ver al final del texto donde analizamos
el ejemplo visto en clase en el cual extraemos muestras de tamaño distinto a las que le
calculamos la media de los ingresos anuales de una supuesta población. Como se observa los
valores de las medias muestrales se encuentran alrededor de la media de la población, y la
cercanı́a a este valor poblacional es mayor cuanto mayor es el tamaño de muestra.
3
Estadı́stica de bolsillo: El IPC
El IPC está considerado como un buen indicador de la variación de los precios de bienes
y servicios. Sindicatos y directivos de empresas utilizan el IPC para las negociaciones de
convenios salariales. El IPC es uno de los principales indicadores que se utilizan en economı́a.
Según el INE: El Índice de Precios de Consumo (IPC) es una medida estadı́stica de
la evolución de los precios de los bienes y servicios que consume la población residente en
viviendas familiares en España.
El conjunto de bienes y servicios, que conforman la cesta de la compra, se obtiene
básicamente del consumo de las familias y la importancia de cada uno de ellos en el cálculo
del IPC está determinada por dicho consumo.
¿Cómo se calcula?
Empezamos con el caso más sencillo en el que yo quiero ver como ha cambiado el precio
de un producto.
Consideremos que quiero ver como ha cambiado el precio del litro de leche del mes pasado
a este. Supongamos que el precio de la leche el mes pasado era de 86 céntimos y este mes
de 88, podemos expresar la variación del precio en tanto por ciento como
88
× 100 = 102, 32.
86
5
Lo que se corresponde con un aumento del 2,32% del precio.
Sin embargo este no es el único producto que una familia puede comprar. Por lo que
serı́a razonable calcular la variación de la suma de precios de todos los productos actual, en
comparación con la misma suma para los precios del mes anterior. Por ejemplo si compramos
leche, carne y un producto de limpieza, el mes pasado, a 0,86, 6 y 3, respectivamente y este
mes están a 0,88, 6,2 y 2,9, entonces calculamos la variación total como
0, 88 + 6, 2 + 2, 9
× 100 = 101, 12.
0, 86 + 6 + 3
Un primer problema en esta idea es que no todos los productos que compramos tiene la
misma importancia en la cesta de la compra. Si se produce un cambio alto en un producto,
no es lo mismo que este suponga un parte importante, en cuanto a gasto, del consumo que
no.
Para ello lo que debemos hacer es ponderar cada uno de los precios por el peso que pueda
tener en la compra. Si en el ejemplo anterior el consumo de leche supone el 30% del consumo
total, la carne el 50% y el producto de limpieza el restante 20%, entonces realizarı́amos el
siguiente cálculo:
0, 88 × 0, 3 + 6, 2 × 0, 5 + 2, 9 × 0, 2
3.944
× 100 =
× 100 = 102.22.
0, 86 × 0, 3 + 6 × 0, 5 + 3 × 0, 2
3.858
El IPC se calcula como en el caso anterior pero extendiendo el cálculo a un mayor número
de productos.
Aunque parezca sencillo, nos podemos plantear la siguiente serie de preguntas:
• 1. ¿Cuál es la lista de productos que se consideran?
• 2. ¿Cuál es el precio con el que comparamos el precio actual?
• 3. ¿Cómo podemos asignar un precio a un producto?
• 4. ¿Cómo sabemos la ponderación que debemos aplicarle a cada producto?
La respuesta a las dos primeras preguntas son una cuestión de acuerdo.
Las respuesta a las dos últimas se resuelven dentro de la estadı́stica y plantean nuevas
preguntas. El precio que le asignamos a un producto es el precio promedio del producto
en todo el pais. La ponderación será, igualmente, la ponderación promedio de las
familias del pais. Lo cual nos plantea la pregunta: ¿Cómo podemos conocer esos
valores en la población española?
En el documento sobre metodologı́a para la elaboración del IPC podemos dar respuesta
a esas preguntas.
6
Descargar