DIRECCIÓN DE EDUCACIÓN ABIERTA Y A DISTANCIA Y VIRTUALIDAD LICENCIATURA EN EDUCACIÓN BÁSICA CON ÉNFASIS EN CIENCIAS NATURALES Y EDUCACIÓN AMBIENTAL ESTADÍSTICA MÓDULO EN REVISIÓN CORPORACION U N IVERSITARIA DEL CARIBE-CECAR DIVISION DE EDUCACIÓN ABIERTA Y A DISTANCIA 'g-'"3, .t - t *l' **úd ;r='j ': i.-n..** ,'', - -€" t.. -' ¡r. MODULO ESTADISTICA PROGRAMA A DISTANCIA DE LICENCIATURA EN EDUCACIÓN BÁSICA CON ÉNFASIS EN CIENCIAS NATURALES Y EDUCACIÓN AMBIENTAL SINCELEJO - SUCRE CORPORACION U N IVERSITARIA DEL CARIBE-CECAR DIVISION DE EDUCACION ABIERTA Y A DISTANCIA t iñ "'f ' ': :=: ...- ''r'I ,i li .="*,.; ::; t.,, '. o: .:. MODULO ESTADISTICA CESAR TULIO MARTINEZ SANCHEZ Licenciado en Matemáticas Especialista en Educación Matemática PROGRAMA A DISTANCIA DE LICENCIATURA EN EDUCACIÓN BÁSICA CON ÉNFASIS EN CIENCIAS NATURALES Y EDUCAGIÓN AMBIENTAL SINCELEJO _ SUCRE CONTENIDO pá9, INTRODUCCIÓN ORIENTACIONES GENERALES PARA A EL DESARROLLO DEL 6 MODULO. OBJETIVOS DEL MODULO 7 OBJETIVO GENERAL. 7 OBJETIVOS ESPECiFICOS 7 UNIDAD 1 CONCEPTOS BÁSICOS DE ESTADíSTICA ó PRESENTACION I OBJETIVOS ESPECIFICOS 11 REQUISITOS PARA EL ESTUDIO DE LA UNIDAD 12 ATREVETE A OPINAR 13 DINÁMICA PARA CONSTRUIR EL CONOCIMIENTO 14 1. 1.1. .1 .1 CONCEPTOS BÁSICOS DE ESTADíSTICA 15 TERMINOLOGIAESTADISTICA 4q 1 Definición de Estadística lq 1.1.2. Población. 16 Muestra. 16 '1.1.4. Dato. 17 1.1.5. Variables 19 1.2. 1.2.1 . .2.2. DISTRIBUCIONESDEFRECUENCIAS 21 Frecuencia: ¿¿ Distribución de frecuencias no agrupadas. 22 1 1 .1 .3. 1.2.3. .2.4. I.2.5. 12 9. 1 Tablas de frecuencia agrupadas ¿5 Distribución de frecuencias acumuladas. 29 Distribucionesporcentuales 30 Interpretación de tabla 32 1.2.7: Representación gráfica de frecuencias 1.2.7.1 1 .2.7 . .2. Gráficos de barras óJ Diagrama circulares 34 1.2.7.3. Histogramas 12.7 .4. 33 Polígonos de frecuencia 35 e,7 1,.'2.7.5. Ojivas 38 RESUMEN 41 EJERCICIOS 42 LECTURAS COMPLEMENTARIA 45 MÉToDoS ESTADísTIcos 45 UNIDAD 2 47 MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN 47 PRESENTACION 48 OBJETIVOS ESPECIFICOS 49 REQUISITOS PARA EL ESTUDIO DE LA UNIDAD 50 ATREVETEA OPINAR 51 DINÁMICA PARA CONSTRUIR EL CONOCIMIENTO 52 2. 2.1. 2.1 .1. 2.1.2. 2.1.3. 2.1.4. 2.1.5. 2.1.6. s¡ MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN EQ MEDIDAS DE TENDENCIA CENTRAL 53 Media Aritmética c? Media en una Distribución de Frecuencias Agrupada. 54 Med¡ana co Mediana para datos agrupados. La moda 59 Moda para datos agrupados 59 2.2. MEDIDAS DE DISPERSIÓN 61 2.2.1. 2.2.2. 2.2.3. Desviaciónmedia ol Yarianza 63 Desviación Típica o Estándar 65 RESUMEN 67 EJERCICIOS 69 LECTURAS COMPLEMENTARIAS. TZ EL ENGAÑOSO TERMINO MEDIO 72 Unidad 3 Probabilidad 75 PRESENTACIÓN 76 OBJETIVOS ESPECIFICOS 77 REQUISITOS PREVIOS 78 ATREVETE A OPINAR 79 DINÁMICA PARA CONSTRUIR EL CONOCIMIENTO 80 J. TEORIA DE LA PROBABILIDAD 81 3.1. 3.2. 3.3. 3.4. 3,5. ESPACIO MUESTRAL 81 EVENTOS 84 PROBABILIDAD DE UN EVENTO 88 ESPERANZA MATEMÁTICA 92 RELACION ENTRE POBLACIÓN, MEDIA MUESTRAL Y 93 VARIANZA 3.6. ANÁLISIS COMBINATORIO RESUMEN 102 EJERCICOS 104 LECTURAS COMPLEMENTARIAS 107 ORIGENES DEL CONSEPTO DE PROBABILIDAD 107 BIBLIOGRAFIA 109 INTRODUCCION En nuestros días, la estadística se ha convert¡do en un método efectivo oara describir con exactitud los valores de datos económicos, políticos, sociales, ps¡cológicos, biológicos o fÍsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadístico no consiste ya sólo en reunir y tabular los datos, sino sobre todo en el proceso de "interpretación" de esa información1. Por tal razón, este modulo esta diseñado para el estudio de los temas básicos de la estadística, que le permitan al estudiante de la licenciatura de básica con énfasis en ciencias naturales a mejorar su nivel crítico como su capacidad para tomar decisiones. Por tanto, el modulo esta diseñado en tres unidades: la primera estudia las definiciones y términos más frecuentes usados en estadísticas, la distribución, organización, e interpretación de datos; en Ia segunda analizaremos las medidas de tendencia central y dispersión la tercera comprende los conceptos fundamentales oara introducirnos al mundo de la orobabilidad. ' Biblioteca encarta 2005 ORIENTACIONES GENERALES PARA EL DESARROLLO DEL MODULO. Como futuro licenciado de la educación básica con énfasis en ciencias naturales, requerirás de formar un pensamiento matemático que te permita no sólo la interpretación de los fenómenos naturales, sino también tazonat con lógica ante de la vida cotidiana. Es por ello que te presentamos el Módulo Estadística, en el cual encontrarás una serie de conceptos básicos sobre diskibuciones de frecuencia, medidas de tendencia central, probabilidad, y aspectos fundamentales estadística. El aprendizaje del modulo y su aplicación dependen exclusivamente de ti, de tu interés, entusiasmo y disciplina para emprender el estudio del mismo. Por lo tanto, te sugerimos tengas en cuenta: situaciones 1. Leer y entender detenidamente los conceptos e ilustraciones que allí encuentres. No avanzar a otros conceptos sin antes entender muy bien el que estud¡as, recuerda que éstos son secuenciales y prerrequisito para los oosteriores. 2. Cada vez que estud¡es un concepto y asimiles su ilustración realiza las actividades y ejercicios que encuentres en el respectivo taller. 3. En lo posible lleva un cuaderno de ejercicios resueltos, no sólo te servirá de material de apoyo sino que notarás tus avances. 4. No te desanimes cuando no ent¡endas algo, a todos nos ha pasado, consulta en otro texto o acláralo con tu grupo de estudio o con el tutor. OBJETIVOS DEL MODULO OBJETIVO GENERAL. Desarrollar competencias en el estudiante en el manejo de los conceptos básicos de estadística para que los utilice como herramienta esencial en situaciones de las ciencias naturales y el que hacer pedagógico. OBJETIVOS ESPECíFICOS 1. Aplicar los conceptos necesarios para la realización de tablas de distribución de frecuencias y graficas. 2. Aplicar los conceptos de medidas de tendencia central 3. Aplicar los conceptos de probabilidad 4. Despertar en los estud¡antes la curiosidad y el interés hacia la búsqueda del conocim¡ento que le sirva de apoyo para su actitudes innovadoras algebraicos. e investigativas a aprendizaje, asumiendo partir de los conoc¡m¡entos UNIDAD 1 CONCEPTOS BÁSICOS DE ESTADíSTICA ,& fr I PRESENTACION Tradicionalmente la estadística se utilizo por los gobiernos de los estados para establecer registros de población, nacimiento, defunciones, cosechas, impuestos, etc. Incluso hoy día gran parte de la población ent¡ende por estadística los conjuntos de datos distribuidos en tablas, gráficos, publicados en diarios, etc. La estadística se debe entender como un método para la toma de decisiones, de ahí que se empleé en multitud de estudios científicos de todas las ramas del saber. Así, por ejemplo: ¿Cómo decidir si un nuevo producto comercial tendrá éxito? ¿Qué podrá pronost¡car un sociólogo a partir de una encuesta sobe voluntad de votos? ¿Cómo podrá un experto en geografia humana calcular la composición de la población en el año 3008? ¿Cuáles serán las necesidades de puestos escolares para los próximos c¡nco años? La estadística no es que conteste con total exactitud a estas preguntas, pero si es cierto que mediante procedimientos estadíst¡cos podremos responder a las cuestiones planteadas con un margen de error prefijado. El mal uso de la estadística permite hacer todo tipo de falsas interpretaciones y equívocos, que puedan confundir a las personas con informaciones tendenciosas. Cuenta una anécdota ocurrida en una guerra entre mandarines chinos. Había que cruzar un río, y un mandarin recordó haber leído que la profundidad media del agua en esa época del año era aproximadamente de un metro, por lo que dio orden de pasarlo a pie. Una vez cruzado el río el mandarín observo asombrado que se había ahogado varios centenares de sus soldados. ¿Qué paso? Pues que aunque el río tenÍa una profundidad media de un metro, en determinados lugares eran mucho más profundos, por lo que los soldados más bajos no pudieron ni asomar la cabeza. l0 - OBJETIVOS ESPECIFICOS 1. Aplicar los conceptos básicos fundamentales para el análisis e interpretación de datos. 2. Organizar un conjunto de datos mediante tablas de frecuencia y gráficas. 3. Analizar, interpretar y extraer conclusiones de cualquier información presentada en tablas de frecuencias o cualquier tipo de gráfica. 4. Fomentar el interés hacia el estud¡o de la estadística dada su aplicación a situaciones propias de la ciencia. ll REQUISITOS PARA EL ESTUDIO DE LA UNIDAD Para cumplir con los logros, propuesto de esta unidad se requiere que el estudiante: - l2 Efectúe correctamente operaciones con número reales. ATREVETE A OPINAR Tome su cuaderno de notas y responda las siguientes preguntas, a medida que avances en sus estudios verificando sus ac¡ertos, corrigiendo los desaciertos que se hayan tenido y respondiendo las preguntas que dejaste de responder, podrás darte cuenta de la cantidad de conocimiento que tenías sobre el tema al comenzar el estudio o lo que adquirió en el proceso. 1. Que aplicabilidad le encuentra a la estadística en su que hacer diario. 2. cual es la diferencia entre población y muestra. 3. Determina el rango de los siguientes dato: 16, 46,6, 4. realiza una tabla de frecuencia y un diagrama de barra con los siguientes datos: T.' 2,5, 10 3, 5 ,4,3,3,2.7 20,75,45y 24 DINAMICA PARA CONSTRUIR EL CONOCIMIENTO ACTIVIDAD PREVIA: (Trabajo independiente) 1. Responda de manera escrita la sección Atrévete a responder. 2. Lea analíticamente la unidad y haga un resumen sobre los conceptos básicos de la unidad 3. Anote las dudas y dificultades presentadas durante la lectura de la unidad y los ejercicioi que se encuentran al final de la unidad 4. Tome un recibo de servicios y convierta el diagrama de barras en una tabla oe frecuencias ACT|VTDAD EN GRUPO (C|PAS) ':::: l. Reunidos en CIPAS, socialicen los resúmenes elaborados de manera individual e independiente 2. . Socialicen las respuestas de la sección Atrévéte a opinar, que desarrollaron de manera individual. 3. Desarrollen los ejercicios que se encuentra al final de la Unidad y discútanlos en el grupo de estudios. Estos ejercicios deben ser socializados en la sesión junto con todos los compañeros de grupo y entregados al tutor. 4. Elabore con sus compañeros una encuesta, aplÍquela , tabule e interprete los resultados 5. Aclare las dudas con el tutor. t4 1. CONCEPTOS BÁSICOS DE ESTADíSflCA 1.i rERMrNoLoc¡A EsrADísnct 1.1.1 Definición de Estadística La Estadística' estudia los métodos científicos para recoger, organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis. Pero, para comprender su estado actual y su campo de actividades, necesitamos conocer algo de su historia. Godofredo Achenwall (1719-1772), profesor y economista alemán, quien es considerado el fundador de la Estadística, ejerciendo la docencia en la Universidad de Leipzig realizó unos apuntes acerca de una nueva ciencia a la que llamó Estadística, la cual la definió como e/ conocimiento profundo de la situación respectiva y comparativa de cada estado. Estadística se deriva de la palabra sfaaf que significa gobierno. Las primeras aplicaciones de la Estadística fueron los asuntos de gobierno y fuego fas utilizaron las compañías de seguros y los empresarios de juego y azal a las anteriores siguieron los comerciantes, los industriales, los educadores, etc. Hoy en día, la Estadística puede definirse como un método científico de operar con los datos e interpretarlos. Los procedimientos y análisis que aparecen en la t lf Martínez, Ciro. Estadíst¡ca. Eco Ediciones. Eogotá 1992. Pá9. I estadística caen en dos categorías generales, descriptiva e inferencial dependiendo del propósito del estudio. Estadística descriptiva: comprende aquellos métodos usados para organizar y describir la información. Estadística inferencial: comprende aquellos métodos y técnicas usadas para hacer generalizaciones, predicciones o estimaciones sobre poblaciones a partir de una muestra. 1.1.2 Población. Es el conjunto de todos los elementos que cumple una determ¡nada característica. Por ejemplo si un biólogo esta interesado en una investigación para determinar características comunes en las diversas especies vivientes, su población de interés será los elementos que conforman los sistemas naturales 1.1.3. Muestra, Es cualquier subconjunto de la población. A la muestra se le considera una representación de la población, por ello se ha de cuidar su elección. La muestra puede ser probabilística o intencional, es probabilística cuando todos los elementos de la población tiene la misma posibilidad de ser elegida, la intencional es cuando el investigador selecciona bajo su criterio la muestra. 16 1.1.4. Dato. Son medidas valores o características susceptibles de ser observado y contado, es decir es asignar numerales a personas, animales o acontecimientos de acuerdo con ciertas reglas, los datos pueden ser: Datos nominales. Consiste en clasif¡car objetos reales según ciertas características o nombres dándole un símbolo o código sin que implique una reacción de orden, distancia o proporción entre estos objetos. En esta escala las variables son cualitat¡vas y para medirlas se asigna códigos a diferentes atributos o categorías. Estos son números que solo nombran, marcan diferencia de clase y por lo tanto, pueden servir para clasificar observaciones sobre variables cual¡tativas mutuamente exclusivos, donde los números de cada grupo pueden entonces contarse. Por ejemplo si la variable en estudio es sexo, entonces macho puede codificarse con cero (0) y hembra con uno (1), pero las marcas alternativas macho = 50 y hembra = 15 también servirán como se puede ver con este ejemplo, en este tipo de escala no tiene sentido sumar, restar, multiplicar, dividir, promediar ni manipular de otra forma datos nominales. solo se ouede contar. Datos Ordinales En esta escala se establecen posiciones relativas de objetos o individuos con relaciones a una característica sin que se reflejen distancia entre ellos. Entre los objetos ordinales existen la relación, mayor, ¡gual o menor que y las relaciones lógicas de transitividad y asimetría. La ordenación implica diferentes niveles de pos¡ción de atributos. Sin embargo, Ias d¡ferencias entre números o razones de dicho número permanecen sin ningún sentido. Por ejemplo, la clasificación de 17 cachamas como grandes, medianas códigos: 3,2, 1,0 o 250, 150, 50, o pequeñas podían registrase con los lo ¡mportante es que los números mayores denotan una clasificación más favorable a un tamaño mayor, en tanto que las menores indican lo opuesto. Pero, estos datos no indican cuantos más o menos favorable es una evaluación comprobada con otra. Un dos se considera más que un uno, pero no necesariamente el doble del tamaño, un 2,b0 se considera una cachama de mayor tamaño que la referencia con un 50 pero no necesariamente 5 veces mayór. En cualquier caso, las operaciones aritméticas con estos datos están fuera de lugar Datos De Intervalos Las variables en una escala de intervalos se miden por valores numéricos y, como los datos ord¡nales inherente una jerarquía u ordenación, además están relacionados entre si por intervalos o distancias significativas por que todos los datos están referidos a un punto cero arbitrario. Dadas esas arbitrariedad, las razones de dicho número no tienen sentido. La suma y la resta son permisibles pero no la multiplicación ni la división la escalas de tiempo calendario, tiempo horario y temperatura dan buenos ejemplos de mediciones que empiezan desde un punto cero local¡zando desde un punto arbihario y luego utilizan una distancia unitaria, igualmente arbitraria pero consistente, para expresar intervalos entre números. Datos de razón El nivel más alto de medición, que produce la información más útil, proporcionan datos de razón, esto es, además de distribución, orden y distancia, permite establecer en que proporción es mayor una categoría que otra, es decir contienen razones con sentido porque están referidas a un punto cero absoluto o natural que denota la ausencia total de la característica que mide. Todos los tipos de l8 operac¡ones aritméticas, incluso la multiplicación y la división se pueden efectuar con estos datos. 1.1.5. Variables Es una característ¡ca que puede tener diferentes valores en los distintos elementos o individuos de un conjunto Ejemplo: Característica de cachamas de un exoerimento: Cachama C1 C2 C3 C4 CS CO C7 C8 Cg C10 Variable Cualitativa Variable Cuantitativa Sexo Especi+ Edad talia Macho Cachama negra Hembra Hembra Cachama blanca Híbrido Cachama blanca Híbrido Cachama negra Hibrido Híbrido Cachama blanca Cachama neora Macho Macho Hembra Hembra Hembra Macho Hembra ¡ Las variables se pueden clasificar en cualitativas y cuantitativas l9 Discretas ./ Cuantitativa \ Variables Continuas Binomial Cualitativa Multinomial Variables cualitativas Una variable que se describe normalmente en palabra y no en forma numérica, porque difiere en clase y no en cantidad entre unidades elementales se denominan variable cualitativa, la tabla anterior contiene dos variables cualitativas, sexo y especie Estas variables cual¡tativas pueden ser Binomial o Multinomial Las Binomiales son las que en ella se observan únicamente dos categorías por ejemplo Sexo (Macho y Hembra), Clases de energía (Cinética, Potencial). Sobre una variable cualitativa multinomial se pueden hacer' observaciones en más de dos categorías, por ejemplo: especie de cachamas (blanca, Negra, híbrido), sistemas naturales (marino, terrestre, estuarios, de agua dulce) transformaciones de la energía (calorífica, radiante, eléctrica, nuclear). 20 Variable cuantitativa: Las variables cuantitativas son aquellas que se pueden expresar numéricamente, porque difieren en cantidad y no en clase entre las unidades eleméntales bajo estudio. En un sentido amplio, es asignar numerales a personas animales objetos acontecimiento de acuerdo con ciertas reqlas. 1.2 DISTRIBUCIONES DE FRECUENCIAS El aspecto fundamental de la estadística es la información que contiene. srn información que seleccionar, organizar, analizar e interpretar, no habrá razón para usar o estudiar estadística; a la información usada en estadística se llaman datos; para que sea út¡l dicha información en la toma de desiciones, debe organizarse y mostrarse apropiadamente. El objetivo de la organización de datos es acomooar un conjunto de datos en forma útil para revelar sus características esenciales y simplificar ciertos análisis Una distribución de frecuencia es una tabla en que un conjunto de datos se divide en un número adecuado de clases, al tiempo que se muestra también el número de unidades pertenecientes a cada clase. En esta tabla se sacrifica parte de la información contenida en los datos; en conocer el valor exacto de cada un¡dad, se sabe únicamente que pertenece a cierta clase- En cambio el tipo de agrupación suele destacar importantes características de los datos y por consiguiente, la ganancia en legibilidad suele más que compensar la perdida de la información. 2l 1.2.1 Frecuencia: La frecuencia de una medida o de una categoría es el número de veces que aparecen en una colección de datos, lo denotaremos con el símbolo n v se lee frecuencia absoluta. Una distr¡bución de frecuencias es una tabla en a que un conjunto de datos se divide en un numero adecuado de clase (categorías), al tiempo que se muestra tamb¡én el numero de unidades pertenecientes a cada clase. Existen dos topos generales de tabla para reportar datos usando frecuencias Estas son: Distribución de frecuencias no agrupadas y distribución de frecuencias agrupadas. L2.2. Distríbución de frecuencias no agrupadas. Continuación se presentan las horas dejadas de trabajar en un mes, por los empleados de un laboratorio de investigación animal Número De Horas Dejadas De Trabajar 9-8-7-8-4-3 -2-1 -1-5-3-2- 1 -1 -7 -3-2-8-7-6-6_4_3_2 2-1 -9-4-6-9-6-9-4-3-5-7 -3-21 -4-4-2 Solución Para hacer la representación de estos datos en una tabla de frecuencla procedemos de la siguiente forma: Pr¡mero usamos marcas de clase para ayudar a determinar la frecuencia absoluta 22 ni de cada observac¡ón, donde X representa el número de horas dejadas de trabaiar. Número de horas dejadas de trabaiar Tabulacion Frecuencia ¿ ilililt o 7 J 4 ililil 1 il 5 o 7 8 o 6 z 4 4 4 42 total Por cada observación, hacemos una marca (1) en la columna denotada con tabulación correspondiente a cada marca de clase, cuando se han hecho todas las observaciones se cuentan las de cada clase X para determinar dicha frecuencias. Note que la suma de todas las frecuencias absolutas es igual al número de datos de la población o muestra según sea el caso. por ejemplo la suma de la frecuenc¡a (42) representa 42 empleados de un laboratorio de investigación animal. 1.2.3.Tablas De Frecuencia Agrupadas Estas tablas presentan las frecuencias de acuerdo con grupo o clase de medidas. Se usan comúnmente para resumir grandes cantidades de datos que contienen relativamente pocas repeticiones; tales resúmenes facilitan ciertos cálculos estadísticos. Para usar una tabla de frecuencias agrupadas, los datos deben medirse al menos con una escala de intervalos. Si se quiere construir una tabla de frecuencias agrupadas para una cierta colección de datos, es necesario responder tres preguntas relativas a las clases. I . Cuántas clases deben usarse 2. Cuál debe ser la amplitud de cada clase 3. En qué valor debe empezar la primera clase. Escoger el número de clases requiere varias consideraciones. si todos los datos se agrupan en un número pequeño de clases, las caracteristicas de los datos originales se ocultan y puede perderse información relevante; por otra parte si se utilizan demasiadas clases se pierde el propósito del agrupamiento que es condensar los datos. Presentándose además la posibilidad que muchas clases queden vacías quitándole sentido al agrupamiento de los datos. El número de clases, denotado por c depende de la situación y del número oe datos obtenidos. No existe ningún'acuerdo general acerca del número de clases que deban usarse dada que la elección es arbitraria se recomienda que se utilicen entre (5 y 15) clases. una sugerencia útil para encontrar el número de clases está dada por la regla de STURGEES3 C = 1 + 3,3 Log n donde n es el número de datos. La amplitud de cada clase o intervalo se encuentra usando el rango (R) que es la diferencia entre el valor máximo (Xr"J y el valor mínimo (X-¡n) en la muestra R=Xr"r-X,n¡n Como G clases debe cubrir el rango, dividimos entre el número de clases para encontrar la amplitud de clases A rMartínez, Ciro. Estadística. Eco Ediciones. Bogotá 1992. pág. 39 24 Amplitud de clase ^R C Generalmente el cociente E C no ". de la misma exact¡tud de los datas en el caso de que esto ocurra debemos aproximar A al número más próximo (valga la redundancia) por encima que tenga la misma exactitud de los datos. Para determinar en que valor empieza la primera clase se tiene en cuenta, si al escoger la amplitud conveniente de cada intervalo el rango se amplía o no. Si el rango no se amplía la primera clase empieza en el valor mÍnimo de la muestra. El rango se amplia, determinamos en cuantas unidades lo hace y se reparte conveniente este valor, al valor máximo se le suma la cantidad especif¡ca y al valor mÍnimo se le resta la otra cantidad la diferencia corresponde al inicio de la primera clase. Ejemplo Para mostrar la construcc¡ón de una distribución de frecuencias, se consideran las siguientes 80 determinaciones de emisión diaria (en toneladas) de óxidos de azufre de una planta industrial. 25 15.8 26.4 17.4 11.2 23.9 24.8 18.7 13.9 9.0 18.1 22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 14.5 26.8 22.7 18.0 20.5 11.1 20.9 15.5 19.4 16.7 19.0 19.1 15.2 22.9 26.6 20.4 21 .4 19.2 21 .6 16.9 10.7 18.5 23.0 24.6 20.1 16.2 l8 7 .7 13.5 23.5 23.7 14.4 28.6 '19.4 17.0 20.8 24.3 22.5 24.6 18.4 13..2 8.3 21.9 12.3 22.3 13.3 1 .8 19.3 20.0 25.7 23.8 25.9 10.5 15.9 27.5 18.'l 17.9 9.4 24.1 20.1 28.5 1 1. Primero se determina el valor máximo y el valor mínimo del conjunto de datos. Xmáx = 28.6 2. Se calcula el Rango. R=X.¿¡-X¡¡¡ R = 28.6 - 6.2 =22.4 3. Se determina el número de intervalos o clases. C=1+3,3Logn C= I + 3,3 Log 80 C=1+S,311,993¡ C:= 1 + 6,28 C:= 8 4 Amplitud de clase ^R C 26 Xmín = 6.2 A =22'4 8 A=2.8 entonces 5. Límite de los intervalos Como C = 8YA = 2,8, entonces R =AxC = 8 X2,B=22,4 En este casoel rango no se amplio, por lo tanto la primera clase empieza en el valor mí nimo 6,2; quedando así: CLASE 1 ¿ 4 7 8 INTERVALO 6.2- I 9- 11.8 11.8 14.6 14.6 17.4 17.4 -20.2 20.2 - 23 23 -25.8 25.8 - 28.6 - Nota: Si el rango se amplia, determinamos en cuantas unidades lo hace y se reparte convenientemente este valor, al máximo se le suma la cantidad esoecifica y al otro valor minimo se le resta la otro cantidad la diferencia correspondiente al inicio de la primera clase. Como se observa en la tabla se presenta el inconveniente que las clases se traslapan, es decir, existen datos, por ejemplo 17,4 (tercer dato de la primera fila) que no se sabe si pertenecen a la cuarta o quinta clase; una forma de evitar esto, es utilizando una cifra decimal para el limite inferior de cada clase. Al realizar la tabulación la tabla queda de la siguiente manera. 27 clase 6.21- tabulación I O¡ 4 - 11.8 11.81 - 14.6 |ilil ill 14.61 - 17.4 ililI ilil| 17.41 - 20.2 ililt ililt ililt iltl 9.01 20.2't 23.01 25.8 8 10 19 -23 4'r. -25.8 o - t l0 28.6 80 Como ya se indicó, una vez agrupados los datos, cada observación pierde su identidad, en el sentido que deja de conocerse su valor exacto. Esto puede provocar dificultades cuando deseamos ofrecer descripciones adicionales de los datos, pero se puede salvarlas representando cada observación en una clase con su punto intermedio llamada marca de clase. para calcular la marca de clase se suman los límites superiores e inferiores y se divide la suma entre dos, se denota como Xi; para los datos de emisión de óxido de azufre se tiene: Toneladas de oxido de azufre 6.219.01 - 11.8 I - 11.81 14.6 14.6 1- 17.4 17.4 1-20.2 20.21-23 X¡ 4 7R ó 10 19 10.4 13.2 16 18.8 21.6 23 01- 25.8 I 25.81 10 80 -28.6 T 28 ll¡ 24.4 27.2 1.2.4 Distribución De Frecuencias-Acumutadas. solo cuando las variables son cuantitativas se puede determinar una frecuencia acumulativa de clases como la suma de frecuencias de clases para todas las clases. Para encontrar la frecuencia absoluta acumulada, que se denota con suman todas las frecuencias absolutas hasta la clase K_ésima. ]V K= Ni se +. Ln, ¡=t Por ejempfo N r=Zn, : ñ1+n2 +n3+¡4 =:4+7+8+10 =2g. t=l A continuación se muestra la frecuencia acumulada de las toneladas de óxidos oe azufre Toneladas de oxido de ' fl¡ Ni 4 4 7 11 29 48 20.21-23 ó 10 19 13 23 01- 25.8 o 25.81-28.6 't0 azu'fre I 6.219.01 - 11.8 11.81 14.6 14.6 1- 17.4 17.4 1- 20.2 - lo A4 70 80 Existen varias formas alternativas de distribuciones para la agrupación ocasionan de datos. Las más comunes son las distribuciones acumulativas ,,mayor que" y "o más", estas tablas se construyen a partir de las tablas de frecuencia acumulaoa respect¡va. .una distribución de frecuencias acumulativa "menos de" muestra el número total de observaciones inferiores a valores dados. Estos valores deben ser fímites de clases apropiados, pero no pueden ser marcas de clases. para el ejemplo de las toneladas de óxidos de azufre sería: 29 Frecuencia acumulada menor oue Oxido de azufre Menor de 6.2 Menor de 9 Menorde 11.8 Menor de 14.6 Menor de 17.4 Menor de 20.2 Menor de 23 Menor de25.8 Menor de28.6 N¡ 4 4 11 19 ¿v 48 61 70 80 Frecuencia acumulada mayor que Oxido de azufre 6.2 o más 80 9omás TO 11.8 o más 14.6 o más 17.4 o más 20.2 o más 23 o más 25.8 o más 28.6 o más N¡ OY 6'l 51 32 lo 10 0 1.2.5. Distribuciones Porcentuales Si se desea comparar distribuciones de frecuencias, puede ser necesario (o al menos conven¡ente) convertidas en distribuciones porcentuales. Para ello sencillamente dividimos cada frecuencia de clase entre la frecuencia total, esto se conoce como frecuencia relativa , que se denota con fi y se calcula 30 así: f = L; ,I luego se multiplica este cociente por cien, de esta forma se ¡nd¡ca que porcentaje de los datos corresponde a cada clase de la distribución. Lo mismo puede hacerse con distribuciones acumulativas, con lo que se convertiría en distribuciones acumulativas porcentuales. A continuación se muestran ambos tioos de distribuciones: Oxido de azufre 6.21- 9 9.01 - 11.8 11.81 - 14.6 14.6 1- 17.4 17.4 1- 20.2 20.21 -23 23 01- 25.8 25 81 - 28.6 T Fi f fl¡ nnq 4 7 0.0875 8 01 10 0.125 0.2375 0.1625 0.1125 0 125 l9 13 Y 10 80 1.0 fix 100 Fi 5% 8.75% 1jYo F, 0.05 0.1375 0.2375 0.3625 0.6 0.7625 0.875 1.00 12.5o/o 23.7 5o/o 16.25% 11 .250/o 12.5% 100% x100 55o/o 13.7 5o/o 23.75% 36.25o/o 600k 76.25o/o 87 .5o/o 100Yo se le conoce como frecuencia relativa acumulada. En la siguiente tabla se muestra una d¡stribución de frecuencias y la interpretación de cada una de las columnas que la conforma. clase Oxidos de azufre ni N¡ f¡ %o F¡ Relativo 1 ¿ o.z- Y 9.01 - '1 1.8 4 7 11 11.81 8 19 10 19 13 29 48 - 14.6 14.6 1- 17.4 17.4 1-20.2 ¿u.¿ | - ¿J 23 01- 25.8 25.81 -28.6 4 7 B I 3l I 10 80 4 61 70 80 0.05 0 0875 0.1 u. t¿c u.¿ó I c 0.1625 0.1125 0.125 1.0 8.75 10 12.5 23.75 16.25 11.25 12.5 100% o/o Xi Acumulado 0.05 0.1375 u.¿ó t c 0.3625 0.6 0.7625 0.875 55 7.6 tJ-/3 23.75 36.25 60 76.25 104 1.00 100 ó/.3 tJ.z 16 18.8 zt.o 24.4 27.2 1.2.6. lnterpretación De Tabla Se interpreta un dato de cada columna 1. na= 1g' esto quiere decir que en diez días se presento una emisión de oxido de azufre comprendido entre 14.6 y 17.4 toneladas diarias. 2. Nu= 46 quiere decir que durante cuarenta y ocho días la emisión de oxido de azufre estovo entre 6.2 y 20.2 toneladas. 3. fa= Q.l=19%; quiere decir que el diez por ciento de los días la emisión de oxido de azufre producida por la fabrica estuvo entre 11.8 y 14.6 toneladas. 4. Fu= 9.7625= 76.250/o; quiere decir que el 76.250/o de los días la fabrica produjo entre 6.2 y 23 toneladas de emisión de oxido de azufre. 5. Xr='19.4' quiere decir que en siete días se produjo 10.4 toneladas de oxido de azufre en la fabrica. Actividad 1.1: ' Se presenta el registro de las edades en meses cumplidos, de 40 niños de un iardín infantil 1232920 24 29 23 16 30 15 14 17 22 21 22 30 183429362725 11 23 2s 28 19 31 30 35 17 27 33 38 26 28 33 34 26 39 A partir de los datos anteriores: construye una tabla de frecuencias e interpreta cada una de las columnas que la conforma. )¿ 1.2.7 Representación Gráfica De Frecuencias Una gráfica es otra manera de describir conjunto de datos; a menudo, una representación de datos mediante ilustraciones hace más evidentes c¡ertas caracterÍsticas que una tabla de frecuencias. se puede afirmar que una gráfica estadística es aquella en la cual se presentan los datos estadísticos en términos de magnitudes, para interpretarlos en forma visuala Hay representaciones gráficas de muchos tipos las más usadas son: Histogramas, polígonos de frecuencias, diagramas de barra, circulares, y ojivas. A continuación se hacen las ilustraciones de cada una de ellas. 1.2.7,1. Gráficos De Barras. Los gráficos de barras proporcionan buena información y permiten una apreciación estadística más rigurosa. Aunque no existen normas específicas para la distribución de gráficos de barras, miremos estas recomendaciones que serán de gran utilidad en este campo: o Verificar que el gráfico quede b¡en balanceado, evitando que las barras resulten muy anchas o demasiado altas. . . . Hay que dejar siempre un espacio prudencial entre las barras, que no sea inferior a la mitad del ancho de ellas. Se deben de realizar, pero esto es a gusto de quien las hace, líneas de fonoo en la gráfica; ellas facilitan la lectura de los valores. No recargar las barras tratando de expresar demasiados productos en ellas. Confiar en nuestra buena apreciación visual y buen sentido. Veamos el siguiente Ejemplo. Las horas dejadas de trabajar en un mes, por los empleados ' MARTINEZ. 8., estadística comercial. E. Norma. Bogora. | 98 l. pág 42. -'t -J de un laboratorio de investigación animal Número de horas dejadas de trabajar I 7 o 5 2 1 0 1.2.7.2. Diagrama Circulares Estos gráficos o diagramas circulares o diagramas de pastel, son muy utilizados para representaciones gráficas de distribuciones porcentuales se forma un gráf¡co circular cuando se individualiza con una marca la porción de pastel que conesponde cada característica que se quiere visualizar Para determinar el tamaño de cada sector necesitamos cono@r el ángulo cental de cada uno de ellos, dicho ángulo se puede calcular así; El ángulo central de 360' equivale a un sedor del 100%, es decir 34 Ansuto central- boo'hoo /'*) = (¡oo Ir,) 100% Es decir multiplicamos la frecuencia relativa por 360. Ejemplo. Las horas dejadas de trabajar en un mes, por los empleados de un laboratorio de investigación animal 10o/o 5o/o 14o/o 1.2.7.3. Histogramas son una forma de representación gráfica de las frecuencias de clase, y consiste en representar las frecuencias por medio de áreas de rectángulo (banas). Los histogramas son diferentes de los diagramas de barras; en un diagrama de barras, las alturas de éstas miden el tamaño de la variable y usualmente se grafican 35 separadas, es decir, dejando espacios entre sí. En un histograma, las frecuencias quedan representadas por el área de sus rectángulos mas no por sus alturas y las barras necesar¡amente se dibujan sin dejar espacios entre ellas. El concepto de densidad de frecuencia es un concepto relativo, puesto que relaciona el volumen de un cuerpo con su masa. En Estadística un concepto similar es la densidad de frecuencia, que para este caso se relaciona con las banas del histograma, de modo que multiplicando el área por la densidad de frecuencia se obtiene la frecuencia absoluta o número de casos que caen dentro del intervalo de clase. El eje vertical en los histogramas mide la densidad de frecuencia y el eje horizontal es la linea del intervalo de clase. Por ejemplo, en la corresponde a intervalos de clase de diferente anchura, el corresponde al intervalo 11-12 v el dos al intervalo 12-16. 6 5 Área rectángulo I = (1) (5) = 5 4 Área rectángulo ll = (4) (2) = 8 3 2 1 36 siguiente figura rectángulo uno nil El rectángulo uno representa 5 unidades de frecuencia y el rectángulo dos representa 8 unidades de frecuencia. Observe que si la base del rectángulo es la unidad, entonces su altura corresponde a la frecuencia. En muchos histogramas, cuando los intervalos de clase tienen la misma anchura, es común escoger como unidad de base de los rectángulos la misma anchura del intervalo y eso nos lleva a que las alturas de las barras midan la frecuencia. Se aconseja manejar muy bien este concepto y tratar siempre la frecuencia como expresión del área de los rectángulos. Con el fin de dar generalidad a la impresión visual que brinda un histograma, los estadísticos recomiendan, para la elección de la longitud de los ejes, utilizar la regla de los tres cuartos, que no es otra cosa que el eje vertical debe ser los tres cuartos de la longitud del eje horizontal. El eje de las abscisas se escoge de acuerdo con las condiciones del problema y luego se fija el eje vertical en los tres cuartos de la longitud del eje horizontal. POLIGONOS DE FRECUENCIA Un polígono de frecuencia se obtiene uniendo con segmentos de recta los efremos de las ordenadas (altura de los rectángulos) correspond ientes a marcas de clases vecinas. Hay que tener cuidado que cuando los intervalos de clase son del mismo ancho, el área bajo la poligonal equivale a la suma de las áreas de los rectángulos que la )t definen. La poligonal culmina con el eje X añadiendo un intervalo de clase antes del inicio y otro a continuación del último; así se obtuvo en la figura poligonal ABCDEF. En la anterior figura, preste especial atención a las parejas de triángulos con líneas horizontales y verticales, ya que son iguales entre sí, es dec¡r, uno de ellos quita área al rectángulo y el otro le añade, obteniendo de este modo que el área bajo la poligonal es igual o equivalente a la suma de las áreas de los rectángulos del histograma. En caso de que los intervalos de clase no sean iguales, entonces el área bajo la poligonal es muy aproximada a la suma de las áreas de los rectángulos; entre más reducido sea el ancho de los intervalos de clase, es más aproximado este cálculo. 1.2.7.5 Oj¡vas Las ojivas resultan al mostrar la información de una distribución de frecuencia acumulada mayor que o menor que. 38 Veamos un ejemplo con la siguiente tabla: Edades Número de Menor que 49.5 0 Menor que 52.5 Menor que 55.5 ¿ó Menor que 58.5 65 Menor que 61.5 92 100 Un gráfico que recoja las frecuencias acumuladas, por debajo de cualquiera de las fronteras de clase superiores respecto de dicha frontera, se llama un polígono de frecuencias acumuladas u ojiva, y se ilustra 39 A ciertos efectos, es deseable considerar una distribución de frecuencias acumuladas de todos los valores mayores o iguales que la frontera de clase inferior de cada intervalo de clase. Como eso hace considerar edades de 4g.5 años o mas, de 52.5 años o más. Etc, se le suele llamar una distribución acumulada o "más", mientras que la antes considerada es una distribución acumulada "menor que". Es fácil deducir una de otra. Las correspondientes ojivas se conocen con los mismos aoodos. Actividad 1.2 1. Teniendo en cuenta los datos de la actividad 1.1 realiza un histograma, polígono de frecuencia. 2. Realiza Un gráfico que recoja las frecuencias acumuladas(ojivas) de las emisiones de oxido de azufre que se encuentra en la página 29 40 un Resumen La Estadística es la encargada otganizar, resumir y de estudiar los métodos cientÍficos para recoger, analizar datos, así como para sacar conclusiones válidas y tomar decisiones razonables basadas en tal análisis; la parte de la Estadística que se ocupa de describir y analizar un grupo dado, sin sacar conclusiones sobre un grupo mayor se denomina Estadística Descriptiva; la EstadÍstica Inductiva es ¡a parte de la Estadística que se ocupa de inferir importantes conclusiones sobre la población a partir del análisis de la muestra. Existen 4 tipos de datos los cuales son: nominales, ordinales, de intervalos y de razón. Las variables se pueden clasificar en q¡anühtivas y cualibtivas, las primeras se clasifican en discretas y continuas, las segundas en binomial y multinomial Las distribuciones de frecuencia se refieren a la manera como se organizan, agrupan y clasifican datos estadísticos de acuerdo con algún método. Una vez se hallan organizado estos datos, es posible eleg¡r cierto tipo de gráfico para visualizarlo y tratar de comprenderlos mejor. Algunos tipos de gráficos mas comunes son las barras, las cuáles nos proporcionan más información y permiten una apreciación estadística más rigurosa; los gráficos circulares o diagramas de pastel son mas usados en representaciones gráficas de distribuciones porcentuales; los histogramas son una forma de representación gráfica de las frecuencias de clase, que consiste en representar las frecuencias por medio de áreas de rectángulos (barras). En tanto que los polígonos de frecuencias se construyen un¡endo con segmentos de recta los extremos de la ordenadas (altura de los rectángulos), correspondientes a marcas de clase vecinas. 41 EJERCICIOS A continuación encontraras un enunciado y cuatro posibilidades de respuesta, entre las cuales debe escoger sólo una, la que considere correcta. RESPONDE SIG LAS PREGUNTAS DEI AL 5 DE ACUERDO CON LA UIENTE INFORMACION: 91 78 85 77 70 ,8071 87 65 50 68 84 73 98 72 83798374746769 10't 86 78 92 93 95 93 81 66 71 70 84 79 76 72 84 102 79 57 59 75 82 90 80 83 69 94 97 Los datos anteriores nos muestra las pulsaciones por minutos de los pac¡entes que llegan a consulta al hospital, se quiere realiza una tabla de frecuencia. 1 . el rango de los datos anteriores es: a. ' 50 b.52 c. 60 d.62 2. cual es el número de clases a. 5 b. 6 c.7 d.8 3. La amplitud de cada clase es: a.5 42 b.6 c.7 d.8 4. El intervalo de la clase 4 es: a.64-72 b.72-80 c.80-88 d.88-96 5. el valor de n3 es a. 10 b. 11 12 c. d.13 RESPONDE LAS PREGUNTAS 6 y 7 DE ACUERDO CON LA SIcUtENTE TNFORMACIÓN: lsaac por cada 10 unidades que vende de un producto gana $2.500. En la siguiente tabla se muestra la ganancia que obtuvo lsaac 6- DIA Ganancia en Deso Lunes 25.000 Miércoles 17.50 Jueves 27.500 Viernes 22.500 de acuerdo con la información de la tabla la venta del dia viernes fue de: a. 90 unidades b. 100 unidades c.2.525 unidades d. 2500 unidades 7. Que día vendió 109 unidades del producto a. 90 c. 43 Lunes b. Miércoles viernes d. Domingo 8. La tabla indica los resultados de una encuesta sobre la preferencia sobre los programas de de televisión. ¿Qué porcentaje de los encuestados prefiere los programas de suspenso Programas Humor Suspenso Terror acción orama a.2oo/o b.24o/o c. 36% 44 Numero de personas 50 OU 40 bU 40 d. 42% LECTU RAS COMPLEMENTARIA MÉToDos ESTAD¡STIGoS La materia prima de la estadística consiste en conjuntos de números obtenidos a¡ contar o medir elementos. Al recopilar datos estadísticos se ha de tener especial cuidado para garantizar que la información sea completa v correcta. El primer problema para los estadisticos reside en determinar qué información y en que cantidad se ha de reunir. En realidad, la dificultad al compilar un censo está en obtener el número de habitantes de forma completa y exacta; de la misma manera que un físico que quiere contar el número de colisiones por segundo entre las moléculas de un gas debe empezar determinando con precisión la naturaleza de los objetos a contar. Los estadísticos se enfrentan a un complejo problema cuando, por ejemplo, toman una muestra para un sondeo de opinión o una encuesta electoral. El seleccionar una muestra capaz de representar con exactituo las preferencias del total de la población no es tarea fácil. Para establecer una ley física, biológica o social, el estadístico debe comenzar con un conjunto de datos y modificarlo basándose en la experiencia. por ejemplo, en los primeros estudios sobre crecimiento de la población, los cambios en el número de habitantes se predecían calculando la diferencia entre el número de nacimientos y el de fallecimientos en un determinado lapso. Los expertos en estud¡os de población comprobaron que la tasa de crecimiento depende sólo del número de nacimientos, sin que el número de defunciones tenga importancia. por tanto, el futuro crecimiento de la población se empezó a calcular basándose en 45 er número anual de nacimientos por cada 1.000 habitantes. Sin embargo, pronto se dieron cuenta que las predicciones obtenidas utilizando este método no daban resultados correctos. Los estadísticos comprobaron que hay otros factores que limitan el crecimiento de la población. Dado que el número de posibles nacimientos depende del número de mujeres, y no del total de la población, y dado que las mujeres sólo tienen hijos durante parte de su vida, el dato más importante que se ha de utilizar para predecir la población es el número de niños nacidos vivos por cada 1.000 mujeres en edad de procrear. El valor obtenido utilizando este dato mejora al combinarlo con el dato del porcentaje de mujeres sin descendencia. Por tanto, la diferencia entre nacim¡entos y fallecimientos sólo es útil para indicar el crecimiento de población en un determinado per¡odo de tiempo del pasado, el número de nacimientos por cada 1.000 habitantes sólo expresa la tasa de crecimiento en el mismo periodo, y sólo el número de nacimientos por cada 1.000 mujeres en edad de procrear sirve para predecir el número de habitantes en el futuro. Tomado de Biblioteca de Consulta Microsoft @ Encarta +o @ 2005. UNIDAD 2 Medidas de tendencia central y dispersión \¡v¿- 47 PRESENTACION En la unidad anterior se estudiaron los métodos para organizar los datos mediante y gráficas, estas técnicas representan medios visuales de descubrrr relaciones, modos de comportamiento y tendencia de los datos; por eso en esta unidad queremos complementar las interpretaciones visuales, con medidas tablas numéricas de característ¡cas poseídas por muchas colecciones de datos cuantitativos; dichas características incluyen el centro, la dispersión y los puntos de posición de un conjunto de datos, 48 OBJETIVOS ESPEC!FICOS 1. Interpretar lo relacionado con las medidas de tendencia central para comprender su campo de aplicación. 2. Desarrollar destrezas y habilidades para efectuar los cálculos de las medidas de tendencia central. 3. Realizar un análisis comparativo de las distintas medidas de tendencia central con el ánimo de seleccionar la más útil según las circunstancias. 4. Desarrollar destrezas para calcular las medidas de dispersión. 5. Comparar las medidas de dispersión determ¡nada aplicación. 49 y seleccionar la mejor para una REQUISITOS PARA EL ESTUDIO DE LA UNIDAD Para el estudio de esta unidad, es necesario tener conocimientos básicos de Estadística como distr¡buciones de frecuencia, gráficos, y algunos conocimientos de Matemáticas, como promedio, operaciones con números reales v sumatoria. 50 ATREVETE A OPINAR Lee con atención y desarrolla los siguientes ejercicios, esto te permitirá evaluar que tanto manejas y recuerdas sobre los temas que se estud¡aran en esta unidad. 1. El jefe de comercialización de frigorífico de la Sabana presenta las cantidades de cabezas de ganado sacrificado por día en la semana anterior, y le pide el favor de Hallar la media aritmética. El número de animales sacrificados son: 84, 91 , 78, 95, 92, 90. 2. Las calificaciones sobre un máximo de 100 puntos obtenidas por un grupo de 12 alumnos licenciatura con énfasis en cienc¡as naturales fueron: En Matemáticas: 60, 40, 70, 30, 80, 40,70,20,30, 40, 50, 60. Estadística: 40, 60, 80, 40, 50, 60, 50, 70, 60, 50, 40, 40, Halle: (a) el promedio en Matemáticas (b) el promedio en Estadística (c) el promedio general en ambas materias. 3. 4. 5l Calcule: (a) la moda en Matemáticas (b) la mediana en Estadística Calcule: (a) varianza y desviación estándar en Estadística DINAMICA PARA CONSTRUIR EL CONOCIMIENTO ACTIVIDAD PREVIA: (Trabajo independiente) 1. Lea detenidamente la Unidad. 2. Responda de manera escrita la sección Atrévete a responder. 3. Haga un resumen sobre los conceptos básicos de la unidad. 4. Realice cada una de las actividades propuestas en el desarrollo de la unidad. 5. Anote las dudas y dificultades presentadas durante la lectura de la unidad y el desarrollo de las actividades propuestas. ACTIVIDAD EN GRUPO (CIPAS) 1. Reunidos en CIPAS, lea nuevamente la Unidad. 2. Socialicen los resúmenes elaborados de manera individual e independ iente. 3. Socialicen las respuestas de la secc¡ón Atrévete a responder, que desarrollaron de manera individual. 4. Socialicen las respuestas de las actividades, que respondieron de manera individual. 5. Desárrollen los ejercicios que se encuentra al final de la Unidad y discútanlos en el grupo de estudios. 6. Estos ejercicioo deben ser socializados en la sesión junto con todos los compañeros de grupo y entregados al tutor. 7. )2 Aclare las dudas con el tutor. 2. MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN 2. 1 MEDIDAS DE TENDENCIA CENTRAL Existen 3 métodos para delerminar el centro en torno al cual se sitúa los elementos de un conjunto de datos. Los cuales son media aritmética, mediana y moda. 2.1.1. Media Aritmética. Es la medida de tendencia central que más se utiliza, y es conocida como oromed io La media aritmética de cierto número de cantidades es la suma de sus valores dividido dicho número. Designado por: N = número de observaciones X= valor de cada observación 7= media aritmética, media, o simplemente, X barra Setiene: 53 X= \'_LX' ¡=¡ N Ejemplo El valor promedio o media aritmética de 450, 460, 470, 470, 480, 480,. v- 450+460+470+480+480 = 468.33 2.1,2, Media en una Distribución de Frecuencias Agrupada. En aritmética, el concepto de media aritmética ponderada se aplica para calcular el valor promedio de cantidades a cada una de las cuales está asociado un número o peso que la pondera. Así, por ejemplo, si un comerciante compra tres partidas de un cereal a $8.60, $7.50y $8.30 el kilogramo, para calcular el precio promedio por kilogramo es necesario conocer el peso de cada partida; si estos pesos son 230, 800 y '140 kilogramos respect¡vamente, entonces: Precio promedio por kitogramo- 8'60(230)1]'59(8-00) +-8'30(1a0) 230+800+140 - t.tt En general si Xr, Xz, ...Xn son las cantidades y mt, ñtz, ...mn las respectivas ponderaciones, entonces la media ponderada X es: X_ La mrX, + mrX, + ...,+ m,X, mt+m2+...+mll Tr- Y Lm, media aritmética ponderada de un conjunto de cantidades Xr, X2,..., Xn ponderadas por los pesos rnr, ñ12,..., mn, queda expresada por el cociente entre la 54 suma de los productos de las cantidades por sus respectivas ponderaciones y la suma de las ponderaciones. Ejemplo. En el examen de admisión a una universidad un aspirante obtuyo las siguientes calificaciones: Matemáticas, 7; Redacción, 6.5; Física, 7.6; ldiombs, 8.4; hallar el promed¡o si las ponderaciones son: Matemáticas, 5; Redacción, 3; Física, 4; e ldiomas, 2. - 7(s) + 6.s(3) + 7.6(4) + 8.4Q) 5+3+4+2 En una distribución de frecuencias agrupadas, todos los valores que caen dentro de un intervalo de clase se consideran de un mismo valor igual a la marca de clase; entonces las frecuencias son las ponderaciones de los valores que con las marcas de clase. Es decir, en una distribución oe agrupadas, las ponderaciones son las frecuencias y las marcas de corresponden frecuencias clase son los valores que se ponderan. Zx n, Así i=- s N En el siguiente ejemplo, se muestra la forma de operar con frecuencias agrupadas para el cálculo de la media. ' SPIEGEL, Murria. Estadística. Editorial McGraw Hill. México 1984. pag.47 )) Ejemplo Toneladas de oxido de azufre I 6.219.01 - 11.8 11.81 14.6 14.6 1- 17.4 17.4 1-20.2 20.21 -23 23 01- 25.8 25.81 -28.6 - Marca Frecuencia X¡ ñ¡ 7.6 10.4 tJ.¿ 16 18.8 21.6 24.4 4 1 8 10 19 13 I ¿t.¿ 10 80 I ni Xi 30.4 72.8 r 05.6 160 357.2 280.8 219.6 272 1498.3 4qR '¡ = " * =18'729 Es decir: La planta industrial producen en promedio 18.729 toneladas d¡arias de oxido de azufre Al calcular la media aritmética con frecuencias agrupadas, su valor se aprox¡mará bastante al valor obtenido con datos no clas¡ficados. El valor de la media no será suficientemente aproximado si la distribución de frecuencias agrupadas es muy irregular, demasiado asimétrica o presenta imperfecciones. En general, la a la media obtenida con frecuencias agrupadas es suficiente para trabajos estadíst¡cos. En los ejercicios que se proponen, usted advertirá estas aproximaciones de la media aritmética. Al entregar la información con datos aproximación agrupados, se pierde parte de la información primaria y no queda otro recurso que trabajar con marcas de clases en lugar de los datos or¡g¡nales. 2.1.3. Mediana. Se define como el valor que divide una distribución de datos ordenados en dos mitades, o sea aquel que deja por arriba igual número de términos que por debajo de é1. En otras palabras, la mediana es el valor del término del medio 56 Para el cálculo de la media aritmética no interesa oue los valores estén o no ordenados; en cambio la mediana impiica que el conjunto sea un conjunto de valores ordenados de menor a mayor. El concepto de término del medio es correcto si se tiene un número impar de términos ordenados; así, por ejemplo, si tenemos los siguientes datos 10, 12, 18, 19 y 21; 18 es el valor del medio, o sea la med¡ana, puesto que deja dos valores por debajo y dos valores por enc¡ma. Pero si se tiene un número par de términos entonces no hay término del medio, en estos casos la mediana es el valor equ¡distante de los dos valores centrales y no coinciden con ninguno de los términos; así, por ejemplo, en la serie de valores 10, $12, 18, 19,21 y 22. Hay dos valores centrales que son 18 y 19, el valor equidistante entre ellos es la media aritmética de ellos, o sea, 18+19 = 18.5 2 y en este caso la mediana es 18.5 y satisface su definición puesto que hay tres valores por debajo de 18.5 y tres valores por enc¡ma. 2.1.4 Mediana para datos agrupados. La mediana para datos agrupados6 se calcula mediante la siguiente formula: (n ) l;-N,- lA : m=L+l ' lll¡ n 2 6 : | donde: I es la mitad de la muestra. SPIEGEL, Murria. Estadfstica. Editorial Mccraw Hill. México 1984 Pá9. 47 57 1y'_,: Frecuencia absoluta acumulada anterior a la clase donde se encuentra la med¡ana n : Frecuencia absoluta de la clase media A: amplitud de la clase mediana Ejemplo: Para la ilustración de las toneladas de oxido producidos por una planta industrial, la mediana se calcula de la siguiente manera: Tonefadas de oxido de azufre 6.219.01 - 11.8 11.81 - 14.6 14.6 1- 17.4 17.4 1-20.2 20.21 -23 23 01-25.8 25.81 -28.6 I r n Ni 4 7 4 R '10 19 13 I 10 80 11 19 29 48 ol 70 80 Como se tienen 80 observaciones el dato que ocupa la posición del centro es 40 y 41, esta observación se encuentra ubica en la quinta clase de la distribución; puesto que hasta aquí hay 48 observaciones, como se puede ver en la tabla anterior luego se tiene: :rR0 = :: 22 =y',Q N,-' =ly'r-' =No=29 rl,= /l,r=19 A2.8 L=17.4 58 Remplazando en la formula m = 17.5 + f qq:?2 | 19 lz.8 = 1 5.78tonetadas. ) Es decir: el 50% de los día la planta industrial produce 15.78 toneladas diarias de oxido de azufre o menos y el otro 50% de los días se produce más de15.78 toneladas diarias de oxido de azufre. 2.1.5. La moda En una distribución de frecuencias, la moda es el valor que ocurre con mayor frecuencia. Así, por ejemplo, en la serie de valores: 1,3,5,5,7,7,9,9,9,10,I1, el número 9 es la moda por ser el valor que tiene mayor frecuencia. La moda se puede considerar como el valor más representativo o típico de una serie de valores. en el sentido de oue ocurre más comúnmente. 2.1.6. Moda para datos agrupados En el caso d datos agrupados, la clase que contenga la moda es la clase modal y la que posee una densidad de frecuencia más alta. Considere los datos de producción de oxido de azufre producido por cierta fabrica. Toneladas de oxido de azufre 6.219.01 - 11.8 I 't| - 81 14.6 14.6 1- 17.4 17.4 1- 20.2 20.21 59 n 4 7 8 10 -23 13 23 01-25.8 I 25.81 -28.6 10 I BO X¡ 7.6 10.4 13,2 to 18.8 21.6 24.4 27.2 Ni 4 11 lo 29 48 61 70 80 la La clase modal es la quinta, en este caso seria 18.8 toneladas. Otra forma es utilizando la formulaT: ft'l |/^tI M,,= L *l-:r;lA donde: lClt+Clt) L =limite inferior de la clase modal. y la frecuencia inmediatamente 6lr: Es la diferencia entre la frecuencia modal y la frecuencia inmediatamente 61,: Es la diferencia entre la frecuencia modal anter¡or poster¡or l:Amplitud Para muestra ilustración L'.=17.4 ¿1,:= 19 - 10 = 9 61,:=19 -13=6 A:2.8 tsl M,,=17 .4 *lLv*+ ol12.8 = 1e.08 Esto quiere decir que la mayoría de los días la fabricas produ¡o 19.08 tonelada de oxido de azufre. Actividad 2.1 Teniendo en cuenta los datos de la actividad 1.1. Calcula e interpreta: Media aritmética, med¡ana y moda. 'SPIEGEL, Murria. Estadística. Editorial McGraw Hill. México 1984. pag. 48 60 2.2 MEDIDAS DE DISPERSIÓN En los temas anteriores se estudiaron las medidas de tendencia central, las cuáles describen el comportamiento de los datos en una distribución de frecuencia. Pero las informaciones y datos que arrojan esa clase de medidas son un poco limitadas y no nos dicen mucho acerca de la forma en Qg-,q los datos se encuentran dispersos o diseminados con relación a la tendencia central. Por otro lado, nos dicen muy poco sobre la relación de un dato respecto a otro u otros de la distribución. Para una correcta interpretación de cierto tipo de datos, es necesario conocer información que nos permita conocer la dispersión de los valores alrededor de la medida de tendencia central. 2.2.1. Desviación Media La desviación medias es la media aritmética de los valores absolutos de las desviaciones de las variables resDecto a la media aritmética" Es decr'. DM = Llx¡- xl La desviación media es una medida de la dispersión bastante objetiva: cuanto mayor sea su valor, mayor es la dispersión de los datos; sin embargo, no proporciona una relación matemática precisa entre su magnitud y la posición de un dato dentro de la d¡str¡bución. Por otra parte, al tomar los valores absolutos mide la " SPIEGEL, Murr¡a. Estadistica. Editorial 61 Mccraw Hill. México 1984. Pá9. 49 desviación de una observación sin mostrar si está por encima o por debajo de la media aritmética. Ejemplo Hallar la desviación media de los siguientes valores: 10, 8, 6, 4,9,11. L^ a- \'- _ l0+8+6+4+9+11 N6 Ilx-71 _ lto - sl+ DM = =)--------) ls - sl+ le - sl+ l¿ =8 - sl+ lg-sl+lt r - sl _,., 8 Ejemplo Considere los datos de la producción de oxido de azufre producido por cierta fabrica.. Hallar la desviación media Toneladas Oxido de azufre 6.2-9 9.01-11.8 11.81-14.6 14.61-17.4 17.41-20.2 20.21-23 23.01-25 52.81-28.6 ' xl D* =>"1+- X, n, 7.6 10.4 't3.2 16 18.8 21.6 24.4 27.2 4 7 ó 10 19 13 I 10 80 '\,n, lX,-Xl nx-x l-ll_,- 30.4 72.8 105.6 160 357.2 280.8 219.6 272 1498.3 11.129 8.329 5.529 2.729 0.0 2.871 5.671 44.516 58.303 44.232 27.29 0.0 37.323 51.039 8.471 84.71 235.4',t3 Dm ?'15 4t 1 = ff=2e42 El valor 2.942la dispersión de los datos en torno a la media aritmética. 2,2.2Ya¡ianza Para calcular la desviación media, fue necesario prescindir de los signos negativos tomando los valores absolutos de las desviaciones respecto a la media aritmética. Si elevamos al cuadrado las desviaciones, logramos con esta operación que todas las desviaciones den resultados positivos, sumando los cuadrados de las desviaciones y dividiendo por N se obtiene el estadístico llamado vaianza que sirve de base para calcular la desviación estándar que es la más importante de todas las med¡das de dispersión que vamos a estudiar. La varianza es la media aritmética de los cuadrados de las desviaciones respecto a la media aritmética. Para datos no agrupados _ ) lx-xf Cr-¿-¿\ N s- l.- Ln,\x - x-\2) Veamos los siguientes ejemplos de aplicación: a ".:# OJ Ejemplo La siguiente serie de datos representa el número de horas empleadas en la realización del presupuesto de educación por diferentes secretarios de 6 alcaldías diferentes; 10, 5, 15,12, 3, 9. Hallar la varianza. l0 + 5 + 15 + 12 + 3 + 9 t) Aplicando la fórmula Para datos no agrupados S'? = -o L\X -XT N Tenemos: c2 (10-e)'+(s-e)'+(t s-of +(tz-e)' +(r-e)'+(o-o)' 1¿11 6 Nota. Para hallar la varianza se debe de trabaiar en valores absolutos. Veamos otro ejemplo utilizando la distribución de frecuencias agrupadas del ejemplo anterior, agregando las columnas necesarias para el cálculo de la vananza. Ejemplo Considere los datos de la producción de oxido de azufre producido por cierta fabrica.. Hallar la vatianza 64 'rq Toneladas Oxido de azufre 6.2-9 X, 7.6 10.4 13.2 16 18.8 21.6 24.4 27.2 9.0'1-11.8 11.8't-14.6 14.61-17.4 17.41-20.2 20.21-23 23.01-25 52.81-28.6 n, 4 x,n, 30.4 72.8 105.6 ¡l 10 19 IJ 160 357.2 280.8 219.6 272 1498.3 I 10 80 _t | I n,lX,-X lY - vl nlX-Xl t--'-^l 11.129 8.329 5.529 2.729 0.0 2.871 5.671 8.471 44.516 58.303 44.232 27.29 0 37.323 51.039 84.71 2.959 495.418 485.605 244.558 74.474 0 107.154 182.380 717.578 23071.16 2 z 23071.16 J= so .t'= 288.389 A pesar de su imporbncia y de la utilidad de la varianza esta presenh dos grandes problemas 1. Es un número bashnb grande en relación con las propias observacirnes, por su enorme tamaño, casi s¡empre resulh dificil habajar con ella. 2. otra es que los resultados vienen dados en por lo que no tendría ningún sentido su desventaja, más grave aún, unidades elevadas al cuadrado, interpretación. Estos dos problemas se pueden obviar si se trabaja con la desviación típica. Desviación Tipica o Estándar La desviación típica es ():) la raíz cuadrada de la varianz". S =.F Ejemplo. Para las horas empleadas en la realización del presupuesto de educación por diferentes secretarios de 6 alcaldías diferentes; 10, 5, 15,12, 3, 9. Se tiene que la varianza es S'? ra lii rf =16.33 Luego la desviación tlpica. s =Js'= , =[633=4.94. Se puede decir que las horas empleadas media de g con tendencia a variar 4.04. por encima y por debajo. Ejemplo Para la producción de oxido de azufre producido por cierta fabrica. Se tiene que: s'= 288.389 Luego: t) s =Js-= s ={288.99= 16.98 Es decir la producción diaria de oxido de azufre puede variar 16.g8 toneladas por encima y por debajo Actividad 2.2. Teniendo en cuenta los datos de desviación estandar 66 ,.j' la ac{ividad 1 .1 . Calcula e interpreta: la Resumen Las medidás de tendencia central son utilizadas, para describir y establecer comparaciones cuantitativas entre distribuciones de frecuencia. La Media Aritmética es la medida de tendencia central más utilizada su cálculo se efectúa de acuerdo a las siguientes situaciones: i' La media aritmét¡ca de cierto número de cantidades es: : la media ponderada mt + m2 + ...+ mn La media para datos agrupados: X = X='=' N uvn LX,n, La Mediana se define como el valor oue divide una distribución ordenados en dos mitades La mediana para datos agrupados :m=L+ ;-N, n, ) I l/7 l - La Moda es el valor que ocurre con mayor frecuencia 67 de datos La moda para datos agrupados: M,,= L *l , l¿ ,d.' lOtt Clz) Las medidas de dispersión son medidas que se utilizan para conocer la dispersión de los valores alrededor de la medida de tendencia central. La Desviación Media es una medida de dispersión bastante objetiva y se define como la Media Aritmética de los valores absolutos de las desviaciones de las variables respecto a la Media Aritmética" O* -Znl4-i I La varianza es la Media Aritmética de los cuadrados de las desviaciones respecto a la Media Aritmética. Para datos no agrupados .s' = Para datos agrupados I(": N "-L ,' =Ln'VN - xl La Desviación Típica se define como la raiz cuadrada de la Varianza 68 EJERCICIOS A continuación encontraras un enunciado y cuatro posibilidades de respuesta, entre las cuales debe escoger sólo una, la que considere correcta. RESPONDE LAS PREGUNTAS Det SIG U I E NTE INFORMACIÓN: 80 87 65 50 68 Los 71 84 73 98 72 91 78 85 77 70 83 101 93 66 79 79 86 95 71 76 1 AL S DE ACUERDO CON LA 83 78 93 70 72 1. La media aritmética de los dados es: a.59 b.69 c.79 d.89 2. La mediana de los dados es: a.78 b.68 c.58 d.98 3. La moda de los datos es a.7O.3 b.60.3 c.70.3 d.80.3 4. La varianza de los datos es: 69 74 102 79 57 59 67 75 82 90 80 69 83 69 94 s7 datos anteriores nos muestran las pulsaciones por minutos de los pacientes que llegan a consulta al hospital a. 74 92 81 84 84 54.83 b. 64.83 c.74.83 d.84.53 5. La desviación estándar se define como a. la potencia de la varianza c. el exponencial de la varianza b. el logaritmo de varianza d. la raiz cuadrada de la varianza. LAS PREGUNTAS 6 Y 7 SE CONTESTAN CON BASE EN LA SIGUIENTE INFORMACION. Durante cinco horas, en una estación de gasolina son tanqueados 60 automóviles de diferentes clases (camionetas, camperos, camiones, tractomulas). La siguiente muestra la capacidad de los tanques de gasolina y el numero de automóviles tanoueados. Capacidad de los tanques de . Numero de automóviles gasolina (galones) tanqueados 12-18 20 19-25 44, 26-32 12 JJ-óV 10 40-46 5 6. La frecuencia relativa de cada uno de los datos de la muestra reoresenta: a. El numero de automóviles tanqueados por hora y su capacidad de tanqueo b. El numero de automóviles tanqueados respecto al total de automóviles tanoueados c. La capacidad promedio de automóviles tanqueados respecto al total de automóviles tanqueados d. El promedio de automóviles tanqueados durante las cinco horas y su capacidad de tanqueo 70 7. Para terminar que el 50% de los automóviles de la muestra tienen capacidad para 22 galones de gasolina o menos, se necesita conocer: a. b. La marca de clase del intervalo con mayor frecuencia absoluta c. El intervalo, que incluye la capacidad de tanqueo que supera a no mas de El total de automóviles tanqueados y la capacidad promedio de los tanques la mitad de los carros tanoueados d. La capacidad de los tanques, que incluye la mitad de carros tanqueados durante las primeras dos horas 8. Las calificaciones obtenidas sobre 100 puntos por 16 aspirantes a ocupar vacantes en el ministerio de educación fueron: Calificación 302 40 50 60 70 80 90 Número de ¿ z 4 3 ,| z Halle: (a) med¡a (b) mediana (c) moda (d) la desviación media (e) var¡anza. 7l ¡i.i ñ LECTU RAS COMPLEMENTARIAS EL ENGAÑOSOg TÉRMINO MEDIO Productos Artilugio (PRODILUGIO S.A) tiene una pequeña fabrica de superart¡lugios. La dirección de la empresa esta a cargo del señor artilugio, su hermano y cinco parientes. la fuerza laboral consiste en cinco encargos y diez operarios. Los negocios van bien, y la fabrica precisa un operario más. El señor artilugio esta entrevistando a Félix al puesto. Señor Artilugio: Aquí muy bien. El salario medio es de 60.000 pesos semanales. Durante el periodo de formación solo cobrara usted 15.000, pero pronto le subiremos el sueldo. Al cabo de unos cuantos días Félix quiso ver al jefe. Félix: ¡Me ha engañado usted! He hablado con los otros operarios y ninguno gana más de 20.000 pesos a la semana. ¿Cómo puede ser de 60.000 pesos el salario medio? Señor Artilugio: vamos, Félix, no se excite. El salario medio es 60.000 pesos Se lo voy a demostrar. ' CARDNER,Martln. Paradojas. Labor, s.a. Barcelona,4a edición 1989 72 Señor Artilugio: He aquí la nómina semanal. Yo gano 480.000; mi hermano, 200.000; mis seis parientes sacan 50.000 cada uno; los cinco capataces, 40.000, y los diez operarios 20.000 cada uno. El total semanal es de 1'380.000 oara 23 Personas. ¿Me equivoco? Félix: ¡vale, vale! Tiene usted razón. El promedio es de 60 billetes a la semana. Pero. aun así. usted me ha enoañado. Señor Artilugio: No estoy de acuerdo. Lo que pasa es que usted no ha comprendido nada. Pude haber ido diciéndole los salarios por orden; el salario med¡o seria entonces 40.000 pesos. Pero no es la media sino la mediana. Féfix: ¿Y que pinta aquí los 20.000? Señor Artilugio: Eso se llama moda. Es el salario ganado por máximo número oe personas. Señor Artilugio: Muchacho, lo malo de usted es que no distingue entre media, mediana y moda. Félix: Bueno, ahora ya se la diferencia. Y... ¡me despidol Los enunciados estadísticos pueden ser en extremo paradójicos, y en ocasiones, directamente engañoso. La historia de la fábrica de artilugio hace ver una fuente de confusiones frecuentes entre media. mediana v moda. La palabra media es por lo común abreviatura de media aritmética. Es una medida estadistica muy valiosa. No obstante, cuando hay valores extremos muy dispares, como su cede con los elevados salar¡os de los dueños y personal administrativo de la fabrica, el salario medio puede crear una impresión falsa. Es muy fácil encontrar situaciones parecidas donde la media induce a error. Un periódico, por ejemplo, informa que una persona sea ahogado en un río cuya profundidad es de solo 50 cm. ¿Podemos sorprendernos? No, cuando nos enteramos de que la desgracia se produjo en uno de los pocos sitios donde la profundidad pasa de tres metros. Las informaciones sobre estadísticas resultan aún más desconcertantes a causa de que termino medio, se aplica en ocasiones no a la media aritmética, s¡ no a la med¡ana o la moda. La mediana es el valor que ocupa la posición centrar en una lista de valores ordenados de menor a mayor. Cuando el numero de términos de la lista es impar, la mediana es sencillamente el termino centrar. Cuando la lista consta de número par de términos es costumbre tomar para la mediana la media aritmética de los dos valores situados en el centro. A Félix la mediana le da información más útil que la media aritmética, pero incluso la mediana le da una imagen desformada de los salarios de su empresa. Lo que realmente le convenÍa saber es la moda, el valor de más frecuente aparición de ta lista. En este caso, la moda es el salario que las personas perciben. Frases como un caso típico suelen aludir a la moda, ultimo ejemplo una familia típica de la ciudad -que presente la moda de ingresos- puede ser muy pobre, aun cuando la renta media, debía a un reducido numero de gente muy rica, sea muy alta. 74 UNIDAD 3 PROBABILIDAD !: 75 PRESENTACION La Teoría de la Probabilidad se rémonta a comienzos del siglo XVll, debido a estudios e investigaciones empíricas acerca de los juegos de azar de la época, y que hoy en día aun están vigentes. o' .f Desde entonces, muchos ¡nvestigadores y matemáticos, como también científicos de importancia reconocida, contribuyeron a que se desarrollara y se perfeccionara paralelamente con la Estadística, llegando a ser un complemento y una parte importante de esta rama de la ciencia. A pesar de haberse comenzado a investigar tanto t¡empo atrás, sus desarrollos más relevantes y su fundamentación matemática sólo se consolidó durante los años treintas y cuarentas del siglo X X a partir de esta etapa, se le denominó Teoría Moderna de la Probabilidad, en la que se precisaron conceptos de gran importancia y se colocó sobre una firme base matemática. La siguiente unidad se presta fácilmente para estudiar por cuenta propia y presenta temas de gran relevancia, los cuáles son fundamentales para introducirnos al mundo de la probabilidad; y únicamente exige un conocimiento previo de Álgebra de secundaria. 76 OBJETIVOS ESPEGIFICOS 1 . ldentificar algunos conceptos básicos de Probabilidad, como eventos y espacio muestral. 2. Conocer cuándo una distribución de Probabilidad es discreta v cuándo es cont¡nua. 3. 77 Adquirir el conocimiento necesario para realizar análisis combinatorio. { tL REQUISITOS PREVIOS Debido a que básicamente se desarrollarán temas que introducen al mundo de la Probabilidad, lo único que se requiere es un conocimiento previo de Álgebra \.. 78 ATREVETE A OPINAR Lee con atención y desarrolla los siguientes ejercicios, esto te perm¡tirá evaluar que tanto manejas y recuerdas sobre los temas que se estudiaran en esta unidad. 1. Se lanza dos veces un par de dados. ¿Cuál es la probabilidad de obtener totales de sieté y once? 2. dos veces mayor que la cruz. Si se lanza tres veces la moneda, ¿cuál es la probabilidad de obtener dos cruces y una cara? F 79 Se carga una moneda de modo que la cara tenga una posibilidad de ocurrir 3. El número de permutaciones de las letras de la palabra "Dios" es: 4. El número de combinaciones que se pueden dar de las letras a, b d , c DINAMICA PARA CONSTRUIR EL CONOCIMIENTO ACTIVIDAD PREVIA: (Trabajo independiente) l. Lea detenidamente la Unidad. 2. Responda de manera escrita la sección Atrévete a responder. 3. Haga un resumen sobre los conceptos básicos de la unidad. 4. Anote las dudas y dificultades presentadas durante la lectura de la un¡dad y el desarrollo de las actividades propuestas. 5. Realice un juego creativo teniendo en cuenta los conceptos leídos ACTTVTDAD EN GRUPO (CTPAS) l. Reunidos en CIPAS, lea nuevamente la Unidad. 2. Socialicen los resúmenes elaborados de manera individual e indeoendiente. 3. Socialicen las respuestas de la sección Atrévete a responder, que desarrollaron de manera individual. 4. Socialicen y participe en cada uno de juegos creados por sus compañeros. 5. Desarrollen los ejercicios que se encuentra al final de la Unidad y discútanlos en el grupo de estudios. 6. Estos ejercicios deben ser socializados en la sesión junto con todos los compañeros de grupo y entregados al tutor. 7. 80 Aclare las dudas con el tutor. 3. TEORIA DE LA PROBABILIDAD 3.I ESPACIO MUESTRAL En el estudio de la Estadística tratamos básicamente con la presentación e interpretación de resultados fortuitos que ocurren en un estudio planeado o investigación c¡entífica. Por ejemplo, podemos registrar el número de accidentes que ocurren mensualmente en la intersección del Monumento a las Vacas en la ciudad de Sincelejo, con el deseo de justificar la instalación de un semáforo; podemos clasificar los artículos que salen de una linea de montaje como "defectuosos" o "no defectuosos"; o nos podemos ¡nteresar en el volumen de gas que se libera en una reacción química cuando se hace variar la concentración de un ácido. Por ello, el estadístico a menudo trata con datos conteos o mediciones representativos, experimentales, o quizá con datos categóricos que se pueden clasificar de acuerdo con algún criterio. Nos referiremos a cualquier registro de información, ya sea numérico o categór¡co, como una observación. Así, los números 2,0, 1 y 2, que representan el número de accidentes que ocurrieron en cada mes de enero a abril durante el año pasado en la intersección Monumento a las Vacas en la ciudad de Sincelejo, constituyen un conjunto de observaciones. De forma similar, los datos categóricos N' D' N' N y D, que representan los artículos defectuosos o no defectuosos cuando se inspeccionan cinco artículos, se reg¡stran como observaciones. Los estadísticos utilizan la palabra experimento para describir cualquier proceso que genere un conjunto de datos. un ejemplo simple de experimento estadístico 81 es el lanzamiento al aire de una moneda. En este experimento sólo hay dos resultados posibles: cara o cruz. Otro experimento puede ser el lanzamiento de un misil y la observación de su velocidad en t¡empos específicos. Las opin¡ones de los votantes con respecto aun nuevo impuesto sobre ventas también se pueden de un experimento. Estamos particularmente interesados en las observaciones que se obtienen por la repetición del experimento varias veces. En la mayor parte de los casos, los resultados dependerán del azar y, por tanto, no se pueden predec¡r con certeza. Si un considerar como observaciones químico realiza un análisis varias veces bajo las mismas condiciones, obtendrá diferentes medidas, que indican un elemento de probabilidad en el procedimiento experimental. Incluso, cuando se lanza al aire una moneda de forma repetida, no podemos tener la certeza de que un lanzamiento dado tendrá como resultado una cara. Sin embargo, conocemos el conjunto completo de posibilidades para cada lanzamiento. El conjunto de todos los resultados posibles de un experimento estadístico se llama espacio muestrallo y se representa con el símbolo S. Cada resultado en un espacio muestral se llama elemento o miembro del espac¡o muestral, o simplemente punto muestral. Si el espacio muestral tiene un número finito de elementos, podemos listar los m¡embros separados por comas y encerrarlos en paréntesis. De esta forma, el espacio muestral S, de los resultados posibles cuando se lanza al aire una moneda, se puede escribir g = {H, T}, Donde H y T corresponden a "caras" y "cruces", respectivamente. Ejemplo 3.1.1 Considere el experimento de lanzar un dado. Si nos interesamos en el número que muestra en la cara superior, el espacio muestral sería Sr={1 ,2,3,4,5,6}. 'o KREYSZIG, Edwin. Introducción 82 a la estadistica Matemática. Ed¡torial Limusa 1979. pá9.56. Si nos interesamos sólo en si el número es par o impar, el espacio muestral es simplemente 52 = {par, impar}. El ejemplo ilustra el hecho de que se puede usar más de un espacio muestral para describir los resultados de un experimento. En este caso, 51 proporciona más información que 52. Si sabemos cuál elemento en Sr tiene lugar, podemos decir cuál resultado ocurre en S2; no obstante, el conocimiento de lo que pasa en 52 no es de ayuda en la determinación de cuál elemento en Sl ocurre. En general, se desea utilizar un espacio muestral que dé la mayor información acerca de los resultados del exoerimento. En algunos experimentos es útil listar los elementos del espacio muestral de forma sistemática mediante un diagrama de árbol. el ejemplo .2. Un experimento cons¡ste en lanzat una moneda y después lanzarla una segunda vez si sale cara. Si sale cruz en el primer lanzamiento, entonces se lanza un dado una vez. Para listar los elementos del Veamos 3.1 espacio muestral que proporcione la mayor información, construimos el d¡agrama de árbol de la siguiente figura. Primer Resultado Segu ndo resultado punto de La muestra H HH T HT 1 T1 T2 T3 T4 T5 T6 83 Ahora bien, las diversas trayectorias a lo largo de las ramas del árbol dan los distintos puntos de la muestra. Al comenzar con la rama superior izquierda y movernos a la derecha a lo largo de la primera trayectoria, obtenemos el punto muestral HH, que indica la posibilidad de que ocurran caras en dos lanzamientos sucesivos de la moneda. Asimismo, el punto muestral T3 indica la posibilidad de que la moneda muestre una cruz seguida por un 3 en el lanzamiento del dado. Al seguir a lo largo de todas las trayectorias, vemos que el espacio muestral es 5 = {HH, HT, T1, T2, T3, T4, T5, T6}. 3.2 EVENTOS Para cualquier experimento dado podemos estar interesados en la ocurrencia de ciertos eventos más que en el resultado de un elemento específico en el espacio muestral. Por ejemplo, podemos estar ¡nteresados en el evento A en el que el resultado cuando se lanza un dado sea divisible entre 3. Éste ocunirá si el resultado es un elemento del subconjunto A = {3,6} del espacio muestral S1 del ejemplo 3.1 . Un eventolr es un subconjunto de un espacio muestral. Ejemplo 3.2.1. Dado el espacio muestral 5 = {t / t > 0}, donde t es la vida en años de cierto componente electrónico, entonces el evento A de que el componente falle antes de que finalice el quinto año es el subconjunto tr = {V0< t < 5}. Es concebible que un evento pueda ser un subconjunto que incluya todo el espacio muestral S, o un subconjunto de S que se denomina conjunto vacío y se denota mediante el símboloZ, que no contiene elemento alguno. Por ejemplo, si " KREYSZIG, Edw¡n. Introducción a la estadist¡ca Matemática. Editor¡al L¡musa 1979. pá9.57 84 hacemos que A sea el evento de detectar un organismo microscópico a simple vista en un experimento biológico, entonces A = O. También, sí g = {r/x es un factor par de 7}, Entonces B debe ser el conjunto vacío, pues los únicos factores posibles de 7 son los números nones 1 y 7. un experimento donde se registran los hábitos de fumar de los empleados de una empresa industrial. Un posible espacio muestral podría Considere clasificar a un individuo como no fumador, fumador ligero, fumador moderado o fumador empedernido. Sea el subconjunto de los fumadores un evento. Entonces la totalidad de los no fumadores corresponde a un evento diferente, también subconjunto de S, que se denomina complemento del conjunto de fumadores. El complemento de un evento A con respecto a S es el subconjunto de todos los elementos de S que no están en A. Denotamos el complemento de A mediante el símbolo A'. Ejemplo. Sea R el evento de que una carta roja se seleccione de una baraja ordinaria de 52 cartas, y sea S toda la baraja. Entonces R' es el evento de que la carta seleccionada de la baraja no sea una roja s¡no una negra. Ejemplo. Considere el espacio muestral S = {libro, catalizador, ciganillo, precipitado, ingeniero, remache}. Sea A = {catalizador, remache, libro, cigarrillo}. Entonces 4' = {precipitado, ¡ngen¡ero}. Consideremos ahora ciertas operaciones con eventos que tendrán como resultado la formación de nuevos eventos. Estos eventos nuevos serán subconjuntos del 85 mismo espacio muestral como los eventos dados. Suponga que A y B son dos eventos asociados con un experimento. En otras palabras, A y B son subconjuntos del mismo espacio muestral S. Por ejemplo, en el lanzamiento de un dado podemos hacer que A sea el evento de que ocurra un nÚmero par y B el evento de que aparezca un número mayor que 3. Entonces, los subconjuntos A = {2,4,6} y B = {4, 5, 6} son subconjuntos del mismo espacio muestral 5 = {1 ,2,3,4, 5,6}. Nótese que A y B ocurrirán ambos en un lanzamiento dado si el resultado es un elemento del subconjunto {4,6}, que es precisamente la intersección de A y B. La intersecciónr2 de dos eventos A y B, denotada mediante el símbolo A el evento que contiene a todos los elementos que son comunes a A y a B. n B, es Ejemplo. sea P el evento de que una persona seleccionada al azar mientras cena en un restaurante de moda sea un contribuyente, y sea Q el evento de que la persona tenga más de 65 años de edad. Entonces el evento PnQ es el conjunto de todos los conhibuyentes en el restaurante que tienen más de 65 años de edad. Sean M = {a, e, i, o, u} y N = {r, s, t}; entonces se sigue que M n N = @. Es decir, M y N no tienen elementos en común y, por tanto, no oueden ocurrir ambos de forma simultánea. Ejemplo 3.2.5. y Para ciertos experimentos estadísticos no es nada extraño definir dos eventos, A A B, que no pueden ocurrir de forma simultánea. Se dice entonces que los eventos y B son mutuamente excluyentes. Expresado de manera más formal, tenemos la definición siguiente: r? pá9 59. KREYSZIG, Edwin. Introducción a la estadíst¡ca Matemática. Editorial Limusa 1979. 86 Dos eventos A y B son mutuamente excluyentes o disjuntos si An B =@;es decir si A y B no tienen elementos en común. Ejemplo. Una compañía de televisión por cable ofrece programas en ocho diferentes canales, hes de los cuales están afiliados con ABC, dos con NBC, y uno con CBS. Los otros dos son un canal educativo y el canal de deportes ESPN. Suponga que una persona se suscribe a este servicio enciende un televisor sin seleccionar de antemano el canal. Sea Al evento de que el programa pertenezca a la red NBC y B el evento de que pertenezca a la red CBS. Como un programa de televisión no puede pertenecer a más de una red, los eventos A y B no tienen programas en común. Por tanto, la intersección A n B no contiene programa alguno y en. consecuencia los eventos A y B son mutuamente excluyentes A menudo, nos interesamos en la ocurrencia de al menos uno de dos eventos asociados con un experimento. Así, en el exper¡mento de lanzamiento de un dado, si ¡= Q, a,6) y B = {4, 5, 6}, Podemos interesarnos en que ocurra A o B, o que ocurran A y B. Tal evento, que se llama la unión de A y B, ocurrirá si el resultado es un elemento del subconjunto {2, 4, 5, 6}. La unión de dos eventos A y B, que se denota mediante el símbolo A u B, es el evento que contiene todos los elementos que pertenecen a A o a B o a ambos' Ejemplo. Sea A = {a, b, c} y B = {b, c, d, e}; entonces AUB={a,b,c,d,e}. Ejemplo. sea P el evento de que un empleado seleccionado al azar de una compañía petrolera fume cigarros. Sea $; 87 ? Q el evento de que el empleado selecc¡onado ingiera bebidas alcohól¡cas. Entonces el evento P v Q es el conjunto de todos los empleados que beben o fuman, o que hacen ambas cosas. 3.3. PROBABILIDAD DE UN EVENTO Quizá fue la sed insaciable del hombre por el juego la que condujo al desarrollo temprano de la Teoría de la Probabilidad. En un esfuerzo por aumentar sus a los matemáticos que les proporcionaran las estrategias ópt¡mas para varios juegos de azar. Algunos de los matemáticos que ganancias pidieron proporcionaron estas estrategias fueron Pascal, Leibniz, Fermat y James de este primer desarrollo de la Teoría de la inferencia estadística, con todas sus predicc¡ones y Bernoulli. Como resultado Probabilidad, la generalizaciones, se extiende más allá de los juegos de azar para abarcar muchos otros campos asociados con los eventos aleatorios, como la política, los negocios, la predicción del clima y la investigación científica. Para que estas predicciones y generalizaciones sean razonablemente precisas, es esencial una comprensión de la estructura del experimento, para tener algún grado de confianza en la validez de la afirmación. En el resto de este capítulo consideramos sólo aquellos exper¡mentos para los que el espacio muestral contiene un número finito de elementos. La probabilidad de la ocurrencia de un evento que resulta de tal experimento estadístico, se evalúa por med¡o de un conjunto de números reales denom¡nados pesos o probabil¡dades 1. Para todo punto en el espacio muestral, asignamos una probabilidad tal que la suma de todas las probabil¡dades es 1. Si tenemos razón para creer que es bastante probable que ocurra cierto punto muestral cuando se que van de 0 a a lleva a cabo el experimento, la probabilidad que se le asigne debe ser cercana punto muestral 1. Por otro lado, una probabilidad cercana a cero se asigna a un que no es probable que ocurra. En muchos experimentos, como lanzar una de moneda o un dado, todos los puntos muestrales tiene la misma oportunidad 88 ocurrencia y se les as¡gnan probabilidades iguales. Para puntos fuera del espac¡o muestral, es decir, para eventos simples que no es posible que ocurran, asignamos una probabilidad de cero. Para encontrar la probabilidad de un evento A, sumamos todas las probabilidades que se asignan a los puntos muéstrales en A. Esta suma se denomina probabilidad de A y denota con P(A). La probabilidad de un evento A es la suma de los pesos de todos los puntos muestrales en A. Por tanto, 0 f P(A) 1't, P(a) = 0, y P(S) = 1. Ejemplo Se lanza dos veces una moneda. ¿Cuál es la probabilidad de que ocurra al menos una cara? Solución El espacio muestral para este experimento es g = {HH, HT, TH, TT} Si la moneda esta balanceada, cada uno de estos resultados tendrá la misma probabilidad de ocurrencia. Por tanto, asignamos una probabilidad de w a cada uno de los puntos muéstrales. Entonces 4w = 1, o w = To. Si A representa el evento de que ocurra al menos una cara, entonces 4 = {HH, HT, TH} y P(A) = Yr+ /a+ /a=/o. Ejemplo Se carga un dado de forma que sea dos veces más probable que salga un número par que uno non. si E es el evento de que ocurra un número menor oue 4 en un solo lanzamiento del dado, encuentre P(E) 89 Solución El espacio muestral es S = {1, 2, 3, 4,5,6}. Asignamos una probabilidad de w a cada número non y una probabilidad de 2w a cada número par. Como la suma de las probabilidades debe ser 1, tenemos 9w = 1 o w = 1/9. Por ello se asignan probabilidades de 1/9 y 219 a cada número non y par, respectivamente. por tanto, E= {1,2,3} y P(E) = 1¡9 + 219 + 119 = 419. Si el espacio muestral para un experimento contiene N elementos, los cuales tienen la misma probabilidad de ocurrencia, asignamos una probabilidad igual a 1/N a cada uno de los N puntos. La probabilidad de cualquier evento A que contenga n de estos N puntos muestrales es entonces la razón del número oe elementos en A al número de elementos en S. Si un experimento puede tener como resultado cualquiera de N diferentes resultados igualmente probables, y si exactamente n de estos resultados . corresponden al evento A, entonces la probabilidad del evento A es p(A) = n/N Ejemplo Un surtido de dulces contiene seis mentas, cuatro chicles y tres chocolates. Si una persona hace una selección aleatoria de uno de los dulces. encuentre la probabilidad de sacar a) una menta o b) un chicle o un chocolate. Solución M, T y C representan los eventos de que la persona seleccione, respectivamente, una menta, un chicle o un chocolate. El número total de dulces es 13, los cuales tienen la misma probabilidad de ser seleccionados. (a) Como seis de los 13 dulces son mentas, la probabilidad del evento seleccionar una menta al azar. es P(M) = 6713. 90 M, (b) Como siete de los l3 dulces son chicles o chocolates, se sigue que P(TwC)=t¡13 Si los resultados de un experimento no tienen igual probabilidad de ocurrencia, las probabil¡dades se deben asignar sobre la base de un conocimiento previo o de evidencia experimental. Por ejemplo, si una moneda no está balanceada, podemos estimar las probabilidades de caras y cruces al lanzar la moneda un número elevado de veces y regishar los resultados. De acuerdo con la definición de frecuencia relativa de la probabilidad, las probabil¡dades verdaderas serían las fracciones de caras y cruces que ocurren a largo plazo. Para encontrar un valor numérico que represente de manera adecuada la probabilidad de ganar en el tenis, debemos depender de nuestro rendimiento pasado en el juego así como también del de nuestro oponente y, hasta cierto punto, en nuestra creenc¡a de ser capaces de ganar. De manera similar, para encontrar la probabilidad de que un caballo gane una carrera, debemos llegar a una probabilidad que se base en las marcas anteriores de todos los caballos que participan en la carrera, así como de records de los jockeys que montan en los caballos. La intuición, sin duda, también juega una parte en la determinación del monto de la apuesta que estemos dispuestos a jugar. El uso de la intuición, las creencias personales y otra información indirecta para llegar a probabilidades se denom¡na como la definición subjetiva de probabilidad. En la mayor parte de las aplicac¡ones de probabilidad de este texto a ¡nterpretación de frecuencia relativa de probabilidad es la que opera. Su fundamento es el experimento estadístico en lugar de la subjetividad. Se le considera mas bien como frecuencia relativa limitante. Como resultado, muchas aplicaciones de probabilidad en la ciencia y la ingeniería se deben basar en experimentos que se puedan repetir. Nociones menos objetivas de probabilidad se 9l encuentran cuando asignamos probabilidades que se basan en información y opiniones previas. Como ejemplo, "hay una buena oportunidad de que de que el Cortuluá pierda el Campeonato Nacional de Fútbol". Cuando la opiniones y la información previa difieren de individuo a individuo, la probabilidad subjetiva se vuelve el recurso relevante. 3.4 ESPERANZA MATEMÁTICA Si p es la probabilidad de que una persona reciba una cantidad S de dinero, la esperanza matemática (o simplemente esperanza) se define como pS. Ejemplo 3.5.1. Si la probabilidad de que un supervisor de Electrocosta gane un ascenso de $10 es 1/5, su esperanza matemática es l/b(g1O) = g2. El concepto de esperanza matemática se extiende fácilmente. Si X denota una variable aleatoria d¡screta que puede tomar los valores X1, X2, ..., X¡ con probabilidades pt, pz, ..., p¡, donde p1 matemática13 de * pz + ... * pr = 1, la esperanza X (o simplemente esperanza de X), denotada E(X), y se define como E(X) = pr Xr + p2X2+... +prXr= Ip¡\ =lpX ,- | Si las probabilidades pj en esa expresión se sustituyen por las frecuencias relativas /¡/N, donde N = If, la esperanza matemática se reduce a (I/X)/N, que es la media aritmética X de una muestra de tamaño N en la que X1, Xz, ..., X. aparecen con estas frecuencias relativas. Al crecer N más y más, las frecuencias relativas se acercan a las probabilidades g. Así que nos vemos abocados a interpretar E(X) como la media de la población cuyo muestreo se consideraba. Si llamamos m a la media muestral, podemos denotar la med¡a poblacional por la '' SPIEGEL, Murria. Estadística. Editorial Mccraw 92 H¡tt. México 1984. páo. 102 correspondiente letra griega p (m¡u). Puede definirse, asimismo, la esperanza matemát¡ca para variables aleatorias continuas, pero requiere el cálculo. 3,5. RELACION ENTRE POBLACIÓN, MEDIA MUESTRAL Y VARIANZA Si seleccionamos una muestra de tamaño N al azar de una población (o sea, suponemos que todas las posibles muestras son igualmente probables), entonces es posible mostrar que el valor esperado de la media muestral m es la media poblacionalp. No se deduce, sin embargo, que el valor esperado de cualquier cantidad calculaoa sobre una muestra sea la cantidad correspondiente de la población. Así, el varor esperado de la varianza muestral, como la hemos definido, no es la varianza de ¡a 1)/N veces dicha varianza. por eso algunos estadísticos prefieren definir la varianza como nuestra varianza multiplicada por N/(N 1). población, sino (N - 3.6. ANÁLISIS COMBINATORIO Al hallar probabilidades de sucesos complicados, suele resultar difícil y tediosa una enumeración de los casos. El análisis combinatorio facilita mucho esa tarea. Principio fundamental. Si un suceso puede ocurrir de n1 maneras, y si cuando éste ha ocurrido otro suceso puede ocurrir de o2 fiáñ€rás, entonces el número de maneras en que ambos pueden ocurrir en el orden especificado €S h1n2. Ejeníplo. Si hay 3 candidatos para gobernador y 5 para alcalde, los dos cargos pueden ocuparsede 3 5 = 15 formas. . 93 Factorial de n1a La factorial de n, denotada por n!, se define como n! = n(n Así, 5! = 5 *4 * 3" - 1)(n 2- -2) ... 1 1=120,y 4!3! = (4 " 3- 2. 1)(3- 2. 1)= 1¿¿. Conviene definir 0!=1. Permutaciones una permutación de n objetos tomados de r en r es una relación ordenada de r objetos de entre n. El número de permutaciones de n objetos tomados de r en r se denota por nPr, P(n, r), o Pn,. y viene dado por: nPr = n(n-1)(n-2)...(n - r +t) =(n : - r)l En particular, el número de permutaciones de n objetos tomados de n en n es: i P = n(n - l)(n - 2)...1 = nr. Ejemplo. El número de permutaciones que se pueden dar de las letras a, b y c tomadas de dos en dos es 3P2 = 3 * 2 = 6. Son ab, ba, ac, ca, bc, cb. El número de permutaciones de n objetos, de los que n1 son iguales, n2 son ¡guafes, ... es nl ln1ln2l... donde n = fl1 r n2 * ... Ejemplo. El número de permutaciones de las letras de la palabra "stat¡stics" es: 'o SPIEGEL, Murria. EstadÍstica. Ed¡torial Mccraw Hill. México 1984. páo. 103 94 i i 10! 3!3!1!2n! Porque hay 3 eses, 3 tes, 1a,2 iesy 1c. Combinacionesl5 una combinación de n objetos tomados de r en r es una selección de r de ellos, sin importar el orden de los r escogidos. El número de combinaciones de n objetos, tomados de r en r se denota por ( lrl L"J n(n l)...1n ,1 ") y viene dado r+l) por: nt 7r.(n - r)! Ejemplo. El número de combinaciones de ras letras a, b y c tomadas de dos en oos es: l3l 3*2 =' Lrl= o Que son ab, ac y bc. Nótese que ab es la misma combinación que va, pero no misma permutación. Reglas Multiplicativas Teorema Si en un experimento pueden ocurrir los eventos A y B, entonces P(AnB)=P(A)P(B/A). Editor¡al Mccraw Hi . Méx¡co 1984. pág. '' SPIEGEL, Murria. EstAdfst¡ca. ,r .r;l t'. ':| 95 .103 ta Así la probabilidad de que ocurran A y B es igual a la probabilidad de que ocurra A multiplicada por la probabilidad de que ocurra B, dado que ocurre A. Como los eventos A n ByB n A son equivalentes, se sigue del teorema anterior que también podemos escribir: P (A n B) = P (BnA) =P(B)P(A/B). En otras palabras, no importa cuál evento se considera como A y cuál como B. Ejemplo. un jefe de almacén de Electrocosta tiene una caja de fusibles que contiene 20 unidades, de las cuales cinco están defectuosos. Si se seleccionan dos fusibles al azar y se separan de la caja uno después del otro sin reemplazar et primero, ¿cuál es la probabilidad de que ambos fusibles estén defectuosos? soLUcloN sean A el evento de que el primer fusible esté defectuoso y B el evento de que el segundo esté defectuoso; entonces interpretamos A n B como el evento de que ocurra A, y entonces B ocurre después de que ocurre A. La probabilidad de separar primero un fusible defectuoso es %; entonces la probabilidad de separar un segundo fusible defectuoso de los restantes 4 es 4t1g. por ello. P(A n B) = (1t41(4t191= 1t19 Ejemplo. Un Supervisor de Electrocosta tiene una caja que contiene cuatro fusibles blancos y tres negros, y una segunda caja que contiene tres blancos y cinco negros. se saca un fusible de la primera caja y se coloca sin verlo en 96 ra segunda. ¿Cuál es la probabilidad de que ahora se saque un fusible negro de la segunda caja? SOLUCIÓN Sean 81, Bz, v Wr respectivamente, la extracción de un fusible negro de la caja 1, uno negro de la caja 2 y un blanco de la caja 1. Nos interesa la unión de los eventos mutuamente excluyentes B1o 82 ! w1nB2. Las diversas posibilidades y sus probabilidades se ilustran en la siguiente figura. Entonces, P[(B1o 82) o (W1n B2)] = P(Brn Bz) + p(Wrn Bz) = P(81 ) P( B2lB1 ) + P(Wl) P (82/ Wr) =(3/7X6/9) + (t7)(5t9) = (38/63). P(B¡ P(B¡ n Br) = (3i7) (6/9) n w) = (3/7)(3/9) P(w'n Bt P(Wr 97 .\ W, = (4/7X5l9) = (4/1)(419) Si, en el primer fusible se reemplaza y los fusibles se reacomodan por completo antes de que se extraiga el segundo, entonces la probabilidad de un fusible defectuoso en la segunda selección aún es /o; es decir, p(B/A) = p(B) y los eventos A y B son independientes. cuando esto es cierto, podemos sustituir p(B) por P(B/A) en el teorema anterior para obtener la siguiente regla especial de multiplicación. Teorema Dos eventos A y B son independientes si y sólo si P(A Por tanto,. para obtener la n B) = P(A) P(B). probabilidad independientes, simplemente calculamos el de que ocurran dos eventos producto de sus probabilidades individuales. Ejemplo. Una pequeña ciudad tiene un carro de bomberos y una ambulancra disponibles para emergencias. La probabilidad de que el carro de bomberos esté disponible cuando se necesite es 0.98 y la probabilidad de que la ambulancia esté disponible cuando se le requiera es 0.g2. en el caso de que resulte un herido oe un edificio en llamas, encuentre la probabilidad de que la ambulancia y el carro de bomberos estén disponibles. Solución sean A y B los respectivos eventos de que estén disponibles el carro de bomberos y la ambulancia. Entonces, P(A 98 n B) = P (A) P(B) = (0.98) (0.92) = 0.9016. Ejemplo se lanza dos veces un par de dados. ¿cuál es la probabilidad de obtener totales de siete y once? Solución Sean A1, Az, Bt y 82 los eventos independ¡entes respectivos de que ocurra un siete en la primera tirada, ocurra un siete en el segundo lanzamiento, un once en el primero y un once en el segundo. Nos interesa la probabilidad de la unión oe los eventos mutuamente excluyentes A1 n 82 y B1n A2. por tanto, P[(A1 n Bz) u(BrnAz)] =P(A1 nBz)+P(BrnAz) = P (A1 )P( 82) + P(Br )P(A2) =(r/6X1/1 8) + (1/18)(1/6) = 1154. Los teoremas anteriores se pueden generalizar para cubrir cualquier número de eventos, como se establece en el teorema siguiente. Teorema Si, en un experimento, pueden ocurrir los eventos A1, 42, 43, ..., AK, entonces, P(A1 nA2n43ñ " nAr) P (A1 )P(A2IA1 )P(& /A1 n Az ) ... P(AK/AI = n Az n ... n Ar-r ). Si.los eventos A1, A2, A3, ..., AK son independientes, entonces, P(A1 n 42 n 43n ... n A¡{= P(A1 ) P(A2 )P(A3 ) P(Ar) t 99 Ejemplo Se sacan tres cartas una tras otra, sin reemplazo, de una baraja ordinaria. Encuentre la probabilidad de que ocurra el evento Ar ó Az o A¡, donde Ar es el evento de que la primera carta sea un as rojo, 42 el evento de que ta segunda carta sea un 10 0 una sota y A¡, el evento de que la tercera carta sea mayor que tres pero menor que siete. Solución Primero definimos los eventos Ar: Az: A¡: la primera carta es un as rojo, la segunda carta es un 10 o una sota, la tercera carta es mayor que tres pero menor que siete. Entonces, P(A)=2¡52, P(A2IA1)=g/91, p(A3/Ar^A2)=.12lSO, Y de aquí, por el último teorema, P(A1 n 42 n 43 ) = P(A1 )p(A2lA1 )p(A3/A1 n 42 ) = (2 | Ejemplo. 52)(8 | 5 1 ) (1 21 50) = g¡ 5525. se carga una moneda de modo que ra cara tenga una posibiridad de ocurr¡r dos veces mayor que la cruz. si se lanza tres veces la moneda, ¿cuál es ta probabilidad de obtener dos cruces V una cara? Solución El espacio muestral para er experimento consiste en los ocho elementos. 5 = {HHH, HHT, HTH, THH, HTT, THT, TTH, TTT}. Sin embargo, con una moneda no balanceada ya no es posible asignar probabif idades iguales a cada punto de la muest ra. para encontrar las 100 probabil¡dades, cons¡dérese primero el espac¡o muestral S1 = {H, T}, que representa los resultados cuando se lanza una vez la moneda. si se asignan probabifidades de w y 2w para obtener un cruz y una cara, respectivamenre, tenemos 3w = 1 o w = 1/3. Por tanto P(H) = 2¡3 y p(T) = 1/3. Sea ahora A el evento de obtener dos cruces y una cara en los tres lanzamientos de la moneda. Entonces, 4 = {TTH, THT, HT-r}, Y como los resultados en cada uno de los tres lanzamientos son independientes, se sigue del último teorema que P(THH) = P(Trl Tn H) = P(T)P(T)P(H) = (1/3) (l/3) (2t3,¡ = 2¡27. De manera similar, P(THT) = P(HTT) = 2127 y por ello P(A) = 2¡27 + 2t27 + 2t27 = 2tg. 101 Resumen El espacio muestral se define como el conjunto de todos los resultados posibles oe un experimento estadístico y cada resultado de un espacio muestral se denomina punto muestral. Un evento es un subconjunto de un espacio muestral. La unión de dos eventos A y B, que se denota mediante er símboro A evento que contiene todos los elementos que pertenecen u B, es er aA o a B o a los dos. se definen dos eventos A y B mutuamente excluyentes, si la intersección de los dos es vacía; es decir, si no tienen elementos en común. La intersección de dos eventos A y B se denota mediante el símbolo A n B: es ei evento que contiene a todos los elementos que son comunes a A v a B. Probabilidad: Quizás la sed insaciable del hombre por el juego fue lo que condu¡o a desarrollar tempranamente probabilidad de un evento muestrales en la teoría de probabilidades, definiéndose ra A como la suma de los pesos de todos los puntos A. Para todo punto en el espacio muestral, asignamos una probabilidad tal que la suma de todas las probabilidades es igual a 1. si tenemos razón para creer que es bastante probable que ocurra c¡erto punto muestral cuando se lleva a cabo el experimento, la probabilidad que se le asigne debe ser 102 cercana a 1. Por otro lado, una probabilidad cercana a cero se asigna a un punto muestral que no es probable que ocurra. Existen dos enfoques para definir probabilidades, un enfoque subjetivo el cual usa la intuición, las creencias personales y otra información indirecta; y un enfoque de frecuencia relativa, el cual es más científico y tiene bases matemáticas y numéricas para estimar las probabilidades. Permutaciones Una permutación de n objetos tomados de r en r es una relación ordenada de r objetos de entre n. El número de permutaciones de n objetos tomados de r en r se denota por nP,', P(n, r), o Pn,, y viene dado por nP, = n(n - 1Xn -2). .(n - r + 1) = n!/(n - r)l Combinaciones una combinación de n objetos tomados de r en r es una selección de r de ellos. sin importar el orden de los r escogidos. El número de combinaciones de ' objetos, tomados de r en r se denota 103 p", ("\ t y viene dado por ;j n EJERCICOS A continuación encontraras un enunciado y cuatro posibilidades de respuesra, entre las cuales debe escoger sólo una, la que considere correcta. 1. lván tiene tres camisas, cuatro pantalones y dos pares de zapatos. El número de maneras en que se puede vestir es: a. Mas de dos formas b. Por lo menos doce formas c. Al menos veinticuatro maneras d. Exactamente veinticuatro formas 2. Un grupo de cinco amigos, que se intercambian diariamente al sentarse en una mesa, vuelven a quedar cada uno en el mismo sitio al cabo de: a. 25 días b. 120 días c. 125 días d. 240 días 3. De un sombrero con papeles numerados del 1 al g, se extraen 4 con reemplazamiento (se saca uno, se anota el resultado y se vuelve a depositar en el sombrero), teniendo que el numero total de posibilidades es de g4. Ahora, si la extracción se hace sin reemplazamiento (no se vuelven a colocar en el sombrero) el total es 9x8x7x6. Sea x, la variable que representa el número obtenido. Todos los números tienen el mismo chance de salir. La probabilidad de que el número más pequeño extraÍdo sea 3 en las dos situaciones: a. Menor que 1 en ambos casos b. Mayor que cero y menor que uno c. En el primer caso mayor que en el segundo d. Es mayor si se hace sin reemplazamiento que con reemplazamiento 104 4. Se realiza el experimento de lanzar un dado cargado una vez. La letra representa el resultado del lanzamiento y po representa la probabilidad de este. como se muestra en el siguiente recuadro: J P(i) 1 z 2t15 P6 2t15 4 1t5 1/6 La probabilidad de obtener un número primo se puede representar con expresión: P(J=s) b.1 - {(2t1s )+ (1/15 )+ (1/6 )} a. PA=4 + P(i=3)+ 6 1t6 ra b. p(J11,4,6) c.p6+ (2t15 ) + (1/6 )} Resuelve 1. se lanza una moneda 2 veces. ¿cuár es ra probabiridad de que ocurra ar menos una cruz? . 2. se carga un dado de forma que sea 2 veces más probabre que sarga un número impar que uno par. Si E es el evento de que ocurra un número menor que 3 en un solo lanzamiento del dado, encuentre p(E). 3. Una nevera térmica contiene un surtido de herados compuesto por seis oe vainilla, cuatro de arequipe y 3 de chocolate. si un cliente realiza una seleccion aleatoria de uno de ros herados, encuentre ra probabiridad de sacar: a) uno de vainilla, b) uno de arequipe c) uno de chocolate. 4. 5. La probabilidad de que J.p. Montoya gane er gran premio de Marasia, er cuar otorga U$ 1'000.000, es 1/5. ¿Cuál es su esperanza matemática? En un negocio aventurado, una señora puede ganar $300 con probabilidad 0.6 o perder $ 100 con probabilidad de 0.4. Hallar su esperanza matemática. 105 6. Hay que colocar a 5 hombres y 4 mujeres en una fila de modo que las mujeres ocupen los lugares pares. ¿De cuántas maneras puede hacerse? (permutación) 7 ¿De cuántas formas se pueden repart¡r 10 objetos en dos grupos de 4 y 6 objetos, respectivamente? (combinación) 8 ¿De cuántas maneras se puede formar con 9 personas una comisión de 5 miembros? (combinación) 9 De entre 5 administradores y 7 ingenieros, hay que constitu¡r una comisión l' de 2 administradores y 3 ingenieros. ¿De cuántas formas podrá hacerse si: a) todos son elegibles, b) un ingeniero particular ha de estar en esa comisión y c) dos administradores concretos tienen prohibido pertenecer a la comisión? 'rF 106 f t- LECTURAS COMPLEMENTARIAS ORIGENES DEL CONSEPTO DE PROBABILIDAD El concepto de probabilidad es muy reciente. En 16s4 el noble francés Antonro Gombard, conocido como caballero de mére, persona muy aficionada al juego, se hizo varias preguntas sobre problemas relacionados con el juego de dados, a partir de su experiencia como asiduo jugador. Mere observo que apostar a que al menos apostar un seis doble en una secuencra de 24 tiradas de dos dados, es un juego en el que se pierde ligeramente mas que se gana. Mere no daba crédito a sus resultados, pues pensaba que si sacar un seis doble en una partida se obtiene una vez de 36, en 24 part¡das serial, que JO I .z -. es menor que Para salir de su perplejidad escribió al matemático franés Blaise pascal (16231662) una carta comentándoles estas cuestiones. Interesado pascal en semejantes problemas inicio una correspondencia con su colega pierre de fermat (1601-1665), tratando de resolver los problemas planteados por mere. La correspondencia entre estos dos grandes matemáticos se considera hoy día como el origen de la teoría de la probabilidad. r07 En 1774, Pierre simón laplace (1749-1827) enuncio la primera def¡nición que se conoce del concepto de probabilidad y que hemos expuesto en el desarrollo de lección. ra Después de laplace, el interés por el cálculo de probabilidades fue disminuyendo, llegando prácticamente a desaparecer como disciplina matemática durante el siolo XIX. El gran número de paradojas y dificultades surgidas a comienzos del presente siglo aconsejaron una profunda revisión del concepto de probabilidad utilizando las herramientas matemáticas más premisas del momento; esto es: la teoría de conjuntos desarrollada principalmente por Emile borel (1g71-i9b6) y la potente teorÍa de la medida debida a Henri lebesgue (l1B7S-1941). El matemático ruso Andrei nicolevich kolmogorov (i 903-r gg7) construyo una axiomática para el calculo de probabilidades, cuya idea fundamental fue considerar la intima relación que existe entre Frecuencia relativa de un suceso y su Probabilidad, cuando el numero de pruebas es muy granoe. 108 '''ü'"ri BIBLIOGRAFíA MURRIA, R. Spiegel, Estadistica, Serie Schaum, Mc. Graw Hill Editores, 1990. LINCOYAN, Portus Govinden, Curso Práctico de Estadística, Mc. Graw Hill Editores, 1986. MARTÍNEZ, Ciro. Estadística. Eco Ediciones. Bogotá 1g92. SPIEGEL, Murria. Estadística. Editorial McGraw Hill. México 1984 WALPOLE, Myers. Probabilística y Estadística, Pearson Education, 1998. HINES W. Willian y MONTGOMERY C. Douglas, Probabitidad y Estadística, Editorial CECSA, 1999. GEORGE, Canavos. Probabilística y Estadística, Mc Graw Hill Editores, 1997. CASTILLO H, Mario. Apuntes de Estadística, Universidad de los Andes, 2002. MORRIS, Hide Groot. Probabilidad y Estadística, Mc Graw Hill Editores, 2001. l0h DIRECCIÓN DE EDUCACIÓN ABIERTA Y A DISTANCIA Y VIRTUALIDAD LICENCIATURA EN EDUCACIÓN BÁSICA CON ÉNFASIS EN CIENCIAS NATURALES Y EDUCACIÓN AMBIENTAL ESTADÍSTICA Carretera Troncal de Occidente - Vía Corozal - Sincelejo (Sucre) Teléfonos: 2804017 - 2804018 - 2804032, Ext. 126, 122 y 123 Mercadeo: 2806665 Celular: (314) 524 88 16 E- Mail: facultadeducacion@cecar.edu.co