CÀLCUL DE PROBABILITATS (Laboratoris) DIPLOMATURA D’ESTADÍSTICA Mónica Bécue Bertaut Despatx 414 Lídia Montero Mercadé Despatx 421 Departament Estadística i Investigació Operativa Setembre de 2004 Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Prof. Lídia Montero i Mónica Bécue Programa de Pràctiques Laboratori Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 1. PRÁCTICAS Las sesiones de prácticas comportan sesiones de problemas, en las cuales los estudiantes aplican los conocimientos adquiridos en las sesiones de teoría, y sesiones de análisis de datos, que permiten introducir ideas básicas sobre la estadística descriptiva. Todas las sesiones, excepto la primera, son objeto de evaluación mediante la entrega, al final de la sesión, del trabajo efectuado en la sesión (o parte del trabajo efectuado). Programa dels laboratoris L’assignatura de Càlcul de Probabilitats comporta l’assistència obligatòria a les pràctiques de laboratori. Les sessions de laboratori previstes són: 1ª Sesión: 16 sep 23 sep Sesión: 30 sep Introducción al Minitab: simular una moneda, simular un dado (para esta sesión, se desdobla el grupo en dos subgrupos: subgrupo1 semana 1: 13 sept; subgrupo 2: 20 sept.) 2a Combinatoria y probabilidad 3a Sesión: 7 oct Probabilidad condicional y teorema de Bayes 4a Sesión: 14 oct Introducción a las variables aleatorias (distribución y resúmenes numéricos) mediante herramientas de estadística descriptiva (Minitab) 5a Sesión: 21 oct Variables aleatorias: función de probabilidad, función de distribución, esperanza, varianza ---------------- Examen parcial ----------------------------------------------------------------6a Sesión: 4 Nov Par de variables aleatorias 7a Sesión: 11 Nov Variable de Bernoulli, variable binomial (Tablas) 8a Sesión: 18 Nov Tablas de contingencia: independencia en la muestra versus en la población (Minitab) 9ª Sesión: 25 Nov Variable geométrica, binomial negativa y de Poisson (Tablas) 10ª Sesión: 2 Dic Variable exponencial, relación con la variable de Poisson 11a Sesión: 9 Dic Variable Normal (Tablas) 12a Sesión: 16 Dic Teorema límites: teorema de los grandes números, TLC Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Prof. Lídia Montero i Mónica Bécue Programa de Pràctiques Laboratori Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 2. ARXIU DE DADES Els arxius base de treball, el que no treu que ocasionalment es pugui fer-ne servir d’altres, es: LECTURA.DAT Es troba a disposició dels alumnes de l’assignatura un conjunt d’arxius de dades en el en la carpeta del servidor KOLMOGOROV relativa a assignatures de la Diplomatura: El archivo LECTURA.MTW contiene información extraída de una investigación destinada a conocer las actitudes hacia la lectura que presentan los escolares de Enseñanza Primaria (Les actitudes envers la lectura, un model d’anàlisi a l’Educació Primària, Nuria Rajadell Puiggros, Tesis de Pedagogía de la Universidad de Barcelona, 1990). 857 alumnos de 5º nivel de enseñanza general básica (10-11 años) son observados. Una vez depurados los datos únicamente se usa una población de 678 alumnos, (se pierden muchas observaciones debido a la gran cantidad de “missing”). Para este ejemplo, se ha conservado solamente una muy pequeña parte de información recogida sobre los niños, extraída del cuestionario de opinión general, del cuestionario general de inventario de actitudes hacia la lectura, y de las fichas escolares. Se obtienen así 30 variables, presentadas a continuación. Se detallan las modalidades correspondientes a cada variable. En el fichero, hay 31 columnas, la primera contiene –alfanumérico- el identificador del individuo. Descripción de las variables y de las modalidades ---------------------------------------------------------------------------------------------------C2. EN LA ESCUELA LEEMOS ( 4 MODALIDADES ) EL1 - POCO EL2 - BASTANTE EL3 - MUCHO EL4 - MISSING ESC LEEMOS ---------------------------------------------------------------------------------------------------C3. EN CASA TENEMOS ( 4 MODALIDADES ) HH1 - POCOS LIBROS HH2 - BASTANTES LIBROS HH3 - MUCHOS LIBROS HHMI - MISSING LIBROS CASA ---------------------------------------------------------------------------------------------------C4. YO LEO ( 4 MODALIDADES ) JL1 - POCO JL2 - BASTANTE JL3 - MUCHO JLMI - MISSING YO LEO ---------------------------------------------------------------------------------------------------C5. LEO CON ( 4 MODALIDADES ) LA1 - MUCHA DIFICULTAD LA2 - ALGUNA DIFICULTAD LA3 - FACILIDAD LAMI - MISSIN LEO CON ---------------------------------------------------------------------------------------------------C6 LIBROS ESCUELA DADOS POR MAESTRO ( 3 MODALIDADES ) LM1 - ME GUSTAN LM2 - NO ME GUSTAN LMMI - MISSING LI ESC MAES ---------------------------------------------------------------------------------------------------C7 LEO CUANDO ( 4 MODALIDADES ) PL1 - HAGO TRABAJO PL2 - ME APETECE PL3 - LAS DOS COSAS PLMI - MISSING LEO CUANDO ---------------------------------------------------------------------------------------------------C8 PREFIERO LEER ( 4 MODALIDADES ) PB1 - EN SILENCIO PB2 - EN VOZ ALTA PB3 - 1+2 PBMI - MISSING PREF. LEER ---------------------------------------------------------------------------------------------------C9 LEER TEXTOS ESCUELA ( 4 MODALIDADES ) TX1 - NO ME GUSTAN TX2 - ME GUSTAN TX3 - GUST. A VECES SI, A TXMI - MISSING ESC ---------------------------------------------------------------------------------------------------C10 GUSTAR ESCUELA ( 4 MODALIDADES ) AE1 - SI AE2 - NO AE3 - SI I NO AEMI - MISSING GUS ESC ---------------------------------------------------------------------------------------------------C11 ASIGNATURA PREFERIDA ( 13 MODALIDADES ) AM1 - MATEMATICAS AM5 - LENGUA CAT. AM8 - GIMNASIA AM11 - MUSICA AM2 - LENGUA CAST. AM6 - LENGUA EXTRAN. AM9 - DIBUJO AM12 - OTROS AM3 - SOCIALES AM7 - PLASTICA AM10 - ETICA-RELIGION AMMI - MISSING ASIG.PREF. AM4 - NATURALES ---------------------------------------------------------------------------------------------------C12 ASIGNATURA RECHAZADA ( 13 MODALIDADES ) AR1 - MATEMATICAS AR5 - LENGUA CATAL. AR8 - GIMNASIA AR11 - MUSICA AR2 - LENGUA CAST. AR6 - LENGUA EXTRAN. AR9 - DIBUJO AR12 - OTROS AR3 - SOCIALES AR7 - PLASTICA AR10 - ETICA-RELIGION AR13 - MISSING ASIG RECH. AR4 - NATURALES ---------------------------------------------------------------------------------------------------C13 ESTUDIOS MADRE ( 6 MODALIDADES ) Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori ES1 - SIN ES3 - MEDIOS ES5 - UNIV. SUP. ESMI - MISSING ESTUDIM ES2 - ELEMENTALES ES4 - UNIVERSITARIOS ---------------------------------------------------------------------------------------------------C14 ESTUDIOS PADRE ( 6 MODALIDADES ) ER1 - SIN ER3 - MEDIOS ER5 - UNIV.SUP. ERMI - MISSING ESTUDIP ER2 - ELEMENTALES ER4 - UNIVERSITARIOS ---------------------------------------------------------------------------------------------------C15 IDIOMA FAMILIAR ( 4 MODALIDADES ) FU1 - CATALAN FU2 - CASTELLANO FU03 - CATALAN Y CASTELLANO FUMI - MISSING LENGUA ---------------------------------------------------------------------------------------------------C16 SE SIENTE BIEN EN CLASE...? ( 9 MODALIDADES ) GC1 - SI POR TODO GC4 - SI POR MAESTRO Y COM GC6 - NO POR MAESTRO GC8 - NO POR MAESTRO Y COM GC2 - SI POR EL MAESTRO GC5 - NO POR NADA GC7 - NO POR COMPAÑEROS GCMI - MISSING BIEN CLASE GC3 - SI POR LOS COMPAÑERO ---------------------------------------------------------------------------------------------------C17 NUMERO DE HERMANOS ( 9 MODALIDADES ) NG1 - NINGUN HERMANO NG4 - TIENE 3 HERMANOS NG6 - TIENE 5 HERMANOS NG8 - TIENE 7 HERMANOS NG2 - TIENE 1 HERMANO NG5 - TIENE 4 HERMANOS NG7 - TIENE 6 HERMANOS NGMI - MISSIN N. HERMANOS NG3 - TIENE 2 HERMANOS ---------------------------------------------------------------------------------------------------C18 NIVEL SOECIOECONOMICO FAMILIAR ( 4 MODALIDADES ) NS1 - BAJO NS2 - MEDIO NS3 - ALTO NSMI - MISSING ---------------------------------------------------------------------------------------------------C19 PORQUE LEO TEXTOS ESCOLARES ( 8 MODALIDADES ) PE1 - DIVERTIDOS PE3 - BONITOS PE5 - FACILES PE7 - LENGUA CATALANA PE2 - INTERESANTES PE4 - ABURRIDOS PE6 - DIFICILES PEMI - MISSING PQ L TE ESC ---------------------------------------------------------------------------------------------------C20 TIPO DE ESCUELA ( 3 MODALIDADES ) PP1 - PUBLICA PP2 - PRIVADA PPMI - MISSING ESCUELA ---------------------------------------------------------------------------------------------------C21 CALIFICACIONES GLOBALES ( 6 MODALIDADES ) QG1 - SUSPENSO QG3 - BIEN QG5 - SOBRESALIENTE QGMI - MISSING CALIF GLO QG2 - SUFICIENTE QG4 - NOTABLE ---------------------------------------------------------------------------------------------------C22 CALIFICACIONES LENGUA ( 6 MODALIDADES ) QL1 - SUSPENSO QL3 - BIEN QL5 - SOBRESALIENTE QLMI - MISSING CALIF. LEN QL2 - SUFICIENTE QL4 - NOTABLE ---------------------------------------------------------------------------------------------------C23 SEXO ( 3 MODALIDADES ) SX1 – NIÑO SX2 - NIÑA SXMI - MISSING SEXO ---------------------------------------------------------------------------------------------------C24 OCUPACIOM DE LA MADRE ( 12 MODALIDADES ) TM1 - ADM. BANC. EMP TM4 - PR. INDUSTRIA TM7 - TRANS. COMUNIC TM10 - PARADO TM2 - FUNCIONARIO TM5 - AGR. GANA. MIN, TM8 - OFICIOS TM11 - JUBILADO TM3 - PR. LIBERALES TM6 - COMERCIO TM9 - AMA DE CASA TMMI - MISSING TRABA MADRE ---------------------------------------------------------------------------------------------------C25 OCUPACIÓN DEL PADRE ( 12 MODALIDADES ) TP1 - ADM. BANC. EMP. TP4 - PR. INDUSTRIA TP7 - TRANS. COMUNIC TP10 - PARADO TP2 - FUNCIONARIO TP5 - AGR. GAN. MIN. TP8 - OFICIOS TP11 - JUBILADO TP3 - PR. LIBERALES TP6 - COMERCIO TP9 - AMA DE CASA TPMI - MISSING TRAB PADRE ---------------------------------------------------------------------------------------------------C26 SEXO*LENGUA FAMILIAR ( 8 MODALIDADES ) SL1 - NIÑO CATALAN SL3 - NIÑO CAT*CAST SL5 - NIÑA CATALAN SL7 - NIÑA CAT*CAST SL2 - NIÑO CASTELLANO SL4 - NIÑO MISSING SL6 - NIÑA CASTELLANO SL8 - NIÑA MISSING ---------------------------------------------------------------------------------------------------C27 EDAD DE LA MADRE ( CONTINUE ) AAAB - EDAD DE LA MADRE ---------------------------------------------------------------------------------------------------C28 EDAD DEL PADRE ( CONTINUE ) AAAC - EDAD DEL PADRE ---------------------------------------------------------------------------------------------------C29 IGNV INTELIGENCIA NO VERBAL ( CONTINUE ) AAAF - IGNV ---------------------------------------------------------------------------------------------------C30 IGV INTELIGENCIA VERBAL ( CONTINUE ) AAAG - IGV ---------------------------------------------------------------------------------------------------C31 M.I. INTELIGENCIA GLOBAL ( CONTINUE ) AAAH - M. I. ---------------------------------------------------------------------------------------------------- Para estos 678 alumnos se calculan las medias y desviación tipo de las variables continuas. Variable continua Edad – Madre Edad – Padre Inteligencia no-verbal Inteligencia verbal Inteligencia global Prof. Lídia Montero i Mónica Bécue Media 38,191 41,104 44,90 40,62 42,59 Desviación Tipo 5,619 6,127 31,72 29,67 30,73 Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 3. PROBABILIDAD Y ESTADÍSTICA: PREGUNTAS, PROBLEMAS Y SITUACIONES Vivimos en un universo del azar: • Se usa y abusa de las cifras bajo la forma de porcentajes, predicciones, publicaciones de riesgos, etc. • Toda decisión, incluso la más cotidiana, se apoya, aunque muchas veces implícitamente, en cálculos de riesgos y/o utilidades. • Por tanto, estamos acostumbrados al razonamiento inductivo, a los argumentos probabilistas, al riesgo de error asociado a toda decisión. Pero…somos, los humanos, muy malos cuando razonamos sobre riesgos, cuando utilizamos un razonamiento inductivo. Cuando utilizamos la intuición o el sentido común para afrontar situaciones en las cuales interviene el azar cometemos muchos errores. A decir verdad, se puede tener primicias válidas, argumentación valida y un resultado falso! No obstante, tenemos que tomar de forma muy corriente muchas decisiones en situaciones de incertidumbre. Se tiene que aprender a utilizar el azar, a domesticar el azar (Ian Hacking). Los estadísticos deben aprenderlo. Pero como en nuestro universo, nada escapa a la probabilidad, los profesionales de casi todos los campos deben aprender a poner la probabilidad a su servicio. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Prof. Lídia Montero i Mónica Bécue Programa de Pràctiques Laboratori Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 4. INTRODUCCIÓ AL PAQUET ESTADÍSTIC MINITAB Full de dades El paquet estadístic MINITAB té un funcionament interactiu interpretat. Realitza operacions sobre un full de dades (worksheet) que es pot considerar com una matriu de dades on les columnes s’identifiquen amb les variables que tenen com a nom defecte c1, c2, c3, etc., i les files representen els individus (o unitats estadístiques o observacions); cada fila conté els valors que toma el individu para totes les variables. Els fulls de dades de MINITAB tenen la extensió per defecte .mtw. Estructures de dades A més de variables-columnes, existeixen d’altres estructures de dades en MINITAB, però en aquest punt només resulta d’interès comentar la possibilitat d’usar constants, que per defecte s’anomenen k1, k2, k3, etc. Tant les variables, com les constants poden tenir noms particularitzats a l’aplicació de l’usuari i això s’assoleix amb la comanda NAME: MTB> NAME K1 ‘DADES’ Ull! Qualsevol referència posterior, en comandes, a la variable dades ha de fer-se amb la cadena de caràcters entre cometes. Ajuda en línia El HELP és molt satisfactori i en les sessions de pràctiques es fomentarà el seu us, de manera que l’estudiant assoleixi en finalitzar el curs prou agilitat amb el sistema com per poder consultar i entendre l’ús de comandes que desconeixi sintàcticament. En entorn Windows, el HELP és sensitiu al context i es pot invocar des de qualsevol punt. Sortir i conservar el full de treball En entorn WINDOWS, sortir del sistema MINITAB assoleix amb la selecció d’icones File Exit. Pel recull de la sessió de treball en un arxiu de texte s’activa la finestra File SaveSession Window As o bé es seleccionen les icones File SaveProject as (salva fulls i icones de resultats oberts, texte i gràfics) o File SaveWorksheet As només per salvar el full de dades actual. Informació sobre l’arxiu Una manera ràpida de consultar el nombre de columnes/variables existents en un full de dades és la comanda INFO, que a la vegada informa de l’existència de noms d’usuari lligats a les variables i del nombre d’observacions de cadascuna. En entorn Windows cal seleccionar les icones Window Info. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Lectura de les dades Una primera tasca fonamental consisteix en comunicar-se amb l’entorn de l’ordinador, és a dir la lectura/escriptura de dades, bé en format ASCII o en format intern MINITAB. La lectura/escriptura de dades en format ASCII es realitza amb les comandes READ i WRITE respectivament. La lectura/escriptura d’arxius de dades en format intern mitjançant les comandes RETRIEVE i SAVE, respectivament. La lectura i escriptura de fitxers s’aconsella s’efectuï a partir de les icones de l’entorn Windows: • Arxius en format intern Minitab: Icona File OpenWorksheet (lectura d’un arxiu existent), File NewWorksheet (creació d’un nou full de dades), Save (As) Worksheet (escriptura). • Arxius en format ASCII: File OtherFiles Import Text (lectura) i File OtherFiles Export Text (escriptura). • Per recuperar un projecte anterior (fulls de càlculs i resultats): Icona File OpenProject. Preparació de les dades En la gran majoria d’estudis d’estadística descriptiva, és necessari de transformar les dades originals: per suprimir alguns valors no adequats, per crear variables derivades de les originals que presenten millors propietats de cara al tipus d’anàlisi posterior, etc. Les comandes MINITAB de transformació i creació de noves variables són bàsicament tres: Ex: Tomando como ejemplo la base “Lectura”. 1. LET. Crea una nova variable com a funció matemàtica de variables prèviament existents, per ex: LET C100 = 10*C2 + C3. En entorn Windows cal seleccionar les icones Calculate Calculator. MTB> Let C40 = (C29 + C30 + C31)/3 C40 contiene una nota igual a la media de los tres tests. 2. COPY. Crea una nova variable que conté un subconjunt (o tots) de valors de la variable original, seleccionats per un criteri molt flexible funció del número d’observació o funció dels valors d’una tercera variable que juga el paper de selector. Les diferències en les dues maneres de selecció es comentaran àmpliament a classe de pràctiques, aquí només es dóna la sintaxi de les dues funcionalitats: Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats (a) Programa de Pràctiques Laboratori MTB> COPY C29 C41; SUBC> USE C23 2 (b) MTB> COPY C29 C41 SUBC> OMIT C23 1. En el ejemplo (a), el cual es equivalente al ejemplo (b), se copian los valores de la variable “inteligencia no verbal”, pero solamente de las chicas en C41. (c) MTB>COPY C30 C42; SUBC> USE C31 50:99. En el ejemplo (c) se copian los valores de la variable “inteligencia verbal” en C42, solamente para los niños que tienen un valor superior o igual a 50 en la variable “inteligencia global”. En entorn Windows cal seleccionar les icones Manipulate CopyColumns. 3. CODE. Pot crear una nova variable amb certs valors originals transformats segons uns criteris de rang de valors. És fonamental per la codificació dels missings com ‘*’: MTB> CODE (0:24) 1 (25:30) 2 (31:45) 3 (46:50) 4 (51:60) 5 'Edad - Madre' C43 Con la instrucción anterior se transforma la variable continua “Edad – Madre” en una variable categorica “Edad – Madre en clase”. Por lo tanto, en la C43 se tendrán los siguientes valores: Edad - Madre C43 0 a 24 1 25 a 30 2 31 a 45 3 46 a 50 4 51 a 60 5 * * (No cambien) En entorn Windows cal seleccionar les icones Manipulate CodeDataValues Numeric to Numeric. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Prof. Lídia Montero i Mónica Bécue Programa de Pràctiques Laboratori Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5. SESIONES 5.1 Introducción al Minitab: simular un dado − Entrar en Minitab − Ventana “sesión”, ventana “hoja de cálculo” − Otras ventanas − Las facilidades del “Project manager” Estructuras de datos: − Constante K1, K2, … − Vectores o columnas C1, C2, … − Dar nombres a las estructuras de datos: Help Name En la primera parte de la práctica, se ve cómo simular la tirada de una moneda: a) “inventando los resultados”, b) utilizando las facilidades ofrecidas por el Minitab y, finalmente, c) tirando realmente una moneda. Se comparan las secuencias obtenidas. Después, cada grupo deberá reproducir los puntos a) y b) para simular un dado y después comparar las secuencias obtenidas siguiendo el mismo esquema. PARTE I: Simular una moneda 1. Cada estudiante “inventa” la cara de la moneda que se “simula” haber tirado Se apuntan todos los resultados en la columna “imita-moneda” Es aconsejable emplear “0” para cara y “1” para cruz. Con esta codificación, cuando se calcula la media de las tiradas, se obtiene la proporción de “1” y, por tanto, de cruces. (Se puede intercambiar, evidentemente, la cara y la cruz). 2. Cada estudiante tira una moneda Se apuntan todos los resultados en la columna “moneda” 3. Simular la moneda mediante las facilidades ofrecidas por Minitab Calc-Random Data-Integer Y conservar los resultados de la simulación en la columna “simula-moneda” Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 4. ¿Cómo estudiar las dos secuencias producidas? Así, por separado para las dos columnas: − Calculen y apunten la media: ¿Qué se espera? ¿Qué valor se observa? Calc-Column statistics-mean − Representen las tiradas mediante un Graph Chart ¿Qué se espera? ¿Qué valor se observa? Graph Chart − Busquen la secuencia más larga de caras y la secuencia más larga de cruces. ¿Qué longitud de secuencia se espera? ¿Qué valor se observa? Se utiliza la secuencia de iconos: Stat Tables Tally PARTE II: Simular un dado (a entregar) Por grupos de dos, repetir los pasos 1, 3 y 4 pero para simular un dado y comparar las secuencias producidas Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.2 Combinatoria y probabilidad Problema 1 ¿Cuál es la probabilidad de obtener un número sin “0” ni “1” al formar números de tres cifras al azar? Problema 2 Se forma una palabra de tres letras, escogiendo las tres letras al azar. ¿Cuál es la probabilidad de que no haya letras repetidas? El alfabeto es de 26 letras. Problema 3 Se distribuyen 4 premios literarios entre 100 autores. ¿Cuál es la probabilidad de que el autor “AAA” tenga uno de los 4 premios? Se atribuye un solo premio por autor. Se atribuyen los premios al azar…. Problema 4 Problema planteado a Galileo por le Príncipe de Toscana. El Príncipe de Toscana, gran jugador, constató que “obtener una suma igual a 9 con 3 dados” era menos frecuente que “obtener una suma igual a 10 con 3 dados”. Le extraño este resultado empírico, dado que hay 6 combinaciones de números distintos (entre 1 y 6 cada uno) cuya suma es igual a 9 y también 6 combinaciones de números distintos (entre 1 y 6 cada uno) cuya suma es igual a 10. ¿Pueden justificar la constatación empírica con cálculos de probabilidad? Problema 5 En el lotto 6/49, una lotería oficial, se deben escoger 6 números entre 49 posibles. Se gana el gordo si los 6 números escogidos son los extraídos el día D. Se comparte el premio entre los que han dado la secuencia correcta. Se puede escoger el número libremente. ¿Una de las dos siguientes secuencias es preferible: • 1, 2, 3, 4, 5, y 6 • 39, 36, 32, 21, 14 y 3? ¿O bien uno debe ser indiferente frente a la elección entre las dos secuencias? Problema 6 Se lanzan dos dados, uno rojo y uno verde. 1 Asocien a esta experiencia un conjunto fundamental Ω. 2. Se considera como conjunto de los sucesos, las partes de Ω. Si los dados no son trucados, definir la probabilidad permite modelizar adecuadamente la tirada de los dos dados. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 3. ¿Es este conjunto fundamental equiprobable? 4. Calculen la probabilidad de los sucesos: obtener 2 caras repetidas, obtener un 3 y un 5, obtener un 3 en el dado rojo, un 5 en el dado verde Problema 7 (noviembre 1999) Se dispone de dos urnas con, cada una, cinco bolas numeradas de 1 a 5. Se extrae una bola de cada urna; cada extracción es independiente de la otra. Se obtiene así un par de cifras. 1. ¿Cuál es el conjunto fundamental asociado a esta experiencia?. Dar una representación gráfica de este conjunto. Representar los acontecimientos A = “Par de cifras repetidas” y B = “Par de cifras cuya suma es igual a 7”. 2. ¿Cuál es la probabilidad del acontecimiento A? Problema 8 (noviembre 1999) 1. ¿Cuál es la probabilidad de que un jugador tenga que efectuar 6 tiradas de un dado hasta que salga un “6”? 2. ¿Cuál es la probabilidad de que un jugador tenga que efectuar un total de 6 tiradas hasta obtener un “6” en dos ocasiones (al obtener el “6” por segunda vez, deja de tirar el dado). Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.3 Probabilidad condicional. Teorema de Bayes Problema 1 Hay dos sacos, los dos con 3 bolas rojas y 7 bolas negras. Se extrae al azar una bola del primer saco y se pone en el segundo. Después, se extrae una bola del segundo saco. ¿Cuál es la probabilidad de obtener una bola roja en esta segunda extracción? Problema 2 Se tiran dos dados equilibrados, uno rojo y uno verde Comprobar que los sucesos {obtener un “2” con el dado rojo} y {obtener un “4” con el dado verde} son independientes Problema 3 Se lanzan dos dados. Calcular la probabilidad de obtener al menos un “1” sabiendo que se han obtenido dos números distintos. Problema 4 En una caja, hay 5000 chips, 1000 provienen de la fábrica X que tiene una tasa del 10% de defectuosos, 4000 provienen de la fábrica Y que tiene una tasa del 5% de defectuosos Se escoge un chip al azar. Es defectuoso. Calculen la probabilidad de que venga de X. Problema 5 Los taxis azules y verdes En un juicio por un atropello mortal causado por un conductor de taxi, se está investigando qué conductor de taxi puede ser el responsable del atropello. En un primer tiempo, se intenta determinar en qué compañía trabaja. En la ciudad en la cual se cometió el atropello, hay solamente dos compañías de taxi. La compañía “TAXIS AZULES” y la compañía “TAXIS VERDES”. La primera utiliza taxis azules, la segunda, taxis verdes. El atropello se cometió en una noche de invierno con niebla. El conductor de taxi no se paró y tampoco se manifestó después. Un testigo dice que el taxi era de color azul. Dadas las condiciones, noche y niebla, se efectúan pruebas para determinar la fiabilidad del testigo: se le somete a una experiencia similar, reconocer el color de un taxi en este tipo de noche. Se determina así que el testigo reconoce el color correcto del taxi el 80% de las veces. Por otra parte, se sabe que el 85% de los taxis que circulaban en este momento pertenecían a “TAXIS VERDES”. Por tanto, en base a estas informaciones, el experto consultado por el juez concluye que el color del taxi complicado en el atropello: a) era azul con una probabilidad igual a 0.8 Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori b) tiene una probabilidad mayor de ser azul que de ser verde, pero esta probabilidad es inferior a 0.8 c) tiene la misma probabilidad de ser verde que de ser azul d) tiene una probabilidad mayor de ser verde que de ser azul Problema 6 (Noviembre 1999) Un laberinto tiene 3 entradas: A, B y C. La probabilidad de que un visitante del laberinto entre por A es de 20%, de que entre por B es de 40% y de que entre por C de 40%. La probabilidad de encontrar la salida sin ayuda es de 60% si se entra por A, de 50% si se entra por B y de 40% si se entra por C. Se pide: 1. La probabilidad de que un visitante salga sin ayuda. 2. La probabilidad de que el visitante haya entrado por A, dado que ha salido sin ayuda. 10 personas deciden visitar el laberinto (estos visitantes entran de manera independiente y efectúan el recorrido de manera independiente). Se pide calcular: 3. a. La probabilidad de que ningún visitante consiga salir sin ayuda. b. La probabilidad de que todos los visitantes salgan sin ayuda c. La probabilidad que al menos dos visitantes salgan sin ayuda Problema 7 (Noviembre 2002) En esta joyería de lujo, vienen tres tipos de clientes: (A) clientes habituales domiciliados en la comunidad, (B) clientes ocasionales domiciliados en la comunidad y (C) clientes ocasionales domiciliados en otra comunidad o en el extranjero. Cuando entra un cliente en la joyería, la probabilidad de que sea un cliente de tipo A de 0.1 y la probabilidad de que sea un cliente de tipo B es de 0.7. 1. ¿Cuándo un cliente entra en la joyería, ¿cuál es la probabilidad de que sea un cliente de tipo C? Se considera una compra importante si su importe supera 3000 euro. La probabilidad de que un cliente de tipo A efectué una compra importante es de 0.5, la probabilidad de que un cliente de tipo B efectué una compra importante es de 0.1 y la probabilidad de que un cliente de tipo C efectué una compra importante es de 0.2 2. Expliciten la notación empleada e indiquen cuáles son las probabilidades «a priori» conocidas. Se acaba de vender un collar de 7000 euro, 1. ¿cuál es la probabilidad de que el cliente fuese un cliente de tipo A?, ¿cuál es la probabilidad de que el cliente fuese un cliente de tipo B?, ¿cuál es la probabilidad de que el cliente fuese un cliente de tipo C?. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Sean pA, pB y pC las probabilidades calculadas en 3. 4 ¿Qué propiedad cumple pA+pB+pC?. Justificar la respuesta Problema 8. El test T y la enfermedad M Un laboratorio farmacéutico fabrica un test T para detectar una enfermedad M poco frecuente. El laboratorio dice que: • cuando la persona a la cual se aplica el test tiene la enfermedad M, entonces el test da positivo con una probabilidad igual a 0.95 • cuando la persona a la cual se aplica el test no tiene la enfermedad M, entonces el test da negativo con una probabilidad igual a 0.98 Por otra parte, se sabe que la probabilidad de tener la enfermedad M en la población a la cual se aplica el test es de 0.005 Se aplica el test a una persona de dicha población, escogida al azar ¿cuál es la probabilidad de que tenga realmente la enfermedad M? Problema 9. La política en el pueblo En este pueblo, 1/3 de los habitantes votan al partido P1, 2/3 al partido P2 En los votantes de P1: • 80% están a favor del cura (20% están a favor del alcalde) • 90% a favor de prohibir el acohol (10% en contra) En los votantes de P2: • 30% están a favor del cura (70% están a favor del alcalde) • 20% a favor de prohibir el acohol (80% en contra) Al interior de los partidos, hay independencia entre las opiniones sobre cura/alcalde y sobre alcohol. 1. Un individuo se declara a favor del alcalde y en contra del alcohol. ¿Cuál es la probabilidad de que vote a P1? 2. En la población global, ¿hay independencia entre las opiniones sobre cura/alcalde y sobre alcohol? Problema 10. Sistema complejo Determinen la probabilidad de que funcione el siguiente sistema en función de las probabilidades pi, i=1,…,5 de que funcionen los componentes Ci, i=1,…,5. Los estados de los componentes son mutuamente independientes. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats C1 Programa de Pràctiques Laboratori C4 Sistema S C2 C3 C5 11. Preguntas cortas 3. Una de las dos expresiones tiene un valor “particular”. ¿Cuál? a) P(A|B) + P(Ā|B)= b) P(A|B) + P(A| B )= 4. La sucesión de sucesos (Ei)i=1,…,n es tal que ΣP(Ei)= de Ω? Prof. Lídia Montero i Mónica Bécue 1, ¿(Ei)i=1,…,n es una partición Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.4 Distribución de una variable empírica. Parámetros de la distribución Una variable empírica es una variable observada sobre una muestra. Se suelen emplear herramientas descriptivas para describirla y obtener una primera información. Se habla de estadística descriptiva univariante, dado que se describe una variable a la vez, sin tener en cuenta los valores que toman las otras variables para el mismo individuo. Les variables aleatòries, com s’indica a teoria, es classifiquen principalment en variables qualitatives i variables quantitatives. Els procediments de descriptiva, per la seva banda es classifiquen en gràfics i numèrics. Parte I: Descripció numèrica d’una variable cuantitativa: inteligencia global Es busca resumir la informació d’una variable mitjançant indicadors clàssics i robustos de la distribució de la variable. Els indicadors clàssics són més comunament coneguts. Els indicadors robustos són aquells pocs sensibles a variar el seu valor en presència de valors extrems en les observacions (llamados outliers si ocupan una posición claramente distinta del “grueso” de la muestra). Els indicadors clàssics de la distribució de la variable són: • Tendència central: la mitjana x = Ex: 1 n ∑ xi o en termes MINITAB mean. n i =1 MTB > mean (C31) Mean of Inteligengia global Mean of Inteligengia global = 44,430 ( ) 2 1 n o la seva arrel quadrada que x − ∑ x i n − 1 i =1 s’anomena desviació tipus o estàndard S x (STDEV en MINITAB). • Dispersió dels valors: variància Ex: sx 2 = MTB > StDev 'Inteligengia global'. Standard Deviation of Inteligengia global Standard deviation of Inteligengia global = 31,532 Els indicadors robustos facilitats pel MINITAB són: • Tendència central: mediana (me o median en terminologia MINITAB), definida com el valor real tal que el 50% de les observacions prenen un valor inferior a me i el 50% prenen un valor superior. • Dispersió dels valors de la variable: distància interquartil (IQR) definida com la diferència entre els quartils del 75 (Q3) i 25% (Q1) (en terminologia MINITAB IQR=Q3-Q1) on: 1. Q1 és un valor real tal que el 25% de les observacions prenen un valor inferior a Q1. 2. Q3 és tal que un 25% de les observacions prenen un valor superior a Q3. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Molts d’aquests valors es troben a la sortida de la instrucció MINITAB DESCRIBE. En entorn Windows, els anteriors estadístics s’obtenen seleccionant els icons Statistics BasicStatistics DescriptiveStatistics. Ex: MTB > Describe 'Inteligengia global'. Descriptive Statistics: Inteligengia global Variable Intelige N 200 Mean 44,43 Median 40,50 TrMean 43,84 Variable Intelige Minimum 1,00 Maximum 99,00 Q1 18,00 Q3 71,75 StDev 31,53 SE Mean 2,23 Descripció gràfica de variables contínues La visualització de la distribució d‘una variable contínua complementa la descripció numèrica de la mateixa. Aquesta visualització es pot obtenir mitjançant diverses eines gràfiques MINITAB: histograma, box-plot, i d’altres. min max +------+----------+ I----------| | |------------------I +------+----------+ ↑ ↑ |<----- 1.5(Q3-Q1) ----->| | | Q1 ↑ | | mediana ↑ * ↑ |<----- 1.5(Q3-Q1) ----->| | | Q3 L’esquema vol il·lustrar en què consisteix el box-plot. La caixa central representa el 50% de les observacions, les que són entre el primer quartil i el tercer quartil; la mediana s’explicita amb una línia. Les cues són les línies que es prolonguen fins a un cert punt. Per exemple, en la cua superior es construeix un punt imaginari, situat a 1.5 vegades el IQR a partir del tercer quartil. La cua arribarà fins a l’observació més gran, però menor que aquest límit. La resta es representaran com a ‘*’, i anàlogament amb la cua inferior. Les observacions a més de 3 vegades el IQR a partir del tercer quartil són codificades gràficament pel MINITAB amb un símbol ‘o’. L’histograma és una representació extensament emprada. Les comandes bàsiques MINITAB per Estadística Descriptiva Univariant Gràfica són BOXPLOT i HISTOGRAM. En entorn Windows, l’obtenció de boxplots requereix seleccionar els icons Graph Boxplot i per tenir histogrames Graph Histo. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Ex: Comparar la información de la variable continua “Inteligencia global” desde un histograma, seleccionar el icono Graph y elegir Histogram… Y desde el Boxplot Histogram Inteligengia global Boxplot Inteligengia global 100 90 Inteligengia global Frequency 20 10 80 70 60 50 40 30 20 10 0 0 0 50 100 Inteligengia global Descripció d’una variable categòrica Les variables categòriques no prenen valors numèrics, sinó modalitats o categories (per exemple, el sexe pot ser home o dona, o el color dels ulls pot ser blau, verd, marró, etc.). Les variables categòriques no tenen significat numèric, tampoc té sentit establir mesures de tendència o de dispersió. Interessa obtenir la distribució dels efectius entre les distintes modalitats: icons Stat Tables Tally Ex: MTB > Tally 'Yo leo' ; SUBC> Counts; SUBC> CumCounts; SUBC> Percents; SUBC> CumPercents. Tally for Discrete Variables: Yo leo Yo leo 1 2 3 N= Count CumCnt 25 25 115 140 60 200 200 Percent CumPct 12,50 12,50 57,50 70,00 30,00 100,00 Les variables categòriques es descriuen simplement amb recomptes de les modalitats presents gràficament representades via la selecció dels icons Pie Chart i Graph Chart en entorn Windows. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Ex: Programa de Pràctiques Laboratori MTB > %Pie 'Yo leo'; SUBC> order 1. Pie Chart: Yo leo Pie Chart of Yo leo 3 ( 60; 30,0%) 1 ( 25; 12,5%) 2 (115; 57,5%) Ex: MTB > Chart Count( 'Yo leo' ) * 'Yo leo'; SUBC> Bar; SUBC> ScFrame; SUBC> ScAnnotation. Chart Yo leo 100 o e l o Y fo t n u o C 50 0 1 2 3 Yo leo Parte II (a entregar) Hagan la descripción de la variable cuantitativa “inteligencia verbal”. ¿qué comentarios podeís hacer? Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.5 Variable aleatoria discreta: función de probabilidad, función de distribución, esperanza, varianza, desviación-tipo Problema 1 Se tiran simultáneamente 2 dados. Se nota X el número de caras pares obtenidas e Y el máximo de las cifras de las caras obtenidas. Determinen las funciones de probabilidad y de distribución de X y de Y. Problema 2 X es una variable aleatoria discreta cuya función de probabilidad viene dada por: xi p(xi) 1 0,30 2 0,20 3 0,15 4 0,15 5 0,10 6 0,10 1. Representar gráficamente la función de probabilidad de X. Calcular la esperanza, la varianza y la desviación-tipo de X. Situar la esperanza en la gráfica. Mostrar gráficamente lo que representa la varianza. 2. Sea Y una variable aleatoria que tiene una esperanza que vale el doble de la esperanza de X y una varianza que vale cuatro veces la varianza de X. Determinen una posible función de probabilidad para esta variable. 3. Sea Z una variable aleatoria que tiene la misma esperanza que X y una varianza que vale cuatro veces la varianza de X. Determinar una posible función de probabilidad para esta variable. Problema 3 X es una variable aleatoria discreta cuya función de probabilidad viene dada por la siguiente tabla: Prof. Lídia Montero i Mónica Bécue xi p(xi) 1 0,20 2 0,20 3 0,15 4 0,15 5 0,10 6 0,10 7 0,05 8 0,05 Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 1. Hagan el gráfico de la función de probabilidad de esta variable. 2. Determinen la función de distribución de X y represéntenla gráficamente. 3. Con la ayuda de esta función de distribución, determinen la probabilidad de que: a. X tome un valor superior a 5.5; b. X tome un valor entre que 3 y 4.6; c. X tome un valore inferior a 2.3. Problema 4 Se tiran sucesivamente 3 dados. A una tirada se asocia 0, si la cara observada es par, ó 1, si la cara observada es impar. Se definen las variables: X= suma de valores asociados a la primera y segunda tiradas; Y= suma de valores asociados a la segunda y tercera tiradas. Calculen las funciones de probabilidad de X e Y, las esperanzas y varianzas de X eY. Problema 5 Sea X una variable aleatoria cuya función de probabilidad viene dada por la siguiente tabla: xi p(xi) -2 0,30 -1 0,20 0 0,15 1 0,15 2 0,10 3 0,10 1. Se define la variable Y de la manera siguiente: Y=0 si X>0 Y=1 si X≤0 Determinen la función de probabilidad de Y. 2. Se define la variable Z como Z=X2; determinen la función de probabilidad de Z. Problema 6 Sea X el número de buques-tanques que entran en el puerto cada día. X se puede considerar como una variable aleatoria de ley: Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori xi p(xi) 0 0,05 1 0,25 2 0,35 3 0,15 4 0,10 5 0,05 6 0,03 7 0,02 1. ¿Cuál el número esperado de buques-tanques que llegan un día cualquiera? 2. ¿Cuál la desviación-tipo del número de buques-tanques que llegan un día cualquiera? 3. El puerto puede atender como mucho K buques-tanques. Los buques-tanques que superan a la capacidad del puerto se desvían hacia otro puerto. a.¿ Calculen cuál debe ser la capacidad K del puerto para que se puedan atender a todos los buques-tanques que llegan el 90% de los días? b. En función de K, ¿cuál es la función de probabilidad de la variable Y, número de buquestanques desviados hacia otro puerto? Calculen la esperanza de Y. c. Se define la variable: Z número de buques-tanques atendidos, en función de K ¿cuál es la esperanza de esta variable? Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.6 Par de variables aleatorias Problema 1 Se tiran sucesivamente 3 monedas. A cara se asocia “1”, a cruz, se asocia “2”. Se definen las dos variables aleatorias: X: suma de los números asociados a las dos primeras monedas Y: suma de los números asociados a las dos últimas monedas Se pide: • Ley de X • Ley de Y • Ley del par (X,Y) • Ley de Z=XY • Calcular E(X), E(Y), COV(X,Y), V(X), V(Y), ρX,Y Problema 2 Consideramos el conjunto de todos los paquetes de 3 bits que se envían por una línea de comunicación (Ω = {000, 001, 010, 011, 100, 101, 110, 111}). Supongamos que todas las secuencias son equiprobables. Se definen dos variables aleatorias X e Y. La variable X es la suma de los 3 bits y la variable Y es el número de alternancias en la secuencia de bits. 1 2 3 4 5 Construya la tabla con la función de probabilidad conjunta de las variables X e Y. Determine las funciones de probabilidad marginales de X y de Y. ¿Son X e Y independientes? Razone la respuesta. Calcule las esperanzas de X y de Y. Calcule las varianzas de X e Y. Calcule la covarianza y el coeficiente de correlación entre X e Y. Problema 3 Se supone que 10% de los paquetes enviados al extranjero no llegan a su destino. Una persona desea mandar dos regalos a y b a un amigo y se pregunta si es mejor enviarlos juntos o separadamente. Cuando se mandan varios paquetes, los sucesos relativos a estos paquetes son mutuamente independientes. 1. Construir espacios de probabilidad asociados a los diferentes métodos de envío. 2. Para cada uno de los dos métodos, ¿cuál es la probabilidad del suceso A: al menos un regalo llega a destino? 3. Para cada uno de los dos métodos, ¿cuál es la probabilidad del suceso B: los dos regalos llegan a destino? 4. Para cada uno de los dos métodos, determinen la esperanza (en Euro) del valor que llega a destino, sabiendo que el regalo a cuesta 150 Euro y el b, 100 Euro. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5. En función de cada uno de los criterios introducidos en las preguntas 2, 3 y 4, ¿Cuál es el mejor método de expedición? Problema 4 Programa si (B1) escribir “si” fsi si (B2) escribir “si” sino escribir “no” fsi fprog En función de P(B1)=p1 y P(B2)=p2, determinar la ley de 5. X1: número de “si” escritos 6. X2: número de “no” escritos ¿Se puede o no determinar la función de probabilidad conjunta de X e Y? Problema 5 Recanvis de Peces (en parte igual al pb 3.28 de la lista) Un taller de reparacions ha controlat durant un cert temps les reparacions fetes sobre un determinat tipus de màquina que presenta una avaria simple (1 fallada) o doble (2 fallades). El taller s’ocupa d’anar reparant les fallades i si cal canviar la peça base. Els resultats del control mostren que • un 40% de les reparacions eren per una avaria simple sense que calgui el canvi de la peça base, • un 30% eren per una avaria simple però que requeria de canviar la peça, • la resta que eren avaries dobles, n’hi havia igual nombre que havien necessitat el canvi de peça, com sense canvi. 1. Quina és la funció de probabilitat de les variables, X: número de fallades i Y: canvi o no de peça? 2. Quina es la llei conjunta d’ambdues variables ? 3. És independent el número de fallades i el fet d’haver de canviar la peça? 4. Calcule E(X), E(Y), V(X), V(Y), COV(X,Y) Problema 6 Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Sea X una que toma el valor 0 si se no se añade azúcar al zumo de naranja envasado, y el valor 1 si se añade azúcar. Sea Y una variable que indica la sensación “azucarada” percibida por el consumidor (1: muy poco azucarado, 2: poco azucarado, 3: bastante azucarado, 4: muy azucarado). Después de efectuar estudios, se ha establecido que la función de probabilidad conjunta de X e Y viene dada por la siguiente tabla: Y 1 2 3 4 0 0,01 0,02 0,06 0,01 1 0,09 0,18 0,54 0,09 X 1. Obtengan las funciones de probabilidad marginales de X e Y. 2.¿Le parece que añadir o no azúcar está relacionado con la sensación “azucarada” que tiene el consumidor? Razone la respuesta. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.7 Variable Bernoulli y binomial Uso de las tablas n p 0.05 0.5 k 2 0 1 4 0 0.8145 1 0.9860 2 0.9995 =f(0)+f(1) 3 1.000 =0.9860 …. F(1)=P(X≤1) f(1)=F(1)-F(0) =0.9860-0.8145 X, binomial (4,0.005) Se lee en la tabla F(x) Prof. Lídia Montero i Mónica Bécue =0.1715 Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Problema 1. Ejemplos de lectura de la tabla. X ~B(4,0.05) 1. ¿Cuanto vale FX(2)? 2. Calcular fX(2) 3. Calculen P(1<X<3), P(1<X≤3), P(1≤X≤3) Problema 2 Se repite una experiencia de Bernoulli 4 veces de manera independiente. La probabilidad de acertar en una experiencia es igual a 0.15. Calculen: 1. Probabilidad de no acertar en ninguna experiencia 2. Probabilidad de tener sólo un acierto 3. Probabilidad de tener al menos 2 aciertos Problema 3 Se repite una experiencia de Bernoulli 4 veces de manera independiente. La probabilidad de acertar en una experiencia es igual a 0.85. Calculen: 1. Probabilidad de no acertar en ninguna experiencia 2. Probabilidad de tener sólo un acierto 3. Probabilidad de tener al menos 2 aciertos Problema 4 Se repite una experiencia de Bernoulli 10 veces de manera independiente. La probabilidad de acertar en una experiencia es igual a 0.80 Calculen: 1. Probabilidad de tener 3 aciertos o menos. 2 Probabilidad de tener al menos 3 aciertos 3 Probabilidad de tener exactamente 3 aciertos 4. Sea X la variable que cuenta el número de aciertos, calculen P(3<X<8), P(5<X≤9), P(2≤X≤6). Problema 5 Sea X una variable binomial de parámetros 8 y 0.1. Determinar el menor entero k tal que P(X>k) ≤1/100 Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Problema 6 Una pieza fabricada tiene la probabilidad 0.1 de ser inutilizable. ¿Cuál es el número mínimo de piezas que se debe fabricar para obtener al menos 5 piezas utilizables con una probabilidad ≥ 0.98 Problema 7 X ~Bernoulli (0.5), Y ~Bernoulli (0.5), X e E independientes Z=|X-Y| a) Determinene la ley de Z b) Calculen P (X=1∩Y=1∩Z=1) y deduzcan del resultado que X, Y y Z no son mutuamente independientes. c) Verifiquen que X, Y y Z son independientes dos a dos. Problema 8 Se controla a la fabricación de un determinado productos por lotes de 10 productos escogidos al azar. Se sabe que en media un 5% de los productos son defectuosos. Al azar se escoge un lote de 10 productos. Se rechaza el lote si hay 2 ó más artículos defectuosos. ¿Cuál es la probabilidad de rechazar el lote? Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.8 Tablas de contingencia Les taules de contingència s’usen per estudiar la independencia/ no independencia entre dues variables categòriques. Parte I Suposem que estudiem una mostra de n=400 electors, extractada de una població donada més amplia. Coneixem la seva ciutat de residència i el partit al qual han votat. Es a dir, s’han observat dues variables qualitatives sobre 400 individus. a. Se ha perdido la tabla que contiene los efectivos cruzados, el número nij de individuos con la modalidad i-ésima de la primera variable categórica (ciutat i) con la modalidad jésima de la segunda variable categòrica (partit j). Sólo se conoce la distribución marginal de las dos variables. En un primer tiempo, parece posible asumir la hipótesis de independencia entre las dos variables “partit votat” y “ciutat. Completen la tabla siguiente en función de esta hipótesis. PARTIT A CIUTA T B C TOTAL Ciutat-1 115 Ciutat-2 110 Ciutat-3 175 TOTAL 200 140 60 400 Notacions • nij pij = nij / n. Marges: • • ni⋅ = Σj nij n⋅ j = Σi nij pi⋅ = Σj pij p⋅ j = Σi pij Efectius esperats “sota la hipòtesi d’independència” Sota la hipòtesi d’independència, en la població: pij = pi . ⋅ p . j , es a dir, la funció de probabilitat conjunta es el producte de les marginals. Al observar n individus, s’espera observar nij = n. pij = n. pi . . p . j Els valors poblacionals pij, pi i pj son desconeguts. S’estimen pi i pj a partir de la mostra (per estimar pij, els efectius de cada submostra son massa petits) Prof. Lídia Montero i Mónica Bécue p̂i . = ni . n p̂ . j = n. j n Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Per tant, s’espera sota la hipòtesi d’independència, un efectiu de np̂i . . p̂ , j = ni . .n. j n individus en la cel·la i,j b. Después, se recupera la información perdida y se sabe que la verdadera tabla cruzada (o tabla de contingencia) es la siguiente: PARTIT CIUTA T TOTAL A B C Ciutat-1 40 55 20 115 Ciutat-2 60 35 15 110 Ciutat-3 100 50 25 175 TOTAL 200 140 60 400 ¿Qué se puede decir de la hipótesis de independencia? Parte II En lo que sigue, se va a ver algunas de las ideas a la base del razonamiento, porpiamente estadístico, que permite comparar los efectivos observados de una tabla de contingencia con los efectivos ”esperados bajo la hipótesis de independencia”. Se utiliza algunas herramientas ofrecidas por el Minitab. Per aix`, anem a estudiar la indepéndencia entre la variable ”yo leo” y ”en la escuela leemos” (en lectura.MTW). Comando Minitab La comanda Minitab TABLES permet aplicar les eines adequades per l’estudi de les taules de contingència. Les icones a seleccionar són Stat Tables CrossTabulation Estudiar la independència entre variable qualitatives (o categòriques) El objectiu es estudiar la independència de les dues variables categòriques i, en cas de no existir independència, donar una descripció de la dependència (atraccions entre modalitats de les dues variables/ repulsions entre modalitats de les dues variables). Lectura per files (o per columnes): comparació dels perfils-fila (y/o dels perfilscolumna) Si les variables son independents, els perfils-files son iguals en la població, poc diferents en la mostra. Per tant, fer la lectura per files (o la lectura per columnes segons lo que interessa) de la taula ens aporta informació sobre la independència. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori La subcomanda ROWPERCENT de la comanda TABLE s’usa per obtenir taules de freqüències per files (es a dir, de les files condicionades als seus totals). Si no hi ha relació (si hi ha independència), les files condicionades son iguals entre elles (i iguals a la marginal). Com es tracta d’una mostra, es considera que hi ha independència (en la població), si les files condicionades son molt semblants (en la mostra). Es podria, de forma simètrica, obtenir la taula de freqüències per columnes mitjançant la subcomanda COLPERCENT. Segons la aplicació, es privilegiará una de las dues eines. Comparació dels efectius esperats i dels efectius observats nij. Abans, s’han calculat els “efectius esperats”, però Minitab ens facilita aquests càlculs (chi-square analysis, above and expected frequency). Les cel·les que presenten una major discrepància entre els dos valors són les que més contribueixen a la dependència de les variables: • si la freqüència observada es més gran que la freqüència esperada, això indica que existeix atracció entre la modalitat i de la variable-fila i la modalitat j de la variablecolumna • si la freqüència observada es més petita que la freqüència esperada, això indica que existeix repulsió entre la modalitat i de la variable-fila i la modalitat j de la variablecolumna Si a totes les cel·les, el valor observat i el valor esperat d’observacions son raonablement semblants, aleshores es verifica la independència (no relació) entre les dues variables estudiades. A més a més, el Minitab calcula l’estadístic denominat χ2 (chi-square o chi-dos), mesura de la desviació a la independència. Aquest estadístic s’estudiarà en Estadística Matemàtica-2, per tomar una decisió sobre la independència/ dependència entre les dues variables. Es calcula a partir de les diferencies entre efectius observats i efectius esperats sota la hipòtesi de independència: χ 2 = ∑∑ i j n .n n ij − i . . j n n i . .n . j 2 n Evidentment, quan els efectius observats i esperats coincideixin, χ2=0; més se està lluny de la hipòtesi d’independència, més χ2 es gran. Es veurà, en Estadística Matemàtica-2, com decidir si el valor es significativament gran. El valor crític varia amb la grandària de la taula. Parte III Comenten los resultados obtenidos en la parte II Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.9 Variable Geométrica, binomial negativa y de Poisson Problema 1 El número de buques-tanques que llegan cada día a una determinada refinería sigue una distribución de Poisson con parámetro λ=2. Las actuales instalaciones portuarias permiten atender como máximo 3 buques al día. Si llegan más de 3 buques un mismo día, a partir del cuarto se desvían hacia otro puerto. 1. En un día determinado, ¿cuál es la probabilidad de tener que desviar uno o más buques tanques? 2. ¿En cuanto se deben aumentar las instalaciones actuales para permitir despachar todos los buques tanques al menos el 90% de los días? 3. ¿Cuál es el número esperado de buques-tanques que llegan al día? 4. ¿Cuál es el número más probable de buques-tanques que llegan diariamente? 5. ¿Cuál es el número esperado de buques-tanques que se atienden diariamente? 6. ¿Cuál es el número esperado de buques-tanques devueltos diariamente Problema 2 En esta centralita, se recibe un promedio de 5 llamadas de teléfono entre las 9h y las 10h de la mañana los días laborales. Calcular: 1. Probabilidad de que se produzca al menos 1 llamada entre las 9h y las 10h 2. Probabilidad de que se produzcan exactamente 2 llamadas entre las 9h y las 9h12mn 3. Probabilidad de que durante una semana laboral de 5 días, haya 2 días sin llamada entre las 9h y las 9h12mn Problema 3 Los días laborales, la llegada de los clientes a la ventanilla del banco sigue una ley de Poisson de tasa media 10 clientes cada hora entre las 8h y las 14h, horas de atención al público. 1. Calcular la probabilidad de que en una hora de atención al público lleguen menos de 5 clientes. Calcular la probabilidad de que en los 12 primeros minutos después de abrir no llegue ningún cliente. Lo mismo para los 12 últimos minutos antes de cerrar. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Problema 4 En una cierta carretera, el número de coches que pasan cada minuto sigue una ley de Poisson de tasa media 4. Un peatón que desea cruzar lo hace cuando ve que no va a pasar ningún coche en los próximos 20s. 1. Calcular la probabilidad de que no tenga que esperar 2. ¿Cuál es la ley que sigue el número de coches que tiene que dejar pasar antes de cruzar? Problema 5 Los pescadores de perla preciosa encuentran en media una perla cada 30000 ostras. A lo largo de una semana, un pescador pesca 6000 ostras. Calculen: 1. el número de perlas que espera obtener 2. la probabilidad de pescar al menos 1 perla Problema 6 Se tira un dado hasta obtener dos “6”. 1. Ley del número de tiradas, esperanza y varianza 2. Calculen la probabilidad de tener que hacer 6 tiradas Problema 7 En una determinada lotería, se gana con probabilidad 1/10 1. Se compran 20 billetes. Calculen la ley de la variable que cuenta el número de billetes ganadores. Calculen la esperanza y la varianza de esta variable. 2. Se repite la compra de un billete hasta ganar. Determinen la ley de la variable que cuenta el número de billetes comprados, su esperanza y su varianza. Problema 8 3 jugadores tiran una moneda equilibrada. Cada jugador para cuando obtiene “cruz”. Sea X: número de caras obtenidas por los jugadores cuando acaban el juego. Determinen la ley de X. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.10 Variable aleatoria continua. Variable uniforme. Variable exponencial, relación con la variable de Poisson Problema 1 Una variable aleatoria continua X puede tomar valores entre -1 y +1 a. sabiendo que fX(x) tiene la forma de un triangulo isócelo, determinar fX(x) b. Calculen P(X2<1/4∩X<1/4) c. Determinen la función de distribución de X, FX d. Determinen la función de distribución de |X| y su densidad de probabilidad Problema 2 La función de densidad de la variable X viene dada por la siguiente gráfica: fX(x) k 1 x a. ¿Cuál es el valor de k? b. Expresen la función de densidad y la función de distribución de X. c. Calculen P(1/3<X≤1/4) Problema 3 La vida d’un dispositiu electrònic del tipus A segueix una llei exponencial de mitjana 1000 hores. Calculeu la probabilitat que un dispositiu de tipus A duri almenys 1000 hores. Problema 4 Se está observando un componente electrónico. La duración de su vida se puede modelizar mediante una exponencial de parámetro λ=5 cuando se cuenta el tiempo en días. Sabiendo que lleva 50 días funcionando, calcular la probabilidad de que viva al menos 100 días más. Problema 5 En una hora cualquiera de la jornada laboral, la variable que cuenta el número de llamadas que llegan a una centralita telefónica es una variable de Poisson de parámetro λ =10. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Ahora, interesa estudiar la variable que mide al tiempo de espera entre dos llamadas, o desde la apertura, a las 9h, hasta la primera llamada. A partir de la función de probabilidad la variable que cienta el número de llamadas, determinar la ley deY la variable aleatoria “tiempo de espera” desde “0” hasta la primera llamada. El tiempo se cuenta en horas. Mostrar que la variable que cuenta el tiempo de espera a partir de cualquier instante hasta que se produzca una llamada tiene la misma distribución qye Y. Problema 6 El tiempo de vida T (en meses) de un semiconductor sigue una ley exponencial de media 500 meses. a) Calculen la probabilidad de que un semiconductor funcione más de 10 años. b) Si un semiconductor lleva funcionando 10 años, ¿cuál es la probabilidad de que funcione al menos 10 años más? c) El diseño de un circuito consta de 3 semiconductores independientes dispuestos en serie (falla el sistema si falla al menos uno de los elementos). Se define la variable aleatoria S como el tiempo de vida, en meses de este sistema. ¿Cuál es la probabilidad de que el sistema funcione más de 10 años? ¿Qué ley sigue la variable aleatoria S? Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.11 Variable Normal Tabla de la normal (0,1) En las tablas, se tiene siempre la función de distribución Z~N(0,1) z 0.00 …. 0.05 0.0 0.5000 0.5199 0.1 0.5398 0.5596 0.2 0.5793 0.5987 … 0.09 F(0.15)=0.559 0.3 3.4 Se lee en la tabla F(x) Prof. Lídia Montero i Mónica Bécue 0.9998 Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori Problema 1 Ejemplos de utilización de la tabla para una normal cualquiera. Sea la variable X~N(100, 25) 1. Cuanto vale FX(104) 2. Calcular x, tal que FX(x)=0.90 3. Cuanto vale FX(90) 4. Calcular x, tal que FX(x)=0.10 Problema 2 (en la lista: 2.42 El Tub de Rajos Catòdics) Els tubs de rajos catòdics d’una terminal gràfica tenen una fina malla darrera la superfície visible que s’ha de tensar durant l’ensamblatge. Si es tensa massa, la malla es desgarra, mentre que si no es tensa prou, s’hi formen arrugues. La tensió a la que es sotmet aquesta malla es pot mesurar en miliVolts (mV) mitjançant un dispositiu electrònic. Actualment, la lectura de la tensió de successius tubs es distribueix segons una llei normal N(µ=275,s=43). La tensió mínima acceptable per tal que la malla no s’arrugui és de 200 mV. La tensió màxima que suporten aquestes malles sense trencar-se és de 375 mV. ⇒ Calculeu la probabilitat que la malla s’arrugui ⇒ Si una malla s’ha arrugat, quina és la probabilitat que s’hi hagi aplicat una tensió inferior a 175mV ? ⇒ Quina és la probabilitat que una malla estigui en bones condicions ? ⇒ Quina és la probabilitat que entre 5 tubs almenys 3 d’ells tinguin la malla en bones condicions? ⇒ Sigui X la lectura de tensió en mV i µ = E(X). Quina és la tensió t tal que P(µ−t ≤X≤ µ+t) = 095 . ? Problema 3 (en la lista, 2.43 Vida de Dispositius Electrònics) La vida d’un dispositiu electrònic del tipus A segueix una llei exponencial de mitjana 1000 hores i la vida d’un dispositiu del tipus B segueix una llei normal de mitjana 1000 hores. La vida dels dispositius de tipus A pot considerar-se independent de la vida dels dispositius de tipus B. a. Calculeu la probabilitat que un dispositiu de tipus A duri almenys 1000 hores. b. Quina és la probabilitat que un dispositiu de tipus B duri almenys 60.000 minuts? c. Quin dispositiu escolliríeu? Per tal d’augmentar la fiabilitat d’un sistema que requereix d’un dispositiu electrònic es decideix de col·locar en paral·lel un dispositiu tipus A i un altre tipus B. d. Quina és la probabilitat que el sistema funcioni després de 1.000 hores? e. Quin és el valor de la variància de la vida d’un dispositiu del tipus B si se sap que la probabilitat que duri més de 500 hores és 0.9993. Problema 4 Una máquina se utiliza para fabricar barras de metal de 2 metros de longitud en media. Sea X la longitud (en metros) de una barra producida por dicha máqina. Se admite que X sigue una ley normal 1. Sabiendo que E(X2) = 4.01m2, calcular la desviación-tipo Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 2. ¿Cuál es la probabilidad de que una barra tenga una longitud superior a 2.2.m? ¿Cuál es la probabilidad de que una barra tenga una longitud comprendida entre 1.8m y 2.2m? 3. . ¿Cuál es la probabilidad de que una barra tenga una longitud comprendida entre 1.98m y 2.02m? 4. ¿Cuál es le valor máximo de la desviación-tipo que permita garantizar que el 95% de las barras tengan una longitud entre 1.98 y 2.02m? Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 5.12 Teoremas límites Problema 1. (en la lista, 3.2.14) Sea S la suma de los 100 errores. Cada error sigue una ley uniforma U(-1/2, +1/2) (de media 0 y varianza 1/12). S = E1 + E2+...Ei+...E100 con Ei U(-1/2,+1/2) e independientes Problema 2. (en la lista: 2.45, La Màquina d’Emplenar Caramels) Una màquina d’emplenar bosses de caramels diposita en cada bossa una quantitat en pes de caramels que pot considerar-se distribuït segons una llei normal, de manera que el 33% de bosses emplenades contenen més de 81.76 g de caramels i només el 0.6% de les bosses contenen un pes de caramels inferior a 69.96 g. Quin són els paràmetres que defineixen la variable aleatòria X, quantitat de caramels per bossa (en g)? Si es trien 10 bosses a l’atzar, quina és la probabilitat que 5 bosses pesin més de 80 g i 5 bosses menys de 80 g? Justificar la formulació. Si es trien 100 bosses a l’atzar, quina és la probabilitat de trobar-ne com a mínim 40 amb un pes superior a 80 g? Justificar la formulació. Problema 3. La comida navideña Un restaurador está encargado de preparar la comida navideña de 1200 clientes. Esta comida comporta 2 tipos de menú: A o B. La larga experiencia del restaurador le permite sabe que 1 persona sobre 3 escobe el menú A. El restaurado prevé a menús A y b menús B. ¿Qué valor mínimo debe dar a a para que haya una probabilidad inferior o igual a 0.1 de tener un número suficiente de menús A? Misma pregunta para b. Con estos valores mínimos, ¿cuál es la probabilidad de que el restaurador no pueda satisfacer las demandas de todos sus clientes? Problema 4. El viaje en tren Para llevar de excursión a los 1000 participantes en un congreso, se utilizan 2 trenes de la misma categoría. Cada participante puede escoger uno de los dos trenes, sin tener preferencia para uno u otro. ¿Qué número mínimo de asientos deberá comportar cada uno de estos trenes para que la probabilidad de que este mínimo sea insuficiente valga 1/5? Misma pregunta con 1/1000. Prof. Lídia Montero i Mónica Bécue Diplomatura d’Estadística Assignatura Càlcul de Probabilitats Programa de Pràctiques Laboratori 1. PRÁCTICAS ....................................................................................................................................... 3 2. ARXIU DE DADES ............................................................................................................................ 5 3. PROBABILIDAD Y ESTADÍSTICA: PREGUNTAS, PROBLEMAS Y SITUACIONES ......... 7 4. INTRODUCCIÓ AL PAQUET ESTADÍSTIC MINITAB ............................................................. 9 5. SESIONES ......................................................................................................................................... 13 5.1 5.2 5.3 5.4 5.5 INTRODUCCIÓN AL MINITAB: SIMULAR UN DADO ......................................................................... 13 COMBINATORIA Y PROBABILIDAD .................................................................................................. 15 PROBABILIDAD CONDICIONAL. TEOREMA DE BAYES ................................................................... 17 DISTRIBUCIÓN DE UNA VARIABLE EMPÍRICA. PARÁMETROS DE LA DISTRIBUCIÓN .................... 21 VARIABLE ALEATORIA DISCRETA: FUNCIÓN DE PROBABILIDAD, FUNCIÓN DE DISTRIBUCIÓN, ESPERANZA, VARIANZA, DESVIACIÓN-TIPO ............................................................................................. 25 5.6 PAR DE VARIABLES ALEATORIAS .................................................................................................... 28 5.7 VARIABLE BERNOULLI Y BINOMIAL ............................................................................................... 31 5.8 TABLAS DE CONTINGENCIA ............................................................................................................. 34 5.9 VARIABLE GEOMÉTRICA, BINOMIAL NEGATIVA Y DE POISSON ................................................... 37 5.10 VARIABLE ALEATORIA CONTINUA. VARIABLE UNIFORME. VARIABLE EXPONENCIAL, RELACIÓN CON LA VARIABLE DE POISSON .............................................................................................. 39 5.11 VARIABLE NORMAL....................................................................................................................... 41 5.12 TEOREMAS LÍMITES....................................................................................................................... 44 Prof. Lídia Montero i Mónica Bécue