IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Tema 11 : Paràmetres mostrals 1 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 2 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 11.1 Introducció En l'Estadística es distingeixen dues parts perfectament diferenciades. Una d'elles es coneix amb el nom d'Estadística Descriptiva i té com objectiu la recollida, organització i anàlisi de dades; i obtenir a partir d'ells uns valors anomenats paràmetres, que els identifiquen, i a més permeten fer comparacions amb altres conjunts de dades i establir relacions entre ells. Una altra part de l'Estadística anomenada estadística inferencial tracta d'elaborar conclusions d'una població a partir de les dades recollides d'una part de la mateixa, anomenada mostra. La representativitat de la mostra serà important per a la fiabilitat de les conclusions. Les mostres preses en una població tenen una mitjana i una desviació típica que estan relacionades amb la mitjana i desviació típica de tota la població; i aquesta relació està basada en la distribució normal estudiada en el curs passat. Es deu al matemàtic francès Pierre Simon Laplace (1749 -1827) el descobriment de l'important paper que juga la distribució normal en la teoria de la probabilitat, i la primera demostració d'un teorema fonamental en estadística: el teorema central del límit. Les aplicacions de l'estadística inferencial abasten camps molt diversos. En Medicina s'empren per investigar els resultats de tractaments amb nous fàrmacs. En Sociologia es fan servir per fer enquestes d'opinió als contribuents. En Indústria, per millorar la qualitat dels productes amb els mètodes de control de qualitat i conèixer el grau d'acceptació dels consumidors. Aquesta unitat didàctica té com a objectius els següents: 1. Estudiar els conceptes bàsics de l'Estadística inferencial. 2. Establir relacions entre els paràmetres de la població i els obtinguts de la mostra. 3 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 11.2 Variables aleatòries Una variable els valors dels quals es determinen sobre els resultats d'un experiment aleatori s'anomena una variable aleatòria. Per exemple, en un col·legi de 300 alumnes, vam triar un alumne a l'atzar (experiment aleatori), anotem la seva edat (variable aleatòria discreta), mesurem la seva alçada (variable aleatòria contínua), vam registrar el nombre de germans que té (variable aleatòria discreta) i el seu pes (variable aleatòria contínua). Els valors d'una variable aleatòria discreta són nombres enters positius, els valors d'una variable aleatòria contínua són nombres reals compresos en un interval real. Les variables aleatòries es simbolitzen per una lletra majúscula com X o Y o Z. 11.2.1. Variables aleatòries discretes. Distribució binomial En les variables aleatòries discretes a cada valor x de la variable X se li associa la probabilitat que x passi, P [X = x]; aquesta associació es diu llei de probabilitat. Una distribució de probabilitat d'una variable aleatòria discreta és semblant a una distribució de freqüències d'una variable estadística, només que en compte de freqüències relatives tenim probabilitats. El curs passat vam estudiar les variables aleatòries discretes que segueixen la distribució binomial. Suposem un experiment aleatori que es pugui repetir indefinidament i que en cada prova només tingui dos resultats: Èxit (E) i fracàs (F). Experiments d'aquest tipus són: llençar una moneda, on únicament surt cara o creu; llençar un dau i observar si surt 5 o no, etc. Suposarem que p és la probabilitat d'èxit en cada prova i, per tant, 1-p serà la probabilitat de fracàs en cada prova. Si l'experiment es repeteix n vegades, a l'anotar els resultats, obtenim una paraula de longitud n formada per les lletres E i F E E F F F E E F E F F F E ... Quantes paraules d'aquest tipus contenen x vegades la lletra E? Això és equivalent a dir: si tenim n caixes, de quantes maneres diferents podem situar x lletres E, una per caixa? O, de quantes maneres podem triar x caixes entre n donades? Aquesta darrera pregunta o n . té una resposta coneguda, i és el nombre combinatori Cn,x ( x) Si ara ens preguntem quina és la probabilitat d'obtenir x èxits en n proves? O, quina és la probabilitat del succés Com que les proves són independents, la probabilitat no varia d'una a una altra prova, llavors: 4 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Com que hi ha paraules de longitud n amb x lletres E i cada paraula té una probabilitat de px · (1-p)n-x, definim una funció de probabilitat per a la variable aleatòria X, que compta el nombre d'èxits en n proves, així: Aquesta funció rep el nom de funció de probabilitat d'una distribució binomial de n proves amb probabilitat d'èxit p, simbòlicament B(n, p). A és a més, recordem que la mitjana i la desviació típica d'aquest tipus de distribució són: μ = n·p ; σ = √ n · p· q On q = 1 - p Exemple 1. En una ciutat, el 40% de l'alumnat que promocionen a batxillerat té suspesa alguna assignatura de 4t d'ESO. Es trien 6 alumnes de 1r de Batxillerat a l'atzar, quina és la probabilitat que la meitat dels alumnes seleccionats tingui alguna assignatura suspesa d'ESO? Solució: Es tracta de distribució binomial perquè: 1r) en cada prova hi ha dos únics resultats: tenir alguna assignatura suspesa o no 2n) el resultat de cada prova és independent de l'anterior 3r) la probabilitat de trobar un alumne amb algun suspens és constant p = 0,4. És, per tant, X = “Nombre d'alumnes de batxillerat amb alguna assignatura de 4t d'ESO suspesa” és una distribució binomial de paràmetres n = 6 i p = 0,4, X ~ B (6; 0,4) La meitat de 6 és 3, la probabilitat que ens demanem és: 5 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Exercicis 1. La probabilitat que un jugador de bàsquet faci cistella en els tirs lliures és 1/4. Si llança 6 tirs lliures, quina és la probabilitat que faci almenys 3 cistelles? 2. La probabilitat que un míssil arribi al seu objectiu és 0,8. Si es llancen 4 míssils, quina és la probabilitat que com a màxim dos d'ells donen en el blanc? 3. Cinc persones de 30 anys subscriuen una pòlissa de vida amb una companyia d'assegurances. Segons les previsions d'aquesta companyia, la probabilitat que una persona sana de 30 anys estigui viva dintre de 35 anys és 0,88. Calculeu la probabilitat que dins de 35 anys visquin: a) les 5 persones que han subscrit la pòlissa b) només 3 d'aquestes persones c) almenys 2 d'aquestes persones. Com pots observar-hi, el càlcul de probabilitats es pot complicar com posa de manifest el següent exemple: Una màquina fabrica pern. El 5 % són defectuosos. S'empaqueten en caixes de 400. Calcula la probabilitat que en una caixa n'hi hagi més de 30 defectuosos. En aquest exemple el càlcul de la probabilitat seria molt tediós i quasi impossible i, si en lloc de 400 unitats per caixa, empaquetem 2000, 3000, 4000 perns en cada caixa...el problema es torna impossible. Per tant, hi necessitem alguna tècnica per resoldre aquest tipus de problema. La solució passa per convertir la variable discreta amb distribució binomial en una variable contínua amb distribució normal. Però això ho veurem més endavant. Ara recordarem la distribució normal. 11.2.2. Variable aleatòria contínua. La distribució normal. Les variables aleatòries contínues es caracteritzen per que la probabilitat atribuïda a cada valor x de la variable aleatòria X és zero. Com s'atribueixen llavors probabilitats? Doncs, en comptes d'assignar probabilitats a cada valor determinat de X, es fa a intervals de valors de la variable, així: Com pots observar, es tracta de calcular una integral definida. Si l'extrem superior d'integració (b) fos igual a l'extrem inferior (a), la probabilitat seria 0. Per tant, totes les probabilitats del tipus P[X=k] = 0 per a variables amb distribució contínua. 6 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Com comentaven abans, d'aquesta manera, calcular probabilitats equival a calcular àrees com la de la regió ombrejada de la figura. Una variable aleatòria contínua, X, es diu que està normalment distribuïda o que segueix una distribució normal de mitjana μ i desviació típica σ, i es simbolitza per N(μ, σ), si la funció f(x) de l'integral és: Nota: No et preocupis que no farem integrals amb aquesta funció. Si X està normalment distribuïda, la probabilitat que X prengui un valor menor o igual que x, P [X ≤ x], és l'àrea de la regió ombrejada a la figura, sabent que l'àrea sota tota la corba és 1. El càlcul d'aquesta àrea es fa mitjançant una integral definida, però aquestes integrals estan tabulades per a N(0,1). És a dir, quan μ = 0, σ = 1 i Z ~ N (0, 1) Nota: La lletra Z està reservada per distribucions N(0,1) Alerta! La següent taula ens donarà únicament les probabilitats de la següent forma: P(Z ≤ k) quan k és major o igual que 0 (k ≥ 0) Si k ≥ 0 i Z ~ N (0, 1), podem calcular P(Z ≤ k) amb la taula N(0,1) i el designarem per Φ(k). És a dir que si escrivim Φ(k) és que podem fer el càlcul directament amb la taula N(0,1). Φ(k) = P(Z ≤ k) En els exemples següents recordem alguns casos que es poden presentar en el maneig de les taules de la N (0,1),que apareixen a continuació. 7 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 8 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Exemples 1. En una distribució normal N (0,1), trobar: a) P [Z ≤ 1,58]; b) P [Z ≥ 0,46]; c) P [Z ≤ - 1,79]; d) P [Z ≥ - 1,79]; e) P [0,89 ≤ Z ≤ 1,98]. Solució: a) P [Z ≤ 1,58] = 0,9429. El nombre 0,9429 apareix a la taula en la intersecció de la fila que comença per 1,5 i la columna que encapçala 0,08; i significa que el 94,29% dels valors de Z estan compresos entre -∞ i 1,58. b) P [Z ≥ 0,46] = 1- P [Z ≤ 0,46] = 1- 0,6772 = 0,3228. En la gràfica veiem que la probabilitat buscada correspon a l'àrea ombrejada i és igual a l'àrea total, 1, menys l'àrea de P [Z ≤ 0,46]. c) P [Z ≤ - 1,79] = P [Z ≥ 1,79] = 1 - P [Z ≤ 1,79] = 1- 0,9633 = 0,0367. En la gràfica observem que per simetria l'àrea P [Z ≤ - 1,79] és Igual que P [Z ≥ 1,79]. d) P [Z ≥ - 1,79] = P [Z ≤ 1,79] = 0,9633. Per simetria l'àrea de P [Z ≥-1,79] és igual que P [Z ≤ 1,79]. e) P [- 0,89 ≤ Z ≤ 1,98] = P [Z ≤ 1,98] - P [Z ≤ - 0,89] = P [Z ≤ 1,98] - (1 - P [Z ≤ 0,89]) = = P [Z ≤ 1,98] + P [Z ≤ 0,89] – 1 = 0,9761 + 0,8133 - 1 = 0,7894. 9 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 2.També ens podem plantejar els exercicis de forma inversa, és a dir, ens donem la probabilitat i nosaltres hem de trobar l’extrem o extrems de l’interval. Calcula el valor de k (exacta o aproximadament) en cada un dels casos següents: a) P [Z ≤ k] = 0,9761 k = 1,98 → b) P [Z ≤ k] = 0,12 En aquest cas, el valor 0,12 no està a la taula N(0,1). Per tant, el valor de k és negatiu. P [Z ≤ k] = P [Z ≥ -k] = 1 - P [Z ≤ -k] = 1 – 0,12 = 0,88 -k → ≈ 1,175 k → ≈ - 1,175 En aquest cas Φ(1,17) = P(Z ≤ 1,17) = 0,8790 i Φ(1,18) = P(Z ≤ 1,18) = 0,8810 tenen el mateix error (per defecte i excés) respecte 0,88. Per això agafem el terme mig entre 1,17 i 1,18 1,175 → c) P [Z ≥ k] = 0,12 P [Z ≤ k] = 0,88 → → Φ(k) = 0,88 → k ≈ 1,175 per les mateixes raons que hem explicat a l’apartat anterior. d) P [Z ≥ k] = 0,88 k ha de ser un valor negatiu P [Z ≤ -k] = 0,88 (-k serà un valor → → positiu) → Φ(-k) = 0,88 - → k ≈ 1,175 k ≈ -1,175 → 3. En una distribució N (0,1) calcula el valor de c que compleix la igualtat P [- c ≤ Z ≤ c] = P [| Z | ≤ c] = 0,95. Nota: | Z | és el valor absolut de Z. Solució: Segons la figura, l'àrea ombrejada a la dreta de c és Després de la igualtat P [Z ≤ c] = 0,95 + 0,025 = 0,975 obtenim a la taula que el valor de c que correspon a 0,975 és 1,96 és a dir, c = 1,96. 10 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Exercicis 4. Troba les probabilitats següents en una distribució N(0, 1): a) P[z > 2,8] b) P[z ≤ –1,8] c) P[z > –1,8] d) P[1,62 ≤ z < 2,3] e) P[1 ≤ z ≤ 2] f ) P[–0,61 ≤ z ≤ 1,4] g) P[–1 ≤ z ≤ 2] h) P[–2,3 < z < –1,7] i ) P[–2 ≤ z ≤ –1] 5. Calcula el valor de k (exacta o aproximadament) en cada un dels casos següents en una distribució N(0, 1): a) P[z ≤ k] = 0,5 b) P[z ≤ k] = 0,8729 c) P[z ≤ k] = 0,9 d) P[z ≤ k] = 0,33 e) P[z ≤ k] = 0,2 f ) P[z > k] = 0,12 g) P[z ≥ k] = 0,9971 h) P[z ≥ k] = 0,6 Per a calcular probabilitats P [X≤ x] amb variables contínues X~ N (μ, σ) amb distribució normal amb mitjana diferent de zero i desviació típica diferent d'1, hem de transformar la variable X en una altra que sigui N(0,1). En realitat, consisteix a canviar la variable X per Z, on . Aquesta transformació es diu tipificació de la variable, i es compleix que: Exemples 1. Si X és una variable aleatòria que segueix una distribució N (60,12), calcula P [X <65]. Solució: 2. Sabent que X és una variable aleatòria que segueix una distribució N (10,3) troba el valor de x en P [X <x] = 0,9761. Solució: Com que calculem el valor de z amb ajuda de les taules i resulta que a 0,9761 li correspon 1,98 Aleshores, z = 1,98. Com que variable), aïllant (Hem de desfer el canvi de x obtenim 11 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 3. Les estatures de 500 estudiants d'un col·legi es distribueixen normalment amb mitjana 148 cm i desviació típica 12 cm. Calcular quants estudiants no arriben als 160 cm i quants n'hi ha amb una estatura compresa entre els 140 i els 160 cm. Solució: Les estatures (X) es distribueixen segons una X ~ N (148, 12). En primer lloc, ens demanen , és a dir, el 84,13% dels estudiants no arriba als 160 cm. Com que el 84,13% de 500 és 0,8413 · 500 = 420,65, truncant la part decimal, podem dir que 420 estudiants no arriben als 160 cm d'alçada. En segon lloc, ens demanem És a dir, el 58,67% té una estatura en l'interval [140, 160] i com que 0,5867 · 500 = 293,35 hi ha 293 estudiants amb una estatura compresa entre els 140 i els 160 cm. Exercicis 6. La durada en anys de la placa base dels ordinadors d'una determinada marca segueix una distribució normal de paràmetres μ = 10 anys i σ = 2 anys. Calcular la probabilitat que la placa base duri més de 12 anys. 7. En una N (0,1) calcular els valors de z corresponents a: a) P [| Z | ≤ z] = 0,9 b) P [| Z | ≤ z] = 0,99 8. El 20% de les persones que concorren a una oposició poden aconseguir un lloc de treball en l'Administració. Les notes mitjanes finals dels exàmens de l'oposició es distribueixen segons una N (5,8 ; 2). Quina és la nota mitjana mínima que s'ha d'obtenir per aconseguir un lloc de treball? 9. Si la pressió sanguínia sistòlica dels individus d'una població A segueix una distribució normal N (127, 24), calcula: a) Quin percentatge d'individus d'A supera el valor 179? b) Quin percentatge d'individus d'A està per sota del valor 71,2? 12 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 10. La durada de cert tipus de motor és una variable normal, amb mitjana de 10 anys i desviació típica de dos anys. El fabricant garanteix el bon funcionament dels motors per un període de 13 anys. Quin percentatge de motors s'espera que compleixi la garantia? 11. En una distribució N(6; 0,9), calcula k perquè es donin les igualtats següents: a) P[x ≤ k] = 0,9772 b) P[x ≤ k] = 0,8 c) P[x ≤ k] = 0,3 d) P[x ≥ k] = 0,6331 11.3 Intervals característics d’una distribució normal Els intervals característics d'una distribució normal són intervals els extrems dels quals equidisten de la mitjana i la probabilitat és una quantitat determinada, generalment 0,90; 0,95 i 0,99. Si X té una distribució de mitjana , s'anomena interval característic corresponent a una probabilitat p, a un interval centrat en la mitjana: ( k , + k ) tal que: P[ k < X < + k] = p Interval característic en distribucions N(0,1) En una distribució normal N (0,1), com que la mitjana és zero, l’interval característic corresponent a una probabilitat p quedarà de la forma (- k , k ) tal que: P[ - k < Z < k ] = p k rep el nom de valor crític i la seva notació és za/2 →k=z a/2 Habitualment, p es designa com a 1 - → p = 1 - p = 1- - k k = za/2 /2 0 /2 Per tant, observem que la probabilitat dins de l’interval característic és de 1 - i fora de l’interval característic, la probabilitat serà de . Així a cada cua que hi queda als costats de l’interval característic la probabilitat serà de /2. Veiem un exemple de com calcular un interval característic. 13 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Exemple: 1. Trobeu l’interval característic d’una distribució normal N(0,1) corresponent a la probabilitat p = 1 - = 0,9 Si dins de l’interval hi ha un àrea de 0,9, fora d’aquest hi haurà 0,1. Ja que l’interval és simètric, l’àrea de cada una de les dues cues és de 0,05. Per tant: P[z > za/2] = 0,05 → P[z ≤ za/2] = 0,95 A la taula N(0,1) trobem Φ(1,64) = 0,9495 i Φ(1,65) = 0,9505 Per tant, assignarem a za/2 el valor mitjà dels valors 1,64 i 1,65 → za/2 = 1,645 D’aquesta manera, l’interval característic serà: (-1,645 ; 1,645) Principals valors crítics 1- /2 Z/2 0.900 0.050 1.645 0.950 0.025 1.960 0.990 0.005 2.575 Interval característic en distribucions N (,) En una distribució normal N (,) l'interval característic corresponent a una probabilitat p = 1- és: ( za/2 · za/2 · 14 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Exemples 1. En una distribució N(173, 6), troba els intervals característics per al 90%, el 95% i el 99%. Solució: Recordem que l’interval característic és: ( z a/2 · z a/2 · Per al 90%: za/2 = 1,645 (173 – 1,645 · 6 ; 173 + 1,645 · 6) = (163,13 ; 182,87) → Per al 95%: za/2 = 1,96 → (173 – 1,96 · 6 ; 173 + 1,96 · 6) = (161,24 ; 184,76) Per al 99%: za/2 = 2,575 → (173 – 2,575 · 6 ; 173 + 2,575 · 6) = (157,55 ; 188,45) 2. En una distribució N(18, 4), troba els intervals característics per al 95% i el 99,8%. Solució: Per al 95%: za/2 = 1,96 → (18 – 1,96 · 4 ; 18 + 1,96 · 4) = (10,16 ; 25,84) Per al 99,8%: 1 – = 0,998 → = 0,002 → /2 = 0,001 0,998 + 0,001 = 0,999 → → z/2 = 3,08 Aleshores, com que l’interval característic és ( z a/2 · z a/2 · → (18 – 3,08 · 4 ; 18 + 3,08 · 4) = (5,68 ; 30,32) Exercicis 12. En les distribucions normals els paràmetres de les quals es donen, troba l’interval característic que en cada cas s’indica: 13. En una distribució N (10, 4), obtén un interval centrat en la mitjana, (μ – k, μ + k), tal que P[μ – k < x < μ + k] = 0,90. 14. En una distribució normal de mitjana μ = 9,5 i variància 2 = 1,44, troba l’interval característic per al 99%. 11.4 Distribució de mitjanes mostrals 15 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Estem interessats, ara, en conèixer la mitjana de les despeses mensuals en alimentació de les llars d'un barri d’Eivissa. Tenim, doncs, una població: les llars d'un barri particular, i una variable aleatòria, X, que assigna a cada llar la quantitat de sous dedicada mensualment a l'alimentació. Volem trobar μ, valor mitjà d'aquesta variable aleatòria. Podem fer una estimació de μ a partir de la mitjana obtinguda d'una mostra aleatòria de la població, ¯x . És evident que aquest valor ¯x pot variar si prenem una altra mostra. Està clar que la mitjana ¯x , d'una mostra determinada, no correspon exactament amb la mitjana μ de la població. Hi ha alguna relació entre la mitjana de les mostres ¯x i la mitjana de la població μ? Sí que existeix. x Si prenem una mostra de grandària n de la població i calculem la mitjana mostral, ¯1, a continuació triem una altra mostra de la mateixa grandària n i calculem la seva mitjana x obtenim un altre nombre, ¯2; procedint de la mateixa manera fins triar k mostres diferents de la mateixa grandària n, obtenim una sèrie de k mitjanes mostrals. Considerant els valors de les mitjanes mostrals com una variable aleatòria que simbolitzarem per X¯ , estudiarem aquesta variable i la seva relació amb la variable X de les despeses mensuals en alimentació de la nostra població. A aquesta nova variable aleatòria X¯ es diu variable de les mitjanes mostrals i la X¯ sobre el conjunt de les mostres de grandària n es diu distribució de les mitjanes mostrals. Aquesta variable X¯ té una mitjana μ¯x i una desviació típica que simbolitzem per σ ¯x. Quina relació hi ha entre μ¯x i σ ¯x amb μ i σ, distribució dels valors de mitjana i desviació típica de tota la població? Es poden demostrar les afirmacions que segueixen: 1. Si la variable X segueix una distribució normal, N(μ, σ), llavors la variable aleatòria σ de la mitjanes mostrals, X̄ , segueix també una distribució normal N (μ, √ n). És a dir, σ té la mateixa mitjana que X, μ̄x = μ, i la seva desviació típica és menor, σ ̄x = √ n 2. Si la variable X segueix una distribució desconeguda o no és normal, i la grandària de σ la mostra és n ≥ 30, llavors X̄ segueix també una distribució normal N (μ, √ n) A la demostració de la segona afirmació es fa servir l'anomenat Teorema Central del Límit, un dels resultats més importants en estadística. Aquest teorema posa en relleu la importància de la distribució normal, que apareix associada a qualsevol distribució, tant si és normal com si no ho és, atès que la distribució de les mitjanes mostrals s'aproxima sempre a una distribució normal. 16 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Les dues afirmacions anteriors es poden resumir de la manera següent: σ Si X és N(μ, σ) → X¯ és N (μ, √ n) σ Si X no és normal o és desconeguda → X¯ és N (μ, √ n), quan n ≥ 30 Què hi passa quan n <30? Quan les mostres són petites, les coses es compliquen una mica més, no gaire, però no és un objectiu d'aquest curs. Exemples 1. En un servei d'atenció al client, el temps d'espera fins a rebre atenció és una variable aleatòria normal de mitjana 10 minuts i desviació típica 2 minuts. Es prenen mostres aleatòries del temps d'espera dels clients que arriben un dia concret. Es demana: a) Quina és la probabilitat que el temps mitjà d'espera d'una mostra de 25 clients no superi els 9 minuts? b) Quina és la distribució de la mitjana mostral, en prendre mostres aleatòries de 64 clients? Especificar els seus paràmetres. Solució: a) Les mostres de qualsevol grandària n, més o menys que 30, d'una població N (μ, σ) es σ distribueixen segons la normal N (μ, √ n). En aquest cas, n = 25 i X és una normal N(10,2); de manera que la distribució de X¯ de les mitjanes mostrals és una normal 2 N(10, √ 25) o N (10, 2/5). En conseqüència, hem de calcular: b) Si n = 64 la variable aleatòria de les mitjanes mostrals X¯ es distribueix segons la 2 normal N (10, √ 64 ) o N (10; 0,25), és a dir, amb μ = 10 i σ = 0,25. 2. S'admet que el perímetre cranial d'una certa espècie animal segueix una distribució normal amb σ = 12.8 cm. Es pren una mostra de 10 individus a l'atzar, quina és la probabilitat que la mitjana de la mostra ¯x , difereixi de μ, mitjana poblacional, 4.5 cm? 17 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Solució: Com X (perímetre cranial d'una certa espècie animal ) es distribueix segons una 12.8 normal N(μ; 12.8), X¯ es distribueix segons la normal N (μ; √ 10), independentment de la mida de la mostra. Hem de calcular P [ I X¯ -μ I ] ≥ 4,5. Tipifiquem la variable i tenim: 3. S'ha registrat el pes dels nounats d'una maternitat durant un any i s'ha observat que es distribueixen amb una mitjana μ = 3250 g i desviació típica σ = 250 g. Quina és la probabilitat que la mitjana d'una mostra de 100 nadons sigui superior a 3300 g? Solució: Desconeixem la naturalesa de la distribució de la variable X, que ens dóna els pesos dels nadons, però com la grandària de la mostra és n = 100, més gran que 30, 250 llavors la variable X¯ segueix una distribució normal N (3250, √ 100) = N (3250, 25). Hem de calcular: 4. En un examen tipus test de 100 preguntes, qualificat a 1 punt per pregunta correcta, les qualificacions es distribueixen amb una mitjana μ = 65 punts i desviació típica σ = 14 punts. Calcula la probabilitat que una mostra de 50 exàmens elegits a l'atzar tingui nota mitjana superior a 70 punts. Solució: Desconeixem la naturalesa de la distribució de la variable X, que ens dóna les qualificacions dels exàmens, però com que la grandària de la mostra és n = 50, més 14 gran que 30, llavors la variable segueix una distribució normal N (65; √ 50) = N (65; 1.97). Hem de calcular: 18 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Exercicis 15. Se suposa que la vida de les bombetes d'un determinat tipus segueix una distribució normal de mitjana 1000 hores i desviació típica 60 hores. Es pren una mostra a l'atzar de 225 bombetes i es calcula la mitjana. Quina és la probabilitat que aquesta mitjana sigui menor que 996 hores? 16. Les qualificacions de l'alumnat d'una prova d'accés a la universitat es distribueixen amb mitjana μ = 5,6 i desviació típica σ = 2,8. Si es tria una mostra de 40 individus presentats a la prova, quina és la probabilitat que la mitjana de la mostra sigui menor que 5? 17. Calcula la probabilitat que en extreure una mostra de grandària 60 d'una població que es distribueix normalment segons N (12, 5), la mitjana de la mostra estigui compresa entre 10 i 14. 18. El coeficient intel·lectual dels alumnes d'una determinada universitat segueix una normal N (95, 28). a) Calcula la probabilitat que la mitjana d’una mostra de 64 alumnes tingui un coeficient intel·lectual mitjà inferior a 92. b) Calcula la probabilitat que la mitjana de la mateixa mostra tingui un coeficient intel·lectual superior a 100. 19. Els paràmetres d’una variable són: μ = 16,4 i σ = 4,8. Ens disposam a extreure una mostra de n = 400 individus. a) Troba l’interval característic per a les mitjanes mostrals corresponents a una probabilitat p = 0,99. b) Calcula P[ 16 < X¯ < 17 ]. 20. El temps d’espera, en minuts, dels pacients en un servei d’urgències, és N(14, 4). a) Com es distribueix el temps mitjà d’espera de 16 pacients? b) En una mitjana jornada hi han atès 16 pacients. Quina és la probabilitat que el temps mitjà de la seva espera estigui comprès entre 10 i 15 minuts? 21. En una ciutat, l’altura dels seus habitants té una desviació típica de 8 cm. Si l’altura mitjana dels habitants fos de 175 cm, quina seria la probabilitat que l’altura mitjana d’una mostra de 100 individus presa a l’atzar fos superior a 176 cm? 22. L’estatura dels joves d’una ciutat segueix una distribució N(μ, σ). Si el 90 % de les mitjanes de les mostres de 81 joves estan en (173,4 ; 175,8), troba μ i σ. 19 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 11.5 Distribució de la diferència de mitjanes mostrals Suposem que volem estudiar una característica en dues poblacions diferents, diguem l'altura de l’alumnat a dues escoles. A la primera escola, la variable aleatòria X1, assigna un valor a l'altura de cada alumne-na, té una mitjana μ1 i desviació típica σ1. A la segona escola, la variable aleatòria X2, que ens dóna l'altura del alumnat, té una mitjana μ2 i desviació típica σ2, no necessàriament iguals a l'anterior. Sabem que la variable X¯1 de les mitjanes mostrals de X1, de mida n1, si n1 és prou gran o X1 és normal, segueix una distribució normal de mitjana μ1 i desviació típica σ1 √ n1 . És a dir, σ X¯1 ~ N (μ1, 1 √ n1). De la mateixa manera, la variable X¯2 de les mitjanes mostrals de X2, de mida n2, si n2 és prou gran o X2 és normal, segueix una distribució normal de mitjana μ2 i desviació σ típica 2 σ √ n2 . És a dir, X¯2 ~ N (μ2, 2 √ n2). Imaginem que prenem una mostra de la primera escola i una altra a la segona escola i calculem la diferència de les dues mitjanes mostrals. Si repetim l'operació diverses vegades (amb el mateix nombre d’individus a la primera escola n1 i el mateix nombre d’individus a la segona escola n2) , obtenim una sèrie de nombres que corresponen als valors d'una nova variable aleatòria que simbolitzem per X¯1−X¯2 Com es distribueix X¯1−X¯2? Doncs... , X̄1−X̄2 ~ N (μ1 - μ2 √σ 12 n1+σ22 n2) Això és el que es coneix com la distribució de la diferència de dos mitjanes mostrals. Exemples 1. Se sap que el pes de tots els al·lots de 5è curs a una escola de primària segueix una distribució normal de mitjana μ1 = 45 kg i σ1 = 7,5 kg , mentre que el pes de les al·lotes, del mateix nivell educatiu, es distribueix també normalment amb mitjana μ2 = 40 kg i σ2= 6,9 kg. Si la variable X¯1 ens dóna les mitjanes mostrals del pes de les mostres de 20 al·lots i X¯2 les mitjanes mostrals de mostres de 18 al·lotes, trobar la probabilitat que el pes mitjà d'una mostra de al·lots superi en 5 kg o més al pes mitjà d'una mostra de les al·lotes. Solució: 20 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Sabem que μ1 = 45 kg i σ1 = 7,5 kg, i que μ2 = 40 kg i σ2 = 6,9 kg. A més, n1 = 20 i n2 = 18 i volem calcular la probabilitat següent: P [ X¯1−X¯2 ≥ 5 ] Sabem que , X¯1−X¯2 ~ N (μ1 - μ2 √σ 12 n1+σ22 n2). En aquest cas ~ N (5 ; 2,3) Per tant, la probabilitat demanada és del 50 %. Exercicis 23. Els llums de baix consum de la marca A tenen una vida mitjana de 12000 hores i una desviació típica de 450 hores, mentre que els llums del mateix tipus de la marca B tenen una vida mitjana de 11200 hores amb una desviació de 650 hores. Trobar la probabilitat que una mostra de 36 llums de la marca A tingui una vida mitjana superior en més de 500 hores a la vida mitjana d'una mostra de 40 llums de la marca B. 11.6 Distribució de la suma de tots els individus de la mostra Algunes vegades fa falta tenir un control de la suma de tots els individus de la mostra i per tant he de saber com és el comportament de la distribució de la suma de la suma dels individus. n xité una distribució normal , podem deduir que amb mitjana n xi=n·¯x Ja que ∑ i=1 n·μ i desviació típica n·σ√ n=σ ·√ n ∑ i=1 ∑ i=1 xi és N( n·μ , σ ·√ n ) n Per tant, podem calcular la probabilitat que la suma dels elements d’una mostra estigui, a priori, en un cert interval. Exemple 1. Els sous, en euros, dels empleats d’una fàbrica es distribueixen N(1200,400). Se’n tria a l’atzar una mostra de 25. Quina és la probabilitat que la suma dels seus sous sigui superior a 35000 €? La suma dels sous segueix una distribució normal de mitjana: n·μ = 25·1200 = 30000 € i la seva desviació típica és: σ ·√ n=400 ·√ 25=400· 5=2000 € 21 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals n ∑ i=1 xi és N(30000 , 2000) Per tant, Exercicis 24. El pes dels cans adults d’una determinada raça és una variable aleatòria que es distribueix normalment amb una mitjana de 7,4 kg i una desviació típica de 0,6 kg. Si consideram mostres de 30 d’aquests animals: a) Quina és la distribució de la mitjana mostral, X¯ ? b) Calculeu P[6,5 < X¯ < 7,5] c) Quina és la distribució de la suma dels pesos dels 30 animals de les mostres? n d) Calculeu P[ xi > 225] ∑ i=1 25. Se suposa que el pes mitjà de les síndries d’una determinada varietat segueix una distribució normal amb μ = 6 kg i σ = 1 kg. Si empaquetam les síndries en caixes de 8 unitats: a) Troba la probabilitat que la mitjana dels pesos de les síndries d’una caixa sigui menor que 5,5 kg. b) Calcula la probabilitat que entre les 8 síndries d’una de les caixes pesin més de 50 kg. 11.7 La distribució binomial s'aproxima a la normal Com vàrem comentar a l’apartat 11.2.1 d’aquest tema, a mesura que n es fa molt gran, la distribució binomial s’aproxima molt a una distribució normal. Aquí tenim un exemple amb p = 0,5 i n = 10 i n = 30. S’observa com la distribució binomial discreta, cada vegada, es més similar a la corba de la distribució normal, que és una distribució contínua. 22 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals I quan podem dir que l’aproximació de la normal a la binomial és prou bona? Una distribució binomial es pareix a una normal molt més com més gran és el producte n·p (o n·q si q < p) Si n·p 3 i n·q 3 -----> L'aproximació és bastant bona Si n·p 5 i n·q 5 -----> L'aproximació és quasi perfecta B(n , p)≈N (n · p , √ npq) En l'aproximació d'ambdues distribucions cal tenir en compte que la binomial és discreta i la normal, contínua. I què vol dir això? Teníem un problema a l’hora de calcular probabilitats amb la distribució binomial si n era molt gran, i la distribució normal ha solucionat aquest problema però hem de pagar un preu. No és gratis!! Entre altres coses, a una distribució binomial P(X=3) no és zero però si volem calcular P(X’=3) per a una distribució normal, aquesta probabilitat és zero. Hem de fer una «rectificació» o «correcció» per tal d’obtenir la probabilitat demanada. El problema consisteix en aproximar un àrea a una longitud. Cosa que sembla una mica incomprensible ;) El que fem és agafar un àrea sota la corba que representa la probabilitat de la variable normal, de tal manera que sigui aproximadament igual a l'altura de la barra de la probabilitat corresponent a la variable binomial L'àrea de la part verda, de base 1, és aproximadament igual a la longitud de la “longitud” de la barra vermella 23 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Càlcul de probabilitats en una binomial mitjançant l'aproximació a la normal Si n·p⩾5 i n·q⩾5 ⇒ X∼B(n , p) → X '∼N (n·p , √ npq) P[ X =k ]=P[k−0,5< X ' <k +0,5] P[a⩽X <b]=P[a−0,5< X ' <b−0,5] P[a< X⩽b]=P[a+0,5< X ' <b+0,5] Exemple 1. La variable x és binomial, amb n = 1 200 i p = 0,008. a) Calcula la probabilitat que x sigui major que 10. b) Troba l’interval característic per a una probabilitat del 95%. Solució: Com que podem aproximar mitjançant una distribució normal de mitjana i desviació típica: B(n , p)≈N (n·p , √ npq) a) Podeu observar que hem rectificat la probabilitat al passar d’una variable discreta (binomial) a una variable contínua (normal) i després hem tipificat. b) Per una probabilitat del 95% → z a/2 = 1,96 i per tant, l’interval característic serà , és a dir Exercicis 26. Si tenim un dau correcte i el llançam 50 vegades: a) Quina és la probabilitat que “l’1” surti més de 10 vegades? b) Quina és la probabilitat que surti “múltiple de 3” almenys 20 vegades? 27. En un sac mesclam fesols i mongetes en la relació de 14 fesols per cada mongeta. N’extreim un grapat de 100 llavors. a) Quina és la probabilitat que la proporció de mongetes estigui entre 0,05 i 0,1? b) Troba un interval per al 99% de les proporcions de les mostres de grandària 100. 28. El 42% dels habitants d’un municipi és contrari a la gestió de l’alcalde i la resta en 24 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals són partidaris. Si es pren una mostra de 64 individus, quina és la probabilitat que guanyin els que s’oposen a l’alcalde? 29. La probabilitat que un nadó sigui nin és 0,515. Si han nascut 184 infants, quina és la probabilitat que hi hagi 100 nins o més? Troba l’interval característic corresponent al 95% per a la proporció de nins en mostres de 184 nadons. 11.8 Distribució de les proporcions mostrals Si en fer l'estudi d'una característica d'una població ens trobem que la variable únicament pot prendre dos valors: èxit o fracàs, la població que tractem d'estudiar segueix una distribució binomial, però quan el nombre de proves és gran aquesta binomial es pot aproximar per una normal. Considerem llavors una població nombrosa de N individus; per exemple, tots els professors de matemàtiques de les Illes Balears i una característica: ser seguidor de l'Atlètic de Madrid; i interroguem a cada professor si és, o no, seguidor de l'Atlètic. Sigui nA el nombre de respostes afirmatives, llavors el quocient ens dóna la proporció poblacional o percentatge poblacional de seguidors de l'Atlètic entre els professors de matemàtiques de les Illes Balears. Imaginem que de l'esmentada població prenem una mostra de grandària n, diguem-ne M1, i calculem la proporció de atlètics: p1=n1 . Si a continuació obtenim totes les n mostres possibles, de grandària n, M2, M3, M4 … llavors veurem que les proporcions de atlètics p2=n2 n, p4=n4 una altra. n, p3=n3 n… variaran d'una mostra a Totes aquestes proporcions p1, p2, p3, ... són valors d'una nova variable aleatòria que anomenarem proporció mostral i simbolitzarem per pr. Aquesta variable al seu torn tindrà una mitjana μpr i una desviació típica σpr . Quina relació tenen la mitjana i la desviació típica de la proporció mostral amb la proporció poblacional p? Es pot demostrar la següent afirmació per a la distribució de les proporcions mostrals: Si una població nombrosa té una proporció poblacional p d'una determinada característica, llavors la variable aleatòria pr, de les proporcions mostrals extretes d'aquesta població, quan la mida de la mostra és prou gran (n ≥ 30), s'aproxima a una = p·(1−p) distribució normal de mitjana μpr = p i desviació típica σpr √ n; és a dir, pr es distribueix segons una N( p, √p·(1−p) n) pr ~ N( p, √p·(1−p) n) Nota important: La proporció pr és una variable discreta. Per calcular probabilitats de pr (i intervals característics) s'haurien de fer les correccions corresponents al pas a una contínua. No obstant això, per no complicar el procés, tractarem pr com si fos contínua. Exemples 25 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 1. A una empresa fuma el 40 % dels seus treballadors. Si triem una mostra de 30 persones, quina és la probabilitat que la proporció de fumadors sigui major que el 50 % ? Solució: La mostra és de grandària n = 30 i la proporció de fumadors és p = 0,4, per tant les proporcions mostrals pr es distribuiran com pr ~ N( p, p·(1−p) √ n) = N( 0,4 ; √0,4 ·0,6 30) = N(0,4 ; 0,089) Nota: ^p=pr 2. En unes eleccions municipals la llista de l'alcalde va sortir amb el 35% dels vots. Si abans de les eleccions es hagués fet un sondeig amb una mostra de 400 veïns, quin hauria estat, si es manté la mateixa intenció de vot, la probabilitat d'obtenir menys del 30% dels vots per a la citada llista? Solució: Grandària de la mostra n = 400 i p = 0,35 i per tant, pr segueix la següent distribució: Hem de calcular: Per tant, únicament al 1,5 % de les mostres s’obtindrien menys del 30 % dels vots Exercicis 30. En una determinada població el 20% dels seus habitants fa servir ulleres graduades. Prenem una mostra de 256 persones, quina és la probabilitat que el percentatge de persones de la mostra que fan servir ulleres graduades estigui entre el 15% i el 25%? 31. Una vacuna contra certa malaltia immunitza al 95% de les persones que se la posen. Si triem una mostra de 64 persones, quin és la probabilitat que la proporció de gent immunitzada a posar-se la vacuna sigui menor que el 92%? 26 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 32. Se sap que el 30% dels estudiants d'una universitat no fa mai “botellón”. Es pren una mostra de 200 estudiants d'aquesta universitat i es demana calcular la probabilitat que més de les tres quartes parts dels estudiants de la mostra faci alguna vegada “botellón”. 33. Com sabem, en un dau correcte la proporció de vegades que surt el 5 és 1/6. Troba cada un dels intervals característics corresponents al 90%, 95% i 99% per a la “proporció de cincs”, en tandes de 100 llançaments d’un dau correcte. 34. Calculeu com es distribueixen les proporcions mostrals, pr, per a les poblacions i les mostres que es descriuen a continuació: 35. Troba els intervals característics per a les proporcions mostrals de l’exercici anterior, corresponents a les probabilitats que, en cada cas, s’indiquen: a) 90% b) 95% c) 99% d) 95% e) 99% f) 80% 36. Quatre de cada deu habitants d’una determinada població llegeix habitualment el periòdic Z. Troba l’interval característic (per al 95%) de la proporció que llegeixen el periòdic Z, en mostres de grandària 49. 37. Un estudi realitzat per una companyia d’assegurances d’automòbils estableix que una de cada cinc persones accidentades és dona. Si es comptabilitzen, generalment, 169 accidents cada cap de setmana: a) Quina és la probabilitat que, en un cap de setmana, la proporció de dones accidentades superi el 24%? b) Quina és la probabilitat que, en un cap de setmana, la proporció d’homes accidentats superi el 85%? c) Quin és, generalment, el nombre esperat d’homes accidentats cada cap de setmana? 38. En una població, la proporció d’individus que tenen una certa característica C és 0,32. a) Com es distribueixen les possibles proporcions pr d’individus que tenen la característica C en mostres de 200 individus? b) Troba l’interval característic de pr corresponent al 95%. c) Calcula la probabilitat que en una mostra la proporció sigui menor que 0,3. 39. Se sap que el 10% dels habitants d’una ciutat determinada va regularment al teatre. Es pren una mostra a l’atzar de 100 habitants d’aquesta ciutat. Quina és la probabilitat que, almenys, un 13% d’ells vagi regularment al teatre? 27 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Exercicis de Selectivitat 1. Setembre 2015 Una empresa dedicada a l’elaboració de productes derivats del blat de moro té una determinada màquina que envasa els grans de blat de moro en bosses que segueixen una distribució normal amb μ = 250 g i σ = 25 g. Les bosses s’empaqueten en capses (paquets) de 200 unitats. a) Determinau la distribució de les mitjanes de les mostres. b) Calculau la probabilitat que la mitjana dels pesos de les bosses d’un paquet sigui més petita que 245 g. c) Calculau la probabilitat que una capsa de 200 bosses pesi més de 51 kg. Nota: Si es necessita als càlculs aproximau √2 ≈ 1.4142. 2. Juny 2015 L'alçada mitjana dels joves de 20 anys d'un poble segueix una distribució normal de mitjana 174 cm i desviació típica 10 cm. Es tria una mostra aleatòria simple de 144 joves. Sigui ̄x la mitjana mostral de les alçades observades. a) Quines són la mitjana i la variància de la variable aleatòria x̄ ? b) Quina és la probabilitat que l'alçada mitjana de la mostra estigui compresa entre 173 cm i 175 cm? 3. Juny 2014 El quocient intel·lectual d’uns alumnes universitaris es distribueix normalment amb una mitjana de 100 i una desviació típica de 10. a) Es tria una persona a l’atzar. Calculau la probabilitat que el seu quocient intel·lectual es trobi entre 98 i 103. b) Es tria una mostra de vint-i-cinc persones a l’atzar. Trobau la probabilitat que la mitjana dels seus quocients intel·lectuals es trobi entre 98 i 103. 4. Setembre 2013 28 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals 5. PBAU juny 2018 6. PBAU juny 2021 El pes de les persones d'un col·legi major segueix una llei normal de mitjana 70 kg i desviació típica 15 kg. Si escollim a l'atzar una persona del col·legi, calculau la probabilitat dels següents esdeveniments: a) El seu pes sigui superior a 80 kg. (3 punts) b) El seu pes sigui inferior a 50 kg, (3 punts) c) Pesi entre 60 i 120 kg. (4 punts) 29 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals Recordeu: - Distribució binomial de n proves amb probabilitat d'èxit, simbòlicament s'expressa així: - Si X és una variable amb distribució normal de mitjana μ i desviació típica σ, X ~ N (μ, σ), la probabilitat que X prengui un valor menor o igual que x, P [X ≤ x] correspon a l'àrea de la regió ombrejada a la figura. El càlcul d'aquesta àrea es fa mitjançant una integral definida i totes aquestes àrees estan tabulades per a N (0,1). Trobem P [X ≤ x] canviant la variable X per Z que és N (0,1) (tipifiquem), on i per tant: - Interval característic en distribucions N (,) En una distribució normal N (,) l'interval característic corresponent a una probabilitat p = 1- és ( z a/2 · z a/2 · - Distribució de mitjanes mostrals Si la variable X segueix una distribució normal, N(μ, σ), llavors la variable aleatòria de la σ mitjanes mostrals, X̄ , segueix també una distribució normal N (μ, √ n). És a dir, té la σ mateixa mitjana que X, μ¯x = μ, i la seva desviació típica és menor, σ ¯x = √ n Si la variable X segueix una distribució desconeguda o no és normal, i la grandària de la σ mostra és n ≥ 30, llavors X¯ segueix també una distribució normal N (μ, √ n) 30 IES Sa Colomina – Departament de Matemàtiques – Matemàtiques aplicades a les CCSS II – Tema 11: Paràmetres mostrals - Distribució de la diferència de mitjanes mostrals , X¯1−X¯2~ N (μ1 - μ2 √σ 12 n1+σ22 n2) - Distribució de la suma de tots els individus de la mostra n σ ·√ n ) ∑ i=1 xi és N( n·μ , - La distribució binomial s'aproxima a la normal Una distribució binomial es pareix a una normal molt més com més gran és el producte n·p (o n·q si q < p) Si n·p 3 i n·q 3 -----> L'aproximació és bastant bona Si n·p 5 i n·q 5 -----> L'aproximació és quasi perfecta B(n , p)≈N (n·p , √ npq) - Distribució de les proporcions mostrals Si una població nombrosa té una proporció poblacional p d'una determinada característica, llavors la variable aleatòria pr, de les proporcions mostrals extretes d'aquesta població, quan la mida de la mostra és prou gran (n ≥ 30), s'aproxima a una = p·(1−p) distribució normal de mitjana μpr = p i desviació típica σpr √ ; és a dir, pr n es distribueix segons una N( p, p·(1−p) √ ) n pr ~ N( p, √p·(1−p) n) 31