Conceptos previos, notaciones y recomendaciones para Muestreo Estadı́stico. Ejemplos 1. Conceptos previos INDISPENSABLES que hay que recordar Generales Conjunto o colección de elementos. Subconjunto. { }, ∈, ∀, ∃, ⊆, etc. Conjunto de todos los subconjuntos de un conjunto U . Se denota por 2U . PRECAUCIÓN: Esto es sólo una notación. No confundir con una potencia numérica. Un conjunto con N elementos tiene 2N subconjuntos. Esto SÍ es una potencia. Por ejemplo, un conjunto de 5 elementos tiene 32 subconjuntos, y un conjunto de 10 elementos tiene 1024 subconjuntos. Cardinal de un conjunto A. Es el número de elementos que contiene. Se denota |A|. PRECAUCIÓN: Esto es una notación. No confundir con valor absoluto de un número. Combinatoria Permutaciones de N elementos. Hay N !. Combinaciones de N elementos tomados de n en n. Hay, N n ! = N! (N − n)!n! Cálculo de Probabilidades Variable aleatoria discreta, X. Toma o asume los valores x1 , x2 , . . . , xk , con probabilidades p1 , p2 , . . . , pk . Esperanza matemática de una variable aleatoria discreta, E[X] = k X i=1 1 xi p i 2 Varianza de una variable aleatoria, h V [X] = E (X − E[X])2 i y también, h i V [X] = E X 2 − E 2 [X] o sea, esperanza del cuadrado MENOS el cuadrado de la esperanza. Covarianza entre dos variables aleatorias, Cov[X, Y ] = E[XY ] − E[X]E[Y ] es decir, esperanza del producto MENOS el producto de las esperanzas. Si tenemos N variables aleatorias, Z1 , Z2 , . . . , ZN , la varianza de la suma es, "N X V # Zi = i=1 N X V [Zi ] + i=1 XNX Cov[Zi , Zj ] i6=j=1 o sea, la suma de las N varianzas MÁS la suma de las N (N − 1) covarianzas. Variable aleatoria de Bernoulli, Be(p). Su esperanza es p. Variable aleatoria binomial, Bi(N, p). Su esperanza es N p. Su varianza es N p(1 − p). Estadı́stica Descriptiva Media aritmética de una serie estadı́stica o un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn , X= n 1X Xi n i=1 PROPIEDAD: n X (Xi − X) = i=1 n X Xi − nX = nX − nX = 0 i=1 es decir, la suma de las diferencias entre un conjunto de valores y su media aritmética es CERO Varianza de una serie estadı́stica o un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn , σx2 = n n 1X 1X 2 (Xi − X)2 = X2 − X n i=1 n i=1 i es decir, la media de los cuadrados MENOS el cuadrado de la media. PRECAUCIÓN: no confundir con la varianza de una variable aleatoria, SON COSAS DISTINTAS. 3 Covarianza de un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn , con otro Y1 , Y2 , . . . , Yn σxy = n n 1X 1X (Xi − X)(Yi − Y ) = Xi Yi − X Y n i=1 n i=1 es decir, la media de los productos MENOS el producto de las medias. PRECAUCIÓN: no confundir con la covarianza de dos variables aleatorias, SON COSAS DISTINTAS. Propiedades importantes que relacionan varianza y covarianza. 2 σx+y = σx2 + σy2 + 2σxy o sea, la varianza de la suma de dos series estadı́sticas es la SUMA de las varianzas MÁS el doble de la covarianza. 2 σx−y = σx2 + σy2 − 2σxy es decir, la varianza de la diferencia de dos series estadı́sticas es la SUMA de las varianzas MENOS el doble de la covarianza. Cuasivarianza de una serie estadı́stica o un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn , s2x = n 1 X (Xi − X)2 n − 1 i=1 Es como la varianza, pero dividiendo por n − 1 en lugar de n. Relaciones entre varianza y cuasivarianza. s2x = n σ2 n−1 x σx2 = n−1 2 s n x Cuasicovarianza de un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn , con otro Y1 , Y2 , . . . , Yn n 1 X n (Xi − X)(Yi − Y ) = sxy = σxy n − 1 i=1 n−1 es decir, como la covarianza, pero dividiendo por n − 1 en lugar de n. Propiedades importantes que relacionan cuasivarianza y cuasicovarianza. s2x+y = s2x + s2y + 2sxy o sea, la cuasivarianza de la suma de dos series estadı́sticas es la SUMA de las cuasivarianzas MÁS el doble de la cuasicovarianza. s2x−y = s2x + s2y − 2sxy es decir, la cuasivarianza de la diferencia de dos series estadı́sticas es la SUMA de las cuasivarianzas MENOS el doble de la cuasicovarianza. 2. 4 Algunas notaciones Para denotar probabilidad, emplearemos usualmente la notación P r y no P para evitar confusiones con el parámetro proporción poblacional, que se estudia en muestreo y se denota precisamente por P . Para indicar números decimales, emplearemos muchas veces la coma superior, por ejemplo 80 9877 ó 00 5433. Pero es posible que esta notación cambie en algunos sitios. Por ejemplo, con la coma inferior 34, 567. Excel emplea la coma inferior. R emplea el punto. 3. Recomendación importante El Muestreo Estadı́stico se basa en gran medida en el Cálculo de Probabilidades. Si no se manejan bien los conceptos del Cálculo de Probabilidades, es imposible entender el Muestreo Estadı́stico. Se recomienda pues un repaso de las asignaturas Cálculo de Probabilidades y Teorı́a de la Probabilidad. También es importante recordar muchos conceptos vistos en la asignatura Estadı́stica Descriptiva. 4. Ejemplos 4.1. Parámetros estadı́sticos usuales Consideremos la serie numérica, X, con valores 1, 3, 2, 4, 3, y la serie numérica Y , con valores 2, 3, 5, 6, 1. Calculemos algunas de las cantidades que aparecen en este documento, Medias 1 13 X = (1 + 3 + 2 + 4 + 3) = = 20 6 5 5 1 17 Y = (2 + 3 + 5 + 6 + 1) = = 30 4 5 5 Varianzas 1 σx2 = (12 + 32 + 22 + 42 + 32 ) − 20 62 = 10 04 5 1 σy2 = (22 + 32 + 52 + 62 + 12 ) − 30 42 = 30 44 5 Coeficiente de variación √ CVx = 10 04 = 00 3922 20 6 √ CVy = 30 44 = 00 5455 30 4 5 Obviamente, Y presenta más dispersión que X. Cuasivarianzas s2x = n 5 σx2 = × 10 04 = 10 3 n−1 4 s2y = n 5 σy2 = × 30 44 = 40 3 n−1 4 Covarianza 1 σxy = (1 × 2 + 3 × 3 + 2 × 5 + 4 × 6 + 3 × 1) − 20 6 × 30 4 = 00 76 5 Cuasicovarianza sxy = n 5 σxy = × 00 76 = 00 95 n−1 4 Comprobación de propiedad de la media n X (Xi −X) = (1−20 6)+(3−20 6)+(2−20 6)+(4−20 6)+(3−20 6) = −10 6+00 4−00 6+10 4+00 4 = 0 i=1 Esto es ESTADÍSTICA DESCRIPTIVA 4.2. Variable aleatoria Consideremos la variable aleatoria X con valores 1, 3, 7 y probabilidades respectivas 00 4, 00 4 y 00 2. Esperanza E[X] = 1 × 00 4 + 3 × 00 4 + 7 × 00 2 = 3 Varianza E[X 2 ] = 12 × 00 4 + 32 × 00 4 + 72 × 00 2 = 130 8 V [X] = E[X 2 ] − E 2 [X] = 130 8 − 32 = 40 8 Esto es CÁLCULO DE PROBABILIDADES