Subido por alopez115

me P1 00

Anuncio
Conceptos previos, notaciones y recomendaciones para
Muestreo Estadı́stico. Ejemplos
1.
Conceptos previos INDISPENSABLES que hay que recordar
Generales
Conjunto o colección de elementos. Subconjunto. { }, ∈, ∀, ∃, ⊆, etc.
Conjunto de todos los subconjuntos de un conjunto U . Se denota por 2U . PRECAUCIÓN: Esto es sólo una notación. No confundir con una potencia numérica. Un conjunto con N elementos tiene 2N subconjuntos. Esto SÍ es una potencia. Por ejemplo,
un conjunto de 5 elementos tiene 32 subconjuntos, y un conjunto de 10 elementos
tiene 1024 subconjuntos.
Cardinal de un conjunto A. Es el número de elementos que contiene. Se denota |A|.
PRECAUCIÓN: Esto es una notación. No confundir con valor absoluto de un número.
Combinatoria
Permutaciones de N elementos. Hay N !.
Combinaciones de N elementos tomados de n en n. Hay,
N
n
!
=
N!
(N − n)!n!
Cálculo de Probabilidades
Variable aleatoria discreta, X. Toma o asume los valores x1 , x2 , . . . , xk , con probabilidades p1 , p2 , . . . , pk .
Esperanza matemática de una variable aleatoria discreta,
E[X] =
k
X
i=1
1
xi p i
2
Varianza de una variable aleatoria,
h
V [X] = E (X − E[X])2
i
y también,
h
i
V [X] = E X 2 − E 2 [X]
o sea, esperanza del cuadrado MENOS el cuadrado de la esperanza.
Covarianza entre dos variables aleatorias,
Cov[X, Y ] = E[XY ] − E[X]E[Y ]
es decir, esperanza del producto MENOS el producto de las esperanzas.
Si tenemos N variables aleatorias, Z1 , Z2 , . . . , ZN , la varianza de la suma es,
"N
X
V
#
Zi =
i=1
N
X
V [Zi ] +
i=1
XNX
Cov[Zi , Zj ]
i6=j=1
o sea, la suma de las N varianzas MÁS la suma de las N (N − 1) covarianzas.
Variable aleatoria de Bernoulli, Be(p). Su esperanza es p.
Variable aleatoria binomial, Bi(N, p). Su esperanza es N p. Su varianza es N p(1 − p).
Estadı́stica Descriptiva
Media aritmética de una serie estadı́stica o un conjunto de cantidades numéricas,
X1 , X2 , . . . , Xn ,
X=
n
1X
Xi
n i=1
PROPIEDAD:
n
X
(Xi − X) =
i=1
n
X
Xi − nX = nX − nX = 0
i=1
es decir, la suma de las diferencias entre un conjunto de valores y su media
aritmética es CERO
Varianza de una serie estadı́stica o un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn ,
σx2 =
n
n
1X
1X
2
(Xi − X)2 =
X2 − X
n i=1
n i=1 i
es decir, la media de los cuadrados MENOS el cuadrado de la media.
PRECAUCIÓN: no confundir con la varianza de una variable aleatoria, SON COSAS
DISTINTAS.
3
Covarianza de un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn , con otro Y1 , Y2 , . . . , Yn
σxy =
n
n
1X
1X
(Xi − X)(Yi − Y ) =
Xi Yi − X Y
n i=1
n i=1
es decir, la media de los productos MENOS el producto de las medias.
PRECAUCIÓN: no confundir con la covarianza de dos variables aleatorias, SON COSAS DISTINTAS.
Propiedades importantes que relacionan varianza y covarianza.
2
σx+y
= σx2 + σy2 + 2σxy
o sea, la varianza de la suma de dos series estadı́sticas es la SUMA de las varianzas
MÁS el doble de la covarianza.
2
σx−y
= σx2 + σy2 − 2σxy
es decir, la varianza de la diferencia de dos series estadı́sticas es la SUMA de las
varianzas MENOS el doble de la covarianza.
Cuasivarianza de una serie estadı́stica o un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn ,
s2x =
n
1 X
(Xi − X)2
n − 1 i=1
Es como la varianza, pero dividiendo por n − 1 en lugar de n.
Relaciones entre varianza y cuasivarianza.
s2x =
n
σ2
n−1 x
σx2 =
n−1 2
s
n x
Cuasicovarianza de un conjunto de cantidades numéricas, X1 , X2 , . . . , Xn , con otro
Y1 , Y2 , . . . , Yn
n
1 X
n
(Xi − X)(Yi − Y ) =
sxy =
σxy
n − 1 i=1
n−1
es decir, como la covarianza, pero dividiendo por n − 1 en lugar de n.
Propiedades importantes que relacionan cuasivarianza y cuasicovarianza.
s2x+y = s2x + s2y + 2sxy
o sea, la cuasivarianza de la suma de dos series estadı́sticas es la SUMA de las cuasivarianzas MÁS el doble de la cuasicovarianza.
s2x−y = s2x + s2y − 2sxy
es decir, la cuasivarianza de la diferencia de dos series estadı́sticas es la SUMA de las
cuasivarianzas MENOS el doble de la cuasicovarianza.
2.
4
Algunas notaciones
Para denotar probabilidad, emplearemos usualmente la notación P r y no P para evitar
confusiones con el parámetro proporción poblacional, que se estudia en muestreo y se
denota precisamente por P .
Para indicar números decimales, emplearemos muchas veces la coma superior, por
ejemplo 80 9877 ó 00 5433. Pero es posible que esta notación cambie en algunos sitios.
Por ejemplo, con la coma inferior 34, 567. Excel emplea la coma inferior. R emplea el
punto.
3.
Recomendación importante
El Muestreo Estadı́stico se basa en gran medida en el Cálculo de Probabilidades. Si no se
manejan bien los conceptos del Cálculo de Probabilidades, es imposible entender el Muestreo
Estadı́stico. Se recomienda pues un repaso de las asignaturas Cálculo de Probabilidades y
Teorı́a de la Probabilidad.
También es importante recordar muchos conceptos vistos en la asignatura Estadı́stica
Descriptiva.
4.
Ejemplos
4.1.
Parámetros estadı́sticos usuales
Consideremos la serie numérica, X, con valores 1, 3, 2, 4, 3, y la serie numérica Y , con
valores 2, 3, 5, 6, 1. Calculemos algunas de las cantidades que aparecen en este documento,
Medias
1
13
X = (1 + 3 + 2 + 4 + 3) =
= 20 6
5
5
1
17
Y = (2 + 3 + 5 + 6 + 1) =
= 30 4
5
5
Varianzas
1
σx2 = (12 + 32 + 22 + 42 + 32 ) − 20 62 = 10 04
5
1
σy2 = (22 + 32 + 52 + 62 + 12 ) − 30 42 = 30 44
5
Coeficiente de variación
√
CVx =
10 04
= 00 3922
20 6
√
CVy =
30 44
= 00 5455
30 4
5
Obviamente, Y presenta más dispersión que X.
Cuasivarianzas
s2x =
n
5
σx2 = × 10 04 = 10 3
n−1
4
s2y =
n
5
σy2 = × 30 44 = 40 3
n−1
4
Covarianza
1
σxy = (1 × 2 + 3 × 3 + 2 × 5 + 4 × 6 + 3 × 1) − 20 6 × 30 4 = 00 76
5
Cuasicovarianza
sxy =
n
5
σxy = × 00 76 = 00 95
n−1
4
Comprobación de propiedad de la media
n
X
(Xi −X) = (1−20 6)+(3−20 6)+(2−20 6)+(4−20 6)+(3−20 6) = −10 6+00 4−00 6+10 4+00 4 = 0
i=1
Esto es ESTADÍSTICA DESCRIPTIVA
4.2.
Variable aleatoria
Consideremos la variable aleatoria X con valores 1, 3, 7 y probabilidades respectivas
00 4, 00 4 y 00 2.
Esperanza
E[X] = 1 × 00 4 + 3 × 00 4 + 7 × 00 2 = 3
Varianza
E[X 2 ] = 12 × 00 4 + 32 × 00 4 + 72 × 00 2 = 130 8
V [X] = E[X 2 ] − E 2 [X] = 130 8 − 32 = 40 8
Esto es CÁLCULO DE PROBABILIDADES
Descargar