2-1 Inferencia estadistica II (Teoría de muestras. Distribuciones muestrales) 1. Muestreo 1.1. Definiciones Población. Conjunto homogeneo de personas, animales o cosas sobre el que se va a realizar un estudio. Individuo: Cada uno de los elementos de la población. Muestra: Parte de una población, elegida convenientemente, para estudiar unos caracteres determinados de esta. Tamaño de la muestra: Número de elementos que la forman. Muestreo: Procedimiento de selección de los individuos, que dentro de la población, compondrán la muestra. 1.2. Tipos de muestreo Atendiendo a la manera de elegir los elementos de la muestra, podemos distinguir entre muestreo aleatorio y muestreo no aleatorio. Centrándonos en el primer caso, podemos encontrarnos las siguientes alternativas de muestreo aleatorio (cada individuo tiene las mismas posibilidades de ser elegido): • Muestreo aleatorio simple: se toman n elementos al azar. Todos los elementos de la población tienen la misma probabilidad de ser elegidos para formar parte de la muestra. • Muestreo aleatorio estratificado: La población se divide en grupos homogéneos que llamamos estratos, y posteriormente se extrae una muestra aleatoria simple de cada estrato. • Muestreo aleatorio sistemático: Se selecciona al azar un elemento de la población y a partir de él se seleccionan de k en k los elementos siguientes. • Muestreo por conglomerados: Se divide la población en distintas secciones o conglomerados. Se eligen al azar unas pocas de estas secciones y se toman todos los elementos de las secciones elegidas para formar la muestra. 2. Distribuciones muestrales La inferencia estadística persigue establecer propiedades de las poblaciones a partir de las observadas en las muestras. Normalmente nos interesa una característica numérica que constituye una variable aleatoria y a la que nos referimos como población. Las características descriptivas de la población, como son la media y la varianza, se llaman parámetros y su estimación es el objetivo de la inferencia paramétrica. Otro aspecto de interés en las Mat. Aplic. CC.SS. II – Curso 2011-2012 Angel Vallelado – www.angelv.es 2-2 poblaciones es la manera en que sus valores están distribuidos, lo que viene dado por la función de densidad se la variable es continua o la función de probabilidad si es discreta. Este aspecto de las poblaciones suele ser desconocido y el comprobar si se ajusta a un modelo de distribución determinado es otro problema de estimación, llamado inferencia no paramétrica. La inferencia paramétrica se divide en dos categorías generales que son la estimación y el contraste de hipótesis. Existen algunas variables aleatorias asociadas a muestras, llamadas estadísticos, y de las cuales es posible determinar su distribución para realizar estimaciones. A continuación se describen las distribuciones muestrales asociadas a la proporción, la media, las sumas muestrales y la diferencia de medias. Las muestras se consideran grandes si n es superior a 30. 2.1. Distribución en el muestreo de una proporción En una población, el valor de la proporción (p) de una determinada población es desconocido, $ ) mediante la observación de una muestra aleatoria pero podemos aproximarlo ( p $ dan lugar a una variable aleatoria que representamos por P y que Los distintos valores de p llamaremos estadistico. se llama distribución muestral de una proporción con los La distribución de los valores de P siguientes parámetros: • Media: µ = p • Desviación típica: σ = • se aproxima a la normal, siempre que p no se A medida que n crece, la distribución de P acerque ni a 0 ni a 1 p(1 − p ) n 2.2. Distribución en el muestreo de la media En una población, el valor de la media poblacional ( µ ) y de la desviación tipica poblacional ( σ ) de una determinada población son desconocidas, pero podemos aproximarla mediante la observación de una muestra aleatoria hallando la media muestral ( x ) y la desviación típica muestral (s) Los distintos valores de x dan lugar a una variable aleatoria que representamos por X y que llamaremos estadistico. La distribución de los valores de X se llama distribución muestral de las medias muestrales con los siguientes parámetros: • Media: µ • Desviación típica: σ n Mat. Aplic. CC.SS. II – Curso 2011-2012 Angel Vallelado – www.angelv.es 2-3 • A medida que n crece, la distribución de X se aproxima a la normal. normal • Si σ es desconocida y n ≥ 30, se sustituye por s. 2.3. Distribución de las sumas muestrales En una población se quiere estudiar la suma de un número determinado de valores, el valor de la media poblacional de esta suma ( µ ) y de la desviación tipica poblacional de esta suma ( σ ) de una determinada población son desconocidas, pero podemos aproximarla mediante la observación de una muestra aleatoria hallando la suma media muestral (t) y la desviación típica muestral de la suma (s) Los distintos valores de t dan lugar a una variable aleatoria que representamos por T y que llamaremos estadistico. La distribución de los valores de T se llama distribución muestral de las sumas muestrales con los siguientes parámetros: • Media: n µ • • Desviación típica: σ n A medida que n crece, la distribución de T se aproxima a la normal. 2.4. Distribución de la diferencia de medias En una población se quiere estudiar la diferencia entre las medias de 2 valores, el valor de la media poblacional de cada valor ( µ1 y µ2 ) y de la desviación tipica poblacional de cada valor ( σ 1 y σ 2 ) de una determinada población son desconocidas, pero podemos aproximarla aproxim mediante la observación de dos muestras aleatorias de tamaño n1 y n2 hallando sus medias y la diferencia de sus medias. Los distintos valores de x1 − x2 dan lugar a una variable aleatoria que representamos por X1 − X 2 y que llamaremos estadistico. La distribución de los valores de X1 − X 2 se llama distribución muestral de la diferencia de medias con los siguientes parámetros: • Media: µ1 − µ2 σ 12 + σ 22 • Desviación típica: • A medida que n1 y n2 crecen, crece la distribución X1 − X 2 se aproxima a la normal. n1 n2 Inferencia estadistica 2/4 - Curso 2011-2012 2011 por Angel Vallelado se encuentra bajo una Licencia Creative Commons Reconocimiento-NoComercial-CompartirIgual Reconocimiento CompartirIgual 3.0 Unported. Unported Basada en una obra en www.angelv.es. Mat. Aplic. CC.SS. II – Curso 2011-2012 2011 Angel Vallelado – www.angelv.es