CAPÍTULO 2: MUESTREO

Anuncio
Página 1 de 8
CAPÍTULO 2: MUESTREO
En el capítulo anterior hablamos de que para tomar decisiones en Estadística primero
debemos formular una hipótesis a partir de la teoría del investigador. Una vez formulada la
hipótesis vamos a necesitar recoger información para comprobar esa hipótesis. Los datos
pueden existir de antemano o usted tendrá que recogerlos, en cualquier caso, la calidad de
la decisión que usted va a tomar, dependerá de la calidad de los datos. Suponemos que los
datos son buenos cuando reflejan la realidad que estamos investigando.
En este capítulo estudiaremos el método de muestreo aleatorio simple (m.a.s.), como el
concepto más básico de muestreo. La idea central del muestro es que nos ayuda a obtener
información acerca del un todo examinando sólo una parte o muestra. Hay otros tipos de
muestreo que por tiempo no veremos en este curso: muestreo estratificado, sistemático,
por conglomerados, etc.
¿Por qué tomar muestras?
Si queremos conocer una población, ¿Por qué no tomar una muestra de toda la población?,
¿Por qué no hacer un censo?
Ejercicio
Considere el proceso de corregir una lectura. Lea la siguiente frase una vez y determine
cuantas veces aparece la letra "f".
FINISHED FILES ARE THE RESULT OF YEARS OF SCIENTIFIC STUDY
COMBINED WITH THE EXPERIENCE OF MANY YEARS1
Número de “efes”: ______________
¿Cuántas efes encontró?, ¿Cuántas hay?
Definición: Un Censo es una muestra de toda la población.
En Chile se realizan censos de población cada diez años. ¿Cree usted que en el último censo
pueden haber existido errores? Si la población es grande un censo puede ser
extremadamente caro. También puede ocurrir que la demora en obtener información de un
censo haga que la información ya no sea válida cuando la tenemos. Para ejemplificar otra
situación imagine que queremos tener información de la duración de lavadoras. En este
caso además tenemos que destruir la unidad para obtener la información, por lo que un
censo tampoco es posible.
1
Fuente: "The Deming route to quality and productivity" William Scherkenbach. ASQC Quality Press, 1986.
Página 2 de 8
Lenguaje de Muestreo
Definiciones:
Población es el grupo entero de objetos o individuos bajo estudio, de los cuales queremos
obtener información.
Muestra es una parte de la población de la cual obtenemos información.
Unidad es un objeto individual o persona en la población.
Variable es una característica de interés medida en cada unidad de la muestra.
El tamaño de la población se denota por la letra mayúscula N.
El tamaño de la muestra se denota por la letra minúscula n.
Tamaño de la población: N = 16
Tamaño de la muestra: n = 4
Definiciones:
Parámetro es una medida numérica que se calcularía usando todas las unidades de la
población.
Estadística es una medida numérica que se calcula de las unidades de la muestra.
Página 3 de 8
Ejemplos
Factor Rh.
En Chile el 5,3% de la población tiene sangre factor Rh(-). En una muestra aleatoria de 400
sujetos de esa población, se encuentra que un 8,8% tiene factor Rh(-).
a) ¿cuál es el valor del parámetro?
b) ¿cuál es el valor de la estadística?
Ampolletas.
Suponga que usted esta a cargo de recibir una carga de 1000 ampolletas. Para decidir si
acepta la carga revisa 20 ampolletas y cuenta el número de ampolletas que están falladas.
Defina en este contexto:
-
Población
-
Unidades
-
Muestra
-
Variable
-
Parámetro
-
Estadística
Observación
Note que un parámetro es fijo y que la estadística puede variar.
Calidad de los datos2
En toda medición, pueden existir básicamente dos tipos de errores: aleatorios y sistemático.
Definiciones:
Se define sesgo como un error sistemático. Ej. Balanza mal calibrada.
Un método de muestreo se dice sesgado si los resultados que produce difieren
sistemáticamente de los verdaderos de una población.
Una muestra por conveniencia es una muestra que consiste en unidades de la población
que son fáciles de obtener.
Una muestra de voluntarios es una muestra que consiste en unidades de la población
que eligen responder.
Las muestras por conveniencia y de voluntarios son generalmente sesgadas.
2
Se recomienda leer Capítulo 3 del libro "Bioestadística" de Erica Taucher. Editorial Universitaria, 1997.
Página 4 de 8
Tipos de Sesgos
Sesgo de selección se produce un sesgo de selección cuando el procedimiento de
muestreo tiende sistemáticamente a incluir o excluir algún tipo de unidad de la población.
Sesgo de falta de respuesta es la distorsión que se provoca cuando gran parte de la
muestra seleccionada no responde o se niega a responder, y estas personas tienden a ser
diferentes de los que responden.
Sesgo por tipo de pregunta es la distorsión que afecta a la respuesta que se provoca ya
sea por la forma de hacer una pregunta o por la forma de preguntarla por parte del
entrevistador.
Métodos de muestreo
Definición:
Se llama muestreo probabilístico al método de muestreo que asigna a cada unidad en la
población una probabilidad (conocida y distinta de cero) de ser seleccionado para la
muestra.
Tipos de métodos:
•
•
•
•
•
Muestreo
Muestreo
Muestreo
Muestreo
Muestreo
aleatorio simple;
aleatorio estratificado;
sistemático;
por conglomerados, y
multietápico.
Una muestra aleatoria simple de tamaño n es una muestra de n unidades seleccionadas
de tal manera que cada muestra posible de tamaño n tiene la misma probabilidad de ser
seleccionada.
Muestras de distinto tamaño pueden tener diferentes probabilidades de ser seleccionadas.
Para asegurarnos que toda muestra aleatoria simple tenga la misma probabilidad de ser
seleccionada necesitamos algún dispositivo confiable de selección de las unidades. Existen
métodos alternativos como la selección de fichas de una urna, la selección de papeles
numerados de una bolsa y otros. Pero un sistema confiable y seguro que siempre funciona
es la tabla de números aleatorios.
Página 5 de 8
Tabla de Números aleatorios.
Una tabla de números aleatorios es una lista de dígitos 0, 1, 2, 3, 4, 5, 6, 7, 8, 9 y tiene
las siguientes propiedades:
1. Cualquier dígito en cualquier posición de la tabla tiene la misma probabilidad de ser 0,
1, ..., 9.
2. Los dígitos en posiciones diferentes son independientes, en el sentido de que el
conocimiento de algunos números de la tabla no da información acerca de otros
números de la tabla.
Usaremos la tabla de números aleatorios para seleccionar una muestra aleatoria simple
(m.a.s.).
Suponga que tenemos N=50 unidades en la población, saque una muestra aleatoria simple
de tamaño n=5.
Paso 1: Asigne ETIQUETAS: Dé a cada unidad en la población un número, etiqueta o
identificación. Todas las etiquetas deben tener el mismo número de dígitos. Como tenemos
50 unidades y 50 tiene dos dígitos, todas las unidades tienen que tener dos dígitos.
Unidad
Unidad 1
Unidad 2
Unidad 3
Unidad 4
Unidad 5
Unidad 6
Unidad 7
Unidad 8
Unidad 9
Unidad 10
Ident
01
02
03
04
05
06
07
08
09
10
Unidad
Unidad 11
Unidad 12
Unidad 13
Unidad 14
Unidad 15
Unidad 16
Unidad 17
Unidad 18
Unidad 19
Unidad 20
Ident
11
12
13
14
15
16
17
18
19
20
Unidad
Unidad 21
Unidad 22
Unidad 23
Unidad 24
Unidad 25
Unidad 26
Unidad 27
Unidad 28
Unidad 29
Unidad 30
Ident
21
22
23
24
25
26
27
28
29
30
Unidad
Unidad 31
Unidad 32
Unidad 33
Unidad 34
Unidad 35
Unidad 36
Unidad 37
Unidad 38
Unidad 39
Unidad 40
Ident
31
32
33
34
35
36
37
38
39
40
Unidad
Unidad 41
Unidad 42
Unidad 43
Unidad 44
Unidad 45
Unidad 46
Unidad 47
Unidad 48
Unidad 49
Unidad 50
Ident
41
42
43
44
45
46
47
48
49
50
Paso 2: Use la TABLA: Empezando en un lugar escogido al azar lea grupos de dígitos
(dependiendo del número de dígitos en las etiquetas) de izquierda a derecha, continuando
con la línea siguiente cuando se acabe la línea que está leyendo. Si el grupo de dígitos
corresponde a una de las etiquetas, ese número identifica a una de las unidades que será
seleccionada. Si el grupo de dígitos no corresponde a una de las etiquetas o si ya fue
seleccionado, se salta al grupo siguiente.
Por ejemplo suponga que el lugar de partida escogido al azar fue la fila 5, columna 1:
FILA 5: 37570
60672 ...
39975
81837
16656
06121
91782
60468
81305
49684
37, 57 (salto), 03, 99 (salto), 75 (salto), 75 (salto), 81 (salto), 83 (salto), 71 (salto), 66
(salto), 56 (salto), 06, 12, y 19.
La muestra seleccionada serán las unidades o sujetos con etiquetas: 37, 03, 06, 12, y 19.
Página 6 de 8
Ejemplo
Muestreo Aleatorio Simple.
Suponga que nos interesa estudiar la proporción de mujeres en
una población.
Formen grupos de 10 estudiantes.
La población de interés es su grupo.
Seleccione una muestra aleatoria simple de tamaño n=3 de su grupo.
Pasos:
1. Escriban los nombres de las personas en el grupo.
2. Asignen un número de identificación a cada persona del grupo.
3. Seleccione la muestra usando la tabla de números aleatorios.
Tabla: Suponga que la posición de partida de la tabla elegida al azar fue: fila 13, columna
1.
Denotaremos por P la proporción de mujeres en su población.
Número de mujeres en su población
___________
Calcule la proporción de mujeres en su población P =
N = ______
número de mujeres
=
N
Resultados de la muestra aleatoria simple de tamaño n=3:
Número de mujeres en la muestra _____________
Proporción de mujeres en la muestra, p̂ =
número de mujeres
=
n
Pensemos
¿Parece simple seleccionar una m.a.s.?
¿Es siempre posible?
¿Cuándo es difícil?
¿Cómo será numerar las unidades si el tamaño de la población fuera 78? o 292? o 4000?
¿Será simple usar la tabla o la calculadora o computador?
El muestreo aleatorio simple es objetivo o insesgado, pero tiene la desventaja que
necesitamos tener una lista completa de la población y eso no es siempre posible. Si
quisiéramos tomar una muestra de la ciudad de Talca, ¿Qué lista de la población podríamos
usar?
Página 7 de 8
Muestreo aleatorio estratificado3
Un muestreo aleatorio estratificado se selecciona dividiendo o estratificando la
población en subgrupos mutuamente exclusivos (estrato) y tomando una muestra aleatoria
simple de las unidades de cada estrato. Para formar la muestra completa se combinan las
unidades muestreadas de cada estrato.
Subgrupos mutuamente exclusivos implica que cada unidad de la población pertenece a un
solo estrato.
Ejemplo
Formen grupos de 10 estudiantes. Cada grupo necesita tener al menos una mujer o un
hombre. La población de interés es su grupo.
Pregunta de interés:
¿Cuánto calza?
Queremos averiguar el promedio del número de calzado en su población.
Pasos:
1. Escriba el nombre de las personas en su grupo.
2. Haga la pregunta a cada miembro de su grupo y escriba la respuesta al lado del
nombre.
3. Calcule el promedio de la respuesta en su población.
Promedio = SUMA
N
= ____________________
¿Este número es un PARÁMETRO o un ESTADÍSTICO?
Tome una muestra aleatoria simple de tamaño n=4.
Pasos:
1. Asigne una identificación a cada nombre en la lista.
2. Use la tabla de número aleatorios (fila 22, columna 10).
3. ¿A quién seleccionó de su grupo y cuál son sus respuestas?
4. Calcule el promedio de las respuestas en su muestra aleatoria simple de tamaño n=2.
¿Este número es un PARÁMETRO o un ESTADÍSTICO?
Pero sabemos de las diferencias entre el número que calzan los hombres y las
mujeres.
3
Sección opcional
Página 8 de 8
Muestra aleatoria estratificada
Pasos:
1. Liste los hombres y las mujeres de su población separadamente, es decir, forme los
estratos. Incluya la respuesta a la pregunta en paréntesis.
MUJERES (Estrato 1)
HOMBRES (Estrato 2)
2. Designe una identificación a cada unidad en cada estrato.
3. Seleccione una m.a.s. de tamaño n=2 de mujeres (fila 14, col 1) y una m.a.s. de
tamaño n=2 de hombres (fila 23, col 2).
Registre las respuestas de la muestra.
Respuestas de mujeres seleccionadas: ______________________
Respuestas de hombres seleccionados: ______________________
4. Calcule el promedio de las respuestas de cada estrato separadamente:
Estrato 1, Mujeres:
Promedio estimado = SUMA
Estrato 2, Hombres: Promedio estimado = SUMA
n
n
= _____________
= ______________
5. Calcule la respuesta global combinando los promedios de los estratos
Promedio global:
 # unidades estrato1  promedio estimado   # unidades estrato 2  promedio estimado 
 + 
 =



N
N

 estrato1
 estrato 2
 

¿Este número es un PARÁMETRO o un ESTADÍSTICO?
¿Cómo es comparado con el promedio de toda la población?
¿Qué facilidades deportivas te gustaría que hubiera en la UTAL?
Pensemos
¿Cuándo nos conviene tomar un tamaño muestral distinto en cada estrato?
Cuando formamos un estrato, ¿Cómo debe ser la variabilidad dentro de cada estrato y entre
los estratos?
¿Es el muestreo aleatorio estratificado un muestreo aleatorio simple?, Si o No, ¿Por qué?
Descargar