ACERCA DEL MUESTREO Según ya se indicó anteriormente, llamaremos muestra a un subconjunto propio, es decir no vacío ni igual a la población en estudio, de la población. Dado que los datos contenidos en una muestra serán los que nos proveerán de información respecto de la población en estudio se requerirá un cuidadoso proceso de muestreo, a efectos de elaborar ese conjunto en las condiciones más adecuadas de representatividad, puesto que la inferencia se caracterizará, reiteramos, por aplicar al colectivo las conclusiones obtenidas a partir de la muestra. En este sentido, pues, el método de selección de la muestra reviste una singular importancia, dado que de cómo se haya constituido ésta se seguirán unos u otros resultados. Genéricamente, y a efectos de tipificar de manera adecuada las nociones que se manejarán, se establecerán tres formas de seleccionar una muestra: 1. Muestreo probabilístico aleatorio: Diremos que el muestreo es probabilístico cuando pueda establecerse “la probabilidad de obtener cada una de las muestras que sea posible seleccionar”. Esto es, cuando la selección muestral constituya un fenómeno aleatorio probabilizable; es decir: cuando dicha selección se verifique en condiciones de azar, siendo susceptible de medida la incertidumbre derivada de aquélla, el muestreo será probabilístico. 2. Muestreo opinático: En este muestreo la representatividad depende del individuo que elabora la muestra (también es llamado muestreo de experto) puesto que es él quien determina si el carácter de las unidades muestrales es o no representativo. Es obvia la influencia de los criterios subjetivos en este tipo de muestreo (con independencia de que se pueda o no decir de él que es útil en ciertas situaciones), lo que condiciona decisivamente la representatividad de la investigación muestral. 3. Muestreo errático o “sin norma”: Se caracteriza porque la muestra se selecciona arbitrariamente, sin tener en cuenta “a priori” ningún tipo de circunstancia de la población. Evidentemente, en el caso de que ésta sea muy homogénea los resultados pueden ser adecuadamente representativos, lo que no sucederá en caso contrario. La principal crítica que corresponde hacer a los dos últimos tipos de muestreo es que no se puede hacer una estimación del error debido al muestreo. Esto ante la no existencia de un modelo probabilístico en el proceso de selección de la muestra. 1 En lo que sigue, y salvo expresa afirmación en caso contrario, supondremos que se esta trabajando dentro de la hipótesis del primer tipo de muestreo, y, más aún, denominaremos muestras aleatorias simples a aquéllas que se considerarán, entendiendo como tales a las que cumplan los dos siguientes requisitos. 1. La muestra como tal se obtendrá al azar, lo que implica que cada muestra poseerá la misma probabilidad de ser escogida que las restantes. 2. Cada elemento de la muestra tendrá siempre la misma probabilidad de haber sido escogido que las restantes. En una muestra aleatoria o probabilística, se sabe que hay posibilidades de que una unidad estadística figure o no en la muestra. Con el objeto de aumentar la probabilidad de contar con una muestra representativa existen diverso tipos de muestreos probabilísticos. Es importante señalar que siempre existirá el error muestral es decir el error o variación entre indicadores muestrales, atribuible al azar, o sea a las diferencias entre muestras y población, y la diferencia existente entre las diversas muestras. Como esas diferencias se deben exclusivamente a los elementos que se seleccionan en la muestra es de gran importancia el método de muestreo con el que se seleccionará la muestra aleatoria. Muestreo sistemático: En este, muestreo los elementos de la población se seleccionan con un intervalo uniforme que se mide con respecto a cualquier característica conveniente, como por ejemplo: el tiempo, espacio, etc. Se debe tener la precaución de que los elementos de la población no este ordenados con respecto a la variable en estudio. El muestreo sistemático difiere del muestreo aleatorio simple en que cada elemento tiene iguales probabilidades de ser seleccionado, pero las muestras no son equiprobables. Muestreo estratificado: Para aplicar el muestreo estratificado la población se particiona en subconjuntos, llamados estratos de tal modo que las unidades estadísticas en cada uno de los estratos presentan, respecto de la característica en estudio, escasa variabilidad siendo esta relativamente grande entre los estratos. Para tomar la muestra se selecciona al azar en cada estrato un número especificado de unidades estadísticas correspondientes a la proporción del estrato de la población o bien se extrae un número igual de unidades estadísticas de cada estrato y se da un peso a los resultados de acuerdo con la proporción del estrato en la población total. Cuando existe una estratificación adecuada el muestreo aleatorio estratificado refleja en forma más adecuada las características de la población de donde se extrajeron las unidades estadísticas muestrales que otras clases de muestreo. 2 Muestreo por conglomerados: En el muestreo por conglomerados, se particiona la población en subconjuntos llamados conglomerados y luego se toma una muestra aleatoria de ellos. Se supone que cada conglomerado es representativo de la población entera. Tal como se sugiere usar el muestreo estratificado cuando en cada estrato se presenta una pequeña variación en el interior, pero existe una amplia variación entre ellos, el muestreo por conglomerados se usará cuando se advierte considerable variación dentro de cada conglomerado pero los subconjuntos son esencialmente semejantes entre sí. No olvidamos que el objetivo es obtener información respecto de una población. En forma más precisa respecto de ciertas características poblacionales que llamaremos parámetros (por ejemplo el porcentaje de coliformes fecales presentes en determinada producción de mayonesa). Esta información la obtendremos, por lo general, por medio de los datos de una muestra, en forma más precisa por la evaluación de determinados indicadores o medidas estadísticas que llamaremos estadígrafos (por ejemplo el porcentaje de coliformes fecales presentes en una muestra de la producción de mayonesa investigada). El arte consiste entonces en toma adecuadamente una muestra, disminuyendo al máximo la probabilidad de cometer errores muestrales es decir errores causados por el acto de tomar una muestra, debidos a la variabilidad que hay entre una muestra y otra. Dos características que pueden encontrase en un proceso de muestreo, y que miden la bondad de este, son la precisión y el sesgo. La precisión es la capacidad de un proceso de muestreo de obtener resultados similares a través de la aplicación del proceso repetidas veces. Una muestra de tamaño pequeño es probable que produzca resultados poco precisos. Por su parte, el sesgo es un error sistemático producido por el proceso de muestreo. Se produce sesgo, por ejemplo, si el marco muestral (es decir la parte de la población de donde efectivamente se obtendrá la muestra) excluye a un sector de la población sensiblemente diferente del resto. 3 Razones para el uso de muestras a) Una muestra puede ahorra dinero cuando no se necesita absoluta precisión. b) Una muestra ahorra tiempo cuando la información se necesita más rápidamente que el necesario para realizar un censo. c) Una muestra permite concentrar la atención en casos individuales. d) En algunas aplicaciones industriales algunos ensayos son destructivos y pueden ser realizados solamente mediante una muestra. e) Algunas poblaciones pueden ser consideradas como infinitas, y, por lo tanto, sólo pueden ser muestreadas. Un ejemplo simple lo constituye un experimento agrícola para investigar fertilizantes. f) Donde los errores no muestrales(es decir los errores tales como datos faltantes, de medición, de recolección de datos, de proceso, etc.) son necesariamente grandes, una muestra puede dar mejores resultados que un censo. Limitaciones del muestreo a) Si se necesitan datos para áreas muy pequeñas, se necesitan muestras de tamaño desproporcionadamente grandes, pues la precisión depende fuertemente del tamaño de la muestra y no de la tasa de muestreo. b) Si los datos se necesitan a intervalos regulares, y es muy importante medir cambios pequeños de un intervalo a otro, se necesitarán muestras muy grandes. c) A veces el proceso de muestreo es demasiado alto. Glosario Marco de muestreo: Conjunto de unidades estadísticas desde el cual se tomará realmente la muestra. Plan de muestreo: Conjunto de procedimientos utilizados para seleccionar la muestra. Unidad de análisis: Aquella entidad para la cual se desea obtener información estadística. Las unidades pueden ser personas, hogares, productos resultantes de algún proceso, etc. Unidad de muestreo: Unidad que se selecciona. Esta puede ser o no las mismas unidades de análisis. Por ejemplo, para obtener información sobre personas se puede seleccionar directamente un conjunto de individuos desde una lista o bien se puede seleccionar una muestra de hogares e incluir en la encuesta a todas las personas en los hogares seleccionados. Error de muestreo: error debido al plan de muestreo utilizado. El término error , estadísticamente hablando, no es sinónimo de "equivocación", sino que incluye todos los tipos de variación extraña. 4