COMISION ECONOMICA PARA AMERICA LATINA Y EL CARIBE CEPAL División de Estadística y Proyecciones Económicas BANCO DE DATOS DE ENCUESTAS DE HOGARES CHILE Encuesta de Caracterización Socioeconómica Nacional Octubre del 2011 y Enero del 2012 Metodología y Cuestionario Primera Edición – Junio 2012 PRESENTACIÓN El presente documento sobre Metodología y Cuestionario contiene algunos antecedentes relativos a la Encuesta de Caracterización Socioeconómica Nacional (CASEN) llevada a cabo por el Ministerio de Desarrollo Social de Chile y el Centro de Microdatos de la Facultad de Economía y Negocios de la Universidad de Chile entre octubre del 2011 y enero del 2012. La información de esta encuesta tiene cobertura nacional y está referida a la población de los hogares particulares del país. Tanto la base de datos como la documentación de la encuesta ha sido preparada por la División de Estadísticas y Proyecciones de la CEPAL, quien además tuvo a su cargo evaluar la consistencia de la información y generar un conjunto de nuevas variables en un contexto de comparabilidad con los demás países de América Latina. Para esta labor se contó con el respaldo del MIDEPLAN, institución responsable del diseño y ejecución de la encuesta, sin cuya acostumbrada colaboración este trabajo no habría sido posible. Se incluyen aquí la descripción del diseño muestral y otros antecedentes metodológicos, así como el cuestionario utilizado para el levantamiento de la encuesta. CHILE, Noviembre de 2011 TERMINOS DE REFERENCIA TÉCNICOS CASEN 2011 CHILE, Noviembre de 2011 1. INTRODUCCIÓN El Ministerio de Desarrollo Social tiene como misión promover el desarrollo del país con integración y protección social de las personas, articulando acciones para el análisis, diseño, coordinación, ejecución y evaluación de políticas sociales, planes y programas que implemente el Estado. Al centro de este mandato se releva la necesidad de contar con información de calidad para la toma de decisiones en la gestión pública. Uno de los desafíos del ministerio, por lo tanto, es generar datos administrativos y datos estadísticos de calidad1: relevantes, confiables, oportunos, comparables, coherentes y accesibles. Desde 1985 el Ministerio de Desarrollo Social (Ex Ministerio de Planificación) tiene a su cargo el diseño y dirección de la Encuesta Casen que es una encuesta de hogares de carácter transversal. Su propósito es disponer de información de la situación socioeconómica de los hogares y de la población que reside en viviendas particulares, principalmente en relación a aspectos demográficos, educación, salud, vivienda, trabajo e ingresos, entre otros. En 2011 el proceso de recolección de datos ha sido encargado al Centro de Microdatos de la Facultad de Economía y Negocios de la Universidad de Chile. Por otra parte, el Ministerio ha confiado al Instituto Nacional de Estadísticas las tareas de diseño y selección de la muestra; la elaboración de la cartografía asociada a la muestra; la elaboración de los factores de expansión de la muestra; y la función de repositorio de la llave dirección-folio de la Encuesta Casen 2011. Finalmente, el Ministerio requiere encomendar la tarea de corrección y ajuste de las partidas de ingreso de la Encuesta Casen 2011 a un CONTRATISTA que cuente con amplia experiencia en el diseño y evaluación de encuestas de hogares y disponga de los recursos técnicos y humanos especializados en las aplicaciones estadísticas requeridas para las tareas a contratar. En este documento se describen las especificaciones técnicas de los requerimientos para el proceso de corrección y ajuste de las variables de ingreso. La sección 2 presenta los antecedentes del estudio. La sección 3 describe los alcances del proyecto, su organización general y las actividades a contratar. La sección 4 presenta el presupuesto disponible y la sección 5 la estructura y cronograma para la entrega de los informes asociados a pago. 1 (*) Ehling, M., and T. Körner (2007), Handbook on Data Quality Assessment Methods and Tools, Wiesbaden: European Commission, Eurostat. CHILE, Noviembre de 2011 2. ANTECEDENTES DEL ESTUDIO 2.1. Marco de referencia para la medición de calidad de los datos de encuestas El Ministerio de Desarrollo Social tiene interés en impulsar una agenda de investigación sobre la calidad de los datos de la Encuesta Casen. Esta agenda utilizará dos marcos de referencia para la evaluación de la calidad de los datos estadísticos: los principios y criterios en el Handbook on Data Quality Assessment Methods and Tools2, y la taxonomía de errores propuesta por el paradigma Error Total de Encuestas.3 Se identifican seis características de un producto estadístico: relevancia, precisión, oportunidad y puntualidad, comparabilidad, coherencia, accesibilidad y claridad. El paradigma del Error Total de Encuestas tiene relación con la precisión de los datos estadísticos.4 El cuadro 1 ilustra las distintas etapas del proceso de diseño de una investigación que utiliza el método de encuestas para la recolección de datos. Los óvalos en la figura indican las partes del proceso donde se producen errores, los cuales son el objeto de investigación al momento de evaluar la precisión de los datos que se recolectan utilizando encuestas. Aquellos a la derecha ilustran fallas asociadas a la representatividad de las unidades de investigación (error de cobertura, error de muestreo, error de no respuesta y error de ajuste estadístico). Los óvalos a la izquierda ilustran fallas asociadas al proceso de medición de los conceptos de investigación (validez, error de medición y error de procesamiento). El Ministerio de Desarrollo Social tiene interés en desarrollar tres grandes líneas de investigación en torno a la calidad de datos Casen: 1. Errores de cobertura y no respuesta 2. Errores de medición 3. Errores de procesamiento El informe que el Ministerio va a encargar al CONTRATISTA tiene por objetivo medir y luego corregir los errores de medición que se producen en el proceso de recolección de los datos 2 Ehling, M., and T. Körner (2007). “Handbook on Data Quality Assessment Methods and Tools”. Wiesbaden: European Commission, Eurostat. 3 Groves, R., Fowler, F.J., Couper, M., Lepkowski, J. and Singer, E. (2004). “Survey Methodology”. New York: Wiley. 4 La precisión, en el sentido estadístico, denota la cercanía de los estimadores a los valores exactos (desconocidos) o valores verdaderos. Los estimadores no son nunca iguales a los valores verdaderos debido a la varianza (errores aleatorios) y el sesgo (errores sistemáticos, no aleatorios). Ver definiciones para las seis características de los productos estadísticos en Ehling y Körner (2007). CHILE, Noviembre de 2011 asociados a ingresos del trabajo, prestaciones de la seguridad social, ingresos de capital y arriendo imputado. Cuadro 1. Proceso de encuesta desde perspectiva de calidad (Groves et al., 2004) A continuación se describen antecedentes técnicos del diseño de la muestra y del protocolo de recolección de datos de la Encuesta Casen 2011. 2.2. Población objetivo Encuesta Casen 2011 La población objetivo de la encuesta es la población que reside en viviendas particulares a lo largo del territorio nacional, excluyendo aquellas áreas consideradas áreas de difícil acceso (ADAs) por el Instituto Nacional de Estadísticas. Al interior de cada vivienda seleccionada, se entrevista a todos los hogares y se recolectan datos acerca de todas las personas que se identifican como residentes habituales del hogar en la vivienda. El informante idóneo para la Encuesta Casen es el jefe/a de cada hogar, sin embargo si no se logra agendar entrevista con él/ella, entonces se realiza la entrevista con cualquier miembro del hogar de 18 años o más. 2.3. Diseño muestral Encuesta Casen 2011 Las principales características del diseño muestral son: a. b. Corresponde a una muestra probabilística, estratificada geográficamente y por tamaño poblacional, tanto en las áreas urbanas como rurales. La selección de la muestra se realiza en dos etapas (muestreo bietápico): las unidades primarias de muestreo son seleccionadas con probabilidad proporcional a su tamaño (medido en términos del número de viviendas al interior de cada unidad primaria de CHILE, Noviembre de 2011 c. d. e. muestreo), y las unidades secundarias de muestreo son seleccionadas con igual probabilidad al interior de cada unidad primaria de muestreo. El marco muestral para la selección de las unidades primarias de muestreo corresponde al Marco Muestral de Manzanas (2002), en las áreas urbanas, y al Marco Muestral de Secciones (2008), en las áreas rurales y resto urbano.5 La representación geográfica de la encuesta son el país y las quince regiones. La muestra total fue diseñada para alcanzar errores absolutos entre 1 y 4 puntos porcentuales, al 95% de confianza, en la estimación de la tasa de pobreza de cada una de las 15 regiones del país. También considera que el error relativo de la tasa de pobreza no supere el 20% en ninguna región del país. Para lograr los niveles de precisión objetivo, la Encuesta Casen 2011 consideró una muestra de aproximadamente 113.000 viviendas. Este tamaño de muestra considera las pérdidas de unidades seleccionadas debido a problemas del marco muestral, no-contacto y rechazo por parte de los seleccionados. El cuadro 2 presenta la distribución de esta muestra por regiones. El cuadro indica, para cada región, el número de viviendas seleccionadas (n=112.897), el número esperado de entrevistas a lograr (n=90.122) y el número de entrevistas efectivamente logrado (n=86.854). Cuadro 2. Distribución regional de la muestra CASEN 2011. Regiones XV Región I Región II Región III Región IV Región V Región VI Región VII Región VIII Región IX Región XIV Región X Región XI Región XII Región Región Metropolitana. País 5 Viviendas Seleccionadas 3.962 7.763 7.506 6.584 4.518 9.695 6.610 8.228 10.477 6.942 7.890 7.847 5.583 3.773 15.459 112.837 Entrevistas Esperadas 3.495 6.241 6.108 4.382 3.780 8.064 5.469 7.464 8.652 5.782 6.576 6.391 3.941 2.315 11.461 90.122 Entrevistas Logradas 3.298 5.032 5.304 4.023 3.692 6.732 5.547 7.382 8.750 5.979 6.446 6.684 4.167 2.404 11.414 86.854 Previo a la selección de las unidades secundarias de muestreo (USM), el INE realiza la actualización de las unidades primarias de muestreo (UPM) seleccionadas. Todas las UPM, tanto urbanas como rurales, fueron actualizadas en terreno previo a la selección de las viviendas (USM) que conforman la muestra Casen 2011. CHILE, Noviembre de 2011 2.4. Método de recolección de datos Encuesta Casen 2011 En 2011, el método de recolección de datos utilizado para la Encuesta Casen fue exclusivamente la metodología de entrevista personal aplicada por encuestador en cuestionarios de papel. El trabajo de campo fue implementado utilizando dos submuestras independientes. Para ello, la muestra total (n=112.837) se dividió en dos submuestras, de 37.483 viviendas y 75.354 viviendas aproximadamente. Cada submuestra es representativa de la población nacional, que conserva la misma estructura de la muestra completa. Ver diagrama en el cuadro 3. La Submuestra-1 fue trabajada en terreno por un total de 5 semanas, entre el 17 de octubre de 2011 y el 21 de noviembre de 2011. A partir de esta muestra se lograron 27.770 entrevistas. La Submuestra-2 fue trabajada en terreno por un total de 9 semanas, entre el 22 de noviembre de 2011 y el 22 de enero de 2012. A partir de esta muestra se lograron 59.084 entrevistas. Para efectos de este estudio, se entenderá como “Encuesta Casen 2011-R2” a la base de datos asociada con la Submuestra 2 (n=59.084 hogares) y “Encuesta Casen 2011” a la base de datos que comprende la muestra completa (n=86.854 hogares). Cuadro 3. Ilustración trabajo de campo Casen 2011 con 2 réplicas. CHILE, Noviembre de 2011 DEFINICIONES HOGARES: Hogar — Grupo de personas, parientes o no, que habitan la misma vivienda y tienen presupuesto de alimentación común o personas que viven solas. Puede ocurrir que uno o más hogares habiten una vivienda; sin embargo, un hogar no puede habitar más de una vivienda. Hogar Principal — Hogar al que pertenece el propietario, arrendatario o responsable ante su propietario de toda la vivienda, cuando en ésta residen dos o más hogares. Jefe o Jefa del Hogar — Persona reconocida como tal por los demás miembros del hogar. Miembros del Hogar — Personas que habitan la misma vivienda y tienen presupuesto de alimentación común. También se considera miembros del hogar a las personas que, en el momento de la encuesta, están residiendo transitoriamente fuera de la vivienda, por vacaciones, enfermedad, trabajo u otra razón, siempre que los períodos de ausencia no superen los seis meses; a las personas que realizan servicios domésticos remunerados y residen habitualmente en la vivienda; a los extranjeros que trabajan o estudian en el país y están residiendo en la vivienda o tienen intención de residir en ella por seis meses o más; y a las personas que se encuentran cumpliendo condena, sujetas a régimen de reclusión nocturna o de salida diaria, siempre y cuando tengan su residencia habitual en la vivienda. En términos generales, se excluyen aquellas personas que estuvieron ausentes más de seis meses en el último año, exceptuando al jefe del hogar, los niños menores de seis meses, los estudiantes internos y los estudiantes que residen en un lugar diferente al hogar familiar. Núcleo Familiar: — Un hogar puede tener uno o más núcleos familiares. Un núcleo puede estar constituido por un matrimonio o unión de hecho sin hijos o hijastros o por un matrimonio o unión de hecho o un jefe (a) de familia con hijos o hijastros de cualquier estado civil, siempre y cuando estén solos, esto es, sin cónyuge o conviviente o hijos o hijastros. En ambos casos, el núcleo puede también estar constituido por menores de 18 años, parientes o no parientes, que dependan económicamente de la pareja o del jefe de familia y que no tengan ascendientes directos en el hogar y por otros parientes que no tengan ascendientes, descendientes o pareja viviendo en el hogar y que no puedan vivir solos, como por ejemplo personas de edad o con discapacidad. CHILE, Noviembre de 2011 Tipología de Hogares — Distribución relativa de los hogares por tipo de hogar definido según la presencia o ausencia de determinados miembros del hogar, de acuerdo a la variable relación de parentesco entre los miembros que lo integran y su relación con la persona identificada como jefe de hogar. Comprende los siguientes tipos: • Unipersonal: Constituido por una sola persona que es el (la) jefe (a) de hogar. • Nuclear Biparental: Constituido por matrimonio o unión de hecho sin hijos o hijastros y matrimonio o unión de hecho con hijos o hijastros de cualquier estado civil, siempre y cuando estén solos, esto es, sin cónyuge o conviviente o hijos o hijastros. • Nuclear Monoparental: Constituido por jefe (a) de hogar con hijos o hijastros de cualquier estado civil, siempre y cuando estén solos, esto es, sin cónyuge o conviviente o hijos o hijastros. • Extenso Biparental: Constituido por un hogar nuclear biparental más cualquier otro pariente del jefe (a) de hogar no nuclear. No hay presencia de miembros no parientes del jefe de hogar. • Extenso Monoparental: Constituido por un hogar nuclear monoparental más cualquier otro pariente del jefe (a) de hogar no nuclear. No hay presencia de miembros no parientes del jefe de hogar. • Compuesto Biparental: Constituido por un hogar nuclear biparental o un hogar extenso biparental más no parientes. • Compuesto Monoparental: Constituido por un hogar nuclear monoparental o un hogar extenso monoparental más no parientes. • Hogar sin núcleo: Constituido por un hogar en que no está presente el núcleo familiar primario (hogar nuclear). Puede tomar las formas de jefe (a) de hogar y no pariente (s), jefe (a) de hogar y cualquier otro pariente, jefe (a) de hogar y no pariente (s) y cualquier otro pariente. CHILE, Noviembre de 2011 POBREZA: Metodología de Estimación de la Pobreza — Los indicadores de pobreza e indigencia estimados por MIDEPLAN a partir de la información de la Encuesta CASEN utilizan el método de ingresos o indirecto. La utilización de esta misma metodología desde 1987 ha permitido la construcción de indicadores comparables a lo largo del tiempo, haciendo posible de esta manera evaluar su evolución. Además, su amplia aplicación a nivel internacional, permite la comparación de la situación nacional con la de otros países. Este método, al igual que el método directo o de necesidades básicas insatisfechas, NBI, mide pobreza e indigencia en términos absolutos. Esto es, los límites entre quiénes son pobres o indigentes y quiénes no lo son se definen en relación a mínimos de satisfacción de necesidades básicas, en el caso de la pobreza, o alimentarias, en el caso de la indigencia. A diferencia del método de NBI, este método utiliza el ingreso como indicador de la capacidad de satisfacción de las necesidades básicas, de modo que estos mínimos se establecen en términos de un cierto nivel de ingreso. Así, la línea de pobreza es el ingreso mínimo establecido por persona para satisfacer las necesidades básicas y la línea de indigencia es el mínimo establecido por persona para satisfacer las necesidades alimentarias. De acuerdo con ello, se considera en situación de pobreza a aquellos hogares cuyos ingresos son inferiores al mínimo establecido para satisfacer las necesidades básicas de sus miembros, y en situación de indigencia a aquellos hogares cuyos ingresos son inferiores al mínimo establecido para satisfacer las necesidades alimentarias de sus miembros. Para la clasificación de los hogares en estas categorías, el ingreso del hogar se define como la suma del ingreso autónomo del hogar, las transferencias monetarias que recibe el hogar del Estado y una imputación por concepto de arriendo de la vivienda, cuando ésta es habitada por sus propietarios. Línea de Indigencia — Ingreso mínimo establecido por persona para satisfacer las necesidades alimentarias. Corresponde al costo mensual de una canasta básica de alimentos por persona, cuyo contenido calórico y proteico permite satisfacer un nivel mínimo de requerimientos nutricionales y que además refleja los hábitos de consumo prevalecientes. El valor de la canasta básica difiere entre las zonas rural y urbana. Línea de Pobreza — Ingreso mínimo establecido por persona para satisfacer las necesidades básicas. Se establece a partir del costo de la canasta básica de alimentos al que se aplica un factor multiplicador. Así, LP = k • CBA donde LP es la línea de pobreza, CBA es el costo de la canasta básica de alimentos por persona, o línea de indigencia, y k, el factor multiplicador. Este factor difiere entre las zonas rural y urbana. Así, el valor de la línea de pobreza corresponde a 2 veces el valor de una canasta básica de alimentos, en la zona urbana, y a 1,75 veces, en la zona rural. Composición de la Canasta Básica de Alimentos Urbana —La composición de la canasta básica de alimentos fue estimada a partir de la información de gasto de los hogares de la IV Encuesta de Presupuestos Familiares realizada por el INE entre diciembre de 1987 y noviembre de 1988 en el Gran Santiago. Los precios utilizados para establecer el costo de esta CHILE, Noviembre de 2011 canasta son los recolectados por el INE para calcular el Indice de Precios al Consumidor (IPC) y su valor es actualizado de acuerdo a la evolución de los mismos. ALIMENTOS TOTAL 1.1 PAN Y CEREALES. Pan corriente GRASAS CANT. FISICA CALORIAS PROTEINAS (gramos (gramos) (Kcal) (gramos) ) 1.258,646 2.176,002 54,612 54,473 362,872 1.072,170 24,685 5,317 291,389 812,976 18,649 2,040 3,579 15,212 0,315 0,372 Arroz de primera, grado 2 36,073 130,945 2,309 2,708 Harina cruda 11,234 39,094 0,899 0,135 Tallarines 20,597 73,943 2,513 0,062 1.2 CARNES 80,748 109,225 13,222 5,516 Posta 12,095 15,627 2,712 0,356 Carne molida 17,883 23,105 3,449 0,934 Cazuela de vacuno 16,163 12,203 1,802 0,469 Pollo entero faenado 14,663 16,833 1,839 0,944 Pollo Trozado 12,695 21,861 2,389 1,226 Salchichas 1,479 4,808 0,185 0,439 Mortadela 5,278 13,294 0,781 1,024 Caldo en cubitos 0,492 1,494 0,065 0,124 1.3 PESCADOS 11,979 13,922 1,728 0,705 Pescada 8,368 4,628 1,013 0,023 Jurel en conserva 3,611 9,294 0,715 0,682 164,237 118,614 7,383 5,827 Leche fresca 91,431 52,116 2,926 2,286 Leche en polvo 41,615 24,595 1,444 1,278 1,364 4,308 0,306 0,314 Yogurt 10,113 10,113 0,445 0,273 Huevos 19,714 27,482 2,262 1,676 Galletas dulces 1.4 PRODUCTOS LACTEOS Y HUEVOS Queso tipo gauda CHILE, Noviembre de 2011 1.5 ACEITES 37,073 313,744 0,048 35,467 Aceite suelto 13,420 118,227 0,000 13,379 Aceite envasado 15,660 137,965 0,000 15,613 7,993 57,552 0,048 6,475 92,734 43,840 0,388 0,239 Limones 5,974 0,478 0,007 0,000 Naranjas 16,208 4,084 0,079 0,034 Manzanas 54,014 30,248 0,162 0,162 Plátanos 16,538 9,030 0,140 0,043 312,574 162,030 6,920 0,983 57,603 9,332 0,415 0,207 Lechuga milanesa 4,449 0,334 0,038 0,009 Repollo 7,734 1,353 0,097 0,016 Zapallo 31,880 7,906 0,051 0,153 Pimentón 3,631 0,356 0,018 0,010 Porotos secos 8,839 28,107 1,821 0,141 Lentejas 2,960 9,710 0,710 0,038 Salsa de tomate 4,519 3,706 0,122 0,045 Ajo 3,699 4,195 0,223 0,013 Verduras surtidas 1,274 0,526 0,028 0,005 116,918 72,022 2,900 0,187 Cebollas 53,625 19,788 0,386 0,097 Zanahorias 15,443 4,695 0,111 0,062 1.8 AZUCAR, CAFE, TE, DULCES Y CONDIMENTOS 82,896 262,303 0,113 0,081 Azúcar granulada 55,855 215,042 0,000 0,000 Sucedáneo de Café 0,308 1,084 0,054 0,000 Té corriente 3,317 10,217 0,000 0,000 Margarina 1.6 FRUTAS 1.7 VERDURAS, LEGUMBRES Y TUBERCULOS Tomates Papas CHILE, Noviembre de 2011 Té en bolsitas 1,046 3,221 0,000 0,000 Jugo en polvo 2,250 1,125 0,000 0,000 Caramelos 7,221 28,668 0,000 0,000 Helados de paleta 1,971 2,760 0,055 0,077 10,876 0,000 0,000 0,000 0,052 0,186 0,004 0,004 106,412 72,927 0,016 0,000 98,320 66,858 0,000 0,000 8,092 6,069 0,016 0,000 7,121 7,227 0,109 0,338 Hot dog 1,542 4,995 0,109 0,338 Bebida gaseosa en mesón 5,579 2,232 0,000 0,000 Sal Pimienta 1.9 BEBIDAS Bebida gaseosa grande Vino familiar 1.10 COMIDAS Y BEBIDAS FUERA DEL HOGAR FUENTE: CEPAL, División de Estadísticas. CHILE, Noviembre de 2011 Valor de las Líneas de Pobreza e Indigencia — El siguiente cuadro muestra los valores de las líneas de indigencia y pobreza que se han utilizado para los análisis realizados a partir de la información de la Encuesta CASEN. ($ de noviembre de cada año) Linea de Pobreza 1990 1992 1994 1996 1998 2000 2003 2006 2009 Zona Urbana 18.594 25.750 30.100 34.272 37.889 40.562 43.712 47.099 64.134 Zona Rural 12.538 17.362 20.295 23.108 25.546 27.328 29.473 31.756 43.242 Linea de Indigencia 1990 Zona Urbana Zona Rural 1992 1994 1996 1998 2000 2003 2006 2009 9.297 12.875 15.050 17.136 18.944 20.281 21.856 23.549 32.067 7.164 15.616 16.842 18.146 24.710 9.921 11.597 13.204 14.598 ($ de noviembre de 2009) Linea de Pobreza 1990 1992 1994 1996 1998 2000 2003 2006 2009 Zona Urbana 55.533 57.253 54.849 54.174 54.038 53.883 54.201 53.850 64.134 Zona Rural 37.446 38.603 36.982 36.527 36.434 36.303 36.545 36.308 43.242 Linea de Indigencia 1990 1992 1994 1996 1998 2000 2003 2006 2009 Zona Urbana 27.767 28.627 27.425 27.087 27.018 26.941 27.100 26.925 32.067 Zona Rural 21.396 22.059 21.132 20.872 20.820 20.744 20.883 20.747 24.710 Fuente: CEPAL Incidencia de la Pobreza en la Población — Porcentaje de personas cuyo ingreso es insuficiente para satisfacer sus necesidades básicas; esto es, que pertenecen a hogares cuyos ingresos no son suficientes para satisfacer las necesidades básicas de sus miembros. Incidencia de la Indigencia en la Población — Porcentaje de personas cuyo ingreso es insuficiente para satisfacer sus necesidades alimentarias; esto es, que pertenecen a hogares cuyos ingresos no son suficientes para costear una canasta básica de alimentos a sus miembros. CHILE, Noviembre de 2011 Incidencia de la Pobreza en los Hogares — Porcentaje de hogares cuyos ingresos no son suficientes para satisfacer las necesidades básicas de sus miembros. Incidencia de la Indigencia en los Hogares — Porcentaje de hogares cuyos ingresos no son suficientes para costear una canasta básica de alimentos a sus miembros. CHILE, Noviembre de 2011 INGRESOS: Ingreso Ocupación Principal — Ingreso que obtienen los ocupados en su ocupación principal, ya sea por concepto de trabajo dependiente en el caso de los asalariados (empleados y obreros del sector público, de empresas públicas y del sector privado, servicio doméstico puertas adentro y puertas afuera y miembros de las fuerzas armadas y de orden), o por concepto de trabajo independiente en el caso de los patrones o empleadores y trabajadores por cuenta propia. Ingreso del Trabajo — Ingreso que obtienen los ocupados en su ocupación principal por concepto de sueldos y salarios, ganancias provenientes del trabajo independiente y autoprovisión de bienes producidos por el hogar. Ingreso Autónomo — Ingreso por concepto de sueldos y salarios, ganancias provenientes del trabajo independiente, autoprovisión de bienes producidos por el hogar, bonificaciones, gratificaciones, rentas, intereses, así como jubilaciones, pensiones, montepíos y transferencias entre privados. Subsidios Monetarios — Aportes en efectivo que distribuye el Estado a las personas y los hogares a través de sus programas sociales. En particular, la Encuesta CASEN 2009 registró los subsidios percibidos por los hogares por concepto de Pensión Básica Solidaria de Vejez y de Invalidez, Aporte Previsional Solidario de Vejez e Invalidez, Subsidio Único Familiar, Subsidio a la Discapacidad Mental, Bonos de Protección Familiar y Bono de Egreso de Chile Solidario, Bonos Extraordinarios de Apoyo a la Familia (Marzo) / (Agosto), Subsidio al Pago del Consumo de Agua Potable, Alcantarillado y Tratamiento de Aguas Servidas (SAP), Subsidio Eléctrico, Subsidio de Cesantía y Asignación Familiar. Ingreso Monetario — Suma del ingreso autónomo y los subsidios monetarios. Ingreso Autónomo per cápita del Hogar — Razón entre el ingreso autónomo del hogar y el número de personas que constituyen ese hogar, excluido el servicio doméstico puertas adentro. Distribución del Ingreso por decil (quintil) de Ingreso Autónomo per cápita del Hogar — Para medir la distribución del ingreso entre los hogares, éstos son clasificados en deciles (quintiles), de acuerdo al ingreso autónomo per cápita percibido por el hogar; estimándose luego la participación porcentual de los ingresos de los hogares de cada decil (quintil) en el total de ingresos del total de hogares del país. Para ello: • Se determina el nivel de ingreso autónomo per capita de cada hogar, dividiendo el total de ingresos autónomos de cada hogar por el número de integrantes del mismo. • Los hogares se ordenan en orden creciente, de acuerdo a su nivel de ingreso autónomo per cápita. • Luego, se divide el total de hogares en 10 (5) grupos de igual tamaño, cubriendo cada uno un 10% (20%) del total; de modo que el primer grupo (primer decil / quintil) comprende a los CHILE, Noviembre de 2011 hogares de menores ingresos y el último grupo (décimo decil / quinto quintil) representa a los con mayor ingreso per cápita. • Definidos los deciles (quintiles) se determina la distribución del ingreso por deciles (quintiles), sumando el ingreso autónomo o monetario, según corresponda, de todos los hogares que pertenecen a un decil (quintil) y calculando la participación porcentual del total de ingresos de cada decil (quintil) en el total de ingresos autónomos o monetarios a nivel nacional. Quintil Nacional Autónomo — Quinta parte o 20% de los hogares nacionales ordenados en forma ascendente de acuerdo al ingreso autónomo per cápita del hogar, donde el primer (Quintil I) representa el 20% más pobre de los hogares nacionales y el quinto quintil (Quintil V) el 20% más rico de estos hogares. Quintil Regional Autónomo —Quinta parte o 20% de los hogares de una región ordenados en forma ascendente de acuerdo al ingreso autónomo per cápita del hogar, donde el primer (Quintil I) representa el 20% más pobre de los hogares de la región y el quinto quintil (Quintil V) el 20% más rico de estos hogares. CHILE, Noviembre de 2011 EMPLEO: Población en Edad de Trabajar — Personas de 15 años y más. Fuerza de Trabajo o Población Económicamente Activa — Personas de 15 años y más que durante el período de referencia de la encuesta se encontraban trabajando (semana anterior a la realización de la encuesta) o buscando activamente trabajo (últimas cuatro semanas anteriores a la realización de la encuesta), esto es, ocupados y desocupados. Ocupados — Personas de 15 años y más que durante la semana anterior a la realización de la encuesta trabajaron a lo menos una hora: por un sueldo o salario, de forma independiente para obtener beneficios o ganancia familiar (incluye a los familiares no remunerados), como aprendices o realizando una práctica; y personas con empleo pero que, durante el período de referencia, estuvieron temporalmente ausentes de su trabajo por licencia, huelga, enfermedad, vacaciones u otra razón. Desocupados — Personas de 15 años y más que, durante la semana anterior a la realización de la encuesta, se encontraban sin empleo, y que, en las últimas cuatro semanas anteriores a la realización de la encuesta, hicieron esfuerzos concretos para conseguir empleo. Inactivos — Personas de 15 años y más que durante el período de referencia de la encuesta no se encontraban ocupadas ni desocupadas (estudiantes, jubilados, otra situación), esto es, no integran la población económicamente activa. Tasa de Participación — Porcentaje de la fuerza de trabajo o población económicamente activa (ocupados y desocupados) de 15 años y más con respecto a la población total de 15 años y más. Tasa de Desocupación — Porcentaje de la población desocupada (cesantes y personas que buscan trabajo por primera vez) de 15 años y más con respecto a la fuerza de trabajo o población económicamente activa de 15 años y más. Ocupados por Rama de Actividad Económica — Clasificación de los ocupados durante el período de referencia de la encuesta de acuerdo a la actividad económica de la empresa, negocio o institución donde se desempeñan, esto es, de acuerdo con el tipo de producto o servicio que se genera en ellas. Se utiliza la Clasificación Industrial Internacional Uniforme de todas las actividades económicas, CIIU, de las Naciones Unidas, cuyas Grandes Divisiones, Rev. 2 y 3, son: Agricultura, Minería, Industria manufacturera, Electricidad, gas y agua, Construcción, Comercio, Transportes, Servicios financieros y Otros servicios. Ocupados por Oficio —Clasificación de los ocupados durante el período de referencia de la encuesta en una serie de grupos de acuerdo a las tareas que comporta cada empleo. Se utiliza la Clasificación Internacional Uniforme de Ocupaciones de 1988 (CIUO-88), de responsabilidad de la OIT, cuyos Grandes Grupos son: CHILE, Noviembre de 2011 Directores y gerentes, Profesionales, científicos e intelectuales, Técnicos y profesionales de nivel medio, Personal de apoyo administrativo, Trabajadores de los servicios y vendedores de comercios y mercados, Agricultores y trabajadores calificados agropecuarios, forestales y pesqueros, Oficiales, operarios y artesanos de artes mecánicas y de otros oficios, Operadores de instalaciones y máquinas y ensambladores, Ocupaciones elementales, y Ocupaciones militares. Ocupados por Categoría Ocupacional —Clasificación de los ocupados durante el período de referencia de la encuesta de acuerdo a la posición que la persona adquiere en el ejercicio de su trabajo: Patrón o empleador, Trabajador por cuenta propia, Empleado u obrero del sector público, de empresas públicas y del sector privado, Servicio doméstico puertas adentro y puertas afuera, Familiar no remunerado y FF.AA. y del Orden. Asalariados —Personas de 15 años y más que trabajaron por un sueldo o salario, durante la semana anterior a la realización de la encuesta; o personas, con empleo por el que reciben un sueldo o salario, que no trabajaron por una ausencia temporal (licencia, huelga, enfermedad, vacaciones u otra razón) durante el período de referencia. Incluye empleados y obreros del sector público, de empresas públicas y del sector privado, servicio doméstico puertas adentro y puertas afuera y miembros de las fuerzas armadas y de orden. CHILE, Noviembre de 2011 EDUCACIÓN: Escolaridad Promedio — Promedio de años de estudio declarados como efectivamente cursados por la población de 15 años y más. Tasa de Analfabetismo — Porcentaje de la población de 15 años y más que declara no saber leer ni escribir. Tasa Bruta de Asistencia Preescolar — Razón entre el número total de niños y niñas que asisten a preescolar y la población menor de 6 años, correspondiente al grupo etáreo teórico. Expresada como porcentaje. Tasa Bruta de Asistencia Básica — Razón entre el número total de niños y niñas que asisten a básica y la población de 6 a 13 años, correspondiente al grupo etáreo teórico. Expresada como porcentaje. Tasa Bruta de Asistencia Media — Razón entre el número total de niños y niñas que asisten a media y la población de 14 a 17 años, correspondiente al grupo etáreo teórico. Incluye alumnos en sistema de nivelación de estudios. Expresada como porcentaje. Tasa Bruta de Asistencia Superior — Razón entre el número total de alumnos y alumnas que asisten a superior y la población de 18 a 24 años, correspondiente al grupo etáreo teórico. Expresada como porcentaje. Tasa Neta de Asistencia Preescolar —Razón entre el número de niños y niñas menores de 6 años que asisten a preescolar y la población menor de 6 años, correspondiente al grupo etáreo teórico. Tasa Neta de Asistencia Básica — Razón entre el número de niños y niñas de 6 a 13 años que asisten a básica y la población de 6 a 13 años, correspondiente al grupo etáreo teórico. No incluye educación especial. Expresada como porcentaje. Tasa Neta de Asistencia Media —Razón entre el número de niños y niñas de 14 a 17 años que asisten a media y la población de 14 a 17 años, correspondiente al grupo etáreo teórico. No incluye educación especial. Expresada como porcentaje. Tasa Neta de Asistencia Superior —Razón entre el número de alumnos y alumnas de 18 a 24 años que asisten a superior y la población de 18 a 24 años, correspondiente al grupo etáreo teórico. Expresada como porcentaje. CHILE, Noviembre de 2011 Cobertura de Educación Preescolar —Razón entre el número total de niños y niñas que asisten a preescolar y la población del grupo etáreo ajustada. El ajuste se efectúa sumando a la población del grupo etáreo teórico (menor de 6 años) a los mayores de 6 años que asisten a preescolar y restando a los menores de 6 años que asisten a básica o educación especial. Expresada como porcentaje. Cobertura de Educación Básica —Razón entre el número total de niños y niñas que asisten a básica y educación especial y la población del grupo etáreo ajustada. El ajuste se efectúa sumando a la población del grupo etáreo teórico (entre 6 y 13 años) a los menores de 6 años y mayores de 13 años que asisten a básica y educación especial y restando a los niños y niñas de este grupo etáreo que asiste a otros niveles educacionales (menores de 14 años que asisten a media y mayores de 5 años que asisten a preescolar). Expresada como porcentaje. Cobertura de Educación Media —Razón entre el número total de niños y niñas que asisten a media y la población del grupo etáreo ajustada. El ajuste se efectúa sumando a la población del grupo etáreo teórico (entre 14 y 17 años) a los menores de 14 años y mayores de 17 años que asisten a media y restando a los niños y niñas de este grupo etáreo que asiste a otros niveles educacionales (niños y niñas de 14 a 17 años que asisten a educación básica, especial, de adultos y superior). Expresada como porcentaje. Cobertura de Programas —Porcentaje de alumnos beneficiarios del programa de que se trate dentro de la población respectiva. CHILE, Noviembre de 2011 SALUD: Sistema Previsional de Salud — Constituye un sistema mixto, integrado por instituciones y organismos públicos y privados. El subsector público está representado principalmente por el Fondo Nacional de Salud, FONASA, y el subsector privado por las Instituciones de Salud Previsional, ISAPRES. FONASA otorga cobertura de atención tanto a las personas que cotizan el 7% de sus ingresos mensuales para la salud en dicho fondo, como a aquéllas que, por carecer de recursos propios, financia el Estado a través de un aporte fiscal directo. La Encuesta CASEN 2009 considera las siguientes alternativas: • Sistema Público Grupo A: Corresponde al Grupo A de la Ley de Salud 18.469. Se define en esta categoría a las personas que tienen tarjeta de gratuidad otorgada por el consultorio por ser definidos como &quot;carentes de recursos&quot;. Incluye a los beneficiarios de Pensiones Básicas Solidarias, los causantes del Subsidio Familiar, los miembros de las familias Chile Solidario y los beneficiarios del programa PRAIS (programa de retornados), entre otros. • Sistema Público Grupo B: Corresponde al Grupo B de la Ley de Salud 18.469. Se define como afiliados a este grupo a las personas cuyo ingreso imponible mensual es igual o menor a $ 165.000. • Sistema Público Grupo C: Corresponde al Grupo C de la Ley de Salud 18.469. Se define como afiliados a este grupo a las personas cuyo ingreso imponible mensual es mayor a $165.000 y menor o igual a $240.900. Si una persona dentro de este tramo de ingresos cuenta con más de tres cargas familiares pasa al Grupo B • Sistema Público Grupo D: Corresponde al Grupo D de la Ley de Salud 18.469. Se define como afiliados a este grupo a las personas cuyo ingreso imponible mensual es mayor a $240.900. Si una persona dentro de este tramo de ingresos cuenta con más de tres cargas familiares pasa al grupo C. • Sistema Público. No sabe grupo. • Sistema de las F. F. A. A. y del Orden: Corresponde a instituciones previsionales exclusivas de las F. F. A. A. y del Orden (CAPREDENA, DIPRECA). • ISAPRES: Corresponde a las Instituciones de Salud Previsional abiertas (ejemplo, Banmédica, Colmena, Consalud, Cruz Blanca, Ferrosalud, Más Vida, Vida Tres) y cerradas, ligadas a una empresa o a un grupo de empresas, (ejemplo, Banco del Estado, Cruz del Norte, Chuquicamata, Fundación, FUSAT, Río Blanco, San Lorenzo). • Otro Sistema: Corresponde a cualquier otro sistema previsional de salud no contemplado en las categorías anteriores. Entre otros, seguros privados de salud (ejemplo, Bicevida, Consorcio, Interamericana de Seguros), seguros extranjeros, Servicio Médico y Dental de Alumnos de la Universidad de Chile, SEMDA. • Ninguno (Particular): Corresponde a las personas que no están afiliadas a algún sistema previsional de salud y costean totalmente y en forma particular las prestaciones de salud. Estado nutricional del niño — Se refiere al diagnóstico más reciente en los últimos 6 meses registrado en el Carnet de Control del Niño Sano (diagnóstico integrado). La información es obtenida por el encuestador directamente del CHILE, Noviembre de 2011 carnet, a menos que el informante no disponga del mismo al momento de la entrevista, registrándose su respuesta. De acuerdo con los diversos estados nutricionales considerados en el Carnet de Control, la Encuesta CASEN considera: • Desnutrido: D o DS (desnutrición secundaria) en el Carnet de Control del Niño Sano • En Riesgo de Desnutrición: RD o R en el Carnet de Control del Niño Sano • Normal: N en el Carnet de Control del Niño Sano • Sobrepeso: SP o S en el Carnet de Control del Niño Sano • Obeso: O u OB en el Carnet de Control del Niño Sano Estado nutricional de la mujer embarazada o amamantando — Se refiere al diagnóstico más reciente en los últimos 6 meses registrado en el Carnet de Control Maternal. La información es obtenida por el encuestador directamente del carnet, a menos que el informante no disponga del mismo al momento de la entrevista, registrándose su respuesta. De acuerdo con los diversos estados nutricionales considerados en el Carnet de Control, la Encuesta CASEN considera: • Bajo Peso: BP o A en el Carnet de Control Materna • Normal: N o B en el Carnet de Control Materna • Sobrepeso: SP, S o C en el Carnet de Control Maternal • Obesa: O, OB o D en el Carnet de Control Maternal Estado nutricional del adulto mayor: — Se refiere al diagnóstico más reciente en los últimos 6 meses registrado en el Carnet de Control del Adulto Mayor. La información es obtenida por el encuestador directamente del carnet, a menos que el informante no disponga del mismo al momento de la entrevista, registrándose su respuesta. De acuerdo con los diversos estados nutricionales considerados en el Carnet de Control, la Encuesta CASEN considera: • Enflaquecido: E o BP (bajo peso) en el Carnet de Control del Adulto Mayor • Normal: N en el Carnet de Control del Adulto Mayor • Sobrepeso: SP o S en el Carnet de Control del Adulto Mayor • Obeso: O u OB en el Carnet de Control del Adulto Mayor CHILE, Noviembre de 2011 Retiro de Alimentos — Se refiere al retiro en los últimos 3 meses de alimentos que entrega el Programa Nacional de Alimentación Complementaria, PNAC, a los menores de 6 años (hasta tres, entre Leche Purita Fortificada (26%), Leche Cereal, Mi Sopita, Fórmula para prematuros, Fórmula de continuación, Sustituto lácteo libre de fenilalanina) y a las mujeres embarazadas o amamantando (Leche Purita Fortificada (26%), Leche Purita Mamá) y el Programa de Alimentación Complementaria para el Adulto Mayor, PACAM, a los adultos mayores (Bebida Láctea Años Dorados, Crema Años Dorados, Bebida Láctea Años Dorados y Crema Años Dorados). Examen de Papanicolaou (PAP) — Examen ginecológico que permite detectar tempranamente cualquier anomalía precursora del cáncer cérvico uterino y da la posibilidad de controlar o curar totalmente la enfermedad, evitando una serie de muertes prematuras. El Ministerio de Salud ha realizado diversas campañas para conseguir aumentar la cobertura de este examen entre las mujeres de 25 a 64 años. El examen se hace en todos los consultorios del país en forma totalmente gratuita y en el sistema de salud privado este procedimiento forma parte del examen también gratuito de medicina preventiva. Garantías Explícitas en Salud, GES: — El Régimen General de Garantías en Salud establece las GES, constitutivas de derechos para los beneficiarios, cuyo cumplimiento puede ser exigido ante FONASA o las ISAPRES, la Superintendencia de Salud y las demás instancias que correspondan. Las GES se refieren a acceso, calidad, protección financiera y oportunidad con que deben ser otorgadas las prestaciones asociadas a un conjunto priorizado de programas, enfermedades o condiciones de salud. El régimen de GES comenzó a operar para afiliados de FONASA e ISAPRES el 1° de julio de 2005. CHILE, Noviembre de 2011 VIVIENDA: Zona Urbana — Conjunto de viviendas concentradas con población mayor a 2.000 habitantes, o entre 1.001 y 2.000 habitantes, donde al menos el 50% de la población económicamente activa se dedica a actividades secundarias o terciarias. Zona Rural —Conjunto de viviendas concentradas o dispersas con población menor a 1.000 habitantes, o entre 1.001 y 2.000 habitantes donde menos del 50% de la población económicamente activa se dedica a actividades secundarias o terciarias. Indice de Materialidad de la Vivienda — Permite conocer las condiciones materiales de las viviendas en que viven los hogares. Se construye a partir de los materiales predominantes en paredes exteriores, cubierta de techo y pisos. Establece las categorías de Aceptable, Recuperable e Irrecuperable para los muros, techos y piso. Dimensión Definición de categorías según material predominante en: Indicador Categorías De acero u hormigón armado; albañilería de ladrillo, bloques de cemento o piedra; tabique forrado por ambas caras ( madera u otro) Paredes Exteriores ACEPTABLE Adobe; tabique sin forro interior (madera u otro); barro, quincha, pirca u otro artesanal tradicional RECUPERABLE Material de desechos o reciclaje (cartón, lata, sacos, plásticos) y otros materiales IRRECUPERABLE Tejas; tejuela, losa de hormigón con cielo interior; zinc o pizarreño con cielo interior; zinc, pizarreño, teja, tejuela o madera sin cielo interior; ACEPTABLE Fonolita; paja, coirón, totora o caña. RECUPERABLE Material de desechos o reciclaje (plásticos, latas, etc.) IRRECUPERABLE Techo CHILE, Noviembre de 2011 Piso Radier revestido (parquet, cerámica, tabla, linóleo, flexit, baldosa, alfombra, etc.) ACEPTABLE Radier no revestido, tabla o parquet sobre soleras o vigas; madera, plásticos o pastelones directamente sobre tierra RECUPERABLE Piso de tierra IRRECUPERABLE Con esta información se clasifica las viviendas de acuerdo al Índice de Materialidad en las categorías de Materialidad Aceptable, Recuperable e Irrecuperable, según se cumpla las siguientes condiciones: Indice De Materialidad Materialidad Aceptable Materialidad Recuperable Materialidad Irrecuperable Materialidad en muros, piso y techo aceptable Muro recuperable, y un indicador aceptable, sea piso o techo Más de un indicador recuperable y ningún indicador irrecuperable Al menos un indicador irrecuperable (muro, piso o techo) CHILE, Noviembre de 2011 Indice de Saneamiento de la Vivienda — Permite conocer las condiciones de saneamiento necesarias para el funcionamiento de la vivienda, referidas a disponibilidad de agua y el medio de eliminación de excretas. Este índice considera que cuando el agua llega directamente por cañería dentro de la vivienda, califica como aceptable, aun cuando su origen sea pozo, noria, río o vertiente. Esto, al considerar que la infraestructura necesaria y los permisos sanitarios hacen que en la mayoría de los casos su calidad sea potable. Definición de categorías según disponibilidad de agua y servicio higiénico Dimensión Disponibilidad de Agua Servicio Higiénico Indicador Categorías Con llave dentro de la vivienda Aceptable Con llave dentro del sitio pero fuera de la vivienda. No tiene sistema, la acarrea Deficitario WC conectado al alcantarillado WC conectado a fosa séptica Aceptable Letrina sanitaria conectada a pozo negro Cajón sobre pozo negro Cajón sobre acequia o canal Cajón conectado a otro sistema No tiene servicio higiénico (WC) Deficitario A partir de esta información el Indice de Saneamiento clasifica las viviendas con saneamiento aceptable y deficitario de acuerdo a las categorías obtenidas en el sistema de agua y la eliminación de excretas. Índice De Saneamiento Saneamiento Deficitario Disponibilidad agua deficitaria o Servicio higiénico deficitario Saneamiento Aceptable Disponibilidad agua aceptable y Servicio higiénico aceptable CHILE, Noviembre de 2011 Indice Tipo de la Vivienda De acuerdo a los tipos de vivienda que recoge la Encuesta CASEN, se asignan las categorías Aceptable e Irrecuperable, independientemente de su materialidad o saneamiento, según el siguiente criterio: Definición de categorías según tipo de vivienda Dimensión Indicador Categorías Casa, casa en cité; Casa en condominio; Departamento en edificio; Pieza en casa antigua o conventillo Tipo Aceptable Mediagua; Mejora; Rancho, choza; Ruca Móvil (carpa, vagón, etc.) Otro tipo de vivienda particular Tipo Irrecuperable Tipo de Vivienda Indice Calidad Global de la Vivienda — El Indice de Calidad Global de la Vivienda reúne los índices de materialidad, saneamiento y tipo de vivienda. Este indicador diferencia el parque de viviendas en Viviendas de calidad Aceptable, Recuperable e Irrecuperables. Clasifica como Aceptables las viviendas con materialidad, saneamiento y de tipo aceptables y como Recuperables las viviendas con saneamiento deficitario o materialidad recuperables, siempre y cuando el tipo de vivienda no sea irrecuperable. Las viviendas Irrecuperables corresponden a las viviendas con materialidad irrecuperable o tipo irrecuperable (independiente del saneamiento). Se considera como irrecuperables todas las viviendas del tipo mediagua, aun cuando su saneamiento o materialidad sean aceptables o recuperables. Índice de calidad global de la vivienda Tipo de Vivienda Índice de Saneamiento Índice de Materialidad Aceptable Aceptable Aceptable Deficitario Recuperable (solo muro recuperable resto aceptable) Aceptable Recuperable Categorías Vivienda calidad Aceptable Vivienda calidad Recuperable Aceptable Aceptable Recuperable Irrecuperable Irrecuperable Aceptable Deficitario Recuperable Irrecuperable Vivienda calidad irrecuperable CHILE, Noviembre de 2011 Allegamiento — El allegamiento es la estrategia utilizada por los hogares y núcleos familiares para solucionar la falta de vivienda, compartiendo una vivienda con otro hogar o núcleo. La Encuesta Casen identifica los diferentes hogares al interior de una vivienda y los diferentes núcleos al interior de un hogar, así como si son receptores o allegados, y el tipo de allegamiento: allegamiento externo y allegamiento interno. Modalidades de allegamiento 1 núcleo familiar Sin Allegamiento 2 o más núcleos Hogares con Nucleos Secundarios Cada hogar tiene 1 solo núcleo Hogares que Comparten la Vivienda con otro Hogar Al menos un hogar tiene 2 o más núcleos Hogares que Comparten la Vivienda con otros Hogares y Nucleos 1 Hogar Vivienda 2 o más hogares Indice de Hacinamiento — Razón entre el número de personas residentes en la vivienda y el número de dormitorios de la misma, considerando piezas de uso exclusivo o uso múltiple. Contempla las categorías: sin hacinamiento, medio y crítico. Indice De Hacinamiento Personas por dormitorio en la vivienda Tipo de hacinamiento 2,4 y menos Sin hacinamiento 2,5 a 4,9 Hacinamiento medio 5 y más Hacinamiento critico CHILE, Noviembre de 2011 METODOLOGÍA CASEN 2011 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 1 Metodología del Diseño Muestral y Factores de Expansión Encuesta de Caracterización Socioeconómica Nacional OBSERVATORIO SOCIAL Documentos Metodológicos, Nº1 13 de Septiembre de 2012 Versión Revisada Metodología del Diseño Muestral y Factores de Expansión Casen 2011 2 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Contenido I. Presentación ................................................................................ 5 II. Síntesis ....................................................................................... 6 1. 2. 3. OBJETIVOS ……………………………………………………………………………………….6 MÉTODOS ……………………………………………………………………………………….6 RESULTADOS .......................................................................... 6 III. Resumen Ejecutivo ....................................................................... 7 IV. Antecedentes del Diseño 2011 ....................................................... 10 1. 2. V. Diseño Muestral ............................................................................ 15 1. 2. 3. 4. 5. VI. CAMBIOS EN DISEÑO MUESTRAL 1987-2009 .................................... 10 CAMBIOS EN DISEÑO MUESTRAL 2011 ............................................. 12 2.1. Evaluación del diseño muestral vigente ........................... 12 2.2. Principales características del diseño muestral 2011 ......... 13 CARACTERÍSTICAS DEL MARCO MUESTRAL ........................................ 15 1.1. Cobertura del Marco Muestral ........................................ 18 1.2. Estratificación del Marco Muestral ................................... 20 ESTIMACIÓN Y DISTRIBUCIÓN DEL TAMAÑO MUESTRAL ......................... 21 2.1. Estimación del Tamaño Muestral por Región .................... 21 2.2. Distribución de la Muestra entre Comunas al interior de la Región................................................................................. 26 SELECCIÓN DE CONGLOMERADOS................................................... 29 3.1. Selección de Conglomerados desde el Marco Urbano ........ 29 3.2. Selección de Conglomerados desde el Marco Rural ........... 31 SELECCIÓN DE VIVIENDAS ........................................................... 32 4.1. Enumeración de los Conglomerados ............................... 32 4.2. Selección de las Viviendas ............................................. 34 REDISTRIBUCIÓN DE CONGLOMERADOS ENTRE LAS SUBMUESTRAS 1 Y 2 ..... 37 Desarrollo de factores de Expansión ................................................ 39 1. 2. 3. 4. 5. 6. VISIÓN GENERAL ...................................................................... 39 PONDERADOR DE SELECCIÓN ........................................................ 42 2.1. Probabilidades de selección de los Conglomerados ........... 42 2.2. Inverso de las Probabilidades de selección ....................... 50 2.3. Ajuste por omisión de Conglomerados ............................ 54 PONDERACIÓN DE SELECCIÓN DE VIVIENDAS ...................................... 59 3.1. Probabilidad Condicional de selección de una vivienda ...... 59 3.2. Ponderador de selección de viviendas ............................. 59 PONDERACIÓN POR ELEGIBILIDAD .................................................. 63 4.1. Ajuste por Elegibilidad Desconocida ................................ 63 4.2. Ajuste por No Elegibilidad .............................................. 67 PONDERACIÓN POR NO RESPUESTA ................................................. 67 PONDERACIÓN DE CALIBRACIÓN .................................................... 73 3 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 6.1. 6.2. VII. Estimación de Varianza ................................................................. 82 1. 2. 3. 4. 5. 6. 7. VIII. Ponderador de Calibración Regional ................................ 74 Ponderador de Calibración Comunal................................ 78 EL ESTIMADOR ........................................................................ 82 VARIANZA DEL ESTIMADOR .......................................................... 84 VARIABLES QUE IDENTIFICAN EL DISEÑO MUESTRAL COMPLEJO ................. 86 3.1. Creación de pseudo-estratos (varstrat) ........................... 87 3.2. Creación de pseudo-conglomerados (varunit) .................. 88 ESTIMACIÓN DE VARIANZAS EN MUESTRA COMPLEJA CASEN 2011 ........... 89 RESULTADOS NIVEL NACIONAL ..................................................... 91 RESULTADOS NIVEL REGIONAL...................................................... 93 MÁRGENES DE ERROR PROYECTADOS, EFECTIVOS E HISTÓRICOS…………….95 Anexos………………………………………………………………………………………………….. 99 4 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 I. Presentación Este informe describe el diseño muestral de la Encuesta de Caracterización Socioeconómica Nacional (Casen) 2011 e informa las implicancias para la investigación y análisis de innovaciones en distintos aspectos del mismo. En otros reportes se presentarán resultados acerca de las tasas de respuesta, errores de medición, resultados generales del trabajo de campo y guías para el análisis a partir de los datos de la encuesta. La encuesta Casen 2011 fue diseñada por el Ministerio de Desarrollo Social y los datos fueron recolectados y procesados, en parte, por su contratista, el Centro de Microdatos del Departamento de Economía de la Universidad de Chile. El diseño y selección de la muestra, así como el cálculo de los factores de expansión y de márgenes de error fueron realizados por el Instituto Nacional de Estadísticas (INE) en conjunto con el Ministerio. La corrección y ajuste de ingresos a cuentas nacionales, estuvieron a cargo de la Comisión Económica para América Latina (CEPAL). Las estimaciones de pobreza comunal, utilizando la metodología de Estimación para Áreas Pequeñas, serán realizadas bajo la asistencia técnica del Programa de Naciones Unidas para el Desarrollo (PNUD). Este informe fue preparado por el Ministerio de Desarrollo Social en conjunto con el Instituto Nacional de Estadísticas. 5 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 II. Síntesis 1. Objetivos La Encuesta de Caracterización Socioeconómica Nacional (Casen) recolecta datos acerca de características sociales y económicas de una muestra representativa de la población que reside en hogares particulares en Chile. Este reporte describe el diseño muestral de la nueva estrategia de recolección de datos implementado a partir de Casen 2011 y los efectos de ese diseño en el desarrollo de factores de expansión y procedimientos para la estimación de la varianza. El conocimiento de estos aspectos del diseño es fundamental para los investigadores que planean analizar los datos de Casen 2011. Se planea liberar dos bases de datos. La primera, denominada “Casen 2011-S2”, correspondiente a la submuestra 2, cubre las 8 semanas de recolección de datos comprendidas entre el 26 de noviembre de 2011 y el 22 de enero de 2012. Esta base abarca un periodo de tiempo que en promedio tiende a coincidir con los periodos de recolección de datos de versiones anteriores de la encuesta. Esta es la base que por lo tanto se utiliza para generar las estadísticas oficiales de pobreza y distribución de ingresos del 2011 1 . La segunda base, denominada simplemente “Casen 2011”, cubrirá las 13 semanas de recolección de datos entre el 17 de octubre y el 22 de enero de 2012. Esta última base incluye datos adicionales recolectados durante las 5 semanas comprendidas entre el 17 de octubre y el 22 de noviembre de 2011, periodo en el cual generalmente no se recolectaron datos en versiones anteriores de la Encuesta. Junto con la liberación de la base Casen 2011 se entregará un set de factores de expansión que permita el análisis de los datos combinados de la Encuesta completa. 2. Métodos El diseño de la Encuesta Casen 2011 se basa en dos muestras probabilísticas, independientes y que comparten el mismo diseño muestral (submuestra 1 y submuestra 2). El trabajo de campo fue implementado por el Centro de Microdatos del Departamento de Economía de la Universidad de Chile bajo contrato con el Ministerio de Desarrollo Social. Las entrevistas se aplicaron en modalidad cara-a-cara, por encuestadores profesionales, utilizando cuestionario en papel. 3. Resultados La tasa de no respuesta a las preguntas de la encuesta fue en general baja2, sin embargo y al igual que en versiones anteriores, se realizó un proceso de imputación para los datos faltantes en variables consideradas clave para las estimaciones de pobreza y distribución de ingresos 3. La imputación simple de los datos se realiza a través de los métodos de medias condicionadas y hot-deck. En forma posterior a la imputación, y también como en versiones anteriores, se 1 Se dice “en promedio” dado que las encuesta Casen anteriores presentan algunas diferencias en el período de recolección de los datos. 2 En la versión 2011, la no respuesta a las principales preguntas del ingreso fluctuó entre 2 y 10%. 3 Se entiende como “datos faltantes” los casos donde, habiéndose declarado la existencia de una actividad generadora de ingresos, no se reporta el monto de los mismos. Hay tres situaciones principales a considerar a este respecto: ocupados que trabajan con remuneración y que no reportan los ingresos del trabajo; pensionados que no reportan sus pagos; personas que viven en una vivienda propia y que no declaran una estimación del valor del arriendo imputado. 6 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 realiza el proceso de ajuste de las partidas más importantes de ingresos4 con el objetivo de calibrar los resultados de la Encuesta a sus referentes en las Cuentas Nacionales. Tanto el procedimiento de imputación como el de ajuste de los ingresos son realizados, a requerimiento del Ministerio, por CEPAL. Las variables de ingresos incluidas en las bases de datos Casen puestas a disposición del público, corresponden a las partidas de ingresos ya imputadas y ajustadas. III. Resumen Ejecutivo La Encuesta de Caracterización Socioeconómica Nacional (Casen) recolecta datos acerca de características sociales y económicas de una muestra representativa de la población que reside en hogares particulares en Chile. Este informe describe los procedimientos utilizados para seleccionar la muestra, desarrollar los factores de expansión y estimar los errores muestrales5. Se recomienda considerar esta información a quienes realicen investigaciones a partir de los datos de la Encuesta Casen, o bien, que deseen comparar los procedimientos de otras encuestas con los empleados en Casen. La Encuesta Casen es diseñada y administrada por el Ministerio de Desarrollo Social (ex Mideplan) - institución responsable de evaluar la situación socioeconómica, así como el impacto de los programas sociales en las condiciones de vida de la población, para obtener periódicamente datos útiles para el diseño y evaluación de la política social existente en el país. En este contexto, el objetivo de la Encuesta es producir estimaciones confiables sobre: • • • La situación socioeconómica de los hogares y de la población. En particular, estimar la magnitud de la pobreza y la distribución del ingreso. Aspectos demográficos, de educación, salud, vivienda, trabajo e ingresos de aquellos grupos definidos como prioritarios por la política social (infancia, juventud, adultos mayores, mujeres, pueblos indígenas, personas con discapacidad). La cobertura, la focalización y la distribución del gasto fiscal de los principales programas sociales de alcance nacional entre los hogares y la población. La Encuesta Casen 2011 fue levantada por el Centro de Microdatos del Departamento de Economía de la Universidad de Chile, bajo contrato con el Ministerio de Desarrollo Social. Las entrevistas fueron aplicadas en modalidad cara-a-cara, por encuestadores profesionales, en cuestionarios de papel. El cuestionario fue diseñado para demorar aproximadamente 60 minutos en hogares de 4 a 5 personas. La revisión del cuestionario 2009, en preparación para el desarrollo de la versión 2011, fue desarrollada por el Ministerio de Desarrollo Social a través de un proceso de consulta que contó con la participación de 35 instituciones de los sectores público y de organismos internacionales6. 4 El procedimiento se realiza para las partidas de sueldos y salarios, ingresos del trabajo independiente, pensiones, renta imputada por la vivienda propia e ingresos del capital. 5 El foco de este documento es la descripción del diseño, selección de la muestra y desarrollo de los factores de expansión. La descripción del proceso de corrección y ajuste de ingresos se encuentra en el documento “La medición de los ingresos en la encuesta Casen (Cepal, 2012)”. 6 Talleres Intersectoriales Casen 2011. Santiago, 2 al 9 de Mayo de 2011. Reuniones bilaterales con equipos técnicos de Ministerios y organismos internacionales entre junio y agosto de 2011. 7 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 La muestra 2011 es la más grande que se ha levantado en la historia de la Encuesta. El aumento es mayor en las regiones extremas del país, donde históricamente se ha concentrado menor proporción de la muestra. Esto se explica porque el tamaño muestral se determinó, por primera vez, con el objetivo de mejorar el nivel de precisión7 de las estimaciones de la tasa de pobreza a nivel regional. Otras dos innovaciones incluyen la extensión del periodo de recolección de datos (desde mediados de octubre hasta mediados de enero) y la utilización del sistema de submuestras para la recolección de los datos. La extensión del periodo de recolección de datos de la Encuesta Casen es parte de la estrategia de rediseño de la Encuesta que busca mejorar la calidad de la recolección de datos. Este diseño busca maximizar el uso de recursos y obtener respuestas de mejor calidad a partir de (1) la producción de un flujo de trabajo continuo, (2) utilizando un equipo más pequeño de encuestadores mejor entrenados8, y (3) el monitoreo continuo del proceso de recolección de datos que permita, de ser necesario, optimizar las estrategias durante el trabajo de campo. Esta estrategia de recolección de datos es utilizada para encuestas de hogares en EEUU, Brasil, Uruguay, Colombia y El Salvador 9. En Chile, la Encuesta Nacional de Empleo (ENE y NENE) también comparte este tipo de diseño. Dado que implementar una muestra única hubiera generado problemas de comparabilidad con la serie completa Casen (porque los períodos muestrales son distintos) es que se optó por dividir el período completo en 2 submuestras, cada una con representatividad regional y nacional, siendo la segunda submuestra levantada en el mismo período que tradicionalmente se ha aplicado la encuesta Casen10. La introducción de un sistema de submuestras persigue mejorar el control de la distribución de la muestra a lo largo del periodo de levantamiento. La estrategia permite generar estimaciones nacionales a partir de cada submuestra o bien combinar ambas submuestras para mejorar la precisión de las estimaciones regionales. La muestra 2011 se recolectó sobre la base de dos muestras independientes que comparten el mismo diseño muestral. La primera, denominada “Submuestra 1” (Casen 2011-S1), se levantó por 5 semanas entre el 17 de octubre y el 22 de noviembre de 2011. La segunda, denominada “Submuestra 2” (Casen 2011-S2), se levantó durante 8 semanas desde el 22 de noviembre de 2011 hasta el 22 de enero de 2012. Esta última submuestra cubre un periodo de tiempo que en promedio tiende a coincidir con los periodos de recolección de datos de versiones anteriores de la Encuesta. La “Submuestra 1”, 7 Precisión (estadística): “Cercanía de los estimadores a los valores verdaderos. Resultado de errores aleatorios y errores sistemáticos”. Ehling, M., and T. Körner (2007). 8 En las últimas versiones se ha evidenciado la creciente complejidad de coordinar la implementación de una encuesta de la magnitud de Casen. En la versión 2009, por ejemplo, se contrató a cerca de 1.500 encuestadores para recolectar 70 mil encuestas. En contraste, la versión 2011 mantuvo un máximo de 1.000 encuestadores para recolectar 87 mil encuestas. 9 En EEUU, encuestas de hogares que utilizan esta estrategia de recolección de datos incluyen: American Community Survey (ACS), National Health Inmunization Survey (NHIS) y National Survey of Family Growth (NSFG), entre otras. En América Latina, esta estrategia la siguen las encuestas de hogares de Brasil (Encuesta Nacional por Muestra de Viviendas, PNAD Continua), Uruguay (Encuesta Nacional de Hogares Ampliada, ENHA, Encuesta Continua de Hogares), Colombia (Gran Encuesta Integrada de Hogares, GEIH) y El Salvador (Encuesta de Hogares de Propósitos Múltiples). 10 Históricamente, la encuesta Casen se recolecta en un periodo de aproximadamente 8 semanas entre los meses de noviembre y enero, con el 50-60% de la muestra entrevistada durante el mes de diciembre. 8 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 por otra parte, cubre un periodo de tiempo en que generalmente no se han recolectado datos en versiones anteriores de la Encuesta. Para efectos de comparación de la serie de tiempo de las estadísticas de trabajo, pobreza y distribución de ingresos, se recomienda utilizar exclusivamente la “Submuestra 2”, puesto que podría haber factores estacionales necesarios de considerar al hacer comparaciones con versiones anteriores de la encuesta. Casen es una encuesta de hogares que selecciona viviendas en la muestra con distintas probabilidades de selección en distintas áreas geográficas del país. Por lo tanto, para producir estimaciones insesgadas, se deben utilizar los factores de expansión apropiados de manera de compensar por las distintas probabilidades de selección y probabilidades de responder la encuesta. Para generar estimaciones de los errores de muestreo se deben utilizar paquetes estadísticos que permitan incorporar el efecto de los factores de expansión, estratos, conglomerados y fracciones de muestreo del diseño muestral 2011. Paquetes que incorporan estas características son Stata, SPSS y SAS entre otros. El resto de este informe describe la forma en que la muestra 2011 fue diseñada y seleccionada, cómo los factores de expansión fueron desarrollados y ajustados para compensar por la falta de respuesta y controles de población total, y cómo se pueden obtener estimaciones del margen de error de las variables de interés incorporando información sobre el diseño complejo de la encuesta. El reporte se puede leer en tres niveles de detalle: Primero, el resumen ejecutivo es para quienes requieren de una visión más general y no técnica de los procedimientos de la encuesta. Segundo, se proveen resúmenes para cada gran sección del reporte, los que entregan información más detallada de cada aspecto del diseño. Tercero, en el resto del informe se ofrecen más detalles técnicos. Quienes lean el informe completo encontrarán algunos temas descritos brevemente en los resúmenes y luego más profusamente en el resto de cada sección. 9 10 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 IV. Antecedentes del Diseño 2011 A lo largo de los años, la Encuesta Casen ha evolucionado en varios aspectos relacionados con la forma en que es planeada, diseñada y ejecutada. Aquí se revisan los cambios más importantes en relación al diseño de la muestra Casen. 1. Cambios en diseño muestral 1987-2009 A lo largo de los años, el Ministerio ha solicitado a diversos expertos recomendaciones para mejorar el diseño muestral de la Encuesta. El año 1996 convoca al grupo de trabajo integrado por INE, el Centro Interamericano de Enseñanza Estadística (CIENES) y la Universidad de Chile para la definición del diseño de la muestra. El diseño y los lineamientos desarrollados por este grupo se aplican en las Encuestas Casen entre 1996 y 2003. En 2008 el Ministerio solicita a la Comisión Económica para América Latina (CEPAL) una evaluación estadística de la Encuesta. En 2009 el Ministerio conforma una comisión para evaluar la propuesta de cambio de marco muestral recomendada por el INE. A continuación se listan los cambios más relevantes implementados entre 1987 y 2009 en relación al diseño de la muestra. Marco muestral Entre 1987 y 1994, se utilizó el marco desarrollado a partir de la información cartográfica del Censo de Población y Vivienda del año 1982, la Fuerza Aérea de Chile, el instituto de Recursos Naturales y la Corporación de Fomento para la Producción (CORFO). Entre 1996 y 2000, se hizo uso del marco del Censo de Población y Vivienda del año 1992. Mientras que para el 2003 se utilizó el marco desarrollado por el INE a partir de la información cartográfica del PreCenso 2002. En 2006 y 2009, se utilizó el marco “Programa Integrado de Encuestas de Hogares” (PIDEH) desarrollado por el INE a partir de la información cartográfica del Censo de Población y Vivienda del año 2002. Instituciones responsables del diseño muestral Entre 1987 y 1994 la institución responsable del diseño de muestral es el Departamento de Economía de la Universidad de Chile. Entre 1996 y 2003 el diseño es definido bajo criterios establecidos por un grupo de trabajo compuesto por Mideplan, INE, Centro Interamericano de Enseñanza Estadística (CIENES) y Universidad de Chile. A partir de 2006 el diseño de la muestra es definido por Mideplan e INE. Diseño muestral Entre 1987 y 1994 el diseño muestral se caracteriza por ser estratificado y trietápico en todas las comunas del país11. Entre 1996 y 2003 el diseño es estratificado bietápico en las comunas autorepresentadas, y estratificado trietápico en las no autorepresentadas12. A partir de 2006 el diseño es estratificado y bietápico en todas las comunas del país13. 11 Número de comunas autorepresentadas: 1987 (n=48), (n=209). 12 Número de comunas autorepresentadas: 1996 (n=124), (n=302). 1990 (n=72), 1992 (n=138) y 1994 1998 (n=196), 2000 (n=286) y 2003 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 11 Selección y actualización de la Muestra Entre 1987 y 2003 la institución responsable de la selección y actualización de la muestra es el Departamento de Economía de la Universidad de Chile. A partir de 2006 la institución a cargo de la selección y actualización de la muestra es el INE. Instituciones responsables del cálculo de Factores de Expansión Entre 1987 y 2006 el cálculo de los factores de expansión está a cargo del Departamento de Economía de la Universidad de Chile. En 2009 este cálculo fue realizado por Mideplan. Cálculo de factores de expansión Entre 1987 y 1994 los factores de expansión se determinan como el cociente entre las proyecciones de población y la muestra lograda en cada comuna. A partir de 1996, se estiman como el inverso de la probabilidad de selección de las viviendas, ajustadas por la proyección de población en hogares particulares en cada comuna (al 30 de noviembre del año de la Encuesta). En 2005, se desarrollan nuevos factores de expansión para las encuestas Casen 1996, 1998 y 2000, en atención a la disponibilidad de las proyecciones de población basadas en el Censo de Población y Vivienda del año 2002. Tamaño muestral efectivo Hogares entrevistados entre 1987 y 1998: 22.793 en 1987, 25.793 en 1990, 35.948 en 1992, 45.379 en 1994, 33.636 en 1996, y 48.107 en 1998). Hogares entrevistados entre 2000 y 2009: 65.036 en 2000, 68.153 en 2003, 73.720 en 2006 y 71.460 en 2009. 13 Número de comunas autorepresentadas: 2006 (n=335) y 2009 (n=334). Metodología del Diseño Muestral y Factores de Expansión Casen 2011 12 2. Cambios en diseño muestral 2011 2.1. Evaluación del diseño muestral vigente En relación a la muestra, expertos han señalado que (1) la determinación del tamaño muestral requiere considerar la variabilidad de las características bajo estudio, (2) el tamaño de la muestra no es suficiente para producir estadísticas confiables al nivel comunal, pero a la vez (3) es demasiado grande y genera problemas operativos que afectan la calidad de los datos. Ver informe CEPAL (2008, pág. 6)14 e informe Comisión Técnicos Casen (2010, págs. 6 y 7)15. Como se explicará más tarde, la determinación del tamaño de una muestra es función del nivel de precisión que se requiere para la producción de estadísticas para ciertos grupos de la población denominados dominios de estudio. Hasta 2009, el Ministerio definió las comunas como dominios de estudio, por lo tanto la muestra consideraba un número mínimo de viviendas seleccionadas en cada comuna. Esto, ya que el objetivo final era producir estimaciones de la tasa de pobreza para cada una de las comunas en la muestra a partir de los datos de la encuesta. Lo que no se explicita en los documentos metodológicos, sin embargo, es cuál fue el nivel de precisión utilizado para determinar el tamaño muestral requerido para cada comuna. Es decir, si bien se planeaba contar con entrevistas y estimaciones en todas las comunas, no se explicitaba en nivel de confiabilidad estadística (nivel de precisión) que se esperaba en las estimaciones. Las observaciones de la Comisión Técnicos Casen en relación a este punto son ilustrativas. Para algunas comunas en 2009 el margen de error (nivel de precisión) para la estimación de la tasa de pobreza es tan grande que los resultados se tornan poco informativos (nivel de precisión bajo) para la toma de decisiones. En este contexto, el Ministerio opta por remplazar las comunas como dominio de estudio por otros que estén más en línea con los objetivos de la encuesta – producir información confiable (de alta precisión) para informar la toma de decisiones en la esfera de las políticas públicas. Se opta entonces por definir como nuevos dominios de estudio a las regiones, en atención a la creciente demanda de información con que se requiere a este nivel territorial. 14 “Se argumenta la necesidad de recalcular el tamaño de la muestra, redefiniendo los objetivos temáticos y acotando los dominios de estudio. Así mismo, se recomienda encarar el cálculo del número de hogares que se deben visitar, a partir de las tasas de pobreza e indigencia, los errores de muestreo, el efecto de diseño, la precisión deseada y la tasa de respuesta esperada observada en la Casen 2006. Es decir, utilizando la evidencia vigente”(Informe CEPAL 2008, Pág. 7). 15 “… el total de hogares en la encuesta Casen es demasiado grande y origina problemas de calidad que afectan a todo el instrumento por las dificultades inherentes a organizar un trabajo de campo en donde se logren entrevistar cerca de 70.000 hogares repartidos en todas las comunas del país en un período de tiempo que no debiera exceder a un mes. Por otra parte, es un tamaño de muestra demasiado pequeño para la estimación de estadísticas confiables a nivel comunal, especialmente de características de baja frecuencia (como el porcentaje de extrema pobreza). En el documento metodológico de la Casen 2006 (ver página web de Mideplan) se entrega el error muestral absoluto del dato comunal, el cual fluctúa entre 6,0 y 7,0 para la gran mayoría de las comunas. Esto significa que la estimación de un indicador como el porcentaje de pobreza de la comuna está afecto a un intervalo de confianza que las más de las veces torna no significativo los cambios del indicador en el tiempo. En suma, se trata de dos objetivos distintos que no se pueden conciliar en un único instrumento.”(Comisión Técnicos casen 2010, Pág. 6). Metodología del Diseño Muestral y Factores de Expansión Casen 2011 13 Re-definir los dominios de estudio para la encuesta Casen implica re-definir el diseño de la muestra. El diseño 2011 se desarrolló siguiendo prácticas estándar para el diseño de muestras para encuestas de hogares, en la línea de las consideraciones discutidas en el informe CEPAL (2008). La sección V de este informe describe en más detalle los criterios y los parámetros utilizados. Es importante mencionar, sin embargo, que la eliminación de las comunas como dominios de estudio no implica la eliminación de las comunas de la muestra Casen 2011. En efecto, como se explica más adelante, la muestra Casen 2011 seleccionó viviendas en las 324 comunas incluidas en el marco muestral del INE. A diferencia de años anteriores, sin embargo, las estimaciones de la tasa de pobreza comunal no serán desarrolladas exclusivamente a partir de los datos de la encuesta, sino que se serán desarrolladas a partir de una metodología de estimación denominada Estimación para Áreas Pequeñas (en inglés Small Area Estimation, SAE). Cabe mencionar que la metodología SAE combina información de encuestas y otras fuentes usando modelos predictivos estadísticos. Esta metodología es utilizada por gobiernos en EEUU, Reino Unido, Australia y Alemania para la asignación de recursos en programas públicos y el desarrollo de mapas de pobreza. En Chile, el Ministerio se encuentra desarrollando la implementación de la metodología a partir de 2011 con la asistencia técnica del Programa de Naciones Unidas para el Desarrollo (PNUD). 2.2. Principales características del diseño muestral 2011 El diseño muestral de la Encuesta Casen, en la mayoría de sus versiones, corresponde a una muestra probabilística, estratificada geográficamente y por tamaño poblacional, tanto en las áreas urbanas como rurales. La selección de la muestra se realiza en dos o tres etapas en las áreas urbanas y rurales. Las unidades primarias de muestreo (UPM) son seleccionadas con probabilidad proporcional al tamaño y las unidades de última etapa (viviendas) son seleccionadas con igual probabilidad al interior de cada UPM. La población objetivo de la encuesta es la población que reside en viviendas particulares a lo largo del territorio nacional, excluyendo las áreas de difícil acceso definida por INE. Al interior de cada vivienda seleccionada, se entrevista a todos los hogares y a las personas que se declaran residentes habituales. El informante idóneo para la Encuesta Casen es el jefe de cada hogar. El diseño muestral 2011 mantiene las características fundamentales de las versiones anteriores, sin embargo presenta algunas diferencias. A continuación de identifican las diferencias más importantes. Las siguientes secciones discuten estos puntos en mayor detalle: a) b) Marco Muestral Maestro. Las muestras 2006 y 2009 fueron seleccionadas a partir del marco de secciones (MS2002) en áreas urbanas y rurales. La muestra Casen 2011 fue seleccionada a partir del marco de manzanas en las áreas urbanas (MM2008) y del marco de secciones en las áreas rurales (MS 2002). Dominios de estudio. Las encuestas 2006 y 2009 definieron como dominios de representación los siguientes niveles de la división políticoadministrativa: país, regiones, y comunas, según área urbano/rural. Para 2011 se ha definido como dominios de representación geográfica el nivel país y sus 15 regiones, según área urbano/rural. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 c) d) 14 Objetivos de precisión y tamaño de muestra. Hasta 2009, la muestra nacional se definió a partir de tamaños fijos para cada comuna en la muestra, de esta forma, regiones con más comunas concentraban más muestra que regiones con menos comunas. Para Casen 2011, en cambio, se definió el tamaño muestral en función de la optimización de la tasa de pobreza regional, bajo el criterio del error absoluto entre 1 y 4 puntos porcentuales a nivel regional. La distribución de la muestra entre comunas al interior de cada región se realiza en forma proporcional al tamaño de la población de cada comuna. Selección de dos muestras independientes. Con la finalidad de ampliar el periodo de recolección de datos, pero a la vez no sacrificar la comparabilidad con la serie histórica Casen, se seleccionó la muestra completa (90 mil viviendas) en 2 submuestras representativas de la población regional y nacional. La submuestra 1 se levanto entre oct11-nov11 y sirvió como base para la selección de la Encuesta EANNA 2012 (n=10.000). La encuesta EANNA se aplicó entre feb12-abr12 a hogares con niños, niñas y adolescentes entre 5 y 17 años. La submuestra 2 se levantó entre nov11-ene12 y sirvió como base para el desarrollo de las estimaciones oficiales de pobreza para Casen 2011. Esta muestra es comparable, tanto en tamaño como en el periodo de recolección de datos de encuestas Casen anteriores 16. La muestra completa servirá como línea de base para las estimaciones que se realizaran, en base a los datos del trimestre oct-nov-dic, posteriormente. Para lograr estos objetivos, en 2011 el Ministerio estableció un convenio con el Instituto Nacional de Estadísticas (INE) que amplía significativamente los espacios de colaboración entre ambas instituciones. En el marco de Casen 2011, el INE desarrolló, a solicitud del Ministerio, la simulación de tamaños óptimos muestra, la selección y actualización de la muestra, el cálculo de los factores de expansión, la estimación de los errores de muestreo bajo muestreo complejo, y en conjunto con el Observatorio Social del Ministerio, este informe del diseño muestral de la Encuesta. A continuación se describe en detalle el procedimiento utilizado para la determinación y selección de la muestra 2011. 16 Al igual que la mayoría de sus predecesoras, la encuesta Casen 2011 concentra cerca del 60% de las entrevistas en el mes de diciembre (2011). Metodología del Diseño Muestral y Factores de Expansión Casen 2011 V. 15 Diseño Muestral La población objetivo de la Encuesta Casen la constituyen todas las personas y hogares que residen en viviendas particulares a lo largo del territorio nacional. La cobertura de la Encuesta Casen 2011 es todo el territorio nacional, excluyendo aquellos sectores identificados por el INE como áreas de difícil acceso. El diseño muestral de la Encuesta Casen 2011 se puede caracterizar como probabilístico y estratificado, según área geográfica y por tamaño poblacional, tanto en el área urbana como rural. La selección de la muestra se realiza en dos etapas (muestreo bietápico) en las áreas rurales y en tres etapas (muestreo trietápico) en las áreas urbanas. Las unidades primarias de muestreo se seleccionan con probabilidad proporcional al tamaño (en cuanto al total de viviendas), mientras que las unidades últimas (las viviendas) se seleccionan con igual probabilidad. La unidad de selección de la muestra es la vivienda. Al interior de la vivienda se identifican hogares y las personas miembros de cada hogar. La entrevista se realiza con un informante por hogar17 que corresponde generalmente al jefe de hogar18. A través del informante se recolectan datos de todos los miembros del hogar que son residentes habituales de la vivienda 19. Al interior de la vivienda se recolectan datos de todos los residentes habituales y los diferentes hogares que la conforman. 1. Características del Marco Muestral Un marco de muestreo se define como la lista o los procedimientos que permiten identificar a todos los elementos de una población objetivo (Groves et al. 2004, pág. 68). Listas de miembros de algunas organizaciones o instituciones son ejemplos de marcos de muestreo sencillos. En Chile, por ejemplo, el Ministerio de Educación tiene el listado de todos los colegios públicos, subvencionados y privados en el país. La población objetivo de la encuesta Casen son los hogares que residen en viviendas particulares ocupadas. El INE no mantiene un listado con las direcciones de todas las viviendas particulares del país, sin embargo, mantiene un marco de áreas geográficas que sirven de base para la selección de viviendas, requeridas para las muestras de las encuestas de hogares más importantes del país. 17 “Se consideran miembros de un hogar a todas aquellas personas que, siendo residentes de una misma vivienda, pueden tener (o pueden no tener) vínculos de parentesco y habitualmente hacen vida en común, es decir, se alojan y se alimentan juntas. Dicho de otra forma -- habitan en la misma vivienda y tienen presupuesto de alimentación común. No se consideran miembros del hogar las personas que pagan pensión (por lo tanto forman otro hogar), en caso de cumplir con los requisitos de permanencia. La pregunta h9 en este módulo permiten identificar a los miembros del hogar que comen juntos o bien comparten los gastos de alimentación, facilitando de este modo la identificación del concepto de hogar.” Manual del Trabajo de Campo 2011 (pág. 23). 18 En la encuesta Casen el jefe de hogar es identificado por los propios entrevistados. No hay instrucciones pre-establecidas para determinar al jefe de hogar (ej. que sea el residente de mayor edad, que sea el dueño de la propiedad, etc.). Si no es el jefe de hogar el entrevistado podría ser cualquier mayor de 18 años. 19 Hasta 2009, todas las preguntas en el cuestionario Casen puedes ser respondidas por un tercero (el informante). En el cuestionario 2011, sin embargo, las preguntas sobre satisfacción con la vida (r20) a inclusión financiera (y29, y30) sólo pueden ser respondidas por las personas que están físicamente presentes durante la entrevista. Es decir, para estas preguntas no se acepta el reporte de terceros. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 16 Un marco muestral de área contiene las unidades geográficas de un país organizadas de forma jerárquica. En Chile, esta ordenación se denomina división político-administrativa y las unidades corresponden, en orden descendiente, a región, provincia y comuna. Al interior de cada comuna se conforma la división censal que da origen a las áreas geográficas denominadas urbana y rural. Estas áreas se encuentran definidas por la actividad económica preponderante y dan origen a las siguientes entidades: Ciudad (CD): Es un gran centro urbano conformado por uno o un conjunto de centros urbanos adyacentes con 40.000 ó más habitantes. Resto de Área Urbana (RAU): Conformado por un conjunto de centros urbanos que totalizan menos de 40.000 y más de 2.000 habitantes. Esta clasificación se da cuando en una comuna existe una ciudad (CD) y entonces todos los centros urbanos restantes, si es que existen, se denominan resto de área urbana (RAU). Urbano (U): Es el centro urbano con menos de 40.000 y más de 2.000 habitantes. Esta clasificación se da cuando en la comuna no existe una ciudad (CD), por lo que cada uno de sus centros urbanos se denominan simplemente como urbanos (U). Rural (R): Conformado por el conjunto de entidades clasificadas como rurales de acuerdo a un tamaño poblacional menor a 1.000 habitantes o entre 1.001 y 2.000 habitantes con predominio de población económicamente activa (PEA) dedicada a actividades primarias.20 Para efectos del Censo 2002, se realizaron sub-divisiones posteriores denominadas manzanas censales (en las áreas urbanas) y secciones de empadronamiento censal (en las áreas rurales). Estas son las unidades geográficas más pequeñas y corresponden a las unidades primarias de muestreo más comúnmente utilizadas en las encuestas de hogares diseñadas por el INE. La Figura V.1 ilustra las unidades geográficas descritas. Para cumplir con los objetivos de investigación, el marco de muestreo “ideal” debe ser completo, preciso y actualizado. A mediados del periodo intercensal, investigaciones realizadas por el INE indican que el marco muestral en uso (MM2002) presentaba deficiencias en estos aspectos, por lo tanto a partir de 2008 el Instituto desarrolló un nuevo marco de muestreo, definiciones para la conformación de unidades de muestreo y procedimientos para la selección de unidades de muestreo en las áreas urbanas del país21. Bajo el nuevo marco de muestreo urbano, se mantiene la división políticoadministrativa, pero se cambia la conformación de las unidades primarias de muestreo. En el nuevo marco, las manzanas censales (predios urbanos delimitados por calles) remplazan a las secciones de empadronamiento censal en las áreas urbanas 22 . El que permite actualizar más rápidamente las unidades muestrales que el marco antiguo por medio del plan municipal de edificaciones que se entrega por convenio al Departamento de Gestión del Marco, logrando 20 Se entiende por Actividad Primaria a toda aquella actividad relacionada con la extracción de recursos naturales. (agricultura, caza, pesca, minería, etc.). 21 Para mayor información ver documento: “Actualización del diseño muestral Nueva Encuesta Nacional de Empleo”, Julio 2006, Instituto Nacional de Estadísticas. Disponible en la página web: http://www.ine.cl/canales/chile_estadistico/mercado_del_trabajo/empleo/metodologia/metodologia.p hp. 22 Las secciones están conformadas por una o más manzanas a requerimiento de totalizar en ella una cantidad fija de viviendas de acuerdo al estrato comuna-zona. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 17 captar nuevos desarrollos urbanos tanto en áreas urbanas como en áreas previamente catalogadas como agrícolas (por ejemplo, nuevos desarrollos en comunas como Peñalolén, Lampa o Chicureo en la Región Metropolitana). El INE comenzó a seleccionar las muestras urbanas utilizando el nuevo marco de muestreo a partir del año 2008. Las primeras encuestas a nivel nacional, cuyas muestras urbanas fueron seleccionadas a partir del nuevo marco, fueron la Nueva Encuesta del Empleo (NENE) en 2009, la Encuesta Nacional Urbana de Seguridad Ciudadana (ENUSC) en 2008, y la Encuesta de Uso de Drogas en Población General en 2008. En las zonas rurales, sin embargo, el INE ha seguido utilizando el marco de secciones (MMS2002) para la selección de muestras. La selección de la muestra 2011 se realizó sobre el marco muestral que el INE mantiene vigente al año 2011, el cual comprende el uso de dos marcos de muestreo que son mutuamente excluyentes: En el área rural, el marco de muestreo corresponde al generado a partir del Censo de Población y Vivienda del año 2002. Las unidades primarias de muestreo se denominan secciones y corresponden al área que puede recorrer un censista el día del censo. En adelante, denominaremos este marco muestral como marco de secciones (MS2002). En el área urbana, el marco de muestreo es aquel generado a partir de cartografía digital de alta validez métrica, actualizado al segundo semestre del año 2008. La información en el marco se actualiza con información anexa de Mapcity, Dmapas y los registros administrativos asociados a nuevas construcciones, otorgados por los municipios. Las unidades primarias de muestreo en el área urbana se denominan manzanas y corresponden a delimitaciones geográficas fijas. En adelante, denominaremos a este marco como marco de manzanas (MM2008). El marco de manzanas clasifica las manzanas en 30 grandes grupos de tamaño de acuerdo al número total de viviendas en la manzana. Más de la mitad de las manzanas en el marco tiene entre 8 y 44 viviendas, mientras que el grupo de tamaño más grande corresponde a manzanas con entre 155 y 1.043 viviendas, las cuales representan el 17,3% del total de las manzanas en el marco (ver Tabla V.1). 18 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura V.1. Estratificación e identificación de unidades primarias de muestreo. Tabla V.1: Número de manzanas y viviendas en el Marco Muestral de Manzanas, según grupo de tamaño de manzanas. Grupo de tamaño Grupo 0 Rango de viviendas 1a7 Total de Manzanas 13.894 Dist. de manzanas 10,4% Total de Viviendas 53.578 Grupo 1 a 4 8 a 23 63.319 47,5% 994.825 24,9% Grupo 5 a 9 24 a 44 39.267 29,4% 1.216.764 30,5% Grupo 10 a 19 45 a 81 10.334 7,7% 591.573 14,8% Grupo 20 a 28 82 a 154 3.990 3,0% 439.327 11,0% Grupo 29 y 30 155 a 1.043 2.545 1,9% 691.503 17,3% 133.349 100% 3.987.570 100% Total Dist. De viviendas 1,3% Fuente: Elaborado por el Instituto Nacional de Estadística. 1.1. Cobertura del Marco Muestral Las unidades de muestreo tienen cuatro características fundamentales para el diseño muestral: (1) cubren, usualmente, la totalidad del territorio del país; (2) tienen sus límites bien definidos; (3) existen estimaciones poblacionales para las unidades; y (4) existen mapas para las unidades (Turner, 2003). La cobertura es una propiedad estadística asociada al marco muestral que se utiliza para la selección de la muestra. La falta de cobertura denota la falla al incluir ciertos elementos (o unidades completas) de la población a encuestar a partir del marco muestral que se ha definido (Kish 1965, pág. 528). Estas fallas no son planeadas por el investigador (ej. fallas en el proceso de conteo e identificación de las viviendas previo a la selección). Es importante distinguir la falta de cobertura (fallas no intencionadas), de las exclusiones que realiza el investigador en forma intencionada. Se pueden Metodología del Diseño Muestral y Factores de Expansión Casen 2011 19 identificar tres tipos de exclusiones de este último tipo en el proceso de selección de la muestra Casen 2011: las 22 áreas geográficas que han sido catalogadas por INE como áreas de difícil acceso (ADA) 23 ; las manzanas y secciones incluidas en otras muestras seleccionadas por el INE para el periodo de recolección de datos de Casen 2011; las manzanas con menos de 8 viviendas. Las áreas de difícil acceso corresponden a zonas geográficas no incluidas en el marco muestral del INE. Estas áreas no están presentes en las muestras de ninguna de las encuestas de hogares seleccionadas por el INE. En total, corresponden al 0,4% de la población de viviendas y al 0,4% de la población de personas del país24. La Tabla V.2 muestra las 22 áreas de difícil acceso excluidas de la muestra Casen 2011. Por otra parte, la Encuesta Nacional del Empleo (NENE) se levanta todos los meses, lo que tiene como consecuencia que durante los meses de octubre, noviembre y diciembre, coincide temporalmente con el levantamiento de la Encuesta Casen 2011. Para evitar complicaciones en el trabajo de campo de ambas encuestas, el 2011 el INE excluyó del marco de muestreo, previo a la selección de la muestra Casen 2011, todas aquellas manzanas y secciones que forman parte de la muestra ENE. En total, se excluye aproximadamente 12,8% de las manzanas (3,8% de viviendas) y 8,3% de las secciones en el marco muestral. En las zonas urbanas, el INE excluye del marco muestral aquellas manzanas con 7 o menos viviendas debido a potenciales problemas operativos y de costos. En total, estas manzanas representan el 10,4% del total de manzanas (1,3% de viviendas) del marco. En total, el marco muestral a partir del cual se selecciona la muestra de la Encuesta Casen 2011, excluye aproximadamente un 4,4% de las viviendas del país. Para algunos efectos, esta cifra puede parecer insignificante, sin embargo es importante que los investigadores que hagan inferencias a partir de los datos Casen tengan estas exclusiones en consideración. Si los fenómenos de interés no están relacionados con el tamaño de las manzanas (en áreas rurales) o no están relacionados con la aislación geográfica (en áreas rurales), entonces es probable que la falta de cobertura del marco muestral no afecte las inferencias hechas a partir de los datos de la encuesta. Si lo contrario es cierto, entonces los investigadores deberán ser cautelosos al momento de hacer inferencia a la población bajo estudio. 23 Ver más antecedentes acerca del marco muestral maestro del INE en: http://www.ine.cl/canales/chile_estadistico/mercado_del_trabajo/empleo/metodologia/pdf/ene_espan ol.pdf. 24 Estimaciones propias del Instituto Nacional de Estadísticas. 20 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla V.2: Áreas de Difícil Acceso definidas por el INE. Región Provincia Comuna Arica y Parinacota Tarapacá Parinacota Tamarugal General Lagos Colchane Antofagasta El Loa Ollagüe Valparaíso Isla de Pascua Llanquihue Juan Fernández Isla de Pascua Cochamó Chaitén Futaleufú Hualaihué Palena Lago Verde Guaitecas O’Higgins Tortel Laguna Blanca Río Verde San Gregorio Valparaíso Los Lagos Aisén del Gral. Carlos Ibáñez del Campo Palena Coihaique Aisén Capitán Prat Magallanes Magallanes y de la Antártica Chilena Antártica Chilena Cabo de Hornos (Ex - Navarino) Tierra el Fuego Última Esperanza 1.2. Antártica Primavera Timaukel Torres del Paine Estratificación del Marco Muestral En el diseño de una muestra, la estratificación corresponde al proceso de agrupar a los elementos de una población en grupos homogéneos previo a la selección de la muestra. Su propósito es mejorar la precisión estadística de los estimadores agrupando las unidades del marco en clases homogéneas en su interior y que difieran de las características del resto. Los estratos deben ser mutuamente excluyentes: cada elemento en la población debe ser asignado a un solo estrato. Además, los estratos deben ser exhaustivos colectivamente, es decir, ningún elemento de la población puede quedar excluido. La Encuesta Casen ha definido tradicionalmente los estratos de selección de la muestra a partir del criterio de proximidad geográfica. Hasta 1996 los estratos se conforman a partir de comunas y grupos de comunas, según área urbano/rural 25. A partir de 1998 los estratos se constituyen a partir de las comunas, según área urbano/rural26. Para Casen 2011 se conformaron h=584 estratos, a partir de la interposición de la división política-administrativa (a nivel de comunas) y la división censal (urbano-rural). De éstos, 312 estratos se encuentran en zonas urbanas y 273 en zonas rurales. 25 En 1994 se conforman 146 estratos y en 1996, 246 estratos. En 1998 se conformaron 358 estratos. En 2000, 2003, 2006 y 2009 se conformaron 529, 553, 605 y 602 estratos respectivamente. 26 21 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 2. Estimación y Distribución del Tamaño Muestral El tamaño y distribución de la muestra 2011 tiene tres características que la hacen diferente a sus predecesoras: es más grande a nivel nacional, está distribuida en mayor proporción en las regiones del extremo norte y sur del país, y está distribuida en forma proporcional al tamaño de la población entre comunas al interior de cada región del país. A continuación se describen los procedimientos que se siguieron para determinar el tamaño y distribución territorial de la muestra Casen 2011. 2.1. Estimación del Tamaño Muestral por Región Uno de los objetivos del diseño 2011 es alcanzar mejores niveles de precisión para las estimaciones regionales de la tasa de pobreza. Para conseguir este objetivo, el tamaño muestral fue determinado en forma independiente para cada una de las regiones del país. La determinación del tamaño muestral se realizó en etapas. La Tabla V.3 muestra los resultados del proceso completo, donde algunas columnas contienen los parámetros estimados a partir de los datos Casen 2009 (tasa de pobreza, efecto diseño, tasa de respuesta), los niveles de precisión requeridos (error absoluto y error relativo) y los tamaños muestrales en cada etapa del proceso (bajo muestreo aleatorio simple, bajo diseño complejo, corregido por finitud y sobredimensionado por no respuesta). La descripción detallada de cada etapa del proceso se realiza en los párrafos que sigue, donde se referencia cada una de las columnas de la Tabla V.3. Tabla V.3: Tamaño muestral Casen 2011 y parámetros, por región. Tabla 3: Tamaño muestral CASEN 2011 y parámetros, por región. Total Pais Población Ratio Viviendas Estimate año 2009 Pi M Error Absoluto Propuesto (%) e0 Error Relativo Propuesto (%) er Tamaños Propuestos Muestreo Aleatorio Simple (M.A.S) m0 Design Effect Deff Tamaños Propuestos Muestreo Bietápico con efecto de diseño m1 Fracción de Muestreo m1 / M Tamaños Propuestos (M.A.S), corregido por finitud m2 Tnr Tamaños corregidos por tasa de No-Respuesta m3 Tasa de No Respuesta 4.595.725 0,151 0,67 4,45 26.882 4,29 93.885 2,0% 90.122 20,7% 112.938 I Region 71.788 0,158 2,4 15,2 1.435 4,76 6.835 9,5% 6.241 19,3% 7.734 II Region 123.376 0,080 1,6 20,0 1.374 4,68 6.426 5,2% 6.108 18,4% 7.486 III Region 68.332 0,175 2,7 15,4 1.530 3,06 4.683 6,9% 4.382 33,7% 6.610 IV Region 198.469 0,166 2,5 15,1 1.216 3,17 3.854 1,9% 3.780 16,2% 4.511 V Region 491.287 0,151 1,9 12,6 1.881 4,36 8.198 1,7% 8.064 16,8% 9.692 VI Region 244.622 0,128 1,9 14,9 2.795 2,00 5.595 2,3% 5.469 17,5% 6.630 VII Region 288.879 0,207 3,2 15,4 1.206 6,35 7.662 2,7% 7.464 9,1% 8.211 VIII Region 553.948 0,210 2,1 10,0 2.599 3,38 8.789 1,6% 8.652 17,5% 10.487 IX Region 267.546 0,271 2,8 10,3 1.951 3,03 5.909 2,2% 5.782 16,5% 6.924 X Region 229.140 0,142 2,7 19,0 1.357 4,85 6.575 2,9% 6.391 18,4% 7.832 XI Region 28.211 0,151 2,3 15,2 3.262 1,40 4.581 16,2% 3.941 29,2% 5.566 XII Region 45.284 0,091 1,8 19,9 1.481 1,65 2.440 5,4% 2.315 39,5% 3.826 RM Metrop 1.833.728 0,115 1,0 8,7 2.552 4,52 11.533 0,6% 11.461 26,0% 15.488 XIV Region 107.635 0,204 4,0 19,6 799 8,76 7.004 6,5% 6.576 16,7% 7.895 XV Region 43.480 0,128 2,0 15,6 1.443 2,63 3.801 8,7% 3.495 13,6% 4.046 22 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 La nomenclatura para describir las fórmulas que siguen, se presenta a continuación, asumiendo que el índice r corresponde a región; h identifica el estrato de muestreo Casen; i corresponde a la unidad primaria de muestreo (i.e. manzanas o secciones); j es la unidad secundaria de muestreo (i.e. viviendas) y k corresponde a la persona seleccionada. Considérese, p : n : : m nm m : M : Deff p r : prevalencia de la variable cualitativa de interés en el estudio, corresponde a la tasa de pobreza. número de conglomerados o unidades primarias de muestreo. número promedio de viviendas a encuestar por unidad primaria de muestreo. número de viviendas a encuestar. número de viviendas en la población. Efecto del diseño asociado a la tasa de pobreza (p) en la región r, que se puede interpretar como el aumento o disminución en la varianza, debido a considerar un muestreo complejo (e.g. estratificado, bietapico, por conglomerados) en vez de un muestreo aleatorio simple de viviendas. SE p r : S p r Error estándar de la estimación de la pobreza (p) en la región r, igual a la raíz cuadrada de la varianza de la estimación. : cuasivarianza poblacional de la tasa de pobreza (p) en la región r. Para variables cualitativas y en un muestreo aleatorio simple, corresponde aproximadamente a (M/(M-1))(PQ), siendo P la Pobreza Poblacional, con Q = (1 – P) y M el total de viviendas en la población. : percentil 2 2 Z 1 2 de nivel 1 2 de la distribución correspondiente a una estimación intervalar de confianza. Normal, 1 de A continuación se describe en detalle cada uno de los seis pasos realizados para definir el total de viviendas a encuestar en cada región r. Paso 1 Se obtienen estimaciones, a nivel regional, de la tasa de pobreza, el error estándar asociado a la tasa de pobreza y el efecto del diseño asociado a este indicador, usando Casen 2009. Estas estimaciones se presentan en las columnas S p 2 r se deriva a partir del 2 a 4 de la Tabla 6. La cuasi-varianza poblacional error estándar de la tasa de pobreza 2009 utilizando la siguiente fórmula: S p r 2 nm 2 SE p r Deff p r (1) 23 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Paso 2 e Se establecen parámetros para los errores absolutos “objetivo” por región ( 0r ) que varían entre 1 y 4 puntos porcentuales. También se establece el nivel de Z 1 2 confianza al 95% para obtener el percentil de la distribución normal . Con estos y la cuasi-varianza de la tasa de pobreza derivada en (1), se obtiene un tamaño muestral considerando un muestreo aleatorio simple mono-etápico m0 r . Z 2 S p r 2 m 0r 1 2 e02r (2) Paso 3 Se estima el tamaño muestral considerando el efecto del diseño al aplicar un muestreo en dos etapas. El efecto del diseño representa el ajuste del tamaño anterior debido al cambio que experimentará la varianza al pasar de un muestreo mono-etápico a uno bi-etápico, y con el objetivo de mantener el error absoluto inicial. Para esto se utilizan el efecto del diseño por región asociado a la tasa de Deff p r (ver columna 7 en Tabla V.3). Los efectos de diseño asociados pobreza a las tasas de pobreza regional de Casen 2009 son bastantes disímiles entre las regiones. El Deff más alto se observa para la región de Los Ríos (8,76) y el más bajo en Magallanes (1,4). La fórmula utilizada para el cálculo del tamaño muestral m 1r , incorporando el efecto del diseño se presenta a continuación: m 1r m 0r Deff p r (3) m0 r representa el total de viviendas estimadas a encuestar en la región r mediante un muestreo aleatorio simple y m1r representa el número de viviendas Donde a encuestar en la región r ajustado por efecto de diseño. presentan en las columnas 6 y 8 de Tabla V.3. Estos valores se Paso 4 El tamaño anterior a su vez se corrige por un ajuste para muestreo en poblaciones finitas o corrección por finitud 1 m M llegando al cálculo de m 2 r . La fórmula utilizada se presenta a continuación: Z 2 S p r Deff p r 2 m 2r 1 2 e02r Z 2 Deff p r 1 2 S p M 2 r m 1r m 1r 1 M (4) Donde m2 r representa el total de viviendas estimadas a encuestar en la región r, mediante un diseño muestral bietápico que incorpora el efecto del diseño y el ajuste por finitud o ajuste para poblaciones finitas, y M corresponde al total de viviendas de la Población en el nivel de estimación requerido. 24 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Paso 5 Una vez definido el total de unidades muestrales a encuestar para estimar la tasa de pobreza, se debe tener en consideración que es posible no lograr el total de unidades por diversas razones, tales como rechazos, moradores ausentes, etc. Con la finalidad de salvaguardar la precisión de la estimación de la tasa de pobreza, se aplica un factor de corrección a la fórmula (4) en base a una estimación de la tasa de no respuesta tnrr regional. En años anteriores se usó un factor de ajuste por no respuesta parejo para todas las áreas geográficas de aproximadamente 25%. El año 2011, se utiliza la tasa de respuesta regional, estimada a partir de los resultados del trabajo de campo de la Encuesta Casen 2009 (ver figura V.2). Las tasas de no respuesta más altas se observan en las regiones de Magallanes (40%), Atacama (34%) y Metropolitana (26%). La fórmula que define el tamaño muestral final de la Encuesta Casen 2011, que incorpora finalmente los ajustes conjuntos de finitud, efecto de diseño y tasa de no-respuesta, está dada por: Z 2 S p r 2 m 3r 1 2 e02r Z 2 Deff p r 1 2 S p M 2 r Deff p r (1 tnrr ) m 2r 1 tnrr (5) m Donde 3r representa el número de viviendas final a encuestar en la región r con los 3 ajustes mencionados. Ver columnas 11 y 12 de Tabla V.3 para el ajuste por no-respuesta. Figura V.2: Distribución de tasas de respuesta comunal, según región. Casen 2009. Fuente: Elaborado por el Ministerio de Desarrollo Social. 25 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Las dos primeras columnas de la Tabla V.4 presentan el total de viviendas y su distribución según el marco muestral desarrollado en base al Censo de Población y Viviendas de 2002. Las columnas que siguen presentan el total de viviendas y la distribución de la muestra seleccionada para la encuesta Casen 200927 y 2011. Al comparar las dos muestras, se observa que la distribución de la muestra 2009 se aproxima más a la distribución de la población de viviendas. Esto es consistente con el diseño muestral empelado hasta 2009, que asignaba más muestra a las regiones con más comunas (las cuales tienen mayor población de viviendas). La muestra 2011, sin embargo, fue diseñada para producir estimaciones con cierto nivel de precisión a nivel regional, por esta razón, requiere de tamaños muestrales relativamente similares para lograr similares niveles de precisión en cada región. Tabla V.4: Distribución de la muestra objetivo para las encuestas Casen 2009 y 2011. Región Tarapacá Antofagasta Atacama Marco Muestral de Viviendas 2002 Población % Casen 2009 Muestra Casen 2011 % Muestra % 71.684 1,6 1.418 1,9 6.241 6,9 123.340 2,7 1.995 2,7 6.108 6,8 68.332 1,5 1.953 2,6 4.382 4,9 Coquimbo 198.469 4,3 3.255 4,4 3.780 4,2 Valparaíso 491.287 10,7 8.045 10,8 8.064 8,9 L. G. B. O'Higgins 244.622 5,3 6.874 9,2 5.469 6,1 Maule 288.879 6,3 6.430 8,6 7.464 8,3 Bío Bío 553.948 12,1 11.850 15,9 8.652 9,6 La Araucanía 267.546 5,8 6.760 9,1 5.782 6,4 Los Lagos 228.440 5,0 5.825 7,8 6.391 7,1 Aisén 28.211 0,6 1.300 1,7 3.941 4,4 Magallanes 45.118 1,0 1.210 1,6 2.315 2,6 1.833.728 39,9 14.125 19 11.461 12,7 107.635 2,3 2.535 3,4 6.576 7,3 43.429 0,9 764 1 3.495 3,9 4.594.668 100,0 74.339 100,0 90.122 100,0 Metropolitana Los Ríos Arica y Parinacota País Fuente: Elaborado por el Ministerio de Desarrollo Social. 27 La muestra objetivo para Casen 2009 fue de 74.339 viviendas. Al término del trabajo de campo se logró completar entrevistas con 71.460 hogares. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 2.2. 26 Distribución de la Muestra entre Comunas al interior de la Región Una vez establecido el total de viviendas en cada región r, se realiza la distribución de las viviendas por comuna y área geográfica de las 90.122 viviendas objetivo ( m2 r ). A continuación se describe paso a paso el protocolo de distribución de la muestra Casen 2011. Paso 1 Al interior de cada región, la muestra de viviendas se distribuye en forma proporcional al peso de la población de viviendas de cada comuna, en relación al tamaño de la población total de viviendas en la región, según el Censo 2002. Como cada comuna puede tener áreas urbana y/o rural, se hace necesaria una segunda distribución al interior de cada comuna según área geográfica. Para esto se obtiene el peso o el aporte relativo, en cuanto al total de viviendas, de cada área geográfica en la comuna respectiva según el Censo 2002. La distribución de viviendas al interior de cada comuna se realiza en función de estos pesos. Cabe mencionar que se ha determinado un par de restricciones adicionales dentro del protocolo de distribución de la muestra 2011: Se establece un número mínimo de viviendas por estrato: 50 en estratos urbanos y 30 en estratos rurales28. Se establece un mínimo de 2 manzanas (o secciones) por estrato, tanto para estratos urbanos como rurales. La primera restricción, que implica fijar un mínimo de viviendas por estrato, busca estabilizar las estimaciones de varianza. Dicho de otro modo, reducir la variabilidad de las estimaciones de la varianza. La segunda restricción, que implica fijar un mínimo de 2 manzanas (o secciones) por estrato, busca hacer factible la estimación de varianza bajo muestreo complejo al evitar, por diseño, el caso de un solo conglomerado por estrato. En términos concretos, la aplicación de estas restricciones sólo implica la redistribución de la muestra al interior de una región. Por ejemplo, en la comuna de San Rosendo son 95 viviendas en la muestra, pero al revisar la distribución poblacional de las viviendas en el Marco muestral se aprecia que el 2,8% de las viviendas se concentra en el área rural, esto significaría que en dicha área sólo 3 viviendas pertenecerían al área rural de San Rosendo, sin embargo al aplicar la regla del mínimo de viviendas el total de viviendas a seleccionar queda en 30. Paso 2 El siguiente paso consiste en sobredimensionar la muestra objetivo (n=90.122) para contrarrestar las pérdidas que se originan producto de distintas formas de no-respuesta (ej. unidades no elegibles, falta de contacto, rechazo a la entrevista, etc.). El diseño 2011 toma un ajuste diferenciado por región y comuna, según la no-respuesta observada en el proceso de encuestaje Casen 28 Con 50 viviendas en el área urbana, se asegura un mínimo de 6 manzanas (tomando en cuenta que en promedio se encuestan 8 viviendas por manzana. En el área rural, se asegura un mínimo de dos secciones, tomando también en cuenta que en esta área se encuestan en promedio 15 viviendas por sección. 27 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 2009. Las tasas de respuesta se pueden interpretar como una estimación de la probabilidad de responder de los hogares en las comunas seleccionadas 29 . Las tasas de respuesta a nivel comunal presentan alta variabilidad en cada región. En atención a esto, se optó por definir cinco grandes categorías para las tasas de respuesta y utilizar esta aproximación (tasas de respuesta “suavizadas”) en vez de las estimaciones directas de las tasas de respuesta comunales. El Tabla V.5 muestra que las tasas de respuesta suavizadas están “cargadas” hacia los extremos superiores de cada intervalo, con el objeto de aplicar un criterio conservador y asegurar el tamaño de muestra suficiente al corregir por este factor. Tabla V.5: Tasas de No-Respuesta suavizadas Tasas de No-Respuesta efectiva Límite Inferior Límite Superior 7,5 Tasa de No-Respuesta Suavizada 5 7,5 17,5 15 17,5 37,5 30 37,5 60 50 > 60 70 Fuente: Elaborado por el Instituto Nacional de Estadística. Figura V.3: Tasas de No-Respuesta suavizadas utilizadas para sobredimensionar la muestra Casen 2011 en cada comuna. Fuente: Elaborado por el Ministerio de Desarrollo Social. 29 Ver más detalles del marco conceptual de la no respuesta en encuestas de hogares en “Nonresponse in Household Surveys” (Groves and Couper, 1998). Metodología del Diseño Muestral y Factores de Expansión Casen 2011 28 Paso 3 Finalmente, la sobredimensión de la muestra generada por la no-respuesta a nivel comunal es ajustada para coincidir con la no-respuesta a nivel regional. Esto, dado que la muestra ajustada a nivel comunal es más grande que la ajustada a nivel regional, por lo que hay que disminuirla hasta el nivel regional, que es el fijado inicialmente. Aquí se utiliza un simple ajuste de razón que redistribuye la sobredimensión en forma proporcional al peso de cada comuna en la región. Con esta disminución forzada, algunas de las tasas iniciales de no-respuesta disminuyen a cero y en algunos casos pasan a ser negativas, por lo que se aplica la restricción que la tasa mínima de no-respuesta sea aproximadamente del 2,5%. Las tasas (efectivas) de no-respuesta final aplicadas en cada comuna están en el Anexo. Sin embargo en la Tabla V.6 se visualiza cómo funciona el mecanismo descrito para el caso de la región de Tarapacá: Para la región de Tarapacá, se determinó un tamaño regional para la muestra objetivo de 7.734 viviendas. A nivel de comuna, este total se redistribuyó en forma proporcional al tamaño de la población entre sus 6 comunas (columna 1). Para determinar la muestra a seleccionar, se aplicó una sobredimensión de 5% (Pozo Almonte y Camiña), 15% (Pica) y 30% (Iquique, Alto Hospicio y Huara) (columna (2)), lo cual lleva a exceder el total regional objetivo (columna (3)). Al reajustar el total regional (columna (4)), se recalcula la tasa de no respuesta y las comunas de Pozo Almonte y Camuña quedan con tasas negativas (columna (5)). Para corregir este problema, se fija un piso de 2,5% de tasa de respuesta para estas comunas y se redistribuye la muestra entre el resto de las comunas en la región. El tamaño final de la muestra a seleccionar en cada comuna se despliega en la columna (6) y las tasas de sobredimensión (no respuesta) efectivas en la columna (7). Sólo una vez determinados los tamaños de muestra requeridos por región y comuna se procede a la selección de las unidades de muestreo. En la próxima sección se describen los procedimientos implementados con el marco de manzanas y el marco de secciones. 29 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla V.6: Ejemplo de distribución de tamaño de muestra para Región de Tarapacá y sus comunas. REGION Comuna TARAPACA Tamaño Inicial Distribuido (1) 6.241 Tasas de No-Respuesta Suavizadas Comunales (2) Tamaño Inicial con Ajuste por NoRespuesta Regional Tamaño Final con Ajuste por NoRespuesta Comunal Tasa Inicial Efectiva de NoRespuesta Tamaño Definitivo Viviendas Ajuste a Región Tasa Final Efectiva de NoRespuesta (3) 8.740 (4) 7.734 (5) 0,193 (6) 7.734 (7) 0,193 Iquique 3.822 0,30 5.460 4.831 0,209 4.810 0,205 Alto Hospicio Pozo Almonte Camiña 1.711 0,30 2.444 2.163 0,209 2.153 0,205 275 0,05 289 256 -0,074 282 0,025 65 0,05 68 61 -0,066 67 0,030 Huara 180 0,30 257 228 0,211 227 0,207 Pica 188 0,15 221 195 0,041 195 0,036 Fuente: Elaborado por el Instituto Nacional de Estadística. 3. Selección de Conglomerados Como se mencionó en la sección V apartado 1, el INE no mantiene un listado con las direcciones de todas las viviendas particulares del país, sin embargo, mantiene un marco de áreas que contiene un listado de unidades (que denominaremos conglomerados) que sirven de base para la identificación y posterior selección de las viviendas – que son las unidades últimas de selección de la muestra. En esta sección se describen los procedimientos utilizados en la selección de conglomerados. La selección se realiza de forma distinta dependiendo del marco de muestreo en que se encuentra registrada la parte urbana o rural de una comuna. A continuación se describen los protocolos utilizados para la selección de manzanas (a partir del marco urbano) y de secciones (a partir del marco rural). 3.1. Selección de Conglomerados desde el Marco Urbano El marco muestral urbano está particionado en 119.455 manzanas y estratificado en 30 estratos, que reflejan el tamaño de las manzanas en el marco (ver Tabla en Anexo). La selección de las manzanas se realiza en cada estrato de la muestra de forma independiente, aleatoria y proporcional al tamaño en cuanto al total de viviendas y manzanas por cada grupo de tamaño30. La selección se implementa en base a un algoritmo de selección que considera las dos etapas, que se describen a continuación. El procedimiento descrito permite seleccionar en la muestra manzanas grandes y pequeñas. 30 Los grupos de tamaño son conglomerados de manzanas censales. Los grupos de tamaño son las unidades primarias de muestreo que se utilizan en el procedimiento de selección implementado en el marco de manzanas de INE. 30 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Etapa 1 Selección de un grupo de tamaño. Las manzanas se agrupan en i grupos de tamaño a nivel del marco de manzanas. Esta información se cruza con las comunas, de modo que en cada comuna puede existir a lo más 30 grupos (i =1, 2, …, z donde z≥30). El procedimiento aplicado es un proceso iterativo 31 en que se escoge en forma aleatoria un grupo de tamaño i en forma proporcional a su tamaño. Este último medido en términos de Wi que corresponde al producto entre el número total de de manzanas y el número total de viviendas de cada grupo i (Wi = N i * M i). Tabla V.7: Método de selección del grupo de tamaño y manzanas. Grupo de Tamaño Número de Manzanas Número de Viviendas Peso del Grupo de Tamaño Wi = Ni * Mi Ponderación Pi=1/Wi Gi Ni Mi 1 N1 M1 N1 * M1 P1 2 N2 M2 N2 * M2 P2 3 N3 M3 N3 * M3 P3 : : : : : : : : : z Nz Mz Nz * Mz Pz Wi Total Nh Mh 1 Fuente: Elaborado por el Instituto Nacional de Estadísticas. Donde, Nh z N i 1 i ; Mh z M i 1 i ; Wi N i * M i ; Pi Wi z Wi z ; P i 1 i 1 i 1 Etapa 2 Selección de una manzana. Una vez escogido el grupo de tamaño, la manzana se elige con probabilidad igual32. Enseguida se descuenta la manzana (disminuye en uno el número de manzanas en el grupo y en el total de la comuna y/o estrato) y también se descuenta el número de viviendas 33 (disminuye el número de viviendas en el grupo seleccionado y en el total de la comuna y/o estrato), para finalmente actualizar tanto el número de manzanas y viviendas en cada grupo de tamaño y repetir el procedimiento hasta seleccionar todas las manzanas que completan el número de viviendas requeridas. 31 En el programa R se aplica la función SAMPLE con Probabilidad =Pi. Otra vez se aplica en R la función SAMPLE, pero ahora con Probabilidad = 1/Ni, donde Ni es el número de manzanas que contiene el grupo i. 33 De acuerdo al número total de viviendas que se obtiene de la enumeración, cada manzana tiene predeterminado el total de viviendas que pueden ser seleccionadas para una muestra. Este total es consistente con una fracción de muestreo de aproximadamente 25% (ver tabla C en los Anexos). Para efectos de selección, sin embargo, se descuenta el número de viviendas enumeradas con el fin de recalcular las probabilidades de selección Pi. 32 31 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 La Tabla V.9 muestra que, a partir del marco urbano, se seleccionaron inicialmente un total de 3.636 manzanas para la submuestra 1 y 5.600 manzanas para la submuestra 2. 3.2. Selección de Conglomerados desde el Marco Rural El marco muestral rural está particionado en 7.505 secciones en la parte Urbana (U) y Resto de Área Urbana (RAU), y en 6.679 secciones en la parte Rural (R). La selección preliminar de las secciones se realiza al interior de cada estrato Urbano, RAU o Rural de la comuna en forma proporcional al total de viviendas ocupadas que éstas contienen, según información del Censo 2002. Esta selección se realiza en forma sistemática proporcional al tamaño, mediante un algoritmo de acumulación de viviendas en el estrato o comuna, en el que se elige un período y arranque aleatorio, como sigue: Paso 1 Se construyen Q intervalos (equivalente al número de secciones del Estrato o comuna) de la manera como se muestra en la Tabla V.8: Tabla V.8: Método de selección de unidades primarias secciones Sección N° Viviendas Acumulado del número de viviendas Límite inferior Límite superior i Mi Mi Linf Lsup 1 M1 1 = M1 1 1 2 M2 2 = M1 + M2 1 + 1 2 3 M3 3 = M1 + M2 + M3 2 + 1 3 ⁞ ⁞ ⁞ ⁞ ⁞ Q-1 = M1 + M2 + . . . + Q-2 + 1 MQ-1 Q = M1 + M2 + . . . + Q-1 + 1 Q MQ MQ Fuente: Elaborado por el Instituto Nacional de Estadísticas. Q-1 MQ-1 Q-1 Q Paso 2 Se calcula el período dado por: K = Q / n con Q siendo el Total de viviendas de la comuna o estrato y n siendo el número de secciones a seleccionar (se supone n Q, es decir, que el número de secciones a seleccionar es menor o igual al número de secciones de la comuna o estrato). Paso 3 Se genera un número aleatorio entero A entre 1 y el período K. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 32 Paso 4 Enseguida se va sumando sucesivamente el período K para obtener distintos valores que pertenecerán a los distintos intervalos que indican qué manzana es la seleccionada. De acuerdo a este algoritmo, las secciones seleccionadas son aquellas cuyo intervalo asociado contiene a los valores dados por: A, A+K, A+2K, A+3K, . . . , A+(n-1)K. El procedimiento anterior, para secciones homogéneas en cuanto al tamaño (de una cantidad de viviendas similar), no permite repeticiones. Por el contrario, cuando las secciones son de tamaño muy distinto, llegando a ser algunas el doble y más del doble de las demás, el procedimiento o algoritmo selecciona menos de las requeridas, porque esencialmente puede seleccionar dos o más veces una misma sección, si ésta es demasiado grande respecto a las demás. Se puede demostrar que para secciones homogéneas en cuanto al tamaño, la probabilidad de inclusión de una sección con Mi viviendas está dada por nMi/Q. La Tabla V.9 muestra que, a partir del marco de secciones, se seleccionaron inicialmente un total de 507 secciones para la submuestra 1. De estas 507 secciones, 398 corresponden a entidades catalogadas como rural (R) mientras que 109 corresponden a entidades RAU o U. Para la submuestra 2 se seleccionaron 736 secciones, donde 548 de ellas corresponden a áreas rurales y 188 corresponden a áreas RAU o U. 4. Selección de Viviendas Como se desprende de la argumentación anterior, la selección de conglomerados (manzanas y secciones) se realiza en dos etapas en el marco de manzanas 34 y en una etapa en el marco de secciones. Previo a la selección de viviendas, sin embargo, se debe actualizar el registro del total de viviendas y la cartografía asociada a los conglomerados en la muestra. El INE es el responsable de realizar estas actividades. Para Casen 2011, estas actividades fueron realizadas en paralelo al proceso de levantamiento del Pre Censo 2012. 4.1. Enumeración de los Conglomerados La selección inicial de conglomerados, ya sea a partir del marco de manzanas o secciones, es de carácter preliminar, debido a que el número final de conglomerados se ajusta en función de los resultados del proceso de actualización que se realiza en terreno. Este proceso es conocido como enumeración o empadronamiento. La enumeración es una operación de registro de viviendas en un área geográfica específica, que tiene como finalidad identificar el universo en el cual se realizará la selección de viviendas. Para realizar esta tarea, cada enumerador debe cumplir con las etapas y objetivos del referido estudio. La enumeración realizada para la muestra de la Encuesta Casen 2011, contempló áreas urbanas y rurales. 34 En el marco urbano, la primera unidad de selección corresponde a un grupo de tamaño y la segunda unidad de selección corresponde a una manzana dentro del grupo de tamaño seleccionado. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 33 Material de trabajo del enumerador. A cada enumerador se entrega el siguiente set de materiales: Plano de ubicación comunal: Plano de la comuna donde se encuentran identificadas todas las manzanas y secciones seleccionadas en la muestra. Croquis de la manzana o sección: Plano a menor escala que identifica sólo la manzana o sección seleccionada. Formulario de enumeración urbano o rural: En él se registran todas las construcciones encontradas en la manzana o sección según el recorrido (orden en que fueron encontradas en terreno). Ver Formulario de Enumeración en Áreas Urbanas en Figura V.4 (los formularios de áreas rurales son similares). Recorrido y Enumeración Urbana. El enumerador debe confirmar que se encuentra en la manzana o sección seleccionada, verificándolo en el plano de ubicación y croquis respectivo. Una vez realizado esto, debe situarse en la esquina norponiente de la manzana, identificada con un punto en el croquis, y comenzar el recorrido siguiendo el sentido de los punteros del reloj. Como método de control, la línea de edificación de la manzana debe estar siempre a la derecha del enumerador. Durante el recorrido se realiza la enumeración de las viviendas, o unidades destinadas a otros usos, registrando los datos asociados a cada uno de ellos en los campos correspondientes del Formulario de Enumeración. Recorrido y Enumeración Rural. Al recorrer la localidad o entidad de la sección, se debe anotar en el formulario el uso o destino de cada una de las edificaciones a medida que se vaya llegando a ellas. Si es una vivienda, se procede a anotar el número de orden de dicha vivienda y luego se marca un punto en el plano de ubicación de la vivienda, y junto a él se anota el mismo número de orden que se registró en el Formulario de Enumeración. La enumeración de las viviendas se debe realizar en forma correlativa dentro de cada localidad o entidad. Es decir, la numeración se realiza de 1 a N para cada una de las localidades que encuentre en el área rural definida en el respectivo plano. Siempre que sea posible, se debe iniciar el trabajo de un área rural desde los accesos señalados en sus límites hacia el interior de ella. El nombre de la localidad o entidad trazada se debe obtener de los propios habitantes de las viviendas enumeradas en el lugar. Ocasionalmente ellos la conocen por distintos nombres, en estos casos, predomina el que se menciona con mayor frecuencia. Durante el proceso de enumeración, algunos conglomerados todavía pueden estar sujetos a cambios (reemplazos) por diversos motivos: el conglomerado puede estar temporalmente destruido porque se van a levantar nuevas edificaciones, ya sean casas nuevas o edificios; la mayoría de las viviendas cambiaron de uso o destino a otro que no es de vivienda; es imposible ingresar a las viviendas del conglomerado porque están dentro de un edificio que tiene un conserje que les impide el ingreso; el conglomerado no tiene el número de viviendas mínimo requerido para la selección de las viviendas; la estructura en terreno del conglomerado difiere de la enviada en el croquis, debido a que ésta pudo haberse fusionado con otra o dividido debido al cambio de límites por cierre o construcción de nuevas calles. Este último es el caso más frecuente. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 34 En total, los motivos inciden aproximadamente en el remplazo de un 3% de las manzanas/secciones originalmente seleccionadas. Para remplazo se busca, dentro del entorno geográfico, un conglomerado con características similares en cuanto al tamaño (número de viviendas) y en cuanto a la ubicación (la misma comuna, distrito y zona, o la misma comuna y distrito, o la misma comuna, dependiendo si al nivel más desagregado se encuentre una de tamaño similar). El remplazo de manzanas/secciones en esta etapa del proceso es práctica habitual en muestras para encuestas de hogares desarrolladas por el INE. Figura V.4 Formulario de Enumeración en Áreas Urbanas, Casen 2011. 4.2. Selección de las Viviendas Una vez determinadas las manzanas y secciones definitivas de la muestra, se procede a la selección de las viviendas al interior de los respectivos conglomerados. En el marco de manzanas la fracción de muestreo que se aplica al interior de cada manzana es de 25% aproximadamente, con un mínimo de 2 viviendas a encuestar. Para no concentrar la muestra en manzanas grandes (en tamaño de viviendas), se establece una cota superior de 31 viviendas a encuestar. Esto permite que manzanas de todos los tamaños estén representadas en la muestra en forma proporcional, a través de un número fijo de viviendas, según el grupo al que pertenezca. Este criterio de selección se desarrolló originalmente para la Encuesta Nacional de Empleo y el INE la aplica para la selección de muestras urbanas de todas las encuestas de hogares. La Tabla VIII.3 en el Anexo presenta el total de viviendas a seleccionar en cada manzana según su grupo de tamaño. En el marco de secciones la selección de viviendas se realiza al interior de cada sección, en forma sistemática, con igual probabilidad. Específicamente, el algoritmo de selección sistemático de viviendas, que es aplicado también en otras encuestas, se estandariza para que independientemente de quien aplique el mismo algoritmo, bajo las mismas condiciones de ordenamiento previo 35 , seleccione las mismas viviendas. Este procedimiento es análogo a introducir una semilla de aleatorización para selecciones aleatorias, las cuales arrojan también las mismas selecciones. 35 Si se trata de manzanas, el ordenamiento es comuna-distrito-zona-manzana-orden_vivienda. Si se trata de secciones, el ordenamiento es comuna-estrato-sección-manzana-orden_vivienda. 35 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Sean Mi el número de viviendas que posee la manzana o sección y mi el número de viviendas a seleccionar. Para la selección de mi viviendas se siguen los siguientes pasos: Paso 1 Se calcula el período K = Mi / mi Paso 2 Se calcula el arranque A o primera selección como la mitad entre el número uno y el período K. Al sumarle 0,5 al período K, se evita que el arranque empiece con cero: A Redondear K 0,5 2 ; 0 Paso 3 Enseguida se va sumando sucesivamente el período K al arranque A para obtener distintos valores que al redondearlos van generando las sucesivas selecciones: A, A+K, A+2K, A+3K, . . . , A+(mi -1)K. La primera selección A ya es un número redondeado a entero, la segunda es el redondeo de A+K, la tercera es el redondeo de A+2K, y así sucesivamente hasta la mi selección dada por el redondeo de A+(mi -1)K. Podría pensarse que se resta aleatoriedad al partir la selección siempre con la mitad entre uno y el período, pero el arranque es tan impredecible debido a que se pre-seleccionan sólo las elegibles, generando que la primera vivienda elegible no corresponda con la primera vivienda de acuerdo al orden de la vivienda según recorrido de la enumeración. La Tabla V.9 muestra la distribución total de las unidades primarias y secundarias de muestreo, según submuestra y área urbanarural. La Tabla V.10 revela la distribución de las unidades secundarias de muestreo, por región y submuestra. Tabla V.9: Total de conglomerados y viviendas, según submuestra y área. Submuestra 1 Urbano Rural Total (1) (2) (3) (4) Estratos 585 312 273 585 Conglomerados 10.479 3.745 398 4.143 Manzanas 9.236 3.636 0 3.636 Secciones 1.243 109 398 507 Viviendas 112.871 36.477 8.777 45.254 En Manzanas 84.410 33.765 0 33.765 En Secciones 28.461 2.712 8.777 11.489 Fuente: Elaborado por el Instituto Nacional de Estadísticas. Unidades de muestreo Total Submuestra 2 Urbano Rural Total (5) (6) (7) 311 273 584 5.788 548 6.336 5.600 0 5.600 188 548 736 54.622 12.995 67.617 50.645 0 50.645 3.977 12.995 16.972 36 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla V.10: Total de viviendas por región, según submuestra. Submuestra 1 Región Submuestra 2 % en % en Viviendas muestra muestra 1 3.096 39,9 4.667 60,1 2 2.995 39,9 4.520 60,1 3 2.639 40,1 3.945 59,9 4 1.818 40,2 2.700 59,8 5 3.892 40,1 5.803 59,9 6 2.657 40,2 3.953 59,8 7 3.309 40,2 4.919 59,8 8 4.223 40,2 6.291 59,8 9 2.796 40,3 4.146 59,7 10 3.156 40,2 4.691 59,8 11 2.215 39,7 3.368 60,3 12 1.510 40,0 2.263 60,0 13 6.204 40,1 9.255 59,9 14 3.166 40,1 4.732 59,9 15 1.578 40,0 2.364 60,0 Total 45.254 40,1 67.617 59,9 Fuente: Elaborado por el Instituto Nacional de Estadísticas. Viviendas Total Viviendas 7.763 7.515 6.584 4.518 9.695 6.610 8.228 10.514 6.942 7.847 5.583 3.773 15.459 7.898 3.942 112.871 % en muestra 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 100,0 Tabla V.11: Distribución del total de viviendas, manzanas y secciones, por región, según submuestra. Encuesta Casen 2011. Región 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Vivienda 39,9% 39,9% 40,1% 40,2% 40,1% 40,2% 40,2% 40,2% 40,3% 40,2% 39,7% 40,0% 40,1% 40,1% 40,0% Total 40,1% Submuestra 1 Manzana Sección 38,4% 41,9% 39,2% 44,4% 39,2% 41,9% 41,4% 41,9% 40,7% 45,3% 39,7% 40,3% 39,8% 39,1% 40,3% 41,0% 38,7% 37,8% 41,1% 40,1% 35,2% 39,7% 40,3% 47,1% 39,4% 45,8% 36,3% 41,1% 40,3% 35,7% 39,4% 40,8% Vivienda 60,1% 60,1% 59,9% 59,8% 59,9% 59,8% 59,8% 59,8% 59,7% 59,8% 60,3% 60,0% 59,9% 59,9% 60,0% 59,9% Fuente: Elaborado por el Instituto nacional de Estadísticas. Submuestra 2 Manzana Sección 61,6% 58,1% 60,8% 55,6% 60,8% 58,1% 58,6% 58,1% 59,3% 54,7% 60,3% 59,7% 60,2% 60,9% 59,7% 59,0% 61,3% 62,2% 58,9% 59,9% 64,8% 60,3% 59,7% 52,9% 60,6% 54,2% 63,7% 58,9% 59,7% 64,3% 60,6% 59,2% Metodología del Diseño Muestral y Factores de Expansión Casen 2011 37 5. Redistribución de Conglomerados entre las Submuestras 1 y 2 Uno de los objetivos del diseño 2011 ha sido implementar una estrategia de muestreo y recolección de datos que permita extender el periodo de trabajo de campo sin sacrificar comparabilidad con la serie histórica Casen. Para lograr este objetivo, se implementa el sistema de selección de la muestra 2011 en dos submuestras independientes, cada una compartiendo el mismo diseño de la muestra completa. Esta estrategia da origen a dos submuestras que permiten el desarrollo de estadísticas independientes a partir de cada una de ellas, así como también de la combinación de ambas. La partición de la muestra en las submuestras independientes 1 y 2 fue establecida inicialmente, en cuanto al número de conglomerados, en una proporción 40% y 60% respectivamente, tal como se visualiza en la Tabla V.11. Debido a retrasos inesperados en el proceso de licitación y desarrollo de los instrumentos de recolección de datos, el Ministerio determinó, en conjunto con el contratista Casen, la necesidad de aplazar en 2 semanas el inicio del encuestaje. Esta decisión fue tomada a pocas semanas del inicio programado del trabajo de campo. Para no afectar las fechas planeadas de aplicación de la submuestra 2, que corresponde a la muestra que se utilizaría para las estimaciones comparables con la serie histórica Casen, se optó por materializar el ajuste a través de la reducción del tamaño muestral y el periodo de recolección de la submuestra 1 y el consiguiente aumento en el tamaño de la submuestra 2. La disminución del tamaño de la submuestra 1 se realizó a partir de la selección al azar del 15% de sus conglomerados. La selección de este 15% se hizo a través de un algoritmo de selección sistemático, con arranque aleatorio, sobre el listado de conglomerados previamente ordenandos según región, estrato Casen (cruce de comuna y área urbana-rural) y el tamaño de viviendas total que poseen los distintos conglomerados. El ordenamiento, previo a la selección, asegura que se elija aproximadamente la misma fracción de muestreo en cada subdivisión de área geográfica y sean seleccionados conglomerados de todos los tamaños de acuerdo a la proporción de ellos en la submuestra 1. Si bien es cierto la redistribución de la muestra fue un hecho inesperado, la detección del problema se realizó en forma oportuna lo cual permitió: (1) convenir una estrategia de ajuste con el consultor internacional; (2) implementar la estrategia de selección y posterior distribución del material en forma oportuna por parte del contratista. La Tabla V.12 y la Figura V.5 muestran la distribución del total de viviendas entre las submuestras 1 y 2. Las submuestras pasaron desde un 40% y 60%, antes del traslado a un 33% y 67% después del traslado. 38 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla V.12: Distribución de viviendas por región, según submuestra, antes y después del traslado de conglomerados. Antes del traslado REGION 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 TOTAL Submuestra 1 2.988 2.570 2.639 1.818 3.839 2.594 3.309 4.170 2.706 3.156 2.216 1.510 5.870 3.106 1.578 44.069 % 38,5 34,2 40,1 40,2 39,6 39,2 40,2 39,8 39,0 40,2 39,7 40,0 38,0 39,4 40,0 39,1 Submuestra 2 4.775 4.936 3.945 2.700 5.856 4.016 4.919 6.307 4.236 4.691 3.367 2.263 9.589 4.784 2.364 68.748 % Después del traslado TOTAL 61,5 7.763 65,8 7.506 59,9 6.584 59,8 4.518 60,4 9.695 60,8 6.610 59,8 8.228 60,2 10.477 61,0 6.942 59,8 7.847 60,3 5.583 60,0 3.773 62,0 15.459 60,6 7.890 60,0 3.942 60,9 112.817 Submuestra 1 2.541 2.182 2.227 1.568 3.224 2.239 2.776 3.637 2.274 2.663 1.898 1.295 4.985 2.613 1.341 37.463 % 32,7 29,1 33,8 34,7 33,3 33,9 33,7 34,7 32,8 33,9 34,0 34,3 32,2 33,1 34,0 33,2 Submuestra 2 5.222 5.324 4.357 2.950 6.471 4.371 5.452 6.840 4.668 5.184 3.685 2.478 10.474 5.277 2.601 75.354 Figura V.5 Distribución del trabajo de campo para submuestras 1 y 2. % TOTAL 67,3 7.763 70,9 7.506 66,2 6.584 65,3 4.518 66,7 9.695 66,1 6.610 66,3 8.228 65,3 10.477 67,2 6.942 66,1 7.847 66,0 5.583 65,7 3.773 67,8 15.459 66,9 7.890 66,0 3.942 66,8 112.817 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 VI. 39 Desarrollo de factores de Expansión 1. Visión General En el caso de encuestas cuyas unidades de observación son seleccionadas mediante un muestreo aleatorio simple, cada unidad incluida en la muestra tiene igual probabilidad de participar, y por tanto cada una de ellas representa en la misma proporción a la totalidad de la población. Sin embargo, en encuestas donde el diseño muestral es complejo (estratificado y multi-etápico), la probabilidad de inclusión de cada unidad de observación es disímil según su procedencia, en cuanto al estrato y a la unidad de muestreo, por tanto el número de unidades que representan en la población es distinto. Históricamente para las encuestas Casen, se han desarrollado dos factores de expansión 36 para cada persona entrevistada: un factor que expande a la proyección de población regional (expr) y otro que expande a la población comunal (expc)37. Entre 1987 y 1994 los factores de expansión se determinaron como el cociente entre las proyecciones de población y la muestra lograda en cada comuna. Entre 1996 y 2009 los factores de expansión se estiman como el inverso de la probabilidad de selección de las viviendas ajustadas por la proyección de población en hogares particulares en cada comuna. A partir de 2011, siguiendo las recomendaciones del experto internacional, se implementó una metodología de cálculo de los factores de expansión que involucra el desarrollo de cuatro ponderadores que vienen a componer los factores de expansión regional y comunal. El diagrama de flujo en la Figura VI.1 resume los pasos y los insumos involucrados en la metodología de cálculo 2011. El primer ponderador, denominado Ponderador de Selección, se construye en base a la probabilidad de seleccionar a un conglomerado (whi_1) y a la vivienda a partir del conglomerado (whij_2). Intuitivamente indica a cuantas viviendas en la población representa la vivienda seleccionada en la muestra. Este se calcula, en términos generales, como el inverso de la probabilidad de selección de la vivienda, condicional a la selección del conglomerado (sección o manzana) que la contiene. El segundo ponderador, denominado Ponderador Corregido por Elegibilidad (whij_3), busca corregir las fallas que llevan a la inclusión en la muestra de viviendas no elegibles y aquellas que terminan clasificadas como de elegibilidad desconocida. El ajuste que sigue da origen al Ponderador Corregido por No Respuesta. El ajuste se aplica con el objetivo de reducir el sesgo que se pueda producir debido a la falla en conseguir la cooperación de los hogares seleccionados en la muestra. La técnica implementada se denomina “propensity score stratification”, la cual fue aplicada para desarrollar grupos homogéneos (en relación a la probabilidad de responder la encuesta) al interior de los cuales se calcula un ajuste de razón 36 En forma excepcional, en 2006 y 2009 se desarrolló un factor de expansión provincial (expp) que suma a la proyección de población en la provincia. 37 La suma de los factores regionales es levemente mayor a la suma de los factores comunales (∑expr > ∑ expc), ya que por construcción el factor regional incluye la población en las comunas no incluidas en la muestra. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 40 que permite corregir (en función del poder explicativo del modelo) el potencial efecto del sesgo de no respuesta. El último ajuste da origen a los Ponderadores de Calibración Regional y Comunal. Estos ajustes buscan corregir por fallas en la cobertura de subpoblaciones de interés y hacer conformar las estimaciones poblacionales obtenidas a partir de la encuesta con stock poblacionales externos. A este ajuste se reconoce también como “corrección de población total”. El ajuste “comunal”, se computa como la razón entre el total de personas estimado para cada comuna a partir de la encuesta y el total de personas según las proyecciones de población del INE. El ajuste “regional”, se computa la razón entre el total de personas estimado a partir de la encuesta y el total de la población según las proyecciones de población del INE en cada región-área. La Figura VI.1 resume el proceso del cálculo de los factores de expansión para Casen 2011. Los capítulos que siguen describen los detalles del proceso de construcción de los factores de la muestra completa (n=86.854 hogares). Cada apartado hace referencia a las rutinas respectivas utilizadas para su implementación, así como también a los resultados necesarios para la validación y comprobación de los cálculos. Las variaciones implementadas para el cálculo de los factores de expansión de las submuestras 1 (n=27.770 hogares) y submuestra 2 (n=59.854 hogares) se describen en el Anexo. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VI.1 Diagrama proceso de desarrollo de factores de expansión Casen 2011. 41 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 42 2. Ponderador de Selección La Encuesta Casen 2011 posee un diseño probabilístico, estratificado según área geográfica y tamaño poblacional. La muestra fue seleccionada a partir de dos marcos muestrales, mutuamente excluyentes, que cubren la totalidad del territorio nacional. En el área rural corresponde al Marco de Secciones (MS2002) y en el área urbana corresponde al Marco de Manzanas (MM2008). La muestra fue seleccionada en dos etapas en el área rural y tres etapas en el área urbana. En el área rural los conglomerados (unidades de muestreo), denominados secciones, fueron seleccionadas con probabilidad proporcional al tamaño, con respecto al total de viviendas particulares que estas contenían al Censo de Población y Vivienda realizado el año 2002, mientras que las viviendas, contenidas en su interior y que se encontraban elegibles al momento del empadronamiento, fueron seleccionadas con igual probabilidad. Por su parte, en el área urbana los conglomerados, denominados manzanas, fueron agrupadas en 30 “grupos de tamaño” según la cantidad de viviendas que éstas contienen, basado en información proveniente del MM2008. La selección de grupos de tamaño y manzanas fue realizada mediante un método iterativo y sin remplazo, con probabilidad proporcional al tamaño, definido según el total de manzanas y viviendas que dicho grupo contiene. Al interior de cada manzana seleccionada se escogen viviendas con la misma probabilidad. En ambos marcos muestrales la selección de conglomerados, manzanas o secciones, fue realizada de forma independiente en cada estrato, el cual es definido como la intersección entre comuna y área (urbano o rural). Para la encuesta Casen 2011 se seleccionaron unidades muestrales en 585 estratos de los 610 que posee el INE en sus Marcos de selección. Dado que el diseño muestral fue realizado en varias etapas y que la probabilidad de seleccionar una vivienda está determinada (o condicionada) por la unidad que la contiene, es que a continuación se exponen las probabilidades de selección de cada una de las unidades de muestreo diferenciadas, según el marco muestral de procedencia. 2.1. Probabilidades de selección de los Conglomerados Las probabilidades de selección de los conglomerados están diferenciadas según el Marco de procedencia, ya que tanto las unidades de muestro como los métodos de selección implementados en cada Marco son distintos. Las unidades primarias de muestreo provenientes del Marco de Secciones (MS2002) fueron seleccionadas todas a la vez de forma sistemática y con probabilidades definidas previamente. El procedimiento consistente en usar la estrategia de selección del muestreo bietápico con probabilidad proporcional al tamaño y, por consiguiente, se utilizan formulas de texto comúnmente aceptadas para la estimación de las probabilidades de selección asociadas a la selección de las unidades primarias de muestreo (las secciones). Las unidades de muestreo provenientes del Marco de Manzanas (MM2008) fueron seleccionadas mediante un método recursivo que consiste en seleccionar primero un “grupo de tamaño”, para posteriormente en su interior seleccionar una manzana. La siguiente etapa consiste en recalcular las probabilidades de 43 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 selección de los n grupos de tamaño n, descontando el total de viviendas de la manzana seleccionada, para volver a realizar la selección de un “grupo de tamaño” y reiterar la selección en su interior de una manzana. El proceso se realiza sucesivamente hasta alcanzar el total predeterminado de viviendas en una comuna. El procedimiento empleado no tiene asociado una fórmula conocida explícita para el cálculo de las probabilidades de selección de las manzanas, por lo tanto, éstas probabilidades deben ser estimadas a través de un método numérico. A continuación se describe la metodología de estimación de las probabilidades de selección de los conglomerados (manzanas y secciones) bajo los dos marcos muestrales. 2.1.1. Probabilidades de selección de Secciones (Marco 2002) Las secciones, unidades primarias de muestreo del Marco 2002, fueron seleccionadas de forma independiente, por comuna y área, mediante un método de selección sistemático y con probabilidad proporcional al tamaño, en cuanto al total de viviendas particulares que ellas contienen según Censo de Población y Vivienda del año 2002. Previo a la selección de la muestra 2011, se excluyeron del marco las secciones pertenecientes a muestras asociadas a otras encuestas de hogares que el INE seleccionó para ser entrevistadas en el mismo periodo que el trabajo de campo Casen (es decir, entre octubre 2011 y enero 2012). En particular, secciones incluidas en la Nueva Encuesta Nacional de Empleo (NENE) 2011 y Encuesta Nacional de Calidad de Vida y Salud (ENCAVI) 201138. La Tabla VI.1 presenta, para cada región del país, el total de secciones y viviendas en el marco de secciones (MS2002) y el total de secciones y viviendas excluidas del marco para la selección de la muestra Casen 2011. Luego, la probabilidad de seleccionar una unidad primaria, sección, puede ser calculada como, Ph (i ) S h M hi _ 2000 Uh (1) donde: i : Representa el índice de la unidad de muestreo, correspondiente a una sección. h : Representa el índice del estrato, correspondiente a la intersección de comuna y área urbano-rural. S h : Es el número de secciones seleccionadas en el estrato h. M hi _ 2000 : Corresponde al total de viviendas en la sección i del estrato h, según el MS2002. 38 Al momento de selección de la muestra Casen se tenía planeado el levantamiento de la encuesta Encuesta Nacional de Calidad de Vida y salud 2011, sin embargo, esta última no fue levantada finalmente. 44 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 U h : Es el total de viviendas en el estrato h según el MS2002 previamente “ajustado” para la selección de Casen 2011 39. El Figura VI.2 presenta la distribución de la probabilidad de selección de las secciones en cada región del país. En general, la mediana de las probabilidades de selección es baja (línea negra al medio de cada caja) para las regiones en el centro del país (en torno al 20%) y relativamente más alta para las regiones en los extremos del país, las cuales tienen menos población. La región con menor variabilidad es la región de Magallanes, donde el 50% de sus secciones tienen una probabilidad superior o igual al 45% de ser seleccionadas. En la Región Metropolitana se concentran las secciones con menor probabilidad de selección lo que se explica, en parte, porque el total de viviendas que concentran las secciones es pequeño en comparación al total de viviendas que posee el estrato de pertenencia. Mientras que en aquellas áreas de menor concentración de la población (principalmente rural), como las regiones I, II, XI, XII y XV, más del 50% de sus secciones poseen probabilidad de selección superior al 40%, que en parte puede ser explicado porque el número de viviendas que concentran las secciones es alto en comparación al total de viviendas que posee el estrato. Tabla VI.1: Total de unidades contenidas en el MM2002 y total de unidades excluidas Región Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota TOTAL Undidades MM2002 N° Secciones Undidades MM2002 excluidas N° Viviendas N° Secciones N° Viviendas 63 3.268 12 672 46 2.347 5 265 103 5.192 15 777 501 39.412 80 6.349 538 38.768 43 3.141 883 67.371 73 5.346 1.192 96.332 84 6.826 1.293 100.123 51 3.823 1.096 89.333 56 4.637 791 64.581 95 7.699 129 6.951 18 988 47 2.630 6 343 441 45.434 27 2.697 395 31.685 38 3.108 56 2.913 23 7.574 596.340 626 1.172 47.843 39 El total de viviendas en el universo (U_h) excluye las viviendas en los conglomerados seleccionados para NENE y ENCAVI (encuestas cuyo periodo de levantamiento coincidía con el de la Encuesta Casen 2011). Metodología del Diseño Muestral y Factores de Expansión Casen 2011 45 Figura VI.2: Distribución de las probabilidades de selección de las Secciones, por Región, Casen 2011. 2.1.2. Probabilidades de selección de Manzanas (Marco 2008) Previo a la selección de las manzanas, se excluyeron del marco todas aquellas manzanas que habían sido seleccionadas en la muestra de la Encuesta Nacional de Empleo cuyo periodo de trabajo de campo fuese el mismo que el de la encuesta Casen (es decir, entre octubre 2011 y enero 2012). Además se excluyeron aquellas manzanas que tienen siete o menos viviendas. En total, se excluyó un 12,8% de las manzanas y un 3,8% de las viviendas del marco. La Tabla VI.2 presenta, para cada región del país, el total de manzanas y viviendas en el marco de manzanas (MM2008) y el total de manzanas y viviendas excluidas del marco para la selección de la muestra Casen 2011. El método de selección de las manzanas, a partir del marco MM2008, corresponde a un método complejo donde las probabilidades de selección no permiten el desarrollo de una fórmula explícita de cálculo. En concreto, las manzanas fueron seleccionadas mediante un método recursivo que consiste en seleccionar, en una primera etapa, un “grupo de tamaño” y, en una segunda etapa, seleccionar una manzana al interior del “grupo de tamaño” previamente seleccionado. Luego se recalculan las probabilidades de selección del grupo de tamaño, descontando el total de viviendas en la manzana seleccionada, así como también reduciendo el total de manzanas que contiene el grupo desde el cual fue extraída; así posteriormente realizar nuevamente la selección de un grupo de tamaño y reiterar la selección en su interior de una manzana. El proceso se realiza sucesivamente hasta acumular el total de viviendas predeterminadas en el cálculo del tamaño muestral. 46 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.2: Total de manzanas y viviendas MM2008, completo y con exclusiones Undidades MM2008 Región Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota TOTAL N° Manzanas 2.198 5.614 4.000 6.817 19.259 5.881 6.703 16.492 7.158 5.221 990 2.038 46.027 2.547 2.415 133.360 N° Viviendas 70.162 131.946 74.686 152.956 507.778 159.390 185.055 445.810 170.383 136.763 19.782 42.374 1.784.022 66.790 52.865 4.000.762 Undidades MM2008 excluidas N° Manzanas 283 843 854 1.037 3.517 927 772 2.374 1.019 748 229 259 3.439 346 453 17.100 N° Viviendas 3.947 6.057 5.438 7.161 27.963 6.812 6.722 22.339 7.468 6.257 2.861 2.302 39.582 3.130 4.390 152.429 Dado que las probabilidades de selección no tienen fórmula explicita, es que en encuestas anteriores que utilizan el mismo diseño muestral que la Encuesta Casen 2011, el INE ha optado por aproximar las probabilidades de selección de las manzanas bajo el supuesto de que corresponden a las calculadas para un diseño probabilístico, estratificado, bi-etápico, y donde sus unidades primarias son extraídas con probabilidad proporcional al tamaño, medido en cuanto al total de viviendas particulares que estas contienen. Es decir, bajo el mismo procedimiento con el cual se seleccionan las secciones en el marco MS2002. A requerimiento del experto internacional, el Ministerio de Desarrollo Social, solicitó al INE desarrollar un estudio de simulaciones que pretendía verificar, para la muestra Casen 2011, la pertinencia de aproximar la estimación de las probabilidades de selección de las manzanas utilizando las fórmulas del muestreo bietápico proporcional al tamaño. Para estos efectos, se realizaron 2.000 simulaciones de selección de manzanas, en las 223 comunas pertenecientes al MM2008, con la finalidad de guardar las probabilidades de selección empírica. Posteriormente, mediante dos métodos distintos se estimó la probabilidad de selección de las manzanas; el primer método consistió en una aproximación lineal, fundamentada en las probabilidades empíricas obtenidas de las simulaciones; el segundo método consiste en obtener la proporción de muestras en las que fue seleccionada una manzana. Este método se denomina probabilidad Bootstrap (Valliant et al., 2008; Valliant & Rust, 2010); Sitter, 1992). Luego, para comparar la calidad predictiva de ambos métodos se obtuvo una estimación del total de viviendas por comuna, mediante la utilización de factores de expansión en cada una de las 2.000 replicas. Los factores de expansión fueron construidos con los inversos de las probabilidades de selección empíricas y bootstrap. Posteriormente, se ponderó el total de viviendas por manzana, reportadas en el MM2008, con su respectivo factor de expansión. Finalmente, se elaboraron gráficos de densidad para comparar el comportamiento de ambas expansiones (inverso probabilidad empírica e inverso probabilidad bootstrap), respecto al total de viviendas reportadas en el MM2008. 47 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Como resultado de este estudio, se verificó que las estimaciones desarrolladas a partir de las probabilidades estimadas con el método bootstrap presentaban, para la mayoría de las comunas en la muestra, mejores propiedades estadísticas (menor error cuadrático medio) que las estimaciones a partir del método que asume muestreo bietápico. En consecuencia, se desestimó la opción de utilizar la fórmula del muestreo bietápico para selecciones proporcionales al tamaño y se procedió a estimar las probabilidades de selección de las manzanas mediante un procedimiento de re-muestreo no paramétrico conocido como Bootstrap. Para la implementación del cálculo de las probabilidades de selección de las manzanas, se desarrollaron inicialmente 2.000 simulaciones de muestras de manzanas en 223 estratos urbanos de la muestra. Posteriormente, se agregaron 2.000 simulaciones en 82 estratos cuyos resultados fueron considerablemente más volátiles para producir estimaciones confiables de la probabilidad de selección de las manzanas. Inicialmente, el proceso de simulación consideró el remuestreo de manzanas asociadas a una muestra de 36.600 viviendas aproximadamente. Para el objetivo inicial del estudio, este tamaño se consideró suficiente. Dado que la muestra Casen tiene distintos tamaños de muestra para la submuestra 1, submuestra 2 y muestra completa, las probabilidades de selección estimadas a partir del método bootstrap ( hi ) deben ser “ajustadas” para expandir en forma consistente con los tamaños de muestrales de cada submuestra. De esta forma, la probabilidad de que una manzana pertenezca a la muestra Casen 2011, puede ser estimada como: Ph (i) ( f1 f 2 ) hi (2) donde f 1 : Corresponde a la razón entre el total de viviendas asignadas a la submuestra 1 en el área urbana (27.766) vs. tamaño de la muestra con el cual se realizaron las simulaciones (32.616). f 2 : Corresponde a la razón entre el total de viviendas asignadas a la submuestra 2 en el área urbana (56.644) vs. tamaño de la muestra con el cual se realizaron las simulaciones (32.616). hi : corresponde a la probabilidad de seleccionar una manzana para una muestra de 32.616 viviendas, estimada mediante bootstrap. La figura VI.3 presenta la distribución de la probabilidad de selección de las manzanas en cada región del país. En general, la mediana de las probabilidades de selección es baja (línea negra al medio de cada caja) para las regiones en el centro del país (en torno al 5%) y relativamente más alta para las regiones en los extremos del país, las cuales tienen menos población urbana. Se puede apreciar que las probabilidades estimadas son relativamente homogéneas al interior de cada región (cajas pequeñas), sin embargo, en la Región de Aysén se observa gran heterogeneidad, y que el 50% de las manzanas poseen probabilidad de selección superior a 0.5. Esto último se puede explicar por la gran cantidad de manzanas seleccionadas en la muestra en comparación al total de unidades existentes en los estratos de la región. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VI. 3: Estimación de la probabilidad de selección de las manzanas mediante Bootstap, Casen 2011. 48 49 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.3: Estadísticas descriptivas estimación de probabilidades de las manzanas mediante método bootstrap Región Recuento Mínimo Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota 733 839 940 410 804 430 462 729 448 499 390 496 1.090 639 504 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,00 0,02 0,01 0,00 0,00 0,00 Total 9.413 0,00 Prob. de selección Manzanas Bootstrap Percentil Percentil Percentil Percentil Percentil Percentil Mediana Máximo 05 10 25 75 90 95 0,05 0,09 0,13 0,19 0,26 0,30 0,31 0,40 0,02 0,04 0,07 0,10 0,13 0,16 0,18 0,22 0,05 0,07 0,11 0,15 0,19 0,22 0,24 0,37 0,01 0,02 0,03 0,04 0,06 0,08 0,09 0,15 0,01 0,01 0,02 0,03 0,04 0,06 0,07 0,20 0,01 0,02 0,02 0,04 0,06 0,10 0,13 0,17 0,01 0,02 0,03 0,05 0,07 0,11 0,12 0,16 0,01 0,01 0,02 0,03 0,04 0,06 0,07 0,16 0,01 0,02 0,03 0,04 0,06 0,08 0,09 0,14 0,02 0,02 0,04 0,06 0,08 0,11 0,12 0,20 0,16 0,17 0,33 0,53 0,65 0,70 0,73 0,80 0,04 0,07 0,10 0,15 0,20 0,24 0,25 0,28 0,00 0,01 0,01 0,02 0,02 0,04 0,06 0,19 0,02 0,05 0,09 0,14 0,18 0,22 0,23 0,29 0,03 0,04 0,08 0,13 0,17 0,19 0,21 0,25 0,01 0,01 0,03 0,07 0,14 0,21 0,27 0,80 Moda Media 0,13 0,08 0,13 0,03 0,02 0,02 0,04 0,03 0,05 0,07 0,55 0,13 0,02 0,09 0,12 0,19 0,10 0,15 0,05 0,03 0,05 0,05 0,03 0,05 0,06 0,49 0,15 0,02 0,13 0,13 0,02 0,10 50 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 2.2. Inverso de las Probabilidades de selección Una vez definidas las probabilidades de selección se calcula el Ponderador de Selección del Conglomerado como el inverso de las probabilidades de selección de manzanas y secciones respectivamente, whi 1 Ph (i ) Uh , S M h hi_2000 whi 1 , (f 1 f 2 ) π hi (3) Si la unidad de muestreo i es una sección (4) Si la unidad de muestreo i es una manzana Para cada manzana en la muestra, por ejemplo, su ponderador de selección puede ser interpretado como “el total de manzanas en la población que ella representa”. Del mismo modo, la suma de los ponderadores de selección de todas las manzanas en la muestra puede ser interpretada como una estimación del total de manzanas existentes en la población. Para realizar dichas estimaciones se debe utilizar la base de datos a nivel de manzanas y secciones. Para obtener la estimación del total de manzanas y secciones, basta sumar el Ponderador de selección de todas las unidades en la muestra. Mientras que para estimar el total de viviendas de la población, se debe w ponderar previamente el inverso de la probabilidad de selección ( hi ) por el total de viviendas por conglomerado según información del Marco de muestreo ( M hi _ 2000 ). Al realizar este ejercicio se obtiene una estimación de 135.738 conglomerados en el total del país (secciones y manzanas). En la Tabla VI.4 se pueden observar las estadísticas descriptivas y estimación del total de manzanas y secciones por región, según el marco de muestreo. 51 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.4: Estadísticas descriptivas del Ponderador de Selección de Conglomerados, según Marco Marco Factor Base FULL Región Recuento Mínimo Percentil 05 Percentil 10 Percentil 25 Mediana Percentil 75 Percentil 90 Percentil 95 Máximo Media Moda Suma Tarapacá 733 1,0 1,2 1,3 1,5 2,0 3,0 4,1 8,6 110,4 3,0 3,0 2.200 Antofagasta 839 1,8 2,2 2,4 2,9 4,0 5,6 10,0 16,8 257,6 6,2 4,9 5.182 Atacama 940 1,0 1,6 1,8 2,0 2,5 3,6 5,9 7,9 85,9 3,7 2,3 Coquimbo 410 2,6 4,2 5,0 6,7 9,8 14,9 22,1 35,1 772,8 15,8 14,9 3.462 6.474 Valparaíso 804 1,9 5,7 7,0 8,9 12,9 20,9 35,1 55,2 257,6 18,8 11,7 15.140 Libertador General Bernardo OHiggins 430 2,3 3,1 3,7 6,1 9,1 15,8 25,2 35,1 772,8 18,3 23,4 7.855 Maule 462 2,4 3,2 3,6 5,2 8,3 12,9 22,1 28,6 257,6 12,1 10,4 5.598 Manzanas Biobio 729 2,4 5,3 6,5 8,8 12,5 20,3 35,1 55,2 772,8 21,7 12,9 15.807 Araucanía 448 2,7 4,5 5,1 6,5 8,7 13,4 20,9 35,7 772,8 16,2 8,3 7.241 Los Lagos 499 1,9 3,1 3,6 4,7 6,3 9,6 16,9 23,4 154,6 9,4 5,9 4.713 Aysén del General Carlos Ibañez del Campo 390 0,5 0,5 0,5 0,6 0,7 1,2 2,2 2,4 16,4 1,2 0,7 478 Magallanes y La Antártica Chilena 496 1,4 1,6 1,6 1,9 2,6 4,1 5,2 10,4 77,3 3,8 2,9 1.894 1.090 2,1 6,2 9,5 17,6 25,8 40,7 77,3 110,4 772,8 43,3 24,9 47.183 Los Ríos 639 1,3 1,7 1,8 2,2 2,8 4,1 7,5 15,6 92,7 5,1 4,2 3.242 Arica y Parinacota 504 1,5 1,9 2,0 2,3 3,0 4,9 9,8 11,9 257,6 4,8 3,2 2.440 Tarapacá 27 1,1 1,1 1,2 1,4 1,5 2,4 2,9 3,2 3,7 1,8 1,2 49 Antofagasta 18 1,2 1,2 1,2 1,3 2,2 3,0 3,3 3,8 3,8 2,2 2,4 40 Atacama 30 1,9 1,9 2,0 2,2 2,7 3,2 3,9 4,4 4,4 2,8 2,8 85 Coquimbo 61 1,2 1,4 1,5 5,0 6,8 9,2 11,3 12,0 13,0 6,9 5,9 421 470 Metropolitana de Santiago 86 1,4 1,5 1,7 2,5 4,8 8,1 10,5 10,9 13,0 5,5 1,5 Libertador General Bernardo OHiggins 124 1,2 1,5 2,0 4,9 6,4 8,6 9,8 10,2 11,3 6,3 1,6 783 Maule 174 1,1 1,5 2,3 4,3 6,5 8,2 10,0 10,6 12,9 6,3 2,1 1.102 Secciones Biobio Valparaíso 182 1,0 1,4 1,5 2,9 5,2 9,8 12,2 16,0 21,9 6,6 11,1 1.198 Araucanía 148 1,8 2,4 3,1 4,6 7,2 8,7 11,1 12,4 14,8 7,0 2,9 1.032 Los Lagos 142 1,0 2,0 2,6 3,6 5,0 5,8 6,8 7,6 9,4 4,8 6,8 681 Aysén del General Carlos Ibañez del Campo 58 1,2 1,2 1,3 1,5 1,7 2,0 2,8 2,9 3,3 1,8 1,7 106 Magallanes y La Antártica Chilena 17 1,9 1,9 2,0 2,1 2,3 2,6 2,8 2,8 2,8 2,4 2,8 40 Metropolitana de Santiago 48 1,7 2,1 2,5 5,0 8,3 10,5 13,3 26,3 31,0 8,9 4,9 427 105 1,0 1,3 1,4 2,1 3,3 4,6 5,6 6,0 6,9 3,4 1,6 360 16 1,3 1,3 1,3 1,4 2,3 2,5 2,7 2,7 2,7 2,1 1,3 10.649 0,5 1,4 1,8 2,7 5,6 11,9 24,9 38,6 772,8 23,4 12,7 Los Ríos Arica y Parinacota Total País 33 135.737,8 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 52 Las figuras VI.4 y VI.5 presentan la distribución de los Ponderadores de Selección de los Conglomerados Rurales (secciones) y Urbanos (manzanas) respectivamente, en cada región del país. En general, los ponderadores de selección de las secciones son más pequeños que los ponderadores de las manzanas. La mayor homogeneidad de los ponderadores de las secciones (que las manzanas) se explica por la diferencia en la composición de las unidades, pues las secciones fueron diseñadas para ser homogéneas en cuanto al total de viviendas, mientras que las manzanas son unidades definidas por límites de calles y por lo tanto el total de viviendas que poseen oscila entre 8 y más de 1.000 unidades. La figura VI.4 muestra que el comportamiento de los Ponderadores de selección de las secciones es homogéneo en casi todas las regiones del país, lo que se debe principalmente a que las secciones poseen tamaños, en cuanto al total de viviendas, muy parecidos entre sí al interior de cada región. Sin embargo, aquellas regiones donde su población rural es pequeña, se observa que en promedio el inverso de la probabilidad no es superior a las 10 unidades, esto debido a que representan una población pequeña. El valor extremo máximo observado se encuentra en la Región Metropolitana, donde una sección representa a 31 unidades (ver Tabla VIII.5 en el anexo). En la figura VI.5 se observa que en la Región Metropolitana el Ponderador de selección de las manzanas tiene mayor variabilidad, pues sus manzanas representan entre 2 y 386 unidades en la población. Por otra parte, en consistencia con las distribuciones en la figura VI.3 (probabilidades de selección), se observa que las manzanas de la Región de Aysén (XI) poseen pequeños ponderadores (inversos de la probabilidad de selección) y corresponden a los más homogéneos del país. La Tabla VI.5 muestra el total de manzanas y secciones en cada marco (totales poblacionales) y las estimaciones desarrolladas a partir del ponderador de manzanas y secciones respectivamente (estimaciones muestrales). Se observa una subestimación del total de manzanas y secciones en todas las regiones del país. Esto se explica porque, previo a la selección de la muestra Casen 2011, se excluyeron unidades de muestreo de ambos marcos muestrales. Además, el marco urbano excluye del proceso de selección a las manzanas con menos de 8 viviendas. Por esta razón, es necesario ajustar el ponderador de selección para corregir las exclusiones deliberadas de conglomerados implementadas al momento de la selección de la muestra. En la sección que sigue se describe el ajuste implementado. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 53 Figura VI.4: Distribución del Ponderador de Selección de Conglomerados Rurales (Secciones) Figura VI.5: Distribución del Ponderador de Selección de Conglomerados Urbanos (Manzanas) 54 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.5: Total de Manzanas y secciones estimadas con la muestra y según marco muestral Marco Región Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota TOTAL 2.3. N° Secciones Estimación Muestra N° Manzanas N° Secciones N° Manzanas 63 2.198 49 46 5.614 40 5.182 2.200 103 4.000 85 3.462 501 6.817 421 6.474 538 19.259 470 15.140 7.855 883 5.881 783 1.192 6.703 1.102 5.598 1.293 16.492 1.198 15.807 1.096 7.158 1.032 7.241 791 5.221 681 4.713 129 990 106 478 47 2.038 40 1.894 441 46.027 427 47.183 395 2.547 360 3.242 56 2.415 33 2.440 6.827 128.910 7.574 133.360 Ajuste por omisión de Conglomerados Con la finalidad de reducir problemas operativos, el MM2008, excluye todas aquellas manzanas que contienen 7 o menos viviendas, así como también todas aquellas manzanas previamente seleccionadas para otra encuesta con periodo de recolección de datos coincidente con el de la Encuesta Casen 2011. El MS2002 por su parte, excluye solamente aquellas secciones que habían sido seleccionadas en otra encuesta y cuyo trabajo de campo era el mismo que el de la Encuesta Casen 2011. El total de manzanas y secciones excluidas desde ambos marcos muestrales equivale a un total de 200.272 viviendas, lo que corresponde a un 4,4% de la población de viviendas pertenecientes a los estratos Casen. Tabla VI.6: Total de viviendas según MM, con y sin exclusión de conglomerados. Total de viviendas MM Marco de Muestreo MM 2008 MS 2002 Total Viviendas - Exclusión unidades* 3.848.333 548.497 4.396.830 - Todas las unidades* 4.000.762 596.340 4.597.102 * Total Estratos CASEN En este contexto, utilizar los Ponderadores de Selección de Conglomerados para estimar totales asociados a fenómenos de interés implica subestimar dichos totales. Para corregir este problema, se realizó un ajuste que permite corregir las omisiones explícitas en los Ponderadores de Selección de Conglomerados. El ajuste consiste en abultar el Ponderador de Selección de Conglomerados según la cantidad de viviendas excluidas por estrato, con la finalidad que el total de 55 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 viviendas estimadas con este nuevo ponderador sea consistente con el total de viviendas de la población (4.597.102 a nivel nacional). Para realizar el ajuste se obtuvo la razón entre el total de viviendas poblacional, por estrato, y el total de viviendas estimadas con el Ponderador de Selección (de manzanas y secciones respectivamente), es decir, Rˆ h M h _ 2000 w hi M hi _ 2000 i h , (4) donde, h : Es el conjunto de conglomerados seleccionados en el estrato h. M hi _ 2000 : Corresponde al total de viviendas en el conglomerado i del estrato h, según el Marco de secciones o Marco de manzanas. M h _ 2000 : Es el total de viviendas en el estrato h según el marco de muestreo correspondiente. De este modo, el Ponderador de Selección de Conglomerados Corregido por Omisión (en adelante, simplemente “Ponderador de Selección de Conglomerado Corregido”) viene dado por: whi' Rˆ h whi (5) La forma de cálculo se ilustra mediante el siguiente ejemplo: considere el estrato “San Pedro de la Paz - urbano”, que en la población posee 32.644 viviendas. Sin embargo, al estimar el total de viviendas con el Ponderador de Selección de Conglomerado en la muestra se obtiene un total de 26.635 unidades, por lo tanto la proporción de unidades que debe aumentar cada Ponderador de Selección de Conglomerado es 1,23 (32.644/26.635) unidades. Luego el ponderador ajustado al total de viviendas de la manzana “A”, perteneciente al estrato en cuestión está dado por 13,8*1,23=16,91. En consecuencia, el conglomerado “A” ahora representa a 16,91 manzanas de la población de conglomerados de San Pedro de la Paz. Las figuras VI.6 y VI.7 muestran la distribución del Ponderador de Selección de Conglomerados Corregido por Omisión de Secciones y Manzanas respectivamente. En la figura VI.6 se puede observar que las distribuciones tienen poca variabilidad en el marco de secciones, con valores medios del ponderador que oscilan entre 2,3 y 30 unidades. En contraste, el ponderador presenta gran variabilidad en el marco de manzanas, donde destaca la Región Metropolitana. Este comportamiento desigual entre los ponderadores asociados a secciones y manzanas refleja nuevamente la heterogeneidad en la construcción de estas unidades40. 40 Ver Manual Conceptual y Metodológico diseño muestral Encuesta Nacional de Empleo, Abril 2010 página 28. http://www.ine.cl/canales/chile_estadistico/mercado_del_trabajo/empleo/metodologia/pdf/031110/m anual_metodologico031110.pdf Metodología del Diseño Muestral y Factores de Expansión Casen 2011 56 En comparación los ponderadores “sin ajustar” (figuras VI.4 y VI.5) se aprecia que existe un aumento en dispersión de la distribución, el que se puede apreciar claramente en la Región Metropolitana. Las Tablas VI.7 y VI.8 muestran las estimaciones de conglomerados y viviendas a partir de los Ponderadores de Selección de Conglomerados Corregidos. Con el ponderador corregido se estimó un total de 7.448 secciones (en vez de las 6.827 estimadas sin corregir, Tabla VI.5) y 138.659 manzanas (en vez de las 128.910 estimadas sin corregir, Tabla VI.5). En total, la estimación de conglomerados aumentó en 10.369 unidades (en comparación a la estimación sin corregir). Queda en evidencia, por lo tanto, que de no realizar dicho ajuste se sub-estima el total de manzanas, secciones y viviendas, lo que se puede apreciar al contrastar las estimaciones en el Tabla VI.5 con aquellas en las Tablas VI.7 y VI.8. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VI.6: Distribución del Ponderador de Selección de Conglomerado Corregidas por Omisión de Secciones. Figura VI.7: Distribución del Ponderador de Selección Corregido por Omisión de Manzanas 57 58 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.7: Número de Manzanas y Secciones Estimadas con Ponderador de Selección Ajustado por Omisión de Conglomerados Región Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Total Estimación Muestra N° Secciones N° Manzanas Total 61 2.581 2.642 45 6.039 6.083 100 3.888 3.988 502 7.033 7.534 511 17.815 18.327 8.653 855 7.798 1.186 6.060 7.245 1.248 16.489 17.737 1.088 7.887 8.976 774 5.368 6.142 124 1.215 1.339 46 2.136 2.182 454 48.388 48.842 400 3.221 3.621 56 2.741 7.448 2.797 138.659 146.107 Tabla VI.7: Número de Viviendas Estimadas con Ponderador de Selección Ajustado por Omisión de Conglomerados Región Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Total Estimación Muestra N° Secciones N° Manzanas Total 3.268 70.162 73.430 2.347 131.946 134.293 5.192 74.686 79.878 39.412 152.956 192.368 38.768 507.778 546.546 67.371 159.390 226.761 96.332 185.055 281.387 100.123 445.810 545.933 89.333 170.383 259.716 64.581 136.763 201.344 6.951 19.782 26.733 2.630 42.374 45.004 45.434 1.784.022 1.829.456 31.685 66.790 98.475 2.913 52.865 596.340 4.000.762 55.778 4.597.102 59 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 3. Ponderación de selección de viviendas Los pasos descritos anteriormente están vinculados con la probabilidad de selección de las manzanas y secciones. Sin embargo, la última unidad de selección de la muestra es la vivienda al interior de los conglomerados previamente seleccionados. En los apartados siguientes se detallan las probabilidades de selección de las viviendas, así como los ajustes y ponderadores asociados. 3.1. Probabilidad Condicional de selección de una vivienda Al interior de cada conglomerado, indistintamente del marco de procedencia, las viviendas fueron seleccionadas bajo un algoritmo de selección sistemático, de modo que todas las viviendas particulares ocupadas en el conglomerado, registradas en el empadronamiento, tuvieran la misma probabilidad de ser seleccionadas. Luego, la probabilidad condicional de incluir la j-ésima vivienda, dado que (condicional a que) el i-ésimo conglomerado (manzana o sección) fue seleccionado en la muestra del estrato h, viene dada por, Phi j i mhi M hi (6) donde, j : Corresponde al índice de la vivienda. M hi : Corresponde al total de viviendas ocupadas en la manzana o sección i, según empadronamiento realizado previo a la recolección de datos. m hi : Corresponde al total de viviendas seleccionadas en la manzana o sección i del estrato h. De esta forma, siguiendo las reglas de probabilidad, se tiene que la probabilidad incondicional de que la j-ésima vivienda pertenezca a la muestra Casen 2011 puede ser expresada como, Phi j Phi j i Ph i donde, (7) Phi j : Corresponde a la probabilidad de que la vivienda j-ésima pertenezca a la muestra. Ph i : Corresponde a la probabilidad de que el conglomerado (manzana o sección) i-ésimo pertenezca a la muestra. A continuación se describe el cálculo del Ponderador de Selección de Viviendas P i según la fórmula (6), donde h corresponde al inverso del Ponderador de Selección de Conglomerados Corregido por Omisión. 3.2. Ponderador de selección de viviendas La fórmula (6) puede ser interpretada como la probabilidad de que una vivienda sea seleccionada desde el marco de muestreo. El inverso de esta probabilidad, en la fórmula (7) abajo, corresponde al Ponderador de Selección de Viviendas. 60 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Este ponderador puede ser interpretado como el número de viviendas que representan en la población las viviendas seleccionadas 41 en la muestra Casen 2011, donde todas las viviendas pertenecientes al mismo conglomerado les corresponde el mismo Ponderador de Selección de Viviendas. '' whij whi' 1 Phi ( j / i ) whi' M hi . m hi (8) El Ponderador de Selección de Viviendas puede ser utilizado directamente para realizar estimaciones a nivel de viviendas. Por ejemplo, estimar el total de viviendas existentes por región, estimar el número de viviendas con determinadas características, etc. A medida que se aleja el momento del censo, las estimaciones de los stocks de viviendas comienzan a desactualizarse. Contar con estimaciones a partir de una encuesta grande como Casen permite identificar zonas del país donde pudiera haber más dinamismo en la construcción de viviendas y por lo tanto estar más proclives a desactualización del marco muestral. Las Figuras VI.8 y VI.9 ilustran la distribución del Ponderador de Selección de Viviendas para cada una de las regiones del país. Al comparar la Figura VI.8 con la Figura VI.9, se puede apreciar que se mantiene el patrón de comportamiento de la distribución de los ponderadores de las manzanas y secciones entre las distintas regiones. Sin embargo, las brechas entre regiones aumentan, así como también la variabilidad al interior de cada región, con la mayor dispersión visible para la región Metropolitana. Este resultado podría sorprender, ya que por diseño se espera que las probabilidades de selección de las viviendas al interior de los conglomerados fuesen relativamente homogéneas. Esta homogeneidad, sin embargo, se ve interrumpida cuando hay desactualizaciones importantes en el marco muestral y el proceso de empadronamiento en terreno muestra que la cantidad esperada de viviendas en un conglomerado dista de lo observado en terreno. Las probabilidades de selección de las viviendas se ven entonces afectadas (aumentan/disminuyen) debido a los crecimientos/decrecimientos observados en el conglomerado, lo cual hace que las viviendas en la muestra deban representar a más/menos viviendas que lo definido según la fracción de selección. Este resultado se observa en todas las regiones - tanto la dispersión como el valor medio del Ponderador de Selección de Vivienda aumenta. El fenómeno se observa más pronunciado en el marco de manzanas, ya que a la variabilidad asociada al proceso de empadronamiento se agrega la mayor variabilidad del Ponderador de Selección de Manzanas. El ponderador de vivienda está asociado a todas las viviendas seleccionadas, sin embargo, es posible que algunas de ellas no correspondan a viviendas particulares (ej. viviendas colectivas, negocios, etc.) o bien se desconozca su condición. El ajuste que se describe a continuación corrige esta situación. 41 El número de viviendas seleccionado varía de acuerdo al Marco de procedencia. En el caso de las secciones pertenecientes a la muestra Casen 2011, éstas están constituidas por un total que oscila entre 41 y 176 viviendas. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VI.8: Distribución del Ponderador de Selección de Viviendas, en áreas rurales (MS 2002). Figura VI.9: Distribución del Ponderador de Selección de Viviendas, en áreas urbanas (MM 2008). 61 62 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.9: Estadísticas descriptivas del Ponderador de Selección de Viviendas, según Marco y Región Secciones Manzanas Marco Total País Región Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Viviendas Muestra Ponderador de viviendas/hogares - FULL Percentil Percentil Percentil Percentil Percentil Percentil Percentil Mínimo Mediana Máximo 05 10 25 75 90 95 99 Media Moda Viviendas Estimadas 7.003 3,4 5,2 5,6 6,3 8,1 12,2 19,4 27,5 59,2 730,6 11,9 7,2 83.649 7.118 2,2 8,5 9,2 11,1 14,6 21,3 31,5 42,6 99,6 1.310,7 20,2 12,7 143.619 5.907 2,0 5,9 6,7 8,0 10,1 13,7 21,4 28,7 54,9 453,1 13,1 12,7 77.179 3.142 9,2 16,1 19,0 28,6 37,0 53,4 75,1 97,0 230,7 2.499,4 49,7 87,0 156.211 7.867 5,0 20,8 28,4 41,5 54,4 76,0 121,3 165,6 342,1 946,0 69,6 35,2 547.545 3.830 5,5 7,6 11,1 17,7 30,5 45,5 68,6 99,9 257,7 2.930,8 43,0 49,3 164.765 4.365 5,6 13,0 14,3 18,7 36,1 52,8 74,6 98,8 161,1 1.823,3 43,1 24,2 188.029 6.588 5,7 22,6 27,4 38,8 55,0 75,8 127,5 156,8 355,2 3.602,5 74,8 34,8 493.099 3.630 7,9 13,9 20,1 27,2 36,3 55,0 79,3 105,7 239,9 2.367,7 50,4 65,2 182.794 4.465 3,4 8,5 11,2 16,5 25,6 35,7 53,9 77,2 185,3 874,5 32,6 9,7 145.461 4.017 2,0 2,5 2,6 3,0 3,8 5,6 9,3 11,6 40,2 85,9 5,5 5,9 22.037 3.351 4,4 6,3 6,8 8,0 10,5 13,8 22,9 27,8 70,6 421,4 14,0 9,0 46.805 14.496 7,0 36,8 46,8 66,2 95,2 143,1 227,6 306,9 809,1 4.694,0 132,6 52,7 1.921.950 5.081 3,0 6,1 6,9 8,2 10,3 14,3 20,9 30,4 88,3 696,2 14,6 7,6 74.371 3.550 2,2 7,3 7,9 9,2 11,4 15,7 24,9 37,1 75,9 868,2 15,9 7,3 56.584 760 2,7 2,7 3,4 5,0 7,4 8,7 9,7 10,5 35,2 35,2 7,6 2,7 5.757 388 2,4 2,4 2,8 3,8 5,5 9,4 14,1 18,7 18,7 18,7 7,1 2,4 2.773 677 2,8 3,3 5,4 5,9 7,8 9,5 18,5 20,8 24,7 24,7 9,0 5,6 6.068 1.376 4,5 7,2 10,3 21,3 35,6 50,4 59,3 67,2 90,3 90,3 35,9 28,4 49.405 1.828 2,3 4,5 6,7 13,5 22,1 33,1 50,5 76,8 79,8 137,1 26,6 31,2 48.622 2.780 4,1 8,4 10,8 19,1 28,4 39,6 54,1 60,4 76,2 114,0 30,4 4,1 84.574 3.863 5,2 8,9 10,1 16,9 27,8 37,2 45,4 53,5 81,2 558,4 30,9 16,9 119.211 3.889 3,7 5,5 7,8 13,3 22,3 38,1 53,9 60,0 99,6 135,4 27,5 5,4 107.101 3.312 5,9 10,6 13,0 17,4 26,9 40,3 51,0 56,5 105,8 107,6 30,1 19,4 99.831 3.382 5,9 9,2 10,7 14,6 20,1 26,9 34,9 44,9 65,7 117,0 22,5 16,3 76.196 1.566 1,9 2,3 2,6 3,2 4,7 6,1 13,9 16,2 20,9 20,9 6,1 4,8 9.579 422 2,7 2,7 2,9 5,6 5,7 8,7 10,0 12,0 17,7 17,7 7,0 5,6 2.950 963 15,3 19,2 27,7 40,1 51,9 76,4 106,0 131,2 149,2 149,2 59,5 149,2 57.320 2.809 2,5 4,6 6,6 8,8 12,3 16,7 21,9 25,1 34,3 37,1 13,2 12,3 37.188 442 2,5 2,5 3,5 4,7 8,9 11,0 14,5 16,6 16,6 16,6 8,4 14,5 112.867 1,9 5,2 6,9 10,9 23,8 50,7 94,2 135,3 299,4 4.694,0 44,4 2,7 3.732 5.014.405 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 4. Ponderación por elegibilidad La población de inferencia de la encuesta Casen son las personas que residen en forma habitual en viviendas particulares ocupadas. Esta definición es consistente con la definición de los marcos muestrales urbano y rural elaborados por el INE. Sin embargo, a pesar de todos los esfuerzos que se realicen por mantener marcos muestrales válidos para esta población siempre existe la posibilidad de errores de inclusión (y exclusión) en el marco. Por ejemplo, fallas en el proceso de enumeración pueden derivar en el registro de inmuebles no elegibles (ej. casas de veraneo, negocios) en el marco 42 . Cambios en el uso de la vivienda también pueden ocurrir entre el momento de enumeración y el momento de la entrevista. Por esta razón, es importante ajustar las probabilidades de selección de las viviendas seleccionadas para incorporar el hecho de que una fracción de las viviendas seleccionadas en la muestra es no elegible y para otras simplemente se desconoce su elegibilidad. Al término del trabajo de campo, todas las viviendas seleccionadas inicialmente por el INE terminan siendo clasificadas en tres grandes grupos: (1) elegibles, (2) no elegibles, y (3) de elegibilidad desconocida 43 . Al primer grupo pertenecen aquellas edificaciones en que el encuestador pudo determinar que se trataban de viviendas particulares ocupadas (incluye tanto entrevistas como no entrevistas). Al segundo grupo corresponden edificaciones identificadas como negocios, viviendas colectivas, viviendas deshabitadas, viviendas de veraneo, viviendas destruidas, etc. El tercer grupo de unidades son aquellas en que no se pudo determinar su estado. Este es el caso, por ejemplo, de unidades que nunca fueron enviadas a terreno, donde no se pudo llegar al lugar, donde no se pudo encontrar el lugar, y otros casos similares. El Ponderador de Selección de Viviendas tiene valores válidos para las viviendas elegibles, no elegibles y de elegibilidad desconocida. En lo que sigue del proceso sólo se dejarán valores válidos para las viviendas elegibles. A continuación se describen los ajustes aplicados. 4.1. Ajuste por Elegibilidad Desconocida En la población, todas las viviendas tienen un estatus conocido de elegibilidad – ellas son o no son viviendas particulares ocupadas. Durante el trabajo de campo, sin embargo, este estado no se puede verificar y algunas viviendas terminan clasificadas como “Elegibilidad Desconocida”. Antes de seguir avanzando, se debe corregir esta situación. Con este fin, el Ponderador de Selección de Viviendas asociado a viviendas clasificadas como de “Elegibilidad Desconocida” se redistribuye entre las viviendas con Elegibilidad Conocida (elegibles y no elegibles) al interior de cada estrato. La proporción de los pesos que debe ser redistribuida se calcula como la razón entre dos estimaciones realizadas en base al Ponderador de Selección de Viviendas. El numerador corresponde a la estimación del total de viviendas en la población y el denominador corresponde a la estimación del total de viviendas con elegibilidad conocida (viviendas elegibles y no elegibles), es decir, 42 El proceso de enumeración consiste en el registro de direcciones asociadas a las manzanas y secciones seleccionadas en la muestra. Este trabajo se realiza en terreno por personal del INE entre 3 y 6 meses antes del trabajo de campo. 43 Para una completa descripción de los Estados de Disposición Final de Casos y su protocolo de implementación ver Manual del Trabajo de Campo Casen 2011. 63 64 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Rˆ h ,know w i h j i '' hij w i h j i ,know '' hij , (9) donde i : Corresponde al conjunto de viviendas seleccionadas en la manzana o sección i. i,know : Corresponde al conjunto de viviendas seleccionadas en la en la manzana o sección i y clasificadas como elegibles o no elegibles. Luego, el Ponderador de Selección de Vivienda Corregido por Elegibilidad está dado por, ''' '' whij Rˆ h,know whij . (10) Las figuras VI.10 y VI.11 presentan la distribución del Ponderador de Selección de Viviendas corregido por Elegibilidad, para cada región y según el marco de procedencia. Este ajuste no afecta significativamente la magnitud y variabilidad de los ponderadores asociados al Marco de secciones o de manzanas. Esto, probablemente por la baja prevalencia de unidades de elegibilidad desconocida. De las 112.867 viviendas seleccionadas un 1,8% fueron clasificadas como elegibilidad desconocida (2.082 viviendas). Algunos resultados del proceso de ajuste se presentan en la Tabla VI.10. En la muestra Casen 2011, hay 110.785 viviendas con Elegibilidad Conocida. El Ponderador de Selección de Viviendas Corregido por Elegibilidad oscila entre 2 y 4.736. La estimación del total del total de viviendas utilizando este ponderador es de 5.014.405 unidades, lo que corresponde al mismo total estimado en el apartado 3.2. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VI.10: Distribución del Ponderador de Selección Corregido por Elegibilidad (MS2002) Figura VI.11: Distribución del Ponderador de Selección de Vivienda Corregido por Elegibilidad (MM2008) 65 66 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.10: Estadísticas descriptivas del Ponderador de Vivienda Corregido por Elegibilidad, según Marco y Región. Factor ajustado por elegibilidad desconocida - FULL Secciones Manzanas Marco Región Mínimo Moda Percentil 05 Percentil 10 Percentil 25 Mediana Percentil 75 Percentil 90 Percentil 95 Máximo Media Viviendas estimadas Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos 165 7.003 3,4 7,3 5,3 5,7 6,4 8,3 12,5 19,9 28,1 747,0 12,2 83.727 99 7.118 2,2 12,9 8,6 9,3 11,2 14,8 21,5 32,0 43,3 1.330,7 20,5 143.611 Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Total País Sin ponderador Viviendas muestra 215 5.907 2,1 13,2 6,1 7,0 8,3 10,5 14,2 22,1 29,8 471,9 13,6 77.179 29 3.142 9,2 87,7 16,3 19,1 28,9 37,3 53,9 75,7 99,9 2.519,2 50,2 156.222 135 7.867 5,1 35,9 21,2 29,0 42,3 55,5 77,5 123,6 168,8 964,4 70,9 547.996 70 3.830 5,6 50,1 7,7 11,3 17,9 31,1 46,3 69,7 101,5 2.978,7 43,8 164.758 68 4.365 5,7 24,6 13,2 14,5 19,0 36,7 53,7 75,8 100,4 1.852,7 43,8 188.331 167 6.588 5,9 38,1 23,4 28,2 39,7 56,2 77,6 130,4 160,8 3.685,5 76,8 493.075 89 3.630 8,0 37,0 14,2 20,5 27,8 37,1 56,2 80,9 107,9 2.417,0 51,6 182.621 106 4.465 3,5 10,0 8,7 11,4 16,9 26,3 36,6 55,2 81,0 896,8 33,4 145.463 43 4.017 2,0 6,0 2,5 2,7 3,0 3,8 5,7 9,4 11,7 86,9 5,5 22.019 41 3.351 4,5 9,1 6,4 6,9 8,1 10,7 14,0 23,2 28,2 427,1 14,1 46.794 72 14.496 7,1 53,1 37,1 47,2 66,8 96,0 144,3 229,6 309,6 4.735,7 133,2 1.921.933 64 5.081 3,0 7,7 6,2 7,0 8,4 10,5 14,5 21,2 30,7 706,3 14,8 74.330 20 3.550 2,2 7,4 7,3 7,9 9,3 11,5 15,8 24,9 37,3 873,7 16,0 56.592 47 760 2,8 2,8 2,8 3,6 5,3 7,7 9,1 10,1 10,1 36,7 8,0 5.680 8 388 2,5 2,5 2,5 2,8 3,9 5,6 9,7 14,4 19,1 19,1 7,3 2.781 13 677 2,9 5,7 3,4 5,6 6,1 7,4 9,8 19,0 21,4 25,3 9,1 6.068 36 1.376 4,5 29,1 7,3 10,6 21,9 36,5 51,7 60,9 68,9 92,7 36,9 49.394 83 1.828 2,5 33,0 4,7 7,0 14,3 22,2 34,7 53,4 81,2 144,9 27,6 48.171 76 2.780 4,2 4,2 8,5 10,9 19,6 28,9 40,5 55,4 61,8 116,6 31,3 84.581 80 3.863 5,3 17,2 9,0 10,2 17,2 28,4 37,9 46,2 54,5 567,4 31,4 118.909 104 3.889 3,8 5,6 5,7 8,0 13,6 22,8 38,9 55,1 61,4 138,5 28,3 107.124 52 3.312 6,1 19,6 10,7 13,2 17,5 27,2 40,7 51,4 57,0 109,9 30,7 100.003 48 3.382 6,1 22,8 9,4 10,8 14,8 20,2 27,2 35,2 45,3 118,1 22,9 76.194 52 1.566 2,0 5,0 2,4 2,7 3,4 4,7 6,4 14,0 16,9 21,8 6,3 9.597 6 422 2,8 5,6 2,8 3,0 5,6 5,8 8,8 10,2 12,2 18,0 7,1 2.962 14 963 15,4 151,0 19,4 28,0 40,6 51,6 77,3 107,2 132,8 151,0 60,4 57.337 77 2.809 2,6 12,7 4,8 6,7 9,0 12,7 17,2 22,5 25,8 38,1 13,6 37.228 3 442 2,5 14,5 2,5 3,5 4,7 8,9 11,0 14,5 16,6 16,6 8,5 3.725 2,00 2,83 5,28 7,04 11,09 24,42 51,72 96,02 138,09 4735,74 45,26 5.014.405 2082 112.867 67 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 4.2. Ajuste por No Elegibilidad Entre las 110.785 viviendas con Elegibilidad Conocida, hay 105.560 que corresponden a viviendas Elegibles y 5.225 que corresponden a No Elegibles (ver Cuadro 14). El objetivo analítico de la Encuesta Casen es producir inferencias hacia la población que reside en viviendas particulares (Elegibles), por lo tanto a partir de esta etapa no se consideran para fines analíticos aquellas viviendas que no conforman la población objetivo de la encuesta (No Elegibles, tales como empresas, viviendas abandonadas, viviendas de veraneo, viviendas demolidas, etc.). Esto se implementa asignando un valor blanco (missing), en el Ponderador de Selección de Viviendas Corregido por Elegibilidad, a las viviendas con clasificación “No Elegible”. A partir de este ajuste, la suma del ponderador corresponde a la estimación del total de viviendas elegibles (viviendas particulares ocupadas) y es de 4.794.266 unidades. Entre las viviendas elegibles, hay 84.239 para las cuales se logró concretar una o más entrevistas44 y 21.321 para las cuales no se logró concretar ninguna. El siguiente capítulo discute los problemas que esta situación conlleva y la forma de corregirlos implementada en Casen 2011. Tabla VI.11: Total de viviendas elegibles Vivienda elegible Frecuencia Porcentaje No Sí Desconocida 5.225 4,6 105.560 93,5 2.082 1,8 Total 112.867 100,0 5. Ponderación por no respuesta De las 105.560 viviendas elegibles seleccionadas en la muestra, se logró concretar entrevistas en 84.239 de ellas. Es decir, la tasa de respuesta de la encuesta fue de 80%. ¿Qué implicancias puede tener el hecho de no haber logrado entrevistas en 1 de cada 5 viviendas elegibles? La respuesta es “depende”. Si no hay relación entre el patrón de no respuesta y la variable de interés, entonces es posible que la no respuesta sólo afecte la precisión de las estimaciones de interés. Sin embargo, si hay alguna relación entre la no respuesta y la variable de interés, existe riesgo de sesgo en las estimaciones a partir de la muestra. En Casen 2011, existe evidencia de que la no respuesta es mayor en comunas de mayor nivel socioeconómico. Si no se corrige por este patrón de no respuesta, estadísticas como el coeficiente de Gini, podrían estar subestimadas (ya que en la encuesta estarían subrepresentadas las viviendas en comunas más afluentes). Otras estadísticas, como la participación en 44 Recordar que, bajo el protocolo de trabajo de campo Casen, al interior de una vivienda seleccionada se completan tanta entrevistas como hogares sean identificados en la vivienda. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 organizaciones sociales, puede no verse afectada por la falta de respuestas en estos sectores. La población en Chile está segregada geográficamente según nivel socioeconómico y el patrón de no respuesta lo está de la misma manera. Dado que los temas de mayor interés de la Encuesta Casen están fuertemente relacionados con variables socioeconómicas, el riesgo de sesgo por no respuesta es elevado. En este contexto, se hace necesario aplicar algún tipo de ajuste estadístico que trate de corregir este problema. En la literatura existen métodos explícitos e implícitos para la corrección de la no respuesta. Hasta 2006, la metodología de construcción de los factores de expansión Casen consideraba ajustes “implícitos”. En 2009, se implementó por primera vez un ajuste explícito. El ajuste consistió en re-ponderar los ponderadores de selección de vivienda por el inverso de la tasa de respuesta en cada conglomerado. Intuitivamente, este ajuste asume que la tasa de respuesta al interior de cada conglomerado es una buena aproximación de la probabilidad de responder de cada vivienda en el conglomerado. También asume que al interior de cada conglomerado, la no respuesta es aleatoria, por lo tanto los que responden pueden representar a los que no responden. El enfoque implementado en 2009 es consistente con los métodos denominados “ajuste por medias condicionadas”, donde la media corresponde a la tasa de respuesta y se condiciona en el identificador de conglomerados. Esta metodología va en la dirección correcta y es perfectible. El método utilizado para el desarrollo del ajuste de no respuesta en 2011 se denomina “estratificación en base al propensity score” (Valliant et al. 2012). En términos concretos, el método requiere de: (1) la definición de las celdas de ajuste y (2) la determinación de la razón de ajuste. La determinación de las celdas de ajuste, también denominados “estratos” de ajuste, se realiza en tres pasos: 1. Selección del modelo de predicción de la probabilidad de responder de las viviendas elegibles. 2. Predicción de la probabilidad de responder de cada vivienda elegible en la muestra (n=105.560). 3. Ordenamiento de las probabilidades predichas, de mayor a menor, y creación de veintiles de la probabilidad de responder. Si el modelo de predicción es correcto, al interior de las 20 celdas de ajuste las viviendas son similares en sus características de interés y, por consiguiente, los entrevistados pueden representar a los no entrevistados. Bajo este supuesto, los ponderadores asociados a las viviendas elegibles que no respondieron deben ser redistribuidos entre las viviendas elegibles que si respondieron. Para estos efectos, se debe calcular una razón de ajuste. La determinación de la razón de ajuste viene dada por la ecuación (11) y se realiza al interior de cada veintil utilizando el Ponderador de Selección de Viviendas Corregido por Elegibilidad. En el numerador se incluye la estimación del total de viviendas elegibles, y en el denominador se incluye la estimación del total de viviendas elegibles que responde, lo que puede ser expresado como, 68 69 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 w w ''' hij Rˆ g , R i g j i , eleg , ''' hij i g j i , eleg , resp donde (11) g : Representa el indicador del veintil de no respuesta. g : Corresponde al conjunto de manzanas o secciones asignadas al ventil g. i,eleg : Es el conjunto de viviendas pertenecientes al conglomerado i y catalogadas como elegibles. i ,eleg ,resp : Es el conjunto de viviendas pertenecientes al conglomerado i, catalogadas como elegibles y que responden la encuesta. La Tabla VI.12 presenta el ponderador de no respuesta (factor de ajuste) estimado para cada veintil. Aquí se aprecia que el grupo que tiene una mayor ponderación es el grupo 1 incrementando los ponderadores de elegibilidad desconocida al doble, mientras que el ponderador de las viviendas pertenecientes al grupo 20 son los que tienen menor impacto por la corrección de no respuesta. Tabla VI.12: Ponderador de no respuesta por celda de ajuste Ponderador de corrección por no respuesta Celda de ajuste de Viviendas no respuesta Sin Ponderador R_nr Muestra 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 4.105 7.237 2,19 2.409 5.025 1,78 2.433 6.459 1,45 1.267 3.708 1,46 1.346 3.819 1,44 1.783 5.594 1,37 1.636 6.219 1,31 1.188 4.532 1,30 1.660 6.401 1,26 1.292 5.583 1,25 947 4.785 1,16 948 5.335 1,17 1.013 5.218 1,15 983 5.039 1,19 914 5.537 1,14 807 5.129 1,13 907 5.520 1,15 979 5.903 1,13 996 6.773 1,10 1.015 9.051 1,07 70 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Una vez estimados los factores de ajuste, el Ponderador Corregido por No Respuesta puede ser expresado como, NR ''' whij Rˆ g , R whij . (12) Este ponderador se asigna a las viviendas elegibles entrevistadas. A las viviendas elegibles no entrevistadas se asigna un valor blanco (missing). Las Figuras VI.12 y VI.13 presentan la distribución del Ponderador Corregido por No Respuesta, diferenciado según Marco de procedencia. Para las unidades provenientes del marco de secciones (MS2002), se puede apreciar en la figura VI.12, que la variabilidad del Ponderador Corregido por No Respuesta tiene un comportamiento similar al Ponderador Corregido por Elegibilidad. Se observa que sólo cambia la escala, es decir los rangos entre los cuales oscilan los ponderadores cambian entre un ajuste y otro, pero no existe un cambio significativo en cuanto a la variabilidad del ponderador, debido al nuevo ajuste. La Región Metropolitana sigue concentrando la mayor variabilidad. El valor más extremo, sin embargo, se encuentra en la Región del Maule (655 unidades, valor extremo omitido de la figura). Los ponderadores ajustados por no respuesta para las unidades provenientes del marco de manzanas (MM2008), visualmente no tienen cambios significativos en lo que respecta a variabilidad. Sin embargo, se debe señalar que el rango de los ponderadores al interior de cada región fue incrementado. El caso más relevante es la región Metropolitana, pues el 50% de los ponderadores de elegibilidad poseen valores inferiores a 96 unidades, mientras que ahora asciende a 137 unidades. En la Tabla VI.13, se exponen las estadísticas descriptivas básicas del ponderador ajustado por no respuesta, donde se puede apreciar que la estimación del total de viviendas elegibles que responde, coincide con la estimación de viviendas elegibles realizados en el apartado 4.2, 4.794.266 unidades. Los ponderadores más grandes (superior a mil unidades) provienen del Marco de manzanas, con mayor énfasis en las regiones Metropolitana y Biobío. Con este ponderador se pueden realizar análisis a nivel de viviendas, sin embargo las unidades de análisis corresponden a los hogares y personas residentes en las viviendas particulares presentes en la muestra. Si se realizan análisis de personas u hogares con este ponderador, es posible que la población sea subestimada o sobrestimada de forma desmesurada. Para resolver este tipo de inconvenientes se realiza un nuevo ajuste, apoyado por variables exógenas, que den cuenta del total de la personas del país. La sección que sigue describe el método de calibración que corrige esta situación. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VI.12: Distribución del Ponderador Corregido por No Respuesta (MS2002) Figura VI.13: Distribución del Ponderador Corregido por No Respuesta (MM 2008) 71 72 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.13: Estadísticas descriptivas del Ponderador Corregido por No Respuesta. Factor ajustado por no respuesta - FULL Secciones Manzanas Marco Total País Región Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Sin ponderador Viviendas muestra Percentil 10 Percentil 25 Mediana Percentil 90 Percentil 95 2621 7.003 Mínimo 5,0 Moda 9,0 Percentil 05 7,4 8,0 9,3 12,9 Percentil 75 18,6 32,2 44,9 Máximo 1.078,4 Media 18,2 Suma 79.583 2468 7.118 2,6 25,1 11,7 13,5 16,8 22,1 31,0 45,3 61,6 1.921,2 30,3 140.675 2519 5.907 3,1 28,8 8,1 9,9 14,2 18,1 26,5 36,7 49,7 1.032,2 23,2 78.531 691 3.142 10,1 127,2 17,8 21,8 34,2 43,8 62,4 88,7 127,2 2.954,6 58,0 142.272 2698 7.867 5,8 44,9 22,7 31,8 48,1 67,2 97,8 146,4 207,8 1.258,8 87,0 449.622 723 3.830 6,4 63,2 9,7 13,0 20,5 35,5 55,7 88,1 117,8 3.551,7 50,8 157.911 722 4.365 6,0 73,9 14,9 16,6 23,0 42,3 61,1 89,3 115,7 2.111,0 50,5 184.072 1362 6.588 6,7 70,6 26,5 32,4 46,2 66,4 94,9 156,6 215,4 4.199,2 91,7 479.242 830 3.630 9,1 43,8 15,8 23,1 31,0 43,8 66,8 95,2 134,5 3.027,1 61,4 171.836 977 4.465 3,8 25,7 10,4 13,0 20,4 30,7 44,7 64,6 95,5 1.123,2 40,2 140.287 1085 4.017 2,6 3,3 3,3 3,5 4,0 4,9 7,3 11,3 15,2 112,7 7,0 20.450 1267 3.351 6,5 16,2 9,3 10,2 12,8 16,3 21,2 32,5 40,6 619,2 21,5 44.889 4423 14.496 8,1 76,4 55,5 70,1 97,9 137,2 202,2 324,6 452,3 5.931,1 186,6 1.879.634 846 5.081 3,2 7,7 6,8 7,9 9,6 12,0 16,5 24,5 35,2 798,3 17,0 71.849 838 3.550 3,0 9,3 9,3 9,9 11,6 14,1 19,1 30,1 43,6 1.024,8 19,3 52.427 300 760 3,9 9,6 3,9 4,7 7,2 10,0 13,1 13,8 15,9 39,2 11,0 5.044 114 388 2,7 2,7 2,7 3,5 4,5 6,5 11,3 18,2 24,8 24,8 9,3 2.535 173 677 3,6 10,2 4,3 7,2 8,2 10,2 12,7 14,4 34,7 43,6 11,9 6.004 242 1.376 5,3 33,6 8,1 10,4 23,3 42,2 57,0 65,2 79,5 104,8 41,2 46.748 404 1.828 2,8 5,1 5,2 7,7 15,3 26,3 37,9 62,5 76,5 181,5 30,7 43.763 476 2.780 4,6 26,4 10,8 12,8 22,3 32,4 46,7 60,7 68,6 135,3 35,6 81.928 347 3.863 6,0 27,0 9,7 11,4 19,0 30,8 40,9 50,1 61,6 654,9 34,5 121.304 587 3.889 4,8 6,0 6,7 10,1 15,7 27,3 44,1 64,6 70,8 151,9 32,8 108.274 238 3.312 6,9 20,9 12,0 14,1 20,1 30,3 44,7 56,9 62,5 125,2 34,2 105.277 246 3.382 7,3 13,1 10,4 12,1 16,3 22,9 30,4 38,2 50,0 138,5 25,8 81.030 350 1.566 2,6 5,9 3,2 3,4 4,2 5,7 9,3 16,0 18,6 25,1 7,6 9.243 118 422 3,8 7,5 3,8 4,1 7,3 7,5 11,1 13,1 16,7 26,3 9,4 2.861 253 963 19,4 48,3 24,3 29,7 46,6 61,5 92,9 125,0 141,8 171,3 71,0 50.395 677 2.809 3,0 18,9 6,4 8,2 10,1 14,0 18,9 24,1 27,6 44,0 15,2 32.388 33 442 3,1 16,3 4,2 4,4 5,9 10,3 12,5 16,9 19,8 19,8 10,2 28.628 112.867 2,6 5,9 6,5 9,2 15,0 29,8 61,5 123,7 180,4 5.931 56,9 4.189 4.794.266 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 6. Ponderación de calibración La muestra Casen corresponde a una muestra de viviendas y, hasta este punto, los factores de expansión calculados sirven para llevar estas unidades muestrales a sus respectivos stocks poblacionales. Sin embargo, dado que las personas que residen en las viviendas seleccionadas son las principales unidades de interés analítico de la encuesta, en esta etapa se requiere incorporar información acerca de este stock poblacional a los factores de expansión. Con este objetivo, para cada Encuesta Casen se solicita al INE que prepare proyecciones de población al 30 de noviembre del año de la Casen en curso. Para 2011, estas proyecciones se solicitaron para las 324 comunas en la muestra y además para las 30 divisiones dadas por el cruce de región y área (urbano, rural). Las proyecciones de población preparadas por el INE son desarrolladas a partir de modelos demográficos que modelan toda la población en el país, sin diferenciar entre aquellos que residen en viviendas particulares y aquellos que se encuentran en viviendas colectivas. La población de inferencia de la Encuesta Casen, sin embargo, está restringida a las personas que residen en viviendas particulares ocupadas. En atención a esta discrepancia, las proyecciones de población elaboradas por INE se ajustan por un factor que representa la proporción de personas que reside en viviendas particulares sobre el total de la población. Este factor se estima, para cada estrato, en base a los resultados del último Censo disponible. Por ejemplo, a nivel nacional, la proyección de población al 30 de noviembre de 2011 era de 17.312.726 personas. Según el Censo 2002, la proporción de personas residentes en viviendas particulares es de 97,9%, por lo tanto una estimación del total de la población que reside en viviendas particulares es 16.962.560 personas. Hasta 2009, el diseño muestral de la Encuesta Casen tenía como objetivo producir estimaciones a nivel comunal y regional. Por lo tanto, se desarrollaron factores de expansión comunales y regionales para cumplir tales propósitos45. El diseño de la muestra 2011 fue optimizado para la estimación de las tasas de pobreza a nivel regional. Por comparabilidad, sin embargo, se desarrollaron factores de expansión regionales y comunales. A continuación se describen los procedimientos para la última etapa de desarrollo de los factores de expansión de Casen 2011. Primero se describe el desarrollo del Ponderador de Calibración Regional y luego el Ponderador de Calibración Comunal. 45 El año 2006 y 2009 se desarrollaron factores de expansión provinciales. El año 2009 se desarrollaron dos sets de factores de expansión, un set que expande a la población en hogares particulares (expr, expc, expp) y otro set que expande a la población total nacional (expr_p, expc_p, expp_p). 73 74 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 6.1. Ponderador de Calibración Regional El Ponderador de Calibración Regional, también conocido como “Factor de Expansión Regional” (expr), se asocia a cada persona en la muestra. Esto, a diferencia con los ponderadores anteriores, que están asociados a las viviendas en la muestra. El procedimiento de cálculo de este ponderador puede ser resumido en cuatro pasos: 1. Ajustar las proyecciones de población y estimar el total de personas en hogares particulares. Se solicitó al INE las proyecciones de población para los 30 estratos formados por el cruce de región y área (urbano, rural). Las proyecciones fueron ajustadas, según la proporción de personas residentes en viviendas particulares reportadas por el Censo de Población y Vivienda del año 2002. Este ajuste fue realizado por comuna-área y luego se sumó el total de población en la región y área, utilizando la información disponible en todas las comunas de la región. De este modo se estimó el total de personas residentes en viviendas particulares ( N RA ) en los 30 estratos formados por el cruce de región-área. 2. Estimar el total de personas en hogares particulares a partir de Casen 2011. En cada vivienda entrevistada se multiplicó en Ponderador Corregido por No Respuesta por el número de personas en la vivienda para obtener una estimación del total de personas residentes en viviendas particulares en cada región-área. 3. Construir el ajuste a población total. Se construyó la razón R̂RA , a partir del cociente entre la estimación del total de personas residentes en viviendas particulares desarrollado a partir de las proyecciones de población ( N RA , en paso 1) y la estimación de la Encuesta 2011 (paso 2). Donde Rˆ RA N RA NR N hij whij , R 1, ,15 y A Urbano, Rural hRA i h j i , eleg , resp N RA : Corresponde al total de personas particulares, en la región R y área A. (13) residentes en viviendas N hij : Corresponde al total de personas residentes en la vivienda j, del conglomerado i, en el estrato h. 4. Construir el Ponderador de Calibración Regional. Finalmente se multiplica el Ponderador Corregido por No Respuesta con el ajuste de población total (paso 3). 75 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 El factor de expansión regional tiene la siguiente expresión: RA NR whijk Rˆ RA whij (14) Las figuras VI.14 y VI.15 muestran la distribución de los Ponderadores de Calibración regional para el marco rural y urbano respectivamente. Se puede apreciar que los patrones observados en ponderadores preliminares se mantiene y que los mayores ponderadores se concentran en la región Metropolitana (tanto para el marco urbano como rural). Además, se observa que las unidades provenientes del MM2008 pertenecientes a las regiones Metropolitana, V y VIII son las que poseen mayor variabilidad, lo que se explica, en parte, porque en ellas se concentra gran parte de la población total, así como también existe gran diversidad en estructura de sus unidades (manzanas grandes y chicas). En ambos gráficos se observa que, en comparación con los ponderadores Corregidos por No Respuesta, los Ponderadores de Calibración Regional de Valparaíso y Aysén se incrementan más que los de otras regiones. Esto se explica porque en estas regiones se concentra parte importante de las comunas no presentes en la muestra (Áreas de Difícil Acceso). En él se aprecia que las unidades provenientes del MS 2002 sus ponderadores ajustados al stock regional oscila entre 2,2 y 604, mientras que para las unidades provenientes del MM2008 este valor varía entre 2,3 y 5.751. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VI.14: Factor de expansión calibración Región – área – MS2002 Figura VI.15: Factor de expansión calibración Región – área – MM2008 76 77 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.14: Estadísticas descriptivas, Ponderador de Calibración Regional (Factor de Expansión regional), según marco. Factor ajustado a las PP Región-Area - FULL Marco Región Secciones Manzanas Perdidos Mediana Percentil 90 Percentil 95 Percentil 99 Máximo 2.184 6.566 4,5 8,2 7,2 11,7 29,3 40,8 80,2 979,9 16,5 72.312,3 2.152 6.802 2,3 22,6 12,2 20,0 40,9 55,6 140,6 1.734,7 27,3 127.018,7 1.915 5.303 2,6 24,6 8,5 15,5 31,3 42,4 92,9 880,2 19,8 66.966,4 477 2.928 11,1 138,8 23,8 47,7 96,8 138,8 329,1 3.224,1 63,3 155.250,0 1.585 6.754 6,3 48,2 34,2 72,1 157,1 223,0 493,2 1.350,7 93,3 482.478,8 493 3.600 6,9 68,2 14,1 38,3 95,2 127,3 301,9 3.838,1 54,9 170.644,3 505 4.148 5,6 68,2 15,3 39,1 82,4 106,8 170,2 1.947,3 46,6 169.795,7 987 6.213 6,4 67,3 30,9 63,4 149,4 205,4 416,1 4.005,0 87,5 457.076,7 604 3.404 9,0 43,5 22,9 43,5 94,5 133,5 295,3 3.004,7 60,9 170.560,9 669 4.157 4,4 29,6 15,0 35,4 74,5 110,2 272,1 1.295,6 46,4 161.827,9 890 1.063 3.822 3.147 2,8 6,5 3,7 16,1 3,9 10,2 5,5 16,2 12,5 32,4 16,9 40,5 44,4 113,3 125,3 617,6 7,8 21,5 22.736,0 44.769,6 4.129 14.202 7,8 74,0 67,9 133,0 314,7 438,5 1.062,1 5.750,9 180,9 1.822.540,4 591 4.826 3,3 7,8 8,1 12,2 25,0 35,9 103,6 813,4 17,3 73.212,4 744 3.456 2,4 7,4 7,9 11,2 23,9 34,6 71,5 812,9 15,3 41.589,5 75 535 4,1 10,2 5,0 10,7 14,7 16,9 41,6 41,6 11,4 5.262,2 75 349 3,2 3,6 3,6 8,5 24,3 33,1 33,1 33,1 11,6 3.173,8 131 635 3,6 10,3 7,3 10,3 14,5 34,8 41,8 43,8 12,0 6.028,9 Coquimbo 103 1.237 5,8 31,3 11,4 39,2 60,6 74,0 97,5 97,5 38,7 43.941,5 Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Total País 124 1.548 3,1 5,6 8,5 28,3 68,5 83,9 109,3 198,9 33,6 47.859,7 249 2.553 4,9 28,5 13,8 33,8 63,4 72,7 94,0 141,4 37,3 86.020,9 153 3.669 5,5 28,4 11,2 31,9 52,7 63,2 93,0 604,1 35,2 123.810,0 284 3.586 4,6 5,8 9,7 28,8 68,1 74,6 122,3 160,1 34,0 112.426,5 154 3.228 6,8 21,3 14,2 30,9 58,1 63,8 123,8 124,2 34,8 106.911,6 136 3.272 8,4 13,9 12,8 24,3 40,6 53,0 88,7 146,9 27,8 87.030,3 224 88 1.440 392 2,2 3,7 4,8 7,5 2,7 4,0 5,5 7,5 14,3 13,1 16,2 16,2 20,6 25,5 20,6 25,5 6,9 9,3 8.366,3 2.819,0 208 918 18,8 60,3 35,4 76,7 155,9 176,9 213,6 213,6 87,7 62.295,9 308 2.440 3,4 21,8 9,2 16,0 27,8 31,9 41,2 50,8 17,3 36.964,3 21 430 2,5 18,2 4,7 11,6 18,9 22,1 22,1 22,1 11,3 4.611,2 21.321 105.560 2,2 4,8 8,9 30,3 122,5 177,6 391,7 5.750,9 56,7 4.776.302 Tarapacá Antofagasta Atacama Coquimbo Valparaíso Libertador General Bernardo OHiggins Maule Biobio Araucanía Los Lagos Aysén del General Carlos Ibañez del Campo Magallanes y La Antártica Chilena Metropolitana de Santiago Los Ríos Arica y Parinacota Tarapacá Antofagasta Atacama Recuento Mínimo Moda Percentil 10 Media Suma 78 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 6.2. Ponderador de Calibración Comunal El Ponderador de Calibración Comunal, también conocido como “Factor de Expansión Comunal” (expc), también se asocia a cada persona en la muestra. El procedimiento cálculo de este ponderador puede ser resumido en cuatro pasos: Ajustar las proyecciones de población y estimar el total de personas en hogares particulares. Se solicitó al INE las proyecciones de población para los 324 estratos formados por las comunas en la muestra Casen 2011. Las proyecciones fueron ajustadas, según la proporción de personas residentes en viviendas particulares reportadas por el Censo de Población y Vivienda del año 2002. Este ajuste fue realizado por comuna-área y luego se sumó el total de población en cada comuna. De este modo se estimó el total de personas residentes en viviendas particulares ( N c ) en los 324 estratos formados por las comunas en la muestra 2011. Estimar el total de personas en hogares particulares a partir de Casen 2011. En cada vivienda entrevistada se multiplicó el Ponderador Corregido por No Respuesta por el número de personas en la vivienda para obtener una estimación del total de personas residentes en viviendas particulares en cada comuna en la muestra 2011. Construir el ajuste a población total. Se construyó la razón R̂ c , a partir del cuociente entre la estimación del total de personas residentes en viviendas particulares desarrollado a partir de las proyecciones de población ( N c , en paso 1) y la estimación de Casen 2011 (paso 2). Donde: Rˆc Nc N hC i h j i , eleg , resp hij NR whij (15) N c : Corresponde al total de personas residentes en viviendas particulares, en la comuna C. N hij : Es el total de personas encuestadas en la vivienda j, del conglomerado i, en el estrato h. Construir el Ponderador de Calibración comunal. Finalmente se multiplica el Ponderador Corregido por No Respuesta con el ajuste de población total (paso3). 79 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 El factor de expansión comunal tiene la siguiente expresión: C NR whijk Rˆ c whij , (16) Por la forma de construcción, se tiene que todos los individuos residentes en el mismo conglomerado (manzana o sección), comparten el mismo ponderador, el que es interpretado como el total de personas en la comuna de residencia que representa un individuo de la muestra. Por lo tanto, el ponderador puede ser utilizado para realizar análisis de personas y hogares, a nivel de comuna 46. Al usar este ponderador, es importante recordar que este expande sólo al total de la población residente en las comunas que participan en la muestra Casen 2011. Esto, a diferencia del ponderador regional que expande a la población nacional (i.e. incluyendo a la población que reside en Áreas de Difícil Acceso). Las figuras VI.16 y VI.17 muestran la distribución de los ponderadores de Calibración Comunal para las unidades en los marcos rural y urbano respectivamente. Se mantienen las tendencias observadas entre ambos conjuntos de figuras. La región de Aysén posee los ponderadores más pequeños y con menor variabilidad, para las manzanas y secciones. Mientras que en la región Metropolitana se observa mayor variabilidad y ponderadores más grandes. De las figuras VI.16 y VI.17 se desprende que las unidades provenientes del marco de manzanas, en general, poseen mayor variabilidad. Es importante señalar que existen regiones donde se observa un leve decrecimiento, a nivel agregado, en los ponderadores de la Región de Tarapacá, Antofagasta y Atacama, lo que se debe a que las proyecciones de población determinan un total de personas inferior a lo estimado con la información de la muestra. En el resto de las regiones no se aprecia una diferencia significativa en los factores de expansión entre los percentiles 1 al 99. Sin embargo, en los casos extremos (outliers) se aprecia un fuerte incremento o caída. Por ejemplo, el ponderador de la región Metropolitana tenía un valor de 5.931 unidades previo a la calibración comunal, aumentando a 10.637 posteriormente. Si se comparan los valores extremos con los obtenidos al calibrar por región se evidencia un aumento importante en los rangos y en los valores más grandes, como se observa en la Tabla VI.15. 46 Si bien el ponderador puede ser utilizado a nivel de comuna es necesario antes de realizar el análisis considerar el error estándar asociado, ya que en algunas comunas el tamaño muestral no es suficiente para obtener estimaciones robustas. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VI.16: Distribución del Ponderador de Calibración Regional (Factor de Expansión Comunal), según región (MS2002). Figura VI.17: Distribución del Ponderador de Calibración Comunal (Factor de Expansión Comunal), según región (MM2008). 80 81 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VI.15: Estadísticas descriptivas básicas del factor de expansión calibrado por comuna, según MM y región Factor ajustado a las PP comuna Secciones Manzanas Marco Región Total Viviendas Elegibles Mínimo Moda Percentil 10 Mediana Percentil 90 Percentil 95 Percentil 99 Máximo Media Total Viviendas Expandidas Tarapacá 2.184 6.566 4,0 9,4 7,2 11,4 26,4 36,4 80,0 864,8 16,2 71.037,8 Antofagasta 2.152 6.802 2,0 21,9 11,7 19,7 41,5 55,0 135,9 1.677,0 27,2 126.257,2 Atacama 1.915 5.303 1,9 27,0 6,8 16,2 33,3 43,5 101,9 965,0 20,0 67.653,1 Coquimbo 477 2.928 9,8 143,9 19,9 48,2 99,4 134,7 341,2 3.342,8 62,6 153.511,9 Valparaíso 1.585 6.754 6,4 50,2 36,8 71,9 154,4 220,3 430,1 1.185,0 92,2 476.699,9 Libertador General Bernardo OHiggins 493 3.600 6,1 65,1 13,5 38,7 94,8 118,9 324,7 3.663,4 54,5 169.378,5 Maule 505 4.148 5,2 60,8 17,0 40,2 96,4 116,9 187,4 1.511,9 51,5 187.718,5 Biobio 987 6.213 6,8 73,9 32,3 64,6 147,4 216,9 419,0 3.604,3 88,0 459.666,1 Araucanía 604 3.404 8,5 44,6 22,9 45,0 96,8 138,3 308,2 3.081,9 63,3 177.116,4 Los Lagos 669 4.157 4,0 23,1 15,2 35,0 71,1 102,7 250,3 1.181,0 44,6 155.722,5 Aysén del General Carlos Ibañez del Campo 890 3.822 2,6 3,3 3,5 5,2 12,0 15,5 48,1 111,5 7,3 21.441,2 Magallanes y La Antártica Chilena 1.063 3.147 6,3 15,4 9,8 15,9 31,1 39,3 108,6 591,8 20,8 43.379,8 Metropolitana de Santiago 4.129 14.202 16,9 80,7 65,9 123,0 308,5 443,2 1.021,0 10.636,5 179,8 1.811.075,5 Los Ríos 591 4.826 3,2 8,0 8,4 12,5 25,8 35,4 101,3 838,3 17,8 75.463,5 Arica y Parinacota 744 3.456 2,4 7,5 8,0 11,4 24,2 35,0 72,4 822,9 15,5 42.098,0 Tarapacá 75 535 2,3 9,8 3,5 10,3 30,0 46,8 57,5 57,5 13,0 5.989,4 Antofagasta 75 349 2,5 2,5 5,0 13,3 25,7 38,0 38,0 38,0 15,1 4.137,9 Atacama 131 635 2,2 9,6 5,5 9,0 12,7 25,1 38,9 40,7 9,8 4.927,9 Coquimbo 103 1.237 4,0 32,0 10,0 34,1 73,7 91,4 122,4 122,4 40,5 45.969,6 Valparaíso 124 1.548 2,6 4,7 7,1 28,6 71,6 87,5 132,9 205,6 35,7 50.860,1 Libertador General Bernardo OHiggins 249 2.553 6,6 28,3 14,6 34,8 67,5 75,4 108,9 123,1 38,1 87.805,0 Maule 153 3.669 5,7 28,9 11,4 28,1 49,2 55,2 79,4 266,1 30,4 106.710,9 Biobio 284 3.586 5,2 8,9 9,1 27,4 66,6 76,4 99,1 152,5 34,0 112.224,8 Araucanía 154 3.228 7,3 18,3 12,9 29,8 56,2 67,6 100,4 104,3 32,9 100.990,7 Los Lagos 136 3.272 6,0 16,0 11,5 24,9 42,4 57,6 87,9 145,6 27,9 87.555,0 Aysén del General Carlos Ibañez del Campo 224 1.440 2,6 7,1 3,3 5,4 13,6 14,4 24,0 24,0 7,2 8.707,9 88 392 3,7 7,8 3,9 7,8 13,5 16,0 25,1 25,1 9,5 2.884,7 Metropolitana de Santiago 208 918 14,2 45,4 23,5 71,1 132,2 166,0 195,7 195,7 78,7 55.849,7 Los Ríos 308 2.440 3,1 18,7 8,4 15,2 25,1 28,1 43,7 47,4 16,3 34.765,6 21 430 3,4 13,1 4,7 8,6 15,9 15,9 19,8 19,8 9,6 3.907,5 21.321 105.560 1,88 7,13 8,76 29,80 118,09 175,74 410,57 10636,55 56,41 4751506,38 Magallanes y La Antártica Chilena Arica y Parinacota Total País Viviendas No responden Metodología del Diseño Muestral y Factores de Expansión Casen 2011 VII. 87 Estimación de Varianza Casen es una encuesta con probabilidades de selección desigual. Por eso es que los análisis se deben hacer con factores de expansión. Si no se usan factores de expansión, las viviendas con mayor probabilidad de selección pesan más en la muestra y distorsionan los resultados. Pero si se usan los factores, cada persona en la muestra pesa lo que corresponde para representar a su región (o comuna). Cuando se utiliza un diseño Aleatorio Simple de muestreo, las varianzas de estimaciones lineales como proporciones, medias y totales, encuentran expresiones simples en los manuales de muestreo. Sin embargo, en diseños complejos como multietápicos y por conglomerados, las expresiones analíticas suelen ser difíciles de implementar, por lo que se recurre habitualmente a dos métodos de aproximación (Rust, 1985), el de linealización mediante el desarrollo de una serie de Taylor tanto del estimador como la estimación de la varianza y el de replicación como los métodos de Replicación Repetida de Jackknife (JRR), el de Replicación Repetida Equilibrada (BRR) y el de Bootstrap. En esta sección se presenta en forma sucinta los puntos a considerar en el análisis de una encuesta de diseño complejo como Casen. Se sugiere a los investigadores revisar bibliografía especializada en estos temas (Wolter, 2007; Valliant et al., 2013; Westat, 2007; Heeringa et al., 2010). 1. El Estimador Casen es una encuesta en que según el diseño, las unidades de selección no tienen la misma probabilidad de ser elegidas, o en otras palabras, tienen probabilidades desiguales de ser seleccionadas. Debido a esto, las variables de interés, asociadas a las unidades de selección, deben ser ponderadas por el inverso de estas probabilidades, que comúnmente se denominan expansores o factores de expansión, que indican a cuántos elementos en la población representa un elemento en la muestra seleccionada. Supóngase que de una población U particionada en N unidades, U = { 1, 2, 3, … , N} se toma una muestra probabilística S de tamaño de tamaño n. La Pk S 0 (diseño probabilidad de inclusión de la unidad k está dada por k 1 wk k aleatorio), donde el término es el inverso de la probabilidad de inclusión o ponderador del diseño asociado al individuo k. La probabilidad que los elementos k y q pertenezcan a la muestra, está dada por 1 k q Pk S y q S 0 wk q kq , siendo el ponderador asociado a la inclusión conjunta de los elementos k y q en la muestra. 83 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 t Algunos de los parámetros que se desea estimar son: poblacional de la variable de interés Y, poblacional de la variable Y. y la variable yU y k U k U k yk N , el total , la media En un diseño aleatorio simple, el estimador Horvitz-Thompson permite realizar estimaciones insesgadas del total poblacional y de la media: yi tˆHT iS w y i iS i i (1) y tˆ 1 1 HT i wi y i ˆ ˆ N N iS i Nˆ i S yˆ HT (2) Donde: wi = es el peso o ponderador del i-ésimo elemento según el diseño e indica a cuántos elementos representa en la población y Nˆ w iS i = es el tamaño de la población estimada. En muestreo aleatorio simple para poblaciones finitas, donde se extrae una muestra aleatoria de n elementos de una población que contiene N de ellos, el wk ponderador muestral es Total y es: y N yi N i N yˆ n iS n tˆHT N n , y el estimador de Horvitz-Thompson para el iS (3) Siendo: yˆ iS yi n =el estimador para la media poblacional. En muestreo aleatorio estratificado en cada estrato independiente, el estimador del total dado por el estimador de Horvitz-Thompson es: tˆHT H tˆ yˆ h h1 HT h H N h1 h yˆ h (4) Donde: k S h yk nh =la media muestral en el estrato h, y n h el número de elementos en la muestra dentro del estrato h. 84 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Los estimadores calibrados son usados frecuentemente para obtener estimaciones más precisas, siendo necesario contar con información auxiliar correlacionada con las variables de interés y en donde los totales son conocidos o son fijados a nivel poblacional. La Encuesta Casen utiliza la calibración para ajustar las estimaciones de personas a los stocks poblacionales estimadas por medio de proyecciones que son fijadas como las poblacionales. Adicionalmente, utiliza otros ajustes como la corrección por no respuesta, de modo que el factor de expansión contiene varios componentes que son necesarios para la obtención de las estimaciones. Los estimadores calibrados al ser no lineales, son ligeramente sesgados, pero el sesgo tiende a cero rápidamente en muestras lo suficientemente grandes como la Encuesta Casen. t Para la estimación del total tˆ cal, h w k k S y k U k el estimador calibrado viene dado por: yk (5) Ry z Para la estimación de una razón dado por: Rˆ cal, y z w w k S k S con tˆ r h w k S k yk k zk k rk y z k U k U k k el estimador calibrado viene (6) , siendo r k y k Rˆ cal, y z z k Estimaciones de totales desarrolladas a partir de la encuesta Casen incluyen el total de personas bajo la línea de pobreza y el total de personas de 60 años y más. Estimaciones de razón incluyen las tasas de cobertura de programas escolares y la tasa de desocupación. 2. Varianza del Estimador Las fórmulas anteriores para los estimadores Horvitz-Thompson (HT) de la población total son muy similares a las fórmulas que se aplican en virtud de muestreo igual probabilidad. Sin embargo, las fórmulas para el cálculo de la varianza del estimador HT para el total de la población, son más complejas: Var tˆHT k U q U wk wq 1 y k y q w kq Un estimador insesgado de esta varianza del Total (7) tˆHT es: 85 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Var tˆHT w k S qS wq wk q y k y q k (8) Bajo el mismo diseño aleatorio simple para poblaciones finitas, los ponderadores N N N 1 wk wk q n y n n 1 . son El estimador de H-T para la varianza es, remplazando en la expresión anterior (7): Var tˆHT Siendo N 2 1 f SU2 N y k 1 y k 2 SU n (9) N 1 la varianza poblacional de la variable Y. El estimador de esta varianza de Var tˆHT Siendo N 2 1 f S S2 n y k 1 k y SS tˆHT es: 2 n (10) n 1 la varianza muestral de la variable Y. Tanto en la expresión (9) como en la (10), f n N es la fracción de muestreo y 1 f finitas. fpc es la corrección por finitud o factor de ajuste para poblaciones Bajo el diseño aleatorio estratificado, la varianza de este estimador HT viene dada por: Var tˆHT Siendo N 1 f n h 1 S S2h S S2h H 2 h y kS h h k yh (11) h n h 1 la varianza muestral f h n h Nh es la fracción de muestreo en el estrato h, y en el estrato 1 f h h, fpc h es la corrección por finitud o factor de ajuste para poblaciones finitas en el estrato h. Para la estimación de varianzas calibradas y bajo el supuesto de muestreo aleatorio estratificado con remplazo, los software STATA (svyset), el SPSS (csplan, en muestras complejas) y R (Survey, svydesign) utilizan las siguientes fórmulas con ponderadores w k , lo que facilita los cálculos: 86 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Var tˆ cal Var Rˆ cal, y z H y h 1 k S h H h 1 k S h k wk nh tˆh nh nh 1 r k 2 w k n h tˆ h n h nh 1 (12) 2 (13) Es importante mencionar dos supuestos que son utilizados frecuentemente por los paquetes estadísticos en la estimación de la varianza: Se asume que las unidades primarias de muestreo, en los diseños multietápicos, fueron seleccionadas con remplazo a partir de los estratos de muestreo. Se ignora cualquier corrección por población finita. Como resultado, las estimaciones de varianza estarán levemente sobreestimadas. Se ignoran las etapas de selección al interior de la unidad primaria de muestreo. Es decir, se asume que las unidades fueron seleccionadas en una etapa al interior del conglomerado, por lo tanto la fórmula de estimación de la varianza sólo requiere el identificador de los las unidades primarias de muestreo y los estratos primarios. Toda la variabilidad al interior de la unidad primaria se captura en el estimador compuesto de varianza. 3. Variables que identifican el diseño muestral complejo Un diseño de muestreo complejo se origina cuando interviene más de una etapa de selección, o se genera un muestreo polietápico o en varias etapas. Esta selección en más de una etapa suele ser generalmente además estratificado, lo que añade otro grado de complejidad. Bajo la estratificación, en un muestreo bietápico, las unidades muestrales se suelen llamar conglomerados o unidades de conglomeración, que son grupos de unidades de selección de las últimas unidades de muestreo sobre las cuales se obtienen las variables de interés. La encuesta Casen 2011 presenta un diseño muestral que se puede caracterizar como probabilístico, estratificado y multietápico. En el muestreo estratificado la estimación de la varianza total se obtiene mediante la suma de las varianzas estimadas en cada estrato y la varianza en cada estrato se estima a partir de la variabilidad de la característica de interés entre los conglomerados. En la base de datos de la Encuesta Casen, la variable que identifica los estratos “originales” utilizados en la selección de la muestra se denomina <Estrato> y la variable que identifica los conglomerados “originalmente” seleccionados en la muestra se denomina <Segmento>. En total considerando la muestra completa (submuestras 1 y 2), la muestra 2011 consideró 585 estratos y 10.479 conglomerados (9.236 manzanas y 1.243 secciones). Para hacer factible la estimación de la varianza en un muestreo estratificado, se deben seleccionar como mínimo 2 conglomerados por estrato. Para evitar estimaciones de varianza volátiles, se recomienda seleccionar un número mínimo de unidades muestrales (ej. viviendas) por conglomerado. En consecuencia, diseños muestrales adecuados consideran al menos dos conglomerados por estrato al momento de selección de la muestra y un número mínimo de unidades por conglomerado. El diseño Casen 2011 estableció, para la muestra completa, un mínimo de 2 conglomerados por estrato y un mínimo de 30 y 50 viviendas Metodología del Diseño Muestral y Factores de Expansión Casen 2011 87 por conglomerado para aquellos rurales (secciones) y urbanos (manzanas) respectivamente. La implementación de la muestra 2011, sin embargo, se llevó a cabo en dos submuestras independientes con la finalidad de producir estimaciones oficiales a partir de la submuestra 2, la cual concentra un 67% de los conglomerados y viviendas de la muestra completa. Por otra parte, pérdidas asociadas a elegibilidad de las viviendas seleccionadas y diversas formas de no respuesta, implicó en algunas zonas una drástica reducción en la cantidad de viviendas de algunos conglomerados. Como consecuencia del menor tamaño muestral, se observan casos de estratos con 1 sólo conglomerado (en adelante, estratos unitarios) tanto en la submuestra 1 como en la submuestra 2. En esta última, hay 94 estratos unitarios. Ver Tabla VIII.2 en Anexo. El caso más crítico se observó en la comuna de El Quisco, donde inicialmente se seleccionaron 59 viviendas en 8 manzanas, sin embargo, sólo se logró entrevistar 18 viviendas en 6 manzanas (en dos de esas manzanas, sólo se logró entrevistar a 1 vivienda). Ya sea por diseño o por falta de respuesta, el problema de terminar con estratos con un solo conglomerado, es recurrente en encuestas de hogares. Hay tres opciones para lidiar con el problema de estratos unitarios: (1) no hacer nada, lo que implica que no es posible estimar varianzas; (2) asumir que los conglomerados unitarios fueron seleccionados “con certeza” en cuyo caso estos estratos no contribuyen a la estimación de la varianza (se le asigna varianza igual a 0) generando una subestimación de la varianza; y (3) crear unidades que agrupen estratos unitarios junto a otros estratos (pseudo-estratos) para efectos de cálculo de varianza. Siguiendo las mejores prácticas en la materia, se optó por esta última opción, con la finalidad de poner a disposición de los investigadores variables que permitan identificar las características del diseño complejo de Casen 2011 y producir estimaciones de varianza más estables. Las estimaciones oficiales de la varianza compleja de Casen 2011 serán desarrolladas utilizando pseudo-estrato, pseudo-conglomerado y corrección por poblaciones finitas. A continuación se describen los procedimientos seguidos para la construcción de estas variables. 3.1. Creación de pseudo-estratos (varstrat) La creación de pseudo–estatos tiene como objetivo corregir el problema de estimación de varianza que generan los estratos unitarios (1 conglomerado por estrato), el cual se traduce en una subestimación de la varianza de cualquier variable de interés. Los pseudo-estratos, en adelante varstrat, son una reagrupación de los 583 estratos de muestreo originales (agrupaciones de comunaárea) en donde cada uno contiene al menos dos conglomerados. Cada varstrat fue creado de acuerdo a reglas de ordenamiento jerárquico en cuanto a la división político administrativa, marco de procedencia y al total de conglomerados que estos poseen, uniendo cada uno de los 94 estratos unitarios junto a otros estratos logran que en conjunto contengan al menos dos conglomerados. El procedimiento es como sigue: 1. Si el estrato unitario se encuentra en una provincia y área que posee dos o más estratos, se combina con otro estrato al interior de la provincia y área. 88 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 2. Si el estrato unitario se encuentra en una provincia y área que posee sólo un estrato, se une a un estrato en otra provincia al interior de la misma región, siempre perteneciente a la misma área (urbana o rural). De un total de 585 estratos muestrales se crearon 170 varstrat, los que poseen al menos dos conglomerados. La Tabla VII.1 presenta el total de estratos y varstrat por región y submuestra. Tabla VII.1: Total de estratos y varstrat según región y submuestra. Región Total de Estratos Replica 1 Replica 2 Total de VarStrat Total Replica 1 Replica 2 Total Ari ca y Pa ri na cota 4 4 4 2 2 2 Ta ra pa cá 8 9 9 5 5 5 Antofa ga s ta 10 12 12 5 5 5 Ata ca ma 14 15 15 6 6 6 Coqui mbo 27 28 28 8 8 8 Va l pa ra ís o 61 67 67 15 15 15 Li bertador Genera l Berna rdo OHi ggi ns 60 64 64 16 16 16 Ma ul e 57 60 60 15 15 15 Bi obi o 95 103 104 21 21 21 Ara uca nía 58 64 64 14 15 15 Los La gos 43 48 48 14 14 14 Los Ríos 24 24 24 11 11 11 Ays én del Genera l Ca rl os Iba ñez del Ca mpo 11 11 11 5 5 5 5 5 5 3 3 3 67 69 70 29 29 29 544 583 585 169 170 170 Ma ga l l a nes y La Antártica Chi l ena Metropol i tana de Sa ntia go Total 3.2. Creación de pseudo-conglomerados (varunit) La creación de pseudo–conglomerados tiene como objetivo estabilizar las estimaciones de varianza, la cual tiene a incrementarse cuando las estimaciones se basan en conglomerados con muy pocas unidades muestrales. Es importante recordar que tanto por diseño como por falta de respuesta existen conglomerados pequeños en la muestra. Por una parte en manzanas con 8 viviendas sólo 2 se seleccionan en la muestra, por otra parte por efecto de no respuesta un conglomerado con 15 viviendas seleccionas puede terminar con solo 8 entrevistadas. Los pseudo-conglomerados, en adelante varunit, son una reagrupación de los 10.649 conglomerados originales, en donde cada uno contiene un número mínimo de viviendas. Los varunit fueron construidos de acuerdo a criterios de orden jerárquico al interior de cada varstrat, según el total de viviendas entrevistadas en la submuestra 2. El procedimiento consistió en unir cada manzana o sección con menos de 30 viviendas entrevistadas, las cuales correspondieron al 99% de los conglomerados en la submuestra 2. El procedimiento utilizado es como sigue: 1. Se ordenan los conglomerados al interior de cada varstrat según el total de viviendas entrevistadas. 2. Al interior de un varstrat, cada uno de los conglomerados con menos de 30 viviendas se une al conglomerado siguiente hasta acumular un total de 30 o más viviendas, con un tope máximo de 50 viviendas. 89 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 3. Si al combinar los conglomerados la cantidad de viviendas sigue siendo inferior a 30, o la cantidad de varunit es igual a 1 el varstart en el cual se realiza la agrupación de conglomerados, se une el varstrat con otro según los criterios establecidos para la creación de los varstrat. El procedimiento fue repetido hasta que cada varunit tuviera entre 30 y 50 viviendas, y hasta que cada varstrat tuviera dos o más varunit. En la implementación del algoritmo se observó que 135 conglomerados quedaban por debajo del criterio establecido (menos de 30 viviendas), lo que se debió a que el total de viviendas que respondieron en dichos conglomerados se encontraban muy cercano a 30 (superior a 24 e inferior a 30), por lo tanto al unir cualquiera de estos conglomerados a otro, el total de viviendas superaba el umbral establecido. Ante esto, se flexibilizaron los umbrales originales, obteniéndose con esto que el total de viviendas que concentran los varunit oscilen entre 28 y 62 viviendas. A partir de un total de 10.649 conglomerados seleccionados en la muestra Casen 2011, se crearon 2.326 varunit, los cuales agrupan entre 28 y 62 viviendas entrevistadas en la submuestra 2. La Tabla VII.2 presenta el total de conglomerados y varunit por región y submuestra. Tabla VII.2: Total de conglomerados y varunit (pseudo-conglomerados) según región y submuestra. Región Total Manzanas y secciones Replica 1 Replica 2 Total de VarUnit Total Replica 1 Replica 2 Total Ari ca y Pa ri na cota 178 342 520 29 63 92 Ta ra pa cá 243 517 760 39 104 143 Antofa ga s ta 251 606 857 39 108 147 Ata ca ma 331 639 970 35 83 118 Coqui mbo 166 305 471 33 66 99 Va l pa ra ís o 313 577 890 56 124 180 Li bertador Genera l Berna rdo OHi ggi ns 194 360 554 49 93 142 Ma ul e 214 422 636 61 124 185 Bi obi o 314 597 911 75 146 221 Ara uca nía 198 398 596 50 102 152 Los La gos 224 417 641 58 114 172 Los Ríos 235 509 744 55 118 173 Ays én del Genera l Ca rl os Iba ñez del Ca mpo 134 314 448 35 77 112 Ma ga l l a nes y La Antártica Chi l ena 185 328 513 25 47 72 Metropol i tana de Sa ntia go 388 750 1.138 90 197 287 729 1.566 2.295 Total 3.568 7.081 10.649 4. Estimación de Varianzas en Muestra Compleja Casen 2011 Existen al menos tres estrategias para incorporar el diseño complejo en la estimación de la varianza, la primera es simplemente multiplicar el error estándar por un estimador (externo) de un efecto diseño, la segunda estrategia es que, al estimar un modelo se incluyan en él las variables del diseño muestral y la última es utilizar software o paquetes estadísticos que produzcan directamente estimaciones de las varianzas que den cuenta del diseño complejo de la muestra. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 90 Tanto Stata como SPSS poseen rutinas que permiten desarrollar estimaciones de varianza bajo muestreo complejo. Ambos paquetes estadísticos entregan una variedad de opciones para obtener las estimaciones de los parámetros de interés (medias, proporciones, razones y totales) mediante análisis de frecuencias, descriptivos, Tablas de contingencia, razones, así como análisis, empleando el modelo lineal general como también los modelos de regresión logística, ordinal y de Cox. En cada análisis se pueden obtener estadígrafos como errores estándares, coeficientes de variación, efectos de diseño, intervalos de confianza, etc. En todos estos análisis, tanto Stata como SPSS asumen el diseño muestral definido en forma previa por el analista. Como ya se ha mencionado, la encuesta Casen 2011 presenta un diseño muestral que se puede caracterizar como probabilístico, estratificado y multietápico. Las variables que permiten caracterizar este diseño muestral con el identificador de estratos, el identificador de conglomerados, la fracción de muestreo y el factor de expansión. Todas estas variables están disponibles en la base de datos Casen 2011-Submuestra Noviembre 2011-Enero 2012. Existen varias opciones para estimar varianzas complejas a partir de las variables que identifican el diseño complejo de la encuesta Casen. Las diferencias entre las distintas opciones están relacionadas con los supuestos asociados a cada una. Distintos paquetes estadísticos tienen incorporadas más o menos opciones para realizar estimaciones de varianza bajo muestreo complejo. Todas las opciones, en menor o mayor medida, permiten incorporar las características de un diseño complejo y por lo tanto permiten desarrollar estimaciones adecuadas - en contraste con las estimaciones bajo el supuesto de muestreo aleatorio simple (que es la opción implementada por defecto en todos los paquetes estadísticos). A continuación se presentan resultados de 6 distintas opciones de estimación de la varianza bajo muestreo complejo. La Tabla VII.3 muestra las variantes de las 4 operacionalizaciones empleadas en Stata 11: Los métodos 1 y 2 utilizan los 583 estratos (estrato) y los 6.997 conglomerados (segmento) asociados al diseño muestral original. El método 2 incorpora la corrección por poblaciones finitas (fmr2). Los métodos 3 y 4 utilizan 170 pseudo-estratos (varstrat) y 1.566 pseudo-conglomerados (varunit) para aproximar las características del diseño muestral original. El método 2 incorpora la corrección por poblaciones finitas (fmr2). La Tabla VII.4 muestra las 2 operacionalizaciones empleadas en SPSS 19: El método 5 utiliza los 583 estratos (estrato) y los 6.997 conglomerados (segmento) asociados al diseño muestral original. El método 6 utiliza 170 pseudo-estratos (varstrat) y 1566 pseudoconglomerados (varunit) para aproximar las características del diseño muestral original. 91 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VII.3: Opciones para estimación de varianza bajo muestreo complejo en Stata 11. Método Conglomerado Estratos Opciones Stata 11 Variable No. Variable No. singleunit fpc 1.SE segmento 6.997 estrato 583 certainty - 2.SE, fpc segmento 6.997 estrato 583 certainty fmr2 3.VV varunit 1.566 Varstrat 170 - - 4.VV, fpc varunit 1.566 Varstrat 170 - fmr2 Tabla VII.4: Opciones para estimación de varianza bajo muestreo complejo en SPSS 19 Método Conglomerado Estratos Opciones SPSS 19 Variable No. Variable No. singleunit fpc segmento 6.997 estrato 583 certainty - varunit 1.566 6.VV *n/a= no disponible en SPSS varstrat 170 - n/a* 5.SE Para efectos de la determinación de la estimación de la pobreza a nivel regional y nacional y su margen de error en la Encuesta Casen 2011, mostraremos las sintaxis o comandos que deben utilizarse para la creación del plan de muestreo y para la obtención de la Tabla con los resultados regionales de la pobreza, medida en porcentaje de pobres respecto al total de la población (personas pobres y no pobres). Se solicita adicionalmente el error típico o estándar. En Stata 11, la definición del plan de muestreo se realiza a partir del comando svyset. La figura VII.1 presenta la sintaxis utilizada para definir los métodos 1, 2, 3 y 4. En SPSS 19, la definición del plan de muestreo se realiza mediante el comando CSPLAN ANALYSIS47. La figura VII.2 presenta la sintaxis utilizada para definir los métodos 5 y 6. Los resultados de las estimaciones realizadas en base a los 6 métodos, para el nivel nacional, se presentan en la Tabla VII.5. Los resultados para las regiones Atacama y Aysén se presentan en las Tablas VII.6 y VII.7 respectivamente. 5. Resultados Nivel Nacional La Tabla VII.5 muestra resultados para estimaciones asociadas al porcentaje de pobres a nivel nacional junto también con las estimaciones del error estándar se y el margen de error moe al 95% de confianza. Las estimaciones fueron desarrolladas utilizando los softwares Stata 11 (los métodos 1, 2, 3 y 4) y SPSS 19 (los métodos 5 y 6). Para la estimación de la tasa de pobreza a nivel nacional, todos los métodos entregan el mismo resultado, independientemente del software que se utilice y de las unidades de estratificación y conglomeración. 47 Con SPSS no es factible indicarle al programa que considere en el cálculo la corrección por finitud, a menos que las unidades de conglomeración o conglomerados hayan sido seleccionadas en forma aleatoria simple. 92 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Para la estimación del error estándar de la tasa de pobreza, se observa que no existen diferencias usando STATA o SPSS para los métodos comparables. Tanto STATA como SPSS entregan exactamente las mismas estimaciones bajo la utilización de las mismas unidades de estratificación y conglomeración (SE ó VV), por lo que se puede hablar de equivalencia en uso de software entre los métodos 1 con 5 y 3 con 6, lo que el análisis se reduce a la comparación de los métodos del 1 al 4 en STATA. Al considerar la misma estratificación y conglomeración SE (Segmento-Estrato) ó VV (Varunit-Varstrat), la diferencia en la estimación del error estándar es prácticamente nula en la comparación de los métodos 1 con 2 (SE sin y con fpc) y 3 con 4 (VV sin y con fpc). Uno esperaría que la incorporación de la corrección por finitud disminuyera el error estándar, sobre todo en aquellos estratos con pocas unidades de conglomeración en el Marco y donde la muestra representa una fracción de muestreo sobre el 5%. Sin embargo, a nivel nacional este efecto es absorbido por todos aquellos estratos con fracciones de muestreo muy por debajo del 5% y que en su conjunto, a nivel nacional, disminuyen esta fracción de muestreo. Al comparar los métodos que utilizan distinta estratificación y unidades de conglomeración, pero bajo el mismo criterio de incorporación de la corrección por finitud, es decir la comparación de los métodos 1 con 3 y 2 con 4 respectivamente, observamos en ambos casos un aumento de un 4,2% en la estimación del error estándar. Este aumento se explica por los supuestos subyacentes en los procedimientos de estimación de los métodos 1, 2 (STATA) y 5 (SPSS) los cuales subestiman la verdadera varianza al considerar todos aquellos estratos con sólo una unidad de conglomeración como incluidos con certeza y por lo tanto con varianza cero (cero aporte a la varianza). En contraste, las nuevas variables de estratificación y conglomeración (VV) son más robustas y no asumen este supuesto, por lo tanto se espera que produzcan una estimación más cercana al verdadero error de muestreo (la cual puede ser mayor o menor que la varianza estimada con las unidades originales de muestreo SE). Tabla VII.5. Estimaciones Tasa de Pobreza y Error estándar a nivel nacional. Nivel Software Metodo p se(p) moe(p) 95 Nacional Stata 11 1. SE 14,45 0,40018 0,784 Nacional Stata 11 2. SE, fpc 14,45 0,39850 0,781 Nacional Stata 11 3. VV 14,45 0,41698 0,817 Nacional Stata 11 4. VV, fpc 14,45 0,41520 0,814 Nacional SPSS 19 5.SE 14,45 0,40018 0,784 Nacional SPSS 19 6.VV 14,45 0,41698 0,817 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 6. 93 Resultados Nivel Regional Las Tablas VII.6 y VII.7 muestran a modo de ejemplo los resultados para estimaciones asociadas a la tasa de pobreza regional para las regiones de Atacama y Aysén. Al igual que a nivel nacional, los 6 métodos presentan las mismos resultados para las estimaciones de la tasa de pobreza . Esto significa que independientemente del software que se utilice o de las unidades de estratificación y conglomeración definidas, las estimaciones de las tasas de pobreza regional resultan idénticas. En cuanto a las estimaciones del error estándar, tanto STATA como SPSS entregan exactamente las mismas estimaciones bajo la utilización de las mismas unidades de estratificación y conglomeración (SE ó VV), por lo que se puede hablar de equivalencia en uso de software entre los métodos 1 con 5 y 3 con 6, lo que el análisis se reduce a la comparación de los métodos del 1 al 4 en STATA. A diferencia del nivel nacional, las estimaciones con y sin corrección por poblaciones finitas presentan algunas diferencias. Este resultado resulta esperable ya que la muestra fue optimizada para alcanzar niveles de precisión determinados al nivel regional. En consecuencia, la adecuada especificación de estas características del diseño muestral permite obtener ganancias en términos de precisión a nivel regional cuando estas se especifican como parte del diseño de la muestra al momento de estimar la varianza compleja. Para la región de Atacama, la corrección por finitud disminuye el error estándar del método 1 de 1,021 a 0,999 (- 2,1%) y del método 3 de 1,255 a 1,229 (-2,1%), mientras que para la región de Aysén esta corrección disminuye el error estándar del método 1 de 0,989 a 0,938 (-5,2%) y del método 3 de 0,906 a 0,859 (-5,2%). Las Tablas VII.6 y VII.7 muestran que la incorporación de pseudo estratos y pseudo conglomerados puede aumentar o disminuir el error estándar. Para la región de Atacama la incorporación de pseudo-estratos y pseudo-conglomerados aumentan la estimación del error estándar en un 23% (de 1,021 a 1,255 ó alternativamente de 0,999 a 1,229), en la región de Aysén lo disminuyen en un 8,4% (de 0,989 a 0,906 ó alternativamente, de 0,938 a 0,859). La pseudoestratificación y pseudo-conglomeración simultánea corrige la conformación de los estratos de muestreo y de conglomerados, permitiendo que en cada uno de ellos haya tantas unidades de conglomeración como de viviendas de modo que la estimación de la varianza se pueda calcular en forma óptima, acercándose más precisamente al verdadero valor poblacional. 94 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VII.6: Estimaciones Tasa de Pobreza y Error estándar, Región de Atacama. Nivel Región 3 Software Stata 11 Método p se(p) moe(p)95 1. SE 13,3 1,021 2,001 Región 3 Stata 11 2. SE, fpc 13,3 0,999 1,959 Región 3 Stata 11 3. VV 13,3 1,255 2,460 Región 3 Stata 11 4. VV, fpc 13,3 1,229 2,408 Región 3 SPSS 19 5.SE 13,3 1,021 2,001 Región 3 SPSS 19 6.VV 13,3 1,255 2,460 Tabla VII.7: Estimaciones Tasa de Pobreza y Error estándar, Región de Aysén. Nivel Región 11 Software Stata 11 Método p se(p) moe(p)95 1. SE 9,8 0,989 1,939 Región 11 Stata 11 2. SE, fpc 9,8 0,938 1,838 Región 11 Stata 11 3. VV 9,8 0,906 1,776 Región 11 Stata 11 4. VV, fpc 9,8 0,859 1,684 Región 11 SPSS 19 5.SE 9,8 0,989 1,939 Región 11 SPSS 19 6.VV 9,8 0,906 1,776 La Tabla VII.8 presenta los resultados de la estimación de la tasa de pobreza nacional y sus márgenes de error (al 95% de confianza) para las muestras Casen 1996 a 2011-S2 (submuestra 2). El margen de error de 2011 fue estimado en Stata 11 utilizando los parámetros del método 4 (varstrat, varunit, expr_r2, fmr2), considerando la utilización de pseudo-estratos y pseudo-conglomerados. Los márgenes de error de los años 1996 a 2009 fueron estimados en Stata 11 utilizando los parámetros del método 3 (estrato, segmento, expr_r2), ya que no se dispone para la serie histórica de pseudo-estratos (varstrat) y pseudoconglomerados (varunit). Tabla VII.8: Incidencia de la Pobreza y de la Pobreza Extrema, 1996-2011 (Estimación (%) y Margen de Error) Pobreza Pobreza Extrema Estimación (%) Margen de error Estimación (%) Margen de error 1996 23,21 0,94 5,75 0,43 1998 21,66 0,75 5,62 0,39 2000 20,22 0,76 5,58 0,38 2003 18,66 0,62 4,67 0,30 2006 13,71 0,58 3,21 0,26 2009 15,13 0,64 3,74 0,30 2011 14,45 0,81 2,79 0,29 Año Metodología del Diseño Muestral y Factores de Expansión Casen 2011 95 7. Márgenes de Error Proyectados, Efectivos e Históricos La muestra de la Encuesta Casen 2011 fue optimizada al nivel regional, esto quiere decir que su diseño buscaba para lograr - en base a la muestra completa márgenes de error entre 1 y 4 puntos porcentuales en cada región del país. La columna (2) en Tabla VII.8 muestra los márgenes de error proyectados para cada región en base a la muestra completa (n=90.122 hogares). Las regiones Metropolitana y de Los Ríos presentan los mínimos y máximos márgenes de error proyectados. Los errores efectivos en base a la submuestra 2 (n=59.084 hogares) se presenta en la columna (4). A pesar de que esta muestra corresponde sólo al 67% de la muestra completa, los márgenes de error a nivel regional se mantuvieron dentro de los límites esperados de 1 a 4 puntos porcentuales. Para algunas regiones, sin embargo, los márgenes de error fueron incluso menores a los proyectados para la muestra completa. Destacan las regiones de El Maule (proyectado: 3,2 y efectivo: 1,65), Los Lagos (proyectado: 2,7 y efectivo: 1,87) y Los Ríos (proyectado: 4,0 y efectivo: 2,94). A nivel nacional el margen de error efectivo (0,82 pp) fue mayor al proyectado (0,67 pp). Este es el resultado de contar, para la submuestra 2, sólo con el 65% del total de entrevistas proyectadas para la muestra completa (=59.084/90.122 hogares). Tabla VII.8: Distribución Regional, muestra CASEN 2011. Muestra Completa Submuestra 2 Entrevistas MOE Entrevistas MOE Proyectadas Proyectado Efectivas Efectivo (1) (2) (3) (4) 1 Tarapacá * 6.241 2,4% 3.675 2,3% 2 Antofagasta 6.108 1,6% 3.905 2,0% 3 Atacama 4.382 2,7% 2.823 2,5% 4 Coquimbo 3.780 2,5% 2.418 2,6% 5 Valparaíso 8.064 1,9% 4.596 2,6% 6 O´Higgins 5.469 1,9% 3.656 2,2% 7 Maule 7.464 3,2% 4.987 1,7% 8 Bío Bío 8.652 2,1% 5.779 3,7% 9 La Araucanía 5.782 2,8% 3.995 2,4% 10 Los Lagos ** 6.391 2,7% 4.392 1,9% 11 Aysén 3.941 2,3% 2.857 1,8% 12 Magallanes 2.315 1,8% 1.588 1,6% 13 Metropolitana 11.461 1,0% 7.790 1,5% 14 Los Rios 6.576 4,0% 4.364 2,9% 15 Arica y Parinacota 3.495 2,0% 2.259 2,8% Nacional 90.122 0,7% 59.084 0,8% Fuente: Elaborado por el INE y el Ministerio de Desarrollo Social. Regiones Metodología del Diseño Muestral y Factores de Expansión Casen 2011 96 Las bases de datos de la Encuesta Casen tienen disponibles, a partir de 1996, las variables que permiten identificar tres importantes aspectos del diseño muestral: estratos (estrato), conglomerados (segmento) y el factor de expansión (expr). Para efectos de comparación, Las tablas Tabla VII.9 y VII.10 presentan los resultados de la estimación de la tasa de pobreza regional y sus márgenes de error (al 95% de confianza) para las muestras Casen 1996 a 2011-S2 (submuestra 2). El margen de error de 2011-S2 fue estimado en Stata 11 utilizando los parámetros del método 4 (varstrat, varunit, expr_r2, fmr2), considerando la utilización de pseudo-estratos y pseudoconglomerados. Los márgenes de error de los años 1996 a 2009 fueron estimados en Stata 11 utilizando los parámetros del método 3 (estrato, segmento, expr_r2), ya que no se dispone para la serie histórica de pseudoestratos (varstrat) y pseudo-conglomerados (varunit). Los tamaños muestrales asociados a las entrevistas efectivas de cada año se presentan en la última fila de la Tabla VII.8. Entre 1996 y 2009, los márgenes de error de la tasa de pobreza a nivel regional promediaban un 3,2% con un mínimo 1% en 2006 en la Región de Metropolitana y un máximo de 6,7% en 2009 en la Región de los Ríos. Estos resultados eran el reflejo de los tamaños muestrales en cada región y del diseño muestral empleado cada año. En 2011, los errores muestrales de la tasa de pobreza a nivel regional promedian un 2,3%. Como se puede apreciar en la Tabla VII.9, para 10 de las 15 regiones del país, los márgenes de error de la tasa de pobreza regional corresponden a los mínimos históricos, por ejemplo la región de Tarapacá con un 2,3% y Magallanes y Aysén con un 1,6% y 1,8% respectivamente. Este hecho, tan sólo a partir de la submuestra 2, implica que se logró el objetivo planteado en la etapa de diseño de la muestra 2011 – mejorar las precisión de las estimaciones de las tasas de pobreza regional. 97 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VII.9: Tasa de Pobreza (p) en la muestra Casen por Año, según Región Región 1996 1998 2000 2003 2006 2009 2011 1 Tarapacá * 21,4 15,6 20,8 18,5 11,8 15,8 13,1 2 Antofagasta 16,4 12,7 13,4 11,2 7,3 8,0 7,5 3 Atacama 26,4 28,7 23,9 24,9 10,5 17,5 13,3 4 Coquimbo 30,1 24,8 24,8 21,5 15,9 16,6 15,3 5 Valparaíso 22,3 18,8 18,8 19,4 15,3 15,1 16,9 6 O´Higgins 26,6 22,9 20,9 19,2 11,4 12,8 10,1 7 Maule 32,6 29,3 25,3 23,1 17,7 20,7 16,2 8 Bío Bío 34,1 32,2 27,1 28,0 20,7 21,0 21,5 9 La Araucanía 35,7 34,8 32,7 29,7 20,1 27,1 22,9 10 Los Lagos ** 32,3 29,2 25,6 21,8 11,8 14,2 15,0 11 Aysén 22,4 15,1 14,3 14,2 9,2 15,1 9,8 12 Magallanes 13,7 12,0 11,1 12,3 6,3 9,1 5,8 13 Metropolitana 14,7 15,4 15,1 13,1 10,6 11,5 11,5 14 Los Rios 18,8 20,4 17,5 15 Arica y Parinacota 18,6 12,8 15,7 Nacional n (hogares) 23,2 21,7 20,2 18,7 13,7 15,1 14,4 33.636 48.107 65.036 71.321 73.720 71.460 59.084 Tabla VII.10: Margen de Error (MOE(p)) al 95% de Confianza de la Tasa de Pobreza (p) en la muestra Casen por Año, según Región Región 1996 1998 2000 2003 2006 2009 2011 1 Tarapacá * 5,14 4,69 4,96 4,53 3,28 5,61 2,27 2 Antofagasta 3,96 3,56 4,16 3,01 2,67 3,03 2,00 3 Atacama 5,38 7,02 3,94 4,87 3,45 4,74 2,41 4 Coquimbo 3,16 3,10 3,23 2,93 2,92 2,75 2,61 5 Valparaíso 2,65 2,39 2,12 1,88 1,84 1,94 2,62 6 O´Higgins 2,77 2,53 2,32 2,33 1,81 1,77 2,13 7 Maule 2,72 2,86 2,35 2,72 2,30 3,48 1,64 8 Bío Bío 3,41 2,24 2,27 1,92 1,66 1,81 3,63 9 La Araucanía 3,08 2,77 2,50 2,37 1,95 2,71 2,31 10 Los Lagos ** 3,03 3,94 3,05 2,17 1,92 2,97 1,85 11 Aysén 4,77 3,96 4,54 3,70 5,55 4,74 1,68 12 Magallanes 5,37 4,89 4,76 4,81 2,97 3,22 1,52 13 Metropolitana 1,48 1,10 1,24 0,96 1,01 0,93 1,45 14 Los Rios 3,55 6,73 2,88 15 Arica y Parinacota 5,64 4,61 2,72 Nacional n (hogares) 0,94 0,75 0,76 0,62 0,58 0,64 0,81 33.636 48.107 65.036 71.321 73.720 71.460 59.084 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Figura VII.11: Sintaxis de estimación en Stata 11. En primer lugar, es necesario crear variable “cortep” en base de datos principal de Encuesta CASEN 2011: recode corte (1/2=1 "Total Pobres")(3=2 "No Pobres"),gen(cortep) * ----------------------------------* metodo 1: estrato, segmento * ----------------------------------svyset segmento [pw=expr_r2], strata(estrato) singleunit(certainty) svy: prop cortep, level(95) svy: prop cortep, level(95) over(region) * ----------------------------------* método 2: estrato, segmento, fmr2 * ----------------------------------svyset segmento [pw=expr_r2], strata(estrato) singleunit(certainty) fpc(fmr2) svy: prop cortep, level(95) svy: prop cortep, level(95) over(region) * ----------------------------------* método 3: varstrat, varunit * ----------------------------------svyset varunit [pw=expr_r2], strata(varstrat) svy: prop cortep, level(95) svy: prop cortep, level(95) over(region) * ----------------------------------* método 4: varstrat, varunit, fmr2 * ----------------------------------svyset varunit [pw=expr_r2], strata(varstrat) fpc(fmr2) svy: prop cortep, level(95) svy: prop cortep, level(95) over(region) Figura VII.12: Sintaxis de estimación en SPSS 19. En primer lugar, es necesario crear variable “cortep” en base de datos principal de Encuesta CASEN 2011: RECODE corte (1 thru 2=1) (3 thru Highest=2) INTO cortep. VARIABLE LABELS cortep 'Situación de pobreza'. EXECUTE. VALUE labels cortep 1 'Total pobre' 2 'No pobre'. * ---------------------------------------------* método 5: estrato, conglomerado * ---------------------------------------------CSPLAN ANALYSIS /PLAN FILE='C:\Directorio\PLAN_1_Congl_Estrat_Personas.csaplan' /PLANVARS ANALYSISWEIGHT=expr_r2 /SRSESTIMATOR TYPE=WR /PRINT PLAN /DESIGN STRATA=area comuna CLUSTER=segmento 98 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 99 /ESTIMATOR TYPE=WR. CSTABULATE /PLAN FILE='C:\Directorio\PLAN_1_Congl_Estrat_Personas.csaplan' /TABLES VARIABLES=region BY cortep /CELLS ROWPCT /STATISTICS SE * ---------------------------------------------* método 6: varstrat, variunit * ---------------------------------------------CSPLAN ANALYSIS /PLAN FILE='C:\Directorio\PLAN_2_VarUnit_VarStrat_Personas.csaplan' /PLANVARS ANALYSISWEIGHT=expr_r2 /SRSESTIMATOR TYPE=WR /PRINT PLAN /DESIGN STRATA=varstrat CLUSTER=varunit /ESTIMATOR TYPE=WR. CSTABULATE /PLAN FILE='C:\Directorio\PLAN_2_VarUnit_VarStrat_Personas.csaplan' /TABLES VARIABLES=region BY cortep /CELLS ROWPCT /STATISTICS SE /MISSING SCOPE=TABLE CLASSMISSING=EXCLUDE. VIII. Anexos 1. Anexo A: Referencias Czajka, J.L., Hirabayashi, S.M., Little, R.J.A. and Rubin, D.B. (1992). “Projecting from Advance Data Using Propensity Modeling: An Application to Income and Tax Statistics.” Journal of Business and Economic Statistics, 10(2), 117-132. Ehling, M., and T. Körner (2007), Handbook on Data Quality Assessment Methods and Tools, Wiesbaden: European Commission, Eurostat. Sitter RR (1992) Comparing Three Bootstrap Methods for Survey Data. The Canadian Journal of Statistics / La Revue Canadienne de Statistique 20:135-154 Valliant R, Brick JM, Dever JA (2008) Weight Adjustments for the Grouped Jackknife Variance Estimator. Journal of Ocial Statistics 24(3):469-488. Valliant, R. Dever, J.A., Kreuter,F. (2013, chapter 14). Valliant, R. Dever, J.A., Kreuter,F. (2013, section 6.5.2). Practical Tools for Designing and Weighting Survey Samples. New York: Springer. Valliant R, Rust KF (2010) Degrees of Freedom Approximations and Rulesof-Thumb. Journal of Ocial Statistics 26:585{602. Wolter KM (2007) Introduction to Variance Estimation, 2nd edn. Springer, New York Valliant, R. Dever, J.A., Kreuter,F. (2013, chapter 15) Westat (2007) WesVar 4.3 Users Guide. Westat, Rockville MD, URL www.westat.com 100 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 2. Anexo B: Tablas Tabla VIII.1 : Estimaciones de la muestra Casen 2009 Tasa de Pobreza Regiones P Error Estandar Tasa Pobreza Efecto Diseño Tasa pobreza SE p2 Deff p Tamaño Muestral (viviendas) nm CuasiVarianza S p2 I Región ,158 ,029 4,764 1.252 ,215 II Región ,080 ,015 4,678 1.793 ,092 III Región ,175 ,024 3,061 1.518 ,290 IV Región ,166 ,014 3,168 3.174 ,198 V Región ,151 ,010 4,358 7.835 ,177 VI Región ,128 ,009 2,002 6.473 ,263 VII Región ,207 ,018 6,354 6.468 ,321 VIII Región ,210 ,009 3,381 11.782 ,298 IX Región ,271 ,014 3,028 6.286 ,398 X Región ,142 ,015 4,846 5.427 ,257 XI Región ,151 ,024 1,404 1.080 ,449 XII Región ,091 ,016 1,647 761 ,125 RM Región Metropolitana ,115 ,005 4,519 13.202 ,066 XIV Región ,204 ,034 8,764 2.476 ,333 XV Región ,128 ,024 2,633 714 ,150 País ,151 ,003 4,289 70.241 ,173 101 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VIII.2: Unidades Primarias de Muestreo, por región y área REGIÓN 1 2 3 4 5 AREA Urbana Rural Total 1 Urbana Rural Total 2 Urbana Rural Total 3 Urbana Rural Total 4 Urbana Rural Total 5 737 0 6 25 Total PSUs 743 25 737 31 768 3 6 9 855 0 4 14 859 14 6 0 1 5 7 5 855 18 873 6 6 12 916 0 0 31 916 31 8 0 0 7 8 7 916 31 947 8 7 15 406 0 9 53 415 53 10 0 3 15 13 15 406 62 468 10 18 28 774 0 15 71 789 71 31 0 5 31 36 31 774 86 860 31 36 67 Manzanas Secciones Estratos Urbanos 3 0 Estratos Rurales 1 5 Total Strata 4 5 102 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 … continuación REGIÓN 6 7 8 9 10 11 12 13 14 15 Total General AREA Urbana Rural Total 6 Urbana Rural Total 7 Urbana Rural Total 8 Urbana Rural Total 9 Urbana Rural Total 10 Urbana Rural Total 11 Urbana Rural Total 12 Urbana Rural Total 13 Urbana Rural Total 14 Urbana Rural Total 15 Urbana Rural Total 398 0 398 462 0 462 730 0 730 450 0 450 477 0 29 95 124 51 123 174 58 125 183 41 107 148 36 106 Total PSUs 427 95 522 513 123 636 788 125 913 491 107 598 513 106 477 142 619 13 35 48 375 0 18 40 393 40 2 0 3 6 5 6 375 58 433 2 9 11 494 0 8 9 502 9 2 0 1 2 3 2 494 17 511 2 3 5 1.096 0 4 44 1.100 44 49 0 2 19 51 19 1.096 48 1.144 49 21 70 575 0 15 92 590 92 9 0 3 12 12 12 575 107 682 9 15 24 491 0 3 11 494 11 1 0 1 1 2 1 491 14 505 1 2 3 9.236 0 9.236 297 946 1.243 9.533 946 10.479 223 0 223 89 272 361 312 272 584 Manzanas Secciones Estratos Urbanos 22 0 22 14 0 14 34 0 34 19 0 19 13 0 Estratos Rurales 10 32 42 16 30 46 20 50 70 13 32 45 10 25 Total Strata 32 32 64 30 30 60 54 50 104 32 32 64 23 25 103 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VIII.3: Grupos de Tamaño de marco muestral INE en Áreas Urbanas Grupo 0 Límites (viviendas) Número de viviendas a encuestar Fracción de muestreo mínima Fracción de muestreo máxima [1 - 7] 1 [8 - 9] 2 22% 25% 2 [ 10 - 13 ] 3 23% 30% 3 [ 14 - 17 ] 4 24% 29% 4 [ 18 - 23 ] 5 22% 28% 5 [ 24 - 25 ] 6 24% 25% 6 [ 26 - 29 ] 7 24% 27% 7 [ 30 - 33 ] 8 24% 27% 8 [ 34 - 37 ] 9 24% 26% 9 [ 38 - 44 ] 10 23% 26% 10 [ 45 - 45 ] 11 24% 24% 11 [ 46 - 49 ] 12 24% 26% 12 [ 50 - 53 ] 13 25% 26% 13 [ 54 - 57 ] 14 25% 26% 14 [ 58 - 61 ] 15 25% 26% 15 [ 62 - 65 ] 16 25% 26% 16 [ 66 - 69 ] 17 25% 26% 17 [ 70 - 73 ] 18 25% 26% 18 [ 74 - 77 ] 19 25% 26% 19 [ 78 - 81 ] 20 25% 26% 20 [ 82 - 85 ] 21 25% 26% 21 [ 86 - 89 ] 22 25% 26% 22 [ 90 - 93 ] 23 25% 26% 23 [ 94 - 97 ] 24 25% 26% 24 [ 98 - 102 ] 25 25% 26% 25 [ 103 - 105 ] 26 25% 25% 27 25% 25% 26 [ 106 - 109 ] 27 [ 110 - 113 ] 28 25% 25% 28 [ 114 - 154 ] 29 19% 25% 29 [ 155 - 303 ] 30 10% 19% 30 [ 304 - 1043 ] 31 3% 10% 104 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VIII.4: Total de UPM y USM seleccionadas, por región Nombre Región TOTAL PAÍS Región de Tarapacá Región de Antofagasta Región de Atacama Región Coquimbo Región de Valparaíso Región de O’Higgins Región del Maule Región del Bíobio Región de la Araucanía Región de los Lagos Región de Aisén Región de Magallanes Región Metropolitana Región de los Ríos Región de Arica Unidades Primarias Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Manzanas Secciones Total Total 9.236 1.243 10.479 737 31 768 855 18 873 916 31 947 406 62 468 774 86 860 398 124 522 462 174 636 730 183 913 450 148 598 477 142 619 375 58 433 494 17 511 1.096 48 1.144 575 107 682 491 14 505 Total Viviendas 84.410 28.461 112.871 7.003 760 7.763 7.118 397 7.515 5.907 677 6.584 3.142 1.376 4.518 7.867 1.828 9.695 3.830 2.780 6.610 4.365 3.863 8.228 6.588 3.926 10.514 3.630 3.312 6.942 4.465 3.382 7.847 4.017 1.566 5.583 3.351 422 3.773 14.496 963 15.459 5.081 2.817 7.898 3.550 392 3.942 105 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VIII.5: Estratos donde fueron seleccionados 1 Región Estrato Comuna Área Total País Viviendas Replica 1 Replica 2 Unidades Muestrales Total Replica 1 Replica 2 Total 1.665 2.432 4.097 95 94 189 Arica y Parinacota Camarones RURAL 20 30 50 1 1 2 Taracá Pica RURAL 21 62 83 1 1 2 Antofagasta Taltal RURAL 18 27 45 1 1 2 Copiapó RURAL 36 52 88 2 1 3 Diego de Almagro RURAL 16 22 38 1 1 2 Andacollo RURAL 14 20 34 1 1 2 La Higuera RURAL 21 30 51 1 1 2 Los Vilos RURAL 20 29 49 1 1 2 Algarrobo RURAL 14 21 35 1 1 2 Cabildo RURAL 21 31 52 1 1 2 Calera RURAL 14 20 34 1 1 2 Calle Larga RURAL 19 27 46 1 1 2 Cartagena RURAL 14 21 35 1 1 2 Casablanca RURAL 18 26 44 1 1 2 Hijuelas RURAL 21 30 51 1 1 2 Los Andes RURAL 18 26 44 1 1 2 Nogales RURAL 15 22 37 1 1 2 Olmué RURAL 18 26 44 1 1 2 Panquehue RURAL 16 24 40 1 1 2 Puchuncaví RURAL 14 20 34 1 1 2 Putaendo RURAL 20 30 50 1 1 2 Quilpué RURAL 14 20 34 1 1 2 Quintero RURAL 15 22 37 1 1 2 Rinconada RURAL 14 21 35 1 1 2 San Esteban RURAL 17 24 41 1 1 2 San Felipe RURAL 20 29 49 1 1 2 Santa María RURAL 19 27 46 1 1 2 Santo Domingo RURAL 14 21 35 1 1 2 Valparaíso RURAL 14 19 33 1 1 2 Villa Alemana RURAL 14 19 33 1 1 2 Zapallar RURAL 14 20 34 1 1 2 Doñihue RURAL 16 24 40 1 1 2 Litueche RURAL 20 29 49 1 1 2 Machalí RURAL 18 26 44 1 1 2 Mostazal RURAL 19 28 47 1 1 2 Nancagua RURAL 21 31 52 1 1 2 Navidad URBANA 22 32 54 1 1 2 Olivar RURAL 22 32 54 1 1 2 Paredones RURAL 21 30 51 1 1 2 Peralillo RURAL 20 28 48 1 1 2 Peumo RURAL 22 32 54 1 1 2 Pichilemu RURAL 18 27 45 1 1 2 Pumanque RURAL 19 27 46 1 1 2 Empedrado RURAL 15 22 37 1 1 2 Licantén RURAL 20 29 49 1 1 2 Pelluhue RURAL 20 29 49 1 1 2 Vichuquén RURAL 22 31 53 1 1 2 Atacama Coquimbo Valparaíso O'Higgins Maule Continúa 106 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VIII.5: Estratos donde fueron seleccionados 1 Región Estrato Viviendas Unidades Muestrales Comuna Área Alto Biobío RURAL 18 26 44 1 1 2 Alto Biobío URBANA 22 31 53 1 1 2 Antuco RURAL 16 22 38 1 1 2 Bulnes RURAL 20 28 48 1 1 2 Cabrero RURAL 18 27 45 1 1 2 Coelemu RURAL 22 32 54 1 1 2 Contulmo RURAL 14 21 35 1 1 2 Curanilahue RURAL 18 26 44 1 1 2 Hualqui RURAL 16 23 39 1 1 2 Los Alamos RURAL 18 27 45 1 1 2 Mulchén RURAL 17 24 41 1 1 2 Negrete RURAL 16 22 38 1 1 2 Ninhue RURAL 17 24 41 1 1 2 Ñiquén URBANA 22 32 54 1 1 2 Penco RURAL 13 19 32 1 1 2 Pinto RURAL 17 25 42 1 1 2 Portezuelo RURAL 15 21 36 1 1 2 Quilaco RURAL 16 22 38 1 1 2 Quilleco RURAL 16 24 40 1 1 2 Quirihue RURAL 16 22 38 1 1 2 San Fabián RURAL 16 23 39 1 1 2 San Nicolás RURAL 20 28 48 1 1 2 San Rosendo RURAL 12 18 30 1 1 2 Santa Bárbara RURAL 16 24 40 1 1 2 Santa Juana RURAL 20 28 48 1 1 2 Tirúa RURAL 22 32 54 1 1 2 Tomé RURAL 18 25 43 1 1 2 Tucapel RURAL 15 22 37 1 1 2 Yungay RURAL 18 25 43 1 1 2 Curacautín RURAL 20 28 48 1 1 2 Los Sauces RURAL 17 24 41 1 1 2 Melipeuco RURAL 20 28 48 1 1 2 Renaico RURAL 16 24 40 1 1 2 Traiguén RURAL 21 31 52 1 1 2 Los Lagos Puqueldón RURAL 22 32 54 1 1 2 Los Ríos Corral RURAL 18 26 44 1 1 2 Alhué RURAL 14 19 33 1 1 2 Buin RURAL 18 25 43 1 1 2 El Monte RURAL 14 21 35 1 1 2 Isla de Maipo RURAL 18 27 45 1 1 2 María Pinto RURAL 17 25 42 1 1 2 Padre Hurtado RURAL 15 22 37 1 1 2 Peñaflor RURAL 14 19 33 1 1 2 San Bernardo RURAL 15 21 36 1 1 2 San José de Maipo RURAL 14 20 34 1 1 2 San Pedro RURAL 16 24 40 1 1 2 Talagante RURAL 18 25 43 1 1 2 Tiltil RURAL 16 23 39 1 1 2 Biobio Araucanía Metropolitana de Santiago Replica 1 Replica 2 Total Replica 1 Replica 2 Total 107 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VIII.6: Total de conglomerados con 30 o más viviendas que responde según submuestra Región Replica 1 >=30 <30 Replica 2 Total >=30 <30 Muestra completa Total >=30 <30 Total Ari ca y Pa ri na cota 3 175 178 0 342 342 3 517 520 Ta ra pa cá 0 243 243 0 517 517 0 760 760 Antofa ga s ta 0 251 251 0 606 606 0 857 857 Ata ca ma 0 331 331 1 638 639 1 969 970 Coqui mbo 1 165 166 1 304 305 2 469 471 Va l pa ra ís o 0 313 313 0 577 577 0 890 890 Li bertador Genera l Berna rdo OHi ggi ns 2 192 194 5 355 360 7 547 554 Ma ul e 0 214 214 2 420 422 2 634 636 Bi obi o 0 314 314 3 594 597 3 908 911 Ara uca nía 6 192 198 3 395 398 9 587 596 Los La gos 4 220 224 13 404 417 17 624 641 Los Ríos 0 235 235 2 507 509 2 742 744 Ays én del Genera l Ca rl os Iba ñez del Ca mpo 0 134 134 5 309 314 5 443 448 Ma ga l l a nes y La Antártica Chi l ena 0 185 185 0 328 328 0 513 513 Metropol i tana de Sa ntia go 0 388 388 6 744 750 6 1.132 1.138 16 3.552 3.568 41 7.040 7.081 57 10.592 10.649 Total 108 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 Tabla VIII.7: Total de USM seleccionadas, por comuna. REGION COMUNA PAIS TOTAL Total 1101 Iquique 1107 Alto Hospicio 1401 Pozo Almonte 1402 Camiña 1404 Huara 1405 Pica Total 2101 Antofagasta 2102 Mejillones 2103 Sierra Gorda 2104 Taltal 2201 Calama 2203 San Pedro de Atacama 2301 Tocopilla 2302 María Elena Total 3101 Copiapó 3102 Caldera 3103 Tierra Amarilla 3201 Chañaral 3202 Diego de Almagro 3301 Vallenar 3302 Alto del Carmen 3303 Freirina 3304 Huasco Total 4101 La Serena 4102 Coquimbo 4103 Andacollo 4104 La Higuera 4105 Paiguano 4106 Vicuña 4201 Illapel 4202 Canela 4203 Los Vilos 4204 Salamanca 4301 Ovalle 4302 Combarbalá 4303 Monte Patria 4304 Punitaqui 4305 Río Hurtado 1 Tarapacá 2 Antofagasta 3 Atacama 4 Coquimbo Población Porcentaje Viviendas Comunal 4.594.668 71.684 45.532 20.214 2.378 421 1.827 1.312 123.340 80.105 1.995 271 2.895 29.206 100,0 63,5 28,2 3,3 0,6 2,5 1,8 100,0 64,9 1,6 0,2 2,3 23,7 Total de Porcentaje viviendas Comunal muestral 112.938 7.734 100,0 4.996 64,6 1.978 25,6 282 3,6 67 0,9 207 2,7 204 2,6 7.486 100,0 4.610 61,6 161 2,2 46 0,6 246 3,3 1.664 22,2 1.133 0,9 183 2,4 6.090 1.645 68.332 31.984 3.714 3.425 3.281 5.997 13.469 1.608 1.848 3.006 198.469 60.179 47.928 3.411 1.426 1.509 7.608 10.533 2.947 10.903 6.899 26.854 4.670 9.633 2.697 1.272 4,9 1,3 100,0 46,8 5,4 5,0 4,8 8,8 19,7 2,4 2,7 4,4 100,0 30,3 24,1 1,7 0,7 0,8 3,8 5,3 1,5 5,5 3,5 13,5 2,4 4,9 1,4 0,6 421 155 6.610 2.918 431 341 324 598 1.225 166 243 364 4.511 1.048 890 151 108 54 208 245 147 257 190 578 169 254 157 55 5,6 2,1 100,0 44,1 6,5 5,2 4,9 9,0 18,5 2,5 3,7 5,5 100,0 23,2 19,7 3,3 2,4 1,2 4,6 5,4 3,3 5,7 4,2 12,8 3,7 5,6 3,5 1,2 109 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 … Continuación Tabla VIII.7 REGION 5 Valparaíso 6 Libertador Bernardo O´Higgins COMUNA Total 5101 5102 5103 5105 5106 5107 5108 5109 5301 5302 5303 5304 5401 5402 5403 5404 5405 5501 5502 5503 5504 5505 5506 5507 5601 5602 5603 5604 5605 5606 5701 5702 5703 5704 5705 5706 Total 6101 6102 6103 6104 6105 Valparaíso Casablanca Concón Puchuncaví Quilpué Quintero Villa Alemana Viña del Mar Los Andes Calle Larga Rinconada San Esteban La Ligua Cabildo Papudo Petorca Zapallar Quillota Calera Hijuelas La Cruz Limache Nogales Olmué San Antonio Algarrobo Cartagena El Quisco El Tabo Santo Domingo San Felipe Catemu Llay Llay Panquehue Putaendo Santa María Rancagua Codegua Coinco Coltauco Doñihue Población Porcentaje Viviendas Comunal 491.287 83.131 7.549 8.950 4.621 46.851 5.714 35.111 95.726 24.190 2.593 2.079 2.025 9.084 5.367 1.278 2.678 1.833 23.195 12.714 2.950 3.395 24.770 6.166 4.612 24.282 2.858 4.634 3.258 2.556 1.974 17.879 2.798 5.440 1.598 3.743 3.685 244.622 61.299 3.386 1.872 4.741 5.551 100,0 16,9 1,5 1,8 0,9 9,5 1,2 7,1 19,5 4,9 0,5 0,4 0,4 1,8 1,1 0,3 0,5 0,4 4,7 2,6 0,6 0,7 5,0 1,3 0,9 4,9 0,6 0,9 0,7 0,5 0,4 3,6 0,6 1,1 0,3 0,8 0,8 100,0 25,1 1,4 0,8 1,9 2,3 Total de Porcentaje viviendas Comunal muestral 9.692 100,0 1.208 12,5 166 1,7 161 1,7 134 1,4 756 7,8 148 1,5 578 6,0 1.288 13,3 412 4,3 116 1,2 113 1,2 112 1,2 221 2,3 162 1,7 70 0,7 123 1,3 109 1,1 436 4,5 279 2,9 137 1,4 150 1,5 467 4,8 164 1,7 164 1,7 434 4,5 132 1,4 160 1,7 92 0,9 86 0,9 110 1,1 336 3,5 125 1,3 162 1,7 104 1,1 135 1,4 142 1,5 6.630 100,0 1.180 17,8 160 2,4 120 1,8 157 2,4 189 2,9 110 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 … continuación Tabla VIII.7 REGION 6 Libertador Bernardo O´Higgins 7 Maule COMUNA 6106 6107 6108 6109 6110 6111 6112 6113 6114 6115 6116 6117 6201 6202 6203 6204 6205 6206 6301 6302 6303 6304 6305 6306 6307 6308 6309 6310 Total 7101 7102 7103 7104 7105 7106 7107 7108 7109 7110 7201 7202 7203 7301 Graneros Las Cabras Machalí Malloa Mostazal Olivar Peumo Pichidegua Quinta de Tilcoco Rengo Requínoa San Vicente Pichilemu La Estrella Litueche Marchihue Navidad Paredones San Fernando Chépica Chimbarongo Lolol Nancagua Palmilla Peralillo Placilla Pumanque Santa Cruz Talca Constitución Curepto Empedrado Maule Pelarco Pencahue Río Claro San Clemente San Rafael Cauquenes Chanco Pelluhue Curicó Población Viviendas 14.640 6.403 9.043 3.671 6.433 3.466 4.625 4.071 3.440 17.119 6.319 15.231 3.933 999 2.045 2.638 1.994 1.873 20.104 3.910 9.045 1.817 4.869 3.467 2.735 2.254 1.000 10.629 288.879 52.845 13.353 2.616 1.165 5.741 2.131 2.559 4.214 10.213 2.481 10.571 2.170 1.836 68.213 Porcentaje Comunal 6,0 2,6 3,7 1,5 2,6 1,4 1,9 1,7 1,4 7,0 2,6 6,2 1,6 0,4 0,8 1,1 0,8 0,8 8,2 1,6 3,7 0,7 2,0 1,4 1,1 0,9 0,4 4,3 100,0 18,3 4,6 0,9 0,4 2,0 0,7 0,9 1,5 3,5 0,9 3,7 0,8 0,6 23,6 Total de viviendas muestral 311 164 249 135 208 147 173 140 138 324 180 285 137 95 111 118 117 115 379 150 200 108 150 134 127 123 45 261 8.211 1.126 328 134 103 202 124 138 165 267 126 299 136 119 1.534 Porcentaje Comunal 4,7 2,5 3,8 2,0 3,1 2,2 2,6 2,1 2,1 4,9 2,7 4,3 2,1 1,4 1,7 1,8 1,8 1,7 5,7 2,3 3,0 1,6 2,3 2,0 1,9 1,9 0,7 3,9 100,0 13,7 4,0 1,6 1,3 2,5 1,5 1,7 2,0 3,3 1,5 3,6 1,7 1,4 18,7 111 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 … continuación Tabla VIII.7 REGION 7 Maule 8 Bío Bío COMUNA 7302 7303 7304 7305 7306 7307 7308 7309 7401 7402 7403 7404 7405 7406 7407 7408 Total 8101 8102 8103 8104 8105 8106 8107 8108 Paz 8109 8110 8111 8112 8201 8202 8203 8204 8205 8206 8207 8301 8302 8303 8304 8305 8306 8307 Hualañé Licantén Molina Rauco Romeral Sagrada Familia Teno Vichuquén Linares Colbún Longaví Parral Retiro San Javier Villa Alegre Yerbas Buenas Concepción Coronel Chiguayante Florida Hualqui Lota Penco San Pedro de la Santa Juana Talcahuano Tomé Hualpén Lebu Arauco Cañete Contulmo Curanilahue Los Alamos Tirúa Los Ángeles Antuco Cabrero Laja Mulchén Nacimiento Negrete 3.672 1.848 9.467 2.198 5.134 4.844 8.226 1.216 22.837 4.908 8.301 10.095 6.237 10.594 3.873 5.321 553.948 64.219 28.325 29.846 2.967 4.931 13.972 12.297 1,3 0,6 3,3 0,8 1,8 1,7 2,8 0,4 7,9 1,7 2,9 3,5 2,2 3,7 1,3 1,8 100,0 11,6 5,1 5,4 0,5 0,9 2,5 2,2 Total de viviendas muestral 157 128 273 132 176 182 251 118 507 175 232 278 194 273 154 180 10.487 820 374 364 128 134 193 225 25.172 4,5 322 3,1 3.114 41.520 16.273 23.016 6.949 12.418 8.447 1.151 12.473 6.926 2.369 54.255 1.197 9.901 5.519 8.609 8.383 2.902 0,6 7,5 2,9 4,2 1,3 2,2 1,5 0,2 2,3 1,3 0,4 9,8 0,2 1,8 1,0 1,6 1,5 0,5 127 516 240 299 162 198 214 91 220 161 118 633 105 182 151 157 166 114 1,2 4,9 2,3 2,9 1,5 1,9 2,0 0,9 2,1 1,5 1,1 6,0 1,0 1,7 1,4 1,5 1,6 1,1 Población Viviendas Porcentaje Comunal Porcentaje Comunal 1,9 1,6 3,3 1,6 2,1 2,2 3,1 1,4 6,2 2,1 2,8 3,4 2,4 3,3 1,9 2,2 100,0 7,8 3,6 3,5 1,2 1,3 1,8 2,1 112 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 … continuación Tabla VIII.7 REGION 8 Bío Bío 9 La Araucanía COMUNA 8308 8309 8310 8311 8312 8313 8314 8401 8402 8403 8404 8405 8406 8407 8408 8409 8410 8411 8412 8413 8414 8415 8416 8417 8418 8419 8420 8421 Total 9101 9102 9103 9104 9105 9106 9107 9108 9109 9110 9111 9112 9113 9114 9115 9116 9117 Quilaco Quilleco San Rosendo Santa Bárbara Tucapel Yumbel Alto Biobío Chillán Bulnes Cobquecura Coelemu Coihueco Chillán Viejo El Carmen Ninhue Ñiquén Pemuco Pinto Portezuelo Quillón Quirihue Ránquil San Carlos San Fabián San Ignacio San Nicolás Treguaco Yungay Temuco Carahue Cunco Curarrehue Freire Galvarino Gorbea Lautaro Loncoche Melipeuco Nueva Imperial Padre Las Casas Perquenco Pitrufquén Pucón Saavedra Teodoro Schmidt Población Viviendas 1.169 2.856 1.094 2.921 3.503 5.893 1.388 45.573 6.176 1.328 5.671 6.580 9.942 3.176 1.320 2.800 2.396 2.569 1.143 4.838 2.797 1.902 13.034 1.137 5.812 2.921 1.495 5.363 267.546 74.106 6.465 5.072 2.133 8.264 3.104 4.561 7.997 7.609 1.657 8.464 22.078 1.916 8.370 6.340 3.815 5.527 Porcentaje Comunal 0,2 0,5 0,2 0,5 0,6 1,1 0,3 8,2 1,1 0,2 1,0 1,2 1,8 0,6 0,2 0,5 0,4 0,5 0,2 0,9 0,5 0,3 2,4 0,2 1,0 0,5 0,3 1,0 100,0 27,7 2,4 1,9 0,8 3,1 1,2 1,7 3,0 2,8 0,6 3,2 8,3 0,7 3,1 2,4 1,4 2,1 Total de viviendas muestral 95 106 102 106 111 142 100 587 148 111 153 172 206 131 104 120 114 113 93 155 130 116 223 105 161 119 111 139 6.924 1.231 181 155 144 231 128 145 206 226 113 201 435 109 185 186 137 161 Porcentaje Comunal 0,9 1,0 1,0 1,0 1,1 1,4 1,0 5,6 1,4 1,1 1,5 1,6 2,0 1,2 1,0 1,1 1,1 1,1 0,9 1,5 1,2 1,1 2,1 1,0 1,5 1,1 1,1 1,3 100,0 17,8 2,6 2,2 2,1 3,3 1,8 2,1 3,0 3,3 1,6 2,9 6,3 1,6 2,7 2,7 2,0 2,3 113 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 … continuación Tabla VIII.7 REGION 9 La Araucanía 10 Los Lagos COMUNA 9118 Toltén 9119 Vilcún 9120 Villarrica 9121 Cholchol 9201 Angol 9202 Collipulli 9203 Curacautín 9204 Ercilla 9205 Lonquimay 9206 Los Sauces 9207 Lumaco 9208 Purén 9209 Renaico 9210 Traiguén 9211 Victoria Total 10101 Puerto Montt 10102 Calbuco 10104 Fresia 10105 Frutillar 10106 Los Muermos 10107 Llanquihue 10108 Maullín 10109 Puerto Varas 10201 Castro 10202 Ancud 10203 Chonchi 10204 Curaco de Vélez 10205 Dalcahue 10206 Puqueldón 10207 Queilén 10208 Quellón 10209 Quemchi 10210 Quinchao 10301 Osorno 10302 Puerto Octay 10303 Purranque 10304 Puyehue 10305 Río Negro 10306 San Juan de la Costa 10307 San Pablo 3.354 10.172 15.653 2.651 15.708 5.810 5.438 2.351 2.960 1.499 2.292 3.165 2.392 6.716 9.907 228.440 52.450 11.122 3.584 4.632 5.760 4.630 5.695 8.183 13.371 15.193 4.208 1.118 3.913 1.103 1.648 9.331 2.692 3.011 50.642 2.964 8.734 2.921 5.793 1,3 3,8 5,9 1,0 5,9 2,2 2,0 0,9 1,1 0,6 0,9 1,2 0,9 2,5 3,7 100,0 23,0 4,9 1,6 2,0 2,5 2,0 2,5 3,6 5,9 6,7 1,8 0,5 1,7 0,5 0,7 4,1 1,2 1,3 22,2 1,3 3,8 1,3 2,5 Total de viviendas muestral 135 229 294 123 359 181 158 143 134 108 143 158 127 189 269 7.832 1.389 365 213 236 232 230 288 518 425 432 195 53 167 55 125 307 136 143 1.299 141 258 141 199 2.286 1,0 128 1,6 3.456 1,5 157 2,0 Población Viviendas Porcentaje Comunal Porcentaje Comunal 1,9 3,3 4,2 1,8 5,2 2,6 2,3 2,1 1,9 1,6 2,1 2,3 1,8 2,7 3,9 100,0 17,7 4,7 2,7 3,0 3,0 2,9 3,7 6,6 5,4 5,5 2,5 0,7 2,1 0,7 1,6 3,9 1,7 1,8 16,6 1,8 3,3 1,8 2,5 114 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 … continuación Tabla VIII.7 REGION 11 Aysén 12 Magallanes Y La Antártica Chilena 13 Región Metropolitana COMUNA Total 11101 11201 11202 11301 11401 11402 Total 12101 12301 12401 Total 13101 13102 13103 13104 13105 13106 13107 13108 13109 13110 13111 13112 13113 13114 13115 13116 13117 13118 13119 13120 13121 Cerda 13122 13123 13124 13125 13126 13127 Coyhaique Aysén Cisnes Cochrane Chile Chico Río Ibáñez Punta Arenas Porvenir Natales Santiago Cerrillos Cerro Navia Conchalí El Bosque Estación Central Huechuraba Independencia La Cisterna La Florida La Granja La Pintana La Reina Las Condes Lo Barnechea Lo Espejo Lo Prado Macul Maipú Ñuñoa Pedro Aguirre Peñalolén Providencia Pudahuel Quilicura Quinta Normal Recoleta Población Viviendas Porcentaje Comunal Total de Porcentaje viviendas Comunal muestral 5.566 100,0 3.421 61,5 1.248 22,4 225 4,0 240 4,3 307 5,5 125 2,2 3.826 100,0 3.048 79,7 277 7,2 501 13,1 15.488 100,0 796 5,1 168 1,1 243 1,6 218 1,4 301 1,9 248 1,6 163 1,1 166 1,1 225 1,5 755 4,9 258 1,7 280 1,8 266 1,7 1.336 8,6 339 2,2 182 1,2 191 1,2 262 1,7 777 5,0 654 4,2 28.211 17.546 7.098 950 690 1.244 683 45.118 37.836 1.589 5.693 1.833.728 90.805 22.147 37.258 35.915 46.840 36.930 20.413 21.285 24.840 101.439 33.195 47.667 28.550 98.041 19.980 24.287 29.826 32.931 141.904 62.925 100,0 62,2 25,2 3,4 2,4 4,4 2,4 100,0 83,9 3,5 12,6 100,0 5,0 1,2 2,0 2,0 2,6 2,0 1,1 1,2 1,4 5,5 1,8 2,6 1,6 5,3 1,1 1,3 1,6 1,8 7,7 3,4 29.360 1,6 212 1,4 60.811 60.277 55.195 47.043 28.541 39.928 3,3 3,3 3,0 2,6 1,6 2,2 421 736 331 271 194 261 2,7 4,8 2,1 1,7 1,3 1,7 115 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 … continuación Tabla VIII.7 REGION 13 Región Metropolitana 14 Los Ríos 15 Arica y Parinacota COMUNA 13128 13129 13130 13131 13132 13201 13202 13203 Maipo 13301 13302 13303 13401 13402 13403 13404 13501 13502 13503 13504 13505 13601 13602 13603 13604 13605 Total 14101 14102 14103 14104 14105 14106 14107 14108 14201 14202 14203 14204 Total 15101 15102 15201 Renca San Joaquín San Miguel San Ramón Vitacura Puente Alto Pirque San José de Colina Lampa Tiltil San Bernardo Buin Calera de Tango Paine Melipilla Alhué Curacaví María Pinto San Pedro Talagante El Monte Isla de Maipo Padre Hurtado Peñaflor Valdivia Corral Lanco Los Lagos Máfil Mariquina Paillaco Panguipulli La Unión Futrono Lago Ranco Río Bueno Arica Camarones Putre Población Viviendas Porcentaje Comunal Total de viviendas muestral Porcentaje Comunal 37.943 27.099 27.337 25.012 28.148 141.442 5.012 2,1 1,5 1,5 1,4 1,5 7,7 0,3 239 232 219 177 508 754 116 1,5 1,5 1,4 1,1 3,3 4,9 0,7 3.841 0,2 99 0,6 20.293 24.591 4.325 65.821 19.125 4.851 18.260 26.185 1.604 7.581 2.764 1.913 16.863 7.226 8.899 10.309 18.951 107.635 49.666 978 4.201 5.117 1.665 6.119 5.810 8.481 10.191 3.191 1.355 10.861 43.429 42.742 255 432 1,1 1,3 0,2 3,6 1,0 0,3 1,0 1,4 0,1 0,4 0,2 0,1 0,9 0,4 0,5 0,6 1,0 100,0 46,1 0,9 3,9 4,8 1,5 5,7 5,4 7,9 9,5 3,0 1,3 10,1 100,0 98,4 0,6 1,0 267 206 103 419 196 119 188 228 89 123 98 42 187 121 143 150 211 7.895 3.283 157 329 379 199 514 457 595 770 289 182 741 4.046 3.875 50 121 1,7 1,3 0,7 2,7 1,3 0,8 1,2 1,5 0,6 0,8 0,6 0,3 1,2 0,8 0,9 1,0 1,4 100,0 41,6 2,0 4,2 4,8 2,5 6,5 5,8 7,5 9,8 3,7 2,3 9,4 100,0 95,8 1,2 3,0 116 Metodología del Diseño Muestral y Factores de Expansión Casen 2011 TABLA VIII.8: Distribución de Viviendas, por Comuna y Zona. REGIÓN COMUNA ZONA Población Viviendas Distribución Total de Urbanos Viviendas viviendas Rurales (%) Muestra (%) 1 Urbano 928 55,7 104 58,4 2 Rural Total 1 Urbano 14106 2 Rural Mariquina Total 1 Urbano 14107 2 Rural Paillaco Total 1 Urbano 14108 2 Rural Panguipulli Total 1 Urbano XIV 14201 La 2 Rural Los Ríos Unión Total 1 Urbano 14202 2 Rural Futrono Total 1 Urbano 14203 Lago 2 Rural Ranco Total 1 Urbano 14204 Río 2 Rural Bueno Total Urbano Rural TOTAL 1 Urbano 15101 Arica 2 Rural Total 15102 2 Rural Camarones XV 1 Urbano Arica y Parinacota 15201 Putre 2 Rural Total Urbano Rural TOTAL 737 1.665 3.105 3.014 6.119 3.204 2.606 5.810 3.014 5.467 8.481 6.610 3.581 10.191 1.842 1.349 3.191 494 861 1.355 5.980 4.881 10.861 73.389 34.246 107.635 39.360 3.382 42.742 44,3 100,0 50,7 49,3 100,0 55,1 44,9 100,0 35,5 64,5 100,0 64,9 35,1 100,0 57,7 42,3 100,0 36,5 63,5 100,0 55,1 44,9 100,0 68,2 31,8 100,0 92,1 7,9 100,0 74 178 271 245 516 231 177 408 219 338 557 511 280 791 155 108 263 92 103 195 376 297 673 5.402 2.493 7.895 3.550 330 3.880 41,6 100,0 52,5 47,5 100,0 56,6 43,4 100,0 39,3 60,7 100,0 64,6 35,4 100,0 58,9 41,1 100,0 47,2 52,8 100,0 55,9 44,1 100,0 68,4 31,6 100,0 91,5 8,5 100,0 255 100,0 50 100,0 160 272 432 39.520 3.909 43.429 37,0 63,0 100,0 91,0 9,0 100,0 63 53 116 3.613 433 4.046 54,3 45,7 100,0 89,3 10,7 100,0 14105 Máfil Metodología del Diseño Muestral y Factores de Expansión Casen 2011 117 3. Anexo C: Plan de Muestreo en SPSS Pasos para Definir Plan de Muestreo en SPSS En SPSS, previamente a la realización de cualquier análisis o estimación que considere un diseño complejo, se requiere generar un plan de muestreo. Generación de un PLAN de muestreo en SPSS La generación de un plan de muestreo se realiza en 4 pasos: 1. En el módulo de muestras complejas, hay que generar un Plan para el análisis posterior, mediante los comandos: < Analizar > / < Muestras complejas > / < Preparar para el análisis > 2. En la ventana que se abre se marca la opción: 3. Crear un archivo de plan En Examinar se debe indicar el directorio donde guardará el archivo con el plan de muestreo, al cual deberá asignarle un nombre, por ejemplo: “PLAN_Ensayo”. Una vez asignado el nombre, marque <Siguiente> para pasar al siguiente nivel de definición del plan de muestreo. En este nivel deberá introducir tres variables para que quede el plan definido. Estas son: Estratos Corresponden a las agrupaciones derivadas de la estratificación definida en el diseño muestral. En el caso específico de la CASEN, corresponden originalmente al cruce o interposición de la división política administrativa a nivel comunal (322 comunas del país), con la división geográfica del territorio nacional en las áreas urbanas y rurales (2 áreas) 48 . En Casen, también se creó una Post-Estratificación con el objetivo de corregir estimaciones de la varianza, lo que dio origen a 170 pseudo-estratos denominados VarStrat. Conglomerados Son las unidades de selección definidas en el diseño muestral, que generalmente corresponden a unidades muestrales previas a la última etapa. En Casen son denominadas manzanas (5.600) y secciones (736) en las partes urbana y rural de las comunas, respectivamente. En forma simultánea a la creación de pseudo-estratos o VarStrat, en Casen se generaron agrupaciones de manzanas y de secciones, denominadas VarUnit, también con el objetivo de mejorar las estimaciones de la varianza, agrupando los conglomerados de manera de contener una cantidad aproximada mínima de 30 viviendas. 48 Cabe hacer notar que no todas las comunas contienen ambas áreas geográfica, por lo que el número de estratos generados de la interposición corresponde a 585 estratos de diseño para la Casen. Metodología del Diseño Muestral y Factores de Expansión Casen 2011 118 Ponderación muestral Se refiere al factor de expansión que posee cada unidad de selección. En Casen corresponde al factor de expansión regional Expr_r2. Una vez ingresadas estas tres variables, marque <Siguiente> para pasar al siguiente nivel de definición del plan de muestreo. 4. Llegado a este paso, o incluso en el paso previo, se puede dar por finalizado el proceso de crear un plan de análisis en muestras complejas. Si se escoge la opción de muestreo con reemplazo (CR), no es necesario definir alguna etapa de muestreo posterior y el proceso puede darse por finalizado. La opción de incluir el factor de corrección para poblaciones finitas o factor de corrección por finitud (FPC) aplica sólo si las unidades de conglomeración son seleccionadas bajo el supuesto de muestreo aleatorio simple. Si se escoge cualquiera de las otras dos opciones, que implican un muestreo con reemplazo, se requiere que sea definida una segunda etapa y también que se tengan calculadas las probabilidades de inclusión conjunta de las unidades de conglomeración. En Casen se recomienda la opción CR ya que la estimación de la varianza no difiere prácticamente de las otras opciones simplificando enormemente los cálculos y la expresión de ésta es sencilla. CHILE, Noviembre de 2011 CUESTIONARIO Comuna Zona Segmento Vivienda Hogar M Región od el FOLIO: o Encuesta CASEN 2011 rio Nombre Entrevistado (Familia con dos apellidos en caso de zonas rurales) io na Dirección: (calle, nº, depto. o casa si corresponde): (Villa / Población) o (Localidad / Entidad): Celular: Teléfono: Comuna: 1. [ 2. [ 3. [ ] Urbano ] RAU ] Rural ue st Observaciones de la Dirección C Garantía de Confidencialidad La Facultad de Economía y Negocios de la Universidad de Chile adhiere a lo establecido en la ley Orgánica N° 17.374 del Ministerio de Economía que, en el Artículo 29, determina lo siguiente: “El Instituto Nacional de Estadísticas, los organismos fiscales, semifiscales y empresas del Estado, y cada uno de sus respectivos funcionarios, no podrán divulgar los hechos que se refieren a personas o entidades determinadas de que hayan tomado conocimiento en el desempeño de sus actividades. El estricto mantenimiento de estas reservas constituye el “SECRETO ESTADISTICO”. Su infracción por cualquier persona sujeta a esta obligación, hará incurrir en el delito previsto por el artículo 247 del Código Penal. Códigos de Disposición Final para Encuestas en Hogares 1. Entrevistado, elegible o od el 120. Entrevista Parcial 2. No entrevistado, elegible 211. Se rechazó la entrevista 212. Se interrumpió la entrevista 224. Vivienda ocupada sin moradores presentes 225. Informante no ubicable o no puede atender rio 231. Muerte del informante M 223. Se impidió acceso a la vivienda 232. Informante impedido físico/mental para contestar io na 236. Otra razón elegible 3. No entrevistado, elegibilidad desconocida 311. No se envió a terreno 317. Área peligrosa o de difícil acceso st 318. No fue posible localizar la dirección 390. Otra razón de elegibilidad desconocida ue 4. No elegible 410. Fuera de muestra 451. Empresa, oficina de gobierno u otra organización C 452. Instituciones (hospital, cárcel, asilo de anciano, etc.) 453. Dormitorio colectivo (militar, de trabajo, internado, etc.) 454. Vivienda en demolición, incendiada, destruida o erradicada 461. Vivienda particular desocupada 462. Vivienda de veraneo o de uso temporal 463. Otra razón no elegible CASEN 2011 110. Entrevista completa 233. Problemas de idioma Encuesta Encuesta CASEN 2011 FOLIO: Comuna Zona Segmento Folio Hogar 1 Total de Hogares en la Vivienda Vivienda Observaciones: od el Folio Hogar 2 Hogar o Región Folio Hogar 3 Folio Hogar 4 Folio Hogar 5 Tabla N°2 Caracterización del Rechazo para Encuestas en Hogares Código Descripción 1. No tiene tiempo No está interesado o es una pérdida de tiempo 3. Por su privacidad no quiere entregar información personal ni familiar 4. Por su seguridad no quiere entregar información personal ni familiar Nunca responde encuestas 6. Está aburrido de contestar encuestas 7. No confía en las encuestas 8. Ha tenido malas experiencias por responder encuestas La familia o pareja prohibe contestar encuestas No tiene beneficios por contestar la encuesta Visita Fecha io na 10. rio 5. 9. Hora 1 / / 2011 : 2a / / 2011 : 3 a / / 2011 : 4a / / 2011 : 5 / / 2011 : / / 2011 : / / 2011 : / / 2011 : a 6a ue a st a 7 M 2. Hora Inicio Entrevista Rechazo Encuestador Cód_Enc Hora Término Entrevista C 8a Disposición Supervisor(a) Codificador(a) Reservado Supervisión 1. Si Encuesta completa Flujo lógico Letra legible Entrevistado idóneo 2. No Códigos Encuestador (a) Supervisor (a) Codificador (a) Digitador (a) 4 Hora de inicio: ___ : ___ MÓDULO H: Registro de residentes Todas las Personas Anote la edad en años cumplidos. Anote “0” en caso de niños menores de 1 año 5 6 7 8 9 10 Pasa a h5 io na Si no hay personas de 0 a 18 años Total Personas st Nombre ue C 4 rio h3. ¿Qué edad tiene [NOMBRE]? Orden en vivienda CASEN 2011 1.Hombre 2.Mujer 3 1.Casado(a) 2.Conviviente o pareja 3.Anulado(a) 4.Separado(a) 5.Divorciado(a) 6.Viudo(a) 7.Soltero(a) M Pregunte sólo si no es evidente 2 Lea alternativas h6. En este estudio es importante conocer las relaciones que tienen las personas al interior del hogar. Me puede indicar, ¿qué personas aquí conforman parejas, ya sea legales o de hecho? h2. ¿Es [NOMBRE] hombre o mujer? 1 h5. ¿Cuál es el estado conyugal o civil actual de [NOMBRE]? o • Empecemos con usted, ¿cuál es su nombre? • Y cuál es el nombre del resto de las personas que viven aquí habitualmente? • Por favor dígame los nombres de las parejas y de los hijos o los adultos que dependen de esas parejas. • No se olvide de incluir a las guaguas, a los niños pequeños y los adultos mayores que vivan aquí. • No se olvide de quienes residen transitoriamente fuera del hogar ya sea por estudio, trabajo, negocio, enfermedad, vacaciones u otra razón, siempre que los periodos de ausencia no superen los 6 meses h4. ¿Me puede indicar el mes y año de nacimiento de las personas de 0 a 18 años? od el h1. Ahora quisiera que me dijera los nombres de las personas que viven aquí habitualmente. Por favor dígame los nombres de las personas en orden. Sexo Edad Identifique las parejas utilizando un número correlativo de 1 a n • Si no hay parejas, deje en blanco Personas de 0 a 18 años registre Fecha de nacimiento Mes Año Total Parejas Estado Civil Pareja Legal Hecho ANOTACIONES 5 Todas las Personas 1.Chilena (exclusivamente) 2.Chilena y otra (doble nacionalidad) 3.Otra nacionalidad (extranjeros). Especifique o h10.b. ¿Qué relación tiene [NOMBRE] con el jefe(a) de este hogar? M 2.Esposo(a) pareja 3.Hijo(a) de ambos 4.Hijo(a) sólo del jefe 5.Hijo(a) sólo del esposo(a) /pareja 6.Padre o madre 7.Suegro(a) utilizando un 8.Yerno o nuera 2.Esposo(a) número corre9.Nieto(a) pareja lativo de 1 a n 10.Hermano(a) 3.Hijo(a) de • Asigne el servi- 11.Cuñado(a) ambos 12.Otro familiar cio doméstico 4.Hijo(a) sólo puertas adentro 13.No familiar del jefe 14.Servicio doméstico puertas adentro a un hogar 5.Hijo(a) sólo • Si es solo 1 residel esposo(a) dente registre 1 /pareja Registre el parentesco de cada hogar 12. Otro familiar en una columna distinta 13. No familiar • Si hay sólo 1 hogar, registre en “Hogar 1” • Si hay 2 ó más hogares, registre al hogar 2 en “Hogar 2” y así sucesivaSi es solo Total Hogares mente 1 residente • Si es solo 1 residente registre 1 en registre 1 “Hogar 1” rio io na Total Núcleos Parentesco Jefe Hogar Nº de Hogar Hogar 1 Hogar 2 ue st Parentesco Jefe Núcleo C Nº de Núcleo 1.Jefe(a) del Hogar h11. ¿Cuál es la nacionalidad de [NOMBRE]? CASEN 2011 de menor edad, identifique de quién depende cada integrante que no forma parte de una pareja, asignando el mismo número de la pareja de la cual depende, o asignando un número correlativo a continuación del número mayor de pareja, si depende de un miembro que no tiene pareja presente en la vivienda y también asigne este valor al miembro del cual depende • Y así sucesivamente hasta que todos los miembros queden identificados • Si es solo 1 residente registre 1 h10.a. ¿Quién es el jefe(a) de este hogar? od el h7. Me puede indicar, ¿qué h8.a. ¿Quién h9. Me puede personas aquí son hijos o es el jefe(a) de indicar, ¿qué dependen de otros? este núcleo? grupo de personas aquí 1.Jefe(a) de comen juntos Asigne el número “0” al Núcleo o comparten servicio domestico y a sus los gastos de dependientes h8.b. ¿Y qué alimentación? • Copie los números con que relación tiene identificó cada pareja en la [NOMBRE] con columna anterior frente a el jefe(a) de cada miembro de la pareja Identifique • Partiendo de los miembros este núcleo? los hogares Hogar 3 Hogar 4 Hogar 5 Nac. Especifique 1 2 3 4 5 6 7 8 9 10 6 MÓDULO E: Educación Personas de 15 años o más e2.a Actualmente, ¿se encuentra participando en algún programa de 1.Sí, lee y escribe nivelación de estudios 2.No, sólo lee dirigido a personas que 3.No, sólo escribe no completaron la ense4.No, ninguno ñanza básica o media? h2. Sexo h3. Edad 1.Sí 2.No h8. Parentesco con Jefe de Núcleo 1.Sí 2.No Pasa a e3 e2.b Asiste a: de 6 7 8 9 10 M st ue C 5 JN Todos e1 e2.a Pasan a e6a e2.b Razones personales 1.No es necesario porque lo(a) cuidan en la casa 2.No me parece necesario que asista a esta edad 3.Desconfío del cuidado que recibiría 4.Se enfermaría mucho 5.Tiene una discapacidad o requiere establecimiento de educación especial e2.c Razones económicas 6.Dificultad económica 7.No me alcanza el puntaje de la Ficha de Protección Social (FPS) para postular Razones de acceso a establecimiento educacional 8.No hay matrícula (vacantes) o no lo aceptan 9.No existe establecimiento cercano 10.Dificultad de acceso o movilización 11.Otra razón. Especifique 1.Modalidad regular 2.Modalidad flexible io na Edad 2 4 Pasa a e6a si tiene 31 años y más rio Orden en vivienda CASEN 2011 Orden en Hogar Sexo 1 3 Pasa a e5 si tiene 7 a 30 años e2.c ¿Asiste bajo modalidad regular o flexible? Traslade Orden en Vivienda Nombre Pasa a e6a Pasa a e4 si tiene 0 a 6 años 1.Nivelación de Estudios Básicos 2.Nivelación de Estudios Medios Total de personas del hogar e4. ¿Cuál es la principal razón por la cual no asiste actualmente a un jardín infantil, sala cuna, programa preescolar no convencional o algún establecimiento educacional? od el h1. Nombre e3. Actualmente, ¿asiste a algún establecimiento educacional, jardín infantil, sala cuna u otro programa preescolar no convencional? Personas de 0 a 6 años y No asisten (e3=2) o e1. ¿Sabe leer y escribir? Traslade desde registro de residentes datos de integrantes del hogar a encuestar Hogar nº Todas las personas e3 e4 e4. Especifique 7 1.Nunca asistió 2.Jardín Infantil / Sala Cuna 3.Kinder / Prekinder 4.Educación Especial (Diferencial) 5.Primaria o Preparatoria (Sistema antiguo) 6.Educación Básica 7.Humanidades (Sistema Antiguo) 8.Educación Media Científico-Humanista 9.Técnica Comercial, Industrial o Normalista (Sistema Antiguo) 10.Educación Media Técnica Profesional 11.Técnico Nivel Superior 12.Profesional 13.Postgrado e5. Especifique C ue st e5 Si no sabe anote 99 Pregunte por la duración de la carrera de pre-grado a quienes reportan estudios de postgrado (e6.a=13) e6.b. ¿Completó el nivel educacional anteriormente declarado? 1.Si 2.No 7. No aplica (nivel 1 a 4 en e6.a) io na Razones de acceso a establecimiento educacional 13.No existe establecimiento cercano 14.Dificultad de acceso o movilización 15.Otra razón. Especifique Lea alternativas e7. ¿Cuántos años dura la carrera que estudió o que estudia actualmente? CASEN 2011 Razones de rendimiento 11.Problemas de rendimiento 12.Expulsión o cancelación de matrícula “Nivel Educacional” od el Razones económicas 9.Dificultad económica 10.Trabaja o busca trabajo Mostrar Tarjeta e6 M Razones personales 1.Ayuda en la casa o quehaceres del hogar 2.Embarazo, maternidad o paternidad 3.Tiene una discapacidad, requiere establecimiento de educación especial 4.Enfermedad que lo inhabilita 5.Problemas familiares 6.No le interesa 7.Terminó de estudiar 8.A su edad no le sirve estudiar o no conoce la manera para completar sus estudios e6.a. ¿Cuál es el nivel más alto alcanzado o el nivel educacional actual? rio e5. ¿Cuál es la principal razón por la cual no asiste actualmente a algún establecimiento educacional? Personas que asisten o asistieron a Educación Superior (e6.a=11, 12 ó 13) o Todas las personas Personas de 7 a 30 años y No asisten (e3=2) e6.c. En ese nivel educacional, ¿cuál fue el último curso que aprobó (para los que no están estudiando) o que cursa actualmente (para los que están estudiando)? e6.a Nivel e6.b e6.c Curso e7 1 2 3 4 5 6 7 8 9 10 8 MÓDULO E: Educación Todos los estudiantes que asisten a Educación: Preescolar, Básica, Media o Superior (e3=1), o a Nivelación Básica o Media (e2.a=1) • En caso de Educación Superior, anote el nombre de la Universidad, CFT o IP 1.Municipal Lea alterna2.Particular Subventivas cionada 3.Corporación de 1.Jornada Administración mañana Delegada 2.Jornada 4.Particular no tarde Subvencionada 3.Jornada 5.JUNJI completa 6.INTEGRA (mañana y 7.Jardín infantil tarde) o sala cuna del trabajo de la madre o 4.Jornada completa del padre con exten8.Universidad sión de del Consejo de horario Rectores 5.Vespertina 9.Universidad 6.Otra (horaPrivada rio variable, 10.Instituto Profeesporádico sional o flexible) 11.Centro de Formación Técnica 99. No sabe C 5 ue 2 4 6 7 8 9 10 e8D Dirección establecimiento st 1 Lea alternativas Marque todas las que corresponda a) Desayuno b) Almuerzo c) Once d) Colación 1.Si 2.No e8C Comuna e9 e10 Colación Once Almuerzo Desayuno io na e8N Nombre establecimiento 3 e11. ¿En el presente año escolar recibe alimentación gratuita en el establecimiento educacional? rio CASEN 2011 M • Escriba con letra clara y legible el nombre del establecimiento, la dirección y comuna en que se ubica, solicite algún documento que lo acredite: Libreta de notas, comunicaciones, etc. e10. ¿A qué jornada asiste regularmente? o • En caso de los programas especiales a preescolares, anote el nombre del programa especial y lugar donde se imparte e9. ¿Cuál es la dependencia administrativa del establecimiento? od el e8. Indique el establecimiento educacional, sala cuna o jardín infantil al cual asiste actualmente (Año 2011). e11.a e11.b e11.c e11.d 9 e12.b. ¿Ha recibido o recibió algunas de estas becas? Mostrar Tarjeta e12 1.Sí 2.No “Becas Estatales” ue C rio Textos Básica Atención Dental Atención Médica Útiles Textos Atención Dental Atención Médica Útiles io na Especifique Media e13 e13 e13 e13 e13 e13 e13 e13 e13 e13 e13 e13 e13 e14.a PBU PBT PBD PBM BU BT BD BM BP MU MT MD MM st e12.b e12.b Tipo 1 Tipo 2 Pre básica CASEN 2011 e12.a e14.b. ¿Cuánto paga mensualmente? M Registre máximo 2 becas Lea alternativas 1.Beca Indígena (Todos los estudiantes) 2.BARE (ed. Media) 3.Beca Presidente de la República (ed. Media y Superior) 4.Beca Bicentenario (ex-MINEDUC) (ed. Superior) 5.Beca Nuevo Milenium (ed. Superior) 6.Beca Vocación de Profesor (ed. Superior) 7.Otra beca estatal. Especifique (Todos los estudiantes) 8.Otra beca no estatal. Especifique (Todos los estudiantes) o Pasa e13 Pasa a e15 od el 1.Sí 2.No 1.Sí 2.No a) Útiles escolares (cuadernos, lápices, block de dibujo, etc.) b) Textos escolares (libros de estudio) c) Atención dental escolar d) Atención médica escolar e) Yo elijo mi PC (séptimo básico) Atención Dental Atención Médica Lea alternativas e14.a. ¿Paga colegiatura o financiamiento compartido? Lea alternativas “Becas Estatales” Textos Mostrar tarjeta e12 e13. En el presente año escolar 2011, ¿ha recibido alguno de los siguientes beneficios? Útiles e12.a. En el año escolar 2011, ¿ha recibido o recibió alguna beca? Todos los que asisten a Educación: Preescolar, Básica o Media PC Todos los que asisten a Educación: Preescolar, Básica, Media o Superior e14.b (Monto$) 1 2 3 4 5 6 7 8 9 10 10 MÓDULO E: Educación Todos los que asisten a educación: Técnico Profesional, Profesional o Postgrado C 6 7 8 9 10 e16 ue 2 5 1.Sí, crédito universitario o Fondo Solidario 2. Sí, crédito CORFO 3.Sí, crédito con garantía estatal o aval del Estado 4.Sí, crédito otorgado por la institución donde estudia 5. Sí, crédito familiar 6. Sí, crédito de institución financiera 7.Sí, otro crédito 8.No Pasa a e0 Si no sabe anote 999 e17 Tipo 1 st 1 4 Registe la respuesta en el formato que prefiera el entrevistado: o Registre máximo 2 alternativas io na e15 3 Anote el monto declarado en pesos e18. ¿Cuánto recibe mensualmente por este crédito? • Si el entrevistado prefiere declarar monto en pesos, registe en columna “Monto($)” • Si el entrevistado prefiere declarar porcentaje, registre en columna “(%)” • Registre como máximo los 2 créditos en caso que así sea, los mencionados en pregunta e17 • Si no sabe anote 999 e0. ¿Quién (o quiénes) responde(n) el módulo Educación? rio CASEN 2011 Si no sabe anote 999 e17. ¿Recibe alguno de los siguientes créditos universitarios para pagar la carrera que estudia? od el Anote el monto declarado en pesos e16. ¿Cuánto paga mensualmente por la carrera que estudia? M e15. ¿Cuánto cuesta mensualmente la carrera que estudia? e17 Tipo 2 Registre por observación e18 Tipo 1 Monto($) 1.Contesta al menos una pregunta 2.Presente, pero no contesta 3.No está presente e18 Tipo 2 % Monto($) % e0 11 MÓDULO O: Trabajo Personas de 12 años y más o1. La semana pasada, ¿trabajó al menos una hora, sin considerar los quehaceres del hogar? Posibilidad de empezar a trabajar pronto 1.Sí 2.No o2 o3 1.Sí 2.No Pasa a o8 o4 o5 C ue st o1 Pasa a o9a o6. ¿Buscó trabajo remunerado o realizó alguna gestión para iniciar una actividad por cuenta propia (negocio o empresa) en las últimas cuatro semanas? o 3.No tiene con quien dejar a los niños 4.No tiene con quien dejar a adultos mayores 5. No tiene con quien dejar a otro familiar 6. Está enfermo o tiene una discapacidad Percepción de limitaciones personales 7.Piensa que nadie le dará trabajo (porque no cuenta con la capacitación requerida, por su edad, etc.) Condiciones laborales no se adecuan a expectativas 8.Las reglas, horarios y distancias de los trabajos no le acomodan 9. Ofrecen sueldos muy bajos Tiene otra actividad o renta 10. Quehaceres del hogar 11. Estudiante 12. Jubilado(a), pensionado(a) o montepiada 13. Tiene otra fuente de ingreso (seguro de cesantía, mesadas, rentas, transferencias del Estado, etc.) io na o3. Aunque no trabajó la semana pasada, ¿tenía algún empleo del cual estuvo ausente temporalmente por licencia, huelga, enfermedad, vacaciones, suspensión temporal u otra razón? 1.Si, ahora mismo 2.Sí, en otra época del año 3.No Limitaciones de condiciones familiares o personales 06 Otros 14. Se cansó de buscar o cree que no hay trabajo disponible 15. Busca cuando realmente lo necesita o tiene trabajo esporádico 16. No tiene interés en trabajar 17. Otra razón Alternativas 3 a 17 pasan a o29 o7. Razón 1 CASEN 2011 Pasa a o9a Lea alternativas 1.Consiguió trabajo que empezará pronto o iniciará pronto una actividad por cuenta propia 2. Está esperando resultado de gestiones ya emprendidas Alternativas 1 y 2 pasan a o8 od el …por un salario o remuneración? …en su empresa o negocio? …para la empresa o negocio de un familiar (con o sin remuneración)? …por pago en especies? …como aprendiz o realizando una práctica? …de venta, sin incluir bienes del hogar? …agrícola, minera o artesanal para la venta? o5. Si le ofrecieran un trabajo, ¿estaría disponible para comenzar a trabajar? M o2. Aunque no trabajó la semana pasada, ¿realizó alguna actividad por lo menos durante una hora 1.Sí 2.No respuesta espontánea por orden de prioridad (debe anotar en “Razón 1” la que la persona considera más importante entre las dos) 1.Sí 2.No Pasa a o9a o7. ¿Cuál es la razón o razones por la que no buscó trabajo o realizó alguna gestión para iniciar una actividad por cuenta propia en las últimas cuatro semanas? No lea las alternativas, registre rio 1.Sí 2.No o4. ¿Ha trabajado alguna vez? o7. Razón 2 1 2 3 4 5 6 7 8 9 10 MÓDULO O: Trabajo Señale el número de semanas cumplidas Pasan a o29 Ahora quisiera preguntarle acerca de su trabajo o negocio principal o9.a. ¿Cuál es su ocupación u oficio? Indique el nombre completo del empleo y facilite detalles, por ejemplo: • Recolector de frutas • Profesor de escuela nivel secundario • Enfermera titulada • Conductor de bus • Guardia de seguridad • Gerente de una empresa o9.b. ¿Qué hace usted en su trabajo o negocio principal? 4 C 5 ue 2 3 6 7 8 9 10 o9.a st 1 io na rio CASEN 2011 Facilite detalles, por ejemplo: • Recoger y transportar uvas • Enseñar matemáticas • Cuidar enfermos y administrar medicamentos • Transportar pasajeros entre ciudades • Vigilar y controlar entrada en una empresa • Administrar una empresa de productos lácteos o8 o10. ¿Cuántas horas trabajó la semana pasada en su empleo o actividad principal? o12. ¿Su trabajo o negocio principal es de tipo…? Lea alternativas 1.Permanente 2.De temporada o estacional 3.Ocasional o eventual 4.A prueba 5.Por plazo o tiempo determinado od el o8. ¿Cuántas semanas buscó o ha estado buscando trabajo? Ocupados (o1=1, o2=1, o3=1) o Desocupados M 12 o9.b o11. ¿Ud. está dispuesto a trabajar más horas a la semana? Lea alternativas 1.Sí, ahora mismo 2.Sí, en otra época del año 3.No o10 Horas totales o13. ¿Desde qué año tiene su trabajo o negocio principal? Registre al menos una fecha aproximada o11 o12 o13 13 Ocupados Asalariados (o15=3,4,5,6,7,8) 3.Empleado u obrero del sector público (Gob. Central o Municipal) 4.Empleado u obrero de empresas públicas 5.Empleado u obrero del sector privado 6.Servicio doméstico puertas adentro 7.Servicio doméstico puertas afuera 8.FF.AA. y del Orden 9.Familiar no remunerado Alternativas 3, 4, 5, 6, 7 y 8 pasan a o16 Alternativa 9 Pasa a o23 Lea alternativas o15 o16 st ue C o17 o20. ¿Con quién firmó su contrato o estableció su acuerdo de trabajo? o o19. ¿Qué tipo de horario tiene su trabajo actual? Lea alternativas Lea alternativas Lea alternativas 1.Jornada completa 2.Jornada parcial 3.Jornada prolongada 4.Otra 1.Sólo diurno 2.Sólo nocturno 3.Rotativo o turnos 1.Directamente con la empresa o negocio donde trabaja Pasa a o23 2.Con un contratista o subcontratista de bienes o servicios 3.Con una empresa de servicios transitorios, suministradora de trabajadores o con un contratista laboral (enganchador) o19 o20 M 1.Plazo indefinido 2.Plazo fijo 1.Sí, firmó 2.Sí, pero no ha firmado 3.No tiene 4.No se acuerda o no sabe si firmó contrato o18. Según su contrato de trabajo o el acuerdo con su empleador, ¿su jornada de trabajo normal es de…? o18 CASEN 2011 o14 pasan a o23 o17. En su trabajo principal, ¿tiene contrato de trabajo escrito? rio 1.Sí, da boleta de servicios (honorarios) 2.Sí, da boleta de compra y venta (factura) 3.No 9. No sabe o15. En su trabajo o16. En o negocio principal, su trabajo ¿usted trabaja como? principal, Lea alternativas ¿qué tipo de contrato 1.Patrón o empleador 2.Trabajador por cuen- o acuerdo de trabajo ta propia tiene…? Alternativas 1 y 2 io na o14. En su trabajo o negocio principal, ¿usted da boleta? od el Ocupados (o1=1, o2=1, o3=1) 1 2 3 4 5 6 7 8 9 10 MÓDULO O: Trabajo • En caso que la empresa o institución tenga múltiples actividades, se debe describir la actividad principal de la empresa. Para mayor detalle, ver manual • Ejemplos de descripción completa: construcción de obras civiles, mantención de equipamiento minero, servicio de seguridad para instituciones, servicio de higiene par empresas, corporación municipal que administra educación y salud, etc. o21 st 1 4 C 5 ue 2 3 6 7 8 9 10 1.Solo 1 persona (el entrevistado) 2.De 2 a 5 personas 3.De 6 a 9 personas 4.De 10 a 49 personas 5.De 50 a 199 personas 6.Más de 200 personas 9. No sabe • Describa la actividad a que se dedica la empresa, negocio o institución en que la persona realiza su actividad u ocupación principal • En caso que la empresa o institución tenga múltiples establecimientos y actividades, se debe describir actividad principal del establecimiento en que trabaja la persona. Para mayor detalle, ver manual • Ejemplos de descripción incompleta: fábrica, comercio, taller, construcción, minería, etc. • Ejemplos de descripción completa: fábrica de envases de vidrio, comercio de zapatillas, taller de reparación de autos, construcción de edificio, extracción de cobre, etc. io na CASEN 2011 • Ejemplos de descripción incompleta: construcción, mantención seguridad, higiene, educación, etc. Lea alternativas o23. ¿A qué se dedica o qué hace el negocio, empresa o institución donde usted trabaja? o22 o24. ¿Cuántas personas trabajan en total en el local o establecimiento donde usted trabaja? Lea alternativas o • Describa la actividad a que se dedica la empresa, negocio o institución que le paga su sueldo o22. Considerando todo el país, ¿cuántas personas trabajan en total en el negocio, empresa o institución que le paga? 1.Solo 1 persona (el entrevistado) 2.De 2 a 5 personas 3.De 6 a 9 personas 4.De 10 a 49 personas 5.De 50 a 199 personas 6.Más de 200 personas 9. No sabe o25. ¿Cuántas personas trabajan en total en ese negocio, empresa o institución en Chile? Lea alternativas rio o21. ¿A qué se dedica o qué hace el negocio, empresa o institución que le paga? Ocupados (o1=1, o2=1, o3=1) od el Ocupados Asalariados por Empresa Contratista (o20=2,3) M 14 1.Solo 1 persona (el entrevistado) 2.De 2 a 5 personas 3.De 6 a 9 personas 4.De 10 a 49 personas 5.De 50 a 199 personas 6.Más de 200 personas 9. No sabe o23 o24 o25 15 Ocupados (o1=1, o2=1, o3=1) Mostrar Tarjeta o29 tución Previsional” Lea alternativas o28 029 “Insti- 1.Sí, AFP (Administradora de Fondos de Pensiones) Cotización obligatoria del trabajador dependiente 2.Sí, AFP (Administradora de Fondos de Pensiones) Cotización voluntaria del trabajador independiente 3.Si, IPS ex-INP, (Caja Nacional de Empleados Públicos (CANAEMPU), Caja de Empleados Particulares (EMPART), Servicio de Seguro Social (SSS) 4.Si, Caja de Previsión de la Defensa Nacional (CAPREDENA) 5.Si, Dirección de Previsión de Carabineros (DIPRECA) 6.Si, otra. Especifique 7.No está cotizando 9. No sabe M 1.Patrón o empleaLea alternador tivas 2.Trabajador por cuenta propia 3.Empleado u 1. Sí obrero del sector 2. No público (Gob. Cen- 9. No sabe tral o Municipal) 4.Empleado u obreAlternativas 2 ro de empresas y 9 Pasa a o0 públicas 5.Empleado u obrero del sector privado 6.Servicio doméstico puertas adentro 7.Servicio doméstico puertas afuera 8.FF.AA. y del Orden 9.Familiar no remunerado o30. ¿Cotizó durante el mes pasado en algún sistema previsional (sistema de pensiones)? o Mostrar Tarjeta o29 “Institución Previsional” rio o27 ue C o29. ¿Se encuentra afiliado a algún sistema previsional (sistema de pensiones)? od el Lea alternativas st o26 1.Sí Pasa 2.No a o29 o28. Considere el trabajo secundario que le reporta mayores ingresos mensuales. En ese trabajo secundario, ¿usted trabaja como…? o30 Especifique o0. ¿Quién (o quiénes) responde(n) el módulo Trabajo? Registre por observación 1.Contesta al menos una pregunta 2.Presente, pero no contesta 3.No está presente CASEN 2011 1.Dentro de su vivienda 2.Taller o local anexo a su vivienda 3.En un establecimiento independiente (fábrica, oficina, etc.) 4.En un predio agrícola 5.En un predio marítimo 6.A domicilio (casa del empleador o cliente) 7.En la vía pública, transporte terrestre, aéreo o acuático 8.En faena, obras de construcción, mineras o similares 9.En otro lugar o27. ¿En el último mes, tuvo otros trabajos, empleos, actividades o negocios además de su trabajo o negocio principal? io na o26. ¿Dónde realiza la actividad o dónde se ubica el negocio, empresa o institución en la que trabaja? Personas de 15 años o más o0 1 2 3 4 5 6 7 8 9 10 16 MÓDULO Y: Ingresos Ingresos del trabajo - Ocupación principal - Remuneración monetaria Asalariados (o15=3,4,5,6,7,8) Ch1. Chequeo de situación ocupacional. 2. Patrón o Empleador • Si o15=1 Pasa a y7 2. Trab. Cuenta Propia CASEN 2011 • Si o15=2 Pasa a y7 3. Familiar No Remunerado • Si o15=9 y11a Pasa a 3. Inactivos y Desocupados • Responde o4 a y11a Pasa 4. Menores de 12 años Pasa a y12 EXCLUYA los descuentos legales correspondientes a: • sistema previsional • sistema de salud • impuestos a las remuneraciones EXCLUYA también los pagos por: • horas extras • bonificaciones • gratificaciones • aguinaldos y otros beneficios • asignaciones familiares 3 4 st C 5 6 7 8 9 10 o Excluya las horas extraordinarias 999 No sabe y1c. Y en [MES -3], ¿cuál fue su sueldo o salario líquido en su trabajo principal? ue 2 Anote el total de días y horas mensuales pactadas por contrato o acuerdo con su empleador y1b. Y en [MES -2], ¿cuál fue su sueldo o salario líquido en su trabajo principal? y1.a [Mes-1] 1 y2. En el mes pasado, ¿a cuántos días y horas pactadas correspondió ese sueldo o salario? od el • Si o15=3,4,5,6,7,8 Pasa a y1 INCLUYA los descuentos por planilla de: • préstamos y consumos en casas comerciales • cuotas sindicales o a clubes • días de licencia médica y subsidio maternal • ahorro previsional voluntario o ahorro voluntario M 1. Asalariado y1a. En el mes pasado, ¿cuál fue su sueldo o salario líquido en su trabajo principal? rio Asigne según corresponda io na Revise la clasificación de los entrevistados según las respuestas al Módulo de Trabajo Mes pasado A continuación le voy a hacer unas preguntas acerca de los ingresos que reciben las personas que componen este hogar. De antemano, le agradezco su disposición a contestar estas preguntas ya que esta información es muy importante para conocer la situación socioeconómica de los hogares del país y orientar las políticas y programas públicos, especialmente en el área social. y1.b [Mes-2] y1.c [Mes-3] Días Horas 17 Ingresos del trabajo - Ocupación principal - Remuneración monetaria Asalariados (o15=3,4,5,6,7,8) Mes pasado Además del ingreso que recién declaró (y1a), ¿recibió el mes pasado otros ingresos provenientes de su ocupación principal? Mostrar Tarjeta y3 “Ingresos mes pasado”. Lea alternativas o y3. ¿Me puede indicar cuánto recibió por …? od el a) Horas extras b) Comisiones c) Propinas d) Asignaciones por vivienda, transporte, educación de los hijos y semejantes e) Viáticos no sujetos a rendición f) Otros. Especifique ¿Y con qué periodicidad recibe este ingreso? (P) M 1.Diario 2.Semanal (1 vez por semana) 3.Quincenal (cada 2 semanas) 4.Mensual (1 vez por mes) 5.Bimestral (cada 2 meses) 6.Trimestral (cada 3 meses) 7.Cuatrimestral (cada 4 meses) 8.Semestral (cada 6 meses) 9.Anual (1 vez por año) 99. No sabe P Monto($) P ue C rio y3.d Asignaciones por vivienda y3.c Propinas Monto($) st Monto($) y3.b Comisiones io na y3.a Horas extras CASEN 2011 Para cada tipo de ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 P Monto($) P y3.e Viáticos no sujetos a rendición Monto($) P y3.f Otros Monto($) P Especifique 1 2 3 4 5 6 7 8 9 10 18 MÓDULO Y: Ingresos Ingresos del trabajo - Ocupación principal - Remuneración monetaria Asalariados (o15=3,4,5,6,7,8) Últimos 12 meses (Entrevistas en Octubre [Oct 2010-Sept 2011], Entrevistas en Noviembre [Nov 2010-Oct 2011], Entrevistas en Diciembre [Dic 2010-Nov 2011]) “Ingresos 12 meses”. Lea alternativas od el Mostrar Tarjeta y4 o y4. Durante los últimos 12 meses, además de los ingresos recién declarados, ¿recibió alguno de los siguientes tipos de ingreso derivados de su ocupación principal? ¿Me puede indicar cuanto recibió por…? y4.a Bonificaciones o aguinaldos Monto($) 4 C 5 6 7 8 9 10 y4.c Sueldo adicional Monto($) Monto($) ue 2 3 y4.b Gratificaciones st 1 rio Para cada tipo de ingreso: • Anote el monto anual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 io na CASEN 2011 M a) Bonificaciones o aguinaldos y otras asignaciones especiales b) Gratificaciones c) Sueldo adicional, por sobre la remuneración mensual (décimo tercer mes) d) Otros similares. Especifique y4.d Otros similares Monto($) Especifique 19 Ingresos del trabajo - Ocupación principal - Remuneración en especies Asalariados (o15=3,4,5,6,7,8) Mes pasado “Remuneración en especies”. Lea alternativas od el Mostrar Tarjeta y5 o y5. En el mes pasado, ¿recibió en su trabajo principal alguno de los siguientes beneficios? Por favor, no incluya los elementos que le entregan exclusivamente para la realización de su trabajo. Sólo incluya aquellos que le entregan para su uso privado. ¿Me puede indicar, el monto estimado en pesos…? a) Alimentos y bebidas b) Vales de alimentación c) Vivienda o alojamiento d) Automóvil para uso privado e) Servicio de transporte f) Estacionamiento gratuito g) Teléfono io na (Continúa) y5.b Vales de alimentación y5.c Vivienda o alojamiento y5.d Automóvil y5.e Servicio de transporte y5.f Estacionamiento gratuito y5.g Teléfono Monto($) Monto($) Monto($) Monto($) Monto($) Monto($) Monto($) C ue st y5.a Alimentos y bebidas CASEN 2011 rio M Para cada tipo de ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 1 2 3 4 5 6 7 8 9 10 20 Ingresos del trabajo - Ocupación principal - Remuneración en especies Asalariados (o15=3,4,5,6,7,8) Ocupación Secundaria (o27=1) Mes pasado “Remuneración en especies”. 1.Si o27=1 (Tiene ocup. secundaria) Pasa a y6 2.Si o27=2 (No tiene ocup. secundaria) Pasa a y12 Lea alternativas 6 7 8 9 10 rio y5.k Bienes o servicios del empleador y5.l Otros Monto($) Monto($) Monto($) Monto($) Monto($) st C 5 Pasan a y12 • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 y5.j Leña ue 4 Se incluye el total de los ingresos líquidos recibidos el mes anterior por todos los trabajos distintos al principal, contemplando ingresos en dinero y en especie. En caso de haber ingresos en especie, deben valorarse a precios de mercado, según juicio de la persona encuestada Asalariados y5.i Sala cuna 2 y6. El mes pasado, ¿cuál fue el ingreso líquido total, que Ud. recibió por otro u otros trabajos u ocupaciones además de su ocupación principal? Considere ingresos en dinero y en especie. Para este ingreso: y5.h Vestimenta 1 3 io na CASEN 2011 M h) Vestimenta i) Servicios de guardería o sala cuna j) Leña u otro tipo de combustible de uso doméstico k) Bienes o servicios producidos por el empleador l) Otros similares Para cada tipo de ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Revise la clasificación de los entrevistados según las respuestas al Módulo de Trabajo od el Mostrar Tarjeta y5 Ch2. Chequeo de ocupación secundaria. o y5. (Continuación) En el mes pasado, ¿recibió en su trabajo principal alguno de los siguientes beneficios? Por favor, no incluya los elementos que le entregan exclusivamente para la realización de su trabajo. Sólo incluya aquellos que le entregan para su uso privado. ¿Me puede indicar, el monto estimado en pesos…? y6 Ocupación secundaria Ch2 Monto($) 21 MÓDULO Y: Ingresos Patrón o Empleador (o15=1), Independiente o Trabajador por cuenta propia (o15=2) Ingresos del trabajo - Ocupación principal - Remuneración monetaria Remuneración monetaria Mes pasado Últimos 12 meses io na Para este ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Para este ingreso: • Anote el monto anual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 y7.b [MES-2] y7.c [MES-3] y8 y9 Monto($) Monto($) Monto($) Monto($) Monto($) C ue st y7.a [MES-1] CASEN 2011 Para este ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 rio M y7c. ¿Cuánto dinero retiró el [MES -3], de su negocio o actividad para sus gastos propios o de su hogar? Incluya su propio sueldo si lo tiene. y9. Durante los últimos 12 meses, ¿cuánto recibió Ud. por ganancias derivadas de la venta de productos silvoagropecuarios, mineros o pesqueros en su negocio o actividad? o y7b. ¿Cuánto dinero retiró el [MES -2], de su negocio o actividad para sus gastos propios o de su hogar? Incluya su propio sueldo si lo tiene. y8. El mes pasado, ¿cuánto retiró en productos de su negocio o actividad para consumo propio o de su hogar? Estime el monto que hubiera tenido que pagar por estos productos. od el y7a. ¿Cuánto dinero retiró el mes pasado de su negocio o actividad para sus gastos propios o de su hogar? Incluya su propio sueldo si lo tiene. 1 2 3 4 5 6 7 8 9 10 MÓDULO Y: Ingresos Patrón o Empleador (o15=1), Independiente o Trabajador por cuenta propia (o15=2) Ocupación Secundaria (o27=1) FAM no remunerado (o15=9), Desocupados, Inactivos (responden o4) Mes pasado Mes pasado Ch3. Chequeo de ocupación secundaria. Ingresos del trabajo y11a. En el mes pasado, ¿recibió algún sueldo o pago por trabajos, actividades o negocios que usted haya realizado ese mes? o Revise la clasificación de los entrevistados según las respuestas al Módulo de Trabajo y11b. Y en el mes [MES -2], ¿recibió algún sueldo o pago? 1.Si o27=1 (Tiene ocup. secundaria) Pasa a y10 2.Si o27=2 (No tiene ocup. secundaria) Pasa a y12 od el 22 y11c. Y en el mes [MES -3], ¿recibió algún sueldo o pago? Para este ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Ch3 3 4 C 5 6 7 8 9 10 M y11.a [MES-1] y11.b [MES-2] y11.c [MES-3] Monto($) Monto($) Monto($) Monto($) ue 2 Para este ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 y10 Ocupación Secundaria st 1 rio • Se incluye el total de los ingresos líquidos recibidos el mes anterior por todos los trabajos distintos al principal, contemplando ingresos en dinero y en especie • En caso de haber ingresos en especie, deben valorarse a precios de mercado, según juicio de la persona encuestada io na CASEN 2011 y10. El mes pasado, ¿cuál fue el ingreso líquido total, que usted recibió por otro u otros trabajos u ocupaciones además de su ocupación principal? Considere ingresos en dinero y en especies 23 Otros ingresos de origen privado A todas las personas Personas de 12 años y más Mes pasado Mes pasado Para cada tipo de ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Para cada tipo de ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 o a) Pensión de alimentos b) Dinero aportado por familiares ajenos al hogar residentes en el país c) Dinero aportado por familiares ajenos al hogar residentes fuera del país a) Remuneración por trabajos ocasionales (No incluir los ingresos declarados en y6, y10 e y11a) b) Trabajos realizados antes del mes anterior c) Seguro de desempleo o de cesantía Monto($) Monto($) io na y12.b Arriendo maquinarias Anotar en el receptor y13.a Pensión alimento Monto($) C ue st y12.a Arriendo urbano Para cada tipo de ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Anotar en el receptor y13.b y13.c Aporte familiar Aporte familiar país extranjero Monto($) Monto($) y14.a Trabajo ocasional y14.b Trabajo anterior y14.c Seguro desempleo Monto($) Monto($) Monto($) CASEN 2011 Anotar en el receptor rio M a) Arriendo de propiedades urbanas b) Arriendo de maquinarias, animales o implementos y14. El mes pasado, ¿recibió ingresos por...? od el y12. El mes pasado, ¿recibió y13. El mes pasado, ¿recibió ingresos ingresos por...? por...? 1 2 3 4 5 6 7 8 9 10 24 MÓDULO Y: Ingresos Otros ingresos de origen privado A todas las personas Últimos doce meses (Entrevistas en Octubre [Oct 2010-Sept 2011], Entrevistas en Noviembre [Nov 2010-Oct 2011], Entrevistas en Diciembre [Dic 2010-Nov 2011]) a) Arriendo de propiedades agrícolas (tierras e instalaciones) b) Arriendo de propiedades por temporadas (urbanas o rurales) y17. En los últimos 12 meses, ¿consumió productos agropecuarios producidos o recolectados por el hogar? Por favor, estime el monto que hubiera tenido que pagar y18. En los últimos 12 meses, ¿recibió ingresos por..? o a) Intereses por depósitos b) Dividendos por acciones o bonos financieros c) Retiro de utilidades de empresas y16. En los últimos 12 meses, ¿recibió ingresos por…? a) Indemnización por despido o renuncia b) Donaciones de instituciones o personas ajenas al hogar c) Devolución de impuestos d) Otros ingresos od el y15. En los últimos 12 meses, ¿recibió ingresos por...? Anotar en el receptor 6 7 8 9 10 M y15.c Retiro utilidades y16.a Arriendo agrícola y16.b Arriendo temporada y17 Autoconsumos Monto($) Monto($) Monto($) Monto($) Monto($) Monto($) st ue C 5 Anotar en el receptor y15.b Dividendo 2 4 Anotar en el receptor y15.a Intereses 1 3 Para este tipo de ingreso: • Anote el monto anual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 rio Para cada tipo de ingreso: • Anote el monto anual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Para cada tipo de ingreso: • Anote el monto anual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 io na CASEN 2011 Ejemplos productos: carnes, lácteos, huevos y aves, productos de la huerta, leña, productos del mar, otros alimentos, etc. Para cada tipo de ingreso: • Anote el monto anual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Anotar en el receptor y18.a y18.b Despido Donación y18.c Devolución y18.d Otros ingresos Monto($) Monto($) Monto($) Monto($) 25 Subsidios o Transferencias del Estado A todas las personas Mes pasado Lea alternativas od el 1. Si 2. No 9. No sabe “Tramos SUBSIDIO FAMILIAR (SUF) a) Subsidio familiar al menor o recién nacido ($7.170) b) Subsidio de asistencia maternal ($71.700 por una sola vez, equivalente a 10 meses) c) Subsidio familiar a la madre ($7.170) 1.Tramo 1: $7.170. (sueldo bruto hasta $187.515) 2.Tramo 2: $5.054. (sueldo bruto entre $187.516 y $307.863) 3.Tramo 3: $1.600. (sueldo bruto entre $307.864 y $480.162) 4.No recibió SUBSIDIO FAMILIAR DUPLO d) Subsidio familiar por invalidez ($14.340) Anotar en el causante (a) – (e) M Mostrar Tarjeta y19 Asignación Familiar”. o y19. El mes pasado, ¿recibió y20. A continuación quisiera preguntarle por subsidios que puede haber recibido el mes paAsignación Familiar? Indique sado alguno de los miembros de este hogar. El mes pasado, ¿recibió alguien en este hogar? el tramo y el número de Mostrar Tarjeta y20 “Subsidios mes pasado”. Lea alternativas. Registre para cada tipo asignaciones que recibió. SUBSIDIO A LA DISCAPACIDAD MENTAL e) Subsidio a la discapacidad mental ($53.805) rio Anotar en el receptor (f) – (j) Recuerde contar 1 asignación para embarazadas, 2 para inválidos y 1 para el resto PENSIÓN BÁSICA SOLIDARIA (PBS) y19 Asignación Familiar Nº Asignaciones Subsidio Familiar (SUF) y20.a y20.b C ue st Tramo i) PBS de vejez ($78.449) j) PBS de invalidez ($78.449) io na Anotar en el receptor y20.c DiscaFamiliar pacidad Duplo Mental y20.d y20.e Subsidio de Cesantía y20.f y20.g y20.h CASEN 2011 SUBSIDIO DE CESANTÍA f) $17.338 por mes (1 a 90 días de cesantía) g) $11.560 por mes (91 a 180 días de cesantía) h) $8.669 por mes (181 a 360 días de cesantía) Pensión Básica Solidaria (PBS) y20.i y20.j 1 2 3 4 5 6 7 8 9 10 26 MÓDULO Y: Ingresos Subsidios o Transferencias del Estado A todas las personas Mes pasado 1.Sí participa 2.No, estaba participando pero ya egresó 3.No, estaba participando pero se retiró 4.No, fue invitada pero no aceptó 5.No, no ha sido invitada 6.No, otra razón 8 9 10 io na Para este tipo de ingreso: • Anote el monto declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Anotar en Jefe (a) de Núcleo Programa Chile Solidario Bonos de Protección Familiar y de Egreso y22.b st y22.a ue C 7 Para este tipo de ingreso: • Anote el monto declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 rio CASEN 2011 6 y23. El mes pasado, ¿su grupo familiar recibió ingresos por este nuevo subsidio llamado “Asignación Social”? Anotar en el receptor 2 5 1. Si 2. No 9. No sabe Anotar en Jefe (a) de Núcleo 1 4 Este subsidio consiste en entregar un pago mensual y otros pagos adicionales una vez al año, los cuales dependen del cumplimiento de compromisos familiares, como por ejemplo Control del Niño Sano, Escolaridad e Inserción Laboral de la Mujer. Solicitar ver liquidación de pago y21 3 mensuales, los 6 primeros meses b) Bono de protección familiar: $10.355 mensuales entre el mes 7 y el año c) Bono de protección familiar: $7.119 mensuales entre los meses 13 y 18 d) Bono de protección familiar: $7.170 mensuales entre los meses 19 y 24 e) Bono de egreso: $7.170 mensuales entre los meses 25 y 60 od el Lea alternativas M “Chile Solidario”. y24. El mes pasado, ¿recibió Subsidio de Agua Potable (SAP)? ¿Me puede indicar el monto? o y21. Su núcleo, ¿participa y22. El mes pasado, ¿recibió alguien A partir de este año, en Chile Solidario? en este hogar…? existe un nuevo subsidio llamado “Asignación a) Bono de protección familiar: $ 13.591 Mostrar Tarjeta y21 Social”. y22.c y22.d y22.e Anotar en Jefe(a) de Hogar y23 Asignación Social y24 SAP Monto($) Monto($) 27 Subsidios o transferencias del Estado Jubilaciones, Pensiones y Montepíos A todas las personas A todas las personas Últimos 12 meses ([Oct 2010-Sept 2011], [Nov 2010-Oct 2011], [Dic 2010-Nov 2011]) Mes pasado y25. En los últimos 12 meses, ¿recibió alguien en este hogar? “Subsidios últimos 12 meses”. a) Aporte Previsional Solidario (APS) de Vejez b) Aporte Previsional Solidario (APS) de Invalidez c) Pensión por leyes especiales de reparación (Exonerados políticos, Ley Valech, Ley Rettig, Pensión de gracia) o Mostrar Tarjeta y25 y26. El mes pasado, ¿recibió ingresos por…? Lea alternativas od el a) Bono Bodas de Oro ($125.000) b) Bono de Invierno ($44.265),(No confundir con bono de atención en salud) c) Subsidio Empleo Joven (entre 18 y 25 años) ¿Me puede indicar el monto? (Monto$) ¿Y con qué periodicidad recibió el Subsidio Empleo Joven? (P) Si el monto declarado aquí como pensión es $78.449 o similar, confirme que este monto no corresponda al mismo declarado como PBS de Vejez o Invalidez ($78.449) en la pregunta y20 1. Mensual 2. Anual M d) Otro Subsidio del Estado. Especifique rio io na Para cada tipo de ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Anotar en causante y25.b Bono de Invierno Monto($) Monto($) y25.c Empleo joven Monto($) C ue st y25.a Bono Bodas de Oro Anote en causante y25.d Otro P Monto($) Especifique y26.a APS Vejez y26.b APS Invalidez y26.c Leyes Reparación Monto($) Monto($) Monto($) CASEN 2011 Para cada tipo de ingreso: • Anote el monto anual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 1 2 3 4 5 6 7 8 9 10 28 MÓDULO Y: Ingresos Jubilaciones, Pensiones y Montepíos A todas las personas Mes pasado y27. El mes pasado, ¿recibió ingresos por...? “Jubilaciones, Pensiones y Montepíos”. Lea alternativas o Mostrar Tarjeta y27.1 od el a) Jubilación o Pensión de vejez bajo la modalidad de retiro programado b) Jubilación o Pensión de vejez bajo la modalidad de renta vitalicia c) Pensión de invalidez d) Montepío o pensión de viudez e) Pensión de orfandad f) Otro. Especifique ¿Me puede indicar el monto? (Monto$) Confirme que este monto no corresponda al mismo declarado como PBS de Vejez o Invalidez ($78.449) en la pregunta y20 Confirme que No incluye el monto APS declarado en pregunta y26 “Instituciones Pagadoras de Jubilaciones, Pensiones y Montepíos”. y27.a Monto($) y27.b Inst y27.c C ue 2 5 6 7 8 9 10 Monto($) Inst Pensión de invalidez Monto($) st 1 4 rio Para cada tipo de ingreso: • Anote el monto mensual declarado en pesos • Si no tuvo ingreso anote 0 • Si no sabe anote 999 Pensión de vejez o jubila- Pensión de vejez o jubilación bajo la modalidad de ción bajo la modalidad de retiro programado renta vitalicia 3 Lea alternativas 1.AFP, Administradora de Fondos de Pensiones 2.IPS, Instituto de Previsión Social (Ex INP, Instituto de Normalización Previsional) 3.Cajas de las Fuerzas Armadas (CAPREDENA o DIPRECA) 4.Mutual / Instituto de Seguridad Laboral (ISL) 5.Compañía de Seguros 6.Otra institución io na CASEN 2011 Mostrar Tarjeta y27.2 M Me puede indicar qué institución pagó estos beneficios? (Inst.) y27.d Montepío o pensión de viudez Inst Monto($) Inst y27.e y27.f Pensión de orfandad Monto($) Otro Inst Monto($) Inst Especifique 29 Inclusión Financiera Cuenta Bancaria Cuenta para la Vivienda io na Línea de crédito Chequera Tarjeta de crédito de casa comercial y0. ¿Quién (o quiénes) responde(n) el módulo Ingresos? 1. Sí 2. No 9. No sabe, no responde ue st y28.a y28.b y28.c y28.d y28.e y29.a y29.b1 y29.b2 y29.b3 y29.b4 y29.b5 y30.a y30.b y30.c y30.d y30.e C o a) Préstamos bancarios b) Créditos de cajas de compensación, cooperativas o instituciones de microcrédito c) Avance en efectivo de casas comerciales d) Préstamos de parientes o amigos e) Créditos de prestamistas o fiado Registre por observación 1.Contesta al menos una pregunta 2.Presente, pero no contesta 3.No está presente CASEN 2011 Tarjeta de crédito bancario od el b1) Ahorro en cuenta para la vivienda b2) Ahorro en cuenta bancaria (cta. de ahorro, depósito a plazo, cta. corriente, cta. vista o cuenta RUT) b3) Ahorro en Cuenta 2 AFP y/o en Ahorro Previsional Voluntario (APV) b4) Ahorro en efectivo b5) Ahorro en otros Lea alternativas Préstamos de parientes o amigos Mostrar Tarjeta y29 “Tipo de Ahorro” Lea alternativas “Tipo M y29.b. ¿Tiene Ud.?: 1. Sí 2. No Tarjeta de débito (Redbanc) Pasa a y30 Avance en efectivo de casas comerciales 1. Sí 2. No 9. No sabe, no responde Mostrar Tarjeta y30 de Préstamos” rio a) Tarjeta de débito (Redbanc) b) Tarjeta de crédito bancario (Visa, Mastercard, etc.) c) Tarjeta de crédito de casa comercial (Falabella, Ripley, Paris, Presto, etc.) d) Chequera e) Línea de crédito 1. Sí 2. No Pasa a y30 9. No sabe, no responde y30. En caso de necesitarlo, ¿cree Ud. que podría acceder a…? Créditos de cajas de compensación, cooperativas o instituciones de microcrédito Lea alternativas Ahorro en Otros “Tipo Ahorro en Efectivo Mostrar Tarjeta y28 de Instrumento” Mostrar Tarjeta y29 “Tipo de Ahorro” Lea alternativas Créditos de prestamistas o fiado y29.a. ¿Mantiene Ud. ahorros? Cuenta 2 AFP y/o APV y28. ¿Tiene Ud.?: Personas de 18 años o más presentes Préstamos bancarios Personas de 18 años o más y0 1 2 3 4 5 6 7 8 9 10 30 MÓDULO S: Salud Solicitar Carnet de Control del niño(a). En caso que no lo tenga registre lo que reporte el entrevistado Mostrar Tarjeta s2 niños”. Registre hasta 3 tipos de alimentos. Lea alternativas st C 5 ue 2 4 6 7 8 9 10 s2.a s2.b s2.c s4. ¿Cuál es su estado nutricional? Solicitar Carnet de Control del Adulto Mayor. En caso que no lo tenga registre lo que reporte el entrevistado 1.Bajo peso 2.Normal 3.Sobrepeso 4.Obeso 9. No sabe s5. ¿En los últimos 3 meses retiró alimentos del consultorio? Pasa a s3 io na Alternativas 1 a 6 1 3 1.Sí, leche Purita fortificada (26% MG) 2.Sí, leche cereal 3.Sí, Mi Sopita 4.Sí, fórmula de inicio para prematuros 5.Sí, fórmula de continuación para prematuros 6.Sí, sustituto lácteo libre de fenilalanina 7.No retiró alimento 9. No sabe / No recuerda Registrar el número de meses rio CASEN 2011 1.Desnutrido 2.En riesgo de desnutrición 3.Normal 4.Sobrepeso 5.Obeso 9. No sabe s1 “Alimentos s3. ¿Durante cuántos meses en el último año retiró este (estos) alimento(s) del consultorio? od el s2. ¿En los últimos tres meses recibió o retiró alimento del consultorio? M s1. ¿Cuál es el estado nutricional de [NIÑO/A]? Personas de 60 años o más o Personas de 0 a 6 años Mostrar Tarjeta S5 “Alimentos adulto mayor”. Lea alternativas 1.Sí, Bebida Láctea Años Dorados 2.Sí, Crema Años Dorados 3. Sí, ambos alimentos (Bebida Láctea y Crema Años Dorados) 4.No retiró alimento 9. No sabe / No recuerda Alternativas 1 a 3 Pasan a s6 s6. ¿Durante cuántos meses en el último año retiró este (estos) alimento(s) del consultorio? Registrar el número de meses s3 s4 s5 s6 31 Mujeres de 12 a 49 años A continuación le voy a hacer algunas preguntas relacionadas con fertilidad, maternidad y salud durante el embarazo y lactancia. Estas preguntas están dirigidas a todas las mujeres mayores de 12 años. Aunque algunas de estas preguntas no corresponden a la situación de las mujeres que componen su hogar, es necesario hacerlas debido a la importancia de tener información comparable entre todos los hogares del país. s9. ¿Se encuentra usted en este momento embarazada o amamantando? Pasan a s10 s10. ¿Cuál es su estado nutricional? s14. ¿Por qué no se lo ha hecho? Registre la principal razón Mostrar Tarjeta s11 Lea alternativas M s11. ¿En los últimos 3 meses retiró alimentos del consultorio? “Alimentos Embarazadas y Nodrizas”. 1. Sí, Leche Purita Fortificada (26% MG) 2. Sí, Leche Purita Mamá 3. Si, ambos alimentos 4. No retiró alimento 9. No sabe / No recuerda Alternativas 1, 2 y 3 pasan a s12 io na Registre el número de años Pasa a s14 s12. ¿Durante cuántos meses en el último año retiró este(s) alimento(s) del consultorio? 1.No sabe dónde hacérselo 2.Le da miedo o le disgusta 3.Se le olvida hacérselo 4.No cree que lo necesite 5.No conoce ese examen 6.No sabía que tenía que hacerse ese examen 7.El horario del consultorio no le sirve 8.No tiene tiempo 9.No ha podido conseguir hora 10.No tiene dinero 11.No le corresponde 12.Otra razón 99. No sabe CASEN 2011 s8. ¿Qué edad tenía usted cuando nació su primer hijo? 1.Sí, durante el último año 2.Sí, hace más de un año y hasta 2 años 3.Sí, hace más de 2 años y hasta 3 años 4.No 9. No sabe / No recuerda Alternativa 4 rio Registre 0 Si no ha tenido hijos Registre 99 Si No sabe Alternativas 0 y 99 pasan s9 Alternativas ≥ 1 pasan s8 s13. En los últimos tres años, ¿se ha hecho el Papanicolau? od el Solicitar Carnet de Control. En caso que no lo tenga registre lo que reporte el entrevistado 1.Bajo peso 2.Normal 3.Sobrepeso 4.Obesa 9. No sabe s7. ¿Cuántos hijos nacidos vivos ha tenido usted en su vida? Registre 99 No sabe 1.Sí, embarazada 2.Sí, amamantando 3.No Alternativas 1 a 2 Mujeres de 15 años o más o Mujeres de 12 años o más Registrar el número de meses s8 s9 C ue st s7 s10 s11 s12 s13 s14 1 2 3 4 5 6 7 8 9 10 MÓDULO S: Salud s15. En los últimos tres años, ¿se ha hecho una mamografía? s17. ¿A qué sistema previsional de salud pertenece usted? s16. ¿Por qué no se la ha hecho? 1.No sabe donde hacérsela 2.Le da miedo o le disgusta 3.Se le olvida hacérsela 4.No cree que la necesite 5.No conoce ese examen 6.No sabía que tenía que hacerse ese examen 7.El horario del consultorio no le sirve 8.No tiene tiempo 9.No ha podido conseguir hora 10.No tiene dinero 11.No le corresponde 12.Otra razón 99. No sabe s15 3 4 C 5 ue 2 6 7 8 9 10 1.Muy mal 2. 3. 4. 5. 6. 7.Muy Bien 9. No sabe a) Seguro de salud único o complementario ante riesgo de enfermedad o accidente b) Seguro de vida 1. Sí 2. No 9. No sabe/no recuerda s18.a s18.b Alternativas 5 y 9 Pasa a s25 s21. ¿Hace cuánto tuvo esa enfermedad o accidente? 1.Hace 1-7 días 2.Hace 8-30 días 3.Hace 31-90 días 1.Sí Pasa a s24 2.No 9. No sabe/no recuerda a s25 Anotar en la línea de la persona que contrató el seguro s17 4.Sí, accidente no laboral ni escolar 5.No tuvo ninguna enfermedad o accidente 9. No sabe / No recuerda s22. ¿Tuvo alguna consulta o atención médica por esa enfermedad o accidente? Anote en la línea de cada persona cubierta por el seguro st 1 s16 s18. ¿Se encuentra Ud. cubierto por alguno de los siguientes seguros de tipo privado…? io na CASEN 2011 Registre la principal razón 1.Sistema Público FONASA grupo A 2.Sistema Público FONASA grupo B 3.Sistema Público FONASA grupo C 4.Sistema Público FONASA grupo D 5.Sistema Público FONASA no sabe grupo 6.F.F.A.A. y del Orden 7.ISAPRE 8.Ninguno (particular) 9.Otro sistema 99. No sabe M Pasa a s16 Mostrar Tarjeta s17 “Sistema de Salud”. Lea alternativas s19. Ahora, en s20. En los últimos 3 meses, ¿tuvo algún problema de salud, una escala de 1 a 7, donde 1 co- enfermedad o accidente? rresponde a muy Registrar sólo lo más reciente mal y 7 a muy 1.Sí, enfermedad provocada por bien, ¿qué nota el trabajo le pondría a su 2.Sí, enfermedad no provocada estado de salud por el trabajo actual? 3.Sí, accidente laboral o escolar rio 1.Sí, durante el último año 2.Sí, hace más de un año y hasta 2 años 3.Sí, hace más de 2 años y hasta 3 años 4.No 9. No sabe / No recuerda Alternativa 4 Todas las personas o Mujeres de 35 años o más od el 32 s19 s20 s21 Pasa s22 33 Todas las personas Pasan a s25 io na ue st s23 C o Pasa a s25 s24.b ¿Accedió a los medicamentos que le recetaron ante esa enfermedad o accidente? 1.Sí, a todos 2.Sí, pero sólo a algunos Pasa a s25 3.No, a ninguno s24.c ¿Pagó por los medicamentos a los que accedió? 1.Sí, pagó por todos 2.Sí, pagó por algunos 3.No, recibió todos gratis 4.No, ya los tenía todos s24.a s24.b CASEN 2011 rio Todas 1.Sí 2.No Pasa a s25 9. No sabe / No recuerda M 1.No lo consideró necesario, así que no hizo nada 2.No lo consideró necesario y tomó remedios caseros 3.Decidió tomar sus medicamentos habituales 4.Prefirió consultar en una farmacia por medicamentos para su problema de salud 5.Prefirió consultar a un especialista en medicina alternativa (medicina vibracional, biomagnetismo, reiki, iriología, flores de bach, medicina oriental, etc.) 6.Prefirió buscar atención de medicina indígena fuera del consultorio o posta 7.Prefirió acudir a la medicina natural u homeopática 8.Pensó en consultar pero no tuvo tiempo 9.Pensó en consultar pero no tuvo dinero 10.Pensó en consultar pero le cuesta mucho llegar al lugar de atención 11.Pidió hora pero no la obtuvo 12.Consiguió hora pero todavía no le toca 13.Consiguió hora pero no la utilizó 99. No sabe s24.a En la consulta o atención médica que tuvo ante esa enfermedad o accidente, ¿le recetaron algún medicamento? od el s23. ¿Por qué no tuvo consulta ni atención? s24.c 1 2 3 4 5 6 7 8 9 10 34 MÓDULO S: Salud Todas las personas A continuación se le pedirá recordar las atenciones o consultas médicas que usted recibió en los últimos 3 meses ante un problema de salud, distinguiendo entre los siguientes tipos: Consulta Médica General, Consulta de Urgencia, Atención de Salud Mental, Consulta de Especialidad y Atención Dental. Por favor no considere en esta parte las visitas a centros de atención por exámenes médicos, controles de salud y hospitalizaciones o intervenciones quirúrgicas s25.b 3 4 C 5 6 7 8 9 10 o od el 1.Sí, total 2.Sí, parcial con copago FONASA grupos C y D (Modalidad Institucional) 3.Sí, parcial con bonos de FONASA (Modalidad Libre Elección) 4.Sí, parcial con bonos, reembolso o pago de deducible de ISAPRE 5.Sí, parcial por cobertura de seguro escolar 6.Sí, parcial por tratamiento dental en nivel secundario o terciario (sólo FONASA grupos B, C o D en Modalidad Institucional) 7.No, gratuito por pertenencia a FONASA grupos A o B o por ser beneficiario PRAIS 8.No, gratuito en consultorio estatal de nivel primario (sólo FONASA grupos C y D) 9.No, gratuito por cobertura AUGE-GES 10.No, gratuito por beneficio para el adulto mayor (sólo FONASA grupos C y D Modalidad Institucional) 11.No, gratuito por Ley de accidentes del trabajo y enfermedades profesionales (Mutual /ISL) 12.No, gratuito por cobertura total de seguro escolar 13.No, gratuito por cobertura 100% ISAPRE 14.No, gratuito por Programa de Salud Escolar de JUNAEB 15.No, gratuito por servicio entregado por un familiar o conocido 16.Otra forma 99. No sabe/no recuerda s25.c s26 Ahora le voy a preguntar sobre Consultas de Urgencia s27 Ahora le voy a preguntar por Consultas de Salud Mental s28 Ahora le voy a preguntar por Consulta de Especialidad s26.a s27.a s28.a ue 2 “Formas de Pago” Lea alternativas. Registre la forma de pago principal M 1.Consultorio General (Municipal o SNSS) 2.Posta Rural (Municipal o SNSS) 3.CRS o CDT (Consultorio de especialidades del SNSS) 4.COSAM (Centro de salud mental comunitaria) 5.SAPU (Servicio de Atención Primaria de Urgencia) 6.Posta (servicio de urgencia de hospital público) 7.Hospital público o del SNSS 8.Consulta, centro médico, clínica u hospital privado 9.Centro de salud mental privado 10.Establecimiento de las F.F.A.A. o del Orden 11.Servicio de urgencia de clínica privada 12.Mutual de Seguridad 13.Servicio médico de alumnos del lugar en que estudia 14.Otro 99. No sabe / No recuerda s26.b st 1 Mostrar Tarjeta s25C Mostrar Tarjeta s25B “Establecimientos de Salud” Lea alternativas s25 Ahora le voy a preguntar por Consulta Médica General s25.a (c) ¿Tuvo que hacer algún pago por la última atención? rio Si s25a = 0 Pasa a s26a Si s26a = 0 Pasa a s27a Si s27a = 0 Pasa a s28a Si s28a = 0 Pasa a s29a Si s29a = 0 Pasa a s30a (b) ¿En qué establecimiento recibió la última atención? io na CASEN 2011 (a) ¿Cuántas consultas o atenciones recibió Ud. en los últimos 3 meses? s26.c s27.b s27.c s28.b s28.c s29 Ahora le voy a preguntar por Consultas Dentales s29.a s29.b s29.c 35 Todas las personas A continuación se le pedirá recordar los exámenes médicos que usted se realizó en los últimos 3 meses, distinguiendo entre los siguientes tipos: Exámenes de Laboratorio y Exámenes de Rayos X o Radiografías. Por favor no considere en esta parte ningún otro tipo de examen distinto a los dos anteriores. (b) ¿En qué es(c)¿En qué establecimiento (d) ¿Tuvo que hacer algún pago por la el últile pidieron que se realizara mo examen? tablecimiento le Mostrar Tarjeta s25C “Formas de Pago” realizaron su último su último examen? Lea alternativas. Registre la forma de pago principal Mostrar Tarjeta s25B “Estaexamen? o (a) ¿Cuántos exámenes se realizó Ud. en los últimos 3 meses? Mostrar Tarjeta s25B blecimientos de Salud” de clínica privada 12. Mutual de Seguridad 14. Otro 99. No sabe / No recuerda privada 12. Mutual de Seguridad 13. Servicio médico de alumnos del lugar en que estudia 14. Otro 99. No sabe / No recuerda io na s30 Ahora le voy a preguntar por Exámenes de Laboratorio s30.b s30.c C ue st s30.a s30.d 13. No, gratuito por cobertura 100% ISAPRE 14. No, gratuito por Programa de Salud Escolar de JUNAEB 15. No, gratuito por servicio entregado por un familiar o conocido 16. Otra forma 99. No sabe/no recuerda CASEN 2011 Si s30a = 0 Pasa a s31a Si s31a = 0 Pasa a s32a rio M od el 1. Sí, total Considere como Lea alternativas “Establecimientos de 2. Sí, parcial con copago FONASA grupos C y D (Modalidad 1 examen de Salud” Institucional) 1. Consultorio general (Municipal laboratorio a cada 3. Sí, parcial con bonos de FONASA (Modalidad Libre Lea alternativas o SNSS) extracción de Elección) 2. Posta rural (Municipal o SNSS) muestra (orina, 1. Consultorio general 4. Sí, parcial con bonos, reembolso o pago de deducible 3. CRS o CDT (Consultorio de sangre, otros) que (Municipal o SNSS) de ISAPRE especialidades del SNSS) la persona se reali3. CRS o CDT (Consulto5. Sí, parcial por cobertura de seguro escolar 4. COSAM (Centro de salud mental zó por cada visita a rio de especialidades 6. Sí, parcial por tratamiento dental en nivel secundario comunitaria) un centro de salud del SNSS) o terciario (sólo FONASA grupos B, C o D en Modalidad 5. SAPU (Servicio de Atención 6. Posta (servicio de • Considere como 1 Institucional) Primaria de Urgencia) urgencia de hospital examen de rayos X 7. No, gratuito por pertenencia a FONASA grupos A o B o 6. Posta (Servicio de urgencia de público) por ser beneficiario PRAIS a cada procedihospital público) 7. Hospital público o del 8. No, gratuito en consultorio estatal de nivel primario miento de imagen 7. Hospital público o del SNSS SNSS (sólo FONASA grupos C y D) (radiografía, ecoto8. Consulta, centro médico, clínica 8. Consulta, centro mé9. No, gratuito por cobertura AUGE-GES mografía, scanner, u hospital privado dico, clínica u hospital otros) que la 9. Centro de salud mental privado 10. No, gratuito por beneficio para el adulto mayor (sólo privado FONASA grupos C y D Modalidad Institucional) 10. Establecimiento de las F.F.A.A. o persona se realizó 10. Establecimiento de las 11. No, gratuito por Ley de accidentes del trabajo y enferdel Orden por cada visita a un F.F.A.A. o del Orden medades profesionales (Mutual /ISL) 11. Servicio de urgencia de clínica centro de salud 11. Servicio de urgencia 12. No, gratuito por cobertura total de seguro escolar s31 Ahora le voy a preguntar por Rayos X o Ecografías s31.a s31.b s31.c s31.d 1 2 3 4 5 6 7 8 9 10 36 MÓDULO S: Salud Todas las personas A continuación se le pedirá recordar los controles médicos a los que usted asistió en los últimos tres meses. Por favor no considere en esta parte las visitas al médico por exámenes de salud ni las atenciones o consultas de salud ya reportadas anteriormente Pasa a s33a Lea alternativas s32.d. ¿Tuvo que hacer algún pago por el último control? M Mostrar Tarjeta s25C “Forma de Pago” Lea alternativas. Registre la forma de pago principal 1. Sí, total 2. Sí, parcial con copago FONASA grupos C y D (Modalidad Institucional) 3. Sí, parcial con bonos de FONASA (Modalidad Libre Elección) 4. Sí, parcial con bonos, reembolso o pago de deducible de ISAPRE 5. Sí, parcial por cobertura de seguro escolar 6. Sí, parcial por tratamiento dental en nivel secundario o terciario (sólo FONASA grupos B, C o D en Modalidad Institucional) 7. No, gratuito por pertenencia a FONASA grupos A o B o por ser beneficiario PRAIS 8. No, gratuito en consultorio estatal de nivel primario (sólo FONASA grupos C y D) 9. No, gratuito por cobertura AUGE-GES 10. No, gratuito por beneficio para el adulto mayor (sólo FONASA grupos C y D Modalidad Institucional) 11. No, gratuito por Ley de accidentes del trabajo y enfermedades profesionales (Mutual /ISL) 12. No, gratuito por cobertura total de seguro escolar 13. No, gratuito por cobertura 100% ISAPRE 14. No, gratuito por Programa de Salud Escolar de JUNAEB 15. No, gratuito por servicio entregado por un familiar o conocido 16. Otra forma 99. No sabe/no recuerda rio 1.Control del niño sano 2.Control de embarazo 3.Control de enfermedades crónicas 4.Control ginecológico 5.Control preventivo del adulto o adulto mayor 6.Control del adolescente 7.Control dental 8.Otro control 9.No sabe/No recuerda io na CASEN 2011 s32.b. ¿Qué tipo de control fue el último que se realizó? Mostrar Tarjeta s25B “Establecimientos de Salud” 1. Consultorio General (Municipal o SNSS) 2. Posta Rural (Municipal o SNSS) 3. CRS o CDT (Consultorio de especialidades del SNSS) 4. COSAM (Centro de salud mental comunitaria) 5. SAPU (Servicio de Atención Primaria de Urgencia) 8. Consulta, centro médico, clínica u hospital privado 9. Centro de salud mental privado 10. Establecimiento de las F.F.A.A. o del Orden 12. Mutual de Seguridad 14. Otro 99. No sabe / No recuerda o Si s32a = 0 s32.c. ¿En qué establecimiento se realizó el último control? od el s32.a. ¿Cuántos controles de salud se realizó usted en los últimos 3 meses? s32 Controles de Salud s32.a st 1 3 4 C 5 ue 2 6 7 8 9 10 s32.b s32.c s32.d 37 Todas las personas Finalmente le voy a preguntar por Hospitalizaciones e Intervenciones Quirúrgicas s33.b. ¿Cuántos días estuvo hospitalizado por ese problema o condición de salud? Para intervención quirúrgica ambulatoria registre 1 día. Si no sabe o no recuerda registre 999 o 1.Sí, total 2.Sí, parcial con copago FONASA grupos C y D (Modalidad Institucional) 3.Sí, parcial a través de programa médico o bonos de FONASA (Modalidad Libre Elección) 4.Sí, parcial a través de bono PAD Parto (sólo FONASA grupos B, C o D) 5.Sí, parcial a través de PAD por enfermedad que requiere hospitalización (sólo FONASA grupos B, C o D) 6.Sí, parcial a través de programa médico, bonos o pago de deducible de ISAPRE 7.Sí, parcial por cobertura de seguro escolar 8.No, gratuito por pertenencia a FONASA grupos A o B o por ser beneficiario PRAIS 9.No, gratuito por cobertura AUGE-GES 10.No, gratuito por beneficio para el adulto mayor (sólo FONASA grupos C y D Modalidad Institucional) 11.No, gratuito por Ley de accidentes del trabajo y enfermedades profesionales (Mutual /ISL) 12.No, gratuito por cobertura total de seguro escolar 13.No, gratuito por cobertura 100% ISAPRE 14.Otra forma 99. No sabe/no recuerda rio Mostrar Tarjeta s33C “Formas de Pago Nivel Terciario” Lea alternativas. Registre la forma de pago principal “Establecimientos de Salud Nivel terciario” Lea alternativas io na 1.Hospital público o del SNSS 2.Clínica u hospital privado 3.Clínica o centro hospitalario de las FF.AA o del Orden 4.Clínica o centro hospitalario de una Mutual de Seguridad 5.Otro 9. No sabe/No recuerda CASEN 2011 s33.c. ¿En qué establecimiento se hospitalizó o se realizó la intervención quirúrgica por ese problema o condición de salud? Mostrar Tarjeta s33D od el 1.Sí, por enfermedad que requirió intervención quirúrgica 2.Sí, por enfermedad que sólo requirió tratamiento médico 3.Sí, por embarazo 4.Sí, por parto normal o inducido 5.Sí, por cesárea 6.Sí, por accidente que requirió intervención quirúrgica 7.Sí, por accidente que sólo requirió tratamiento médico 8.No Pasa a s34 9.No sabe/no recuerda Pasa a s34 s33.d. ¿Tuvo que hacer algún pago por la hospitalización (o intervención quirúrgica)? M s33.a. En los últimos 12 meses, ¿ha estado hospitalizado o se ha realizado alguna intervención quirúrgica? s33 Hospitalizaciones e Intervenciones Quirúrgicas s33.b C ue st s33.a s33.c s33.d 1 2 3 4 5 6 7 8 9 10 38 MÓDULO S: Salud Todas las personas s34. Durante los últimos 12 meses, ¿ha estado en tratamiento médico por...? Mostrar Tarjeta s34 “Condiciones de salud” Lea alternativas. Registre la más importante s35. Este tratamiento médico, ¿fue cubierto por el sistema AUGE-GES? 1.Sí 2.No 9.No sabe/no recuerda s37. ¿Tiene Ud. alguna de las siguientes condiciones permanentes y/o de larga duración? rio s34 st 1 4 C 5 ue 2 3 6 7 8 9 10 io na CASEN 2011 M od el o Registre hasta 3 condiciones 1.Hipertensión arterial 1.Dificultad física y/o de movilidad 2.Infección respiratoria aguda Alternativas 1 y 9 pasan s37 2.Mudez o dificultad en el habla 3.Urgencia odontológica 3.Dificultad psiquiátrica 4.Diabetes s36. ¿Por qué este tratamiento médico 5.Depresión 4.Dificultad mental o intelectual 6.Vicio de refracción (Miopía, hipermetropía, no fue cubierto por el sistema AUGE5.Sordera o dificultad para oír aún GES? astigmatismo) usando audífonos 7.Salud oral Integral 6.Ceguera o dificultad para ver aún 1.Prefirió elegir otro médico o estable8.Infarto agudo al miocardio usando lentes cimiento, o seguir con su médico de 9.Cataratas siempre 7.No tiene ninguna condición de 10.Órtesis o ayudas técnicas 2.Decidió no esperar para acceder a la conlarga duración 11.Neumonía sulta a través del AUGE o GES, para solu12.Enfermedad pulmonar obstructiva crónica cionar su problema con mayor rapidez Alternativas 1 a 6 Pasa a s38 13.Leucemia 3.Pensó que la atención AUGE podría ser de 14.Asma bronquial moderada o grave baja calidad s38. ¿El origen de esta condición 15.Cáncer gástrico 4.Su plan de salud cubría su necesidad 16.Cáncer cervico uterino es…? 17.Cáncer de mama mejor que el AUGE o GES 18.Cáncer de testículo 5.El trámite para acceder al AUGE o GES es Registre el origen para cada una de 19.Cáncer de próstata muy difícil las condiciones declaradas en s37 20.Colecistectomía preventiva 6.El AUGE o GES no cubría las necesidades 21.Insuficiencia renal crónica Terminal 1.De nacimiento (congénito) de la enfermedad 22.Accidente cerebral isquémico 2.Producida durante el parto 7.No sabía que su enfermedad estaba 23.Pérdida de audición (hipoacusia) bilateral 3.Por enfermedad cubierta por el AUGE con necesidad de audífono 8.No pertenezco al tramo de edad que está 4.Por accidente 24.Otra condición de salud cubierto por el AUGE 5.Otra 25.No ha estado en tratamiento por ninguna 9.Su médico le recomendó no atenderse de las condiciones de salud anteriores por el AUGE 99. No sabe/no recuerda 10.Otra razón Alternativas 24, 25, 99 pasa a s37 s37 Condición s38 Origen s35 s36 1a 2a 3a 1a 2a 3a 39 Personas de 6 años o más con déficits (s37 = 1 a 6) y Personas de 60 años o más a) Bañarse, lavarse los dientes, peinarse y comer solo(a)? b) Moverse/desplazarse solo(a) dentro de la casa? c) Controlar completamente su esfínter? d) Realizar sus tareas del hogar? 1. Sí 2. No a) Salir solo a la calle sin ayuda o compañía? b) Hacer compras o ir al médico solo sin ayuda o compañía? 1. Sí 2. No a) Concentrarse y recordar cosas? b) Aprender nuevas tareas? c) Establecer y mantener relaciones personales y familiares? d) Relacionarse con personas que no conoce? e) Desempeñarse en sus estudios u oficios/actividad productiva? f) Participar de alguna actividad recreativa y/o de participación social de acuerdo a su edad? g) Desplazarse o moverse debido a obstáculos físicos del entorno? rio io na s39 Registre por observación 1.Contesta al menos una pregunta 2.Presente, pero no contesta 3.No está presente s40 ue st s39.a s39.b s39.c s39.d s40.a s40.b s40.c s40.d s40.e s40.f s40.g C s0. ¿Quién (o quiénes) responde(n) el módulo Salud? s41.a s41.b CASEN 2011 1. Sí 2. No 9. No Sabe/No Responde M s40. ¿Tiene dificultades para: o s41. ¿Tiene dificultades para: od el s39. ¿Tiene dificultades para: s0 1 2 3 4 5 6 7 8 9 10 40 MÓDULO R: Residentes r1.a. Cuando usted nació, ¿en qué comuna o país vivía su madre? Personas de 5 años o más Jefes de núcleo y cónyuge r2. ¿En qué comuna o país vivía hace 5 años (2006)? r3. Durante sus primeros 15 años de vida, ¿vivió la mayor parte del tiempo con alguno de sus padres? 1. En esta comuna 2. En otra comuna. Especifique ¿cuál comuna? 3. En otro país. Especifique ¿cuál país? pasa r1.b 9. No sabe 1.En esta comuna 2.En otra comuna. Especifique ¿cuál comuna? 3.En otro país. Especifique ¿cuál país? 9. No sabe Lea las alternativas od el r1.b. ¿En qué año llegó usted al país? o Todas las personas 1.Sólo su padre 2.Sólo su madre 3.Ambos padres 4.Su padre con pareja 5.Su madre con pareja 6.Ninguno de sus padres r1 4 C 5 ue 2 3 6 7 8 9 10 r1.a Especifique st 1 io na rio CASEN 2011 M Registre al menos una fecha aproximada r1.b Año r2 r2 Especifique r3 41 Jefes de núcleo y cónyuge Todas las personas Personas de 12 años o más r4.a. ¿Cuál fue el nivel de educación más alto alcanzado por su madre (o figura materna)? r6. En Chile, la ley reconoce nueve pueblos indígenas, ¿pertenece usted o es descendiente de alguno de ellos? r4.b. ¿Cuál fue el nivel de educación más alto Lea alternativas alcanzado por su padre (o figura paterna)? 1.Aymara Lea alternativas 2.Rapa-Nui (Pascuenses) r4 Nivel Educacional b. Padre r5 Curso a. Madre b. Padre C ue st a. Madre M od el o 1.Juntas de vecinos u otra organización territorial (comité de aguas, comité de allegados, otros) 3.Quechua 2.Club deportivo o recreativo 4.Mapuche 3.Organización religiosa o de iglesia 5.Atacameño (Linkán Antai) 4.Agrupaciones artísticas (grupo folclórico, 6.Coya de teatro, de música, de baile, de danza, 7.Kawésqar (Alacalufes) otros) 8.Yagán (Yámana) 5. Grupos de identidad cultural (asociaciones 9.Diaguita indígenas, círculos de inmigrantes, otros) 10.No pertenece a ningún pueblo 6.Agrupaciones juveniles o de estudiantes Pasa a r9 indígena 7.Agrupaciones de mujeres (centros de madres, talleres de mujeres, grupos de apoyo r7. ¿Habla o entiende algunas en problemáticas femeninas, otros) de las siguientes lenguas: Ayma- 8.Agrupaciones de adulto mayor (club de ra, Rapa-Nui, Quechua, Mapuadulto mayor, asistentes de centros de dungun, Kewesqar o Yagán? día, otros) 9.Grupos de voluntariado (damas de colo1.Habla y entiende res, cruz roja, voluntarios en institucio2.Sólo entiende nes de caridad, otros) 3.No habla ni entiende Pasa a r9 10. Grupos de autoayuda en salud (de diabéticos, hipertensos, obesos, alcohólicos anór8. ¿Cuál? nimos, personas con discapacidad, grupos 1.Aymara asociados a otros problemas de salud) 2.Rapa-Nui 11.Agrupación ideológica o corporativa 3.Quechua (partido político, sindicato, asociación 4.Mapudungun gremial, colegio profesional, otros) 5.Kawésqar 12.No participa en ninguna organización o 6.Yagán grupo io na r5.b. En ese nivel educacional, ¿cuál fue el último curso que aprobó su padre (o figura paterna)? importante r6 r7 r8 CASEN 2011 r5.a. En ese nivel educacional, ¿cuál fue el último curso que aprobó su madre (o figura materna)? Mostrar Tarjeta r9 “Organizaciones Sociales” Lea alternativas. Registre la más rio 1. Nunca asistió 5. Primaria o Preparatoria (sistema antiguo) 6. Educación Básica 7. Humanidades (sistema antiguo) 8. Educación Media Científico-Humanista 9. Técnica Comercial, Industrial o Normalista (sistema antiguo) 10. Educación Media Técnica Profesional 11. Técnico Nivel Superior 12. Profesional 13. Postgrado 99. No sabe r9. ¿Participa actualmente en alguna organización o grupo organizado? r9 1 2 3 4 5 6 7 8 9 10 42 MÓDULO R: Residentes Jefes de Núcleo r11.a. Su núcleo, ¿cuántos vehículos de uso laboral tiene en uso y en funcionamiento? r11.b. Su núcleo, ¿cuántos vehículos de uso particular tiene en uso y en funcionamiento? st C 5 6 7 8 9 10 o rio Computador Banda ancha fija contratada Banda ancha fija prepago Banda ancha móvil contratado Banda ancha móvil prepago Teléfono móvil con internet (Smartphone) r12 r13.a r13.b r13.c r13.d r13.e r13.f r14.a r14.b r14.c r14.d r14.e Teléfono fijo Seguro automotriz r11.b Calefont Vehículo Particular r11.a Lavadora Vehículo Laboral r10 ue 4 io na 1. Sí 2. No 2 3 Sí tiene conexión Pasa r16 Sí no tiene conexión Pasa r15 r12. Aparte del seguro automotriz obligatorio, ¿tiene contratado otro seguro para su(s) vehículo(s) de uso particular? 1 1 Sí 2 No Pasa r13 Dueño de vehículo CASEN 2011 Sí tiene “0” vehículo particular 1. Sí 2. No a) Banda ancha fija contratada b) Banda ancha fija prepago c) Banda ancha móvil (modem, USB), contratado d) Banda ancha móvil (modem, USB), prepago e) Teléfono móvil con internet (Smartphone) r15. ¿Por qué no tiene conexión a Internet en su vivienda? 1.Por seguridad para evitar acoso a los niños 2.Por privacidad para evitar uso de información personal 3.Ningún miembro del hogar sabría utilizarla 4.No existe servicio donde vive 5.No le interesa 6.Es demasiado caro 7.Porque accede gratis a través de WIFI u otro sistema od el Anote “0” cuando no tenga ningún vehículo en uso o en funcionamiento a) Lavadora automática b) Refrigerador c) Calefont (caldera eléctrica, calefactor solar, calefont a gas) d) Teléfono fijo e) Televisión pagada (TV cable/ TV satelital/digital) f) Computador (PC, netbook, laptop) r14. ¿Tiene acceso a algún tipo de conexión pagada a Internet en la vivienda, como…? M Pasa r13 refrigerador 1. Sí 2. No r13. Su núcleo, ¿tiene en uso y en funcionamiento…? Cable r10. ¿Algún miembro de su núcleo es dueño de algún vehículo de uso laboral o particular, en uso y funcionamiento? Jefes de Hogar r15 43 a) Obtener información b) Comunicación escrita c) Comunicación por voz d) Entretenimiento e) Comercio electrónico f) Operaciones de banca electrónica g) Actividades de educación formal y capacitación h) Trámites en línea con instituciones públicas 1. Si 2. No Lea alternativas ue C rio Trámites en línea con instituciones públicas Actividades de educación formal y capacitación Operaciones de banca electrónica Comercio electrónico Entretenimiento io na Comunicación por voz Comunicación escrita Obtener información r18.a r18.b r18.c r18.d r18.e r18.f r18.g r18.h st r17 r19 1.Completamente insatisfecho 2. 3. 4. 5. 6. 7. 8. 9. 10.Completamente satisfecho r20 r0. ¿Quién (o quiénes) responde(n) el módulo Residentes? registre por observación 1.Contesta al menos una pregunta 2.Presente, pero no contesta 3.No está presente CASEN 2011 r16 Por favor, use esta tarjeta donde 1 significa que usted está “completamente insatisfecho” y 10 significa que usted está “completamente satisfecho”. ¿Dónde se ubica usted? Mostrar Tarjeta r20 “Satisfacción con la vida en general” r17. ¿Con qué frecuencia usa Internet? 1.Al menos una vez al día 2.Al menos una vez a la semana 3.Al menos una vez al mes 4.Menos de una vez al mes 1. Si, prepago 2. Si, contrato 3. No r20. Considerando todas las cosas, ¿cuán satisfecho está usted con su vida en este momento? M 1.En el hogar 2.En el trabajo 3.En el establecimiento educacional 4.En un telecentro comunitario o infocentro (servicio gratuito) 5.En lugares pagados (cybercafé, centro de llamados, etc.) 6.Otro 7.No lo usa Pasa a r19 r19. ¿Tiene Ud. teléfono móvil en funcionamiento y en uso? od el r16. ¿Dónde utiliza r18. ¿Usó Internet en los últimos 12 más frecuentemente meses para…? Internet? Personas de 15 años o más “Presentes” o Personas de 5 años o más r0 1 2 3 4 5 6 7 8 9 10 44 MÓDULO V: Vivienda 1. Frente (ancho): Mts 2. Fondo (largo): Mts v3. Su hogar, ¿bajo qué situación ocupa el sitio? C ue st 1.Propio pagado 2.Propio pagándose 3.Propio compartido (pagado) con otras viviendas del sitio 4.Propio compartido (pagándose) con otras viviendas del sitio 5.Arrendado con contrato 6.Arrendado sin contrato 7.Cedido por servicio o trabajo 8.Cedido por familiar u otro 9.Usufructo (sólo uso y goce) 10.Ocupación irregular (de hecho) 11.Poseedor irregular 12.Otro 1.Propio pagado 2.Propio pagándose 3.Propio compartido (pagado) con otros hogares de la vivienda 4.Propio compartido (pagándose) con otros hogares de la vivienda 5.Arrendada con contrato 6.Arrendada sin contrato 7.Cedida por servicio o trabajo 8.Cedida por familiar u otro 9. Usufructo (sólo uso y goce) 10.Ocupación irregular (de hecho) 11.Poseedor irregular 12.Otro v4. ¿Es alguien en su hogar, el dueño o el responsable principal del sitio en el que se ubica esta vivienda? 1.Sí, alguien en el hogar es dueño del sitio 2.Sí, alguien en el hogar es el responsable principal del arriendo del sitio 3.Sí, alguien en el hogar, es el responsable principal debido a la cesión o usufructo, ante el dueño del sitio 4.No v7. ¿Algún miembro de este hogar es dueño de esta vivienda? 1. Sí 2. No 1.Sí, con subsidio habitacional 2.No, sólo con recursos propios 3.No, la recibió de herencia o traspaso gratuito Pasa a v16 v11. ¿Compró la vivienda con crédito hipotecario? od el v6. Su hogar, ¿bajo qué situación ocupa la vivienda? M 1. Hasta 100 m2 2. De 101 a 200 m2 3. De 201 a 300 m2 4. De 301 a 500 m2 5. Más de 500 m2 9. No sabe Estimar metros del frente (ancho) y fondo (largo) del sitio Mts io na CASEN 2011 Considere el área total del sitio donde está ubicada la vivienda. Si la vivienda es un condominio horizontal, asigne la superficie correspondiente al sitio que tiene asignada la vivienda, no incluya los espacios comunes del condominio (como plazas, gimnasio, piscina, club house) 1. Menos de 30 m2 2. De 30 a 40 m2 3. De 41 a 60 m2 4. De 61 a 100 m2 5 De 101 a 150 m2 6. Más de 150 m2 9. No sabe Estimar metros totales de la vivienda Pasa a v15 v2. ¿Cuántos metros cuadrados tiene el sitio? No incluya: terrazas abiertas ni jardines, tampoco sótanos, desvanes, trasteros que no sean habitables Pasa a v16 Cero viviendas Pasa a v3 Marque “cero viviendas” en caso de departamento, conventillo u otra forma de propiedad compartida del terreno v10. ¿Compró la vivienda con ayuda de algún programa habitacional o subsidio del estado? o v5. ¿Cuántos metros cuadrados tiene la vivienda? rio v1. ¿Cuántas viviendas hay en el sitio? Pasa a v16 v8. ¿Qué miembro del hogar es el propietario de esta vivienda? 1.Jefe de hogar 2.Cónyuge 3.Conviviente o pareja 4.Hijo(a) 5.Otro pariente 6.Otro no pariente 7.Jefe y cónyuge 8.Jefe y otro pariente v9. ¿En qué año compró o recibió la vivienda o el subsidio? Año Mostrar Tarjeta v11 “Institución Hipotecario” Lea alternativas 1.Sí, SERVIU 2.Sí, Banco Estado 3.Sí, banco privado o financiera 4.Sí, compañía de seguros 5.Sí, caja de compensación 6.Sí, cooperativas 7.Sí, otra institución 8.No, sin crédito hipotecario Pasa a v16 v12. ¿Está pagando su crédito hipotecario actualmente? 1.Sí, está pagando al día sus dividendos 2. Sí, está pagando con atraso sus dividendos 3.No está pagando, aunque tiene deuda pendiente 4.No está pagando, terminó de pagar Pasa a v16 v13. ¿Cuánto paga (o debería pagar) de dividendo? Monto Dividendo $ v14. ¿Cuántos años le Número de años faltan para terminar de pagar su crédito hipotecario? Pasa a v16 v15. Su hogar, ¿cuánto paga de arriendo? $ v16. ¿Tiene alguno de los siguientes seguros asociados a su vivienda y/o a los bienes muebles que se encuentren en ella, ya sea a través de crédito hipotecario o contratado de manera personal? Registre para cada tipo a. Seguro de incendio 1 Sí 2 No 9 No sabe b. Seguro de terremotos c. Seguro contra robos v19. ¿Cuánto fue el gasto $ en consumo de agua potable de su hogar el último mes? Debe solicitar la cuenta de agua potable y registre el monto asociado al último mes. Si no sabe anote 999 Si no paga por consumo, marque razón: Incluido en el arriendo o cuota de condominio Lo paga otro hogar en la vivienda v21. La vivienda donde usted vive, ¿dispone de sistema de eliminación de excretas? Registre sólo la mejora/transformación más importante 1.Sí, reparaciones de muros, techo o piso 2.Sí, urbanización del sitio, conexión a servicios domiciliarios (agua potable, alcantarillado, energía eléctrica) 3.Sí, tabiques interiores, forro interior 4.Si, ampliaciones en la vivienda o construcción de piezas 5.No, no ha hecho nada Pasa a v26 v25. ¿Cómo financió esa mejora o transformación? Refiérase sólo a la mejora/transformación más importante 1.Recursos propios (autoconstrucción, ahorro) 2.Crédito con instituciones financieras 3.Subsidio estatal 4.Otro v26. ¿Cuántas piezas de cada tipo tiene la vivienda? Registre el número de piezas de cada tipo en la vivienda ue st 1.Sí, con W.C. conectado al alcantarillado 2.Sí, con W.C. conectado a fosa séptica 3.Sí, con letrina sanitaria conectada a pozo negro 4.Sí, con cajón sobre pozo negro 5.Sí, con cajón sobre acequia o canal 6.Sí, con cajón conectado a otro sistema 7.Sí, baño químico dentro del sitio 8.No dispone de sistema C v22. La vivienda donde usted vive, ¿dispone de energía eléctrica? 1. S í, de la red pública con medidor propio 2.Sí, de la red pública con medidor compartido 3.Sí, de la red pública sin medidor 4. Sí, de un generador propio o comunitario 5.Sí, a través de placa solar 6.Sí, de otra fuente. Especifique: 7.No dispone de energía eléctrica Alternativas 3 a 7 Pasan a v24 Estar-comer Cocina Incluido en el arriendo o cuota de condominio Lo paga otro hogar en la vivienda io na 1.Con llave dentro de la vivienda 2.Con llave dentro del sitio, pero fuera de la vivienda 3.No tiene sistema, la acarrea Dormitorios (uso exclusivo para dormir) o Baño Otras piezas de uso múltiple v28. ¿Cuál es la principal razón para compartir esta vivienda con otro hogar? 1.Cuidar niños, enfermos, ancianos o personas con discapacidad 2.Razones económicas 3.Razones de estudio 4.Razones laborales 5.Por emergencia 6.Prefiere vivir así o se siente cómodo 7.Costumbre o tradición familiar 8.Otra, Especifique: Dormitorios (uso exclusivo para dormir) Estar-comer Cocina Baño Otras piezas de uso múltiple Verifique el número de hogares registrados en el Módulo de Registro Ch4. Número de hogares en la vivienda. Asigne código según corresponda 1.Si hay 1 solo hogar Pase a v31 2.Si hay 2 o más hogares Pase a v27 v29. ¿Está haciendo algo para vivir en una vivienda exclusiva para su hogar? 1.Sí, está postulando o postuló a un subsidio 2.Sí, está participando en un comité, inscrito en la municipalidad o entidad de gestión (EGIS) 3.Sí, está ahorrando o solicitó crédito para comprar una vivienda 4.Sí, está buscando una vivienda para arrendar 5.Sí, otra cosa 6.No, no está haciendo nada v30. ¿Es alguien en este hogar el dueño, responsable del arriendo o cesión o usufructo? o ¿el responsable es algún miembro de otro hogar de esta vivienda? 1. Alguien en este hogar 2. Alguien en otro hogar v31. ¿Algún miembro de este hogar es propietario de otra vivienda? 1.Sí, jefe de hogar o pareja 2.Sí, hijo/a 3.Sí, otra persona del hogar 4.No, nadie es propietario de otra vivienda CASEN 2011 v20. ¿Cuál es el sistema de distribución del agua en la vivienda? Registre el número de piezas de cada tipo que ocupa su hogar Si no paga por consumo, marque razón: v24. Durante los últimos dos años (2009-2011), ¿ha realizado mejoras o transformaciones en la vivienda? 45 od el 1.Red pública con medidor propio 2.Red pública con medidor compartido 3.Red pública sin medidor 4.Pozo o noria 5.Río, vertiente, lago o estero 6.Camión aljibe 7.Otra fuente. ¿Cuál? Alternativas 3 a 7 Pasan a v20 Debe solicitar la cuenta de luz y registre el monto asociado al último mes. Si no sabe anote 999 v27. ¿Cuántas piezas de cada tipo ocupa su hogar en esta vivienda? M v18. ¿De dónde proviene el agua de la vivienda? v23. ¿Cuánto fue el $ gasto en consumo eléctrico de su hogar el último mes? rio v17. ¿Cuánto se paga Monto Arriendos de arriendo en este $ sector por viviendas similares a la suya? MÓDULO V: Vivienda Registre por observación. Sólo pregunte si no es observable v33. ¿Cómo diría usted que es el estado de conservación de los muros? v37. ¿Cómo diría usted que es el estado de conservación del techo de la vivienda? o 1. Bueno 2. Aceptable 3. Malo Registre por observación. Sólo pregunte si no está dentro de la vivienda v38. ¿Su vivienda tiene cielo interior? 1. Sí 2. No 9. No sabe Registre por observación v34. ¿Cuál es el material que predomina en el piso de la vivienda? 1.Parquet, madera, piso flotante o similar 2.Cerámico, flexit o similar 3.Alfombra o cubrepiso 4.Baldosa de cemento 5.Radier 6.Enchapado de cemento 7.Tierra v39. ¿Cómo describiría el tipo de vivienda donde usted vive? 1.Casa aislada (no pareada) 2.Casa pareada por un lado 3.Casa pareada por ambos lados 4.Departamento en edificio con ascensor 5.Departamento en edificio sin ascensor 6.Pieza en casa antigua o conventillo 7.Mediagua o mejora 8.Rancho, choza o ruca 9.Vivienda precaria de materiales reutilizados (latas, plásticos, cartones, etc.) 10.Móvil (carpa, casa rodante o similar) 11.Otro tipo io na CASEN 2011 1.Bueno 2.Aceptable 3.Malo Observaciones od el 1.Hormigón armado 2.Albañilería (bloque de cemento, piedra o ladrillo) 3.Tabique forrado por ambas caras (madera, lata u otro) 4. Tabique sin forro interior (madera u otro) 5.Adobe, barro, quincha, pirca u otro artesanal tradicional 6.Materiales precarios o de desecho (cartón, latas, sacos, plásticos, etc) Registre por observación. Sólo pregunte si no es observable M v32. ¿Cuál es el material que predomina en los muros exteriores de la vivienda? rio 46 st Registre por observación. Sólo pregunte si no es observable ue v35. ¿Cómo diría usted que es el estado de conservación del piso de la vivienda? 1. Bueno 2. Aceptable 3. Malo C v36. ¿Cuál es el material que predomina en el techo de la vivienda? 1.Tejas o tejuela (arcilla, metálica, cemento, madera, asfáltica) 2.Losa hormigón 3.Planchas metálicas (zinc, cobre, etc.) o fibrocemento (pizarreño) 4.Fonolita o plancha de fieltro embreado 5.Paja, coirón, totora o caña 6.Materiales precarios o de desecho 7.Sin cubierta en el techo v0.a. ¿Quién (o quiénes) responde(n) el módulo Vivienda? Registre número de orden de la persona V0.b. ¿Dónde se produce la entrevista? Registre por observación 1.En el interior de la vivienda 2.Fuera de la vivienda (entrada del domicilio o vivienda, otro lugar) Hora de término: ___ : ___ Pregunta 47 Observaciones io na st ue C CASEN 2011 rio M od el o Módulo o od el M rio io na st ue C Encuesta CASEN 2 0 1 1