Tecnologías de captura, procesamiento y difusión de la información LOS CENSOS DE 2010 EN AMÉRICA LATINA: BALANCE Y PRINCIPALES LECCIONES APRENDIDAS Santiago de Chile, 22 al 24 de octubre de 2013 Lenin Aguinaga P. Lenin.Aguinaga@cepal.org Centro Latinoamericano y Caribeño de Demografía CELADE - División de Población de la CEPAL, Naciones Unidas TEMARIO Y FUENTES DE LA PRESENTACIÓN CAPTURA PROCESAMIENTO DIFUSIÓN APORTE CELADE/CEPAL LECCIONES APRENDIDAS Seminario: Uso de las Tecnologías en los Censos y Operaciones Estadísticas Caracas, Venezuela Mayo 6-8, 2013 Taller Regional sobre Difusión y Comunicación de Datos Río de Janeiro, Brasil Junio 5-7, 2013 Tecnologías de Captura Datos (TCD) Tecnologías de Captura de Datosde (TCD) Censos de Población en los Países la Región según Tipología Tecnológica País Argentina Bahamas Bárbados Belize Bolivia Brasil Chile Colombia Costa Rica Ecuador El Salvador Guatemala Guyana Haiti Honduras Jamaica Mexico Nicaragua Panamá Paraguay Perú Rep. Dom. Suriname Trinidad & Tobago Uruguay Venezuela 1G Ronda de 1990 2G 3G 4G 1G 1991 1G - - - - - 2000 2001 2002 2002 - 2000 2000 2001 2000 2002 - - 2010 2012 - - - 2005 2011 2010 2007 2012 2012 2003 2013 2001 2012 2011 2001 - - - 2000 1995 2000 - 1993 - - - 1990 * La ronda de 2010 incluye algunos censos que todavía estan por confirmar. 1G: Primera Generación (Lápiz - papel y Digitación Manual) 2G: Segunda Generación (Lápiz - papel de calidad especial y Escáneres) 3G: Tercera Generación (Dispositivo Móviles de Captura) Fuente: Encuesta sobre Tecnología del Grupo Estadístico IFD/ICS, BID. Ronda de 2010* 2G 3G 2010 2010 2010 2010 2012 2000 1992 1990 1985 4G 2001 1990 1990 1991 1992 1991 1993 1990 1992 1994 1991 1988 1991 1990 1990 1992 1993 Ronda de 2000 2G 3G 2010 2005 2010 2002 2002 2004 2000 2012 - - 2007 2010 2011 2011 1996 2001 2011 2011 4G De cuestionarios en papel a cuestionarios electrónicos De cuestionarios en papel a cuestionarios electrónicos •Algunos países de la Región ya han empezado a dar los primeros pasos hacia lo que serán los Censos del Futuro. El uso de los DMC ya se ha empezado a hacer en Ya hay algunas operativos censales de gran escala (Brasil, Colombia, Paraguay, Uruguay y Venezuela). experiencias en la Región DMC en otros operativos Proyecto de tecnologías del BID •Por otro lado, otros países ya han experimentado el uso de los DMC bien sea en sus censos pilotos u otro tipo de operativos como encuestas a hogares y de establecimientos (Por ejemplo, los casos de México en su Censo Agropecuario de 2006, su Censo Piloto de Población en 2008 y su Censo Económico de 2009, y Perú con la Encuesta ENDES continua desde 2007). •El BID ha querido promover dentro de la Región la transmisión de estas experiencias para conocer las ventajas y desventajas de esta nueva tecnología y facilitar la decisión de los INEs en cuando a que tecnología utilizar. Monitoreo, Control y Seguimiento CRTC Distribución de Celulares Censos 2011- Soporte para Resolución de Problemas • Call-Center gratuito para censistas • Equipos itinerantes de técnicos Instituto Nacional de Estadística Esquema del Procesamiento Demográfico Censal 2.- 1.- Depuración Tendencia Censal Estructura de Análisis Consolidación Depuración Omisión Datos Censales 2011 Validación Automatización de proceso Aplicación de métodos Secuencia de Validación Control de Validación Control de versiones 3.- Productos Post-Censal Resultados Preliminares Monografías Hojas de Cálculos y Mapas Temáticos Redatam en línea Aspectos Generales y Estrategias utilizadas en las diferentes Operaciones Estadísticas • Se desarrolló un sistema para la digitación, validación de inconsistencias, verificación o re-digitación, codificación sistematizada, carga, gestión de entrevistas y envío de datos en los dispositivos móviles, integración de los datos a nivel nacional y reportes web. • El proceso de entrada de datos se ha descentralizado a las Oficinas Regionales del INEC, teniéndose 9 centros de captura en todo el País. Operación Estadística Censo Nacional de Población y Vivienda 2010 Digitación tradicional (Papel-PC) Verificación de digitación X X (*) PDA Smartp hone Tablet Codificación Sistematizada X Instituto Nacional de Estadística y Censo de Panamá http://www.contraloria.gob.pa/inec/ Advantages and implications of using the handhelds computers Coding Table 3-Proportion of people coded during phases of data collection and editing of the 2010 Census, compared to the total number of people reporting each variable. Percentage of people Percentage of people Theme coded in the collection coded in editing step (handheld) Universe data Indian ethnicity 88.79 11.21 Indigenous language 90.02 9.98 Long form data Indian ethnicity Indigenous language Religion Undergraduate degree Master degree PhD degree Last municipality people lived Municipality where people lived 5 years ago Municipality where people study Municipality where people work Source: IBGE, Survey Directorate. 89.73 89.54 94.30 84.95 72.44 76.16 92.39 10.27 10.46 5.7 15.05 27.56 23.84 7.61 93.45 6.55 93.12 6.88 90.48 9.52 PASO 0: CONSOLIDACIÓN DE LOS DATOS CENSALES Esquema de Comunicaciones N C INTERNET CRTC Nivel Central Nivel Local DMC SALA DE PROCESAMIENTO CENSAL CSPro 4.1 Consolidación de los datos censales Identificación de incidencias Análisis y depuración de los casos inconsistentes Generación de Base de Datos 2011. BASE DE DATOS FINAL Status Base de Datos final del XIV Censo de Población y Vivienda 2011 27.150.095 26.868.534 27.087.651 Dic 2011 Feb 2012 Mar 2012 27.203.000 27.227.930 Abr 2012 Jul 2012 Consolidación de los Datos Censales (.dat). Revisión y descarga de los respaldos (CRTC y DMC). Digitación de colectividades, penitenciarías y viviendas indígenas levantadas en papel. Datos demográficos declarados en tipo 3 y omitidos en tipo 4 o en hogares. Viviendas en BD OTI, omitidas en el respaldo (.dat). Uso de las tecnologías en los censos y operaciones estadísticas ACTIVIDADES DE DIFUSIÓN CENSO GENERAL 2005 Capacitación y uso de la información •Diplomados •Talleres regionales •Capacitaciones •Convenios •Estudios pos-censales •Atlas Geoestadístico •Artículos Orientación Divulgación •Avisos de prensa • anuncios en radio y televisión • folletos •Artículos •Página web •Sistemas de difusión de la información censal •Banco de datos •Sala especializada •Redes sociales •Sociedad de la estadística Canales de atención Usuarios atendidos Portal Web 2011: 2.911.201 2012: 4.044.969 Dispositivos móviles 2011: 16.127 2012: 73.766 Listado de Tomadores de Decisiones 2011: 4.040 2012: 24.144 Redes Sociales: Twitter 2011: 4.4.60 2012: 16.371 2013: 30.455 * Facebook: 2011: 1.112 2012: 2.346 2013: 2.966 * *Mayo 30 de 2013 ACCESO A LOS MICRODATOS FORMATO CENSO / MUESTRA AÑO EL SALVADOR - DIGESTYC C 2007 X PERÚ - INEI C 2007 X MÉXICO - INEGI M 2010 BRASIL – IBGE M 2010 ARGENTINA – INDEC C 2010 X ECUADOR - INEC C 2010 X COSTA RICA - INEC C 2011 X URUGUAY - INE C 2011 PAÍS REDATAM ASCII DBF SPS S STAT A SAS X X X X X X X X X COLOMBIA - DANE: Acceso al Microdato anonimizado Censo General 2005. Permitirá la generación y acceso al microdato de la base del Censo General 2005, preservando la confidencialidad. APORTE CELADE/CEPAL http://www.redatam.org REDATAM APLICADO EN: Captura Consistencia Coherencia • Sistemas de Indicadores de Seguimiento Demográfico • Módulo R+SP xPlan (Paraguay, Venezuela) • Tabulados y/o indicadores antes y después de cada proceso de validación • Módulos R+SP BA y R+SP Process (Bolivia, Brasil, Ecuador) • Modelo jerárquico para revisar la estructura geográfica e identificar duplicados, diferenciando valores válidos, fuera de rango y no aplicables en un solo reporte • Base de datos para diseminación elaborada antes de su publicación • Módulos R+SP Create y Red7 Create (Argentina, Brasil, Chile, Ecuador, Paraguay, Venezuela) REDATAM APLICADO EN: Procesamiento Difusión Demografía • Plan de Tabulación y Generación de Indicadores • Módulo R+SP Process (Argentina, Brasil, Colombia, Uruguay, Venezuela, CELADE) • Aplicaciones En-Línea (17/20 países de América Latina y 5/25 países de El Caribe con al menos un censo) • Aplicaciones En-CD (Argentina, Costa Rica, Ecuador, Perú, Venezuela) • Formato especial de salida SIDRA para alimentar el Banco de Datos Agregados de Brasil • Módulos R+SP WebServer, R+SP xPlan, R+SP Process • Estimaciones Indirectas de la Fecundidad y Mortalidad Infantil sobre bases de datos REDATAM • Módulos R+SP EIF y R+SP EIM LECCIONES APRENDIDAS SOMOS UNA COMUNIDAD CAPTURA E INGRESO DE LA INFORMACIÓN VENTAJAS LECCIONES APRENDIDAS Sistema de Captura Óptica mediante Scanner • La información a procesar se capturan automáticamente sin necesidad de que se introduzca a mano ni un solo dato o en casos específicos con porcentajes muy bajos. • La introducción manual de datos se reduce aproximadamente en un 90% o más. • Las correcciones necesarias se efectúan en un entorno cómodo, donde el cuestionario censal que se modifica se muestra directamente en la pantalla. • Debido a 2 experiencias de información (Censo y otra investigación estadística) con gran volumen de información; ha generado una experticia en el INEC que permite afrontar retos de gran magnitud con tecnología de captura óptica. • Si bien es cierto la tendencia actual es capturar la información a través de dispositivos móviles (tablets, PDA, EDAS), no se debe descartar la captura óptica como alternativa válida. Uso de las TIC INEC Ecuador DIFICULTADES AFRONTADAS ASEGURAR EL NIVEL DE CALIDAD CONSTANTE EN TODOS LOS PROCESOS, FRENTE A: • • • • GRANDES VOLÚMENES PLAZOS EXIGENTES SEDES DIVERSAS GRUPOS DE TRABAJO NUMEROSOS APRENDIZAJES IMPORTANCIA DE ORGANIZAR: • PLANIFICACIÓN RIGUROSA • MONITOREO EFICIENTE • TRABAJO EN EQUIPO Censos 2011- Lecciones Aprendidas • Invertir muchas horas en planificación y elaboración de planes de contingencia • Generar convenios o acuerdos con los Agentes Externos con tiempos que se ajusten al cronograma del proyecto • Generar mecanismos ágiles de reclutamiento de personal técnico • Contar con los dispositivos definitivos con buen margen de tiempo • Pensar en el Censo como Mega Proyecto y utilizarlo para dotar a los Institutos de tecnología aprovechable en otros proyectos Instituto Nacional de Estadística Recuerde 1. La producción estadística sin difusión no existe. 2. No está permitido los errores. Las crisis comunicacionales en redes sociales se expanden más rápido y llegan a mayor cantidad de personas. Los usuarios están más pendientes de los errores. 3. Se debe tener personas preparadas en comunicación y en nuevas tecnologías, y claro siempre innovando. 4. Es importante el apoyo de los Directivos a comunicación, pues sin el la difusión estadística no será la deseada. 5. No es aconsejable utilizar todas las herramientas tecnológicas, su uso debe ser analizado y utilizado dentro de una estrategia. Sin embargo, siempre hay que estar abierto a conocer las nuevas herramientas. 6. Mientras más información difunda, más preguntas y usuarios tendrá. 7. Conserve los canales tradicionales y esté abierto a los nuevos. Mecanismos de Difusión de datos