Cátedras CONACYT Datos Generales Institución: Centro de Investigación en Matemáticas, A.C. Dependencia del Proyecto: CIMAT – Unidad Monterrey Entidad Federativa donde se realizará el proyecto: Nuevo León Temática (Ver convocatoria): Conocimiento del universo Reto (Ver convocatoria): Estudios de física, matemáticas, química y sus aplicaciones Título: Modelación matemática, estadística y computacional para datos complejos en un contexto de Big Data Modalidad: Grupal Descripción del Proyecto Propósito (máximo 500 caracteres): Generar conocimiento estadístico mediante el desarrollo de modelos matemáticos y algoritmos computacionales en el análisis de fenómenos complejos identificados en las actividades económicas y sociales del país en un contexto de Big Data. Promover la ampliación y diseminación del conocimiento, formar recursos humanos, y aplicar a problemáticas nacionales relevantes, modelos que faciliten la extracción de nuevos conocimientos. Consolidar un grupo de investigación de vanguardia capaz de afrontar los retos que este tipo de complejidad implica. Objetivos (máximo 500 caracteres): Realizar investigación sobre modelos matemáticos, estadísticos y computacionales que conduzcan a la generación de información relevante a partir de grandes volúmenes de datos de diferentes ámbitos del desarrollo humano Conjuntar experiencia y facilitar la transmisión del conocimiento adquirido mediante publicaciones, formación de recursos humanos y productos que puedan ser útiles a la sociedad en general, en particular en áreas de la salud, ciencias económicas nantoecnología y biotecnología Actividades (máximo 2,000 caracteres) 1. Explorar e identificar las áreas de oportunidad en un contexto de Big Data. 2. Desarrollar modelos matemáticos, estadísticos y computacionales para el análisis de la problemática de acuerdo a las áreas de oportunidad identificada. 3. Elaborar reportes técnicos que describan los modelos y los resultados obtenidos de su aplicación a datos generados artificialmente y a datos reales, incluyendo asimismo la descripción de su potencial y limitaciones, conclusiones y posibles áreas de oportunidades. 4. Publicar los resultados en revistas de arbitraje internacional. 1 5. Fortalecer a un grupo de investigación en análisis de datos bajo un enfoque de Big Data. 6. Participar en el comité de postgrados del CIMAT que corresponda. 7. Colaborar en la creación de un programa de Maestría en CIMAT-Mty, con una especialidad en el área de Big Data. 8. Identificar los perfiles académicos de los alumnos potenciales y difusión de programa de posgrado. 9. Dirigir tesis a mediano plazo en CIMAT-Unidad Monterrey y en un periodo a corto plazo en los programas de CIMAT-Guanajuato, ITESM-Campus Monterrey y UANL. 10. Implementar los programas y documentar su rendimientos 11. Realizar visitas académicas a instituciones nacionales e internacionales e invitación de profesores de instituciones nacionales e internacionales para realizar estancias de investigación en la Unidad Monterrey, en temas afines a Big Data 12. Participar en seminarios internos y externos, en Talleres y Congresos de investigación, vinculación y difusión 13. Organizar seminarios internos, así como Talleres y Congresos tanto de investigación como de vinculación y difusión 14. Participar en proyectos de Vinculación académicos y de la iniciativa privada 15. Participar en la elaboración de Convenios académicos con Universidades y Centros de investigación. 16. Participar en convocatorias para proyectos de investigación y vinculación, a nivel nacional e internacional. 17. Participar en la red de Vinculación del PIIT Metas a alcanzar (incluir formación de recursos humanos) y plazos estimados (hasta 10 años) (máximo 2,000 caracteres) 1. Consolidación del grupo de análisis de datos con estructuras complejas, integrado por un mínimo de 5 investigadores al segundo año de su creación. 2. Desarrollo de 3 proyectos de investigación y vinculación nacionales e internacionales en colaboración con otros grupos de investigación de áreas afines, en un plazo no mayor a 5 años, en temáticas como econometría y comercio, análisis de percepción en redes sociales, genómica, imágenes y predicción de riesgos, finanzas, imágenes satelitales y detección /predicción de catástrofes, entre otras. 3. Número de investigadores en el SNI: Ingreso al SNI a partir del 2o año de los tres. 4. Integración de los 3 investigadores al programa de posgrado, a partir del segundo año de su creación. 5. Ingreso al padrón de posgrados de excelencia, a partir del 3er año de su creación. 6. Número de tesis dirigidas y terminadas con éxito. Nivel Maestría: 3 por año a partir del segundo año. Nivel doctoral: 3 por bienio a partir del tercer año. Considerando que las tesis terminadas en la institución serían partir del 3er año de la creación del posgrado, generando al inicio del periodo, tesis en otros programas de posgrado. 2 7. Promover la vinculación de los estudiantes graduados del posgrado en los sectores productivos. 8. Conseguir 3 proyectos para jóvenes investigadores en un período de 5 años, y /o participar en los proyectos vigentes de otros de los investigadores de la Unidad. 9. Número de proyectos de vinculación implementados con éxito: de 2 a 4 por año, a partir del primero. 10. Número de publicaciones en revistas indexadas: al menos una por investigador por año, a partir del primero 11. Número de trabajos originales en reuniones científicas internacionales: una por año por investigador, a partir del primero. 12. Número de trabajos originales en reuniones científicas nacionales: una por año por investigador, a partir del primero. 13. Desarrollo de una herramienta computacional eficiente y funcional que incorpore los modelos estadísticos y herramientas de minería de datos desarrollados, para el análisis de estructuras complejas de datos en un enfoque de Big Data. 14. Organización de 3 eventos internacionales sobre aspectos temáticos relacionados con Big Data, en colaboración con otras instituciones académicas de nacionales y extranjera y con instituciones oficiales como INEGI. Resultados e impactos esperados (máximo 2,000 caracteres) 1. Aumentar los niveles de experiencia en el área de Big Data, mediante el desarrollo de modelos matemáticos, estadísticos y algoritmos computacionales que incorporen nuevas tendencias en el tratamiento de grandes volúmenes de datos multivariados que presenten alta dimensionalidad, estructuras de correlaciones no lineales, variables de distinta naturaleza obtenidas de diversas fuentes, fortaleciendo la investigación en el área y apuntalando a la institución como líder en modelación de problemas complejos, reflejándose en la generación de conocimiento para el desarrollo científico del país mediante sus aplicaciones en diversos campos, particularmente en inteligencia de negocios, salud, biotecnología y nanotecnología. 2. Consolidar los programas de Posgrado en el CIMAT, particularmente el de próxima apertura en la unidad de Monterrey para atender la demanda de quienes quieran formarse con un enfoque orientado al análisis de datos bajo una perspectiva de Big Data. El estándar de excelencia esperado a nivel internacional de dicho posgrado formará recursos humanos altamente capacitados en la identificación de la problemática y en el desarrollo e implementación de modelos matemáticos, estadísticos y algoritmos computacionales para su solución, además de la trasferencia del conocimiento útil a la sociedad en los retos que implica la toma de decisiones informadas ante la alta dimensionalidad de la información que se genera hoy en día prácticamente en cualquier área del conocimiento. 3. Difundir y fomentar la importancia y valor del análisis de grandes volúmenes de datos, como una ventaja competitiva en el contexto actual de negocios en la 3 iniciativa privada, y como una oportunidad de explorar y solucionar problemáticas de relevancia para la sociedad en el sector público. Vinculación, pertinencia y perspectivas de transferencia de tecnología (si aplica) (máximo 2,000 caracteres) La Unidad Monterrey del CIMAT nació del crecimiento de proyectos de vinculación cuyos inicios se remontan a 1999. El cumplimiento oportuno y efectivo de las metas de corto y mediano plazo ha reafirmado la reputación y competitividad de la unidad, logrando el reconocimiento legítimo como un Centro íntegro, productivo y con un gran potencial de crecimiento. Esto se ha visto reflejado en el aumento significativo en el número de proyectos, investigaciones, publicaciones y alianzas en los últimos años. Para ejemplificar y dimensionar lo anterior, tan sólo en el 2013 se mantuvo acercamiento con 17 empresas, para un total de 22 proyectos de diversas índoles, superando la cifra de 6 el año previo. Con relación a los proyectos de Convocatoria CONACYT y otras instituciones públicas, la cifra aumentó de 5 a 13 respectivamente, entre las que destacan 4 grandes proyectos de impacto nacional: 1) Modelo de Crecimiento regional basado en el Conocimiento, 2) Métodos y Técnicas de Inteligencia Computacional y Minería de Datos para la Toma de Decisiones en Explotación de Campos Maduros (SENER), 3) Análisis de información para Sistema de Alertas Tempranas, y 4) Optimización de la Cadena Alimentaria para la Reducción de las Pérdidas Post-Cosecha, los que se detallan más adelante. En los últimos dos años se han desarrollado hasta 25 proyectos producto de colaboraciones y convenios de la Unidad con universidades de la entidad y del extranjero. Con esta noble inercia producto del esfuerzo de muchos años, se espera que la productividad en transferencia de conocimiento y creación de propiedad intelectual que significarán los jóvenes catedráticos, y su fortalecimiento, por ende, a los programas de postgrado, tendrá una cuantía importante y producirá resultados en el corto, mediano y largo plazo. En particular las demandas de proyectos que involucran problemas complejos en distintas áreas como salud, econometría, bioinformática han ido en aumento en la Unidad Monterrey y CIMAT en general. 4 Motivos de la Institución para desarrollar el proyecto (máximo 2,000 caracteres) Este proyecto solicita incluir 3 jóvenes catedráticos al grupo de CIMAT Mty que colabora estrechamente con investigadores de CIMAT Guanajuato en la generación de modelos bajo la perspectiva de Big Data. En la actualidad, los sistemas de información que registran las actividades en diversos ámbitos, generan un gran volumen datos con estructuras complejas. De esta forma, el desarrollo de nuevo conocimiento sobre estos sistemas, así como el aprovechamiento del ya existente depende de forma directa de la capacidad de comprender y crear modelos matemáticos eficientes. En este sentido, y de manera particular la tarea de explotar y analizar de manera sistemática información de distinta naturaleza generada de diversas fuentes oficiales y del sector privado denominada recientemente con el término genérico Big Data, resulta un área de oportunidad estratégica que deber ser explotada de forma óptima. Para este fin, el desarrollo de modelos estadísticos, técnicas de procesamiento de información y herramientas de minería de datos y su aplicación en el análisis de estructuras complejas de información derivadas de las actividades económicas, generan un mayor conocimiento de los fenómenos de interés. En el CIMAT Unidad Monterrey se han desarrollado distintas interacciones con empresas e instituciones del sector público que generan información con una estructura compleja, entre las que destacan la creación y aplicación de modelos estadísticos multivariados, algoritmos computacionales y herramientas de minería de datos. En aras de consolidar esta labor, y fortalecer estas áreas de investigación como pilares que apuntalen al CIMAT como institución líder en modelación estadística de problemas complejos, la integración de estos tres jóvenes catedráticos, aumentará la experiencia y conocimiento acumulado en CIMAT; Asimismo estas incorporaciones fortalecerán la planta de profesores del programa de posgrado de próxima apertura. 5 Descripción del grupo de Investigación o personal académico asociado al proyecto (Incluir los nombres de los miembros y sus especialidades) (máximo 2,000 caracteres): Graciela González Farías. Investigador Titular C. SNI Nivel 3 Especialidad: Series de Tiempos, Modelos Multivariados Víctor Muñiz Sánchez. Técnico Titular C. Especialidad: Análisis de datos en alta dimensión, modelos de clasificación Rodrigo Macías Páez. Investigador Asociado A. SNI Nivel Candidato Especialidad: Modelos de clasificación y clustering Johan Van Horebeek. Investigador Titular A. SNI Nivel 2 Especialidad: Reconocimiento estadística de patrones, aprendizaje estadístico, análisis y modelación de datos multidimensionales Rogelio Ramos Quiroga. Investigador Titular A. Especialidad: Diseño de Experimentos, Estadística Espacial, Aprendizaje Estadístico e Inferencia Estadística en Análisis Multivariado Baidya Nath. Saha, Investigador Asociado C Especialidad: Cómputo Estadístico, Vision Computacional e Ingeniería de software. Actualmente posdoc en la Universidad de Calgary, integrándose a la Unidad Monterrey en Julio de 2014. 6 Descripción de la infraestructura física disponible para ejecutar las actividades del proyecto (máximo 2,000 caracteres): El proyecto arquitectónico completo de la Unidad Monterrey del CIMAT en el Parque de Investigación e Innovación Tecnológica (PIIT) consta de tres módulos de 6,255 metros cuadrados de construcción total, más 2671 metros cuadrados de áreas externas. El programa arquitectónico incluye biblioteca, cocina, comedor, oficinas administrativas, almacén, taller para equipos de cómputo, sala de videoconferencias, dos salones para seminarios multimedia, una sala de usos múltiples, una sala de juntas, y oficinas para 32 investigadores, 76 estudiantes, 32 técnicos académicos, 10 directivos (dirección, coordinaciones, gerencias) y 16 auxiliares. En el momento de escribir esto (marzo 2014) se tienen construidos y en fase de acabados y equipamiento las instalaciones de la planta baja del módulo sur: 788 metros cuadrados, que pueden albergar 8 investigadores, 13 técnicos académicos, y 3 funcionarios; estas oficinas contarán con servicio de internet, tanto dentro de la RED NIBA como en la RED RI3, ambas con velocidades de conexión de 1 Gbs a Internet II a través de fibra óptica, y con internet comercial, que nos enlazará con la muy completa biblioteca virtual de CIMAT Gto., y contarán con climatización y servicios de seguridad y limpieza. En cuanto a la infraestructura de cómputo, la Unidad Monterrey del CIMAT cuenta con dos súper computadoras, una de 24 y otra de 12 Cores, con un total de 96 GB de RAM y 8 tarjetas gráficas, que se enlazan al cluster “Insurgente” del CIMAT en Guanajuato lo que proporciona la capacidad para realizar cómputo en paralelo con MPI y OpenMP y visualización científica de manera local, y a través del “Insurgente” para ofrecer y desarrollar servicios de Cómputo de Alto Desempeño. 7 Relación del proyecto con los programas de Posgrado registrados o susceptibles de pertenecer al PNPC (máximo 2,000 caracteres): Hasta ahora, personal de la Unidad Monterrey del CIMAT ha colaborado o colabora bajo acuerdo con la Maestría en Estadística Aplicada del ITESM, de la que egresaron varios de los técnicos académicos de la Unidad y que, como se ha dicho, desaparecerá en poco tiempo, con la Maestría en Ciencias con orientación en Matemáticas y el Doctorado en Matemáticas, de la FCFM de la UANL, con el departamento de Psiquiatría del H.U. de la UANL, y con el Programa Multicéntrico de Residencias Médicas del Tec de Monterrey y la SSNL. Por otra parte, una de las implicaciones fundamentales del fortalecimiento de la planta de investigadores en los temas que son centrales en la Unidad es la creación de un programa de posgrado que se convierta en un programa de excelencia académica, con el sello de generar una formación integral para la solución de problemas nacionales. Al ser un programa más de CIMAT estará regido por los mismos criterios de excelencia de los programas ya registrados a nivel internacional en el PNPC, ayudando a nutrirse de esa experiencia. 8 Perfiles Solicitados 1. Grado Académico: Doctorado Áreas del conocimiento: Ciencias Físico-Matemáticas y Ciencias de la Tierra Disciplina: Matemáticas Subdisciplina: Estadística Experiencia Profesional (máximo 2,000 caracteres): Capacidad de investigar mientras realizan actividades de vinculación y docencia Facilidad para liderar equipos y enseñar Experiencia para enseñar y dirigir tesis inicialmente de nivel maestría en Modelación Estadística Perfil SNI Capacidad para la obtención de fondos a través de concursos y convocatorias Capacidad para comunicarse, como puede ser requerida al exponer clases, ponencias en inglés, proponer métodos, y mostrar resultados. De preferencia con aptitudes y /experiencia en Modelos de Reducción de Dimensionalidad De preferencia con aptitudes y /experiencia para el trabajo de vinculación Actividades a Desarrollar (máximo 2,000 caracteres): Desarrollar investigación Básica en Modelos Multivariados Establecer Vínculos con otros grupos de investigación en Big Data Fortalecer al grupo de Modelación Estadística de la Unidad Monterrey del CIMAT Presentar avances de investigación en Talleres, Seminarios y Conferencias Impartir un curso por semestre, inicialmente en postgrados de instituciones con las que se tenga acuerdo de colaboración, y eventualmente en el postgrado en la Unidad Monterrey del CIMAT Escribir reportes técnicos, resúmenes y artículos científicos para publicación. Coadyuvar al fomento de transmisión de conocimiento de modelos para datos con estructuras complejas. 9 2. Grado Académico: Doctorado Áreas del conocimiento: Ciencias Físico-Matemáticas y Ciencias de la Tierra Disciplina: Matemáticas Subdisciplina: Otras subdisciplinas de las matemáticas Experiencia Profesional (máximo 2,000 caracteres): Capacidad de investigar mientras realizan actividades de vinculación y docencia Facilidad para liderar equipos y enseñar Experiencia para enseñar y dirigir tesis inicialmente de nivel maestría en Modelación Estadística y Cómputo Avanzado Perfil SNI Capacidad para la obtención de fondos a través de concursos y convocatorias Capacidad para comunicarse, como puede ser requerida al exponer clases, ponencias en inglés, proponer métodos, y mostrar resultados. De preferencia con aptitudes y /experiencia en Modelos de clasificación bajo diferentes enfoques y algoritmos de optimización De preferencia con aptitudes y /experiencia para el trabajo de vinculación Actividades a Desarrollar (máximo 2,000 caracteres): Desarrollar investigación básica en modelos de clasificación bajo diferentes enfoques y algoritmos de optimización Establecer Vínculos con otros grupos de investigación en Big Data Fortalecer al grupo de Modelación Estadística de la Unidad Monterrey del CIMAT Presentar avances de investigación en Talleres, Seminarios y Conferencias Impartir un curso por semestre, inicialmente en postgrados de instituciones con las que se tenga acuerdo de colaboración, y eventualmente en el postgrado en la Unidad Monterrey del CIMAT Escribir reportes técnicos, resúmenes y artículos científicos para publicación. Coadyuvar al fomento de transmisión de conocimiento de modelos para datos con estructuras complejas. 10 3. Grado Académico: Doctorado Áreas del conocimiento: Ciencias Físico-Matemáticas y Ciencias de la Tierra Disciplina: Matemáticas Subdisciplina: Otras disciplinas de las matemáticas Experiencia Profesional (máximo 2,000 caracteres): Capacidad de investigar mientras realizan actividades de vinculación y docencia Facilidad para liderar equipos y enseñar Experiencia para enseñar y dirigir tesis inicialmente de nivel maestría en Modelación Estadística y Cómputo Avanzado Perfil SNI Capacidad para la obtención de fondos a través de concursos y convocatorias Capacidad para comunicarse, como puede ser requerida al exponer clases, ponencias en inglés, proponer métodos, y mostrar resultados. De preferencia con aptitudes y /experiencia en Cómputo Paralelo y Manejo de Bases de Datos De preferencia con aptitudes y /experiencia para el trabajo de vinculación Actividades a Desarrollar (máximo 2,000 caracteres): Desarrollar investigación básica en modelos de clasificación bajo diferentes enfoques y algoritmos de optimización Establecer Vínculos con otros grupos de investigación en Big Data Fortalecer al grupo de Modelación Estadística de la Unidad Monterrey del CIMAT Presentar avances de investigación en Talleres, Seminarios y Conferencias Impartir un curso por semestre, inicialmente en postgrados de instituciones con las que se tenga acuerdo de colaboración, y eventualmente en el postgrado en la Unidad Monterrey del CIMAT Escribir reportes técnicos, resúmenes y artículos científicos para publicación. Coadyuvar al fomento de transmisión de conocimiento de modelos para datos con estructuras complejas. 11