Proyecto No. 3162 Modelación matemática, estadística y

Anuncio
Cátedras CONACYT
Datos Generales
Institución: Centro de Investigación en Matemáticas, A.C.
Dependencia del Proyecto: CIMAT – Unidad Monterrey
Entidad Federativa donde se realizará el proyecto: Nuevo León
Temática (Ver convocatoria): Conocimiento del universo
Reto (Ver convocatoria): Estudios de física, matemáticas, química y sus aplicaciones
Título: Modelación matemática, estadística y computacional para datos complejos en
un contexto de Big Data
Modalidad: Grupal
Descripción del Proyecto
Propósito (máximo 500 caracteres):
Generar conocimiento estadístico mediante el desarrollo de modelos matemáticos y
algoritmos computacionales en el análisis de fenómenos complejos identificados en las
actividades económicas y sociales del país en un contexto de Big Data. Promover la
ampliación y diseminación del conocimiento, formar recursos humanos, y aplicar a
problemáticas nacionales relevantes, modelos que faciliten la extracción de nuevos
conocimientos. Consolidar un grupo de investigación de vanguardia capaz de afrontar
los retos que este tipo de complejidad implica.
Objetivos (máximo 500 caracteres):
 Realizar investigación sobre modelos matemáticos, estadísticos y computacionales
que conduzcan a la generación de información relevante a partir de grandes
volúmenes de datos de diferentes ámbitos del desarrollo humano
 Conjuntar experiencia y facilitar la transmisión del conocimiento adquirido mediante
publicaciones, formación de recursos humanos y productos que puedan ser útiles a
la sociedad en general, en particular en áreas de la salud, ciencias económicas
nantoecnología y biotecnología
Actividades (máximo 2,000 caracteres)
1. Explorar e identificar las áreas de oportunidad en un contexto de Big Data.
2. Desarrollar modelos matemáticos, estadísticos y computacionales para el análisis
de la problemática de acuerdo a las áreas de oportunidad identificada.
3. Elaborar reportes técnicos que describan los modelos y los resultados obtenidos de
su aplicación a datos generados artificialmente y a datos reales, incluyendo
asimismo la descripción de su potencial y limitaciones, conclusiones y posibles
áreas de oportunidades.
4. Publicar los resultados en revistas de arbitraje internacional.
1
5. Fortalecer a un grupo de investigación en análisis de datos bajo un enfoque de Big
Data.
6. Participar en el comité de postgrados del CIMAT que corresponda.
7. Colaborar en la creación de un programa de Maestría en CIMAT-Mty, con una
especialidad en el área de Big Data.
8. Identificar los perfiles académicos de los alumnos potenciales y difusión de
programa de posgrado.
9. Dirigir tesis a mediano plazo en CIMAT-Unidad Monterrey y en un periodo a corto
plazo en los programas de CIMAT-Guanajuato, ITESM-Campus Monterrey y UANL.
10. Implementar los programas y documentar su rendimientos
11. Realizar visitas académicas a instituciones nacionales e internacionales e invitación
de profesores de instituciones nacionales e internacionales para realizar estancias
de investigación en la Unidad Monterrey, en temas afines a Big Data
12. Participar en seminarios internos y externos, en Talleres y Congresos de
investigación, vinculación y difusión
13. Organizar seminarios internos, así como Talleres y Congresos tanto de
investigación como de vinculación y difusión
14. Participar en proyectos de Vinculación académicos y de la iniciativa privada
15. Participar en la elaboración de Convenios académicos con Universidades y Centros
de investigación.
16. Participar en convocatorias para proyectos de investigación y vinculación, a nivel
nacional e internacional.
17. Participar en la red de Vinculación del PIIT
Metas a alcanzar (incluir formación de recursos humanos) y plazos estimados
(hasta 10 años) (máximo 2,000 caracteres)
1. Consolidación del grupo de análisis de datos con estructuras complejas, integrado
por un mínimo de 5 investigadores al segundo año de su creación.
2. Desarrollo de 3 proyectos de investigación y vinculación nacionales
e
internacionales en colaboración con otros grupos de investigación de áreas afines,
en un plazo no mayor a 5 años, en temáticas como econometría y comercio,
análisis de percepción en redes sociales, genómica, imágenes y predicción de
riesgos, finanzas, imágenes satelitales y detección /predicción de catástrofes, entre
otras.
3. Número de investigadores en el SNI: Ingreso al SNI a partir del 2o año de los tres.
4. Integración de los 3 investigadores al programa de posgrado, a partir del segundo
año de su creación.
5. Ingreso al padrón de posgrados de excelencia, a partir del 3er año de su creación.
6. Número de tesis dirigidas y terminadas con éxito. Nivel Maestría: 3 por año a partir
del segundo año. Nivel doctoral: 3 por bienio a partir del tercer año. Considerando
que las tesis terminadas en la institución serían partir del 3er año de la creación del
posgrado, generando al inicio del periodo, tesis en otros programas de posgrado.
2
7. Promover la vinculación de los estudiantes graduados del posgrado en los sectores
productivos.
8. Conseguir 3 proyectos para jóvenes investigadores en un período de 5 años, y /o
participar en los proyectos vigentes de otros de los investigadores de la Unidad.
9. Número de proyectos de vinculación implementados con éxito: de 2 a 4 por año, a
partir del primero.
10. Número de publicaciones en revistas indexadas: al menos una por investigador por
año, a partir del primero
11. Número de trabajos originales en reuniones científicas internacionales: una por año
por investigador, a partir del primero.
12. Número de trabajos originales en reuniones científicas nacionales: una por año por
investigador, a partir del primero.
13. Desarrollo de una herramienta computacional eficiente y funcional que incorpore los
modelos estadísticos y herramientas de minería de datos desarrollados, para el
análisis de estructuras complejas de datos en un enfoque de Big Data.
14. Organización de 3 eventos internacionales sobre aspectos temáticos relacionados
con Big Data, en colaboración con otras instituciones académicas de nacionales y
extranjera y con instituciones oficiales como INEGI.
Resultados e impactos esperados (máximo 2,000 caracteres)
1. Aumentar los niveles de experiencia en el área de Big Data, mediante el desarrollo
de modelos matemáticos, estadísticos y algoritmos computacionales que incorporen
nuevas tendencias en el tratamiento de grandes volúmenes de datos multivariados
que presenten alta dimensionalidad, estructuras de correlaciones no lineales,
variables de distinta naturaleza obtenidas de diversas fuentes, fortaleciendo la
investigación en el área y apuntalando a la institución como líder en modelación de
problemas complejos, reflejándose en la generación de conocimiento para el
desarrollo científico del país mediante sus aplicaciones en diversos campos,
particularmente en inteligencia de negocios, salud, biotecnología y nanotecnología.
2. Consolidar los programas de Posgrado en el CIMAT, particularmente el de próxima
apertura en la unidad de Monterrey para atender la demanda de quienes quieran
formarse con un enfoque orientado al análisis de datos bajo una perspectiva de Big
Data. El estándar de excelencia esperado a nivel internacional de dicho posgrado
formará recursos humanos altamente capacitados en la identificación de la
problemática y en el desarrollo e implementación de modelos matemáticos,
estadísticos y algoritmos computacionales para su solución, además de la
trasferencia del conocimiento útil a la sociedad en los retos que implica la toma de
decisiones informadas ante la alta dimensionalidad de la información que se genera
hoy en día prácticamente en cualquier área del conocimiento.
3. Difundir y fomentar la importancia y valor del análisis de grandes volúmenes de
datos, como una ventaja competitiva en el contexto actual de negocios en la
3
iniciativa privada, y como una oportunidad de explorar y solucionar problemáticas de
relevancia para la sociedad en el sector público.
Vinculación, pertinencia y perspectivas de transferencia de tecnología (si aplica)
(máximo 2,000 caracteres)
La Unidad Monterrey del CIMAT nació del crecimiento de proyectos de vinculación
cuyos inicios se remontan a 1999. El cumplimiento oportuno y efectivo de las metas de
corto y mediano plazo ha reafirmado la reputación y competitividad de la unidad,
logrando el reconocimiento legítimo como un Centro íntegro, productivo y con un gran
potencial de crecimiento. Esto se ha visto reflejado en el aumento significativo en el
número de proyectos, investigaciones, publicaciones y alianzas en los últimos años.
Para ejemplificar y dimensionar lo anterior, tan sólo en el 2013 se mantuvo
acercamiento con 17 empresas, para un total de 22 proyectos de diversas índoles,
superando la cifra de 6 el año previo. Con relación a los proyectos de Convocatoria
CONACYT y otras instituciones públicas, la cifra aumentó de 5 a 13 respectivamente,
entre las que destacan 4 grandes proyectos de impacto nacional: 1) Modelo de
Crecimiento regional basado en el Conocimiento, 2) Métodos y Técnicas de
Inteligencia Computacional y Minería de Datos para la Toma de Decisiones en
Explotación de Campos Maduros (SENER), 3) Análisis de información para Sistema de
Alertas Tempranas, y 4) Optimización de la Cadena Alimentaria para la Reducción de
las Pérdidas Post-Cosecha, los que se detallan más adelante. En los últimos dos años
se han desarrollado hasta 25 proyectos producto de colaboraciones y convenios de la
Unidad con universidades de la entidad y del extranjero. Con esta noble inercia
producto del esfuerzo de muchos años, se espera que la productividad en transferencia
de conocimiento y creación de propiedad intelectual que significarán los jóvenes
catedráticos, y su fortalecimiento, por ende, a los programas de postgrado, tendrá una
cuantía importante y producirá resultados en el corto, mediano y largo plazo.
En particular las demandas de proyectos que involucran problemas complejos en
distintas áreas como salud, econometría, bioinformática han ido en aumento en la
Unidad Monterrey y CIMAT en general.
4
Motivos de la Institución para desarrollar el proyecto (máximo 2,000 caracteres)
Este proyecto solicita incluir 3 jóvenes catedráticos al grupo de CIMAT Mty que
colabora estrechamente con investigadores de CIMAT Guanajuato en la generación de
modelos bajo la perspectiva de Big Data.
En la actualidad, los sistemas de información que registran las actividades en diversos
ámbitos, generan un gran volumen datos con estructuras complejas. De esta forma, el
desarrollo de nuevo conocimiento sobre estos sistemas, así como el aprovechamiento
del ya existente depende de forma directa de la capacidad de comprender y crear
modelos matemáticos eficientes.
En este sentido, y de manera particular la tarea de explotar y analizar de manera
sistemática información de distinta naturaleza generada de diversas fuentes oficiales y
del sector privado denominada recientemente con el término genérico Big Data, resulta
un área de oportunidad estratégica que deber ser explotada de forma óptima. Para este
fin, el desarrollo de modelos estadísticos, técnicas de procesamiento de información y
herramientas de minería de datos y su aplicación en el análisis de estructuras
complejas de información derivadas de las actividades económicas, generan un mayor
conocimiento de los fenómenos de interés.
En el CIMAT Unidad Monterrey se han desarrollado distintas interacciones con
empresas e instituciones del sector público que generan información con una estructura
compleja, entre las que destacan la creación y aplicación de modelos estadísticos
multivariados, algoritmos computacionales y herramientas de minería de datos. En
aras de consolidar esta labor, y fortalecer estas áreas de investigación como pilares
que apuntalen al CIMAT como institución líder en modelación estadística de problemas
complejos, la integración de estos tres jóvenes catedráticos, aumentará la experiencia
y conocimiento acumulado en CIMAT; Asimismo estas incorporaciones fortalecerán la
planta de profesores del programa de posgrado de próxima apertura.
5
Descripción del grupo de Investigación o personal académico asociado al
proyecto (Incluir los nombres de los miembros y sus especialidades) (máximo
2,000 caracteres):
Graciela González Farías. Investigador Titular C. SNI Nivel 3
Especialidad: Series de Tiempos, Modelos Multivariados
Víctor Muñiz Sánchez. Técnico Titular C.
Especialidad: Análisis de datos en alta dimensión, modelos de clasificación
Rodrigo Macías Páez. Investigador Asociado A. SNI Nivel Candidato
Especialidad: Modelos de clasificación y clustering
Johan Van Horebeek. Investigador Titular A. SNI Nivel 2
Especialidad: Reconocimiento estadística de patrones, aprendizaje estadístico, análisis
y modelación de datos multidimensionales
Rogelio Ramos Quiroga. Investigador Titular A.
Especialidad: Diseño de Experimentos, Estadística Espacial, Aprendizaje Estadístico e
Inferencia Estadística en Análisis Multivariado
Baidya Nath. Saha, Investigador Asociado C
Especialidad: Cómputo Estadístico, Vision Computacional e Ingeniería de software.
Actualmente posdoc en la Universidad de Calgary, integrándose a la Unidad Monterrey
en Julio de 2014.
6
Descripción de la infraestructura física disponible para ejecutar las actividades
del proyecto (máximo 2,000 caracteres):
El proyecto arquitectónico completo de la Unidad Monterrey del CIMAT en el Parque de
Investigación e Innovación Tecnológica (PIIT) consta de tres módulos de 6,255 metros
cuadrados de construcción total, más 2671 metros cuadrados de áreas externas. El
programa arquitectónico incluye biblioteca, cocina, comedor, oficinas administrativas,
almacén, taller para equipos de cómputo, sala de videoconferencias, dos salones para
seminarios multimedia, una sala de usos múltiples, una sala de juntas, y oficinas para
32 investigadores, 76 estudiantes, 32 técnicos académicos, 10 directivos (dirección,
coordinaciones, gerencias) y 16 auxiliares.
En el momento de escribir esto (marzo 2014) se tienen construidos y en fase de
acabados y equipamiento las instalaciones de la planta baja del módulo sur: 788
metros cuadrados, que pueden albergar 8 investigadores, 13 técnicos académicos, y 3
funcionarios; estas oficinas contarán con servicio de internet, tanto dentro de la RED
NIBA como en la RED RI3, ambas con velocidades de conexión de 1 Gbs a Internet II a
través de fibra óptica, y con internet comercial, que nos enlazará con la muy completa
biblioteca virtual de CIMAT Gto., y contarán con climatización y servicios de seguridad
y limpieza.
En cuanto a la infraestructura de cómputo, la Unidad Monterrey del CIMAT cuenta con
dos súper computadoras, una de 24 y otra de 12 Cores, con un total de 96 GB de RAM
y 8 tarjetas gráficas, que se enlazan al cluster “Insurgente” del CIMAT en Guanajuato lo
que proporciona la capacidad para realizar cómputo en paralelo con MPI y OpenMP y
visualización científica de manera local, y a través del “Insurgente” para ofrecer y
desarrollar servicios de Cómputo de Alto Desempeño.
7
Relación del proyecto con los programas de Posgrado registrados o susceptibles
de pertenecer al PNPC (máximo 2,000 caracteres):
Hasta ahora, personal de la Unidad Monterrey del CIMAT ha colaborado o colabora
bajo acuerdo con la Maestría en Estadística Aplicada del ITESM, de la que egresaron
varios de los técnicos académicos de la Unidad y que, como se ha dicho, desaparecerá
en poco tiempo, con la Maestría en Ciencias con orientación en Matemáticas y el
Doctorado en Matemáticas, de la FCFM de la UANL, con el departamento de
Psiquiatría del H.U. de la UANL, y con el Programa Multicéntrico de Residencias
Médicas del Tec de Monterrey y la SSNL.
Por otra parte, una de las implicaciones fundamentales del fortalecimiento de la planta
de investigadores en los temas que son centrales en la Unidad es la creación de un
programa de posgrado que se convierta en un programa de excelencia académica, con
el sello de generar una formación integral para la solución de problemas nacionales. Al
ser un programa más de CIMAT estará regido por los mismos criterios de excelencia de
los programas ya registrados a nivel internacional en el PNPC, ayudando a nutrirse de
esa experiencia.
8
Perfiles Solicitados
1. Grado Académico: Doctorado
Áreas del conocimiento: Ciencias Físico-Matemáticas y Ciencias de la Tierra
Disciplina: Matemáticas
Subdisciplina: Estadística
Experiencia Profesional (máximo 2,000 caracteres):
 Capacidad de investigar mientras realizan actividades de vinculación y
docencia
 Facilidad para liderar equipos y enseñar
 Experiencia para enseñar y dirigir tesis inicialmente de nivel maestría en
Modelación Estadística
 Perfil SNI
 Capacidad para la obtención de fondos a través de concursos y
convocatorias
 Capacidad para comunicarse, como puede ser requerida al exponer clases,
ponencias en inglés, proponer métodos, y mostrar resultados.
 De preferencia con aptitudes y /experiencia en Modelos de Reducción de
Dimensionalidad
 De preferencia con aptitudes y /experiencia para el trabajo de vinculación
Actividades a Desarrollar (máximo 2,000 caracteres):
 Desarrollar investigación Básica en Modelos Multivariados
 Establecer Vínculos con otros grupos de investigación en Big Data
 Fortalecer al grupo de Modelación Estadística de la Unidad Monterrey del
CIMAT
 Presentar avances de investigación en Talleres, Seminarios y Conferencias
 Impartir un curso por semestre, inicialmente en postgrados de instituciones
con las que se tenga acuerdo de colaboración, y eventualmente en el
postgrado en la Unidad Monterrey del CIMAT
 Escribir reportes técnicos, resúmenes y artículos científicos para publicación.
 Coadyuvar al fomento de transmisión de conocimiento de modelos para
datos con estructuras complejas.
9
2. Grado Académico: Doctorado
Áreas del conocimiento: Ciencias Físico-Matemáticas y Ciencias de la Tierra
Disciplina: Matemáticas
Subdisciplina: Otras subdisciplinas de las matemáticas
Experiencia Profesional (máximo 2,000 caracteres):
 Capacidad de investigar mientras realizan actividades de vinculación y
docencia
 Facilidad para liderar equipos y enseñar
 Experiencia para enseñar y dirigir tesis inicialmente de nivel maestría en
Modelación Estadística y Cómputo Avanzado
 Perfil SNI
 Capacidad para la obtención de fondos a través de concursos y
convocatorias
 Capacidad para comunicarse, como puede ser requerida al exponer clases,
ponencias en inglés, proponer métodos, y mostrar resultados.
 De preferencia con aptitudes y /experiencia en Modelos de clasificación bajo
diferentes enfoques y algoritmos de optimización
 De preferencia con aptitudes y /experiencia para el trabajo de vinculación
Actividades a Desarrollar (máximo 2,000 caracteres):
 Desarrollar investigación básica en modelos de clasificación bajo diferentes
enfoques y algoritmos de optimización
 Establecer Vínculos con otros grupos de investigación en Big Data
 Fortalecer al grupo de Modelación Estadística de la Unidad Monterrey del
CIMAT
 Presentar avances de investigación en Talleres, Seminarios y Conferencias
 Impartir un curso por semestre, inicialmente en postgrados de instituciones
con las que se tenga acuerdo de colaboración, y eventualmente en el
postgrado en la Unidad Monterrey del CIMAT
 Escribir reportes técnicos, resúmenes y artículos científicos para publicación.
 Coadyuvar al fomento de transmisión de conocimiento de modelos para
datos con estructuras complejas.
10
3. Grado Académico: Doctorado
Áreas del conocimiento: Ciencias Físico-Matemáticas y Ciencias de la Tierra
Disciplina: Matemáticas
Subdisciplina: Otras disciplinas de las matemáticas
Experiencia Profesional (máximo 2,000 caracteres):
 Capacidad de investigar mientras realizan actividades de vinculación y
docencia
 Facilidad para liderar equipos y enseñar
 Experiencia para enseñar y dirigir tesis inicialmente de nivel maestría en
Modelación Estadística y Cómputo Avanzado
 Perfil SNI
 Capacidad para la obtención de fondos a través de concursos y
convocatorias
 Capacidad para comunicarse, como puede ser requerida al exponer clases,
ponencias en inglés, proponer métodos, y mostrar resultados.
 De preferencia con aptitudes y /experiencia en Cómputo Paralelo y Manejo
de Bases de Datos
 De preferencia con aptitudes y /experiencia para el trabajo de vinculación
Actividades a Desarrollar (máximo 2,000 caracteres):
 Desarrollar investigación básica en modelos de clasificación bajo diferentes
enfoques y algoritmos de optimización
 Establecer Vínculos con otros grupos de investigación en Big Data
 Fortalecer al grupo de Modelación Estadística de la Unidad Monterrey del
CIMAT
 Presentar avances de investigación en Talleres, Seminarios y Conferencias
 Impartir un curso por semestre, inicialmente en postgrados de instituciones
con las que se tenga acuerdo de colaboración, y eventualmente en el
postgrado en la Unidad Monterrey del CIMAT
 Escribir reportes técnicos, resúmenes y artículos científicos para publicación.
 Coadyuvar al fomento de transmisión de conocimiento de modelos para
datos con estructuras complejas.
11
Descargar