Corpus Ex Machina: semillero de lingüística computacional

Anuncio
1
Corpus Ex Machina: semillero de lingüística computacional
Descripción:
Corpus Ex Machina es un semillero que forma parte del GES, Grupo de Estudios Sociolingüísticos,
adscrito a la Facultad de Comunicaciones de la Universidad de Antioquia. Inicia labores a inicios del
año 2016 como resultado del trabajo realizado en la asignatura de Lingüística Computacional del
pregrado Letras: Filología Hispánica. Está conformado por estudiantes de dos pregrados de la
Universidad de Antioquia, Letras: Filología Hispánica y Licenciatura en Educación Básica con énfasis
en Lengua Castellana.
Objetivos:
Corpus Ex Machina tiene como objetivo principal afianzar el conocimiento en el área de la lingüística
computacional y trabajar sobre corpus lingüísticos. Busca para ello, que los estudiantes se formen en el
campo de la investigación, utilizando los procedimientos y las herramientas que la informática provee
para el análisis de dichos corpus.
Este semillero tiene además como objetivo, el fundamentarse en la interdisciplinariedad como forma de
trabajo, ya que consideramos que a partir de esta podremos avanzar como investigadores mejor
formados y complementados.
Áreas de trabajo:
- Lingüística de corpus
- Modelización de sistemas que tratan el lenguaje natural
- Procesamiento del lenguaje natural
- Semántica de corpus
- Sistemas de Aprendizaje de Lenguas Asistidos por Ordenador (ALAO)
Balance de actividades:
2
Nos hemos concentrado en dos proyectos:
- Proyecto de etiquetado morfosintáctico del corpus PRESEEA, corpus perteneciente al grupo de
Estudios Sociolingüísticos de la Universidad de Antioquia.
- Proyecto de etiquetado del corpus para el dispositivo de enseñanza del español como lengua
extranjera (DISEELE).
Por el momento se ha hecho un estudio y una evaluación de las diferentes herramientas para la
anotación y el etiquetado del corpus PRESEEA, y se ha realizado un sondeo sobre los textos que se
pueden ir adecuando para el corpus DISEELE.
Actividades segundo semestre 2016:
Periodo
Acciones
Julio 2016
- Inicio de actividades de anotación del corpus PRESEEA.
- Consecución de textos para corpus DISEELE.
- Lectura y análisis crítico de artículos acerca de sistemas de anotación de
corpus en español.
Agosto 2016
- Continuación del trabajo de anotado y etiquetado del corpus PRESEEA.
- Constitución del corpus DISEELE.
- Escritura de, por lo menos, un artículo de investigación por parte de los
integrantes del grupo para ser enviado a una revista en el área de la lingüística
aplicada.
Septiembre 2016
- Análisis de los primeros trabajos de anotación del corpus PRESEEA.
- Corrección de errores de anotación, corpus PRESEEA.
- Inicio de anotación y etiquetado del corpus DISEELE.
- Envío de ponencias para diferentes eventos en el área de la lingüística.
Octubre 2016
- Continuación del trabajo de anotado y etiquetado del corpus DISEELE.
- Lectura crítica de artículos de investigación.
- Preparación para el coloquio de lingüística del mes de noviembre de 2016.
Noviembre 2016
- Análisis de los primeros trabajos de anotación del corpus DISEELE.
- Corrección de errores de anotación del corpus DISEELE.
3
- Participación en un evento en el área de la lingüística.
Diciembre 2016
- Evaluación del trabajo realizado durante el segundo semestre 2016.
- Observar los diferentes eventos (congresos y coloquios) del año 2017 y
comenzar a preparar las propuestas de comunicación, con el fin de mostrar
los primeros resultados de nuestro trabajo.
- Reunión para establecer el cronograma de actividades del semestre 01 de
2017.
Coordinador del semillero:
Profesor Jorge Mauricio Molina Mejía. Doctor en Informática y Ciencias del Lenguaje. Docente de
cátedra Facultad de Comunicaciones Universidad de Antioquia, programa Letras: Filología Hispánica.
Miembros del semillero:
Estudiantes de Letras: Filología Hispánica:
Ana María Quiroz Moncada
Andrés Felipe Grajales Ramírez
Daniel Arango Rivera
David Alexis Arboleda Méndez
José Luis Pemberty Tamayo
Mariana Múnera Manco
Estudiantes de Licenciatura en Educación Básica con énfasis en Lengua Castellana:
Esnedy Montoya Galeano
Franklin Yessid Arias Bedoya
Descargar