Corpus para aprendizaje en Procesamiento del Lenguaje Natural (PLN) Lucía Martínez García Licenciatura en Documentación Universidad Carlos III de Madrid 100047248@alumnos.uc3m.es Corpus para aprendizaje en Procesamiento del Lenguaje Natural (PLN) Los corpus lingüísticos son útiles para el aprendizaje en Procesamiento del Lenguaje Natural (PLN). Los corpus pueden verse como herramientas para la recuperación y organización de la inforamción , ya que estructuran de una manera ordenada textos para que puedan ser fácilmente recuperados y utilizados, por ejemplo, para la investigación en el ámbito académico. La lingüística del corpus es la subdisciplina de la lingüística que estudia este tipo de banco de datos. Normalmente se asocia con la lingüística computacional y con las aplicaciones del procesamiento de lenguaje natural . Además, los corpus deben mostrar de alguna manera cómo funciona una lengua natural , además de permitir mejorar el conocimiento de las estructuras lingüísticas de la lengua que representan. Debido a que los corpus tanto textuales como orales siguen una serie de pautas y criterios normalizados de presentación del lenguaje natural , indican la ortografía y gramática adecuadas, y gracias a ellos es más fácil dar las instrucciones precisas para que los ordenadores "entiendan" el lenguaje natural .