“Lenguas y Tecnologías de la Lengua en España“! Núria Bel! Universitat Pompeu Fabra! META-NET Executive Board! Co-editora del ! “Informe sobre el estado de las tecnologías del lenguaje en España dentro de la Agenda Digital para España”! Taller ELRC Madrid (España), 26-­‐01-­‐2016 1 Tecnologías de la Lengua, Procesamiento del Lenguaje y Traducción Automática! • Tecnología para leer documentos y …" – corregirlos" – extraer información, " – inducir información, " – traducirlos, " – … lo que hacemos las personas con textos …" automáticamente! • Estas tecnologías requieren “motores” (algoritmos) y “gasolina” (datos). " • La gasolina son muchos documentos para cada idioma: los recursos lingüísticos" Taller ELRC Madrid (España), 26-­‐01-­‐2016 2 Multilingual Europe Technology Alliance ! Taller ELRC Madrid (España), 26-­‐01-­‐2016 Evaluación de la existencia de recursos lingüísticos en Europa (2012) ! "" "" Taller ELRC Madrid (España), 26-­‐01-­‐2016 Resultados Evaluación Traducción Automática (2012) ! Taller ELRC Madrid (España), 26-­‐01-­‐2016 Diagnóstico! Taller ELRC Madrid (España), 26-­‐01-­‐2016 6 Traducción Automática en España! 2006 2005 2000 2011 2015 Taller ELRC Madrid (España), 26-­‐01-­‐2016 2013 La dimensión del multilingüismo en España! • España cuenta con una lengua oficial y 3 cooficiales" • Además, en lo cotidiano, el multilingüismo se amplía por:" – – – – – – Turismo" Comercio" Desarrollo y cooperación entre regiones de Europa" Cuestiones legales transfronterizas" Inmigración" y Relaciones Internacionales. " Taller ELRC Madrid (España), 26-­‐01-­‐2016 Entorno lingüístico de España ! Lenguas vecinas: Portugués Francés Árabe Bereber Taller ELRC Madrid (España), 26-­‐01-­‐2016 9 Multilingüismo en la colaboración transfronteriza ! FRANCÉS • Relaciones transfronterizas, ejemplos:" PORTUGUÉS " • Colaboración de ambulancias y servicios de emergencias" • Seguridad y control de fronteras" • Proyectos de infraestructuras" – Carreteras" – Trenes" – Servicios postales" • Infraestructuras financieras" Taller ELRC Madrid (España), 26-­‐01-­‐2016 Multilingüismo e Inmigración ! 8000 Número de residentes extranjeros Thousands of foreign citizens 7000 (fuente: Eurostat 2009) 6000 5000 4000 Comparativa países EU España el 2º país con más residentes extranjeros 3000 2000 1000 0 Taller ELRC Madrid (España), 26-­‐01-­‐2016 Multilingüismo e Inmigración! • Residentes extranjeros en España (ine, 1-07-2015)" – 4.426.000 residentes extranjeros" – 2.823.000 provienen de la Unión Europea (libre circulación)" • Las lenguas más habladas :" 1. 2. 3. 4. 5. 6. Rumano" Árabe / bereber" Inglés" Italiano" Chino" Búlgaro" Taller ELRC Madrid (España), 26-­‐01-­‐2016 Multilingüismo y Comercio Exportación Española (2015) ! Ranking Exportaciones Países y lenguas 1. 2. 3. 4. 5. 6. 7. Francia, francés Alemania, alemán Italia, italiano Portugal, portugués Reino Unido, inglés Estados Unidos, inglés Países Bajos, neerlandés 8. Bélgica, francés, neerlandés 9. Marruecos, árabe y bereber 10. Turquía, turco Taller ELRC Madrid (España), 26-­‐01-­‐2016 13 Multilingüismo y Comercio Importación Española(2015)! Ranking Importaciones Países y lenguas 1. 2. 3. 4. 5. 6. Alemania, alemán Francia, francés Italia, italiano China, chino Reino Unido, inglés Países Bajos, neerlandés 7. Estados Unidos, inglés 8. Portugal, portugués 9. Bélgica, francés, neerlandés 10. Rusia, ruso 11. Argelia, árabe, bereber Taller ELRC Madrid (España), 26-­‐01-­‐2016 14 Recursos disponibles + tecnología! "" " La necesidad de traducción " es garantía de que existen datos: documentos y " traducciones La tecnología actual permite re-utilizar todos los recursos disponibles para ayudar a cubrir las enormes necesidades de traducción que existen. Taller ELRC Madrid (España), 26-­‐01-­‐2016 15 ya ampliamente utilizados ... en sectores especializados! El rendimiento mejora si se dispone de datos de cada dominio en el que se quiere utilizar Taller ELRC Madrid (España), 26-­‐01-­‐2016 16 TL en España: Empresas españolas! Andalucía: MTC Soft, Victor Translator, Indysys Cataluña: Lucy Software, Verbio Technologies, INCYTA, Inbenta , AutomaticTrans, Viclone virtual solutions, websays, Tekstum, sisu-labs, tauyou <language technology>, Artificial Solutions, Ateknea Solutions, Inbenta, ExpertSystem Ibérica. Extremadura: Oteara. Galicia: Cilenis, Imaxin. Madrid: Daedalus, Celer soluciones, Seprotec Multilingual Solutions, Habla Computing, Molino de Ideas, Bitext innovations, Paradigma Tecnológico, Mamvo Performance, Sigma Technologies, Linguaserve, Sentisis, Playence, Fonetic Solutions, Semantia Lab, Hermés Traducciones. País Vasco: Fundación Eleka, Elhuyar, Anboto Europe, Todoentradas, Centro Tecnológico Vicomtech, Mapalia Networks, IK4-IDEKO, Mondragón Lingua, Sherpa. Valencia: Innovative Social Technologies, Pangeanic, Prompsit. Taller ELRC Madrid (España), 26-­‐01-­‐2016 17 TL en España: Centros de investigación en tecnologías de la lengua! " " " " " " Mapa de la investigación en España UVigo, UCoruña UNED, UAM, UPM, UEM, UCM, UCIII, RAE UGC UPV, Deusto Taller ELRC Madrid (España), 26-­‐01-­‐2016 UPC, UPF, UB, UOC, UAB UPV, UA UJaén, USevilla, UGranada TL en España Plan de Impulso SETSI (2016-2020)! Taller ELRC Madrid (España), 26-­‐01-­‐2016 19 Organización, organización, organización…! " " Tenemos datos ... hay que organizarse! Taller ELRC Madrid (España), 26-­‐01-­‐2016 Taller ELRC Madrid (España), 26-­‐01-­‐2016 21