Traducción automática del árabe al castellano y viceversa: problemas y soluciones Shatha Kareem Atta Esam Ahmed Nasser Reyadh Mahdi Jasim Universidad de Bagdad RESUMEN En este artículo presentamos nuestro trabajo en traducción automática entre las lenguas árabe y castellana e intentar diagnosticar las dificultades y ofrecer la solución adecuada. INTRODUCCION La traducción, en general, es transmitir el significado de un texto de un idioma a otro, teniendo en cuenta la precisión y el estilo. Esto requiere la comprensión del texto original y su contenido. En este caso, el traductor debe tener fluidez en ambos idiomas. En cambio, en la traducción automática o electrónica no interviene el ser humano en esta tarea. El propósito de esta investigación es estudiar las dificultades y los errores gramaticales, morfológicos, semánticos y ortográficos en la traducción automática, e intentar a través del análisis buscar soluciones y ofrecer consejos y recomendación para tener una calidad de traducción aceptable. Sin duda alguna, la traducción mediante la informática tiene interés por parte de los usuarios por su capacidad de elaborar traducciones con gran rapidez y cuantía, no obstante, este tipo de traducir puede ofrecernos puntos de debilidad como el hecho de las dificultades con palabras de distintos significados, términos y los usos metafóricos de lengua. Otras dificultades consisten en la diferenciación entre los que requiere la traducción semántica o profesional y la traducción comunicativa. (Taha Yusuf, Lina, 2010). En primer lugar, podemos decir y a través de la experiencia en los textos traducidos, que los textos traducidos de una lengua a otra mediante el uso de la informática, requieren una revisión por parte de traductores especialistas de 2 a 4 por ciento a fin de ser admitidos a la publicación, dicha revisión puede comprender el nivel léxico, la composición de oraciones, etc.…, por lo cual, ofrecemos, en este apartado los motivos lingüísticos y estilísticos que obstaculizan el proceso de traducir de una lengua, como el Árabe, por ejemplo, hacia otras lenguas, como la lengua inglesa. 1 A pesar de haber más de mil programas de traducción mediante la informática, no obstante, al lado de la red de internet, que facilita el proceso de entregar los textos ya traducidos, no obstante, podemos ver muchos defectos en la forma de traducir. Los puntos a los que podemos aplicar, aquí, a la lengua árabe, los podemos aplicar a otras lenguas, salvo el campo de la poesía y prosa, por su forma metafórica de alta precisión. Uno de estos puntos se refiere a la falta de puntuación (signos de puntuación), lo que hace que el texto árabe sea más complicado de tratarse. La longitud de la oración árabe puede mostrar inconveniencia en la traducción, pues el intermedio de esta longitud consta de 32 palabras, lo cual hace que el aparato procese lentamente para la traducción. Se puede superar a este obstáculo mediante la división de la oración a varias sílabas, como a complementos circunstanciales, preposicionales. Otro obstáculo que podemos mencionar, aquí, es la dimensión histórica, pues hay que tener en cuenta los textos escritos hace siglos de tiempo con los escritos hoy día, pues hay palabras que cambiaron de significado, otros que han cambiado de forma como es el caso de la palabra ( )السيارةque antes daba un significado de (peatón) y ahora da significado de coche. La escasez de los textos traducidos de árabe a otras lenguas y viceversa hace qua la operación de traducir carezca de un corpus propicio de palabras basado en la traducción estadística. Por mucho que nos ahorre la traducción mediante la informática de tiempo, sin embargo, se queda lejos de la precisión de dar equivalencia de sentido de las ideas del texto original; a demás, vemos que hay delimitación de la capacidad del aparato a cerca de las palabras memorizadas, la forma de composición de oraciones y su conjunción, lo cual hace más propicio que los traductores traduzcan. Otro punto que podemos mencionar, se refiere a la falta del aparato al factor sentimental que tiene el traductor que lo guíe hacia la elección de una palabra y no de otra. La necesidad de este factor aumenta más en la traducción poética y prosa por sus cualidades y también en dependencia de la lengua, pues entre el castellano, el francés y el italiano, hay un acercamiento de entendimiento del texto literario árabe, mientras que en lengua como la lengua alemana, vemos que hay un entendimiento del texto literario en cuanto a la metáfora. La TA es poco fiable todavía y sólo resulta viable con textos de gramáticas controladas que respondan a patrones fijos y con pares de lenguas de estructura sintáctico-gramatical similar. Éste es el caso de las lenguas de especialidad, en las que se están obteniendo los mejores resultados, ya que son áreas bien delimitadas con un léxico definido y restringido, cuyas estructuras son fijas y, por lo tanto, son más controlables por el sistema de TA que las estructuras de las lenguas naturales. Antes que nada debemos contestar a la pregunta: ¿por qué queremos automatizar el proceso de traducción? Para poder responder a esta pregunta, primero hay que identificar tres tipos de uso de la TA. Primero Hutchins (2007) menciona la necesidad tradicional de traducciones de calidad “publicable”, en 2 especial la producción de documentación multilingüe para grandes empresas. Sin embargo, muchas veces uno no necesita una traducción perfectamente correcta, sino una traducción que se pueda producir rápidamente (a veces inmediatamente) y que transmita la esencia del texto original, aunque ello suponga valernos de frases gramaticalmente imperfectas, con un léxico extraño y con un estilo rudimentario. Llamamos a este segundo tipo de uso “TA para asimilación”. La complejidad de la TA está relacionada con la riqueza de las lenguas naturales. El procesamiento de lenguas naturales es algo muy complejo que todavía no entendemos completamente. ¿Qué es lo que hace tan difícil procesar estas lenguas naturales? Cuetara Priede (2007:10) presenta la siguiente definición de las lenguas naturales: Una lengua natural es un conjunto de símbolos vocales arbitrarios por medio del cual se comunican los seres humanos. Tal conjunto está organizado en un sistema de relaciones, sintagmáticas y paradigmáticas, muy cohesionadas que hace posible que el habla sea un sistema de comunicación muy preciso y especializado. Esta arbitrariedad de la lengua natural también la menciona el lingüista Charles F. Hockett (1960) en sus quince rasgos definitorios de la lengua natural. Algunos de los rasgos definitorios que discute Hockett también se encuentran en la comunicación animal y en las lenguas formales, pero sólo las lenguas naturales tienen todos estos rasgos. Mencionaremos aquellos que muestran la complejidad de una lengua natural a la hora de automatizarla. Con la arbitrariedad Hockett quiere decir que no existe correlación entre el signo (signifiant) y el significado (signifié). Por ejemplo, los fonemas que crean la palabra “libro” no tienen ninguna relación con el concepto de “libro”. No hay ninguna razón para que el concepto de un conjunto de hojas debiera ser un “libro” y no cualquier otra combinación de fonemas2. Otro rasgo interesante de Hockett es la productividad de una lengua, es decir que las reglas de la gramática permiten la creación de una infinita cantidad de construcciones sintácticas; en otras palabras, lo que Chomsky (1977) llama “gramática generativa”, permite la creación de oraciones que jamás han sido creadas, pero que pueden ser entendidas. Por ejemplo, la frase <<Con el perro en mi armario azul hablo sobre mis vacaciones en Marte durante el verano de 1970>>, probablemente es una frase que nunca antes ha sido creada, pero que un hispanohablante puede entender perfectamente. El rasgo de transmisión cultural quiere decir que la lengua humana no es innata, sino un producto de la evolución histórica que se transmite entre generaciones. Por consiguiente, una lengua natural está vinculada con la evolución cultural e histórica de una región. Es obvio que por lo menos estos tres rasgos producen problemas a la hora de automatizar una lengua. La TA es útil cuando lo que se pretende es hacer una aproximación rápida a los contenidos, y también cuando se procede a corregir de manera profesional el resultado. La TA puede ser una potente herramienta si el que la usa conoce las limitaciones del programa y las peculiaridades de las lenguas en contraste. Con el paso del tiempo las estrategias, la capacidad de los ordenadores y los diccionarios mejoran sustancialmente, y proliferan los recursos que pueden consultarse en línea. 3 La TA es un instrumento útil para conseguir un plurilingüismo igualitario y sostenible y para reforzar los procesos de estandarización en lenguas recesivas o minorizadas. La TA es rentable cuando traducimos sistemas lingüísticos cercanos desde el punto de vista cultural y gramatical, o si se da alguno de ambos casos. SISTEMAS DE TRADUCCION AUTOMATICA ARABES: En algunos países del mundo árabe podemos encontrar iniciativas de traducción automática. Podemos destacar, entre otros, productos ya maduros como: Sistema de "Al-Muteryim Al Arabi=traductor árabe", desarrollado por la empresa “ ATA” en Londres, y la compañía tiene una sucursal en la capital de Omán “ Masqat”. Sistema de "Arabtrans", ha sido desarrollado por una compañía árabe también se encuentra en Londres, y estaba disponible en los mercados árabes. Sistema de "operador árabe", que fue desarrollado por CIMOS Árabe en París, y este sistema son los sistemas más ambiciosos, donde la compañía ha enumerado cuatro programas para la traducción entre el inglés y árabe y en francés y árabe - el programa para cada dirección. Sistema de Apptek, que fundado también por una empresa árabe que trabaja en uno de distritos de Washington. Al-Wafi, un sistema que parece que deriva de Al-Muteryim Al-Arabi. Al-Misbar que es también, aparentemente derivado principalmente de "traductor de árabe." Está disponible en Internet. Ayib, que es creado la empresa “Al-Alamiya”. Hay otros sistemas más de traducción automática que han comenzado a invadir los mercados árabes, pero la mayoría carecen de una programación avanzada, tales como al-Muteryim Al-Kafi, Al-Muteryim Al-Dahabi y otros. CORPUS Teniendo en cuenta la distancia lingüística y cultural que hay entre el árabe y el español, y partiendo de este punto, podemos entender los problemas y las dificultades de la traducción automática que puedan surgir a la hora de pasar un texto de una lengua a otra. 4 Para demostrar algunos de estos problemas inherentes a la traducción automática, conviene revisar unos cuantos ejemplos. Veamos ahora una frase sobre la herencia, traducida del árabe al castellano por uno de los traductores automáticos disponibles en línea (Google): انىصُخ انصذُذخ انُبفرح La ventana de la derecha El correcto testamento vigente... mandamiento… Traducción Traducción humana automática Notamos que la traducción no tiene nada que ver con texto original, pues se ha traducido el sustantivo “ ”انىصُخcuya función es sujeto en árabe por “mandamiento” en lugar de “testamento” y el adjetivo “ ” انصذُذخpor derecha como si fuera un sustantivo. Lo peor de todo es el otro adjetivo “ ”انُبفرحque significa “vigente”, o “valido” y no “ventana” como la ha traducido muestra querida máquina en este ejemplo, por tratarse de una palabra homógrafa, el programa de TA no la ha reconocido. Como se puede observar que los resultados han sido desastrosos. Es común que los traductores automáticos lanzan traducciones excesivamente literales, realizadas palabra por palabra, con gramática incorrecta, en ocasiones francamente ininteligibles. Ahora veamos otro ejemplo más complejo, se trata de un versículo extraído del Corán, Sura: la familia de Imran, 144. ش ُْئًب َ ٍَ َضُسَّ انهَّه ْ ت عَهًَ عَ ِم َجُْهِ فََه ْ ٍِ َُْمَه ْ سمُ أَفَِئٌْ يَبدَ َأوْ ُل ِزمَ اَْمََه ْجزُ ْى عَهًَ َأعْمَبثِكُ ْى وَ َي ُ ًَُّدٌ إِنَّب زَسُىلٌ َلدْ خَهَذْ ِيٍْ َلجْهِهِ انس َّ وَيَب يُذ Sin embargo, el Profeta Muhammad y han pasado antes que él en efecto, muerto o han sido asesinados en Anglaptm Oakabkm y girando sobre sus talones no le hará daño Dios una cosa y Sadze Dios gracias. TA Mahoma no es sino un enviado, antes del cual, han pasado otros enviados, si pues, muriera o lo mataran, ¿ibais a volveros atrás? Quien se vuelva atrás no causará ningún daña a Alá. Alá retribuirá a los agradecidos. (Traducción Juan Vernet) De las dos traducciones anteriores, es muy fácil distinguir los errores cometidos por los medios electrónicos. ذهت أيٍُ يع أخزه صبدلخ انً انسىق Amīn fue con su hermana, honesto-a-mercado. Traducción automática Amīn y su hermana Sādiqa se fueron al mercado. Traducción humana En este ejemplo, se traduce el nombre propio femenino “ ”صبدلخcomo si fuera un sustantivo común masculino y pone la preposición “A” entre dos guiones sin añadirle a ésta el artículo determinado contracto “al”. ذهت ونى َعد 5 Oro ya no es. Traducción automática Se fue sin volver. Traducción humana Francamente, la traducción del ejemplo anterior es desastrosa porque que tiene que ver el verbo “ir, ”ذهتcon el sustantivo “oro”. Como se trata de una palabra homógrafa otra vez se equivoca el programa de distinguir entre los dos vocablos; el primero es un verbo en pasado mientras el segundo es sustantivo. El problema no termina con esto sino, en el texto original hay otro verbo (volver, )َعد, traducido y cambiado por otro copulativo. Además ha introducido la partícula ya injustificablemente. فال رظٍ أٌ انهُث َجزسى أذا زأَذ أَُبة انهُث ثبزشح Si usted ve que no los colmillos de un prominente Laith pensar que está sonriendo. TA Si ves asomar los dientes del león no pienses que sonríe. TH En el ejemplo anterior se puede observar las faltas cometidas por el traductor automático. El conjunto de elementos físicos que integran un ordenador se denomina HARDWARE. يجًىعخ يٍ انعُبصس انًبدَخ انزٍ رؤنف جهبش كًجُىرس ودعب األجهصح En el ejemplo anterior, la traducción iba correctamente, pero llegando al verbo denominarse, el programa falla en traducirlo bien. Primero transforma su tiempo en pasado en lugar de presente, y añade innecesariamente la conjunción coordinante copulativa Y (WA )و. Por otra parte, el verbo traducido está ortográficamente mal escrito. Otro error que se comete por la máquina al traducir la palabra hardware por االجهصحque significan dispositivos o aparatos. Ahorrar no es sólo guardar sino saber gastar. أعرف قضاء إنقاذ ولكن ليس االدخار Para saber la traducción hecha por google, ponemos la traducción literal: Ahorrar no solamente, pero salvar/rescatar gastar saber. El siguiente ejemplo es un proverbio español que recomienda la prudencia antes de hablar: Antes de hablar, pensar وانزفكُس،لجم انذدَث Traducción automática Antes de hablar, y pensar. Traducción literal 6 Hemos escogido un ejemplo literario, un fragmento de las Coplas de Jorge Manrique por la muerte de su padre. Recuerde el alma dormida, avive el seso y despierte contemplando cómo se pasa la vida, cómo se viene la muerte tan callando, cuán presto se va el placer, cómo, después de acordado, da dolor; cómo, a nuestro parecer, cualquiera tiempo pasado fue mejor. raducción Traducido por máquina traducción literal umana رركس انسوح انُىو Recuerda el alma el sueño رركس النائمة الروح رسسَع ورىلظ فٍ انديبغacelerar y despierta en el celebro أدٍُ انعمم واستيق رفكس piensa وتأمل ، كُف رُفك دُبركcomo gastas tu vida الحياة تمر كيف كُف َأرٍ انًىد como viene la muerte الموت يأتي وكيف ،هبدئخ نهغبَخmuy lenta صامتا ،كُف سُكىٌ يٍ دواعٍ سسوزٌ ثسسعخcomo con mucho gusto rápido رحيل سريع هو وكم ثعد اٌ وافمذ، كُفcomo, después المتعة أنى َعطٍ؛dolor da تألفنا أن بعد وكٌف ، فٍ زأَُب، ٍكُف ًَكcomo puede, a nuestro parecer األلم لنا ٌسبب أيضً أٌ ولذha pasado cualquier tiempo رأٌنا فً وكٌف وكبٌ أفضمy fue mejor مضى قد زمن أي أن أفضل هو El otro ejemplo es un fragmento de un poema del poeta español Miguel Hernández de su poesía titulada “A mi hijo”: Te has negado a cerrar los ojos, muerto mío, abiertos ante el cielo como dos golondrinas: su color coronado de junios, ya es rocío alejándose a ciertas regiones matutinas. 7 Traducción humana Traducido por máquina يا يُزٍ زفضذ أٌ رغهك عُُُك رىفٍ األنغبو،وقد زفضذ نك َغًض عُُُه :المفتوحتين فٍ انسًبء كعصفىزٌ سُىَى : ٍُُمفتوحة عهً انسًبء َجزهع يثم اث لونهما انًزىج ثشهس دصَساٌ لد أصجخ َدي اَهب انُدي،توج َىَُى نىَه راحال نهًُبطك انصجبدُخ .بعيدا إنً يُبطك يعُُخ انصجبح . Su traducción literal es la siguiente: Te ha negado cerrar tus ojos, se han muerto las minas Abiertas ante el cielo, se traga como dos La corona de junio es su color, es rocío Lejos, a determinadas zonas de mañana. De la traducción anterior, se puede notar que el programa es incapaz de dilucidar las funciones gramaticales que cumple cada una de las palabras que componen esta forma compuesta del verbo pronominal “negarse” traduciéndolo como un verbo normal. Y ha cambiado unas palabras por ejemplo, “muerto mío” por otras “minas” y omisión de unas como “golondrinas”, etc. El Registro Civil constituye la prueba de los hechos inscritos. Sólo en los casos de falta de inscripción o en los que no fuera posible certificar (obtener certificación) el asiento se admitirán otros medios de prueba, pero en el primer supuesto será requisito indispensable para su admisión que, previa o simultáneamente, se haya instado la inscripción omitida o la reconstitución del asiento. إال أٌ فٍ دبالد عدو رسجُم أو دُث ال ًَكٍ انزصدَك عهً ) انذصىل عهً شهبدح (ال َجسو. السجل انًدٍَ هى دنُم عهً انىلبئع انًسجهخ . دثذ درف أو إعبدح دخىل انًمعد، ونكٍ فٍ اندوزح األونً شسطب أسبسُب نهمجىل لجم أو فٍ َفس انىلذ،عمد يمعد ضًٍ األدنخ La primera frase está bien traducida, pero otra vez el traductor falla en traducir el verbo ser en subjuntivo. Y por haber los dos paréntesis, la maquina no ha sido capaz de interpretar la continuación de la oración. Por otro lado, la palabra asiento por ser polisémica, el traductor fracasa en distinguir su verdadero significado en el texto. Omisión del verbo copulativo SER. Sin dar más comentarios, traducimos literalmente la traducción: El registro civil constituye la prueba de los hechos inscritos. Pero, en los casos de falta de inscripción o no es posible certificar que (obtener certificación) no se firma contrato silla dentro de las pruebas, pero en el primer supuesto un requisito indispensable para aceptar antes o después en el mismo tiempo, se exhorta a borrar o reinscripción de la silla. Al comparar los resultados obtenidos del análisis de ambos corpus cabe destacar que tanto la traducción automática del árabe al castellano como del castellano al árabe ha tenido muchos problemas y 8 dificultades de comprensión y distinción. Esa confusión se debe, por una parte, a los tipos de textos que se pretende traducir (religioso, jurídico, literario, etc.), por otra parte, por la divergencia cultural y lingüística que hay entre dos lenguas y culturas relativamente tan distantes y distintas. En cuanto a los ejemplos analizados en este estudio, todos ellos nos demuestran que la ausencia de un mecanismo para aprehender el contexto oracional impide al programa de TA analizar las relaciones sintácticas contiguas al interior de la oración y percibir las distintas posibilidades de interpretación de la polisemia presente en el corpus. CONCLUSIONES De lo anterior se puede concluir los siguientes puntos: * La traducción automática es sólo una forma que puede ayudar a superar la barrera del idioma dada la gran explosión de información que vive la sociedad del siglo XXI. * No se puede prescindir del trabajo humano en la labor de traducción, sobre todo en la traducción literaria o del área humanística, aunque por otra parte debe considerarse a la traducción automática como elemento de gran apoyo para las traducciones de tipo técnico. Teniendo en cuenta que el lenguaje es un producto cultural y social que resulta demasiado complicado y sutil para las máquinas. Las máquinas son incapaces de manejar todo el vocabulario, gramática, contexto y matices existentes en la lengua fuente y la lengua meta. Es verdad que la tecnología ha mejorado con el paso del tiempo, pero es un hecho irrefutable que la traducción automática sólo sirve para dar una idea muy general de lo que dice el texto. Cuando se trata de traducción, una máquina no puede y nunca podrá reemplazar a los seres humanos. * La traducción automática es ahora tema de trabajo de investigación de lingüistas, ingenieros y científicos de la información entre otros, queda entonces, en nosotros bibliotecarios profesionales, profundizar más acerca del tema. * Es necesario equilibrar la participación entre el traductor humano y la máquina, es decir, se debe buscar el punto óptimo de interactividad. La máquina debe ayudar al traductor, o en el caso más ambicioso, a un usuario que desconozca totalmente la lengua de llegada, con todos los instrumentos disponibles y en los que la informática es más eficaz: repertorios de términos, de ejemplos, de modelos, etc. *La máquina debe consultar con el traductor todos los casos en los que la complejidad computacional es mayor (ambigüedad, estilo, etc.), es decir, en aquellas cuestiones en las que la máquina se desenvuelve con mayor dificultad. La máquina debe permitir la integración de los procesos de redacción y de traducción. Previo estudio de los sublenguajes y de la tipología textual, debe ofrecer modelos de texto ya conocidos y que tienen equivalencias bien establecidas en la lengua meta. En suma, de este breve análisis de algunos problemas importantes en la traducción automática no debería obtenerse la impresión de que los sistemas basados en algunas estrategias son inviables. Al contrario, la traducción automática está ya en Internet y constantemente se están desarrollando sistemas experimentales, pre-comerciales y comerciales que utilizan diferentes versiones de las estrategias. El objetivo de este artículo 9 ha sido resumir algunos de los problemas e ilustrarlos con algunos ejemplos que muestran sus implicaciones prácticas. Para tener un texto relativamente bien traducido automáticamente y para obtener una traducción de calidad, se recomienda seguir los siguientes consejos: Antes de enviar el texto a traducir, es aconsejable realizar revisión y corrección previas. Se procura evitar frases demasiado largas y eliminar ambigüedades estructurales. Construir frases completas, claras e inconfundibles. Tratar de evitar ciertas frases como las pasivas. Utilizar correctamente la puntuación: puntos, comas, signos interrogativos, etc., porque es determinante para dar el correcto sentido a la frase. Poner las letras semivocales encima de las palabras. Intentar evitar introducir palabras o frases coloquiales o expresiones idiomáticas como las frases hechas, modismos, proverbios, etc. No introducir abreviaturas desconocidas. Intentar separar los nombres propios que puedan tener algún significado para no confundir el sustantivo con el adjetivo calificativo. Bibliografía Alan K. Melby. 1995. The Possibility of Language. A discussion of the nature of language with implications for human and machine translation. John Benjamins. Al-Jattab, Maamun (2008): la traducción automática del árabe: problemas y soluciones. Circulo de Informatización de la Lengua Árabe, Amman. Cuetara Priede, J., 2007, "Manual de gramática histórica", Universidad Nacional Autónoma de México, http://www.scribd.com/doc/26001579/Manual-de-Gramatica-Historica (junio de 2010). Hockett, C., 1960, "The origin of speech", Scientific American 203, p. 88-96. Hutchins, J., 2007, "Machine translation: a concise history", Chinese University of Hong Kong http://www.hutchinsweb.me.uk/CUHK-2006.pdf (julio de 2010) Taha Yusuf, Lina (2010): “la interactividad y cooperación entre el hombre y la máquina en el proceso de traducción”. Revista universidad de Damasco, Nº 26, primer volumen, pags. 709-725. El Corán: traducción, introducción y notas de JUAN VERNET. Editorial Planeta. Barcelona, 1963. Zaki Muhamed, Jider (2008): el árabe y la traducción automática: problemas y soluciones, conferencia de la Organización Árabe de Educación, Cultura y Ciencias en Amman (Jordania). 10