En la película de Blade Runner algunos personajes hablaban el cityspeak -interlingua en la traducción al español-, una jerga que mezcla varios idiomas como el alemán, español y japonés. Esta lengua ha inspirado a un grupo de investigadores de la Universidad Politécnica de Valencia para diseñar un traductor automático de lenguas minoritarias.
Más del 10 por ciento de los lenguajes del mundo no tienen sistemas de traducción automática, y en muchos casos estos deben traducirse primero al inglés y después al idioma de destino. Por eso, los científicos se plantearon el desarrollo de un sistema que ayudase a solventar estas carencias.
"Nuestro objetivo era ayudar a entender aquellas lenguas que actualmente no son capaces de abarcar los traductores, y contribuir así a la preservación de culturas y la eliminación de barreras lingüísticas", han explicado a SINC Luis Leiva y Vicent Alabau, creadores del nuevo método.
Inspirados en el citispeak de Blade Runner, los investigadores pensaron que "
sería buena idea usar lenguajes parecidos a los de un grupo de hablantes para suplir la falta de recursos en traducción automática". De esta forma, el sistema emplea informaciones de idiomas parecidos al de destino, aprovechando su similitud gramatical y sintáctica.
"La idea consiste en escoger aquellas palabras de otros idiomas para los que se pueda generar una traducción automática, de forma que se parezcan lo más posible al idioma destino, que es el idioma del usuario que quiere entender el mensaje", explica Leiva.
"Si bien las frases resultantes pueden parecer extrañas a primera vista, ya que gramaticalmente son una mezcla de varios idiomas, en realidad son lo suficientemente entendibles para un hablante de la lengua destino".
Una mezcla de idiomas
Por ejemplo, si una persona que solo hable español quiere traducir la frase en inglés "
another label with the same name already exists" ("ya existe una etiqueta con el mismo nombre"), el sistema buscaría similitudes en italiano, portugués y francés, generando traducciones automáticas que se combinan estadísticamente para formar un resultado similar al español, que en este caso sería "
un'altra étiquette con mesmo nome existe deja". Obviamente no es español, pero un hispano parlante podría entender el sentido de la frase sin problemas.
El nuevo traductor, que aún se está perfeccionando, servirá para ofrecer contenidos digitales en idiomas para los que actualmente no existen traductores automáticos. Esto será útil para favorecer la integración social de hablantes monolingües y a la vez les ayudará a familiarizarse con el vocabulario de otras lenguas.