El nuevo motor de traducción de la Unión Europea

¿Será posible que la Unión Europea desarrolle un motor de búsqueda mejor que “Google Translate”? Al parecer lo es, tal cual lo asegura la empresa encargada de hacerlo: Pangeanic. Debido a esto, la Unión Europea, mediante la división CEF (Connecting Europe Facility), le ha encargado a Pangeanic nada más y nada menos que la creación de 420 motores de traducción.

google

¿Por qué tantos? Porque los estados miembros de la Unión Europea cuentan con unas 24 lenguas oficiales, y se desarrollará un motor de traducción por cada combinación de idiomas.

La razón de que haya un motor por cada combinación de idiomas es que la traducción directa es mucho más eficiente que la traducción con un idioma intermediario. Es por eso que Pangeanic se jacta de tener una traducción de mejor calidad que Google, dado que éste utiliza el inglés como idioma intermediario en su motor, mientras que Pangeanic traduce directamente entre los idiomas.

Claro que esta traducción requiere de mucho más datos y trabajo. Es por eso que el proyecto le llevará dos años y la empresa se adjudicará dos millones de euros por la realización.

Traducción Neural Machine (NMT)

NMT es solo una de las muchas maneras emocionantes de obtener traducciones más naturales y fluidas en el idioma de destino. De hecho, la academia todavía está luchando por entender lo que sucede dentro de la «caja negra» una vez que la red neuronal comienza a entrenarse.

Las «conclusiones» son bastante sorprendentes y, a veces, sorprendentemente precisas cuando se trata del procesamiento del lenguaje humano debido a la cantidad de cálculos, pesos, gradientes aplicados y modelos de atención, incluso entre idiomas no relacionados e idiomas con una rica morfología. Este es el tipo de traducción que utilizará Pangeanic en el proyecto.

Otros tipos de traducción automática incluyen la traducción estadística, por reglas e híbrida.

Traducción automática estadística *info acá

Este sistema emplea un algoritmo de aprendizaje para un cuerpo grande de texto previamente traducido, y utiliza este algoritmo para traducir textos que no se han encontrado antes.

El sistema es adecuado para documentos que se centran en un tema en particular. Sus ventajas incluyen la plétora de plataformas y algoritmos actuales existentes (que hacen que el sistema sea barato y rápido) y el hecho de que requiere poco espacio (es decir, no necesita un servidor propio).

Traducción automática basada en reglas

Este es el primer sistema desarrollado en el mundo de la traducción automática y data de la década de 1950; se basa en las reglas de gramática, léxico y programas de software para procesar las reglas. La traducción se produce mediante reglas de coincidencia de patrones. El atributo clave de este sistema es que permite evitar el cumplimiento de reglas infructuosas.

Traducción automática híbrida

Este método utiliza múltiples enfoques de traducción automática dentro de un sistema. Hay muchos tipos de traducción automática híbrida.

Un enfoque popular combina un motor estadístico con un enfoque basado en reglas (tanto en la etapa previa y posterior al procesamiento). El sistema ofrece una gran flexibilidad, control y precisión, y difiere de un enfoque puramente estadístico.

Deja un comentario

Este sitio usa Akismet para reducir el spam. Aprende cómo se procesan los datos de tus comentarios.