miércoles, 8 de febrero de 2017

¿Nos podemos fiar de los traductores automáticos?

Un poco de humor con el "traductor Murciano"


Volvemos a poner a prueba los traductores de rumano algo más de 2 años después de nuestro primer análisis. Seguimos usando los mismos criterios, es decir, que sean online, gratuitos, que no necesiten instalación y que traduzcan frases completas. El texto para la prueba sigue siendo el mismo con el fin de comprobar si ha habido durante este tiempo evolución en alguno de ellos:

Cât e ceasul?

Tata se bărbierește în fiecare zi.

Ea este din Spania.

Cum te-ai odihnit, prințeso?

Cumnatul meu fumează ca un turc


La razón de elegir este texto ya se expuso en la anterior prueba.

Los traductores elegidos iban a ser exactamente los mismos que la vez anterior pero el de Wordlingo ya no hace traducciones para el rumano, lo cual no es una gran pérdida, ya que fue el que menor puntuación obtuvo en su día. En su lugar hemos incorporado el traductor de Facebook, para lo cual hemos enviado el texto al muro de una persona para observar lo que le mostraba el traductor.

Los 5 traductores probados en esta ocasión son, en orden alfabético, Apertium, Babylon, Facebook, Google y Microsoft. Hemos rebautizado el traductor Bing como Microsoft porque ya no sólo se utiliza en el buscador Bing.

Recordamos que una traducción correcta (aunque no la única posible) de las 5 frases propuestas sería:

¿Qué hora es?

Papá se afeita todos los días.

Ella es de España.

¿Cómo has descansado, princesa?

Mi cuñado fuma como un carretero.



Sin más, vamos con los resultados:

Apertium 6/10

¿Cuánto está el reloj? 0,75
El papá se afeita cada día. 2
Ella está de España. 1,50
Cómo te descansaste, *prințeso? 1
Cuñado mío fuman que un turco 0,75

Babylon 6/10

¿Qué hora es? 2
Pappa afeitado todos los días 0,75
Es en España 1
¿Cómo has descansado, printeso? 1,25
Mi hermano fuma como un turco 0,75

Facebook 8/10

Qué hora es? 2
Papá bărbierește todos los días. 1
Ella es de España 2
Cómo has tenido que descansar, prințeso? 1
Mi cuñado fuma como una chimenea. 2

Google 7,25/10

¿Qué hora es? 2
Papá se afeita todos los días 2
Es en España 1
¿Cómo se ha descansado, princesa? 1,50
Mi hermano fuma como un turco 0,75
Microsoft 4,50/10

¿Cuánto es? 0
Dad es bărbierește cada día 0,50
Ella es de España 2
¿Ha usted descansado, prințeso? 1
Mi cuñado fuma como un Turco 1

Conclusiones:

Tras esta segunda prueba surge la duda de si no estamos siendo demasiado generosos con las puntuaciones. Mantenemos los mismos criterios de puntuación simplemente para poder comparar con el anterior análisis.

El mundo de los traductores automáticos va despacio. La evolución en algunos casos ha sido incomprensiblemente a peor, en otros a mejor. Hay dos sorpresas gratas, la evolución a mejor del traductor de Babylon, que ha pasado del suspenso al aprobado, y el traductor de Facebook, que ha entrado con la mejor puntuación de todas, con 3 plenos, incluyendo una traducción de la última frase simplemente perfecta, donde recoge no sólo la literalidad de las palabras sino su sentido, con una frase que cualquier hispanohablante entiende.
Decepcionante el comportamiento del traductor de Microsoft para rumano (con otros idiomas es mejor), porque incluso empeora los resultados de la vez anterior y pasa al suspenso. También decepcionante es que sigan apareciendo traducciones que llevan a error. ¿Tan difícil es traducir Cumnatul por "cuñado" en vez de "hermano", cuando en ningún diccionario de los de papel que yo conozca se traduce así de mal? Es inadmisible que tengamos que utilizar un aparato de última generación para obtener una traducción peor que la que obtendríamos con un pequeño diccionario y un poco de sentido común.


Se supone que con el tiempo y la apuesta que están haciendo las grandes empresas de informática en la aplicación de la inteligencia artificial, los traductores de lenguaje natural vayan a mejor, el tiempo que esto tarde dependerá de a qué idiomas les den prioridad. Ya sabemos que el rumano no está entre los prioritarios.

Es vital que las empresas ofrezcan a los usuarios la posibilidad de aportar traducciones alternativas que ayuden a mejorar, creo que esto ha ayudado a que Google siga mejorando, mientras que Microsoft se ha quedado estancado.


Como consejo yo usaría los mejores traductores automáticos, tanto el de Google como el de Facebook, para comprender el sentido general de textos en rumano, por ejemplo, artículos de prensa. No los usaría ni para traducir un texto del español al rumano y enviárselo a un rumano, ni para textos con implicaciones legales entre empresas.

Por último, la comparativa en gráfico:






No hay comentarios:

Publicar un comentario