sábado, 13 de diciembre de 2014

Análisis de los traductores de rumano


Los traductores automáticos de rumano a prueba.

(Breve análisis de algunos traductores automáticos de rumano, gratuitos y en línea)

He puesto a prueba algunos traductores de rumano. La condición principal era que fueran gratuitos. Entre otros requisitos estaba que tradujeran no sólo palabras sueltas sino frases y textos completos, que fueran automáticos y no necesitasen instalación. No he valorado el hecho de que reconocieran automáticamente el lenguaje de entrada como Bing o Google porque considero que en los casos en que tienes que seleccionar manualmente el lenguaje tampoco se hace muy difícil. Tampoco he tenido en cuenta que tardaran más o menos en realizar la traducción puesto que, aunque había diferencias perceptibles entre algunos de ellos, ninguno tardó excesivamente. No se han incluido traductores “duplicados”, es decir, algunos que trabajan con otro ya conocido bajo otra marca. También se ha eliminado uno que, simplemente, no funcionaba. Valorar, además, las facilidades que dan los traductores para que la gente colabore. En el caso de Bing se puede señalar la traducción como Adecuada o Mala, y en el caso de Google incluso se puede proponer una traducción que consideremos más correcta, con lo cual estos traductores, sobretodo el de Google, es más fácil que vayan mejorando con el tiempo.

Los traductores analizados son, por orden alfabético, los traductores de Apertium, Babylon, Bing, Google y Wordlingo.

Para ello se han introducido las siguientes 5 frases en los diferentes traductores:

Cât e ceasul?

Tata se bărbierește în fiecare zi.

Ea este din Spania.

Cum te-ai odihnit, prințeso?

Cumnatul meu fumează ca un turc.

 

Una traducción válida de cada una de ellas sería:

¿Qué hora es?

Papá se afeita todos los días.

Ella es de España.

¿Cómo has descansado, princesa?

Mi cuñado fuma como un carretero.

En ninguno de los casos se trata de rumano avanzado, si bien las frases 1 y 5 no admiten traducción literal palabra a palabra. Cada frase se puntúa de 0 a 2 para un total de un máximo de 10 puntos entre todas. El análisis se hizo entre el 12 y el 13 de Diciembre de 2014 a tener en cuenta puesto que los traductores están evolucionando a lo largo del tiempo.

El resultado de las traducciones ha sido sorprendente y, en algunos casos, decepcionante. Si bien esta impresión queda mitigada cuando se analiza la dificultad de traducir automáticamente un lenguaje natural y la cantidad de reglas escritas, y no escritas, que contiene, así como la amplitud que debería tener una base de datos con todas las expresiones y frases hechas de un idioma.

Vayamos frase por frase:

Cât e ceasul? Esta primera frase no debería representar dificultad ninguna para un traductor que tenga una mínima base de datos de frases y expresiones comunes. Es nuestro equivalente a “¿Qué hora es?”, y una de las formas más comunes de preguntarlo en rumano. No es ninguna pregunta trampa, pero sí selecciona si hay algún traductor que se limite a traducir palabra por palabra. En éste caso debería traducir algo así como, “¿Cuánto es el reloj?” Las respuestas van desde el “¿Cuánto es?” de Bing que omite una palabra y la frase pierde todo el sentido, pasando por las que reconocen que tiene algo que ver con el tiempo, pero sin acertar del todo, como “¿Cuánto tiempo es?”, hasta la traducción correcta de Google “¿Qué hora es?”.

Tata se bărbierește în fiecare zi. En este caso, la dificultad no está en que se trate de una frase hecha, sino en la amplitud del diccionario sobre el que trabaja el traductor. Traducciones válidas serían: “Papá se afeita todos los días” o “El padre se afeita a diario”. En este caso vemos que tanto Google como Bing no reconocen una palabra y la dejan tal cual. Google no reconoce Tata (Papá) y parece que la deja como si fuera un nombre propio, con lo cual la frase no pierde del todo el sentido. Bing no reconoce bărbierește pero Tata sí. Lo más sorprendente es que hay dos traductores que introducen un negativo que no existe, y traducen la frase justo al contrario, con lo cual, por muy bien que estuviera el resto de la frase, no ha quedado más remedio que ponerles un cero. En este caso ha sido Apertium el que más se ha aproximado con una traducción más que válida. Sorprendente también la traducción de “se” por “es” o la “ocurrencia” de poner “Mi padre” que se ha inventado el traductor de Wordlingo.

Ea este din Spania. Esta es una frase de nivel cero, es lo más básico de lo básico, de las que se pueden aprender el primer día. No tiene trampa y se puede traducir literalmente. La mínima dificultad está en distinguir entre traducir este como “es” o como “está”. Bing y Apertium aciertan de pleno, el resto no.

Cum te-ai odihnit, prințeso? Una oportunidad para ver si algún traductor reconoce el vocativo y para ver cómo traducen un verbo que en rumano es reflexivo y en español no. Sólo Google acierta con el vocativo y muestra una traducción decente de la frase completa.

Cumnatul meu fumează ca un turc. La dificultad estriba en traducir no literalmente sino como una frase hecha que es. Ningún traductor ha acertado, es más, el resto de la frase, que no debería presentar dificultad ninguna, queda desfigurada en algunos casos, como traducir “mi cuñado” por “mi hermano” o meter un galimatías sin sentido con palabras que no se sabe de dónde salen como “parado” del traductor de Wordlingo. O decir justo lo contrario de lo que se pretende como en el caso de Babylon.

 

Veamos los resultados de cada traductor:

 

 

Apertium 7/10

¿Cuánto es el reloj? 1

El papá se afeita cada día 2

Ella es de España 2

Cómo te descansaste, *prințeso? 1

Cuñado mío fuman que un turco 0,75

 Babylon 2,5/10

¿Cuánto tiempo es? 1

Mi padre no se afeita todos los días. 0

Es en España 1

¿Cómo descansaban, printeso? 0,25

Mi cuñado de dejar de fumar como un Turco 0

 
 

Bing 5/10

¿Cuánto es? 0

Papá es bărbierește cada día. 0,75

Ella es de España 2

¿Cómo has descansado, prințeso? 1,25

Mi cuñado humo como un turco 1

Google 6,5/10

¿Qué hora es? 2

Tata afeitarse todos los días. 0,75

Es en España 1

¿Cómo has descansado, princesa? 2

Mi hermano fuma como un turco 0,75

 Wordlingo 1,75/10

¿Cuánto hora es él? 0,75

Mi padre no es afeitado diario.  0

Está en España.  1

¿Cómo usted se reclinó, printeso? 0

El mi fumar parado cuñado como turco 0

Conclusiones:

El mundo de los traductores automáticos está en plena evolución y es probable que de aquí a no mucho tiempo hayan mejorado lo bastante como para sustituir en la mayoría de los casos a las traducciones de pago hechas por personas.

Hoy por hoy sólo recomendaría su uso como apoyo al aprendizaje de idiomas a partir de unos conocimientos básicos previos del idioma o para traducir textos como hobby. Cualquier otro uso como una traducción con fines comerciales o jurídicos, queda descartada por la posibilidad de encontrarse con resultados no ya erróneos, sino incluso contrarios al sentido del texto original.

Las puntuaciones son relativamente generosas porque las frases presentadas no son de gran dificultad, pero son válidas para comparar los diferente traductores entre sí. De los cinco traductores dos de ellos no han aprobado y, en concreto, Wordlingo ni siquiera pasa la prueba para estar como enlace en la guía de recursos gratuitos de rumano en internet de Quiero Aprender Rumano. Decepcionante también Babylon, que pertenece a, se supone, un grupo especializado en idiomas. Aprueba, por poco, Bing, que en su traductor para móviles încorpora tecnologías novedosas y que seguramente mejorará con el tiempo. Mejor Google que aprueba sobradamente y que además ofrece una (mejorable) locución del resultado y que mejorará sus traducciones con el tiempo, sin duda, debido a la facilidad para que la gente colabore. Por último, felicitarse por el traductor de Apertium, cuyas primeras versiones pude probar y eran bastante peores que la actual. Apertium aprueba con nota.

1 comentario:

  1. Fantástica comparativa, muchísimas gracias. Lo que sí querría saber es si hay alguna página para aprender rumano que creas que es buena, que a ti personalmente te guste. Hace tiempo escuché los programas de radio romania internacional pero no se pueden descargar sino que hay que escucharlos online.

    ResponderEliminar