Alineación de textos: Bitext2tmx

En muchas ocasiones, al traducir textos para un mismo cliente o documentos de un mismo tipo, solemos encontrarnos con frases o líneas completas que se repiten, que varían ligeramente o que ya hemos traducido en el pasado. Obviamente, esto sucede en algunas especializaciones de la traducción más que en otras, aunque no significa que no podamos aprovechar la oportunidad para “reciclar” traducciones.

Para eso están las herramientas TAO y las memorias de traducción, para ahorrarnos tiempo. Sin embargo, puede que os haya sucedido lo mismo que a mí. En mis comienzos recibía encargos de menos de mil palabras y, claro, perdía más tiempo creando un proyecto y preparando una memoria que en ponerme manos a la obra directamente.

Aun así, podemos rescatar ese trabajo. Es posible recuperar los textos y alinearlos, es decir, crear una memoria de traducción a partir de los textos de origen y destino.

Aunque hay miles de herramientas disponibles, la mayoría de ellas muy buenas, me decanto por Bitext2tmx, una herramienta de alineación libre e independiente que permite exportar textos bilingües en formato tmx. Podemos descargar gratis esta herramienta aquí.

Bitext2tmx 1.0

Para mostrar un ejemplo de alineación, voy a utilizar un comunicado del Diario Oficial de las Comunidades Europeas. Aquí tenéis el documento en inglés y en español.

Preparando los documentos

El primer paso consiste en pasar toda la información de cada idioma a un documento de texto en formato txt. Recomiendo guardarlo siempre en codificación UTF-8. Para ello, podemos copiar y pegar todo el texto desde Word, Adobe Reader o cualquier formato origen y pegarlo en el bloc de notas. Una vez guardado, podemos ejecutar Bitext2tmx y pulsar Abrir. Seleccionamos el texto de origen, el texto meta y la configuración de codificación seleccionada anteriormente.

Alineando segmentos

Tras aceptar, Bitext2tmx alineará las correspondencias con sus propias reglas de segmentación (no configurables) y nos encontraremos con algo así:
En la imagen, podemos observar cómo ha segmentado las líneas 20 a 27. En realidad pertenecen a la frase de la línea 19, pues tan solo indican un número de página. Para arreglarlo pasaremos a unir esos segmentos. Seleccionamos la línea 19 y pulsamos el botón Unir (el de la parte izquierda) 5 veces para que los segmentos de origen queden alineados. Sucede lo mismo con los del texto meta, seleccionamos la línea 19 y pulsamos Unir 8 veces, esta vez en el botón de la parte derecha. Utilizando este mismo método, revisaremos la alineación de las líneas 28 a 34 y sucesivas.

A continuación, podemos observar un caso en el que la segmentación no ha sido correcta y deberemos dividir las líneas (línea 1043). En este caso, nos interesa dividir el título de la sección del cuerpo. Entramos en el cuadro de texto, pulsamos al final del segmento a separar y seleccionamos Partir:

Una vez hayamos revisado que los textos se encuentran en paralelo, recomiendo utilizar la opción Borrar filas en blanco, pues nos ahorraremos exportar segmentos en blanco que no sirven para nada, pero que ocuparán espacio en la memoria final.

Exportando la memoria

Cuando estemos totalmente contentos con nuestra alineación, nos dirigimos a Archivo y guardamos el proyecto, que se exportará automáticamente con formato tmx.

Y ya está. Ya tenemos lista nuestra nueva memoria de traducción compatible con la mayoría de herramientas TAO.

Conclusiones

Dado que no ha sido actualizada desde principios de 2008, esta herramienta resulta bastante rústica y ofrece un entorno gráfico un poco demodé. Respecto a la funcionalidad, cabe destacar que las opciones de segmentación no son configurables y que no podemos exportar campos a la memoria. Además, tampoco permite guardar el progreso, lo que resultará molesto a la hora de alinear textos muy extensos.

Por otro lado, es una herramienta totalmente gratuita y muy fácil de usar, lo que la convierte en la herramienta estrella para empezar a trastear con las alineaciones. Finalmente, aunque se trata de una herramienta muy básica, cumple con las necesidades del usuario medio.

6 comentarios

Archivado bajo alineación, herramientas

6 Respuestas a “Alineación de textos: Bitext2tmx

  1. Thanks Pedro for this great article, I will soon have a go at Bitext2tmx 1.0!

  2. Muchas gracias por la presentación de esta herramienta. Unas buenas herramientas en el bolso pueden cambiar las partes las menos agradables de la traducción como la repetición de segmentos y hacernos pasar más tiempo en la búsqueda de nuevo conecimiento.

  3. Mónica Sánchez

    Muchas gracias, Pedro. Una entrada muy clara e instructiva, como siempre. Ahora mismo voy a probarlo.
    ¡Un saludo!

  4. Muchas gracias a los dos por pasaros y dejarme un cometario.
    Espero que os sea útil. Intentaré continuar analizando herramientas TAO. No dudéis en comentarme cualquier sugerencia 🙂

  5. Muy útil. Mil gracias 🙂

Replica a Manuela Cancelar la respuesta