Alineación de textos: Bitext2tmx

En muchas ocasiones, al traducir textos para un mismo cliente o documentos de un mismo tipo, solemos encontrarnos con frases o líneas completas que se repiten, que varían ligeramente o que ya hemos traducido en el pasado. Obviamente, esto sucede en algunas especializaciones de la traducción más que en otras, aunque no significa que no podamos aprovechar la oportunidad para “reciclar” traducciones.

Para eso están las herramientas TAO y las memorias de traducción, para ahorrarnos tiempo. Sin embargo, puede que os haya sucedido lo mismo que a mí. En mis comienzos recibía encargos de menos de mil palabras y, claro, perdía más tiempo creando un proyecto y preparando una memoria que en ponerme manos a la obra directamente.

Aun así, podemos rescatar ese trabajo. Es posible recuperar los textos y alinearlos, es decir, crear una memoria de traducción a partir de los textos de origen y destino.

Aunque hay miles de herramientas disponibles, la mayoría de ellas muy buenas, me decanto por Bitext2tmx, una herramienta de alineación libre e independiente que permite exportar textos bilingües en formato tmx. Podemos descargar gratis esta herramienta aquí.

Bitext2tmx 1.0

Para mostrar un ejemplo de alineación, voy a utilizar un comunicado del Diario Oficial de las Comunidades Europeas. Aquí tenéis el documento en inglés y en español.

Preparando los documentos

El primer paso consiste en pasar toda la información de cada idioma a un documento de texto en formato txt. Recomiendo guardarlo siempre en codificación UTF-8. Para ello, podemos copiar y pegar todo el texto desde Word, Adobe Reader o cualquier formato origen y pegarlo en el bloc de notas. Una vez guardado, podemos ejecutar Bitext2tmx y pulsar Abrir. Seleccionamos el texto de origen, el texto meta y la configuración de codificación seleccionada anteriormente.

Alineando segmentos

Tras aceptar, Bitext2tmx alineará las correspondencias con sus propias reglas de segmentación (no configurables) y nos encontraremos con algo así:
En la imagen, podemos observar cómo ha segmentado las líneas 20 a 27. En realidad pertenecen a la frase de la línea 19, pues tan solo indican un número de página. Para arreglarlo pasaremos a unir esos segmentos. Seleccionamos la línea 19 y pulsamos el botón Unir (el de la parte izquierda) 5 veces para que los segmentos de origen queden alineados. Sucede lo mismo con los del texto meta, seleccionamos la línea 19 y pulsamos Unir 8 veces, esta vez en el botón de la parte derecha. Utilizando este mismo método, revisaremos la alineación de las líneas 28 a 34 y sucesivas.

A continuación, podemos observar un caso en el que la segmentación no ha sido correcta y deberemos dividir las líneas (línea 1043). En este caso, nos interesa dividir el título de la sección del cuerpo. Entramos en el cuadro de texto, pulsamos al final del segmento a separar y seleccionamos Partir:

Una vez hayamos revisado que los textos se encuentran en paralelo, recomiendo utilizar la opción Borrar filas en blanco, pues nos ahorraremos exportar segmentos en blanco que no sirven para nada, pero que ocuparán espacio en la memoria final.

Exportando la memoria

Cuando estemos totalmente contentos con nuestra alineación, nos dirigimos a Archivo y guardamos el proyecto, que se exportará automáticamente con formato tmx.

Y ya está. Ya tenemos lista nuestra nueva memoria de traducción compatible con la mayoría de herramientas TAO.

Conclusiones

Dado que no ha sido actualizada desde principios de 2008, esta herramienta resulta bastante rústica y ofrece un entorno gráfico un poco demodé. Respecto a la funcionalidad, cabe destacar que las opciones de segmentación no son configurables y que no podemos exportar campos a la memoria. Además, tampoco permite guardar el progreso, lo que resultará molesto a la hora de alinear textos muy extensos.

Por otro lado, es una herramienta totalmente gratuita y muy fácil de usar, lo que la convierte en la herramienta estrella para empezar a trastear con las alineaciones. Finalmente, aunque se trata de una herramienta muy básica, cumple con las necesidades del usuario medio.

6 comentarios

Archivado bajo alineación, herramientas

La movilidad del traductor

Resulta muy curioso observar cómo la mayoría de mis familiares se desplazan cientos de kilómetros para poder estar un fin de semana con los suyos. Ayer mismo se despedían hasta la próxima y todos preguntaban lo mismo: “¿Y tú cuando te vas?” “¿No trabajas el lunes?”. Pues sí, trabajo el lunes. Sin embargo, me quedaré por aquí algunos días más.

Me parece fantástico tener la posibilidad de adecuar un espacio de trabajo donde quiera que vaya en la mayoría de sitios. Ya quedó atrás la era de los diccionarios y las maletas llenas de libros de referencia. Con un pequeño portátil o incluso un netbook y una conexión a internet (que podremos improvisar con un acceso 3G) ya estamos listos para comenzar la jornada.

Mi ordenador de trabajo dejó de ser portátil hace ya un par de años y, por suerte, cada vez que vuelvo a casa me espera mi viejo equipo (que aún utiliza un sistema operativo por siglas), es por eso que en mi caso prefiero recurrir a otras alternativas como la memoria USB o la información en la nube con Dropbox.

En tan solo 10 minutos podemos exportar nuestros marcadores/favoritos, licencias, diccionarios electrónicos, memorias de traducción y herramientas portátiles como OmegaT, Portable CAT o Aegisub (ya dedicaré un artículo a estas herramientas). Incluso podemos trabajar en la nube gracias a herramientas de traducción como Google Translator Toolkit o Wordfast Anywhere.
¡Listo! Ya solo falta buscarnos un escritorio y rezar para que los vecinos sean compasivos.

¿Y vosotros? ¿Cómo aprovecháis la movilidad del traductor?

¡Se me olvidaba!

¡Felices fiestas!

6 comentarios

Archivado bajo consejos, herramientas

Y ahora… ¿Qué?

Gracias a la magia de las redes sociales, esta mañana ha resucitado un artículo. Y lo ha hecho con mucha fuerza. Tanto que ha originado una acalorada oleada de mensajes en twitter:

Se han comentando muchísimas cosas y se han ofrecido distintos puntos de vista. Mi intención no es rebatir a nadie ni intentar ofrecer una verdad absoluta salvadora del futuro de muchos, pero sí que me gustaría quedarme con una de las cuestiones más recurrentes:

Muchos traductores se quejan de lo difícil que es entrar en el mercado. Con razón o sin ella, es cierto que hay mucho traductor quejica suelto. Es difícil conseguir clientes y establecerse entre tantos profesionales. Siempre hay alguien con mejor formación, experiencia o incluso mejores tarifas.

Y es que nadie dijo que iba a ser fácil, todo lo contrario.

Sin embargo, esta mañana, había algo en lo que todos coincidíamos: no hay que tirar la toalla.

Yo soy el primero en quejarse de lo difícil que es, o cuando recibo una negativa sobre algún proyecto o colaboración; pero a los cinco diez minutos se me pasa y me digo: «¿qué habré hecho mal?», «la próxima vez lo haré mejor» o «debo esforzarme más».

Hay que seguir adelante, leer, informarse, especializarse. No estoy descubriendo la pólvora, pero nunca viene mal recordarlo.

A continuación os dejo con un vídeo (en inglés) que he recordado al escribir el artículo.

Ojala todo fuese así de sencillo:

  • Paso 1: estudiar traducción;
  • paso 2:
  • paso 3: obtener beneficios.

19 comentarios

Archivado bajo buscando trabajo, comienzos, desengaños

The Versatile Blogger

Versatile Blogger Award

Menuda sorpresa me he llevado al enterarme de que me han premiado con el Versatile Blogger Award. La verdad es que no me esperaba ver En la punta de la lengua entre la lista de premiados en varios de los blogs que leo habitualmente.

Los responsables son Isabel García Cutillas (El traductor en la sombra), Vanessa Lorite (Tradúceme despacio que tengo prisa) y Rai Rizo (Letras de Sastre. ¡Muchas gracias a los tres por el premio! Aunque no suela comentar vuestros artículos, ¡os aseguro que me los leo todos!

Ahora me encuentro en el compromiso de contar 7 cosas sobre mí. Veamos:

  1. En realidad yo era de ciencias. Estudié el bachillerato científico-técnico y estuve a punto de empezar Teleco, pero mi amor por el inglés fue mucho más fuerte y comencé mi querida Filología Inglesa de forma vocacional, ¡y mirad cómo ha acabado todo!
  2. Soy cinturón azul de taekwon-do. No es nada impresionante, pero comencé con 22 años y, al igual que las lenguas, es bastante difícil mejorar cuando superamos la edad límite. En fin, me vi obligado a dejarlo cuando empecé a mudarme de un sitio a otro.
  3. Se puede decir que he sido músico. Toco la guitarra eléctrica desde hace unos añitos, e incluso llegué a tocar con un grupo de amigos por varios bares y locales de La Mancha profunda e incluso grabamos una maqueta.
  4. He salido en la tele: cuando tenía ¿6? Años aparecí en dos programas de Juego de Niños, en TVE. Además, he aparecido en el anuncio local de una papelería y en el de una compañía inglesa de transportes.
  5. He puesto voz a un anuncio de una importante compañía de servicios informáticos. Fue bastante curioso: cuando se pusieron en contacto conmigo dijeron que necesitaban mis servicios lingüísticos, una vez en el punto de encuentro me enteré de que era un doblaje y, ya que estaba allí, no me quise ir con las manos vacías.
  6. Odio los domingos en España, sobre todo en invierno. Eso es algo que descubrí al viajar al extranjero. A no ser que vivas en una gran ciudad, no hay nada que hacer un domingo.
  7. Comencé a escribir este blog para un curso de diseño web. Muchos ya conoceréis el proyecto Tradusfera. Al final me quedo con el blog, me ha gustado mucho la experiencia y, ¿quién sabe si retomaré Tradusfera también?

Ha sido bastante difícil seleccionar a mis nominados, así que he decidido hacer una criba a aquellos que ya han recibido el premio. Por lo tanto, el premio se lo paso a:

  1. Filóloca
  2. Melodía de traducción
  3. Méteteme
  4. (Nunca) sobran las palabras
  5. El taller del traductor
  6. [Sé lo que] Traducistes
  7. La prueba de lo ajeno
  8. Algo más que traducir
  9. No disparen al traductor
  10. Perdido en San Borondón
  11. Tú serás mi voz
  12. Con el calco en los talones
  13. La paradoja de Chomsky
  14. Mox’s blog
  15. Azote ortográfico

A continuación, las normas para mis nominados:

1) Agradécele al que te ha premiado y añade un enlace a su perfil o bitácora en tu entrada.
2) Comparte siete cosas sobre ti.
3) Pásale el premio a 15 bitácoras que hayas descubierto recientemente y que disfrutes leyendo.
4) Contacta a los bitacoreros que hayas escogido para que sepan que les has dado el premio.

¡Adelante!

4 comentarios

Archivado bajo Sin categoría

¡Cuidado con los ojos!

Al igual que en muchas otras profesiones, en la traducción es habitual dedicar largos periodos de tiempo al día delante del monitor. Durante todas estas horas, nuestros ojos se exponen a diversos factores que pueden hacer que, días tras día, nuestra visión se resienta.

Muchos de los consejos que he recibido de mano de familiares y profesores coinciden completamente con todo lo que podáis encontrar en la red de redes. Sin embargo, algunos compañeros traductores y programadores me han desmitificado una de las indicaciones que llevo oyendo más años.

Los consejos más básicos y de los que derivan muchos otros son:

  • invertir en un buen monitor;
  • hacer uso de la iluminación natural;
  • evitar deslumbramientos y reflejos;
  • descansar la vista cada cierto tiempo;
  • utilizar contraste alto y brillo bajo;
  • ¿utilizar texto negro sobre un fondo blanco?

Pues sí, este último lo he escuchado cientos de veces, y no es ninguna mentira, pero siempre hay un pero. Bien, los ojos leen con mayor facilidad cuando se trata de caracteres negros sobre fondos muy claros; a mayor contraste, mayor facilidad para distinguir los caracteres.

Hasta aquí perfecto, pero ¿qué sucede si nos vamos unos días a la nieve sin gafas de sol? Bye bye retinas.

Si dedicamos mucho tiempo con la mirada fija en un punto con un contraste tan alto terminaremos con problemas igualmente. Como decía, algunos traductores y programadores que conozco optan por cambiar el fondo por un tono levemente grisáceo para trabajar con procesadores de texto y líneas de comando.

Para configurar el fondo en Windows (varias versiones) tendremos que ir a:

Panel de control> Color y apariencia de las ventanas> Configuración> Opciones avanzadas> Ventana

Cambiamos el blanco por un tono grisáceo y arreglado. Esta configuración se aplicará tanto a las ventanas como al fondo de página de la mayoría de programas como MS Word.

Espero que os haya gustado mi briconsejo y os invito a compartir otras ideas.

6 comentarios

Archivado bajo comienzos, consejos

Un vistazo a Wordfast Anywhere

Tras unas vacaciones inesperadamente largas, regreso al blog para ofrecer una nueva entrada en la línea de las herramientas gratuitas. En esta ocasión le toca el turno a Wordfast Anywhere.

Wordfast Anywhere es la versión gratuita y portátil que combina funciones avanzadas de Wordfast Pro y Wordfast Classic (disponibles aquí), aunque su verdadero punto fuerte es su accesibilidad. Una vez registrados en el servidor, podremos acceder a la herramienta desde cualquier dispositivo que disponga de un navegador y de acceso a internet.

Wordfast Anywhere nos promete:

  • mantener y gestionar hasta 10 documentos activos a la vez;
  • un tamaño máximo de documentos de hasta 2MB;
  • almacenamiento de memorias de traducción en línea de hasta 1 millón de unidades en total;
  • glosarios accesibles “en la nube” mientras no superemos las 100.000 entradas en total;
  • mantener la confidencialidad de todos nuestros documentos (incluidos los archivos y memorias).

Pasemos a ver algunas de sus funciones en detalle:

 Memorias de traducción y glosarios

Podremos crear una memoria de traducción en cualquier momento. En tan sólo unos segundos podremos alojarla en nuestro servidor dedicado y empezar a almacenar segmentos. Las MTs son, hasta cierto punto, personalizables, pudiendo así incluir atributos específicos que nos muestren, por ejemplo, la fecha de almacenamiento, el nombre de nuestro cliente o el proyecto al que pertenecieron. Además, ofrece la posibilidad de acceder a ellas a través de nuestra cuenta o incluso convertirla en una memoria compartida con otros traductores.

Es importante destacar que también se nos ofrece la posibilidad de importar memorias de otras aplicaciones e incluso exportarlas desde Wordfast. De este modo, podremos extraer nuestras memorias en los formatos Wordfast TM (extensión txt) o con formato TMX, siendo compatible con la mayoría de herramientas del mercado.

Por su parte, los glosarios son listados de palabras en formato txt con separación por tabulaciones. Podremos añadir comentarios y hasta 3 campos personalizables (género, categoría gramatical, etc.).

Traducción asistida

Wordfast Anywhere incluye la tecnología VLTM: Very Large Translation Memories. Esta función nos permite activar una búsqueda pasiva de nuestros segmentos de origen en otras memorias de traducción de acceso libre. Así, podremos comparar unidades ya traducidas ya que sólo se ofrecerán como propuestas de traducción, pero en ningún caso sustituirán las unidades de nuestra memoria de traducción activa.

Además, la traducción automática de Google Translate está totalmente integrada, permitiendo, por ejemplo, pseudotraducir para después revisar o comprender mejor el texto (algo que dejo totalmente al juicio de cada traductor).

Compatibilidad

Wordfast Anywhere admite documentos de distintas extensiones y formatos, incluyendo:

  • proyectos de traducción en formato txml;
  • documentos de texto (txt), de MS Office (doc, docx, rtf, xls, xlsx, ppt, pptx) y de OpenOffice (odt, ods, tif, tif);
  • otros formatos (pdf*, htm, html, mif, inx).

*La gestión del formato PDF se efectúa por una conversión a rtf que deberemos descargar en nuestro equipo y después reenviarla para traducir.

Herramientas avanzadas

En este punto solo destacaré el uso de herramientas que, aunque haya titulado avanzadas, considero imprescindibles en una herramienta de traducción asistida. Son el alineador de documentos y la búsqueda de concordancia. Además, permite realizar un análisis de los documentos a traducir que incluye el número de palabras, coincidencias y repeticiones.

Conclusión

Aunque no sea una herramienta innovadora, sí que cumple las expectativas en cuanto a compatibilidad y accesibilidad. El modo editor es bastante intuitivo y recuerda a muchas otras herramientas TAO. Con tan sólo memorizar 4 combinaciones de teclado (personalizables), podremos empezar a traducir en cuestión de segundos.

Sin más, os dejo con una captura de pantalla donde se puede observar el menú editor con todas las funcionalidades como: el indicador y selector de segmentos (izquierda), el navegador y la barra de herramientas (parte superior), las coincidencias parciales y traducción automática (bajo la barra de herramientas), el editor con código de colores para los segmentos de origen y destino (zona central) y el visor de glosario (parte derecha).

pincha en la imagen para aumentar el tamaño

16 comentarios

Archivado bajo herramientas

Glosarios para OmegaT en 5 minutos

Editado: las versiones posteriores de OmegaT (como la actual 2.3.0) incluyen una opción para añadir términos en el glosario principal (generado automáticamente al incluir la primera entrada). Esta opción está disponible en el menú Editar, o con la combinación CTRL+Mayúsculas+G. No obstante, no nos dará elección a guardarlo en un glosario específico o personalizado, por lo que prefiero la edición manual.

Cuando presenté OmegaT no pensaba que la creación de glosarios fuera a suponer problema alguno. Sin embargo, ha llegado a mis oídos que preparar un glosario para OmegaT puede ser algo bastante complejo y engorroso.

Al igual que hice en mi reseña de GTT, os ofrezco una forma rápida y sencilla para preparar vuestros propios glosarios con total compatibilidad en OmegaT:

  • Para empezar, deberemos abrir nuestra herramienta estrella: el bloc de notas.
  • Escribimos el término en la lengua de origen y pulsamos el tabulador (Tab ⇆).
  • A continuación escribimos el término en la lengua de destino y volvemos a pulsar el tabulador.
  • (Opcional) podemos añadir una breve descripción.

Por último, guardamos el archivo:

  • Vamos a Archivo> Guardar como…
  • Deberemos asegurarnos de ajustar las siguientes opciones:
  • Deberemos especificar la extensión del archivo como utf8; por ejemplo, glosario_chulísimo.utf8
  • Y el tipo de codificación deberá ser también UTF-8.

¡Y ya está! Ya podemos copiar el archivo (o guardarlo) en la carpeta de nuestro proyecto y disfrutar con otra ayudita extra.

Antes de terminar, me gustaría recordar una serie de puntos:

  • Podemos utilizar más de un glosario a la vez, pudiendo tener un documento para cada especialidad.
  • Cada vez que queramos añadir una entrada nueva deberemos editar el glosario con el bloc de notas y añadirla manualmente (por lo menos en la versión2.0.5 aún no lo han integrado). Al guardar los cambios se actualizará el visor automáticamente.
  • En los casos en los que queramos añadir varios equivalentes para el mismo término de origen, deberemos añadirlos como entradas paralelas, es decir, repitiendo el término de la lengua de origen en otra línea cualquiera. Quedaría algo así:

Una vez que nos encontremos con algún término que hayamos añadido a nuestro precioso glosario, OmegaT nos ofrecerá todas las entradas que tengamos para dicho término (¡o incluso frase!).

2 comentarios

Archivado bajo herramientas