Archivo de la etiqueta: TAO

Alineación de textos: Bitext2tmx

En muchas ocasiones, al traducir textos para un mismo cliente o documentos de un mismo tipo, solemos encontrarnos con frases o líneas completas que se repiten, que varían ligeramente o que ya hemos traducido en el pasado. Obviamente, esto sucede en algunas especializaciones de la traducción más que en otras, aunque no significa que no podamos aprovechar la oportunidad para “reciclar” traducciones.

Para eso están las herramientas TAO y las memorias de traducción, para ahorrarnos tiempo. Sin embargo, puede que os haya sucedido lo mismo que a mí. En mis comienzos recibía encargos de menos de mil palabras y, claro, perdía más tiempo creando un proyecto y preparando una memoria que en ponerme manos a la obra directamente.

Aun así, podemos rescatar ese trabajo. Es posible recuperar los textos y alinearlos, es decir, crear una memoria de traducción a partir de los textos de origen y destino.

Aunque hay miles de herramientas disponibles, la mayoría de ellas muy buenas, me decanto por Bitext2tmx, una herramienta de alineación libre e independiente que permite exportar textos bilingües en formato tmx. Podemos descargar gratis esta herramienta aquí.

Bitext2tmx 1.0

Para mostrar un ejemplo de alineación, voy a utilizar un comunicado del Diario Oficial de las Comunidades Europeas. Aquí tenéis el documento en inglés y en español.

Preparando los documentos

El primer paso consiste en pasar toda la información de cada idioma a un documento de texto en formato txt. Recomiendo guardarlo siempre en codificación UTF-8. Para ello, podemos copiar y pegar todo el texto desde Word, Adobe Reader o cualquier formato origen y pegarlo en el bloc de notas. Una vez guardado, podemos ejecutar Bitext2tmx y pulsar Abrir. Seleccionamos el texto de origen, el texto meta y la configuración de codificación seleccionada anteriormente.

Alineando segmentos

Tras aceptar, Bitext2tmx alineará las correspondencias con sus propias reglas de segmentación (no configurables) y nos encontraremos con algo así:
En la imagen, podemos observar cómo ha segmentado las líneas 20 a 27. En realidad pertenecen a la frase de la línea 19, pues tan solo indican un número de página. Para arreglarlo pasaremos a unir esos segmentos. Seleccionamos la línea 19 y pulsamos el botón Unir (el de la parte izquierda) 5 veces para que los segmentos de origen queden alineados. Sucede lo mismo con los del texto meta, seleccionamos la línea 19 y pulsamos Unir 8 veces, esta vez en el botón de la parte derecha. Utilizando este mismo método, revisaremos la alineación de las líneas 28 a 34 y sucesivas.

A continuación, podemos observar un caso en el que la segmentación no ha sido correcta y deberemos dividir las líneas (línea 1043). En este caso, nos interesa dividir el título de la sección del cuerpo. Entramos en el cuadro de texto, pulsamos al final del segmento a separar y seleccionamos Partir:

Una vez hayamos revisado que los textos se encuentran en paralelo, recomiendo utilizar la opción Borrar filas en blanco, pues nos ahorraremos exportar segmentos en blanco que no sirven para nada, pero que ocuparán espacio en la memoria final.

Exportando la memoria

Cuando estemos totalmente contentos con nuestra alineación, nos dirigimos a Archivo y guardamos el proyecto, que se exportará automáticamente con formato tmx.

Y ya está. Ya tenemos lista nuestra nueva memoria de traducción compatible con la mayoría de herramientas TAO.

Conclusiones

Dado que no ha sido actualizada desde principios de 2008, esta herramienta resulta bastante rústica y ofrece un entorno gráfico un poco demodé. Respecto a la funcionalidad, cabe destacar que las opciones de segmentación no son configurables y que no podemos exportar campos a la memoria. Además, tampoco permite guardar el progreso, lo que resultará molesto a la hora de alinear textos muy extensos.

Por otro lado, es una herramienta totalmente gratuita y muy fácil de usar, lo que la convierte en la herramienta estrella para empezar a trastear con las alineaciones. Finalmente, aunque se trata de una herramienta muy básica, cumple con las necesidades del usuario medio.

Anuncios

6 comentarios

Archivado bajo alineación, herramientas

Un vistazo a Wordfast Anywhere

Tras unas vacaciones inesperadamente largas, regreso al blog para ofrecer una nueva entrada en la línea de las herramientas gratuitas. En esta ocasión le toca el turno a Wordfast Anywhere.

Wordfast Anywhere es la versión gratuita y portátil que combina funciones avanzadas de Wordfast Pro y Wordfast Classic (disponibles aquí), aunque su verdadero punto fuerte es su accesibilidad. Una vez registrados en el servidor, podremos acceder a la herramienta desde cualquier dispositivo que disponga de un navegador y de acceso a internet.

Wordfast Anywhere nos promete:

  • mantener y gestionar hasta 10 documentos activos a la vez;
  • un tamaño máximo de documentos de hasta 2MB;
  • almacenamiento de memorias de traducción en línea de hasta 1 millón de unidades en total;
  • glosarios accesibles “en la nube” mientras no superemos las 100.000 entradas en total;
  • mantener la confidencialidad de todos nuestros documentos (incluidos los archivos y memorias).

Pasemos a ver algunas de sus funciones en detalle:

 Memorias de traducción y glosarios

Podremos crear una memoria de traducción en cualquier momento. En tan sólo unos segundos podremos alojarla en nuestro servidor dedicado y empezar a almacenar segmentos. Las MTs son, hasta cierto punto, personalizables, pudiendo así incluir atributos específicos que nos muestren, por ejemplo, la fecha de almacenamiento, el nombre de nuestro cliente o el proyecto al que pertenecieron. Además, ofrece la posibilidad de acceder a ellas a través de nuestra cuenta o incluso convertirla en una memoria compartida con otros traductores.

Es importante destacar que también se nos ofrece la posibilidad de importar memorias de otras aplicaciones e incluso exportarlas desde Wordfast. De este modo, podremos extraer nuestras memorias en los formatos Wordfast TM (extensión txt) o con formato TMX, siendo compatible con la mayoría de herramientas del mercado.

Por su parte, los glosarios son listados de palabras en formato txt con separación por tabulaciones. Podremos añadir comentarios y hasta 3 campos personalizables (género, categoría gramatical, etc.).

Traducción asistida

Wordfast Anywhere incluye la tecnología VLTM: Very Large Translation Memories. Esta función nos permite activar una búsqueda pasiva de nuestros segmentos de origen en otras memorias de traducción de acceso libre. Así, podremos comparar unidades ya traducidas ya que sólo se ofrecerán como propuestas de traducción, pero en ningún caso sustituirán las unidades de nuestra memoria de traducción activa.

Además, la traducción automática de Google Translate está totalmente integrada, permitiendo, por ejemplo, pseudotraducir para después revisar o comprender mejor el texto (algo que dejo totalmente al juicio de cada traductor).

Compatibilidad

Wordfast Anywhere admite documentos de distintas extensiones y formatos, incluyendo:

  • proyectos de traducción en formato txml;
  • documentos de texto (txt), de MS Office (doc, docx, rtf, xls, xlsx, ppt, pptx) y de OpenOffice (odt, ods, tif, tif);
  • otros formatos (pdf*, htm, html, mif, inx).

*La gestión del formato PDF se efectúa por una conversión a rtf que deberemos descargar en nuestro equipo y después reenviarla para traducir.

Herramientas avanzadas

En este punto solo destacaré el uso de herramientas que, aunque haya titulado avanzadas, considero imprescindibles en una herramienta de traducción asistida. Son el alineador de documentos y la búsqueda de concordancia. Además, permite realizar un análisis de los documentos a traducir que incluye el número de palabras, coincidencias y repeticiones.

Conclusión

Aunque no sea una herramienta innovadora, sí que cumple las expectativas en cuanto a compatibilidad y accesibilidad. El modo editor es bastante intuitivo y recuerda a muchas otras herramientas TAO. Con tan sólo memorizar 4 combinaciones de teclado (personalizables), podremos empezar a traducir en cuestión de segundos.

Sin más, os dejo con una captura de pantalla donde se puede observar el menú editor con todas las funcionalidades como: el indicador y selector de segmentos (izquierda), el navegador y la barra de herramientas (parte superior), las coincidencias parciales y traducción automática (bajo la barra de herramientas), el editor con código de colores para los segmentos de origen y destino (zona central) y el visor de glosario (parte derecha).

pincha en la imagen para aumentar el tamaño

16 comentarios

Archivado bajo herramientas

Glosarios para OmegaT en 5 minutos

Editado: las versiones posteriores de OmegaT (como la actual 2.3.0) incluyen una opción para añadir términos en el glosario principal (generado automáticamente al incluir la primera entrada). Esta opción está disponible en el menú Editar, o con la combinación CTRL+Mayúsculas+G. No obstante, no nos dará elección a guardarlo en un glosario específico o personalizado, por lo que prefiero la edición manual.

Cuando presenté OmegaT no pensaba que la creación de glosarios fuera a suponer problema alguno. Sin embargo, ha llegado a mis oídos que preparar un glosario para OmegaT puede ser algo bastante complejo y engorroso.

Al igual que hice en mi reseña de GTT, os ofrezco una forma rápida y sencilla para preparar vuestros propios glosarios con total compatibilidad en OmegaT:

  • Para empezar, deberemos abrir nuestra herramienta estrella: el bloc de notas.
  • Escribimos el término en la lengua de origen y pulsamos el tabulador (Tab ⇆).
  • A continuación escribimos el término en la lengua de destino y volvemos a pulsar el tabulador.
  • (Opcional) podemos añadir una breve descripción.

Por último, guardamos el archivo:

  • Vamos a Archivo> Guardar como…
  • Deberemos asegurarnos de ajustar las siguientes opciones:
  • Deberemos especificar la extensión del archivo como utf8; por ejemplo, glosario_chulísimo.utf8
  • Y el tipo de codificación deberá ser también UTF-8.

¡Y ya está! Ya podemos copiar el archivo (o guardarlo) en la carpeta de nuestro proyecto y disfrutar con otra ayudita extra.

Antes de terminar, me gustaría recordar una serie de puntos:

  • Podemos utilizar más de un glosario a la vez, pudiendo tener un documento para cada especialidad.
  • Cada vez que queramos añadir una entrada nueva deberemos editar el glosario con el bloc de notas y añadirla manualmente (por lo menos en la versión2.0.5 aún no lo han integrado). Al guardar los cambios se actualizará el visor automáticamente.
  • En los casos en los que queramos añadir varios equivalentes para el mismo término de origen, deberemos añadirlos como entradas paralelas, es decir, repitiendo el término de la lengua de origen en otra línea cualquiera. Quedaría algo así:

Una vez que nos encontremos con algún término que hayamos añadido a nuestro precioso glosario, OmegaT nos ofrecerá todas las entradas que tengamos para dicho término (¡o incluso frase!).

2 comentarios

Archivado bajo herramientas

Un vistazo a Déjà Vu X2

Hace unas semanas que ATRIL ha lanzado la nueva versión de su producto estrella Déjà Vu. El nuevo Déjà Vu X2 (DVX2) promete muchas novedades y, al fin, he logrado ponerle las manos encima. A continuación os ofrezco una breve reseña de la nueva versión en comparación con la anterior.

Comenzando un proyecto

Las opciones principales para crear un nuevo proyecto son exactamente las mismas que en DVX. La creación de una nueva memoria de traducción y su gestión son exactamente iguales y ofrecen las mismas opciones que en DVX. No incluyen ninguna novedad excepto el entorno gráfico, que parece calcado de otras herramientas TAO.

La gestión de terminología tampoco ofrece novedades. Es más, sigue ofreciendo problemas de reconocimiento en español en cuanto a flexiones de género y número a la hora de validar la terminología, pues las detecta como inconsistencias.

Por el contrario, la alineación de archivos ha visto algunas mejoras entre las cuales cabe destacar la alineación de más de un documento por proyecto de alineación. A pesar de que es un punto a su favor, personalmente creo que es una función que ya debería haber estado presente en DVX.

Editor y el proceso de traducción

El editor es visualmente mucho más atractivo e integra (al fin) una ventana de explorador, donde podemos comprobar el número de palabras por documento y por proyecto al igual que el porcentaje del proceso de traducción. Aunque el editor continúa utilizando un código de colores para representar el estado de cada segmento, ahora se incluye una pequeña marca de visto bueno para representar los segmentos validados.

Además se incluye una opción que se echaba en falta en la anterior edición. Ahora podremos exportar los documentos antes de haber terminado la traducción.

También incorpora por defecto la nueva opción de autoescritura, es decir, si en el segmento de origen aparece un término presente en algunas de las bases de datos (lexicón, glosario o memoria de traducción), el editor nos ofrecerá la opción de incluir el término con tan solo escribir las primeras letras. Aunque no es una novedad en las herramientas TAO, si que es novedoso en cuanto a DVX2, ahorrándonos bastante tiempo a la larga.

Por otro lado siguen ocultando los códigos de formato, mostrando simplemente un código numérico que deberemos descifrar por nuestra propia cuenta para poder determinar si se trata de un hipervínculo, un tipo de fuente, etc.

Mejora en el ensamblado de segmentos

ATRIL promete haber mejorado DVX2 en cuanto a su funcionalidad en cuanto al ensamblado de segmentos. Al igual que en DVX, ofrece una opción de pseudotraducción, es decir, propaga segmentos con alta coincidencia en la memoria de traducción sustituyendo las diferencias por términos extraídos de forma inteligente de la memoria de traducción y de su Lexicón.

 Puntos a favor

Incluye total compatibilidad con Google Translate, lo que puede agilizar el proceso de traducción a la hora de pretraducir algún segmento a modo de borrador. También cabe mencionar que es totalmente compatible con DVX, pudiendo abrir documentos de la anterior versión y viceversa.

Puntos en contra

Las novedades incluídas ya deberían haber estado integradas en la anterior versión.

Sólo veremos mejoras del ensamblado si tenemos memorias de traducción y bases de datos de miles de segmentos y términos. Además, sigue sin reconocer categorías gramaticales, por lo que, en ocasiones, ofrece frases sin ningún sentido en español.

3 comentarios

Archivado bajo herramientas

Google Translator Toolkit: ¿herramienta profesional?

Hace ya tiempo que tenía el artículo medio preparado, pero como llevo unos días liado con otros proyectos no he tenido tiempo para terminarlo. Esta mañana, he visto que Verónica pedía opiniones de esta herramienta TAO y me he dicho: “hoy es el día perfecto para publicar esto.” Espero que resulte útil.

Google Translator Toolkit es una herramienta de traducción gratuita que cumple con todos los requisitos para convertirse en el aliado de los traductores con poco presupuesto como yo.

Formatos, un punto débil

A día de hoy, Google TT es compatible con la mayoría de los formatos básicos del mercado: html, doc, odt, txt, rtf, srt y sub. Sin embargo se queda corto y no permite subir formatos como docx, ni documentos de presentación ni hoja de cálculos. Esto no representa un obstáculo que no podamos solventar exportando el documento deseado a alguno de los compatibles… A menos que trabajemos con formatos.

Otro punto que podría parecer negativo es el tamaño máximo de archivo. Aunque parezca que 1 MB es ridículamente pequeño en estos tiempos que corren, pero hemos de tener en cuenta que no es tan poco, dado que solo trabajaremos con formatos de texto.

 ¿Idiomas? Todos los que quieras.

Google TT reconoce hasta 346 lenguas incluyendo sus variedades dialectales, y sigue creciendo. El problema viene a la hora de traducir a varias lenguas. No, amigo. De una en una. Si necesitas traducir un texto a 10 lenguas tendrás que crear 10 proyectos…

 Herramientas

El siguiente punto lo vamos a dedicar a lo que realmente buscamos en TAO: las memorias de traducción. Google TM utiliza el formato TMX, y podemos importar fácilmente cualquier MT siempre y cuando sea versión 1.0 o superior, un tipo de archivo con el que trabajan la mayoría (si no todas) las TAO. En comparación con los documentos, el señor Google es más generoso, y nos deja que cada TM ocupe hasta 50MB. Además, podemos gestionar las TMs, pudiendo actualizarlas, exportarla en formato nativo (TMX) e incluso hacer búsqueda de concordancias.

En lo que respecta a los glosarios… solo se me ocurre una forma de describirlo: caos.

Google TM trabaja con glosarios en formato CSV, y en su manual explican “muy bien” como crear uno en OpenOffice o en Google Docs. Personalmente no me gusta trabajar con esos programas y he encontrado un “truco”:

Escribid en una hoja del bloc de notas lo siguiente:

Glosario en notepad

  • podeis sustituir en por el idioma de origen y es por otro idioma objetivo. También podéis sustituir el ejemplo perro por cualquier otra palabra, pero no toquéis nada más.
  • Guardad como… Documento de texto (txt), Codificación: UTF-8
  • Una vez guardado se cambia la extensión a CSV.

Arreglado, ya podéis editar el archivo en MS Office, OpenOffice o incluso en el mismo bloc de notas.

Otro punto negativo, no podemos incluir términos en el glosario mientras traducimos. Si queremos añadir términos tenemos que crear un glosario nuevo para después importarlo al que queramos usar.

No se lo cuentes a nadie

El siguiente punto es bastante importante para todos aquellos que os dediquéis a la traducción profesionalmente: la confidencialidad. Todo lo que traduzcamos irá a la memoria compartida de Google a menos que indiquemos lo contrario al crear el proyecto.

Por otro lado, podemos compartir cualquier proyecto, documento, MT o glosario con quien queramos sin que Google se alimente de nuestros conocimientos. Ideal para las traducciones en grupos.

Extras:

  • Estadísticas: no hay mucho que decir, sólo nos comenta el número de palabras pretraducidas o las que nos quedan para acabar.
  • Añadir comentarios: nada especial.
  • Traducción Automática de Google Translate: pues aquí les tenemos, para que nos eche una mano en las frases más complicadas. Personalmente, no lo recomiendo.

Otras consideraciones:

A pesar de que podemos importar y exportar glosarios y memorias en cualquier momento, no podemos añadir una TM o un glosario una vez que hayamos empezado a traducir un documento. Es necesario seleccionarlos cuando preparamos el proyecto.

Además, solo podemos trabajar con un glosario y/o una TM por documento.

Un último punto negativo: al tratarse de una herramienta online basada en una web, no podemos utilizar los atajos de teclado. Nos toca avanzar a clicks y eso nos puede hacer perder bastante tiempo.

Personalmente me gusta utilizarlo cuando no estoy en casa, solo hace falta una cuenta de google.

Espero que en el futuro mejoren los aspectos negativos.

18 comentarios

Archivado bajo herramientas

OmegaT o cómo ahorrarnos el precio de una licencia

Los comienzos siempre son arriesgados y requieren cierta inversión. En el campo de la traducción, nos vemos obligados a invertir en herramientas, en equipos, diccionarios, e incluso marketing.

En concreto, la inversión en herramientas de traducción es una de las más recomendables. Sin embargo, ¿por qué no ahorrarnos unos cientos de euros en licencias y programas mientras podemos utilizar software libre?logo_OmegaT

Me gustaría presentaros a OmegaT, una herramienta libre de traducción asistida que recomiendo probar a todos os especialistas en el campo.

Soy consciente de que no es el programa más sofisticado del mercado, sobretodo si lo comparamos con otros de los “grandes” que no voy a comentar ahora. Por otro lado, es bastante flexible y contiene todo los necesario para lanzarnos al mundo de la traducción técnica. Permitidme listar algunas de las características que me han animado a instalar esta herramienta en mi equipo:

  • Es gratis: olvídate de licencias y de plug-ins adicionales.
  • Es compatible con los formatos tmx para memorias de traducción, y resulta muy fácil editar, importar y exportar los datos. ¡Tan sólo hace falta el bloc de notas!
  • Dispone de glosarios y diccionarios que puedes crear fácilmente en un documento separado por tabulaciones.
  • Tiene un útil contador de segmentos, palabras y caracteres.
  • Permite la edición y validación de etiquetas.
  • Todas las combinaciones de teclado aparecen en el menú contextual. Puedes avanzar por medio de su menú o consultar los accesos directos en “dirigirse a” en cualquier momento.
  • Incluye el servicio de Google Translate. Puedes ayudarte de la traducción automática y editar posteriormente el resultado, quedando guardado en tu memoria de traducción.

Como ya he dicho anteriormente, todos los datos se pueden exportar con facilidad a otros programas de traducción asistida. Lo único que echo en falta es una búsqueda de concordancia aproiada y una utilidad para alinear documentos, pero bueno, siempre se pueden utilizar otros programas externos que intentaré comentar en futuros artículos.

Probad OmegaT gratis ahora mismo en su página oficial.

2 comentarios

Archivado bajo comienzos, herramientas