Preparación de nuevos tipos de archivos con herramientas CAT (con JSON de ejemplo)

Hola a todos:

En los últimos meses me he venido encontrando un formato de archivo que no había recibido antes para preparar para traducción. Se trata de JSON (JavaScript Object Notation). JSON se utiliza principalmente como una alternativa a XML para transferir e intercambiar datos de forma sencilla. Además es también bastante común el encontrarse este tipo de datos como información integrada (embedded) dentro de otros tipos de archivo (por ejemplo, dentro de archivos JavaScript).

La cuestión es que en este post adjunto el tipo de archivo JSON que he preparado para SDL Trados Studio. No obstante, en este caso lo que me parece interesante es el comentar el proceso para aprender a crear (conceptualmente, con independencia de la herramienta CAT usada para traducir) cualquier definición de tipo de archivo.

Lo primero que hay que hacer al encontrarnos con un nuevo tipo de archivo es documentarnos. En el caso de JSON (y de la mayoría de archivos ligados a la programación web), Wikipedia (http://en.wikipedia.org/wiki/JSON) y w3schools (http://www.w3schools.com/json/) son siempre una buena opción. Tras documentarnos sobre las características formales el tipo de archivo es importante hacerse con unas copias y ejemplos (a ser posible, reales y del cliente para el que trabajemos) para comprobar que siempre vamos a trabajar con la estructura correcta. En el caso de JSON, según la definición estándar, la sintaxis se estructura en torno a pares de valores entrecomillados (comillas dobles) y separados por dos puntos. Por ejemplo:

“nombre” : “Alvaro”, donde “nombre” es el campo y “Alvaro” es el valor.

Dado que JSON se emplea a menudo como alternativa a XML, es interesante ver la analogía con la sintaxis de éste último, <nombre>Alvaro</nombre>.

Esta estructura (“elemento” : “valor traducible”) es la base sobre la que se crean otras más complejas como se puede observar en los diversos archivos de ejemplos, en los que hay diferentes niveles anidados y matrices con información. Pero, ¿es esto realmente importante?

Estructura Json

Estructura Json

En realidad, no es algo decisivo. A efectos de traducción, lo interesante es que hemos identificado que la información que se desea traducir es únicamente el valor entrecomillado que hay tras los dos puntos en cada par de valores. Por tanto, al crear nuestro tipo de archivo, conceptualmente hay que pensar algo como “sólo quiero traducir todo lo que haya entre dos puntos, comillas dobles de apertura y las comillas dobles de cierre” (:”TODO ESTO SERIA TRADUCIBLE, PERO NO MAS”).

Una vez hemos llegado a este punto, lo que hay que hacer es trasladar esa idea a la herramienta que utilicemos a fin de que al procesar los archivos únicamente se extraiga como texto traducible lo deseado.

Seleccionar tipo de definición de archivo

Seleccionar tipo de definición de archivo

En el caso de la definición de archivo JSON que he preparado para SDL Trados Studio, partí de la base de usar expresiones regulares porque me siento bastante cómodo con ellas (y porque era la opción más viable que había). Una vez hecho eso, la cuestión fue plasmar “sólo quiero traducir todo lo que haya entre dos puntos, comillas dobles de apertura y las comillas dobles de cierre” en una expresión regular. Este podría ser un desglose del razonamiento

  1. “elemento” : “valor traducible” –> Estructura general
  2. : “valor traducible” –> Estructura traducible (incluyendo espacios)
  3. : “cualquiertexto” –> Estructura traducible (incluyendo espacios)
  4. : “–> Expresión de inicio de segmento
  5. Cualquiertexto –> Texto traducible
  6. ” –> Expresión de fin de segmento

Tras desmembrar la idea, ya solo es cuestión de escribir la expresión regular en el lugar adecuado en la herramienta CAT (Studio en mi caso). De todas formas, nunca está de más hacer unas cuantas pruebas en herramientas que permitan hacer búsquedas con expresiones regulares como, por ejemplo, Notepad ++. En el caso de JSON, la expresión completa para pruebas sería :\s*?».*?» (descripción de la expresión regular: dos puntos seguidos no obligatoriamente por 1 o más espacios en blanco, comillas dobles, cualquier combinación de números, letras y espacios en blanco y finalmente otras comillas dobles).

Pruebas

Pruebas

Tras hacer todas las comprobaciones que se deseen y configurar la regla general de extracción del texto traducible en el archivo podemos definir otros parámetros (entre otros la extensión de archivo predeterminada para la definición que en la que yo os ofrezco es .json) adicionales como la gestión de elementos internos, etc. En mi definición, aunque no tenga mucho sentido he puesto, por si las moscas, que se traten como elementos no traducibles todas las posibles etiquetas (por si alguien integra html dentro de JSON).

Creo que eso es todo. Me parece que con esta breve explicación cualquiera que se ponga a pensar un rato podrá hacer frente a nuevos tipos de archivo como JSON y prepararlos para traducirlos con CAT en lugar de manualmente.

Archivo de ejemplo 4 preparado

Archivo de ejemplo 4 preparado

Y ya que estamos, además la definición de JSON para Studio, también os dejo la de los archivos .rc de Windows que, aunque parezca mentira (¡a estas alturas de la vida!), hace poco me llegó un archivo rc para traducir. Aquí va pues la definición de tipo de archivo RC.

Con eso me despido. Espero que algunos os animéis con archivos “raros” a partir de ahora.

Un saludo,

Álvaro

Recomendación musical: Miracle un tema un poco antiguo de los Foo Figthers que escuché de fondo en Camden mientras paseaba con mi mujer y se me ha quedado en el coco.

Preparación de archivos XML con información contextual (vía XPath)

Hola a todos,

En los últimos meses he tenido que preparar bastantes archivos XML para su traducción con SDL Trados Studio. Por mi pasado como traductor, tengo siempre muy presente que cuanta más información haya sobre cada uno de los segmentos que se deben traducir, más calidad tendrá el resultado final. Y si además esa información está disponible dentro de una misma plataforma (en este caso dentro de la herramienta CAT para traducir), mejor.

En este artículo describiré rápidamente cómo aprovechar la información contextual en los XML que la tienen (algo cada vez más habitual en los archivos que se envían para traducción en forma de atributos o elementos de comentario). Para ello, utilizaremos la configuración avanzada de Studio y Xpath (para más información sobre Xpath y traducción, véase, por ejemplo, este post de multifarious).

Como ejemplo de archivo XML, tomaré el siguiente: un catálogo de libros en los que el elemento title (título) contiene un atributo llamado comment (comentario), en el que se ofrece información adicional acerca del propio título del libro. Por ejemplo, en el primer elemento, para el libro XML Developer`s Guide, hay disponible un comentario que dice “This book is also available on a CD. Translate this consistently”.

La idea es que, cuando estemos traduciendo, podamos tener acceso a esta información contextual desde la herramienta CAT en cada una de las unidades de traducción sin tener que abrir el archivo XML e ir haciendo búsquedas manuales.

XML de ejemplo

Una vez hayamos creado nuestra definición de tipo de archivo personalizada para el archivo XML (el asistente hace el trabajo bastante bien, no me voy a detener a explicarlo aquí, quizá en otro post), podemos hacer uso de las opciones más avanzadas para añadir la información contextual que he comentado. Para ello, seleccionamos Tools > Options > File Types y, a continuación, nuestro tipo de archivo personalizado (en el ejemplo es ProcessComments, previamente preparado tras dejar los elementos traducibles). A continuación, accedemos a la sección Parser y seleccionamos elemento para el que queremos añadir la información contextual. Conforme al ejemplo, el elemento en cuestión es title y seleccionamos Edit.

Parser Options

En el siguiente panel, definiremos la regla para el elemento. Además de especificar que siempre será traducible (el título del libro), el siguiente paso será definir el tipo de etiqueta como de estructura (Structure) y dejar el whitespace como la opción predeterminada, salvo que haya algún motivo (y conocimientos suficientes) para cambiarla.

Edit Rule

A continuación, hay que hacer clic en Edit, en la parte correspondiente a la información sobre la estructura. Acto seguido, pulsamos Add para añadir una propiedad.

Structure Info

En la pantalla de edición de la información, tendremos que usar como Purpose la opción Information (puesto que los comentarios son meramente informativos) y, a continuación, añadir un nombre (Name). El código y la información de identificación (identifier) se rellenarán automáticamente. Por último, llegamos a la opción más importante, Set description from content of this relative XPath. Mediante esta opción, podemos definir el elemento del archivo XML de donde se extraerá el contenido que se mostrará como información contextual para cada uno de los segmentos en los que se traduzcan elementos title.

Info context

En el caso del ejemplo, nos encontramos con la siguiente situación:

<title comment=» “This book is also available on a CD. Translate this consistently»>XML Developer`s Guide</title>.

El elemento title tiene un atributo comment. Esta estructura es de hecho, la estructura del elemento title para todo el archivo XML, así que lo que debemos hacer es enlazar el atributo comment a la opción Set description from content of this relative XPath. Para ello, debemos utilizar la regla de XPath correspondiente. Conforme a la especificación de XPath, debemos utilizar arroba y el nombre del atributo, es decir @comment. Básicamente, con esta regla de Xpath se le dice a Studio que en cada elemento title, busque dentro un atributo comment y, si existe, que muestre su contenido para la propiedad que acabamos de definir como Info Context en el ejemplo.

Por último, también podríamos alterar el formato de todo el elemento title y del contenido de Info context, pero yo particularmente no soy muy amigo de los colorines (en todo caso, recomendaría asignar algún fondo gris o de color no llamativo).

Tras aplicar la regla, al preparar archivos que casen con la definición de archivo preparada para los archivos XML de mi catálogo de libros, la información de contexto personalizada con comentarios para cada unidad de traducción estará disponible en la columna de la derecha en SDL Trados Studio. Como se muestra en las capturas siguientes, al hacer clic en la columna correspondiente en cada segmento, podemos ver los comentarios respectivos desde la herramienta CAT, sin tener que hacer búsquedas en archivos externos (copia texto de origen, abre editor de texto, abre comando de búsqueda, pega texto de origen, encuentra texto de origen y localiza comentario correspondiente).

XML bien preparado en Studio

Al tratarse este artículo de un ejemplo introductorio, el contenido del mismo puede parecer hipersimplificado para las personas con mucha experiencia en la gestión y preparación de archivos XML. Sin embargo, creo que para los que no tienen tanto bagaje,  este post puede picarles la curiosidad para empezar a jugar con las propiedades avanzadas, acercarse a Xpath, etc.

Finalmente, me gustaría aclarar que aunque en el ejemplo he usado SDL Trados Studio, realmente la dinámica de trabajo para preparar archivos de esta forma es prácticamente idéntica en cualquier herramienta CAT. La clave está realmente en aprender a aplicar las reglas de Xpath correspondiente y luego sólo es cuestión de aplicar el concepto a la herramienta CAT en cuestión. No hay más misterio.

Bueno, eso es todo. Espero que os resulte útil esta breve explicación y que os lancéis a mejorar la preparación de vuestros archivos. A medida que se practica y se va teniendo éxito, el perfil de usuario mejora, así que en, al fin y al cabo, terminas por ser capaz de ofrecer un mejor servicio.

Un abrazo y hasta la próxima.

Recomendación musical: lo último que he escuchado de Kings of Leon me gustó bastante, el single se llama supersoaker.

Aplicación de formato en SDL Trados Studio

Saludos a todos. Espero que hayáis pasado todos un verano (en el hemisferio norte, para los de otras latitudes más meridionales, no os quitéis el abrigo) estupendo.

Hace ya bastantes meses, hubo una lectora de (Nunca) Sobran las palabras que me planteó una serie de dificultades que le surgían a la hora de aplicar los diferentes tipo de formato de un texto (negrita, cursiva, superíndice, etc.) en una traducción cuyos segmentos presentaban un grado de complejidad relativamente elevado precisamente en términos de etiquetas y marcas de formato. Pasado un tiempo, al impartir un curso, me di cuenta de que, de nuevo, la aplicación del formato en el texto de destino representaba un problema para los usuarios no avanzados, que tendían a obviarlo (con los problemas que ello conlleva), o bien, a aplicar únicamente negritas, cursivas y subrayados, dejando de lado el resto de etiquetas que marcaban el cambio de fuente, etc.

A fin de aclarar un poco la situación para unos y otros, así como refrescar un poco las ideas de los usuarios habituales de SDL Trados Studio, he grabado un breve video sobre las tres formas principales de aplicar formato en esta herramienta. Son las siguientes:

1. Aplicación tipo formating painting de SDL-X o comando Copiar formato de MS Word: se trata de una función parecida a la clásica de SDL-X, que te permite replicar el formato del texto de origen en el destino utilizando el ratón para calcar el formato.

2. Utilización del método abreviado Ctrl+, (coma): al pulsar esta combinación de teclas se abre una lista con todos los posibles formatos que podemos aplicar a cualquier parte del texto de destino.

3. Utilización de la función QuickPlace: se trata de prácticamente lo mismo que el método anterior, pero con la diferencia de que QuickPlace es un panel que se queda abierto y varía dinámicamente en función del segmento activo.

Formatos en SDL Trados Studio

En el VÍDEO podéis ver un ejemplo de aplicación, así como la solución por la que muchos traductores optamos cuando hay muchas marcas de formato y etiquetas en un texto: copiar el texto de origen tal cual y sobrescribirlo con la traducción, respetando la posición de los indicadores de formato y las etiquetas de apertura y cierre.

Bueno, como en el verano del sur de España el calor se nota bastante, creo que con este artículo más ligero que en otros casos, pero mucho más refrescante y práctico en que otras ocasiones nos podemos dar por satisfechos, ¿no?

Espero que a todos los que tengáis dificultades o no conocieseis todas las alternativas para aplicar el formato, estas breves notas y el vídeo complementario os resulten útiles.

Sin más, un caluroso saludo.

Atentamente,

Álvaro

Recomendación musical: “Runaways”, single de lo nuevo de The Killers, que saldrá en otoño. No llega al nivel de Hot Fuss, pero se puede escuchar, que no es poco en estos tiempos.

Cambio de variedad lingüística (locale) y dirección de una TM

Saludos a todos, estimad@s lector@s:

Os cuento. En las últimas semanas he estado ejerciendo como formador y asesor de procesos y herramientas de traducción asistida por ordenador (TAO, o CAT por las siglas en inglés) para una empresa de traducción. Cuando hemos visto la gestión de memorias de traducción (TM por las siglas en inglés), me han planteado dudas sobre cómo cambiar la combinación de idiomas, usar las TM en ambas direcciones, etc.
Esta serie de preguntas enlazan con otras consultas privadas que he recibido a través de este blog-consultorio, en las que se me planteaban problemas similares. Bueno, pues atajemos los dos problemas principales a los que he respondido en esta materia: cómo cambiar la variedad de un idioma (locale o language flavour en el mundillo de la localización [L10N]) y cómo invertir la combinación lingüística de una TM (para pasar, por ejemplo, la combinación inglés-español a español-inglés).

Para mostrar cómo solucionar estas dos cuestiones concretas he grabado un par de vídeos en los que utilizo, por una parte, memorias en formato .tmx (por ser interoperables en varias plataformas) y, por otra, Wordfast Classic (versión 6) como herramienta de trabajo para la inversión lingüística, al tratarse de una herramienta que puede descargarse gratuitamente (además, dos de las personas que me plantearon la duda sobre el cambio de locale trabajaban con Wordfast). No obstante, tras los comentarios recibidos, el uso de Olifant también se presenta como una alternativa muy interesante (esta última frase se ha añadido para mejorar el post con el feedback de los lectores).

Cambio de locales en una TM

En L10N, el concepto de locale tiende (recalco lo de tiende, puesto que en realidad engloba muchas más cosas) a identificarse automáticamente con la variedad específica de un idioma. Por ejemplo, en el caso del inglés, este se divide en diferentes locales específicos identificados con códigos informáticos como ‘en-gb’ para inglés de Reino Unido, ‘en-us’ para inglés de EE. UU., ‘en-au’ para inglés de Australia, etc. La cuestión radica en que en ocasiones y por diferentes motivos se necesita cambiar una TM para que los locales se adapten al de un archivo que hemos recibido para traducir. En el ejemplo que se muestra en el vídeo hay que pasar una memoria en .tmx de inglés de EE. UU. y español de España a inglés de Reino Unido y español de México.
En el mercado hay muchas herramientas de TAO que te permiten elegir el locale concreto al importar desde formatos como .tmx (en este sentido el asistente de TM de Déjà Vu X2 es realmente práctico y el módulo de gestión de TM de SDL Trados Studio ofrece gran flexibilidad al importar memorias en .tmx). No obstante, al hacer los cambios manualmente con un editor de texto plano aprendemos un procedimiento que podemos emplear con independencia de la plataforma que usemos (algo realmente práctico cuando trabajas gestionando proyectos de diversa índole).
Bueno, aquí va el vídeo del tutorial sobre el cambio de locales en una TM en .tmx:

Inversión de los idiomas de una TM

En ocasiones, y especialmente cuando se trabaja, por ejemplo, en una oficina en la que se traduce con una combinación lingüística en ambas direcciones (traducción directa e inversa de inglés y español, por ejemplo) resulta interesante utilizar como referencia una misma TM y adaptar su sentido (directo o inverso) en función de las necesidades. Me ha parecido sorprendente que, tras echar un vistazo a varias plataformas de TAO potentes, no he encontrado nada tan práctico y rápido como la solución que puede ofrecer Wordfast: abres una TM en .tmx, pulsas en un par de botones para invertir el sentido de la combinación lingüística y, a continuación, exportas la nueva TM. Todo en menos de un minuto. En el resto de herramientas habitualmente hay que seleccionar muchos más parámetros, hacer ajustes, etc. Total, que acabas perdiendo bastante tiempo para algo que debería ser cuestión de minutos.
En el ejemplo que se muestra en el vídeo a continuación se utiliza la TM en .tmx con los nuevos locales creada en el apartado anterior para invertir el sentido de inglés de Reino Unido a español de México a español de México a inglés de Reino Unido.
Aquí va el vídeo:

Bueno, espero que os resulten prácticos este par de procedimientos rápidos y gratuitos, sobre todo a aquellos que no sólo traducís y gestionáis sino que además hacéis de ingenieros lingüísticos sobre la marcha.
Un saludo,

Álvaro

Recomendación musical: Kelly Jones de Stereophonics con el padrino del mod Paul Weller y Ronnie Wood de los Rolling Stones que se juntan para homenajear a los Beatles con Don’t let me down.

Para los que siguen añorando Trados…

Hola a todos:
Bueno, solo una nota rápida. En muchos de los comentarios y correos que la gente me escribe, queda patente que Trados (sí, el clásico Workbench combinado con Word o con TagEditor) sigue siendo muy popular entre una gran cantidad de traductores y localizadores.

Cuando tienes que hacer gestión de proyectos, hay veces que cuesta encontrar un recurso (un traductor o un revisor, vamos) de calidad. Después, hay casos en los que tras encontrar a la persona que necesitas para el trabajo, resulta que no tiene la herramienta que por las circunstancias del trabajo en particular se necesita (a la gente que trabaja como gestor en agencias les sonará esto). Para este tipo de situaciones, que con SDL Trados Studio se dan bastante a menudo (sobre todo con idiomas que se salen del cuarteto FIGS según me han comentado algunos colegas PjM), poder recurrir a Trados como herramienta de trabajo resulta muy útil. Para ello se ha desarrollado SDLXLIFF to Legacy Converter, que transforma los archivos sdlxliff de SDL Trados Studio en archivos ttx de Trados.
Se trata de una magnífica solución para situaciones de emergencia como la descrita anteriormente. Espero que a los que gestionáis os pueda resultar útil para abrir el abanico de posibilidades.
Como he dicho, este post iba a ser cosa rápida.
Nos vemos,

Álvaro

– Recomendación musical: lo que estoy escuchando ahora, Cum on Feel the Noize, una genial cara B de Oasis, con Liam con su mejor voz y Noel con su mítica guitarra con la Union Jack.

Complementos indispensables para SDL Trados Studio

Hola a todos y, como ya es costumbre, perdón por haber tardado tanto en escribir de nuevo. Entre unas cosas y otras, el blog siempre se va quedando el último en la lista de prioridades. Feliz año 2012, por cierto.
Bueno, para retomar el hilo de post anteriores acerca de SDL Trados Studio que tanto parecen haber gustado al personal, me dispongo a recomendar rápidamente tres complementos o plugin esenciales para esta aplicación (versión tanto 2009 como 2011) desde mi punto de vista. La verdad es que los complementos permiten incorporar al programa las mejoras que necesita en diferentes funcionalidades que se echan en falta en las versiones completas del programa. Se trata de módulos adicionales gratuitos (en este caso) disponibles en la página de aplicaciones abiertas de SDL que podemos ejecutar de forma integrada con SDL Trados Studio. Sinceramente, creo que todo el que trabaje con Studio a menudo debería conocerlos (mis compañeros y los freelancers con los que trabajo los conocen y están más satisfechos con el rendimiento de Studio desde que los utilizan) y personalmente considero que en la instalación de ningún traductor o revisor deben faltar los siguientes:

a. SDL XLIFF Converter for MS Office: se trata del complemento más importante para la herramienta, puesto que permite al traductor realizar las comprobaciones más prioritarias de su trabajo, es decir, pasar los correctores ortográfico y gramatical. Aunque Studio 2011 ya integra el corrector ortográfico de MS Word, no integra el gramatical. Este complemento genera un documento de MS Word bilingüe que podemos corregir y modificar para a continuación, importar los cambios directamente a Studio (podemos definir el estado de los segmentos, etc.). Además de la seguridad que proporciona el hecho de poder usar los correctores de MS Word, este complemento abre también otra vía muy interesante, la de la interoperabilidad. Dado que la traducción se exporta a MS Word y luego todos los cambios pueden importarse fácilmente, personas que participen en, por ejemplo, un proyecto en grupo, podrían traducir manualmente en el archivo exportado de MS Word, ya que finalmente su trabajo podría incorporarse al proyecto general importando su traducción a través de SDL Xliff Converter. Esto representa, por tanto, una forma de acceder a trabajos que exigen Trados Studio sin que necesariamente tengamos que dominar a fondo (ni tener) la propia herramienta. Obviamente, se trata de una solución temporal y de emergencia en algunos casos, pero no está de más saberlo.
b) SDL Batch Find/Replace: una de las limitaciones que han tenido las herramientas de SDL hasta la fecha (Trados Workbench, SDL-X y SDL Studio) es la incapacidad para aplicar cambios lingüísticos a varios archivos que pertenecen al mismo lote desde la propia interfaz de traducción. En el caso de la suite 2007, el asunto se solucionó con el magnífico Transistor que algunos conoceréis y que funciona a las mil maravillas con SDL-X. Para ofrecer una funcionalidad parecida, se ha diseñado SDL Batch Find/Replace, que permite realizar operaciones de búsqueda y reemplazo, cambio de estado, bloqueado y desbloqueo, etc. en varios archivos al mismo tiempo sin necesidad de tener que abrir cada uno de los archivos del proyecto de trabajo de SDL Trados Studio. A mí me parece muy práctico para aplicar cambios generales y realizar comprobaciones de última hora.
c) SDL XLIFF Split/Merge: ¡cuántas veces hemos recibido un archivo gigante con miles de palabras que necesitábamos dividir para repartirlo entre los miembros del grupo trabajo o recursos de producción! Hasta la publicación de este complemento, la tarea de dividir los archivos sdlxliff de Studio en partes se debía hacer de forma (peligrosamente) manual, o bien, no hacerse como tal (sino especificando hasta dónde había que traducir). Afortunadamente, este complemento te permite especificar cómo quieres dividir un archivo sdlxliff (en función del número de palabras, estados, etc.) para, posteriormente, volver a unirlo cuando esté traducido y revisado. Personalmente, a mí me ha resultado muy práctico para primero dividir un archivo en partes, crear un proyecto nuevo con esas partes y finalmente sacar paquetes de Studio individuales para cada una de las partes divididas anteriormente (de esta forma, la precisión es mucho mayor que con otros métodos alternativos). Es un complemento especialmente útil para la gestión de proyectos grandes que han de externalizarse. Eso sí, esta aplicación permite dividir un archivo y luego fusionarlo (usando el archivo de información que se crea, es importante no perderlo), pero no al revés: no se pueden fusionar archivos diferentes y después separarlos, en este caso, lo mejor es añadirlos a un proyecto y fusionarlos durante la creación.
d) SDLXLIFF Compare: por último, llegamos a un complemento que me gusta porque te permite aprender. ¿Por qué? Todos necesitamos ver en qué fallamos, qué debemos corregir, etc. Esta aplicación te permite comparar dos versiones de un archivo sdlxliff (por ejemplo, traducción y revisión) y generar un informe en que se aprecian fácilmente los cambios realizados. A mí me gusta para en algunos casos pasar informes de sus cambios a los traductores externos, pero, sobre todo, lo uso a menudo para comentar las traducciones con los traductores noveles de la oficina, puesto que es la mejor manera de que sepan cuáles son sus fallos y dónde los cometen. Esta función ya estaba en otras herramientas CAT e incluso en el propio SDL Tardos Studio en forma de control de cambios; no obstante, me parece que poder disponer de informes detallados independientes en HTML resulta mucho mejor.

Hasta aquí hemos llegado con los complementos. Realmente, como he dicho al principio, esto es sólo una pequeña selección de mis favoritos. Os recomiendo visitar SDL OpenExchange de vez en cuando puesto que hay varios desarrolladores que publican nuevos complementos de cuando en cuando.

Un saludo a todos y gracias por vuestra atención.
Atentamente,

Álvaro

Creación de TM en tmx con material disponible para CAT (memoQ, SDL Trados Studio)

En los últimos meses he recibido varias consultas de algunos lectores que se inician (o no tanto) en el mundo de la traducción y me preguntan cómo crear una TM a partir de documentos que ya tienen disponibles. En la mayoría de los casos, se trata de usuarios que no quieren todavía realizar el desembolso en una herramienta CAT de las potentes (SDL Trados Studio, Deja Vu, MemoQ, Accross, etc.), sino que quieren empezar a probar otros sistemas con material de trabajo real.

Mi respuesta siempre ha sido la misma: usa WinAlign u otro alineador para crearte una TM con los documentos equivalentes que ya tienes en inglés y español y así poder comenzar a trabajar. La cuestión es que creo que mi respuesta no ha sido lo suficientemente concreta, o no permite que muchos usuarios puedan empezar a trabajar, así que he decidido ser más explícito y ofrecer una solución más tangible a través de esta entrada y de  los vídeos adjuntos.

Mi propuesta pues para crear la TM es usar la combinación de herramientas más sencilla (y económica) que se me ha ocurrido para empezar: Wordfast y Plus Tools. Plus Tools (Ptools) es una suite de complementos GRATUITA para Wordfast (que también es gratuito hasta alcanzar una cierta cantidad de unidades de traducción) pero que en realidad nos va a servir para nuestro propósito por dos motivos: 1) al integrarse en Word, resulta sencilla y accesible para cualquier usuario y 2) crea una TM que a través de WF podemos exportar a tmx, de forma que podremos importarla luego a cualquier herramienta CAT* que queramos (en el ejemplo, usaré memoQ). Sin más dilación, manos a la obra, alineemos los documentos, creemos la TM e importémosla. Aviso: he usado dos textos de la Red de cuya calidad lingüística no me hago responsable.

Pasos:

1)      Descarga e instala Plus Tools y Wordfast en Word (lee los manuales para hacerlo, es básicamente cargar una plantilla en Word).

2)      Alinea los documentos. Alinear es en realidad un ejercicio de “unir con flechas” del texto en inglés y en español. Dado que a veces el sistema automático de Plus Tools no es perfecto, puede que haya que corregir algunas frases, tal y como se ve en el vídeo. Consulta el manual para ver el funcionamiento, pero vamos, que es muy sencillo e intuitivo.

3)      Crea la TM. Sigue las instrucciones que hay al principio del documento de la alineación para crear la TM. A continuación abre esta TM en Wordfast y expórtala a tmx.

4)      Abre la herramienta CAT que quieras utilizar para traducir, en mi caso MemoQ. Desde el módulo de TM, usa los comandos correspondientes para crear una TM con la misma combinación de idiomas del archivo TMX (en el ejemplo eso ya está hecho) y, a continuación, importa la TM en TMX a tu nueva TM del programa CAT.

Aquí os dejo los tres vídeos del proceso para memoQ:

1. Alineación y creación de TM.

2. Exportación a tmx vía WF.

3. Importación de TM en tmx a CAT.

Tras completar estos pasos, tenemos una TM operativa en cualquier programa de CAT que queramos utilizar y, como vemos en el vídeo, funciona perfectamente.

Bueno, eso es todo. He tratado de hacerlo lo más sencillo que he podido para que la próxima vez que queráis crear una TM desde cero mediante alineación de forma GRATUITA, no os resulte complicado.

* En realidad, la gran mayoría de las herramientas CAT tienen su propio alineador. Yo propongo el de Plus Tools porque es gratuito y, si usas herramientas gratis tipo Omega T, es el más sencillo para crear TM en tmx. No obstante, los de plataformas de pago, son más potentes (a mí me gusta WinAlign de SDL Trados).

– Recomendación musical: como no podía ser de otra forma, The Death of You and Me, la presentación en solitario de Noel Gallagher.

QA y expresiones regulares en herramientas CAT (SDL Trados Studio) o generales (Microsoft Word)

Cuando llevas un tiempo relativamente razonable en el mundo de la traducción, llegas a la conclusión de que hay mucha gente capaz de hacer relativamente bien la gran mayoría de los trabajos que conforman el volumen de trabajo habitual de un proveedor de servicios lingüísticos para el que yo trabajo. Por tanto, si hay tantos profesionales (tanto recursos de producción freelancers como la propia competencia) capaces de ofrecer un nivel de calidad, pongamos 8, ¿qué puedo hacer para diferenciarme y ofrecer la máxima calidad (entre 9 y 10)?

Más allá de los procedimientos más habituales de la fase de control de calidad (QA) que se lleva a cabo normalmente tras finalizar la fase de traducción y de revisión (entre los que encontramos las clásicas revisiones ortográficas y gramaticales, las comprobaciones con perfiles automatizados tipo ‘igual puntuación source-target’, ‘comprobación de ¿? en español’, etc.), me gustaría llamar la atención sobre las expresiones regulares. Como define Microsoft, las expresiones regulares (regexp en inglés) no son más que fórmulas para identificar patrones de texto. La ventaja que ofrecen las expresiones regulares sobre estos sistemas de QA basados en glosarios y listas de palabras prohibidas es que superan la limitación de las propias palabras y van un nivel más allá. Veamos a lo que me refiero con un ejemplo concreto. Pongamos que tengo un proyecto de 90.000 palabras que tengo que repartir entre cuatro traductores (e incluso después entre dos revisores). A pesar de que les entregue mucha documentación lingüística (TM, glosarios) y referencias de estilo, es probable que haya divergencias en el resultado final en cosas como la localización de modelos de productos con números, números de piezas, el uso de mayúsculas tras puntos, el uso de un tipo de comillas u otras, etc.

Si yo deseo alcanzar la máxima calidad y limitarme a enviar el trabajo al cliente tal cual, podría usar las expresiones regulares para añadirlas al QA de mi herramienta CAT (prácticamente todas permiten hacerlo) para garantizar máxima precisión, coherencia y consistencia del material. A continuación, un ejemplo para ver a qué me refiero:

ST       Warning: Make sure all options are enabled before proceeding.

TT       Advertencia: Antes de continuar, compruebe que todas las opciones están activadas.

En este ejemplo, tendríamos un pequeño error puesto que tras : debería ir minúscula. Si tengo 90.000 palabras, ¿voy a revisar todos los : de mis archivos manualmente? La respuesta es no, para eso usaremos la siguiente expresión regular (en este caso escrita en un perfil de SDL Trados Studio y mostrada en el QA interactivo):

: [A-Z] (Descripción de la regla: si en el target se encuentra el patrón ‘dos puntos, espacio, cualquier caracter en mayúscula’ se genera una advertencia).

RexExp dos puntos

Con esta sencilla fórmula podemos identificar todos los fallos de este tipo en cuestión de segundos para corregirlos de forma mucho más eficaz. De hecho, si hubiésemos sido previsores, podríamos haber facilitado a nuestros traductores un perfil con expresiones regulares de este tipo para minimizar el número de potenciales errores de la última fase de QA al reunificar las 90.000 palabras repartidas entre los cuatro traductores.

Creo que este ejemplo muestra claramente que las expresiones regulares tienen un elevadísimo potencial que nos permitirá elevar la precisión de nuestra fase de QA y, consecuentemente, el de nuestro trabajo (tened en cuenta que podemos crear expresiones que se ajusten a todo tipo de necesidades usando tanto patrones como texto literal para, por ejemplo, comprobar que una dirección web siempre se localiza tal y como se muestra más abajo.).

Hay mucha gente que pensará que esto de las expresiones regulares es muy complicado pero, para los que sean de esa opinión, sólo puedo deciros que en un mercado tan competitivo hay que esforzarse por marcar la diferencia aprendiendo y ofreciendo servicios adicionales y de valor añadido. Además, las expresiones regulares son una habilidad transferible, se trata de un lenguaje universal que se puede aplicar en muchos contextos diferentes, de forma que es un conocimiento que podrás aplicar en miles de situaciones. A modo de ejemplo, un botón basta (la primera expresión, pero para búsquedas en Word):

Bueno, espero que os haya resultado interesante el tema de las expresiones regulares. A mí sí que me lo parece y por experiencia sé que te hace destacar entre los demás (incluso SIN SER un superexperto, como en mi caso). En Internet hay miles de sitios donde aprender a redactar regexps, seguro que encontráis alguno que os resulte adecuado para empezar.

Como siempre, en caso de duda, disparad.

Recomendación musical: un grupo que me pasó una compañera, Editors y su tema Bullets.

Actualización de TM con varios archivos en SDL Trados Studio 2009

Saludos a todos:

Desde hace ya bastante tiempo, como parte de mi trabajo tengo que resolver gran cantidad de dudas acerca de SDL Trados Studio 2009, a veces son problemas complicados, pero en otras ocasiones se trata de consultas de fácil resolución, que a menudo los usuarios no sacan adelante por propia desconfianza tanto en ellos mismos como en la propia plataforma.

Una de las dudas recurrentes que me han llegado últimamente consiste en la gestión de las TM en Studio y la preparación de una migración desde aplicaciones como Trados, SDL-X o Wordfast a Studio.

El objetivo de esta entrada del blog os informar un poco sobre la herramienta de gestión de TM de Studio y, para ello, he grabado un tutorial al que podéis acceder más abajo. En este caso en concreto, me interesa comentar que SDL Trados Studio incorpora un módulo exclusivo de gestión de TM, situado en la parte inferior de la barra de navegación izquierda.

Es importante aclarar que este módulo no está diseñado para hacer búsquedas en las TM (aunque también lo permite), sino que sirve para administrarlas. Se trata de un módulo en que se pueden realizar cambios generales, actualizaciones, importaciones, exportaciones, etc.

En este ejemplo, lo que voy a mostrar es cómo podemos usar cuadro de diálogo de importación para importar a nuestra TM de Studio todo el material que queramos de otras herramientas de traducción asistida. Para facilitar esta tarea, como se ve en el tutorial, Studio nos permite importar directamente archivos de los siguientes tipos:

a)      Archivos sdlxliff (nativo de Studio).

b)      Archivos ttx de Trados.

c)      Archivos itd de SDL-X.

d)     Archivos TMX. Esto último permite que con exportar una TM de cualquier herramienta TAO al formato TMX podamos reutilizarla en Studio.

Obviamente, el hecho de poder usar esta función arroja diferentes ventajas: por una parte, si queremos actualizar una TM con varios trabajos hechos diferentes herramientas, podemos hacerlo (usando TMX). Por otra parte, si somos usuarios de la suite 2007 de SDLX y Trados podemos migrar fácilmente a Studio, usando archivos bilingües en lugar de TM para alimentar la TM. Finalmente, al usar un proceso de importación por lotes, podremos importar tantos archivos como sean necesarios al mismo tiempo, sin que haya que abrirlos uno por uno para actualizar una misma TM (sí, hay gente que lo hace así). Además de todo lo anterior, entre las opciones de importación, se nos ofrecen posibilidades como seleccionar estados de confirmación de la traducción o añadir campos a la configuración de la TM durante la importación (por ejemplo, añadir un campo de tipo de texto, nombre de usuario para definir una penalización, etc.).

La verdad es que el módulo de gestión de TM de Studio está bastante bien y hay muchos usuarios que desconocen su uso y lo confunden con una ventana para concordancias o visualización de fuzzies.

Dicho todo esto, corto el rollo y os dejo el enlace al tutorial (clic en la imagen).

Saludos,

Álvaro

Recomendación musical: será por la Navidad, pero, un clásico: Catatonia, Road Rage.