Cambio de rumbo profesional y apertura de Dc. Studio

Hola a todos desde las frías tierras de Zürich:

Ante todo, os ruego me perdonéis por la inactividad reciente, pero es que he estado tremendamente ocupado últimamente. ¿Motivo? Pues un cambio importante en mi vida.

Soporte CLS COMMUNicationDesde hace más o menos un mes sabía que iba a empezar un trabajo nuevo, así que cais no he tenido tiempo para otra cosa que no fuese preparar papeleos, despedidas, formarme, etc. El cambio en cuestión es que desde el pasado lunes 16 de abril formo parte del equipo de IT de la empresa suiza de servicios lingüísticos CLS COMMUNication, en concreto del departamento de Language Technology. A partir de ahora trabajaré en lo que más me gusta: ayudar a traductores y PjM en apuros, dar formación de herramientas y procedimientos de traducción, desarrollar herramientas y aplicaciones para mejorar el negocio, hacer consultoría y asesorar a clientes y managers, etc.

De momento me encuentro en Zürich conociendo a mis compañeros de departamento y la empresa en general, aunque en breve me trasladaré a Londres, donde seré, entre otras cosas, el IT guy de la oficina de CLS en la capital del Reino Unido.

La consecuencia directa, en cuanto al blog se refiere, es que si ya de por sí últimamente mis artículos tendían a tener un carácter técnico, creo que el camino que seguirá el blog será profundizar en todo tipo de entresijos informáticos relacionados con IT en general, programación y sobre todo con las herramientas CAT.

De hecho, para celebrar el nuevo rumbo que toma mi vida profesional, he decidido crear una nueva sección en mi web denominada Doctor Studio. Dado que en los diferentes artículos que he publicado sobre SDL Trados Studio se han generado bastantes preguntas y debates interesantes, me parece que lo mejor es que de ahora en adelante, los lectores que tengan problemas dejen sus comentarios y dudas en una misma sección centralizada, para que pueda consultarse con mayor facilidad.

Bueno, como todavía estoy bastante ocupado entre unas cosas y otras, os dejo y os invito a visitar la web de mi nueva empresa, así como, en el futuro, plantear vuestras dudas al Doctor Studio.

Un saludo desde tierras suizas.

Atentamente,

Álvaro

Recomendación musical: el pequeño de los Gallagher y los suyos (Beady Eye) sacan nuevo trabajo y su nuevo single suena bastante bien, aquí lo tenéis, Flick of a finger.

Petición de ayuda a los lectores para apoyar al Msc Trans de Imperial College

Estimados lectores:

Escribo este post a fin de solicitaros ayuda de forma directa.
Las dificultades económicas generadas por la crisis afectan a todo el mundo y a todas las instituciones. Las universidades y los programas formativos no quedan al margen. Como consecuencia, la Junta directiva de Imperial College London se está planteando la posibilidad de eliminar el departamento de traducción de dicha universidad.

A fin de evitarlo, a través de una iniciativa pública disponible en http://www.change.org/en-GB/petitions/petition-against-the-transferral-or-closure-of-the-translation-studies-unit?utm_source=share_petition&utm_medium=url_share&utm_campaign=url_share_after_sign#share se está tratando de recabar apoyo para evitarlo. El objetivo es poner de relieve que los estudios de traducción continúan siendo necesarios y aún más que estos tengan un carácter científico y riguroso.

Save TSUAunque puede que muchos de vosotros no conozcáis de primera mano el departamento de traducción de Imperial College, me gustaría aclarar que cuenta con docentes de máximo prestigio como Jorge Díaz Cintas o Christophe Declercq. Además, el departamento de traducción de Imperial funciona como unidad dinamizadora de actividades de traducción en Reino Unido y en el viejo continente en general. Por descontado está el hecho que ofrece una formación completa y de calidad que nos ha permitido a muchos no únicamente disfrutar de un periodo formativo sensacional en un entorno inmejorable, sino también mejorar nuestra red de contactos profesionales y académicos.

Por ello y porque estoy convencido de que se trata de un centro neurálgico para los estudios en traducción e interpretación en todo el mundo del que todavía muchos profesionales deben disfrutar, os ruego que apoyéis esta iniciativa (y cuanto antes, mejor).

Gracias por vuestra colaboración. Es sólo cuestión de un minuto, pero juntos podemos dejar muy claro que es importante que se preste a la traducción la importancia que realmente tiene en la actual sociedad globalizada. Un saludo,

Álvaro

 

Expresiones regulares y traducción (parte I)

Hace ya un tiempo escribí un post sobre expresiones regulares y QA. La cuestión es que entre ese artículo, la experiencia del día a día, los comentarios del blog y otras publicaciones me ha parecido oportuno volver a retomar el tema para proporcionar una panorámica más amplia sobre el asunto. Mi intención es ofrecer a los lectores una serie de dos o tres posts en los que poco a poco se aclare el funcionamiento y la utilidad de esta poderosa herramienta de corte informático. Por experiencia, he constatado que en materia de conocimiento y dominio de expresiones regulares, en el mundo de la traducción y la localización se aprecia un salto cualitativo en los profesionales que las aplican en su día a día para agilizar su trabajo así como garantizar una mayor calidad de su trabajo. Este es principalmente el motivo por el que me he decidido a comenzar esta serie de artículos de tono didáctico que inauguro con el presente post.

Hecha la exposición preliminar, en primer lugar es necesario aclarar que las expresiones regulares no son un lenguaje de programación en sí, sino una sintaxis especial que se incorpora (se implementa) en muchas aplicaciones creadas con diferentes lenguajes de programación. Por ejemplo, se implementan en la mayoría de las herramientas CAT. Se trata de una sintaxis enfocada a buscar (y reemplazar) cadenas o patrones de texto. Dada su naturaleza, la clave de las expresiones regulares radica pues en definir muy claramente qué patrón de texto necesitamos encontrar. Reitero la idea: las expresiones regulares por sí mismas (las reglas sintácticas) no son excesivamente complicadas, lo difícil es identificar con precisión el tipo de cadena textual que necesitamos encontrar y qué queremos hacer con ella. En otras palabras, lo complicado es usarlas para que realmente puedan ayudarnos a solucionar problemas concretos ahorrando más tiempo del que exigen para su planteamiento.

Expresiones regulares

A continuación presento una recopilación de los elementos u operadores básicos de la sintaxis de las expresiones regulares a modo de tabla de referencia rápida para el futuro y más abajo comento un ejemplo más detallado para contextualizarlas. En todos los ejemplos, se da por hecho que estamos realizando búsquedas con aplicaciones compatibles con expresiones regulares en las que la opción correspondiente está activada. Por último, hay que indicar a este respecto que estos operadores son los clásicos; puede que en algunos programas las expresiones regulares se hayan implementado variando la grafía de los operadores (por ejemplo, para negar en Word, se usa [!]).

Búsqueda de caracteres alfanuméricos
Caracteres literales: todos los caracteres alfanuméricos pueden usarse en las búsquedas, es decir, se emplean como en las búsquedas habituales. Por ejemplo: al buscar con expresiones la combinación abracad, encontraremos las palabras que contengan estos caracteres literales, como en el caso de la palabra abracadabra.. (el caracter de punto): se busca cualquier caracter, salvo el de nueva línea. Es importante resaltar que al usar el punto (.) sólo se busca un único caracter. Por ejemplo, al buscar por car.a, encontramos tanto carga como carca.

[]: los corchetes se usan para definir grupos de caracteres para la búsqueda (de forma predeterminada, no se distingue entre mayúscula y minúscula). Por ejemplo, con [012345] se encontraría cualquier ocurrencia de 0, 1, 2, 3, 4 o 5 (pero sólo una).

– []: el guión se usa para indicar un intervalo. Existen una serie de intervalos predefinidos:

– [A-Z]: se encuentra cualquier caracter entre la A y la Z en mayúscula.

– [a-z]: se encuentra cualquier caracter entre la a y la z en minúscula.

– [A-z]: se encuentra cualquier caracter ASCII entre la A y la z. Al tratarse de caracteres ASCII, se incluyen también los caracteres [ y ^.

^ (dentro de corchetes): el acento circunflejo sirve para NO encontrar todos los caracteres o grupos de caracteres indicados dentro de los corchetes, es decir, permite excluir caracteres de una búsqueda. Por ejemplo, una regexp con [^abc] no encontrará nunca ni a, ni b ni c.

Explicados los operadores textuales básicos, veamos un pequeño ejemplo práctico que combina varios operadores. Digamos que tenemos el siguiente texto totalmente ficticio:

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut luctus lacus in metus convallis sit amet consectetur leo imperdiet. PORTA01 Suspendisse suscipit hendrerit enim sed interdum. Praesent dui felis, iaculis ullamcorper iaculis eget, vestibulum eget ipsum. Phasellus fringilla rutrum turpis ut lacinia. Ut dapibus enim ut mauris feugiat auctor. In hac habitasse platea dictumst. Mauris gravida eros varius metus tristique condimentum. Sed quis mi nisi. Donec interdum malesuada Porta35 neque non laoreet. Curabitur pulvinar porta est, quis malesuada urna rutrum eget. Curabitur porta tempor sapien, ultrices condimentum tortor rhoncus et. Aliquam sit amet arcu eget leo tincidunt dignissim vitae PoRTa80 sed leo. Integer orci tellus, facilisis eget elementum tristique, ultrices quis magna. Nunc nunc magna, pulvinar tempor fermentum quis, sollicitudin sed ante.

En él se incluyen nombres de producto cuya forma sigue el patrón PORTAXX, donde XX es un número cualquiera. Por la instrucción de nuestro cliente, en el texto meta, PORTA siempre tendrá que ir en mayúscula. Por tanto, lo que nos interesa es localizar sólo los nombres de producto en el texto y comprobarlos. Para ello, en lugar de ir visualmente uno por uno o probando con las diferentes combinaciones de mayúscula y minúscula (como vemos en el texto anterior, resaltado en rojo, hay diversos formatos en el texto de partida para los nombres de producto), lo que hacemos es utilizar los operadores textuales para crear la siguiente expresión: [Pp][Oo][Rr][Tt][Aa][0-9][0-9].

Con esta expresión (que en realidad puede mejorarse, como se verá más adelante) buscamos cada una de las letras de la palabra porta en todas sus combinaciones de mayúscula y minúscula, así como, a continuación, cualquier combinación de dos números entre 0 y 9. Es interesante destacar que, con esta expresión básica, nos ahorramos las dos ocurrencias de porta (no seguidas de número) que aparecen dentro del párrafo del ejemplo.

Ahora viene la pregunta del millón: ¿para qué sirve esto en el mundo de la traducción? Bueno, como ya expliqué en mi post anterior mencionado al principio, las expresiones regulares nos permiten mejorar considerablemente las prestaciones de las funciones de control de calidad de las herramientas CAT. Por ejemplo, pueden utilizarse para, entre otras cosas (ya veremos usos más avanzados en el siguiente post de la serie), hacer búsquedas y reemplazos de terminología (buscando de una vez todas las ocurrencias en mayúscula y minúscula), para buscar patrones de texto prohibidos (por ejemplo, : [A-Z] para evitar la mayúsculas tras los dos puntos en español), para, en herramientas CAT, filtrar por tipos de segmentos que contienen determinados patrones de texto (por ejemplo, mostrar sólo los segmentos que contengan algún número [0-9]), etc.

Como se comentó al inicio, lo más difícil consiste en analizar bien nuestros problemas para, acto seguido, considerar la posibilidad de aplicar las expresiones regulares para solventar el problema.

En este primer post de la serie sobre expresiones regulares se ha tratado el concepto y la introducción a las búsquedas exclusivamente con operadores textuales básicos. En los siguientes artículos se tratará la combinación de los anteriores con otros operadores más avanzados que permiten realizar consultas más complejas. No obstante, este tipo de habilidades requiere un poco de práctica, así que os invito a probar primero con los caracteres textuales para que nadie se quede rezagado de cara al próximo post de la serie sobre expresiones regulares.

Un saludo,

Álvaro

Recomendación musical: Rob Thomas y los suyos (Matchbox Twenty) han sacado nuevo disco tras años de inactividad. Os propongo el primer corte de su nuevo álbum North, titulado Parade.

El viejo TagEditor, insuperable para la creación de definiciones de tipo de archivo

Hola a todos.

Este mes escribo para hablar sobre una de las funciones favoritas de un programa denostado por mucha gente debido a su edad, TagEditor (la última versión salió en 2005, y se actualizó con la última versión de la suite de trabajo de 2007 de SDL International). Bueno, en realidad me dispongo a comentar esta función porque he tenido que recurrir a ella en diversas ocasiones para crear definiciones de tipo de archivo cuando los archivos de trabajo que he recibido no las tenían y se me planteaban multitud de problemas. Me explico con un ejemplo práctico (y real) para poder hacerme entender con más facilidad.

Hace unas semanas recibí de un cliente un lote de archivos que conformaban un sitio web que venían generados a partir de un conocido y popular CMS (Content Management System). En concreto, los archivos que contenían el texto traducible habían sido exportados a formato .html por la empresa de gestión web del cliente, lo que en un principio me pareció comodísimo: ¡qué mejor que un volcado completo para traducirlo! Nada más lejos de la realidad. Me puse a examinar los archivos y comprobé (tras intentar lanzar el sitio web en local) que en realidad los archivos no eran HTML propiamente dicho, sino que eran archivos codificados totalmente como XML, desde la declaración de la primera línea hasta el resto de la estructura conformada por innumerables etiquetas personalizadas (que es, por otra parte, la ventaja de trabajar con XML).

Estructura de XML con extensión .html

Estructura de XML con extensión .html

La cuestión es que cuando fui a preparar mi proyecto de trabajo con mi herramienta CAT, ésta reconoció los archivos como .html, y como texto para traducir en el editor me salían, obviamente, un montón de cosas que no debían ser texto traducible. Esto se debe a que la definición del tipo de archivo de HTML habitual de las herramientas CAT es cerrada, es decir, sólo incluye los elementos y atributos oficiales de HTML. Os pongo una captura de un archivo sencillísimo que había pero que ilustra bien el problema (de 8 segmentos, 5 en realidad no eran traducibles):

Texto traducible sin definición de tipo de archivo personalizada

A fin de remediar el problema hice lo siguiente: en primer lugar, cambié la extensión de todos los archivos de .html a .xml (eran más de 1.000 archivos, así que utilicé un comando de Windows), de manera que la extensión de los archivos coincidiese con su contenido y estructura real, de forma que la herramienta CAT los procesara como XML; en segundo lugar, dado que los archivos .xml exportados del CMS del cliente contenían diversos elementos (mezcla de elementos habituales en HTML y de elementos y atributos XML personalizados) decidí recurrir a TagEditor para crear una definición de tipo de archivo nueva que incluyese todos los elementos y atributos presentes en el sitio web para así poder especificar de qué tipo eran cada uno y si su contenido era traducible (puesto que no había recibido ningún kit de localización preparado con su .ini ni nada por el estilo).

Varias herramientas te permiten crear y personalizar tipos de archivos, pero a mí me gusta personalmente TagEditor por su flexibilidad y porque los archivos para la definición se pueden añadir en lotes gigantes sin que se corte. Para crear una definición de tipo de archivo en TagEditor:

1 – Abrimos TagEditor.

2 – Seguimos la ruta Tools > Tag Settings > New.

3 – En el primer panel del asistente, tras dar un nombre a la definición, seleccionamos (en el caso de XML) New Settings for XML.

4 – En el siguiente paso, el más importante, dado que en mi caso no tenía ni dtd, ni xsd ni ini (por eso tenía que crearla yo), seleccionamos Import y añadimos todos los archivos del proyecto.

5 – Tras confirmar el aspecto de los elementos y atributos, llegamos al paso donde se define cómo se gestiona el contenido de cada etiqueta. Por ejemplo, en mi caso, tras consultar con el cliente se determinó que el contenido de etiquetas XML personalizadas como, entre otras, target, uuid o link no se traducían; por tanto, mi cometido consistió en protegerlas, es decir, establecerlas como no traducibles. Para ello, por ejemplo, seleccioné la etiqueta uuid, pinché en Properties y, dentro del cuadro de diálogo abierto, únicamente tuve que definir el tipo de contenido, tipo de etiqueta y, por último, determinar que el contenido debía ser no traducible [Not translatable (protected content)].

Definición de etiqueta xml uuid

Definición de etiqueta xml uuid

Ya os podéis imaginar el resto del trabajo: analizar todas las etiquetas para identificar las no traducibles, así como definir también los atributos (por ejemplo, dentro del elemento content, el atributo lang debía ser traducible mientras que el atributo name no).

Para finiquitar la tarea de definición de tipo de archivo, en el asistente de TagEditor definimos cómo queremos convertir las entidades XML y añadimos las personalizadas (si las hay) y, en última instancia, guardar nuestra nueva y flamante definición de tipo de archivo (.ini), que usaremos con nuestra herramienta CAT (creamos un nuevo tipo de archivo e importamos este archivo .ini).

Este tipo de tareas de ingeniería de localización puede resultar bastante tedioso y hay que tener mucho cuidado al analizar todos los elementos. No obstante, se obtienen dos ventajas fundamentales:

–         Se evita perder tiempo traduciendo texto que no se debe y que además se incluye incorrectamente en el recuento (con los problemas que ello conlleva).

–         Se delimitan bien posibles problemas futuros. Al identificar qué se traduce y examinar la estructura de los archivos se suelen hallar problemas de falta de internacionalización, etc. Todo ello contribuye a anticipar posibles problemas al procesar los archivos traducidos y solucionarlos de antemano.

En mi caso concreto, además contribuyó a que el cliente fuese consciente de lo complejo que puede resultar algo tan “sencillo” (o eso pensaban ellos) como traducir el texto de un sitio web. Al crear la definición del tipo de archivo puse de relieve mi valor añadido como profesional y, al mismo tiempo, me curé en salud porque, tras utilizar el archivo .ini creado, el texto a traducir resultaba mucho más user friendly. De hecho, retomando el ejemplo de la captura del principio, la cosa quedó así (solamente se mostraban los 3 segmentos realmente traducibles, las referencias y llamadas a otros archivos quedaban excluidas):

Texto traducible con definición de tipo de archivo

Texto traducible con definición de tipo de archivo

El quid de toda esta exposición radica en algo que a título personal me pareció realmente paradójico: para gestionar y preparar una traducción de contenidos creados en los dos últimos años me acabó resultando mucho más práctico usar una herramienta antigua y fiable como TagEditor, que me brindaba más versatilidad que las funciones equivalentes de otras herramientas CAT más modernas… ¡Qué cosas! No sé, quizá sea que como empecé a trabajar con herramientas CAT con TagEditor le guardo un aprecio especial, a modo del primer amor.

Supongo que es posible que el procedimiento de creación de definiciones de tipo de archivo que he descrito (en el ejemplo, para archivos XML) resulte complejo, sin embargo, os animo a hacer pruebas en casa con vuestros propios archivos (empezar por XML es siempre lo más sencillo) porque controlar este tipo de operaciones te da muchísima soltura y seguridad para proyectos y clientes complejos.

Eso es todo. Perdón por la extensión, que se me ha ido la pinza escribiendo. Sólo espero que os sirva a algunos de vosotros para tareas diarias.

Un saludo,

Álvaro

Recomendación musical: unos clásicos como Green Day nos regalan un nuevo tema «Oh, Love» de su nuevo disco titulado Uno, que forma parte de una trilogía.

Cambio de variedad lingüística (locale) y dirección de una TM

Saludos a todos, estimad@s lector@s:

Os cuento. En las últimas semanas he estado ejerciendo como formador y asesor de procesos y herramientas de traducción asistida por ordenador (TAO, o CAT por las siglas en inglés) para una empresa de traducción. Cuando hemos visto la gestión de memorias de traducción (TM por las siglas en inglés), me han planteado dudas sobre cómo cambiar la combinación de idiomas, usar las TM en ambas direcciones, etc.
Esta serie de preguntas enlazan con otras consultas privadas que he recibido a través de este blog-consultorio, en las que se me planteaban problemas similares. Bueno, pues atajemos los dos problemas principales a los que he respondido en esta materia: cómo cambiar la variedad de un idioma (locale o language flavour en el mundillo de la localización [L10N]) y cómo invertir la combinación lingüística de una TM (para pasar, por ejemplo, la combinación inglés-español a español-inglés).

Para mostrar cómo solucionar estas dos cuestiones concretas he grabado un par de vídeos en los que utilizo, por una parte, memorias en formato .tmx (por ser interoperables en varias plataformas) y, por otra, Wordfast Classic (versión 6) como herramienta de trabajo para la inversión lingüística, al tratarse de una herramienta que puede descargarse gratuitamente (además, dos de las personas que me plantearon la duda sobre el cambio de locale trabajaban con Wordfast). No obstante, tras los comentarios recibidos, el uso de Olifant también se presenta como una alternativa muy interesante (esta última frase se ha añadido para mejorar el post con el feedback de los lectores).

Cambio de locales en una TM

En L10N, el concepto de locale tiende (recalco lo de tiende, puesto que en realidad engloba muchas más cosas) a identificarse automáticamente con la variedad específica de un idioma. Por ejemplo, en el caso del inglés, este se divide en diferentes locales específicos identificados con códigos informáticos como ‘en-gb’ para inglés de Reino Unido, ‘en-us’ para inglés de EE. UU., ‘en-au’ para inglés de Australia, etc. La cuestión radica en que en ocasiones y por diferentes motivos se necesita cambiar una TM para que los locales se adapten al de un archivo que hemos recibido para traducir. En el ejemplo que se muestra en el vídeo hay que pasar una memoria en .tmx de inglés de EE. UU. y español de España a inglés de Reino Unido y español de México.
En el mercado hay muchas herramientas de TAO que te permiten elegir el locale concreto al importar desde formatos como .tmx (en este sentido el asistente de TM de Déjà Vu X2 es realmente práctico y el módulo de gestión de TM de SDL Trados Studio ofrece gran flexibilidad al importar memorias en .tmx). No obstante, al hacer los cambios manualmente con un editor de texto plano aprendemos un procedimiento que podemos emplear con independencia de la plataforma que usemos (algo realmente práctico cuando trabajas gestionando proyectos de diversa índole).
Bueno, aquí va el vídeo del tutorial sobre el cambio de locales en una TM en .tmx:

Inversión de los idiomas de una TM

En ocasiones, y especialmente cuando se trabaja, por ejemplo, en una oficina en la que se traduce con una combinación lingüística en ambas direcciones (traducción directa e inversa de inglés y español, por ejemplo) resulta interesante utilizar como referencia una misma TM y adaptar su sentido (directo o inverso) en función de las necesidades. Me ha parecido sorprendente que, tras echar un vistazo a varias plataformas de TAO potentes, no he encontrado nada tan práctico y rápido como la solución que puede ofrecer Wordfast: abres una TM en .tmx, pulsas en un par de botones para invertir el sentido de la combinación lingüística y, a continuación, exportas la nueva TM. Todo en menos de un minuto. En el resto de herramientas habitualmente hay que seleccionar muchos más parámetros, hacer ajustes, etc. Total, que acabas perdiendo bastante tiempo para algo que debería ser cuestión de minutos.
En el ejemplo que se muestra en el vídeo a continuación se utiliza la TM en .tmx con los nuevos locales creada en el apartado anterior para invertir el sentido de inglés de Reino Unido a español de México a español de México a inglés de Reino Unido.
Aquí va el vídeo:

Bueno, espero que os resulten prácticos este par de procedimientos rápidos y gratuitos, sobre todo a aquellos que no sólo traducís y gestionáis sino que además hacéis de ingenieros lingüísticos sobre la marcha.
Un saludo,

Álvaro

Recomendación musical: Kelly Jones de Stereophonics con el padrino del mod Paul Weller y Ronnie Wood de los Rolling Stones que se juntan para homenajear a los Beatles con Don’t let me down.

Silencio, se rueda: introducción básica a la subtitulación

Hace unos días, a través de mi correo electrónico-barra-consultorio (ojo, lo digo sin acritud, es un placer recibir consultas), se pusieron en contacto conmigo un par de personas para preguntarme acerca del subtitulado. Aunque no soy un experto consagrado en la materia, sí es cierto que siempre me ha llamado la atención y me ha gustado. Además, he recibido formación y subtitulado tanto profesionalmente como por puro ocio en mi tiempo libre (ahora con tantas series y cortos sueltos en la Red, de vez en cuando todo el mundo hace sus pruebas).

El asunto es que estas personas pidieron consejo sobre cómo empezar, tanto desde el punto de vista de pautas operativas básicas de subtitulado como en materia de herramientas de software para subtitular. Finalmente, he decidido dar la respuesta en voz alta a través del blog. En esta entrada incluyo también unas notas bibliográficas por si alguien quiere echar un vistazo, aunque algunas de las pautas que apunto las recuerdo de mis primeros encuentros con el subtitulado allá en el año 2003 en Londres.

En cuanto al software, me pareció que como la cuestión era iniciarse, lo mejor era recurrir a un programa gratuito que ofrezca funciones básicas de subtitulado, de ahí que recomiende Subtitle Workshop en lugar de herramientas profesionales como WinCAPS. En Internet existe gran cantidad de documentación sobre Subtitle Workshop (además de la propia ayuda del programa), pero, en pocas palabras, se trata de una aplicación que te permite cargar un vídeo y hacer manualmente el spotting insertando los subtítulos con teclas de método abreviado para, finalmente, introducir el texto en cada subtítulo. De forma predeterminada Subtitle Workshop no ofrece un sistema de comprobación de caracteres por línea ni duración de los subtítulos en pantalla parecido al de los sistemas de pago, pero me parece que para empezar es una herramienta adecuada, porque los procesos principales se asimilan con mucha facilidad. No obstante, como se puede observar en los comentarios de esta entrada, otros profesionales como David Diéguez recomiendan usar otras herramientas como, por ejemplo, VisualSubSync Mod.

Por cuanto respecta a las pautas de subtitulado, como he dicho arriba no soy un erudito en la materia, así que, además de a mi propia experiencia y conocimientos, he recurrido a las referencias disponibles al final para hacer una recopilación de 10 indicaciones o consejos acerca del subtitulado que los principiantes pueden tener en cuenta como punto de partida. Por otra parte, os invito a leer alguna de las miles de obras de referencia disponibles en el mercado. Cualquiera de las publicaciones específicas de Jorge Díaz Cintas al respecto sería una buena opción. Hechas estas aclaraciones, aquí va la respuesta en voz alta a la consulta sobre las pautas básicas de subtitulado:

1 El subtitulador es el encargo de la segmentación (spotting) y la traducción de los subtítulos, que deben reflejar el ritmo de la película. La entrada y salida de subtítulos debe sincronizarse, en medida de lo posible, con la propia voz. No obstante, el subtítulo debe aparecer 0,25 segundos después de escucharse la voz en pantalla. Entre subtítulo y subtítulo, debe haber al menos cuatro fotogramas de separación para que se perciba el cambio. Finalmente, los subtítulos no deben permanecer en pantalla más de 2 segundos tras finalizar la voz.

2 Los subtítulos deben reflejar toda la información escrita en las imágenes (avisos, carteles, etc.) que puedan aportar matices al significado global transmitido por el conjunto de imagen y diálogo. Asimismo, en los propios subtítulos debe tratar de plasmarse la información cultural que resulte relevante para la compresión del mensaje transmitido en el film.

3 Los subtítulos deben coincidir con los cambios de plano o escena, así como los cambios temáticos significativos en pantalla. Las voces en off (personajes que no se ven en pantalla) también se subtitulan y, para diferenciarlas, deben marcarse con el formato de texto en cursiva.

3 Deben utilizarse estructuras sintácticas sencillas, y los subtítulos deben conformar estructuras gramaticales completas. En un subtítulo, no se deben separar las palabras, se debe tratar de separar las líneas del subtítulo coincidiendo con comas y puntos, o bien, por las conjunciones. El final de un subtítulo debe marcarse con punto.

4 Un subtítulo completo de dos líneas con entre 14 y 16 palabras no puede permanecer en pantalla más de 6 segundos. En el caso de los subtítulos completos de una línea con entre 7 y 8 palabras pueden y deben permanecer un máximo de 3,5 segundos. En el caso de los subtítulos de una sola palabra, deben permanecer en pantalla un mínimo de 1,5 segundos.

5 El máximo de líneas por subtítulo es 2. El número de caracteres por línea no debería superar los 35. En cuanto a color y fuente del texto, se recomiendan fuentes Serifs como Arial en un color blanco hueso (que no sea #fff). La alineación del texto será centrada, salvo en los diálogos, en los que el texto (incluido el guión de apertura) se alineará a la izquierda.

6 Es mejor un subtítulo con dos líneas cortas de tamaño proporcional que uno con una línea larga. En caso de usar dos líneas no proporcionales, la superior debe ser más corta que la inferior. Cuando hay un diálogo entre personajes, cada línea corresponde a un personaje y además, éstas comenzarán con un guión y un espacio para marcar el inicio del diálogo.

7 Salvo en circunstancias extraordinarias, el bloque de subtítulos debe colocarse centrado en la parte inferior de la pantalla, con una separación de 1/12 del tamaño total de la pantalla con respecto a la parte inferior

8 Debe evitarse la repetición de nombres y elementos comunes que puedan interpretarse sin que deban ser siempre subtitulados. Cuando sea posible, para ahorrar espacio, deben usar siglas y acrónimos, así que los pronombres siempre que sea posible.

9 En el caso de subtítulos correspondientes a monólogos largos, la continuación del subtítulo se marca con tres puntos suspensivos al final del mismo y tres puntos suspensivos al comienzo del siguiente. En este punto, hay subtituladores que sostienen que la ausencia de punto ya marca que el texto sigue, por lo que no consideran necesario invertir los caracteres en puntos suspensivos.

10 Literalidad en palabras fácilmente reconocibles. En el caso de nombres propios como puntos geográficos o nombres de personas e incluso en el caso de palabras extremadamente similares en la lengua de partida y llegada, se recomienda encarecidamente subtitular de forma literal, puesto que al reconocerse la forma, el espectador espera una determinada traducción que, de no encontrarse, resulta en una sensación de error.

Bueno, como ya he dicho, esta recopilación cubre nociones muy básicas y el subtitulado tiene mucho más intríngulis. La formación, la consulta y la práctica (me temo que en ese orden) hacen al maestro, así que si os animo a todos los que no hayáis hecho nunca subtitulado a probar y, a los que tenéis experiencia, a compartir con el resto todo lo que consideréis imprescindible que se me haya escapado.

Un saludo a todos.

Atentamente,

Álvaro

– Recomendación musical: The Wombats, Moving to New York. De los temas que te animan para arrancar el día.

Referencias bibliográficas

– Díaz Cintas J, Teoría y práctica de la subtitulación: inglés / español, Barcelona, Ariel, 2003.

– Karamitroglou Fotios, A Proposed Set of Subtitling Standards in Europe (1998). Available at: http://translationjournal.net/journal/04stndrd.htm

– CESyA, Buenas Prácticas. Available at: http://www.cesya.es/es/normativa/buenas_practicas
– ESIST European Association for Studies in Screen Translation, Code of Good Subtitling Practice (1998). Available at: http://www.esist.org/ESIST%20Subtitling%20code_files/Code%20of%20Good%20Subtitling%20Practice_en.pdf

La postedición o el enigma del efecto polaco

Algunos negaban su existencia, otros creían que se trataba de una profecía que jamás llegaría a cumplirse. Sin embargo, ya está aquí. La postedición ha llegado a nuestras vidas, y lo ha hecho para quedarse. Dejadme que os explique el motivo por el que me he animado a escribir este post. Tiene su aquel.

Hace unas semanas, como parte de mis tareas, me tocó participar en una traducción-postedición de un cliente que desarrolla aplicaciones de diseño gráfico. Se trata de un cliente grande, cuya terminología, estilo y memorias de traducción están absolutamente contrastados y que desde hace un tiempo ha decidido utilizar el motor de traducción automática de mi empresa (iMT). Para ser sinceros, la verdad es que en general el resultado de la traducción automática era muy bueno, dado que se trataba de una ayuda en línea, con frases sencillas, terminología de un glosario, etc. No obstante, casi al final del texto me encontré con una oración cuya traducción automática decía algo parecido a: “[…] para conseguir un efecto realmente polaco”. La verdad es que no pude contener la risa, porque la frase en inglés terminaba más o menos así: “[…] you will get a very polished effect”. La cuestión es que esta anécdota me resultó especialmente graciosa porque me recordó a mi novia cuando vivíamos en Londres. Ella trabajó durante un tiempo en hostelería y entre todos los compañeros hablaban una especie de Spanglish (algo no tan raro cuando trabajas en un ambiente con muchos hispanoparlantes, por cierto). Al final hasta en casa nos acabamos acostumbrando a escuchar que si había estado polichando, para referirse en realidad a que había estado secando los platos. El quid de la cuestión es que si las propias personas a veces terminamos aceptando como natural las expresiones más inverosímiles (¿pero quién no traga a menudo con las implementaciones?), ¿cómo va a resistirse la traducción automática al enigmático atractivo del “efecto polaco”? 😉

Además de esta anécdota que sobre todo me sacó una buena sonrisa, el otro motivo que me llevó a escribir esta reflexión es que hace no demasiado se puso en contacto conmigo una traductora que tenía muchas dudas acerca de las herramientas CAT. Lleva toda la vida (más de 25 años) traduciendo manualmente de forma artesanal, por así decirlo. La cuestión es que me pareció admirable que ahora tenga interés por progresar y enfrentarse a la nueva realidad. Parte innegable del nuevo escenario profesional de la traducción es la postedición, a la que, desde mi punto de vista, todos debemos acostumbrarnos porque:

a)      Desde la perspectiva de la satisfacción del cliente, hay muchos que por cuestión de relación calidad-coste lo exigen como método y, por tanto, como buen profesional se deben desarrollar las capacidades necesarias para ofrecer el servicio.

b)      En el plano económico, la postedición representa una oportunidad de negocio para los traductores. La tecnología y el perfil profesional evoluciona y es necesario adaptarse. Sorprende que, a pesar de que hay muchísimos buenos traductores, no hay tantos que sepan y quieran hacer postedición. Personalmente, creo que esto es un error, ya que, aunque al principio cuesta desarrollar la técnica (“tragar” con algunas estructuras, etc.), al final compensa porque te brinda más oportunidades de trabajo.

Los profesionales que fueron pioneros en afrontar el reto hace años, gozan ahora de prestigio y ponen de manifiesto su versatilidad. La cuestión es que creo que, ante situaciones en las que inicialmente podemos mostrarnos reticentes, debemos aprender a ver las cosas con perspectiva de futuro. Debemos adaptarnos a las innovaciones y las exigencias profesionales en constante cambio. Al fin y al cabo, si somos capaces de acabar acostumbrándonos a expresiones lingüísticas inverosímiles (que en realidad no son más que una representación de la propia realidad) y terminamos por polichar los platos después de fregarlos, ¿no vamos a ser capaces de resolver el “efecto polaco” que nos plantea la postedición? Por supuesto que sí, sólo se trata de voluntad, como me mostró a mí, y espero que a todos, la traductora de la que he mencionado anteriormente.

Bueno, no me extiendo más.

Un saludo,

Álvaro

Recomendación musical: últimamente estoy escuchando mucho piano. Como propuesta relajante, Yurima, The Sunbeams They Scatter.

Para los que siguen añorando Trados…

Hola a todos:
Bueno, solo una nota rápida. En muchos de los comentarios y correos que la gente me escribe, queda patente que Trados (sí, el clásico Workbench combinado con Word o con TagEditor) sigue siendo muy popular entre una gran cantidad de traductores y localizadores.

Cuando tienes que hacer gestión de proyectos, hay veces que cuesta encontrar un recurso (un traductor o un revisor, vamos) de calidad. Después, hay casos en los que tras encontrar a la persona que necesitas para el trabajo, resulta que no tiene la herramienta que por las circunstancias del trabajo en particular se necesita (a la gente que trabaja como gestor en agencias les sonará esto). Para este tipo de situaciones, que con SDL Trados Studio se dan bastante a menudo (sobre todo con idiomas que se salen del cuarteto FIGS según me han comentado algunos colegas PjM), poder recurrir a Trados como herramienta de trabajo resulta muy útil. Para ello se ha desarrollado SDLXLIFF to Legacy Converter, que transforma los archivos sdlxliff de SDL Trados Studio en archivos ttx de Trados.
Se trata de una magnífica solución para situaciones de emergencia como la descrita anteriormente. Espero que a los que gestionáis os pueda resultar útil para abrir el abanico de posibilidades.
Como he dicho, este post iba a ser cosa rápida.
Nos vemos,

Álvaro

– Recomendación musical: lo que estoy escuchando ahora, Cum on Feel the Noize, una genial cara B de Oasis, con Liam con su mejor voz y Noel con su mítica guitarra con la Union Jack.

A Day In The Life: ¿traductor en plantilla o freelance?

La verdad es que el tema de este post no es precisamente original. No obstante, sí espero que lo sea el planteamiento. Como ya han corrido ríos de tinta en que traductores en plantilla y por cuenta propia alaban las virtudes de su puesto y critican las desventajas de, como muchos lo entienden, el lado opuesto, mi propósito con esta entrada es sencillamente limitarme a mostrar el día a día de unos y otros. Para ello, he contado, por una parte, con la inestimable colaboración de Pablo Muñoz Sánchez de Algo más que traducir, que se ha prestado a abrirnos una pequeña ventana a su realidad habitual y, por otra, con mi propia experiencia. Pablo trabaja por su cuenta, entre otras cosas, como traductor freelance (si quieres saber más, visita su web); yo trabajo como traductor y gestor de proyectos, entre otras labores (si quieres saber más, visita mi web también ;)), en SDL International, en la división que la empresa tiene en Granada.

Este post va dirigido especialmente a esas personas que no tienen muy claro qué se hace como traductor de una empresa de traducción tipo LSP ni tampoco cómo es la vida cuando te lo montas como freelance. No es mi meta (ni el de Pablo, indirectamente) entrar a valorar cuál es mejor ni peor. Esa decisión es tuya al fin y al cabo, estimado lector. La cuestión es sencillamente ofrecerte una visión de la vida de dos traductores que han escogido alternativas diferentes.

Aviso: las horas y detalles no son fijos ni corresponden a un día concreto, los datos facilitados a continuación tienen un carácter recreativo y generalista. Además, la descripciones de nuestros puestos (en plantilla y freelance) son absolutamente personales y probablemente no correspondan a la situación de otros profesionales, en parte que las circunstancias de cada cual son irrepetibles.

Dicho todo esto, espero que os resulte curioso e interesante.

A Day in The Life:
Álvaro

A Day in The Life:
Pablo

7:37. Suena el despertador como cada día. Sí, soy maniático, a las 37, ni a las 35 ni a las 40. Un té con leche rápido, tareas de higiene, me subo a la bicicleta (Granada es una ciudad pequeña) y a las 8:30 estoy en la oficina.

8:45. Suena el despertador del tabletófono (un Samsung Galaxy Note), aunque probablemente mi reloj biológico me haya despertado minutos antes. Soy un poco dormilón como se puede comprobar por la hora… Aprovecho para mirar el correo desde la cama con el tabletófono, contesto si puedo algo que requiere pocas palabras y leo/archivo lo que no necesita más acciones por mi parte. También miro mi Google Reader, Twitter y Facebook y comparto alguna cosa si me parece interesante.

8:30. Probablemente uno de los peores momentos del día, por la incertidumbre. Abres MS Outlook y, mientras se descargan los mensajes del servidor, aprovechas para dar los buenos días a los compañeros. Cuando terminas, a leer todo el correo. Cruzas los dedos para que no te haya llegado un supermarrón que te tenga todo el día ocupado gestionando. Tras la lectura, que suele llevarme más o menos una media hora, llega la hora de la gestión de los trabajos nuevos y los que están en curso (los de mis cuentas de cliente).

9:30-11:15. Arreglado el tema del correo, manos a la obra, es decir, trabajo de producción, ya se trate de traducción, revisión, testing, aprobaciones finales en papel o lo que toque. Todo ello y enlazando una tarea tras otra, con mis cascos y la musiquita de fondo, aunque de vez en cuando haces alguna paradita para hacer una broma o comentar algo (profesional, o no) con los compañeros de trabajo.

9:15. A esta hora procuro ponerme en pie para asearme un poco y desayunar, aunque si he visto que no tenía nada urgente y estoy algo cansado del día anterior, puedo llegar a levantarme hasta a las 9:45. Parecería que desaprovecho el día, pero así al menos cuando me despierto estoy totalmente fresco, lo que me hace más productivo.

11:15-11:30. Momento relax. Desayuno con los compañeros en el bar de abajo. Concretamente, en El Pepe. Una de las mejoras cosas de trabajar en plantilla es que puedes aprovechar estos momentos para comentar el trabajo, discutir otros asuntos y disfrutar de compañía de colegas para olvidarte de todo por un rato y relajarte antes de volver al tajo.

10:00-13:00.Vamos a fijar que, de media, a las 10 ya estoy bien metido en el ajo tras haber contestado correos (o en su defecto haber dormido más). Mis clientes principales viven en Japón, así que mientras duermo, ellos ya me están enviando proyectos. Si hay trabajo, me pongo a tope con la música y estoy dándolo todo hasta eso de las 13:00, que es cuando me afeito, me ducho y me visto (sí, una parte del día traduzco con pijama). Si no hay trabajo (aunque siempre tengo algo que hacer en los últimos meses), aprovecho para hacer todo tipo de cosas pendientes. Es en estas horas cuando escribo en el blog, por cierto: 3 horas bien aprovechadas (que reconozco que no siempre es así) dan para mucho. Dependiendo de si tengo una barbaridad de trabajo o no, dejo el correo abierto todo el rato para contestar cualquier cosa que surja.

11:30-14:00. Grueso del día. En estos momentos, como en el resto de oficinas de mi empresa (SDL, un LSP internacional) ya han terminado su periodo de lectura de correo, etc.; yo, por mi parte, sigo con el trabajo de producción, pero, como es habitual, a lo largo del día continúa el goteo de correo y de minitareas urgentes que te interrumpen las tareas de traducción y revisión grandes. Es normal el tener que parar a gestionar para enviar trabajo a recursos externos, así como sacar un rato para hacer los pedidos de estos trabajos, explicar bien las instrucciones, intentar pasar feedback de trabajos en curso, anteriores, etc.

14:00-15:30. Hora de comer. Como la ciudad es pequeña, yo me permito el lujo de evitar el tupper y disfrutar de una comida en casa con la compañía de mi señora.

13:45-15:00. Entre estas horas salgo de mi casa más fresco todavía gracias a la ducha y voy a las oficinas de un cliente en las que trabajo 4 horas al día. Son tan majos que hasta puedo comer allí gratis y con calidad porque tienen chef, así que socializo un poco antes que nada y me alimento bien (no puede faltar la Coca Cola, se me hace raro comer con agua). Ah, casi siempre voy andando, tardo unos 25 minutos, así que entre ida y vuelta ando como 1 hora todos los días.

15:30-17:30. Tras el parón para comer, la verdad es que lo que haces es como «reiniciar» el día. Tienes que volver a ponerte al día con el correo y gestionar lo que te ha llegado nuevo (si es que ha llegado algo nuevo, claro), solucionar dudas, etc. Cuando termino de este tipo de cosas, puedo reanudar el trabajo de producción. La verdad es que cuando se acerca la hora de salida oficial (que serían las 17:30) te das cuenta de lo difícil que a veces es cumplir con los volúmenes de producción esperados (en palabras/hora), porque no has podido dedicarte en cuerpo y alma a traducir, revisar o la tarea que te haya tocado.

15:00-19:00. En este trabajo mi tarea principal es revisar traducciones y a veces testear las interfaces traducidas de algunos productos. Lo primero que hago es procesar todo el correo (de nuevo, correo cuya tarea ya he terminado o que no hace falta contestar, correo que archivo para que no esté a la vista en mi bandeja de entrada). Una vez hecho eso, veo los proyectos que me ha asignado mi jefa y comento con ella cualquier problema que vea en la asignación o alguno de los correos que nos hayan enviado. Después, todo es revisar a tope, siempre con el correo abierto porque en esta empresa se espera que contestes rápido (no me distrae mucho aunque pueda parecer lo contrario, ya que los proyectos no suelen ser muy grandes y aprovecho para contestar entre proyecto y proyecto).

Sobre las 17:00 aprovecho para levantarme un poco y coger algo de la nevera. Gracias al tabletófono, también miro de vez en cuando mi correo personal para ver si tengo que contestar algo urgentemente o saber si más tarde tengo que hacer algo (evidentemente, no voy a dedicar mucho tiempo a mi otro trabajo estando en las oficinas de un cliente)

≈ 17:30. Habitualmente, no tengo que hacer jornadas de mucho más de 8 horas. No obstante, suelo aprovechar la última parte del día para preparar el día siguiente (comprobar que no he olvidado nada, ordenar el correo electrónico, consultar mi lista de tareas, etc.) así como para actualizar recursos para las herramientas CAT (actualizar TM y bases de datos terminológicas, crear expresiones regulares). Una vez he terminado estas cositas, cierro mi equipo, haces un par de bromas con los colegas (si no se han ido antes que tú) y para casa. Mañana será otro día (laboral), probablemente parecido al que acaba de terminar.

≈ 18:30. A esta hora más o menos comienzo mi vida “más personal”, por así decirlo. Como creo en aquello de Mens sana in corpore sano, por la tarde me gusta hacer deporte dos o tres veces por semana, aunque este es también el tramo del día que dedico a leer, estudiar cosas, disfrutar de la compañía de mi señora, navegar por la Red y, como en el caso de Pablo, contestar correos de, entre otras personas, algunas que piden consejo o tienen dudas acerca de esta profesión y de herramientas CAT (por cierto, me encanta responder a este tipo de correos, así que, que no paren!).

19:00-19:30. Sobre las 19:00 salgo de la oficina de mi cliente (aunque muchas veces salgo algo más tarde en función de a la hora a la que haya empezado a trabajar, ya que a veces la sobremesa se hace algo larga). Durante el trayecto, voy mirando Google Reader, Twitter y Facebook con el tabletófono, todo ello andando. Todo el trayecto es recto literalmente, así que no tiene muchos riesgos una vez conoces el camino y los cruces.

19:30-21:00. Ya en casa, me relajo hablando con mis compañeros de piso y miro Facebook y Twitter aparte de algunas otras cosillas por Internet. Probablemente me haya llegado algo de trabajo o correos de gente pidiéndome consejo (me escribe mucha gente a través del blog), así que aprovecho para traducir un poco si hay algo pendiente o bien responder correos.

Puede dar la sensación de que estoy siempre trabajando, pero hay que tener en cuenta que me levanto bastante tarde (me acuesto sobre la 1 de la mañana más o menos, a veces hasta las 2), que hago pausas y que ando como 1 hora al día. Además, al ser autónomo, todo este horario es muy flexible.

Recomendación  musical: por el título del post, era inevitable… A Day In the Life, de The Beatles.

Traducciones con restricción de caracteres II: porcentaje de ampliación

Hola a todos:
Como no tengo mucho tiempo para ponerme a escribir últimamente, os dejo aquí una actualización de un recurso sobre el que ya hablé hace unos meses. En concreto, en marzo publiqué una entrada en el blog acerca de la traducción con restricción de caracteres y di un Excel.
Hace unos días, estaba hablando con un PM sobre un proyecto de traducción de unas cadenas de firmware. La cuestión es que decía que el cliente no quería usar las herramientas de traducción habituales (hubo que usar un entorno de traducción propio del cliente que habían desarrollado), que el tiempo de trabajo era exiguo y que había que traducir y hacer un QA con restricción de caracteres, pero no sobre un límite fijado de caracteres (cosa que me extrañó, si una pantallita tiene 150 caracteres, los tiene siempre), sino con una restricción del 20% sobre el texto de partida (eso no es tan raro en SW, pero sí en FW).

Obviamente, la herramienta de trabajo era deficiente, así que como eran bastantes cadenas para hacer los cálculos a mano, se me ocurrió retomar la hoja de Excel que propuse en la entrada mencionada al principio y adaptarla. ¿Cómo? Muy sencillo añadí dos columnas: una, llamada Additional % allowed, en la que se especifica el porcentaje que la cadena puede superar la longitud del original en formato decimal (20% = 0,2), y la otra, Additional Characters allowed, es el resultado (redondeado hacia arriba) en caracteres que podemos usar de más en nuestra traducción. Finalmente, modifiqué la fórmula del resultado (String Status) para que tenga en cuenta el 20% adicional del que disponía.

He pensado que a los que trabajéis con desarrolladores directamente y os encontréis con situaciones como la que he descrito anteriormente, os puede resultar útil como complemento a la hoja de Excel original. Por supuesto, seguro que podréis mejorarla y adaptarla a vuestras necesidades para sacarle mayor partido. Os dejo pues la nueva hoja AQUÍ.

Bueno, eso es todo. Un saludo a todos y perdón por mi inconstancia como blogero.
Saludos,

Álvaro

Recomendación musical: no podía ser de otra forma… Noel Gallager, Dream On