Cambio de rumbo profesional y apertura de Dc. Studio

Hola a todos desde las frías tierras de Zürich:

Ante todo, os ruego me perdonéis por la inactividad reciente, pero es que he estado tremendamente ocupado últimamente. ¿Motivo? Pues un cambio importante en mi vida.

Soporte CLS COMMUNicationDesde hace más o menos un mes sabía que iba a empezar un trabajo nuevo, así que cais no he tenido tiempo para otra cosa que no fuese preparar papeleos, despedidas, formarme, etc. El cambio en cuestión es que desde el pasado lunes 16 de abril formo parte del equipo de IT de la empresa suiza de servicios lingüísticos CLS COMMUNication, en concreto del departamento de Language Technology. A partir de ahora trabajaré en lo que más me gusta: ayudar a traductores y PjM en apuros, dar formación de herramientas y procedimientos de traducción, desarrollar herramientas y aplicaciones para mejorar el negocio, hacer consultoría y asesorar a clientes y managers, etc.

De momento me encuentro en Zürich conociendo a mis compañeros de departamento y la empresa en general, aunque en breve me trasladaré a Londres, donde seré, entre otras cosas, el IT guy de la oficina de CLS en la capital del Reino Unido.

La consecuencia directa, en cuanto al blog se refiere, es que si ya de por sí últimamente mis artículos tendían a tener un carácter técnico, creo que el camino que seguirá el blog será profundizar en todo tipo de entresijos informáticos relacionados con IT en general, programación y sobre todo con las herramientas CAT.

De hecho, para celebrar el nuevo rumbo que toma mi vida profesional, he decidido crear una nueva sección en mi web denominada Doctor Studio. Dado que en los diferentes artículos que he publicado sobre SDL Trados Studio se han generado bastantes preguntas y debates interesantes, me parece que lo mejor es que de ahora en adelante, los lectores que tengan problemas dejen sus comentarios y dudas en una misma sección centralizada, para que pueda consultarse con mayor facilidad.

Bueno, como todavía estoy bastante ocupado entre unas cosas y otras, os dejo y os invito a visitar la web de mi nueva empresa, así como, en el futuro, plantear vuestras dudas al Doctor Studio.

Un saludo desde tierras suizas.

Atentamente,

Álvaro

Recomendación musical: el pequeño de los Gallagher y los suyos (Beady Eye) sacan nuevo trabajo y su nuevo single suena bastante bien, aquí lo tenéis, Flick of a finger.

Anuncios

Petición de ayuda a los lectores para apoyar al Msc Trans de Imperial College

Estimados lectores:

Escribo este post a fin de solicitaros ayuda de forma directa.
Las dificultades económicas generadas por la crisis afectan a todo el mundo y a todas las instituciones. Las universidades y los programas formativos no quedan al margen. Como consecuencia, la Junta directiva de Imperial College London se está planteando la posibilidad de eliminar el departamento de traducción de dicha universidad.

A fin de evitarlo, a través de una iniciativa pública disponible en http://www.change.org/en-GB/petitions/petition-against-the-transferral-or-closure-of-the-translation-studies-unit?utm_source=share_petition&utm_medium=url_share&utm_campaign=url_share_after_sign#share se está tratando de recabar apoyo para evitarlo. El objetivo es poner de relieve que los estudios de traducción continúan siendo necesarios y aún más que estos tengan un carácter científico y riguroso.

Save TSUAunque puede que muchos de vosotros no conozcáis de primera mano el departamento de traducción de Imperial College, me gustaría aclarar que cuenta con docentes de máximo prestigio como Jorge Díaz Cintas o Christophe Declercq. Además, el departamento de traducción de Imperial funciona como unidad dinamizadora de actividades de traducción en Reino Unido y en el viejo continente en general. Por descontado está el hecho que ofrece una formación completa y de calidad que nos ha permitido a muchos no únicamente disfrutar de un periodo formativo sensacional en un entorno inmejorable, sino también mejorar nuestra red de contactos profesionales y académicos.

Por ello y porque estoy convencido de que se trata de un centro neurálgico para los estudios en traducción e interpretación en todo el mundo del que todavía muchos profesionales deben disfrutar, os ruego que apoyéis esta iniciativa (y cuanto antes, mejor).

Gracias por vuestra colaboración. Es sólo cuestión de un minuto, pero juntos podemos dejar muy claro que es importante que se preste a la traducción la importancia que realmente tiene en la actual sociedad globalizada. Un saludo,

Álvaro

 

Expresiones regulares y traducción (parte I)

Hace ya un tiempo escribí un post sobre expresiones regulares y QA. La cuestión es que entre ese artículo, la experiencia del día a día, los comentarios del blog y otras publicaciones me ha parecido oportuno volver a retomar el tema para proporcionar una panorámica más amplia sobre el asunto. Mi intención es ofrecer a los lectores una serie de dos o tres posts en los que poco a poco se aclare el funcionamiento y la utilidad de esta poderosa herramienta de corte informático. Por experiencia, he constatado que en materia de conocimiento y dominio de expresiones regulares, en el mundo de la traducción y la localización se aprecia un salto cualitativo en los profesionales que las aplican en su día a día para agilizar su trabajo así como garantizar una mayor calidad de su trabajo. Este es principalmente el motivo por el que me he decidido a comenzar esta serie de artículos de tono didáctico que inauguro con el presente post.

Hecha la exposición preliminar, en primer lugar es necesario aclarar que las expresiones regulares no son un lenguaje de programación en sí, sino una sintaxis especial que se incorpora (se implementa) en muchas aplicaciones creadas con diferentes lenguajes de programación. Por ejemplo, se implementan en la mayoría de las herramientas CAT. Se trata de una sintaxis enfocada a buscar (y reemplazar) cadenas o patrones de texto. Dada su naturaleza, la clave de las expresiones regulares radica pues en definir muy claramente qué patrón de texto necesitamos encontrar. Reitero la idea: las expresiones regulares por sí mismas (las reglas sintácticas) no son excesivamente complicadas, lo difícil es identificar con precisión el tipo de cadena textual que necesitamos encontrar y qué queremos hacer con ella. En otras palabras, lo complicado es usarlas para que realmente puedan ayudarnos a solucionar problemas concretos ahorrando más tiempo del que exigen para su planteamiento.

Expresiones regulares

A continuación presento una recopilación de los elementos u operadores básicos de la sintaxis de las expresiones regulares a modo de tabla de referencia rápida para el futuro y más abajo comento un ejemplo más detallado para contextualizarlas. En todos los ejemplos, se da por hecho que estamos realizando búsquedas con aplicaciones compatibles con expresiones regulares en las que la opción correspondiente está activada. Por último, hay que indicar a este respecto que estos operadores son los clásicos; puede que en algunos programas las expresiones regulares se hayan implementado variando la grafía de los operadores (por ejemplo, para negar en Word, se usa [!]).

Búsqueda de caracteres alfanuméricos
Caracteres literales: todos los caracteres alfanuméricos pueden usarse en las búsquedas, es decir, se emplean como en las búsquedas habituales. Por ejemplo: al buscar con expresiones la combinación abracad, encontraremos las palabras que contengan estos caracteres literales, como en el caso de la palabra abracadabra.. (el caracter de punto): se busca cualquier caracter, salvo el de nueva línea. Es importante resaltar que al usar el punto (.) sólo se busca un único caracter. Por ejemplo, al buscar por car.a, encontramos tanto carga como carca.

[]: los corchetes se usan para definir grupos de caracteres para la búsqueda (de forma predeterminada, no se distingue entre mayúscula y minúscula). Por ejemplo, con [012345] se encontraría cualquier ocurrencia de 0, 1, 2, 3, 4 o 5 (pero sólo una).

– []: el guión se usa para indicar un intervalo. Existen una serie de intervalos predefinidos:

– [A-Z]: se encuentra cualquier caracter entre la A y la Z en mayúscula.

– [a-z]: se encuentra cualquier caracter entre la a y la z en minúscula.

– [A-z]: se encuentra cualquier caracter ASCII entre la A y la z. Al tratarse de caracteres ASCII, se incluyen también los caracteres [ y ^.

^ (dentro de corchetes): el acento circunflejo sirve para NO encontrar todos los caracteres o grupos de caracteres indicados dentro de los corchetes, es decir, permite excluir caracteres de una búsqueda. Por ejemplo, una regexp con [^abc] no encontrará nunca ni a, ni b ni c.

Explicados los operadores textuales básicos, veamos un pequeño ejemplo práctico que combina varios operadores. Digamos que tenemos el siguiente texto totalmente ficticio:

Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut luctus lacus in metus convallis sit amet consectetur leo imperdiet. PORTA01 Suspendisse suscipit hendrerit enim sed interdum. Praesent dui felis, iaculis ullamcorper iaculis eget, vestibulum eget ipsum. Phasellus fringilla rutrum turpis ut lacinia. Ut dapibus enim ut mauris feugiat auctor. In hac habitasse platea dictumst. Mauris gravida eros varius metus tristique condimentum. Sed quis mi nisi. Donec interdum malesuada Porta35 neque non laoreet. Curabitur pulvinar porta est, quis malesuada urna rutrum eget. Curabitur porta tempor sapien, ultrices condimentum tortor rhoncus et. Aliquam sit amet arcu eget leo tincidunt dignissim vitae PoRTa80 sed leo. Integer orci tellus, facilisis eget elementum tristique, ultrices quis magna. Nunc nunc magna, pulvinar tempor fermentum quis, sollicitudin sed ante.

En él se incluyen nombres de producto cuya forma sigue el patrón PORTAXX, donde XX es un número cualquiera. Por la instrucción de nuestro cliente, en el texto meta, PORTA siempre tendrá que ir en mayúscula. Por tanto, lo que nos interesa es localizar sólo los nombres de producto en el texto y comprobarlos. Para ello, en lugar de ir visualmente uno por uno o probando con las diferentes combinaciones de mayúscula y minúscula (como vemos en el texto anterior, resaltado en rojo, hay diversos formatos en el texto de partida para los nombres de producto), lo que hacemos es utilizar los operadores textuales para crear la siguiente expresión: [Pp][Oo][Rr][Tt][Aa][0-9][0-9].

Con esta expresión (que en realidad puede mejorarse, como se verá más adelante) buscamos cada una de las letras de la palabra porta en todas sus combinaciones de mayúscula y minúscula, así como, a continuación, cualquier combinación de dos números entre 0 y 9. Es interesante destacar que, con esta expresión básica, nos ahorramos las dos ocurrencias de porta (no seguidas de número) que aparecen dentro del párrafo del ejemplo.

Ahora viene la pregunta del millón: ¿para qué sirve esto en el mundo de la traducción? Bueno, como ya expliqué en mi post anterior mencionado al principio, las expresiones regulares nos permiten mejorar considerablemente las prestaciones de las funciones de control de calidad de las herramientas CAT. Por ejemplo, pueden utilizarse para, entre otras cosas (ya veremos usos más avanzados en el siguiente post de la serie), hacer búsquedas y reemplazos de terminología (buscando de una vez todas las ocurrencias en mayúscula y minúscula), para buscar patrones de texto prohibidos (por ejemplo, : [A-Z] para evitar la mayúsculas tras los dos puntos en español), para, en herramientas CAT, filtrar por tipos de segmentos que contienen determinados patrones de texto (por ejemplo, mostrar sólo los segmentos que contengan algún número [0-9]), etc.

Como se comentó al inicio, lo más difícil consiste en analizar bien nuestros problemas para, acto seguido, considerar la posibilidad de aplicar las expresiones regulares para solventar el problema.

En este primer post de la serie sobre expresiones regulares se ha tratado el concepto y la introducción a las búsquedas exclusivamente con operadores textuales básicos. En los siguientes artículos se tratará la combinación de los anteriores con otros operadores más avanzados que permiten realizar consultas más complejas. No obstante, este tipo de habilidades requiere un poco de práctica, así que os invito a probar primero con los caracteres textuales para que nadie se quede rezagado de cara al próximo post de la serie sobre expresiones regulares.

Un saludo,

Álvaro

Recomendación musical: Rob Thomas y los suyos (Matchbox Twenty) han sacado nuevo disco tras años de inactividad. Os propongo el primer corte de su nuevo álbum North, titulado Parade.

El viejo TagEditor, insuperable para la creación de definiciones de tipo de archivo

Hola a todos.

Este mes escribo para hablar sobre una de las funciones favoritas de un programa denostado por mucha gente debido a su edad, TagEditor (la última versión salió en 2005, y se actualizó con la última versión de la suite de trabajo de 2007 de SDL International). Bueno, en realidad me dispongo a comentar esta función porque he tenido que recurrir a ella en diversas ocasiones para crear definiciones de tipo de archivo cuando los archivos de trabajo que he recibido no las tenían y se me planteaban multitud de problemas. Me explico con un ejemplo práctico (y real) para poder hacerme entender con más facilidad.

Hace unas semanas recibí de un cliente un lote de archivos que conformaban un sitio web que venían generados a partir de un conocido y popular CMS (Content Management System). En concreto, los archivos que contenían el texto traducible habían sido exportados a formato .html por la empresa de gestión web del cliente, lo que en un principio me pareció comodísimo: ¡qué mejor que un volcado completo para traducirlo! Nada más lejos de la realidad. Me puse a examinar los archivos y comprobé (tras intentar lanzar el sitio web en local) que en realidad los archivos no eran HTML propiamente dicho, sino que eran archivos codificados totalmente como XML, desde la declaración de la primera línea hasta el resto de la estructura conformada por innumerables etiquetas personalizadas (que es, por otra parte, la ventaja de trabajar con XML).

Estructura de XML con extensión .html

Estructura de XML con extensión .html

La cuestión es que cuando fui a preparar mi proyecto de trabajo con mi herramienta CAT, ésta reconoció los archivos como .html, y como texto para traducir en el editor me salían, obviamente, un montón de cosas que no debían ser texto traducible. Esto se debe a que la definición del tipo de archivo de HTML habitual de las herramientas CAT es cerrada, es decir, sólo incluye los elementos y atributos oficiales de HTML. Os pongo una captura de un archivo sencillísimo que había pero que ilustra bien el problema (de 8 segmentos, 5 en realidad no eran traducibles):

Texto traducible sin definición de tipo de archivo personalizada

A fin de remediar el problema hice lo siguiente: en primer lugar, cambié la extensión de todos los archivos de .html a .xml (eran más de 1.000 archivos, así que utilicé un comando de Windows), de manera que la extensión de los archivos coincidiese con su contenido y estructura real, de forma que la herramienta CAT los procesara como XML; en segundo lugar, dado que los archivos .xml exportados del CMS del cliente contenían diversos elementos (mezcla de elementos habituales en HTML y de elementos y atributos XML personalizados) decidí recurrir a TagEditor para crear una definición de tipo de archivo nueva que incluyese todos los elementos y atributos presentes en el sitio web para así poder especificar de qué tipo eran cada uno y si su contenido era traducible (puesto que no había recibido ningún kit de localización preparado con su .ini ni nada por el estilo).

Varias herramientas te permiten crear y personalizar tipos de archivos, pero a mí me gusta personalmente TagEditor por su flexibilidad y porque los archivos para la definición se pueden añadir en lotes gigantes sin que se corte. Para crear una definición de tipo de archivo en TagEditor:

1 – Abrimos TagEditor.

2 – Seguimos la ruta Tools > Tag Settings > New.

3 – En el primer panel del asistente, tras dar un nombre a la definición, seleccionamos (en el caso de XML) New Settings for XML.

4 – En el siguiente paso, el más importante, dado que en mi caso no tenía ni dtd, ni xsd ni ini (por eso tenía que crearla yo), seleccionamos Import y añadimos todos los archivos del proyecto.

5 – Tras confirmar el aspecto de los elementos y atributos, llegamos al paso donde se define cómo se gestiona el contenido de cada etiqueta. Por ejemplo, en mi caso, tras consultar con el cliente se determinó que el contenido de etiquetas XML personalizadas como, entre otras, target, uuid o link no se traducían; por tanto, mi cometido consistió en protegerlas, es decir, establecerlas como no traducibles. Para ello, por ejemplo, seleccioné la etiqueta uuid, pinché en Properties y, dentro del cuadro de diálogo abierto, únicamente tuve que definir el tipo de contenido, tipo de etiqueta y, por último, determinar que el contenido debía ser no traducible [Not translatable (protected content)].

Definición de etiqueta xml uuid

Definición de etiqueta xml uuid

Ya os podéis imaginar el resto del trabajo: analizar todas las etiquetas para identificar las no traducibles, así como definir también los atributos (por ejemplo, dentro del elemento content, el atributo lang debía ser traducible mientras que el atributo name no).

Para finiquitar la tarea de definición de tipo de archivo, en el asistente de TagEditor definimos cómo queremos convertir las entidades XML y añadimos las personalizadas (si las hay) y, en última instancia, guardar nuestra nueva y flamante definición de tipo de archivo (.ini), que usaremos con nuestra herramienta CAT (creamos un nuevo tipo de archivo e importamos este archivo .ini).

Este tipo de tareas de ingeniería de localización puede resultar bastante tedioso y hay que tener mucho cuidado al analizar todos los elementos. No obstante, se obtienen dos ventajas fundamentales:

–         Se evita perder tiempo traduciendo texto que no se debe y que además se incluye incorrectamente en el recuento (con los problemas que ello conlleva).

–         Se delimitan bien posibles problemas futuros. Al identificar qué se traduce y examinar la estructura de los archivos se suelen hallar problemas de falta de internacionalización, etc. Todo ello contribuye a anticipar posibles problemas al procesar los archivos traducidos y solucionarlos de antemano.

En mi caso concreto, además contribuyó a que el cliente fuese consciente de lo complejo que puede resultar algo tan “sencillo” (o eso pensaban ellos) como traducir el texto de un sitio web. Al crear la definición del tipo de archivo puse de relieve mi valor añadido como profesional y, al mismo tiempo, me curé en salud porque, tras utilizar el archivo .ini creado, el texto a traducir resultaba mucho más user friendly. De hecho, retomando el ejemplo de la captura del principio, la cosa quedó así (solamente se mostraban los 3 segmentos realmente traducibles, las referencias y llamadas a otros archivos quedaban excluidas):

Texto traducible con definición de tipo de archivo

Texto traducible con definición de tipo de archivo

El quid de toda esta exposición radica en algo que a título personal me pareció realmente paradójico: para gestionar y preparar una traducción de contenidos creados en los dos últimos años me acabó resultando mucho más práctico usar una herramienta antigua y fiable como TagEditor, que me brindaba más versatilidad que las funciones equivalentes de otras herramientas CAT más modernas… ¡Qué cosas! No sé, quizá sea que como empecé a trabajar con herramientas CAT con TagEditor le guardo un aprecio especial, a modo del primer amor.

Supongo que es posible que el procedimiento de creación de definiciones de tipo de archivo que he descrito (en el ejemplo, para archivos XML) resulte complejo, sin embargo, os animo a hacer pruebas en casa con vuestros propios archivos (empezar por XML es siempre lo más sencillo) porque controlar este tipo de operaciones te da muchísima soltura y seguridad para proyectos y clientes complejos.

Eso es todo. Perdón por la extensión, que se me ha ido la pinza escribiendo. Sólo espero que os sirva a algunos de vosotros para tareas diarias.

Un saludo,

Álvaro

Recomendación musical: unos clásicos como Green Day nos regalan un nuevo tema “Oh, Love” de su nuevo disco titulado Uno, que forma parte de una trilogía.

Cambio de variedad lingüística (locale) y dirección de una TM

Saludos a todos, estimad@s lector@s:

Os cuento. En las últimas semanas he estado ejerciendo como formador y asesor de procesos y herramientas de traducción asistida por ordenador (TAO, o CAT por las siglas en inglés) para una empresa de traducción. Cuando hemos visto la gestión de memorias de traducción (TM por las siglas en inglés), me han planteado dudas sobre cómo cambiar la combinación de idiomas, usar las TM en ambas direcciones, etc.
Esta serie de preguntas enlazan con otras consultas privadas que he recibido a través de este blog-consultorio, en las que se me planteaban problemas similares. Bueno, pues atajemos los dos problemas principales a los que he respondido en esta materia: cómo cambiar la variedad de un idioma (locale o language flavour en el mundillo de la localización [L10N]) y cómo invertir la combinación lingüística de una TM (para pasar, por ejemplo, la combinación inglés-español a español-inglés).

Para mostrar cómo solucionar estas dos cuestiones concretas he grabado un par de vídeos en los que utilizo, por una parte, memorias en formato .tmx (por ser interoperables en varias plataformas) y, por otra, Wordfast Classic (versión 6) como herramienta de trabajo para la inversión lingüística, al tratarse de una herramienta que puede descargarse gratuitamente (además, dos de las personas que me plantearon la duda sobre el cambio de locale trabajaban con Wordfast). No obstante, tras los comentarios recibidos, el uso de Olifant también se presenta como una alternativa muy interesante (esta última frase se ha añadido para mejorar el post con el feedback de los lectores).

Cambio de locales en una TM

En L10N, el concepto de locale tiende (recalco lo de tiende, puesto que en realidad engloba muchas más cosas) a identificarse automáticamente con la variedad específica de un idioma. Por ejemplo, en el caso del inglés, este se divide en diferentes locales específicos identificados con códigos informáticos como ‘en-gb’ para inglés de Reino Unido, ‘en-us’ para inglés de EE. UU., ‘en-au’ para inglés de Australia, etc. La cuestión radica en que en ocasiones y por diferentes motivos se necesita cambiar una TM para que los locales se adapten al de un archivo que hemos recibido para traducir. En el ejemplo que se muestra en el vídeo hay que pasar una memoria en .tmx de inglés de EE. UU. y español de España a inglés de Reino Unido y español de México.
En el mercado hay muchas herramientas de TAO que te permiten elegir el locale concreto al importar desde formatos como .tmx (en este sentido el asistente de TM de Déjà Vu X2 es realmente práctico y el módulo de gestión de TM de SDL Trados Studio ofrece gran flexibilidad al importar memorias en .tmx). No obstante, al hacer los cambios manualmente con un editor de texto plano aprendemos un procedimiento que podemos emplear con independencia de la plataforma que usemos (algo realmente práctico cuando trabajas gestionando proyectos de diversa índole).
Bueno, aquí va el vídeo del tutorial sobre el cambio de locales en una TM en .tmx:

Inversión de los idiomas de una TM

En ocasiones, y especialmente cuando se trabaja, por ejemplo, en una oficina en la que se traduce con una combinación lingüística en ambas direcciones (traducción directa e inversa de inglés y español, por ejemplo) resulta interesante utilizar como referencia una misma TM y adaptar su sentido (directo o inverso) en función de las necesidades. Me ha parecido sorprendente que, tras echar un vistazo a varias plataformas de TAO potentes, no he encontrado nada tan práctico y rápido como la solución que puede ofrecer Wordfast: abres una TM en .tmx, pulsas en un par de botones para invertir el sentido de la combinación lingüística y, a continuación, exportas la nueva TM. Todo en menos de un minuto. En el resto de herramientas habitualmente hay que seleccionar muchos más parámetros, hacer ajustes, etc. Total, que acabas perdiendo bastante tiempo para algo que debería ser cuestión de minutos.
En el ejemplo que se muestra en el vídeo a continuación se utiliza la TM en .tmx con los nuevos locales creada en el apartado anterior para invertir el sentido de inglés de Reino Unido a español de México a español de México a inglés de Reino Unido.
Aquí va el vídeo:

Bueno, espero que os resulten prácticos este par de procedimientos rápidos y gratuitos, sobre todo a aquellos que no sólo traducís y gestionáis sino que además hacéis de ingenieros lingüísticos sobre la marcha.
Un saludo,

Álvaro

Recomendación musical: Kelly Jones de Stereophonics con el padrino del mod Paul Weller y Ronnie Wood de los Rolling Stones que se juntan para homenajear a los Beatles con Don’t let me down.

Silencio, se rueda: introducción básica a la subtitulación

Hace unos días, a través de mi correo electrónico-barra-consultorio (ojo, lo digo sin acritud, es un placer recibir consultas), se pusieron en contacto conmigo un par de personas para preguntarme acerca del subtitulado. Aunque no soy un experto consagrado en la materia, sí es cierto que siempre me ha llamado la atención y me ha gustado. Además, he recibido formación y subtitulado tanto profesionalmente como por puro ocio en mi tiempo libre (ahora con tantas series y cortos sueltos en la Red, de vez en cuando todo el mundo hace sus pruebas).

El asunto es que estas personas pidieron consejo sobre cómo empezar, tanto desde el punto de vista de pautas operativas básicas de subtitulado como en materia de herramientas de software para subtitular. Finalmente, he decidido dar la respuesta en voz alta a través del blog. En esta entrada incluyo también unas notas bibliográficas por si alguien quiere echar un vistazo, aunque algunas de las pautas que apunto las recuerdo de mis primeros encuentros con el subtitulado allá en el año 2003 en Londres.

En cuanto al software, me pareció que como la cuestión era iniciarse, lo mejor era recurrir a un programa gratuito que ofrezca funciones básicas de subtitulado, de ahí que recomiende Subtitle Workshop en lugar de herramientas profesionales como WinCAPS. En Internet existe gran cantidad de documentación sobre Subtitle Workshop (además de la propia ayuda del programa), pero, en pocas palabras, se trata de una aplicación que te permite cargar un vídeo y hacer manualmente el spotting insertando los subtítulos con teclas de método abreviado para, finalmente, introducir el texto en cada subtítulo. De forma predeterminada Subtitle Workshop no ofrece un sistema de comprobación de caracteres por línea ni duración de los subtítulos en pantalla parecido al de los sistemas de pago, pero me parece que para empezar es una herramienta adecuada, porque los procesos principales se asimilan con mucha facilidad. No obstante, como se puede observar en los comentarios de esta entrada, otros profesionales como David Diéguez recomiendan usar otras herramientas como, por ejemplo, VisualSubSync Mod.

Por cuanto respecta a las pautas de subtitulado, como he dicho arriba no soy un erudito en la materia, así que, además de a mi propia experiencia y conocimientos, he recurrido a las referencias disponibles al final para hacer una recopilación de 10 indicaciones o consejos acerca del subtitulado que los principiantes pueden tener en cuenta como punto de partida. Por otra parte, os invito a leer alguna de las miles de obras de referencia disponibles en el mercado. Cualquiera de las publicaciones específicas de Jorge Díaz Cintas al respecto sería una buena opción. Hechas estas aclaraciones, aquí va la respuesta en voz alta a la consulta sobre las pautas básicas de subtitulado:

1 El subtitulador es el encargo de la segmentación (spotting) y la traducción de los subtítulos, que deben reflejar el ritmo de la película. La entrada y salida de subtítulos debe sincronizarse, en medida de lo posible, con la propia voz. No obstante, el subtítulo debe aparecer 0,25 segundos después de escucharse la voz en pantalla. Entre subtítulo y subtítulo, debe haber al menos cuatro fotogramas de separación para que se perciba el cambio. Finalmente, los subtítulos no deben permanecer en pantalla más de 2 segundos tras finalizar la voz.

2 Los subtítulos deben reflejar toda la información escrita en las imágenes (avisos, carteles, etc.) que puedan aportar matices al significado global transmitido por el conjunto de imagen y diálogo. Asimismo, en los propios subtítulos debe tratar de plasmarse la información cultural que resulte relevante para la compresión del mensaje transmitido en el film.

3 Los subtítulos deben coincidir con los cambios de plano o escena, así como los cambios temáticos significativos en pantalla. Las voces en off (personajes que no se ven en pantalla) también se subtitulan y, para diferenciarlas, deben marcarse con el formato de texto en cursiva.

3 Deben utilizarse estructuras sintácticas sencillas, y los subtítulos deben conformar estructuras gramaticales completas. En un subtítulo, no se deben separar las palabras, se debe tratar de separar las líneas del subtítulo coincidiendo con comas y puntos, o bien, por las conjunciones. El final de un subtítulo debe marcarse con punto.

4 Un subtítulo completo de dos líneas con entre 14 y 16 palabras no puede permanecer en pantalla más de 6 segundos. En el caso de los subtítulos completos de una línea con entre 7 y 8 palabras pueden y deben permanecer un máximo de 3,5 segundos. En el caso de los subtítulos de una sola palabra, deben permanecer en pantalla un mínimo de 1,5 segundos.

5 El máximo de líneas por subtítulo es 2. El número de caracteres por línea no debería superar los 35. En cuanto a color y fuente del texto, se recomiendan fuentes Serifs como Arial en un color blanco hueso (que no sea #fff). La alineación del texto será centrada, salvo en los diálogos, en los que el texto (incluido el guión de apertura) se alineará a la izquierda.

6 Es mejor un subtítulo con dos líneas cortas de tamaño proporcional que uno con una línea larga. En caso de usar dos líneas no proporcionales, la superior debe ser más corta que la inferior. Cuando hay un diálogo entre personajes, cada línea corresponde a un personaje y además, éstas comenzarán con un guión y un espacio para marcar el inicio del diálogo.

7 Salvo en circunstancias extraordinarias, el bloque de subtítulos debe colocarse centrado en la parte inferior de la pantalla, con una separación de 1/12 del tamaño total de la pantalla con respecto a la parte inferior

8 Debe evitarse la repetición de nombres y elementos comunes que puedan interpretarse sin que deban ser siempre subtitulados. Cuando sea posible, para ahorrar espacio, deben usar siglas y acrónimos, así que los pronombres siempre que sea posible.

9 En el caso de subtítulos correspondientes a monólogos largos, la continuación del subtítulo se marca con tres puntos suspensivos al final del mismo y tres puntos suspensivos al comienzo del siguiente. En este punto, hay subtituladores que sostienen que la ausencia de punto ya marca que el texto sigue, por lo que no consideran necesario invertir los caracteres en puntos suspensivos.

10 Literalidad en palabras fácilmente reconocibles. En el caso de nombres propios como puntos geográficos o nombres de personas e incluso en el caso de palabras extremadamente similares en la lengua de partida y llegada, se recomienda encarecidamente subtitular de forma literal, puesto que al reconocerse la forma, el espectador espera una determinada traducción que, de no encontrarse, resulta en una sensación de error.

Bueno, como ya he dicho, esta recopilación cubre nociones muy básicas y el subtitulado tiene mucho más intríngulis. La formación, la consulta y la práctica (me temo que en ese orden) hacen al maestro, así que si os animo a todos los que no hayáis hecho nunca subtitulado a probar y, a los que tenéis experiencia, a compartir con el resto todo lo que consideréis imprescindible que se me haya escapado.

Un saludo a todos.

Atentamente,

Álvaro

– Recomendación musical: The Wombats, Moving to New York. De los temas que te animan para arrancar el día.

Referencias bibliográficas

– Díaz Cintas J, Teoría y práctica de la subtitulación: inglés / español, Barcelona, Ariel, 2003.

– Karamitroglou Fotios, A Proposed Set of Subtitling Standards in Europe (1998). Available at: http://translationjournal.net/journal/04stndrd.htm

– CESyA, Buenas Prácticas. Available at: http://www.cesya.es/es/normativa/buenas_practicas
– ESIST European Association for Studies in Screen Translation, Code of Good Subtitling Practice (1998). Available at: http://www.esist.org/ESIST%20Subtitling%20code_files/Code%20of%20Good%20Subtitling%20Practice_en.pdf

La postedición o el enigma del efecto polaco

Algunos negaban su existencia, otros creían que se trataba de una profecía que jamás llegaría a cumplirse. Sin embargo, ya está aquí. La postedición ha llegado a nuestras vidas, y lo ha hecho para quedarse. Dejadme que os explique el motivo por el que me he animado a escribir este post. Tiene su aquel.

Hace unas semanas, como parte de mis tareas, me tocó participar en una traducción-postedición de un cliente que desarrolla aplicaciones de diseño gráfico. Se trata de un cliente grande, cuya terminología, estilo y memorias de traducción están absolutamente contrastados y que desde hace un tiempo ha decidido utilizar el motor de traducción automática de mi empresa (iMT). Para ser sinceros, la verdad es que en general el resultado de la traducción automática era muy bueno, dado que se trataba de una ayuda en línea, con frases sencillas, terminología de un glosario, etc. No obstante, casi al final del texto me encontré con una oración cuya traducción automática decía algo parecido a: “[…] para conseguir un efecto realmente polaco”. La verdad es que no pude contener la risa, porque la frase en inglés terminaba más o menos así: “[…] you will get a very polished effect”. La cuestión es que esta anécdota me resultó especialmente graciosa porque me recordó a mi novia cuando vivíamos en Londres. Ella trabajó durante un tiempo en hostelería y entre todos los compañeros hablaban una especie de Spanglish (algo no tan raro cuando trabajas en un ambiente con muchos hispanoparlantes, por cierto). Al final hasta en casa nos acabamos acostumbrando a escuchar que si había estado polichando, para referirse en realidad a que había estado secando los platos. El quid de la cuestión es que si las propias personas a veces terminamos aceptando como natural las expresiones más inverosímiles (¿pero quién no traga a menudo con las implementaciones?), ¿cómo va a resistirse la traducción automática al enigmático atractivo del “efecto polaco”? 😉

Además de esta anécdota que sobre todo me sacó una buena sonrisa, el otro motivo que me llevó a escribir esta reflexión es que hace no demasiado se puso en contacto conmigo una traductora que tenía muchas dudas acerca de las herramientas CAT. Lleva toda la vida (más de 25 años) traduciendo manualmente de forma artesanal, por así decirlo. La cuestión es que me pareció admirable que ahora tenga interés por progresar y enfrentarse a la nueva realidad. Parte innegable del nuevo escenario profesional de la traducción es la postedición, a la que, desde mi punto de vista, todos debemos acostumbrarnos porque:

a)      Desde la perspectiva de la satisfacción del cliente, hay muchos que por cuestión de relación calidad-coste lo exigen como método y, por tanto, como buen profesional se deben desarrollar las capacidades necesarias para ofrecer el servicio.

b)      En el plano económico, la postedición representa una oportunidad de negocio para los traductores. La tecnología y el perfil profesional evoluciona y es necesario adaptarse. Sorprende que, a pesar de que hay muchísimos buenos traductores, no hay tantos que sepan y quieran hacer postedición. Personalmente, creo que esto es un error, ya que, aunque al principio cuesta desarrollar la técnica (“tragar” con algunas estructuras, etc.), al final compensa porque te brinda más oportunidades de trabajo.

Los profesionales que fueron pioneros en afrontar el reto hace años, gozan ahora de prestigio y ponen de manifiesto su versatilidad. La cuestión es que creo que, ante situaciones en las que inicialmente podemos mostrarnos reticentes, debemos aprender a ver las cosas con perspectiva de futuro. Debemos adaptarnos a las innovaciones y las exigencias profesionales en constante cambio. Al fin y al cabo, si somos capaces de acabar acostumbrándonos a expresiones lingüísticas inverosímiles (que en realidad no son más que una representación de la propia realidad) y terminamos por polichar los platos después de fregarlos, ¿no vamos a ser capaces de resolver el “efecto polaco” que nos plantea la postedición? Por supuesto que sí, sólo se trata de voluntad, como me mostró a mí, y espero que a todos, la traductora de la que he mencionado anteriormente.

Bueno, no me extiendo más.

Un saludo,

Álvaro

Recomendación musical: últimamente estoy escuchando mucho piano. Como propuesta relajante, Yurima, The Sunbeams They Scatter.