Windows Powershell para reemplazos de nombres de archivos

Estimados lectores:

Hola a todos y perdón por el retraso al escribir. Entre el cambio de trabajo, el cambio de países (dos veces en un mes) y las consecuentes mudanzas, los cursos, las enormes distancias en Londres, etc., llevo unos meses que no tengo tiempo prácticamente ni para mirar el correo electrónico.

No obstante, creo que ya ha llegado la hora de publicar algo en el blog, aunque sea un artículo muy cortito. Espero que os resulte práctico.

El tema de hoy trata sobre la gestión de archivos y los cambios de nombres. Como la gran mayoría de vosotros sabéis (tanto si sois PMs como si trabajáis de traductores/revisores como de gestores de cuentas), en la industria de la traducción es costumbre indicar el nombre de los archivos con el código lingüístico al final del mismo, antes de la extensión de archivo. Hay clientes que prefieren el código con dos letras (por ejemplo, EN para inglés, ES para español, etc.), mientras que otros proveedores o empresas se decantan por el código completo de cuatro letras (por ejemplo, EN-GB para inglés de Reino Unido, ES-ES para español de España, etc.). Estoy seguro que ya sabéis a lo que me refiero. Además, no es tan raro encontrar empresas que además del código lingüístico también añaden otros sufijos tipo TRA o QA para marcar las versiones de traducción y revisión respectivamente.

La cuestión es que es muy habitual que las personas que gestionan las traducciones tengan la labor de, una vez los archivos se han traducido con herramientas CAT, cambiar los códigos lingüísticos a la lengua de destino. Muchos de vosotros pensaréis, ¡pero qué tontería! ¡Si mi herramienta CAT te añade automáticamente el código lingüístico! Eso es cierto, pero no significa que todo el mundo quiera usar el código lingüístico que añade tu herramienta CAT, en caso de que lo añada. Por poner un ejemplo, imaginemos que tenemos la siguiente situación.

Un cliente nos encarga una traducción de 10 archivos a 5 idiomas. Los archivos tienen el siguiente formato, CodidoDeProyecto_ID_de_idioma.ExtensiónDeArchivo, por ejemplo, 24870_EN.xlsx o 558741_DE.xml.

Archivos antes

La instrucción que nos da el cliente es que necesita los archivos con los mismos nombres, pero con los ID de idioma correspondientes en formato largo. Si tuviésemos que cambiar cada uno de los 50 archivos a mano, con una media de 15 segundos por archivo (hacer clic con el botón derecho, seleccionar cambio de nombre, borrar la extensión, poner la correcta y guardar el cambio), tendríamos que invertir 12 minutos y 30 segundos. ¡Y únicamente con 50 archivos!

Esta tarea se puede automatizar fácilmente. En el mercado hay algunas herramientas gratuitas que lo hacen, pero en algunos casos en muchas empresas (y también entre traductores autónomos) existe reticencia (o directamente está prohibido) a instalar software que no está aprobado o para el que no se tiene servicio de asistencia técnica en caso de problemas. Si esta es tu situación, te propongo usar Windows Powershell, que está disponible en la mayoría de las versiones de SO Windows. Para arrancarlo, hay que hacer Inicio > Ejecutar y escribimos Powershell.

Se nos abrirá una colorida consola de comandos.

–          Lo primero que debemos hacer es ir hasta la carpeta donde están los archivos que queremos modificar. Para ellos escribimos cd “C:\Users\Alvaro\Documents\Blog”, y entre las comillas ponemos la ruta que deseamos. Pulsamos Intro.

PowerShell

–          A continuación escribimos Dir | Rename-Item –NewName { $_.name –replace “_EN”,”_ES-ES” }, donde “_EN”,”_ES-ES” son la parte que queremos reemplazar y el nuevo sufijo respectivamente. Es importante tener en cuenta que Powershell hace los reemplazos de forma literal, por lo que hay que ser cuidadoso con lo que ponemos. En el ejemplo, he decidido incluir hasta el guión bajo, para asegurarme que solo se cambia el sufijo lingüístico. Podría haber incluido, por ejemplo, también la extensión de archivo y habría quedado así “EN.xml”,”ES-ES.xml”. Para gustos los colores, ¿no? (dicho esto me gustaría añadir que también podríamos con este método cambiar extensiones de archivo por lotes). Cuando terminemos de escribir este comando, pulsamos Intro.

–          Comprobamos nuestra carpeta y listo, el cambio de los archivos de EN a ES_ES está completado en mucho menos tiempo. Para 10 archivos, en lugar de 2,5 minutos, hemos invertido un solo minuto. Si hacemos las cuentas para el resto de archivos, vamos a ahorrar bastante tiempo.

Archivos Después

Esta operación es un ejemplo de como muchas veces automatizando tareas repetitivas pero sencillas podemos ahorrar tiempo y, además, evitarnos momentos tediosos durante el día a día. Además, también pone de manifiesto que a veces en nuestros PC tenemos muchísimas herramientas que infrautilizamos.

Eso es todo, espero que os resulte útil.

Un saludo,

Álvaro

Recomendación musical: Do I wanna know?, el single del que será el nuevo disco de los Artic Monkeys en septiembre. Temazo.

Anuncio publicitario

Petición de ayuda a los lectores para apoyar al Msc Trans de Imperial College

Estimados lectores:

Escribo este post a fin de solicitaros ayuda de forma directa.
Las dificultades económicas generadas por la crisis afectan a todo el mundo y a todas las instituciones. Las universidades y los programas formativos no quedan al margen. Como consecuencia, la Junta directiva de Imperial College London se está planteando la posibilidad de eliminar el departamento de traducción de dicha universidad.

A fin de evitarlo, a través de una iniciativa pública disponible en http://www.change.org/en-GB/petitions/petition-against-the-transferral-or-closure-of-the-translation-studies-unit?utm_source=share_petition&utm_medium=url_share&utm_campaign=url_share_after_sign#share se está tratando de recabar apoyo para evitarlo. El objetivo es poner de relieve que los estudios de traducción continúan siendo necesarios y aún más que estos tengan un carácter científico y riguroso.

Save TSUAunque puede que muchos de vosotros no conozcáis de primera mano el departamento de traducción de Imperial College, me gustaría aclarar que cuenta con docentes de máximo prestigio como Jorge Díaz Cintas o Christophe Declercq. Además, el departamento de traducción de Imperial funciona como unidad dinamizadora de actividades de traducción en Reino Unido y en el viejo continente en general. Por descontado está el hecho que ofrece una formación completa y de calidad que nos ha permitido a muchos no únicamente disfrutar de un periodo formativo sensacional en un entorno inmejorable, sino también mejorar nuestra red de contactos profesionales y académicos.

Por ello y porque estoy convencido de que se trata de un centro neurálgico para los estudios en traducción e interpretación en todo el mundo del que todavía muchos profesionales deben disfrutar, os ruego que apoyéis esta iniciativa (y cuanto antes, mejor).

Gracias por vuestra colaboración. Es sólo cuestión de un minuto, pero juntos podemos dejar muy claro que es importante que se preste a la traducción la importancia que realmente tiene en la actual sociedad globalizada. Un saludo,

Álvaro

 

Expresiones regulares y traducción (parte II)

Hola y saludos otoñales (casi invernales) a todos (los del hemisferio norte, en el sur, al revés):

En el anterior post de esta serie sobre expresiones regulares vimos la introducción general y el uso de los operadores básicos (caracteres literales, punto, corchetes, guión y acento circunflejo).

En esta segunda parte de la serie vamos a centrarnos en los caracteres con un significado especial más allá del propio literal: los metacaracateres. Los metacaracteres sirven para identificar o encontrar patrones de texto o formato que, de otra manera, resultaría bien imposible, bien muy complejo. En una implementación general de la sintaxis de las expresiones regulares nos encontramos con la siguiente selección de metacaracteres habituales, que presento en un cuadro para que pueda usarse como referencia rápida.

Metacaracteres de búsqueda

\ (barra invertida): la barra invertida sirve para anular (o “escapar” en términos informáticos) un metacaracter de forma que se utilice como un carácter literal. Por ejemplo, si hacemos una búsqueda por \\n (como veremos a continuación, \n es un metacaracter para un salto de línea manual) estaremos indicando que en lugar de buscar un salto de línea se busque el carácter de barra invertida seguido del carácter n (práctica habitual en programación para suprimir, por ejemplo, los saltos de línea y cambiarlos a otra cosa).

\f (barra invertida y f): sirve para identificar o buscar los caracteres de salto de página en formato electrónico (se trata de un carácter que manda la instrucción a la impresora).

\n (barra invertida y n): sirve para encontrar un carácter de salto de línea en un documento (de hecho, \n es la forma de insertar una línea nueva en muchos lenguajes de programación como C o C++).

\r (barra invertida y r): sirve para encontrar un carácter de retorno de carro (cuando se pulsa la tecla Intro para pasar la siguiente línea, como cuando se empujaba la palanca de cambio de línea en una máquina de escribir antigua).

\t (barra invertida y t): sirve para encontrar un carácter de tabulación horizontal (el que se inserta al pulsar la tecla Tab del teclado).

\v (barra invertida y v): sirve para encontrar un carácter de tabulación vertical (en ASCII tiene asignado el 11).

[\b] (corchete apertura, barra invertida, b y corchete de cierre): permite identificar un carácter de retroceso en un texto.

\d (barra invertida y d): se trata de uno de los metacaracteres más útiles y usados. Permite buscar cualquier dígito, es decir, es lo mismo que escribir [0-9] para usar un intervalo, tal y como vimos en el post anterior. Por ejemplo, al buscar \d euros en un editor compatible con regexp clásicas (por ejemplo, EditPad Lite), encontraríamos en un texto tanto 5 euros como 7 euros.

\D (barra invertida y D mayúscula): sirve para justamente lo contrario a lo anterior, es decir, para buscar todo lo que no sean dígitos. Se trata por tanto, del equivalente a [^0-9].

\w (barra invertida y w): otro de los metacaracteres más utilizados ya que permite localizar cualquier carácter alfanumérico (en mayúscula o minúscula) y el guión bajo. Por tanto, es igual al patrón [a-zA-Z0-9_]. Por ejemplo, con la búsqueda [Cc][Rr]\w encontraríamos tanto CR7 como crocs.

\W (barra invertida y W mayúscula): sirve para lo contrario a lo anterior, es decir, encontrar un carácter no alfanumérico ni un guión bajo; sería el equivalente a [^a-zA-Z0-9_]. Se puede utilizar para buscar caracteres de formato (párrafo, saltos, etc.) u otros como #.

\s (barra invertida y s): sirve para encontrar cualquier tipo de carácter de espacio en blanco. Es por tanto equivalente a [\f\n\r\t\v]. Por ejemplo, al buscar por \s en el texto Uno y dos, el texto que se identificaría serían los espacios en blanco (Unoydos).

\S (barra invertida y S mayúscula) lo contrario a lo anterior, es decir, lo mismo que [^\f\n\r\t\v]. Nos permite encontrar un carácter del tipo de todo lo que es «visible» al ojo humano en un texto.

\b (barra invertida y b): este metacaracter es muy útil porque sirve para marcar una posición de un carácter dentro de una palabra. Habitualmente se usa para buscar caracteres al principio. Por ejemplo: al buscar por \barm se encontrarían las palabras armadura y arma, pero no harmónica puesto que el patrón de búsqueda arm no está al principio de palabra en el último caso. Aunque se usa especialmente para marcar el inicio de una palabra, \b también sirve para marcar el final; por ejemplo, la búsqueda ato\b serviría para encontrar pazguato, pero no atornillar. Por último, si se combina el uso para inicio y final de palabra, lo que obtenemos es el equivalente a la búsqueda de palabra completa; por ejemplo, \bagua\b encontrará agua pero no aguantar. Por su uso, este es un metacaracter marcador de posición dentro de una palabra.

\B (barra invertida y B mayúscula): sirve para no encontrar un carácter en los límites de una palabra. Se usa, por ejemplo, para localizar guiones de separación en palabras en inglés (no hay espacios a los lados) con regexp como \B-\B, con las que se obtendrían resultados como taskrelated.

^ (acento circunflejo): fuera de un corchete, el acento circunflejo sirve para marcar el inicio de una cadena completa. Ojo, hemos dicho cadena, no palabra. En términos habituales, esto significaría comienzo de una frase en una nueva línea. Por ejemplo, ^\w nos serviría para localizar el primer carácter alfanumérico de una frase o cadena. En algunas implementaciones se suele ver \A en lugar de ^.

$ (símbolo del dólar): sirve para lo mismo que el metacaracter anterior, solo que en este caso se encuentra el final de una cadena. Por ejemplo, :$  nos permitiría encontrar todas las cadenas que terminen en dos puntos. En algunas implementaciones se suele ver \Z en lugar de $.

Como podemos intuir, la combinación de estos metacaracteres con los patrones de búsquedas tratados en el primer artículo de esta serie sobre expresiones regulares multiplica las prestaciones de las que disponemos. A modo de ejemplo práctico en el mundo de la traducción, podemos ver la combinación de caracteres literales y comodines (metacaracteres) en la creación de reglas de control de calidad o QA en la mayoría de las herramientas CAT del mercado. Habitualmente, las funciones de QA operan de la siguiente manera:

1) Se busca la aparición (o ausencia) de un patrón determinado en el texto de origen y

2) Se compara el resultado del primer paso para verificar la existencia (o no existencia) de dicho patrón en el texto de destino.

En concreto y para verlo con más claridad, vamos a definir una regla que busque los números con punto como separador de decimales en el texto de origen y que en el texto de origen NO tengan como separador de decimales una coma.

a) Expresión regular para el texto de origen: \d\.\d.

– Explicación: expresión formada por cualquier número (\d), punto (como punto es un metacaracter por sí mismo, lo escapamos con la barra invertida) y de nuevo cualquier número.

– Resultado: se encontraría, por ejemplo, 10.1, 512,684.58, 4.6.

b) Expresión regular para el texto de destino: [^\d,\d].

– Explicación: expresión formada por cualquier número (\d), coma y de nuevo cualquier número.

– Resultado: se encontraría, por ejemplo, 10,1, 512.684,58, 4,6.

Como se observa, en realidad lo que se hace es decirle al programa mediante una expresión regular lo siguiente “si en un segmento de origen encuentras un número, un punto y otro número y en el segmento de destino correspondiente hay un número separado de otro por algo que no sea una coma, genera un error de QA para que lo compruebe». En concreto, en este caso vemos como en el número 512.684,58 se habría producido un falso positivo (¡el tema de los falsos positivos daría para otro post!), puesto que aquí el punto separa las unidades de millar, no los decimales. En el resto de casos, no habría habido ningún problema.

QA reg exp en SDLX

Expresión regular para función de QA en SDLX

Esta última explicación y ejemplo es uno de los casos más habituales de uso de las expresiones regulares. No obstante, existen muchos más escenarios como, entre otros, el filtrado de cadenas en el editor de traducción, la extracción de cadenas en la ingeniería de traducción con patrones complejos, etc. La verdad es que una vez se dominan bien todos los operadores básicos, cada cual es capaz de idear aplicaciones de lo más variopintas en su trabajo y su día a día.

En este segundo artículo de la serie sobre regexp hemos tratado los metacaracteres como complementos indispensables para los operadores de regexp básicos a fin de buscar y encontrar patrones textuales más sofisticados. Pero, ¿no sirven todos estos metacaracteres vistos para localizar caracteres individuales? En el ejemplo [^\d,\d], ¿no se resaltaban con la búsqueda únicamente el número anterior (\d) y posterior al separador de decimales (,\d)? ¿Qué pasa si queremos buscar más números o caracteres y combinar en una búsqueda patrones más grandes en que se repitan caracteres, espacios en blanco, etc.?

Obviamente, todo eso se pensó al diseñar las expresiones regulares, así que nosotros lo veremos en el siguiente post de esta serie, donde trataremos la búsqueda y creación de repeticiones de caracteres y búsquedas, los cuantificadores, las subexpresiones y muchas más cosas con las que podremos aprovechar toda la potencia que nos brindan las regexp.

Mientras tanto, como en el caso anterior, a practicar con lo ya aprendido, ¿de acuerdo?

Nos leemos en más o menos un mes. Ah, y como siempre, perdonad que me enrolle tanto y termine por escribir post larguísimos. Un saludo a todos,

Álvaro

Recomendación musical: tras casi dos años de espera si no me equivoco, mis apreciados Stereophonics vuelven a la carga con nuevo material y sello discográfico propio. Aquí va el single titulado In A Moment.

Verano, el mejor momento para descansar…y para aprender

Hola a todos. Espero que el verano esté transcurriendo bien para todos los lectores de (Nunca) Sobran las palabras.

VeranitoHabitualmente, para muchísima gente el período estival equivale a descanso absoluto. En el caso del mundo de la traducción, a pesar de que muchos profesionales optan por dedicar unos días a relajarse y olvidarse de todo por un rato, es cierto que también se da una situación diferente: por una parte, muchos traductores que tienen menor volumen de trabajo aprovechan las vacaciones del resto para aumentar su cartera de encargos (algo muy recomendable para los profesionales con menos experiencia, por cierto) y, por otra, otros ven la ralentización de julio y agosto como una oportunidad para dedicar más tiempo a otros menesteres, entre ellos, la formación y el reciclaje profesional.

Yo, por mi parte, me siento más identificado con este segundo grupo. Por ello, redacto estas líneas para informaros de un curso gratuito que he completado hace poco, por si os interesa. Dado que mi campo de especialización favorito es la localización, puesto que me permite combinar los conocimientos de programación y web con la traducción, me decanté hace un mes más o menos por actualizarme un poco en el asunto de la nueva programación web con el desarrollo de HTML 5. Tras leer diversos foros y páginas informativas, acabé por completar el curso gratuito de MDSN de Microsoft España sobre HTML 5. Se trata de una buena alternativa para refrescar conocimientos básicos sobre la Web y, al mismo tiempo, familiarizarse con la nueva familia de estándares de diseño de webs para navegadores, dispositivos móviles, tablets, etc.

Recomiendo este curso por diferentes motivos: el nivel avanza bastante bien desde las dos primeras lecciones introductorias hasta conceptos algo más complejos en las siguientes, la estructura de las lecciones está bastante clara y resulta sencilla de asimilar con los ejercicios, cuenta con el respaldo de Microsoft y, además, es gratuito.

Personalmente creo que, en el ámbito de la localización (e incluso de los videojuegos web), el conocimiento de HTML 5 se presenta como un activo imprescindible en el futuro cercano, sobre todo porque diversos elementos (entre ellos, el canvas) apuntan al declive final de flash como tecnología multimedia visual para la interactividad web. Por tanto, dominar y conocer los diversos aspectos que garantizan una perfecta adaptación y localización de los productos web desde su lenguaje de programación es, sin duda alguna, un valor añadido que cualquier profesional de la localización que se precie no debe dejar de lado. En mi caso, estoy aprovechando el verano para ponerme al día, puesto que entre unas cosas y otras, en los últimos meses había estado dando largas a la formación continua, algo indispensable para cualquier trabajador.

En resumen, el verano es tiempo de descanso y de formación. Dicho esto y expuesta mi recomendación para un estío basado en HTML 5, os dejo que dediquéis los próximos minutos al necesario descanso (o a lo que más os plazca).

Un saludo,

Álvaro

Recomendación musical: Polock – Fireworks. ¡Ojo!, que la clave está en la subida y en el final de la canción, no en la forma en que empieza.

Interesante evento gratuito sobre subtitulado en Londres

Hola a todos:

Por si no os ha llegado por otros canales, os paso la información sobre un evento gratuito sobre subtitulado que se celebrará en Londres el viernes 26 de octubre de 2012. Está organizado por mi antigua universidad, Imperial College. Es una oportunidad estupenda para los que residen en Reino Unido, así como para cualquier que quiera pegarse una escapada de fin de semana a una de las mejores ciudades del mundo.

Bueno, aquí va la información:

Título del evento: An introduction to subtitling: bridging the language and culture divide.
Lugar y fecha: Friday, 26 October 2012. Europe House, 32 Smith Square, London SW1P 3EU
Resumen: The European Commission Representation in the UK, the Translation Group at Imperial College London and the VSI Group are holding a full-day seminar on subtitling aimed at students of modern languages and translation. This event is free. More details in the attached Subtitling flyer.

Espero que alguno tengáis la oportunidad de asistir. Yo voy a ver si puedo apañármelas y nos vemos allí.

Un saludo,

Álvaro

Silencio, se rueda: introducción básica a la subtitulación

Hace unos días, a través de mi correo electrónico-barra-consultorio (ojo, lo digo sin acritud, es un placer recibir consultas), se pusieron en contacto conmigo un par de personas para preguntarme acerca del subtitulado. Aunque no soy un experto consagrado en la materia, sí es cierto que siempre me ha llamado la atención y me ha gustado. Además, he recibido formación y subtitulado tanto profesionalmente como por puro ocio en mi tiempo libre (ahora con tantas series y cortos sueltos en la Red, de vez en cuando todo el mundo hace sus pruebas).

El asunto es que estas personas pidieron consejo sobre cómo empezar, tanto desde el punto de vista de pautas operativas básicas de subtitulado como en materia de herramientas de software para subtitular. Finalmente, he decidido dar la respuesta en voz alta a través del blog. En esta entrada incluyo también unas notas bibliográficas por si alguien quiere echar un vistazo, aunque algunas de las pautas que apunto las recuerdo de mis primeros encuentros con el subtitulado allá en el año 2003 en Londres.

En cuanto al software, me pareció que como la cuestión era iniciarse, lo mejor era recurrir a un programa gratuito que ofrezca funciones básicas de subtitulado, de ahí que recomiende Subtitle Workshop en lugar de herramientas profesionales como WinCAPS. En Internet existe gran cantidad de documentación sobre Subtitle Workshop (además de la propia ayuda del programa), pero, en pocas palabras, se trata de una aplicación que te permite cargar un vídeo y hacer manualmente el spotting insertando los subtítulos con teclas de método abreviado para, finalmente, introducir el texto en cada subtítulo. De forma predeterminada Subtitle Workshop no ofrece un sistema de comprobación de caracteres por línea ni duración de los subtítulos en pantalla parecido al de los sistemas de pago, pero me parece que para empezar es una herramienta adecuada, porque los procesos principales se asimilan con mucha facilidad. No obstante, como se puede observar en los comentarios de esta entrada, otros profesionales como David Diéguez recomiendan usar otras herramientas como, por ejemplo, VisualSubSync Mod.

Por cuanto respecta a las pautas de subtitulado, como he dicho arriba no soy un erudito en la materia, así que, además de a mi propia experiencia y conocimientos, he recurrido a las referencias disponibles al final para hacer una recopilación de 10 indicaciones o consejos acerca del subtitulado que los principiantes pueden tener en cuenta como punto de partida. Por otra parte, os invito a leer alguna de las miles de obras de referencia disponibles en el mercado. Cualquiera de las publicaciones específicas de Jorge Díaz Cintas al respecto sería una buena opción. Hechas estas aclaraciones, aquí va la respuesta en voz alta a la consulta sobre las pautas básicas de subtitulado:

1 El subtitulador es el encargo de la segmentación (spotting) y la traducción de los subtítulos, que deben reflejar el ritmo de la película. La entrada y salida de subtítulos debe sincronizarse, en medida de lo posible, con la propia voz. No obstante, el subtítulo debe aparecer 0,25 segundos después de escucharse la voz en pantalla. Entre subtítulo y subtítulo, debe haber al menos cuatro fotogramas de separación para que se perciba el cambio. Finalmente, los subtítulos no deben permanecer en pantalla más de 2 segundos tras finalizar la voz.

2 Los subtítulos deben reflejar toda la información escrita en las imágenes (avisos, carteles, etc.) que puedan aportar matices al significado global transmitido por el conjunto de imagen y diálogo. Asimismo, en los propios subtítulos debe tratar de plasmarse la información cultural que resulte relevante para la compresión del mensaje transmitido en el film.

3 Los subtítulos deben coincidir con los cambios de plano o escena, así como los cambios temáticos significativos en pantalla. Las voces en off (personajes que no se ven en pantalla) también se subtitulan y, para diferenciarlas, deben marcarse con el formato de texto en cursiva.

3 Deben utilizarse estructuras sintácticas sencillas, y los subtítulos deben conformar estructuras gramaticales completas. En un subtítulo, no se deben separar las palabras, se debe tratar de separar las líneas del subtítulo coincidiendo con comas y puntos, o bien, por las conjunciones. El final de un subtítulo debe marcarse con punto.

4 Un subtítulo completo de dos líneas con entre 14 y 16 palabras no puede permanecer en pantalla más de 6 segundos. En el caso de los subtítulos completos de una línea con entre 7 y 8 palabras pueden y deben permanecer un máximo de 3,5 segundos. En el caso de los subtítulos de una sola palabra, deben permanecer en pantalla un mínimo de 1,5 segundos.

5 El máximo de líneas por subtítulo es 2. El número de caracteres por línea no debería superar los 35. En cuanto a color y fuente del texto, se recomiendan fuentes Serifs como Arial en un color blanco hueso (que no sea #fff). La alineación del texto será centrada, salvo en los diálogos, en los que el texto (incluido el guión de apertura) se alineará a la izquierda.

6 Es mejor un subtítulo con dos líneas cortas de tamaño proporcional que uno con una línea larga. En caso de usar dos líneas no proporcionales, la superior debe ser más corta que la inferior. Cuando hay un diálogo entre personajes, cada línea corresponde a un personaje y además, éstas comenzarán con un guión y un espacio para marcar el inicio del diálogo.

7 Salvo en circunstancias extraordinarias, el bloque de subtítulos debe colocarse centrado en la parte inferior de la pantalla, con una separación de 1/12 del tamaño total de la pantalla con respecto a la parte inferior

8 Debe evitarse la repetición de nombres y elementos comunes que puedan interpretarse sin que deban ser siempre subtitulados. Cuando sea posible, para ahorrar espacio, deben usar siglas y acrónimos, así que los pronombres siempre que sea posible.

9 En el caso de subtítulos correspondientes a monólogos largos, la continuación del subtítulo se marca con tres puntos suspensivos al final del mismo y tres puntos suspensivos al comienzo del siguiente. En este punto, hay subtituladores que sostienen que la ausencia de punto ya marca que el texto sigue, por lo que no consideran necesario invertir los caracteres en puntos suspensivos.

10 Literalidad en palabras fácilmente reconocibles. En el caso de nombres propios como puntos geográficos o nombres de personas e incluso en el caso de palabras extremadamente similares en la lengua de partida y llegada, se recomienda encarecidamente subtitular de forma literal, puesto que al reconocerse la forma, el espectador espera una determinada traducción que, de no encontrarse, resulta en una sensación de error.

Bueno, como ya he dicho, esta recopilación cubre nociones muy básicas y el subtitulado tiene mucho más intríngulis. La formación, la consulta y la práctica (me temo que en ese orden) hacen al maestro, así que si os animo a todos los que no hayáis hecho nunca subtitulado a probar y, a los que tenéis experiencia, a compartir con el resto todo lo que consideréis imprescindible que se me haya escapado.

Un saludo a todos.

Atentamente,

Álvaro

– Recomendación musical: The Wombats, Moving to New York. De los temas que te animan para arrancar el día.

Referencias bibliográficas

– Díaz Cintas J, Teoría y práctica de la subtitulación: inglés / español, Barcelona, Ariel, 2003.

– Karamitroglou Fotios, A Proposed Set of Subtitling Standards in Europe (1998). Available at: http://translationjournal.net/journal/04stndrd.htm

– CESyA, Buenas Prácticas. Available at: http://www.cesya.es/es/normativa/buenas_practicas
– ESIST European Association for Studies in Screen Translation, Code of Good Subtitling Practice (1998). Available at: http://www.esist.org/ESIST%20Subtitling%20code_files/Code%20of%20Good%20Subtitling%20Practice_en.pdf

La postedición o el enigma del efecto polaco

Algunos negaban su existencia, otros creían que se trataba de una profecía que jamás llegaría a cumplirse. Sin embargo, ya está aquí. La postedición ha llegado a nuestras vidas, y lo ha hecho para quedarse. Dejadme que os explique el motivo por el que me he animado a escribir este post. Tiene su aquel.

Hace unas semanas, como parte de mis tareas, me tocó participar en una traducción-postedición de un cliente que desarrolla aplicaciones de diseño gráfico. Se trata de un cliente grande, cuya terminología, estilo y memorias de traducción están absolutamente contrastados y que desde hace un tiempo ha decidido utilizar el motor de traducción automática de mi empresa (iMT). Para ser sinceros, la verdad es que en general el resultado de la traducción automática era muy bueno, dado que se trataba de una ayuda en línea, con frases sencillas, terminología de un glosario, etc. No obstante, casi al final del texto me encontré con una oración cuya traducción automática decía algo parecido a: “[…] para conseguir un efecto realmente polaco”. La verdad es que no pude contener la risa, porque la frase en inglés terminaba más o menos así: “[…] you will get a very polished effect”. La cuestión es que esta anécdota me resultó especialmente graciosa porque me recordó a mi novia cuando vivíamos en Londres. Ella trabajó durante un tiempo en hostelería y entre todos los compañeros hablaban una especie de Spanglish (algo no tan raro cuando trabajas en un ambiente con muchos hispanoparlantes, por cierto). Al final hasta en casa nos acabamos acostumbrando a escuchar que si había estado polichando, para referirse en realidad a que había estado secando los platos. El quid de la cuestión es que si las propias personas a veces terminamos aceptando como natural las expresiones más inverosímiles (¿pero quién no traga a menudo con las implementaciones?), ¿cómo va a resistirse la traducción automática al enigmático atractivo del “efecto polaco”? 😉

Además de esta anécdota que sobre todo me sacó una buena sonrisa, el otro motivo que me llevó a escribir esta reflexión es que hace no demasiado se puso en contacto conmigo una traductora que tenía muchas dudas acerca de las herramientas CAT. Lleva toda la vida (más de 25 años) traduciendo manualmente de forma artesanal, por así decirlo. La cuestión es que me pareció admirable que ahora tenga interés por progresar y enfrentarse a la nueva realidad. Parte innegable del nuevo escenario profesional de la traducción es la postedición, a la que, desde mi punto de vista, todos debemos acostumbrarnos porque:

a)      Desde la perspectiva de la satisfacción del cliente, hay muchos que por cuestión de relación calidad-coste lo exigen como método y, por tanto, como buen profesional se deben desarrollar las capacidades necesarias para ofrecer el servicio.

b)      En el plano económico, la postedición representa una oportunidad de negocio para los traductores. La tecnología y el perfil profesional evoluciona y es necesario adaptarse. Sorprende que, a pesar de que hay muchísimos buenos traductores, no hay tantos que sepan y quieran hacer postedición. Personalmente, creo que esto es un error, ya que, aunque al principio cuesta desarrollar la técnica (“tragar” con algunas estructuras, etc.), al final compensa porque te brinda más oportunidades de trabajo.

Los profesionales que fueron pioneros en afrontar el reto hace años, gozan ahora de prestigio y ponen de manifiesto su versatilidad. La cuestión es que creo que, ante situaciones en las que inicialmente podemos mostrarnos reticentes, debemos aprender a ver las cosas con perspectiva de futuro. Debemos adaptarnos a las innovaciones y las exigencias profesionales en constante cambio. Al fin y al cabo, si somos capaces de acabar acostumbrándonos a expresiones lingüísticas inverosímiles (que en realidad no son más que una representación de la propia realidad) y terminamos por polichar los platos después de fregarlos, ¿no vamos a ser capaces de resolver el “efecto polaco” que nos plantea la postedición? Por supuesto que sí, sólo se trata de voluntad, como me mostró a mí, y espero que a todos, la traductora de la que he mencionado anteriormente.

Bueno, no me extiendo más.

Un saludo,

Álvaro

Recomendación musical: últimamente estoy escuchando mucho piano. Como propuesta relajante, Yurima, The Sunbeams They Scatter.

Proyecto del Parlamento UE

Hola a todos:

Este va a ser un post muy breve. Sólo quiere dejar un enlace sobre un proyecto de colaboración terminológica con el Parlamento europeo, ya que creo que puede resultar interesante para muchos de vosotros.

Todavía está en fase inicial, pero puede ser interesante, ya que también dan información sobre seminarios, etc.

Bueno, aquí va el enlace al proyecto TermCoord: http://termcoord.wordpress.com/.

La próxima vez que escriba en el blog, espero que sea una parrafada más considerable.

Un saludo a todos y buen comienzo de Semana Santa. Atentamente,

Álvaro

Recomendación musical: los Foo Fighters han vuelto con material nuevo de calidad. En Back and forth, Krist Novoselic (como Dave Grohl, también ex de Nirvana) toca el bajo.

Concurso de subtitulado fansub

Hola a todos:

Esto va a ser rápido, nada de mis interminables divagaciones habituales.

Sé que algunos de los lectores del blog sois subtituladores aficionados de pelis y series para la Red. Hoy Jorge Díaz Cintas me ha mandado información sobre un concurso abierto para gente con experiencia en este tipo de subtitulado a la que le apetezca poder ganarse unas pelillas y una colaboración profesional.

Aquí os paso el enalce: http://www.subti.com/news/?Fans_and_Subs.

Bueno, ánimo a los que participéis.
Un saludo,

Álvaro

Conferencia del W3C sobre la Web multilingüe en Madrid

Un apunte muy breve.

Uno de mis antiguos profesores (uno estupendo, por cierto), Jorge Díaz Cintas, me ha informado de que los próximos días 26 y 27 de octubre de 2010 se celebra en Madrid una conferencia del W3C titulada The Multilingual Web – Where Are We?.

Para obtener más información acerca del evento GRATUITO, podéis visitar este enlace.

Los que viváis cerca o tengáis posibilidad de ir, no os la perdáis, porque seguro que resulta superinteresante, ya que todos los temas que se van a tratar forman parte del día de los profesionales de la localización web.

Un saludo y si alguien va, que comente, por favor (aunque tras la conferencia colgarán el material de la misma).

Álvaro