Traducciones con restricción de caracteres

Como casi siempre, debo empezar pidiendo disculpas por mi inactividad. La verdad es que incluso hay veces en que me planteo dejar de escribir temporalmente porque entre el trabajo como traductor, el de tutor y las tareas que tengo como diseñador y webmaster, el blog está más abandonado de lo que debería. Sea como fuera, me he decidido a publicar un post rápido pero que puede resultar práctico.

La cuestión es que hace más o menos unas tres semanas, recibí bastantes encargos de software en los que había que trabajar con restricción de caracteres y no se podía superar la longitud del texto de origen. A pesar de que esta era la instrucción específica del cliente y que los archivos iban en SDLX (que en realidad no es lo más indicado para hacer SW, pero eso ya es otra cuestión), no se me proporcionó ninguna forma de comprobar si mis traducciones superaban la restricción impuesta de forma automática (señalar toda la cadena y ver el recuento de caracteres en SDLX no es nada automático).

Total, que al final, tras comentarlo con dos de mis compañeros, David Valdivia y Ángel Martínez (profesionales excepcionales, cada uno a su manera y en su especialidad), llegamos a la conclusión de que lo mejor era crear un sistema de comparación de longitud de caracteres que pudiese usarse con cualquier traducción. ¿La solución? En lugar de buscar algo muy enrevesado, optamos por usar una herramienta de la que casi todos disponemos y que más o menos todos manejamos, Excel.

El proceso fue el siguiente: crear una hoja de Excel en la que se pueda cortar-pegar tanto el texto de origen como la traducción (la mayoría de las herramientas de traducción asistida te permite generar una vista de original-traducción enfrentada por columnas, o bien, puedes copiar todo el texto directamente –como en mi caso particular, en SDLX), a continuación, crear dos columnas en las que Excel inserte el recuento de cadena original y traducción, luego, crear otra columna en la que se inserte la diferencia del recuento de caracteres entre original y traducción y, finalmente, en función del resultado obtenido, indicar mediante un mensaje si las cadenas son válidas o no válidas.

Para los que queráis crear un recurso de este tipo, que también puede resultar adecuado para textos audiovisuales, ahí van los pasos detallados (al final del post facilito un modelo ya completo).

  1. Creamos la hoja de Excel con las columnas (campos) indicadas anteriormente. Una vez completado este paso, vamos a insertar la fórmula de recuento en la 3ª y 4ª columna para el recuento de cadena original y traducida respectivamente. Para ello, seleccionamos la tercera columna, en la segunda fila, y pulsamos el botón de fórmula o función (fx) y, entre las categorías disponibles, escogemos Texto y la función Largo. Para la cadena original, seleccionamos la fila A2, mientras que, al repetir la operación para la traducida, seleccionamos la B2, como se muestra en la ilustración.
  2. Automáticamente, se insertarán los recuentos. A continuación, vamos a trabajar en la diferencia. Para ello, en la columna de la diferencia, señalamos la fila 2 (E2) y, a continuación, en el cuadro de la función, escribimos =D2-C2 (es decir, que ponga el resultado de restar C2, caracteres originales, a D2, caracteres de la traducción). De esta forma, ya tenemos un resultado: si el recuento es positivo, nos hemos pasado la restricción, si no, correcto.
  3. Por último, para que tengamos esta información sobre el estado de la restricción más clara, vamos a poner una función condicional en la última columna. Señalamos la fila F2 e insertamos una función. Seleccionamos la categoría Lógica y, a continuación, SI. Finalmente ponemos como valores lo siguiente: D2 <= C2 (en Prueba_lógica), CORRECTO (en Valor si verdadero) y ERROR (en Valor si falso). De esta forma, si la traducción es más larga que la cadena original, es estado indicado será Correcto, mientras que si se supera la restricción de caracteres el resultado será Error.
  4. Como podéis ver, el resultado es bastante bueno.

Como todos sabéis, en el mundo de la traducción y la localización profesional, el escenario no es siempre el ideal y, a menudo, somos nosotros los que tenemos que ingeniárnoslas para salir del paso airosos y realizar una labor de calidad. Muchas veces resulta mucho más práctico optar por soluciones sencillas y rápidas como, por ejemplo, este Excel de recuento de caracteres que por otras más complejas (como habría sido pasar el texto entregado en SDLX a Passolo o Alchemy Catalyst, sobre todo porque esta tarea no estaba pagada y podría resultar incómoda al revertir el proceso para la entrega).

Espero que este post os resulte útil y que especialmente os sirva para que vosotros desarrolléis más ideas sencillas y directas. Por cierto si alguien quiera el comparador de Excel, que lo descargue de mi web a través de ESTE ENLACE.

Un saludo a todos. Atentamente,

Álvaro

Recomendación musical: Beady Eye, The Morning Son. Todavía no tenemos vídeo original, pero algo es algo

18 comentarios el “Traducciones con restricción de caracteres

  1. Buen tuto, gracias. Ciertas fórmulas de Excel (sobre todo las lógicas) son muy versátiles, pero a veces «programarlas» se hace algo complejo.

    También podrías abrir el SDLx en TagEditor y utilizar la comprobación de caracteres que tiene el QA Verifier. Creo recordar que solo permite un valor para todo el documento, pero también es útil. Solo sirve a posteriori, pero es útil.

    De todas formas, lo más fácil de todo sería poner una fuente monospace, como Courier New, en SDLx y desplazar la línea de separación para que la columna del texto meta ocupe justo el número de caracteres máximo. No hay nada más cómodo, siempre que se utilice la misma limitación a lo largo de todo el documento.

    • alvaromira dice:

      Gracias por tu comentario. Por cierto, enhorabuena por haber entregado la tesina. La tengo descargada para leerla, pero creo que va a pasar a lista de cosas para el verano…

      Con respecto al tema de TagEditor, sí, defines un máximo de caracteres global. En cuanto al tema de la línea de separación y la definición del monospace, no me parece malo como sugerencia, pero me temo que, de nuevo el problema es el mismo. Hay muchos casos en que la restricción no es fija, sino que varía en función de la parte de la interfaz que sea (sobre todo para el FW, que ya sabes que es el pelotazo más grande que se ha inventado -el ejemplo más claro es el infierno del minipanel de las impresoras y escáners), etc.

      Un saludo y gracias por tu participación.
      Álvaro

      • Y cómo mola intentar traducir cadenas sin que te permitan más caracteres que el inglés, ¿eh? Anda que no he traducido FW yo sin que se entendiera absolutamente nada. Bueno, tampoco se entendía el inglés, así que no pasa nada. 🙂

        Me temo que son cosas de los japoneses y chinos. Ellos pueden meter bastante información en poco espacio (aunque cada carácter ocupe el doble de espacio en memoria), y creen que el resto del mundo lo tenemos igual de fácil. Ay, esos informáticos que no saben el significado de la palabra «internacionalizar».

      • alvaromira dice:

        Y qué lo digas, Jordi… es probablemente ahí donde radican la mayoría de los problemas. Justamente mi tesina se llamaba Long Way to Localisation
        Bueno, que tengas buena semana, tío.
        Un saludo,

        Álvaro

      • A mí lo que me hace gracia es cuando te dan el inglés como el original, que ha sido traducido del francés o del alemán, y te dicen que mantengas el límite teniendo en cuenta el inglés (que ya sabemos todos que, como media, es un 25% más corto que la mayoría de los idiomas europeos), y te das cuenta que, casi siempre, el francés es mucho más largo, y que te vendría de puta madre que te dejasen hacerlo tan largo como el francés… Y te joden, porque te dicen que no, que tiene que ser con el inglés… Y las pasas putas para abreviar, cambiar palabras y hacer el pinopuente para que el texto sea tan largo como el inglés, a pesar de que, en verdad, sobra espacio porque el juego se programó teniendo en cuenta el francés o el alemán 😉

  2. Gracias por el truquillo. A mí me marean cada vez que me piden lo de las restricciones. Por suerte, de momento no me ha pasado con SDLX y el cliente suele pasarme el texto en Excel. A veces te añaden la columna de las restricciones y te solucionan la vida. Otras, te la añaden pero la fórmula está mal puesta y no te dice cuántos caracteres tiene la celda, jjjjj. En estos casos hago algo un poco chapucero pero que, de momento, me ha servido. Primero, me aseguro que la columna en inglés y la columna en español tengan la misma anchura y, así, puedo ver a ojo si el español es más largo o no. Aquellos que veo que son más largos, los copio en word y miro el número de palabras y ya ahí lo acorto. Cuando consigo que esté dentro del límite, lo copio de nuevo al Excel.

    A ver, no es demasiado trabajo, al menos no para alguien maniático como yo XD… pero con este truquillo que me das, solo tengo que «preparar» una vez y ya está 🙂

    • alvaromira dice:

      Gracias por tu comentario, Curri. Me alegro de que le veas utilidad al Excel. Como decía Jordi, que fácil sería si se empezase con plantear bien las cosas con una fase de internalización para facilitar la vida…

  3. @CqCV dice:

    Yo traduzo textos de videojuegos y, cuando trabajo con SDLX, suelo utilizar la fórmula Largo en Exel para hacer este tipo de comprobaciones al final, cuando he terminado la traducción, pero, como muchas veces en un texto tengo restricciones distintas para los distintos tipos de strings, en la propia interfaz de SDLX también lo voy consultando mientras traduzco. Para hacerlo, selecciono el texto cuyos caracteres quiero contar y al hacerlo me aparece el número de caracteres del texto seleccionado en la parte inferior derecha de la pantalla. Es un poco lío si todas y cada una de las strings del proyecto tienen restricción, pero cuando son solo algunas, puede resultar muy útil mirarlo sin salir de SDLX, aunque al final se haga una última comprobación en un Excel.

    • alvaromira dice:

      Gracias por tu comentario, Mª Luisa. Ese recurso de SDLX es el que mencionaba en el post del blog, pero claro, como bien dices, sólo va si es poco, si son tropecientas mil cadenas, te acabas cortando las venas.

  4. Olli dice:

    Hola Álvaro:

    Puede que escribas cada N meses pero da gusto leer tus entradas :D. Mejor esto que una entrada al día sobre chorradas :).

    Otra posibilidad para lo que comentas en la entrada es utilizar una fórmula LEN (creo que en Excel en español es LARGO o LONGITUD), que te da automáticamente la longitud de la cadena en una celda 🙂

  5. Irene dice:

    Hola:
    Para trabajar con un posible cliente estuve trasteando Across (http://www.across.net/en/index.aspx) hace poco y, además de parecerme bastante chulo, descubrí una función de comparación de caracteres entre TO y TM. Te va avisando y ves si te estás pasando. Es también una opción interesante.
    En cualquier caso, enhorabuena por el post, y por tu blog, que no lo conocía.
    Saludos.

    • alvaromira dice:

      Gracias por tu comentario, Inés. La verdad es que Across es una maravilla, sobre todo porque en muchas cosas, es una plataforma que mira al futuro (al igual que LingoTek). Gracias por mencionar lo de esa función, que no la conocía, echaré un vistazo a la configuración para ver cómo activarla.
      Un saludo,

      Álvaro

    • Ostras, Irene, muchas gracias. Y yo me he pasado los últimos tres años de mi vida contando las celdas «a mano», como aquel que dice jijijiji.
      Gracias a dios, últimamente no me han llegado muchos proyectos de esos complicados, sobre todo porque ya me quejé varias veces de que, pedirnos que nos rompamos los cuernos para abreviar cosas que en inglés tiene una palabra de tres letras y en francés son tres palabras, es hacer trampas 🙂

      • Irene dice:

        Puf. Me hago cargo, Curri.
        Álvaro: a mí me aparece directamente el recuento si estoy en el «Combi mode». No he tenido que activarlo, aunque, claro, estoy empezando y no sabría decirte si hay que hacerlo si no aparece por defecto y dónde.
        Saludos.

  6. olli dice:

    Alvaro, ni caso al comentario que te he puesto. Se me ha ido la pinza por completo XD

    • alvaromira dice:

      Gracias de todas formas por el cumplido, Olli. Es normal que se te vaya la pinza, ¡si posiblemente estarías haciendo la digestión!
      Un saludo y a ver si un día nos tomamos algo por Granada.

  7. Olli dice:

    No se puede comer cocido y comentar, que luego ocurren estos desfases mentales :D.

    Pues por mí encantado que nos veamos. Échame un mail cuando puedas y si eso vemos cuando nos viene bien a los dos 🙂

  8. […] que ya hablé hace unos meses. En concreto, en marzo publiqué una entrada en el blog acerca de la traducción con restricción de caracteres y di un Excel. Hace unos días, estaba hablando con un PM sobre un proyecto de traducción de unas […]

Deja un comentario