QA y expresiones regulares en herramientas CAT (SDL Trados Studio) o generales (Microsoft Word)

Cuando llevas un tiempo relativamente razonable en el mundo de la traducción, llegas a la conclusión de que hay mucha gente capaz de hacer relativamente bien la gran mayoría de los trabajos que conforman el volumen de trabajo habitual de un proveedor de servicios lingüísticos para el que yo trabajo. Por tanto, si hay tantos profesionales (tanto recursos de producción freelancers como la propia competencia) capaces de ofrecer un nivel de calidad, pongamos 8, ¿qué puedo hacer para diferenciarme y ofrecer la máxima calidad (entre 9 y 10)?

Más allá de los procedimientos más habituales de la fase de control de calidad (QA) que se lleva a cabo normalmente tras finalizar la fase de traducción y de revisión (entre los que encontramos las clásicas revisiones ortográficas y gramaticales, las comprobaciones con perfiles automatizados tipo ‘igual puntuación source-target’, ‘comprobación de ¿? en español’, etc.), me gustaría llamar la atención sobre las expresiones regulares. Como define Microsoft, las expresiones regulares (regexp en inglés) no son más que fórmulas para identificar patrones de texto. La ventaja que ofrecen las expresiones regulares sobre estos sistemas de QA basados en glosarios y listas de palabras prohibidas es que superan la limitación de las propias palabras y van un nivel más allá. Veamos a lo que me refiero con un ejemplo concreto. Pongamos que tengo un proyecto de 90.000 palabras que tengo que repartir entre cuatro traductores (e incluso después entre dos revisores). A pesar de que les entregue mucha documentación lingüística (TM, glosarios) y referencias de estilo, es probable que haya divergencias en el resultado final en cosas como la localización de modelos de productos con números, números de piezas, el uso de mayúsculas tras puntos, el uso de un tipo de comillas u otras, etc.

Si yo deseo alcanzar la máxima calidad y limitarme a enviar el trabajo al cliente tal cual, podría usar las expresiones regulares para añadirlas al QA de mi herramienta CAT (prácticamente todas permiten hacerlo) para garantizar máxima precisión, coherencia y consistencia del material. A continuación, un ejemplo para ver a qué me refiero:

ST       Warning: Make sure all options are enabled before proceeding.

TT       Advertencia: Antes de continuar, compruebe que todas las opciones están activadas.

En este ejemplo, tendríamos un pequeño error puesto que tras : debería ir minúscula. Si tengo 90.000 palabras, ¿voy a revisar todos los : de mis archivos manualmente? La respuesta es no, para eso usaremos la siguiente expresión regular (en este caso escrita en un perfil de SDL Trados Studio y mostrada en el QA interactivo):

: [A-Z] (Descripción de la regla: si en el target se encuentra el patrón ‘dos puntos, espacio, cualquier caracter en mayúscula’ se genera una advertencia).

RexExp dos puntos

Con esta sencilla fórmula podemos identificar todos los fallos de este tipo en cuestión de segundos para corregirlos de forma mucho más eficaz. De hecho, si hubiésemos sido previsores, podríamos haber facilitado a nuestros traductores un perfil con expresiones regulares de este tipo para minimizar el número de potenciales errores de la última fase de QA al reunificar las 90.000 palabras repartidas entre los cuatro traductores.

Creo que este ejemplo muestra claramente que las expresiones regulares tienen un elevadísimo potencial que nos permitirá elevar la precisión de nuestra fase de QA y, consecuentemente, el de nuestro trabajo (tened en cuenta que podemos crear expresiones que se ajusten a todo tipo de necesidades usando tanto patrones como texto literal para, por ejemplo, comprobar que una dirección web siempre se localiza tal y como se muestra más abajo.).

Hay mucha gente que pensará que esto de las expresiones regulares es muy complicado pero, para los que sean de esa opinión, sólo puedo deciros que en un mercado tan competitivo hay que esforzarse por marcar la diferencia aprendiendo y ofreciendo servicios adicionales y de valor añadido. Además, las expresiones regulares son una habilidad transferible, se trata de un lenguaje universal que se puede aplicar en muchos contextos diferentes, de forma que es un conocimiento que podrás aplicar en miles de situaciones. A modo de ejemplo, un botón basta (la primera expresión, pero para búsquedas en Word):

Bueno, espero que os haya resultado interesante el tema de las expresiones regulares. A mí sí que me lo parece y por experiencia sé que te hace destacar entre los demás (incluso SIN SER un superexperto, como en mi caso). En Internet hay miles de sitios donde aprender a redactar regexps, seguro que encontráis alguno que os resulte adecuado para empezar.

Como siempre, en caso de duda, disparad.

Recomendación musical: un grupo que me pasó una compañera, Editors y su tema Bullets.

Anuncio publicitario

26 comentarios el “QA y expresiones regulares en herramientas CAT (SDL Trados Studio) o generales (Microsoft Word)

  1. Siempre se aprende algo nuevo. Gracias por lo de las regex, pero pregunto: ¿podría crearse este tipo de «regla» para el caso de tu ejemplo que no está utilizando el subjuntivo? Para entendernos:
    Donde dice:
    «…compruebe que todas las opciones están activadas».
    Debería decir:
    «…compruebe que todas las opciones estén activada».
    ¿O es aquí donde, gracias a Dios, es el traductor y no el sistema el que proporciona un texto sin errores?
    La duda proviene de la falacia (hasta el presente) que postula que cada vez más los sistemas de traducción reemplazarán al ser humano.
    Un saludo cordial.
    Marisa

    • Perdón: «…estén activadas»
      Quedo a la espera de tus sugerencias sobre cómo armar una regla para casos como el que cité. Gracias, Álvaro.

    • alvaromira dice:

      Hola, Marisa.
      Gracias por tu comentario. Me temo que lo que pides es imposible. Como he dicho, las regexp procesan patrones de texto o cadenas de texto literales. Lo que tú piedes es procesamiento del languaje avanzado, es otro tipo de tecnología que se hace con motores que tienen cargados miles de reglas. En SDL tenemos, por ejemplo, KbTs, que no está mal del todo. Por cierto, con respecto a los de los sistemas automatizados, realmente en muchos casos más que reemplazar al traductor, modifican su rol al de posteditor, pero sí es cierto que suponen (como he dicho, en algunos casos, cumpliéndose ciertas condiciones) una ayuda que acelera significativamente el proceso de trabajo.
      Un saludo,

      Álvaro

  2. ¡Qué buena entrada, Álvaro! La verdad es que no sabía que Trados Studio también permitía el uso de las expresiones regulares (no es que use demasiado el programa), así que me lo apunto para el futuro.

    Saludos,

    Pablo

    • alvaromira dice:

      Gracias por tu comentario, Pablo. Estoy seguro que un tío tan técnico como tú saca un montón de expresiones regulares para diferentes contextos. El único problema que tienen es que funcionan solo de forma intrasegmental, y no se pueden aplicar para más de un segmento en las herramientas CAT.
      Un saludo,

      Álvaro

  3. aidagda dice:

    Acabo de estrenar mi Trados Studio y estas entradas ahora mismo me resultan interesantes. Gracias.

  4. Ostras, qué caña, esto no lo conocía yo. Como dice Pablo, me lo apunto para el futuro, que este tipo de cosas siempre resultan útiles :D.

    ¡Saludos!

  5. Por cierto, esto sería cojonudo si se pudiera aplicar en programas como SDLX, que es el que más suelo utilizar…

    • alvaromira dice:

      Gracias por tus dos comentarios, Eva. Por cierto, en SDLX, como en la mayoría de las herramientas CAT, también la tienes (un poco menos sofisticada que en Studio, eso sí).
      Abres SDLX (módulo general) > QA Checker > Regular Expressions, o bien, desde el editor de SDLX, Tools > QA Checker accedes a la misma interfaz pero para un solo archivo.
      Un saludo y a practicar se ha dicho.

  6. El único «pero» que tengo en tener que usar esto es que, en cosas como:
    «localización de modelos de productos con números, números de piezas, el uso de mayúsculas tras puntos, el uso de un tipo de comillas u otras»
    el Project Manager, si es bueno de verdad, tendría que decidir desde el principio sobre esto y comentar a los traductores y correctores de cómo debe de hacerse. Es más, el uso de un tipo de comillas u otras no tiene por qué decidirse: se usan las correctas y punto 🙂 Lo mismo con lo de empezar en minúsculas después de dos puntos. Si un traductor no sabe eso que es básico, mejor darle el DRAE para que se lo empolle. Creo que, así, sería mucho más fácil conseguir que, al menos lo básico, sea congruente.

    Por lo demás, me parece buen método para igualar términos que, sí, seguramente se hayan traducido de forma diferente. Gracias por la entrada 🙂

    • alvaromira dice:

      Hola, Curri.
      Veo tu ranzonamiento pero no lo comparto. Creo que estás dando por hecho cosas que no siempre se cumplen. No estoy diciendo que no haya que dar las instrucciones (algo que menciono al hablar de proporcionar las referencias), sino de asegurarnos de que todo el trabajo se adhiere a las instrucciones. Todos somos humanos y cabe la posibilidad de que, por un despiste, algún traductor, no localice bien un código, que en 5000 palabras se nos pasen un par de comillas no españolas, etc.
      El propósito de un QA de máxima precisión es justamente tratar de detectar pequeños fallos que pueden producirse, especialmente cuando hay muchas manos en unmismo trabajo. Te puedo garantizar que trabajo con muy (recalco MUY) buenos profesionales (tanto internos como freelancers) y siempre hay despistes, gente que no sigue las instrucciones, etc.

      Cierto que estoy contigo en que hay muchos PM que se desinteresan por sus proyectos, pero eso ya es otro tema. Probablemente al plantearte el tema desde una óptica diferente a la mía, no coincidamos. La próxima vez intentaré dejar mi concepto más claro desde el principio.

      Un saludo,
      Álvaro

  7. Paula dice:

    No interesante, muy interesante. No sabía que existían y ya mismo me pongo a investigar cómo se usan.

  8. Qa | TagHall dice:

    […] a mi saldo « Vertientes, Camagüey… . Ludovic Hirlimann. Acerca de QA « capitanmosquis . QA y expresiones regulares en herramientas CAT (SDL Trados … . Moodle 2.2 QA is complete: […]

  9. […] Artículo sobre espresiones regulares y QA (Álvaro Mira) […]

  10. […] ya un tiempo escribí un post sobre expresiones regulares y QA. La cuestión es que entre ese artículo, la experiencia del día a día, los comentarios del blog […]

  11. Roci dice:

    Me ha parecido muy interesante y sobre todo útil a la hora de ahorrar tiempo y mejorar la consistencia y calidad de la traducción. Gracias por compartirlo 🙂

  12. DOS ESTUDIO dice:

    Hola alvaromira,

    Yo tampoco conocía el tema. Ahora me pondré a ver cómo se usan. Seguro me harán ahorrar tiempo!

    Gracias!

  13. Juampe Luque dice:

    muy bueno el post… gracias de mi parte también.

    Sólo recalcar que hay muchos usos normativos de la mayúscula tras dos puntos… en títulos o diálogos… p.ej…. y los primeros pueden aparecer en textos técnicos…

    • alvaromira dice:

      Hola, Juampe. No podrías estar más en lo cierto. Necesitaba dar ejemplos habituales que se viesen claros, así que tire por la regla más común y un tipo de error que se señala en muchos QA. De todas formas, como bien sabes, al final todo acabará dependiendo de la guía de estilo que se tome como referencia por parte del cliente (la suya, las normas estilísticas de la RAE, las de editoriales, periódicos, etc.).
      Un saludo,

      Álvaro

  14. Rosa dice:

    Hola espero puedan ayudarme, cuando hago el QA y RegEx, a pesar de que desmarco la casilla de los 100% el análisis lo hace a todo el documento no se como modificar esto. Por otra parte cuando abro un archivo para editar en Trados Studio 2011, los segmentos que están al 100% me aparecen como confirmados y yo no los quiero confirmados. Que puedo hacer para solucionar este problema???

    • alvaromira dice:

      Hola, Rosa. Gracias por tu comentario. Con respecto al QA, ¿estás añadiendo todas las regexp al proyecto (herramientas > Configuración del proyecto) o a tu perfil de usuario (herramientas > Opciones)? Es que hay diferencia a la hora de aplicarlo y en los resultados…
      Por otra parte, con respecto a los 100, tienes que modificar la configuración de la pretraducción al crear los proyectos para que no te los confirme y, por otra parte, cambiar las opciones de usuario para que no se confirmen los 100% recuperados directamente de la TM.
      Atentamente,

      Álvaro

      • Rosa dice:

        Muchas gracias Álvaro, no tengo mucha experiencia en el uso del Trados Studio 2011 por lo que no se cómo cambiar las configuraciones que mencionas para que los 100% no me aparezcan confirmados, no se si puedas ayudarme…. muchísimas gracias de antemano

      • alvaromira dice:

        Hola, Rosa:
        Pues si los 100% no los quieres confirmados al arrancar la traducción tras crear el proyecto, tienes que configurar el asistente para que al crear el archivo de traducción (el que tú abres en el editor) te aplique las coincidencias 100% de la TM pero no las confirme durante la fase de pretraducción.
        Para ello, tienes que irte las tareas por lotes y personalizar la pretraducción para que no te confirme las 100%. Te copio un enlace con la descripción de las opciones: http://producthelp.sdl.com/SDL%20Trados%20Studio/client_en/Ref/A-G/Batch_Processing/Batch_Processing___Pretranslate_Files.htm

        Presta atención al apartado After Applying Translation.

        Si realmente lo que quieres es no confirmar las auto-propagaciones al 100% (repeticiones de un segmento dentro de un mismo texto), avísame y te explico.
        Un saludo,

        Álvaro

Deja una respuesta

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Salir /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Salir /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Salir /  Cambiar )

Conectando a %s