29 Ago

Introducción

La informática ha revolucionado el modo de hacer cálculos y procesar información. Del mismo modo, ha revolucionado la manera de traducir, dando lugar a la traducción por ordenador.

Conceptualización

Traducción por ordenador: Proceso (o el producto) de traducir un texto informatizado en una Lengua Origen (LO) a un texto informatizado en una Lengua Meta (LM) mediante el uso de un programa de ordenador.

Distinción fundamental: Consecuencia de dos enfoques diferentes:

  • TA (Traducción Automática): Una máquina traduce un texto de una lengua a otra. Subdivide la sintaxis, identifica partes del discurso, resuelve ambigüedades…
  • TAO (Traducción Asistida por Ordenador): Herramientas informáticas para ayudar al traductor: Bases de datos terminológicas, Memorias de traducción…

Evolución de la Traducción por Ordenador

La traducción es una de las actividades más complejas para un ordenador, ya que requiere:

  • Decir todo lo que dice el original.
  • No decir nada que el original no diga.
  • Decirlo todo con corrección y naturalidad.

Ningún programa es capaz de emular completamente la actividad de un traductor profesional.

Inicios de la TA

La noción de TA surge en el siglo XVII con las reflexiones de Descartes y Leibnitz. Sin embargo, el interés por automatizar los principios de la traducción es más reciente (siglo XX).

  • Años 30: George Artsrouni y Petr Smirnov-Troyanskii proponen las primeras etapas en TA.
  • Años 50: Primeros ensayos con la colaboración de IBM y la Universidad de Georgetown (alcance limitado): 49 oraciones de ruso a inglés, 250 palabras, 6 reglas gramaticales.

Informe ALPAC

El optimismo inicial desapareció debido a las barreras semánticas insuperables.

  • 1964: Evaluación de la TA por el Comité ALPAC (Automatic Language Processing Advisory Committee):
  • La TA era lenta, ineficiente y costaba el doble que la traducción humana.
  • Se destacó la necesidad de desarrollar herramientas para traductores (diccionarios, bases de datos).

Consecuencias para la investigación en TA:

  • En EE.UU se paraliza.
  • Continúa en Europa con Systran (Comisión de la UE) y Taum Météo (previsión del tiempo).

Años 80

Importantes avances debido a:

  • Mayor demanda de traducciones de las comunidades multilingües.
  • Acceso masivo a ordenadores personales (IBM PC en 1981), lo que permitió el desarrollo de programas de traducción.

Años 90

Cambio radical en la estrategia de traducción, centrándose en corpus de texto y ejemplos:

  • El lenguaje deja de ser considerado una entidad estática. Se reconoce como cambiante según el uso y en constante evolución, adaptándose a las realidades sociales y culturales.
  • La TA pasa de fundamentarse en reglas gramaticales a considerar corpus lingüísticos.
  • Creación de servicios de traducción en línea como Altavista.

Últimas dos décadas

El auge de las TIC, los mercados mundiales y la cooperación supranacional han incrementado la demanda de traducción.

  • Limitaciones del traductor humano (4-6 páginas o 2000 palabras/día).
  • Para superar esta limitación y responder a la creciente demanda, se desarrollan herramientas TAO.

Traducción Automática: ¿Qué es?

Es una aplicación del Procesamiento del Lenguaje Natural (PNL), un área de la lingüística computacional que investiga el uso de software para traducir texto o habla de un lenguaje natural a otro.

Combina elementos de diversas disciplinas, especialmente la lexicografía, la lingüística, la lingüística computacional y la inteligencia artificial.

¿Por qué la TA?

Factores que impulsan el desarrollo de la TA:

  • Factores prácticos: Gran volumen de información a traducir.
  • Factores políticos: Multilingüismo en instituciones y organizaciones.
  • Factores comerciales y tecnológicos: Globalización y necesidad de comunicación internacional.

Tipos de Textos y la TA

No todos los textos permiten una TA aceptable.

TA Adecuada para:

  • Textos escritos.
  • Materias muy específicas.
  • Lenguaje formal, estereotipado y predecible.
  • Textos mecánicos y rutinarios.
  • Textos jurídicos y manuales técnicos.

TA Inadecuada para:

  • Textos creativos (narrativa, poesía, teatro, ensayo…).
  • Textos expresivos (lenguaje coloquial, lenguaje humorístico, chistes, juegos de palabras…).

Tipos de Sistemas de TA

  1. Traducción Basada en Reglas (RBMT)

    • Base teórica: Lingüística Generativa e Inteligencia Artificial.
    • La traducción se basa en lograr equivalencias semánticas.
    • Se basa en información lingüística para determinar la estructura común entre lenguas.
    • Utiliza diccionarios monolingües y bilingües, además de reglas de transferencia estructural.
    • Métodos: Directos e indirectos (interlingua y transferencia).
  2. Traducción Basada en Analogías (ABMT)

    • Surge en los años 90 con la recopilación de corpus textuales.
    • Desarrollo de un nuevo acercamiento: TA estadística.
    • Traducción basada en ejemplos.
    • Utiliza técnicas estadísticas para determinar la mejor traducción posible usando corpus bilingües alineados.
    • Base del desarrollo de las memorias de traducción.
  3. Traducción Basada en Redes Neuronales

    • Paradigma más reciente (2014).
    • Utiliza redes neuronales artificiales y grandes corpus paralelos para su entrenamiento.
    • Con técnicas de aprendizaje automático y grandes cantidades de textos paralelos, el ordenador “aprende” a traducir.

Dificultades de la TA

  • La forma no determina completamente el contenido: Problema de la ambigüedad.
  • El contenido no determina completamente la forma: Problema de la síntesis.
  • Las lenguas divergen: Problema de la transferencia.
  • Gestión de gran cantidad de conocimiento, que se debe recopilar y representar en un formato útil para ser procesado por un ordenador: Problema de la descripción.

Problemas para un Sistema de TA:

  1. Diferencias Léxicas

    • Ambigüedades de traducción:
    • Ambigüedades estilísticas: La elección de equivalentes varía según el registro o tipo textual. Ejemplo: Las relaciones de parentesco en japonés varían según la referencia al oyente o hablante.
    • Ambigüedades gramaticales: Elección alternativa, condicionada por el contexto gramatical. Ejemplo: «know» en inglés puede traducirse como «saber» o «conocer» en español.
    • Ambigüedades conceptuales: A un único “concepto” en una lengua corresponde una serie de conceptos en otra. Ejemplo: «leg» en inglés puede traducirse como «pierna», «pata» o «pie» (de una silla) en español.
  2. Diferencias Estructurales

    • Diferencias sintácticas entre lenguas.

Conclusión

La TA es una herramienta útil para los traductores, ya que permite:

  • Incremento de la productividad.
  • Disminución de costes y tiempos de entrega.

Sin embargo, es importante recordar que:

  • No sirve para todo tipo de textos.
  • El futuro de la traducción es mixto, combinando la TA con la experiencia y el conocimiento del traductor humano.

Deja un comentario