En este apartado mostraremos los principales tipos de motores de traducción existentes, sus arquitecturas, características y funcionamiento. Nos detendremos sobre todo a analizar sus respectivos lexicones o diccionarios y mostraremos algunos sistemas de TA específicos, algunos de ellos ya mencionados en el apartado anterior.
El diseño de un sistema de TA combina elementos de diversas disciplinas, especialmente la lexicografía, la lingüística, la lingüística computacional (la parte que se encarga de la implementación de las descripciones lingüísticas en algoritmos) y la Inteligencia Artificial (la parte de ésta que se encarga de la Representación del Conocimiento). Esto es así puesto que la tarea de traducir implica un proceso basado en el conocimiento (Whitelock & Kilby 1995). Además, los sistemas variarán según la concepción que se tenga del proceso de traducción y en cierto modo serán un reflejo de ésta.
El papel que juega el diccionario en un sistema de TA depende del tipo de motor de traducción que el sistema posea. Lo usual, de hecho, es que la estructura interna de los diccionarios esté condicionada por el motor de traducción que se pretenda emplear.
Una clasificación ya clásica de los sistemas de TA establece tres grandes grupos, aunque hoy en día esta clasificación no es realmente válida, puesto que los modernos sistemas incorporan técnicas de varios enfoques y otros nuevos que no están contemplados en ella. Sin embargo, dicha clasificación nos servirá para mostrar las más importantes técnicas utilizadas tradicionalmente en Traducción Automática. La tipología que vamos a exponer se corresponde más o menos con las diversas etapas que describimos en el apartado anterior.
Para entender los diversos paradigmas comúnmente utilizados en Traducción Automática, a menudo se usa el diagrama de la Figura 3.4, adaptado de (Hutchins & Somers 1992:107), aunque fue usado antes por (Vauquois 1968). En él se muestra la cantidad de análisis y de generación que cada paradigma requiere, así como el grado de similitud entre la representación fuente y la objeto. Por ejemplo, en las arquitecturas directas o transformer el análisis del texto fuente es muy sucinto, y como consecuencia el proceso de traducción tiene que realizar operaciones muy complejas para generar un texto aceptable en la lengua meta.
Figura 3.4 Gráfico piramidal de transferencia e interlingua
Como este diagrama muestra, se distinguen típicamente tres enfoques principales: los enfoques directos, los de interlingua y los de transferencia (normalmente sintáctica y en contados casos también semántica). Esta pirámide se basa en las diferencias de "longitudes relativas" de los tres componentes de la traducción: análisis, transferencia y síntesis o generación.
Al igual que en otros ámbitos de las tecnologías de la información, también la TA se ha clasificado en generaciones, que, vagamente, vienen a coincidir con esta tipología. Sin embargo no adoptaremos este tipo de clasificación porque lleva a concepciones erróneas sobre el nivel de avance que suponen7. Preferimos catalogar los diferentes enfoques según la arquitectura que usan, si bien, repetimos, los sistemas implementados raramente pueden ser etiquetados estrictamente como sistemas de una u otra arquitectura. A continuación exponemos las características más sobresalientes de estas metodologías.
NOTAS
Anterior I Siguiente I Índice capítulo 3 I Índice General