ISSN: 1139-8736
Depósito Legal: B-35510-2000

3.2.5 Metal

Metal (Mechanical Translation and Analysis of Language) es uno de los sistemas comerciales más avanzados en la actualidad. Como ya hemos mencionado, el sistema comenzó a desarrollarse a mediados de los años 60 en el LRC (Linguistic Research Center) de la Universidad de Texas, bajo la dirección de Winfred Lehman. Fue el único sistema que sobrevivió a esta época, debido sin duda al interés que la multinacional alemana Siemens13 mostró por el sistema.

Fue esta empresa la que en 1989 introdujo en el mercado este sistema de TA. El primer objetivo de Siemens fue crear un sistema que abaratara los costos de sus propias traducciones internas, sólo después se planteó licenciar el software a terceros. Al igual que Systran, Metal fue un sistema concebido para ser ejecutado en grandes ordenadores (sistemas dotados de compiladores Lisp Symbolics , y más concretamente equipos Siemens con SO SinixTM ). En 1994 el producto se portó a la plataforma Unix standard (Metal/X, bajo el entorno X-Windows). Al año siguiente, la empresa alemana GMS (Gesellschaft für multilinguale Systeme) adquirió los derechos del sistema MetalX, junto con los 10 pares de idiomas disponibles y todo el entorno de desarrollo. Esta empresa portó el código fuente en Lisp a C++ para poder portar posteriormente toda la aplicación a otras plataformas. Hoy en día el sistema, denominado Langenscheidt’s T1, en su versión 3.0 se encuentra disponible en plataformas PC Win32 para inglés sdarrow.gif (848 bytes) alemán e inglés sdarrow.gif (848 bytes) español. En la Figura 3.10 mostramos la estructura básica del sistema Metal según su concepción original, tomado de (Hutchins & Somers 1992:353).

Metal tuvo sus orígenes en la temprana tendencia al paradigma de interlingua. Sin embargo, la primera versión comercial de Metal (1989) fue un sistema de transferencia sintáctica unidireccional alemán arrow.gif (839 bytes) inglés. Como tal sistema de transferencia, esta versión no hacía distinción entre sus componentes de transferencia y generación, exhibiendo de hecho un módulo de transferencia sobrecargado que reducía la generación a la mera síntesis morfológica (Trujillo 1995).

El proceso de traducción en Metal es el siguiente: análisis morfológico, parsing, transferencia (incluyendo reglas léxicas y estructurales (árbol-a-árbol), y finalmente síntesis. El análisis lingüístico se realiza mediante una gramática libre de contexto aumentada con transformaciones. Las reglas de transferencia, junto con el diccionario bilingüe, convierten los árboles sintácticos de la lengua origen en los árboles para el generador de la lengua meta. A su vez, el proceso de generación incluye otras transformaciones estructurales que finalmente construyen una estructura en lengua meta válida. El sistema posee otras muchas características específicas, tales como la compilación léxica, las herramientas de generación de gramáticas y, sobre todo, los algoritmos de formateado y deformateado (ver Figura 3.10).

Figura 3.10
Figura 3.10 Procesos básicos del sistema Metal

En cuanto a la base de datos del sistema, en Metal existe una clara distinción entre los algoritmos de traducción (análisis, transferencia y síntesis) y los diccionarios que esos algoritmos usan (Bennett & Slocum 1988). Los diccionarios tienen una estructura jerárquica: a los módulos básicos les corresponden los tres niveles superiores (palabras gramaticales, vocabulario general y vocabulario técnico ordinario), después están los diccionarios terminológicos generales, los terminológicos específicos y finalmente los diccionarios de usuario. El usuario puede agregar tantos glosarios específicos como desee y especificar el orden de consulta de los mismos14.

Los diccionarios son monolingües (para el análisis) y bilingües (para la trasferencia). Los diccionarios de LO y LM tienen la misma estructura, pero se accede a ellos de modo diferente: mediante el valor ALO (alomorfo) en el caso de los diccionarios de LO, mediante los valores CAN (forma canónica) en el caso de los de LM. Cada entrada es esencialmente una lista de pares atributo:valor . El primer elemento de la lista es la forma canónica, cuyo nombre de atributo es CAN (aunque de hecho se omite). En la misma línea le sigue el atributo CAT (categoría) y en la línea siguiente el atributo ALO. El formato es el siguiente:

(<forma canónica>) CAT (<categoría>)
ALO (<alomorfo>)
<atributo 1> (<lista de valores>)
<atributo 2> (<lista de valores>)
.
.
.
<atributo n> (<lista de valores>)

A continuación detallamos los atributos principales, que son compartidos por todos los lexicones.

AST adjective stem CONJ conjunction
NST noun stem PREP preposition
VST verb stem PRN pronoun
DET determiner N-FLEX noun inflection
LOC locative adverb A-FLEX adjective inflection
MAN manner adverb D-FLEX determiner inflection
TMP temporal adverb V-FLEX verb inflection
DEG degree adverb PNCT punctuation

WF word final
WI word initial
NI non-initial
NF non-final

Aparte de estos atributos generales, existe una serie de posibles atributos que se pueden aplicar a entradas específicas o a lenguas determinadas. Corresponden a información adicional de tipo morfológico, sintáctico y semántico.

Un problema del sistema Metal es que no es bidireccional, ya que las reglas de transferencia se especifican en relación con un conjunto de reglas gramaticales específicas de la lengua de origen, que son interpretadas de una forma procedimental. Por tanto, cada regla de transferencia requiere una estructura de entrada y salida determinada, cuya parte de input contiene una serie de pruebas que se aplican al nodo de LO y deben ser satisfechas para que esa regla se pueda aplicar.

También existe un problema de reversibilidad monolingüe (Trujillo 1995). Consiste en que las gramáticas que se usan para el análisis son diferentes de las transformaciones utilizadas para la generación. Obviamente, este genera mucha información redundante, y por tanto a inconsistencias.

De modo parecido a Systran, la característica que sin duda hace de Metal un buen sistema de TA, con unos resultados más que aceptables es, como señala Magnúsdóttir (1993:5), su extensa codificación de la información léxica.


NOTAS

  1. Hoy, Siemens-Nixdorf.
  2. Para una descripción detallada de la estructura jerárquica de los diccionarios de Metal, véase (Schneider 1987).

 

Anterior  I  Siguiente  I  Índice capítulo 3  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-35510-2000
Copyright © 2000 Antonio Moreno Ortiz