ISSN: 1139-8736
Depósito Legal: B-35783-2001

4.2.2 El CLS Framework: MARTIF y RelTef

El CLS Framework debe su nombre a las iniciales en inglés de las palabras concepto, enlace y referencias compartidas. Así CLS hace referencia a Concept-oriented with Links and Shared references y es el resultado de un esfuerzo conjunto del Grupo de Investigación de Traducción de la Brigham Young University y del Instituto de Lingüística Aplicada de la Kent State University (EE UU). Se trata de un marco de trabajo que facilita las bases tanto teóricas como aplicadas para trabajar con información terminológica. El interés principal se centra en la estructura y el contenido de las bases de datos terminográficas. El marco de desarrollo de trabajo tiene tres áreas bien delimitadas: la representación de la información, el diseño de la arquitectura de las bases de datos terminográficas y el intercambio, distribución y fusión de la información terminológica.

Una entrada terminográfica está compuesta por datos, que están agrupados según su naturaleza en campos, registros o celdas, según el tipo de representación. Cada campo constituye lo que, siguiendo lo estipulado en la ISO 12620, se denomina data category, categoría de datos. En esta norma no se especifica la estructura de cada una de las entradas terminográficas, es decir, no se especifican las relaciones que se establecen entre los distintos campos que integran cada entrada. Según el CLS Framework, en una base de datos terminográfica las categorías de datos se pueden agrupar en tres grandes grupos:

- información sobre el término;
- información contextual, etc.;
- información administrativa

Por tanto el CLS Framework aporta, en primer lugar, un marco de trabajo para estructurar dichos campos con una base teórica y aplicada cuyos pilares se encuentran en una visión de la terminología basada en el concepto u onomasiológica y, en segundo lugar, facilita la proyección de los campos que integran las bases terminológicas hacia las data categories, extraídas de la ISO 12620.

Como ya hemos mencionado, una de las aplicaciones del CLS Framework es el intercambio terminológico. Éste se consigue a través del estándar MARTIF (ISO 12200: 1999). Se trata de un formato independiente diseñado estrictamente para el intercambio de datos terminológicos en el que se contempla todo el conjunto de sistemas de bases de datos terminográficas, desde la más simple a la más compleja y cubre tanto la gestión prescriptiva como la descriptiva. Se pretende que MARTIF se convierta en interlingua terminológica, garantizando el intercambio entre usuarios (individuos o corporaciones) que utilizan software y hardware distintos (Thurmair et al 1999: 238). Este aparente fracaso a la hora de contemplar también el enfoque lexicográfico es totalmente intencionado ya que se quiere responder a una demanda real de mercado, entre otras finalidades.

Los orígenes de MARTIF se remontan a la Text Encoding Initiative (Melby et al. 1994). Desafortunadamente, la intención original de mantener una estrecha coordinación entre los diferentes grupos participantes en la iniciativa llegó a su fin cuando uno de los grupos fracasó en una de las tareas asignadas. Aún así, los creadores de MARTIF son, en su mayoría, integrantes de grupos de terminología en funcionamiento en la actualidad y están involucrados de forma activa en la creación de aplicaciones para los sistemas de traducción automática que tienen como usuario al traductor.

En la actualidad, las propuestas para el intercambio de la información en ambientes integrados son mucho más prometedoras. MARTIF ha sido aceptado como estándar internacional y muchos programadores están presionando para que se lleve a cabo la implementación de éste en sus respectivos entornos.

Además de MARTIF, el CLS Framework incluye una aplicación relacional, Reltef™ (Hardman 2000). Se trata de un diagrama relación-entidad que sirve para la recuperación de datos y mantenimiento de las bases de datos. Al ser tanto MARTIF como Reltef™ consistentes con la estructura global especificada por el CLS Framework y las data categories de la ISO 12620, es posible escribir rutinas de conversión bidireccionales entre ambos con apenas pérdida de información.

En la aplicación OntoTerm® (véanse §4.5 y capítulo 5), el sistema gestor de base de datos terminográfica que usamos en nuestro trabajo de investigación, se acoge la iniciativa de estandarización y se implementa MARTIF utilizando las categorías de datos (ISO 12620), por un lado y el modelo de datos ReltefTM, por otro. Mientras que en la actualidad la mayoría de los sistemas gestores de bases de datos terminográficas permiten la exportación de datos a formato texto o texto enriquecido (RTF), casi ninguno permite la importación de datos de otras fuentes que no sean ficheros en su propio formato "propietario" (Pérez Hernández 2000: 279). OntoTerm® responde así a una organización sistemática y almacenaje de información compleja tanto especializada como no especializada, y adopta los recursos aportados por organismos internacionales de estandarización para garantizar la reutilización e intercambio de dicha información y la consistencia y coherencia interna de los datos (Pérez Hernández 2000: 298).

Anterior   I  Siguiente   I  Índice capítulo 4   I   Índice General


ISSN: 1139-8736
Depósito Legal: B-35783-2001