ISSN: 1139-8736
Depósito Legal: B-37271-2002
Copyright: © Silvia Montero Martínez

4.4.2.1 MikroKosmos

Mikrokosmos58 (MK) es un sistema de traducción automática basado en el conocimiento que se ha desarrollado en el Computing Research Laboratory de la Universidad de Nuevo Méjico junto con el Departamento de Defensa de EE UU.

Se centra en la traducción de textos sobre la fusión y adquisición de empresas y las lenguas de trabajo son español, chino e inglés (Viegas et al. 1999). El sistema está estructurado en torno a una serie de lexicones específicos para cada lengua y una ontología que juega un papel decisivo en este sistema, ya que constituye una representación del conocimiento independiente de la lengua a través de un conjunto de conceptos muy estructurado que sirve para representar el significado de un lexema o frase tanto de la lengua origen como de la lengua meta (Moreno et al. 2000: 2). Esta ontología funciona como nexo de unión entre las distintas lenguas y contiene aproximadamente 5.000 conceptos. Está disponible en formato Lisp-like (versión de enero de 1997) por lo que para reutilizar esta fuente es necesario contar con un sistema como la herramienta original de MK. Para el uso de esta ontología en la aplicación ONTOTERM®, se optó por convertir el archivo original en una BD relacional de forma semi-automática (Moreno et al. 2000: 2) 59 que posteriormente se podría editar y consultar, entre otras funciones, de manera coherente y fácil a partir de la nueva plataforma (§4.6.1 ).

En la elaboración de la ontología de MK, las decisiones se toman en función de las necesidades; la adquisición de conceptos, el punto más polémico de la semántica ontológica, se rige por unos parámetros pragmáticos: se incluyen aquellos conceptos que son relevantes para la tarea propuesta. Así, además de contener una serie de conceptos generales, se van añadiendo otros específicos que facilitan la traducción automática de los documentos especializados. Esta adquisición de conceptos se va sometiendo a una evaluación global llevada a cabo por todas las partes implicadas enfatizándose así la negociación entre ellas y el concepto de situated ontology u ontología negociada (Mahesh 1996: 48; Mahesh y Nirenburg 1995).

A pesar de que este sistema fuera diseñado para traducir un tipo específico de textos, el hecho de que no se impusiera restricción alguna en el contenido de los textos de entrada obligó a los creadores de MK a construir una ontología en la que se incluyera un gran número de conceptos generales, y a representar muy variados objetos del mundo, las propiedades de dichos objetos y los eventos en los que dichos objetos se relacionan entre sí o con sus propiedades. Así, tal como se observa en la Fig. 4.7 los conceptos se estructuran en torno a tres categorías ontológicas básicas, EVENT, OBJECT y PROPERTY (§2.3.3.1):

Figura 4.7: Arquitectura base de la ontología Mikrokosmos

Dada la transdisciplinariedad del ámbito de investigación de ONCOTERM, el cáncer y su tratamiento, la ontología debía reflejar una estructuración conceptual muy rica en la que estuvieran incluidos conceptos bastante genéricos y de ramas del saber diferentes, como por ejemplo, las partes del cuerpo humano o las relaciones causa-efecto, ya que si se limitaba a conceptos específicos sobre oncología, muchas de las propiedades y relaciones de los objetos y eventos no iban a poder representarse, al hacer referencia bien a conceptos de otros dominios de especialidad bien a conceptos más genéricos.

En la ontología de MK se trabaja desde una aproximación transcategorial (Viegas et al. 1999: 12), es decir, las categorías sintácticas y las categorías ontológicas, conceptuales o semánticas no se relacionan de manera automática. Aunque muchos verbos pertenezcan a la categoría EVENT y muchos sustantivos estén representados por conceptos que pertenecen al árbol de los OBJECT, no siempre es así; por ejemplo, CANCER y TRATAMIENTO son categorías conceptuales que pertenecen a los EVENT, a pesar de ser sustantivos, porque se entiende como procesos. Tal como veíamos (§2.3.3.1), según Mahesh (1996: 17) los objetos y eventos son los que se han venido a denominar stand-alone concepts, es decir, conceptos que no dependen de otros para su ubicación conceptual, en otras palabras son autónomos conceptualmente. En cuanto a las propiedades, éstas son non-stand-alone concepts y se dividen en relaciones y atributos. La jerarquía resultante es una red semántica de marcos, cada uno de los cuales posee una rica estructura interna que le permite una gran expresividad.

La ontología puede ser considerada como una entidad autónoma en el sentido de que se define a sí misma. Por ejemplo, todas las propiedades adscritas a los objetos o eventos están a su vez definidas en algún punto de la rama propiedad. Por otro lado, las propiedades de los objetos y eventos se heredan a lo largo de los sucesivos niveles de la jerarquía; por ejemplo, todos los EVENTs heredan por omisión el requerimiento de un AGENTE y en el caso del término 'surgeon', éste hereda propiedades de 'physician', 'human' y de 'vertebrate'. Pero esta herencia puede ser negativa, es decir, ha de ser posible bloquear algún elemento para que no herede una propiedad determinada. Éste es el caso de los PASSIVE-COGNITIVE-EVENTs y los INVOLUNTARY-PERCEPTUAL-EVENTs que no requieren un agente que heredarían de COGNITIVE-EVENT y de PERCEPTUAL-EVENT, respectivamente.

El concepto de ontología negociada encaja con nuestra concepción terminográfica, ya que creemos que es la única forma de llegar a un punto de encuentro. La clave está en la negociación y posible intercambio de conocimiento, tanto experto como no experto, entre distintas entidades: bases de datos, facultativos de la salud, documentalistas, terminólogos/terminógrafos, ingenieros del conocimiento o traductores entre otros. En el enfoque de una ontología negociada, el desarrollo de la misma no puede estar condicionado o controlado por las normas de la especificación léxica de la semántica de cada lengua; de ahí que aboguemos por un enfoque que sea independiente-de-la-lengua y que, al mismo tiempo, esté orientado a la aplicación concreta que nos ocupa, la gestión terminográfica bilingüe en el subdominio oncológico. Según Moreno et al. (2000:1) este sistema de representación reune las características necesarias para el terminógrafo: i) una utilidad que le permite representar sistemáticamente la información conceptual asociada a los términos: los conceptos, sus características y las relaciones que se dan entre ellos; ii) un sistema explícito y formal de representación que permite la reutilización y es de fácil manejo para el terminólogo; iii) un sistema que facilita la representación de la multidimensionalidad de los conceptos; iv) la posibilidad de representar relaciones interdisciplinares, ya que los conceptos de un dominio con frecuencia están vinculados a otros de dominios cercanos; v) un sistema de representación que garantiza su reutilización siendo independiente en sí mismo aunque esté vinculado a una o más bases terminológicas.


Notas

58 Se puede encontrar información más detallada sobre el proyecto Mikrokosmos en http://crl.nmsu.edu/Research/Projects/mikro/index.html.

59 Se puede encontrar información más detallado sobre este proceso en Moreno et al. (2000).


Índice general I Índice Capítulo 4  I Siguiente


ISSN: 1139-8736
Depósito Legal: B-37271-2002
Copyright: © Silvia Montero Martínez