ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez

5 Representación de la información terminológica en OntoTerm®: un gestor de base de datos terminológica basado en el conocimiento

Además de extraer y recopilar la información terminológica, la misión fundamental del terminógrafo es la de representar, es decir, hacer explícita, la información terminológica del ámbito de especialidad que le ocupa. En la realidad cotidiana, esta representación puede ser tan detallada o tan básica como exija el trabajo en curso o la finalidad última que se persigue con la recopilación terminológica:

Representation is about making things explicit, about resolving ambiguities and above all, particularly in the context of artificial intelligence, about creating a surrogate of a class of things that exist in the real world on a computer system.  POINTER Report (sección 4: 97)

La forma en la que se representa la información recopilada por los terminógrafos es un aspecto vital de la gestión terminológica y puede también condicionar los usos (y usuarios) de un repositorio terminológico. Conscientes de su importancia, en este capítulo vamos a centrar nuestra atención en la representación de la información terminológica, organizando el capítulo en tres grandes bloques. En el primero (sección 5.1), veremos tres aspectos que encontramos comúnmente en las publicaciones teóricas de terminología, en lo que se refiere a la representación de la información terminológica: la descripción de los conceptos, las relaciones entre conceptos (sistemas conceptuales) y las definiciones. Veremos, por tanto, lo que tradicionalmente se ha considerado como aspectos básicos en la representación del conocimiento en el ámbito escrito de la terminología. Veremos que, a pesar de las constantes referencias a la sistematización conceptual como paso previo a la recopilación terminológica, los tipos de representación que hasta hace relativamente poco se han propuesto en la teoría terminológica son bastante simples a la vez que poco reutilizables, y se prestan muy poco a la consistencia y la formalización.

En el segundo bloque (secciones 5.2, y 5.3) exploramos la posibilidad de integrar la representación del conocimiento terminológico en el ámbito general de la representación del conocimiento (Knowledge Representation: KR), rama de la Ingeniería del Conocimiento y la Inteligencia Artificial en la que se han desarrollado mecanismos formales y altamente estructurados de representación del conocimiento. Pensamos que la adopción de alguno de estos mecanismos de representación beneficiaría en gran medida la calidad de los repositorios terminológicos y puede servir para plasmar de forma explícita la orientación onomasiológica de la terminografía. En esta línea, propondremos uno de estos mecanismos de representación, una ontología de conceptos, como medio para representar el conocimiento que el terminógrafo adquiere sobre el área de especialidad de modo formalizado y reutilizable. Además, la estructuración del dominio de especialidad por medio de una ontología de conceptos permite que se haga patente la perspectiva desde la que se aborda el trabajo terminográfico y los criterios seguidos en el establecimiento de jerarquías, relaciones conceptuales y atributos asignados a los conceptos.

En la sección 5.3 mostramos la ontología de la que partió inicialmente nuestro trabajo de investigación, la ontología del proyecto Mikrokosmos (Beale, Nirenburg & Mahesh, 1995; Mahesh & Nirenburg 1995a,b). La extensión de esta ontología para dar cabida a la representación de información conceptual sobre la oncología ha sido posible gracias al sistema gestor de base de datos terminológica basada en el conocimiento con el que hemos contado,79 denominado OntoTerm™ ya que dicha aplicación nos ha permitido introducir, modificar y consultar la ontología, así como su posterior desarrollo. En este sistema (que describimos brevemente en el apartado 5.4), la representación de información atañe a los tres aspectos fundamentales de las unidades terminológicas. Es decir, se representa de forma explícita :

  1. información conceptual del ámbito de especialidad;
  2. información lingüística relevante a la unidad terminológica;
  3. información sobre el uso que los especialistas del área hacen de los términos, tal y como se desprende del estudio de los textos que éstos producen o por medio de consultas específicas con especialistas.

Este sistema gestor se compone de dos módulos principales: el editor de ontologías y el editor de bases de datos terminológicas. El primer módulo permite la representación de la información conceptual, mientras que en el segundo se representa la información terminológica de carácter lingüístico, de uso y administrativa.

Este sistema, además, permite que la información representada cumpla dos características que nos parecen esenciales para una buena gestión terminológica:

  1. estar organizada de forma sistemática;
  2. contar con un formato estándar de representación, que asegure, no sólo la reutilización y el intercambio de la información, sino también la consistencia y coherencia interna de los datos.

El tercer bloque de este capítulo (secciones 5.5 y 5.5.1), versará sobre las categorías de datos de una base terminológica y detallaremos el estándar de representación de información terminológica adoptado en nuestro trabajo de investigación.


Notas

79 Este sistema gestor de base de datos terminológica ha sido diseñado e implementado por el Dr. Moreno Ortiz, miembro del grupo de investigación OncoTerm. Queremos hacer constar una vez más nuestro agradecimiento al Dr. Moreno, por habernos permitido participar activamente en el diseño de dicho sistema y por la diligencia con la que ha ido implementando todas nuestras sugerencias. También queremos agradecerle el tiempo dedicado a explicar y aclararnos algunos de los temas incluidos en este capítulo (especialmente las secciones 5.2.2, 5.2.3 y 5.5.4).


Índice General I Índice Capítulo 5 I Siguiente

ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez