ISSN: 1139-8736
Depósito Legal: B-35783-2001

5.2 Adquisición y modelado conceptual para la estructuración definicional

El proceso que hemos seguido para la adquisición y modelado del conocimiento experto es muy difícil de seccionar en módulos individuales y secuenciales, ya que estas dos tareas responden a un proceso cognitivo complejo, no-lineal y con un feedback continuo. Se trata de un proceso circular, que supone una continua evaluación y, que, a su vez, alterna una postura analítica sobre los detalles específicos de cada categoría conceptual y de cada término, con una sintética sobre las regularidades y estructuras existentes. Somos conscientes, pues, de que adquisición y modelado conforman un mismo proceso, divisible exclusivamente en aras de una mayor claridad expositiva.

En lo que se refiere a la adquisición del conocimiento experto, hemos acudido a fuentes de documentación entre las que destacamos consultas a obras en soporte papel e informático de carácter especializado y consultas a especialistas. La adquisición y el modelado del conocimiento experto se ha llevado a cabo gracias a una extracción de información especializada a partir de términos en las dos lenguas de trabajo, inglés y español, basándonos en estudios de córpora especializados1 y tomando como pilares:

En lo que se refiere a la tarea de la estructuración o modelado del conocimiento, que se ha ido realizando de manera paralela a la de adquisición del conocimiento experto, nos hemos establecido como ejes de referencia los siguientes:

La organización conceptual está en continuo cambio. La red ontológica sigue alimentándose con más conceptos que enriquecen la estructura global y dibujan con mayor exactitud los distintos aspectos del dominio oncológico, lo que implica que tanto la adquisición como el modelado del conocimiento son tareas que no finalizan nunca. Hasta la fecha existen un total de más de 8.000 conceptos de los que tan sólo 4.700, pertenecían a la estructura inicial de Mikrokosmos. Entre estos nuevos conceptos se encuentran también relaciones específicas no jerárquicas en su mayoría así como atributos pertenecientes a los conceptos autónomos del dominio médico y del subdominio oncológico, en particular.

Según la estructura de OntoTerm®, no se puede incluir un término sin haber sido asignado previamente a un concepto, a diferencia del concepto que se puede añadir sin tener que establecer ninguna relación con el término al que hace referencia. Por esta razón, además de una justificación lógica basada en la perspectiva onomasiológica de todo estudio terminográfico, el punto de partida metodológico (aunque no siempre cronológico) es la ubicación conceptual en la ontología base. El proceso de asignación de un lugar conceptual forma parte del modelado conceptual, y se realiza por medio de inferencias a partir de las distintas fuentes de documentación consultadas así como a partir de la explotación intensiva de un corpus textual informatizado recopilado específicamente para este proyecto3. Con la ayuda del asesoramiento experto, del conocimiento de la aplicación OntoTerm® y del subdominio oncológico, se asigna un lugar al concepto dentro de la estructura base del subdominio oncológico. Si el concepto-en-evaluación responde a una especificación de otro concepto ya existente, se ubica como hijo de éste. De forma casi simultánea, al igual que se ha establecido la primera relación y la más importante, la de hiponimia, se establecen el resto de relaciones que son en su mayoría no-jerárquicas.

El concepto, pues, se almacena en un archivo de extensión *.ont, gestionado por el editor de la ontología, Ontology Editor. Sea cual sea la categoría ontológica a la que pertenezca, OBJECT, EVENT o PROPERTY (§4.3.2), se ha de vincular, obligatoriamente, al concepto inmediatamente superior, por medio de la relación de hiponimia y, de forma opcional, se puede vincular por medio de relaciones de meronimia o de tipo no-jerárquico, a otros conceptos próximos en la estructura conceptual. En el caso de ser un concepto perteneciente a la categoría ontológica de PROPERTY, si se trata de una RELATION, además habrá que añadir su relación inversa y ubicarla también en la estructura jerárquica general de las RELATIONs. Si por el contrario, se trata de un ATTRIBUTE habrá que vincular al objeto una constante, bien escalar, entre cuyos valores podemos encontrar números, o bien literal, entre cuyos valores encontramos colores, por ejemplo. Lo ideal es que cada concepto cuente con un abanico de links a otros conceptos que fluctúe entre un número de 10 y 15 (Mahesh 1996: 42).

Antes de pasar a ver algunos ejemplos concretos de modelado del conocimiento en nuestro estudio, queremos analizar uno de los problemas al que nos hemos enfrentado y que puede llevar a error en la lectura de la base de datos ontológica de OntoTerm®: el término de concepto. No debemos olvidar en ningún momento que, lo que delimita al concepto es su situación en la estructura conceptual y no el nombre que recibe al insertarse en la ontología. Qué duda cabe que todo concepto tiene un nombre normalmente representativo de la parcela del conocimiento que formaliza. Sin embargo, no se debe confundir el término, formalización de uno o varios conceptos, en una lengua determinada, para su uso en una situación comunicativa, con el nombre que recibe el concepto, una unidad léxica, en una sola lengua, normalmente la de trabajo de los terminógrafos. En el programa OntoTerm®, dividido en el módulo conceptual y el terminográfico, el nombre del concepto recogido en *.ont, siempre formará parte del vocabulario de la ontología, de la terminología ontológica, aunque no tiene por qué ser un término, recogido en *.otb, la TermBase. Los términos (ontológicos) en la *.ont siempre están en inglés; en muchas ocasiones, no se corresponden con el ensamblaje léxico convencional y no cuentan tampoco con un paralelismo formal en el corpus especializado. Ejemplos de términos ontológicos, en versales, y las categorías a las que pertenecen, en mayúscula, son los siguientes:

DISEASE-EVENT EVENT

MEDICAL-ROLE OBJECT

INVERSE-DISEASE-EVENT-OBJECT-RELATION PROPERTY: RELATION

AFFECTED-POPULATION-SEX PROPERTY: ATTRIBUTE: LITERAL

RECOVERY-RATE PROPERTY: ATTRIBUTE: SCALAR

Tabla 5. 1: Ejemplos de términos ontológicos y categorías a las que pertenecen

Por el contrario, los términos (léxicos) en la *.otb, entre otras características están en las dos lenguas de trabajo: inglés y español, y cuentan con un paralelismo formal en el corpus especializado. La categoría ontológica PROPERTY no tiene, por regla general, correspondencia terminológica, si bien se refleja en la formalización de la definición del término (§5.3 y §5.4). En la siguiente tabla observamos algunos ejemplos de términos léxicos, en cursiva; de formalización de PROPERTY en la definición, en cursiva y paréntesis, y de los conceptos a los que pertenecen, en versales:

cancer/cáncer DISEASE-EVENT

oncologist/ oncólogo MEDICAL-ROLE

(has side effect/ tiene como efecto secundario) INVERSE-DISEASE-EVENT-OBJECT-RELATION

(female-male population are the most affected by/ afecta más a la población femenina-masculina) AFFECTED-POPULATION-SEX

(the recovery-rate is 40%/ la tasa de recuperación es de un 40% ) RECOVERY-RATE

Tabla 5. 2: Ejemplos de términos léxicos; formalización de PROPERTY y conceptos a los que pertenecen


NOTAS

1 Remitimos desde aquí al exhaustivo y riguroso trabajo de investigación sobre el uso de córpora de Pérez Hernández (2000): Explotación de los córpora textuales informatizados para la creación de bases de datos terminológicas.

2 Queremos agradecer la valiosísima ayuda del responsable del diseño e implementación del sistema gestor de base de datos terminográfica. Sin sus explicaciones, su pronta respuesta a todas las dudas surgidas en la realización de esta tesis así como la diligencia con la que ha ido implementando todas las sugerencias, este trabajo de investigación habría sido irrealizable.

3 El uso de córpora para la extracción de información en el marco de nuestro proyecto, se detalla en Pérez Hernández (2000).

Anterior   I  Siguiente   I  Índice capítulo 5   I   Índice General

ISSN: 1139-8736
Depósito Legal: B-35783-2001