ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez

5.2.2 Bases de datos y bases de conocimiento

Los investigadores y estudiosos de este campo han fijado diferencias concretas en cuanto a metodologías, técnicas de implementación, usos, contenidos y objetivos entre ambos sistemas. De hecho, la distinción entre base de datos y base de conocimiento, así como la distinción paralela entre modelo de datos y esquema de representación ha sido objeto de debate durante mucho tiempo entre estas comunidades de científicos. Un modelo de datos se asocia con una base de datos, mientras que su correspondiente en una base de conocimiento es el denominado esquema de representación. Existen otras distinciones importantes que mencionamos a continuación.82

Las bases de datos son anteriores en el tiempo a las bases de conocimiento. Nacieron a mediados de la década de los 50 y desde entonces han sido una de las principales herramientas que los ordenadores ofrecen. A principios de los 60 se desarrollaron las primeras bases de datos estructuradas jerárquicamente y poco tiempo después, las bases de datos de red. A finales de los 60, Ted Codd, investigador de IBM, desarrolló un lenguaje de programación de propósito general que denominó programación relacional, basado en la teoría de conjuntos y la lógica, y que contenía el germen de lo que había de ser el más extendido de los sistemas de bases de datos hasta la fecha, las bases de datos relacionales.

El objetivo primero de una base de datos es, como su nombre indica, almacenar grandes cantidades de datos organizados siguiendo un determinado esquema o modelo de datos que facilite su almacenamiento, recuperación y modificación.

Por su parte, las bases de conocimiento (KB: Knowledge Base) pertenecen a una etapa muy posterior. Surgieron a partir de la investigación en IA como respuesta a las necesidades que las aplicaciones de esta disciplina planteaban. Las bases de conocimiento son la evolución lógica de los sistemas de bases de datos tradicionales, en un intento de plasmar no ya cantidades ingentes de datos, sino elementos de conocimiento (normalmente en forma de hechos y reglas) así como la manera en que estos elementos han de ser utilizados. También se les trata de dotar de conocimiento sobre sí mismas, es decir, una KB ha de "saber lo que sabe". Por ejemplo, ante una consulta determinada, una base de datos accederá a los datos almacenados en ella y dará una respuesta afirmativa o negativa, independientemente de que tenga o no la información relevante; en cambio, una KB respondería "sí", "no" o "no lo sé", en el caso de carecer de todos los datos pertinentes a la consulta.

Se dice que una base de datos almacena únicamente hechos, que son un reflejo de universo, llamado Universo de Discurso (UoD) determinado. Las funciones que el gestor de base de datos se limita a facilitar son, fundamentalmente, las de edición y consulta de los datos. Una base de conocimiento, por otra parte, puede almacenar, además de hechos, un conjunto de reglas que se sirven de esos hechos para obtener información que no se encuentra almacenada de forma explícita. El tipo de base de conocimiento al que se dota de una considerable capacidad de deducción a partir de la información que contiene se denomina sistema experto.

Ambos sistemas de información cuentan con sus correspondientes gestores para simplificar al administrador las tareas comunes de mantenimiento: el sistema gestor de bases de datos (DBMS: Database Management System) y el sistema gestor de bases de conocimiento (KBMS: Knowledge Base Management System). También encontramos diferencias sustanciales en este aspecto. Básicamente los DBMSs actuales se encuentran perfectamente estandarizados, ofreciendo un número de características y metodologías comunes que posibilitan la comunicación entre diversos tipos y productos comerciales. La comercialización de los KBMSs es prácticamente anecdótica, y los esfuerzos en cuanto a su estandarización se están produciendo en estos momentos, en lo que se ha dado en denominar KIF (Knowledge Interchange Format) (Genesereth & Fikes 1992).

La diferencia más importante entre ambos tipos de sistemas de información es sin duda el modelo de datos en el que se basan (Brodie & Mylopoulos 1986). Los modelos de datos aportan la base conceptual para diseñar aplicaciones que hacen un uso intensivo de datos, así como la base formal para las herramientas y técnicas empleadas en el desarrollo y uso de sistemas de información.

Con respecto al diseño de bases de datos, el modelado de datos puede ser descrito así (Brodie 1984:20): dados los requerimientos de información y proceso de una aplicación de uso intensivo de datos (por ejemplo, un sistema de información), construir una representación de la aplicación que capture las propiedades estáticas y dinámicas requeridas para dar soporte a los procesos deseados (por ejemplo, transacciones y consultas). Además de capturar las necesidades dadas en el momento de la etapa de diseño, la representación debe ser capaz de dar cabida a eventuales futuros requerimientos. Un modelo de datos 83 es por tanto una colección de conceptos bien definidos matemáticamente que ayudan a expresar las propiedades estáticas (entidades, propiedades y relaciones) y dinámicas (operaciones con las entidades, propiedades o relaciones) de una aplicación con un uso de datos intensivo.

En lo que respecta a las bases de conocimiento, la necesidad de una notación precisa para representar el conocimiento se hizo evidente en el ámbito de la IA casi desde el principio, sin duda debido a la experiencia acumulada en el terreno de las bases de datos. Esta notación recibe el nombre de esquema de representación en el entorno de las bases de conocimiento. Ahora entran en juego los términos que incluíamos en nuestra definición de concepto, que trataremos de explicar y clarificar, porque son cruciales para entender el enfoque que proponemos a la gestión terminológica.

En este sentido, resulta práctico considerar una base de conocimiento como un modelo de un mundo/empresa/sección de la realidad (Mylopoulos & Levesque 1984). Hemos de considerar el mundo/universo como una colección de individuos o entidades y una colección de relaciones que existen entre esos individuos. La colección de individuos que conforman el universo a representar y las relaciones que éstos mantienen constituye un estado, y puede haber transformaciones de estado que causan la creación o modificación de individuos o de las relaciones entre ellos. Podemos clasificar los esquemas de representación dependiendo de cuál sea el punto de partida:

La utilidad de un determinado esquema de representación se centra en dos aspectos (Obermeier 1989:23):

Los esquemas de representación procedimentales apenas han tenido repercusión en lo que respecta a la representación de información léxica, por lo que no serán tratados en este trabajo. Los esquemas de representación lógicos durante mucho tiempo fueron considerados como la respuesta a todas las necesidades de los sistemas artificiales de comprensión del lenguaje natural, debido principalmente a la enorme repercusión del trabajo del gran lógico y matemático Richard Montague. En la actualidad, sin embargo, son pocos los enfoques que pretenden utilizar la lógica como único recurso, aunque ésta se encuentra embebida en la mayoría de los sistemas de representación y proceso de NLP.

El tipo de esquema de representación del conocimiento que ha disfrutado de mayor aceptación, tanto a nivel teórico como de implementación, son sin duda las redes semánticas, sobre todo porque tienen una adecuación psicológica importante. De este modo, investigadores de muy diversos ámbitos han hecho uso de las mismas, ya sea con implementaciones reales o sólo a nivel teórico para explotar y exponer hipótesis filosóficas, psicológicas, lingüísticas, etc.

La idea que defendemos es que deberíamos aprovechar esta experiencia acumulada para emplearla en la creación de representaciones conceptuales que, además de servir de base a la gestión terminológica, a la que tienen mucho que aportar, garanticen la integración de las bases terminológicas con sistemas más amplios de gestión del conocimiento, de modo que los recursos (terminológicos) creados para una empresa concreta puedan ser reutilizados en empresas de mayor envergadura que requieran de conocimiento especializado sobre un campo de especialidad concreto.

Para que esto pueda hacerse realidad, sin embargo, debemos comprender mínimamente lo que es un sistema basado en el conocimiento y las opciones que se plantean a la hora de elegir uno. Los sistemas de conocimiento modernos se basan en su mayoría en los sistemas de redes semánticas tradicionales de la IA. A continuación hacemos una breve exposición de las características fundamentales de éstos, con el objeto de comprender las premisas y conceptos con los que habremos de trabajar, así como lo que supone adoptar un enfoque terminológico basado en el conocimiento real.


Notas

82 Moreno Ortiz (1997) ofrece una explicación muy detallada de las características que diferencian las bases de datos y las bases de conocimiento.

83 Los modelos de datos clásicos son tres: el jerárquico, el de red y el relacional. De ellos, es sin duda el modelo relacional de datos el que ha demostrado mayor flexibilidad, eficacia y fiabilidad. En él se basan aproximadamente el 95% de las bases de datos y sistemas de información en funcionamiento hoy en día. El resto se reparte entre sistemas heredados (jerárquicos), las novedosas bases de datos orientadas al objeto y los modelos de datos de propósito específico. Estos últimos, también llamados "propietarios", son los empleados por la mayoría de los gestores de bases de datos terminológicas comerciales actuales.


Índice General I Índice Capítulo 5 I Siguiente

ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez