ISSN: 1139-8736
Depósito Legal: B-35510-2000

4.5 Conclusiones y discusión

En este capítulo hemos llevado a cabo un repaso extensivo de todo lo relacionado con la representación y gestión de información. En lugar de restringir nuestro estudio a las metodologías específicamente destinadas a la representación léxica, hemos preferido enmarcar ésta en el más amplio campo de la representación del conocimiento en general, con el objetivo de fundamentar nuestra elección de un determinado sistema de información y porque pensamos que es la única manera de entender en su justo término un buen número de términos que muy a menudo aparecen utilizados de forma imprecisa o inexacta.

En primer lugar hemos tratado de diferenciar dos tipos de sistemas de información: las bases de datos y las bases de conocimiento. Ello nos condujo a analizar los diversos tipos de modelos de datos y esquemas de representación, que es lo que en realidad determina la calificación de un sistema de información como base de datos o base de conocimiento, ya que en muchas ocasiones estos dos tipos de sistemas pueden compartir metodologías y objetivos.

A la hora de valorar la elección de un sistema de información, por tanto, tendremos que valorar los siguientes parámetros:

Por tanto, distintos tipos de sistemas de información son apropiados para distintos tipos de aplicaciones o para representar diversos tipos de información. En el siguiente capítulo, donde describimos nuestra implementación mostraremos el uso que hemos hecho de los dos sistemas de información que hemos elegido: el modelo de datos relacional para la base de datos léxica y el esquema de marcos para la ontología.

Esta segunda elección era prácticamente la única elección posible, puesto que nuestra implementación reutiliza una ontología, la del sistema Mikrokosmos, que fue construida este esquema, que ofrece funcionalidades, como la herencia múltiple, que difícilmente pueden ser recreadas en otro tipo de sistema.38

La elección de un RDBMS para almacenar la información léxica se centra en varias razones. Las razones técnicas, que se refieren a la robustez, fiabilidad y conectividad de este tipo de sistemas serán expuestas en el capítulo siguiente, donde expondremos el modelo relacional de datos en detalle. Esta elección resulta la más apropiada para representar el tipo de información que el modelo lingüístico-lexicográfico genera: grandes cantidades de información (léxica) detallada.

También es adecuado para la práctica lexicográfica común a la que nuestro sistema pretende dar soporte, puesto que podemos aprovechar sus funcionalidades en cuanto a integridad de datos, control de acceso, etc. para desarrollar un marco de homogéneo y seguro que facilite su uso a usuarios no expertos mediante interfaces gráficos. En el siguiente capítulo veremos cómo hemos puesto en práctica todas estas funcionalidades.

Creemos que el modo más adecuado es usar medios de representación estándar, con lo que se consigue la independencia de los datos y garantizamos la conectividad con otros sistemas de información..

Finalmente, la decisión de no utilizar un sistema de representación específico para la información léxica se debe fundamentalmente a las siguientes razones:

  1. Precariedad de las implementaciones existentes. Como hemos visto, las aplicaciones que soportan el trabajo con estos formalismos (PATR, DATR, ALE) no están aún lo suficientemente afianzadas como para ser utilizadas en aplicaciones reales. Su utilización real no va más allá de la investigación de teorías gramaticales determinadas.
  2. Pérdida de independencia de los datos. Como hemos visto, los formalismos basados en la unificación no hacen distinción entre representación y proceso. La gramática es en sí una representación del conocimiento léxico.
  3. Como consecuencia de lo anterior, la adopción de uno de estos formalismos específicos conlleva la obligada adopción de un formalismo gramatical acorde, es decir, basado en la unificación. Si bien pensamos que este tipo de formalismos gramaticales son hoy por hoy la mejor apuesta en cuanto a procesamiento del lenguaje natural, una premisa importante desde el principio en este trabajo ha sido evitar el compromiso con teoría gramatical alguna: las teorías se extinguen, la información permanece.
  4. Pensamos que es posible generar este tipo de representaciones, quizá de forma semiautomática, a partir de información léxica en estado puro, es decir, carente de reglas de restricciones gramaticales o reglas.

NOTAS

  1. Hemos barajado la posibilidad de utilizar un ODBMS para almacenar esta información pero descartamos la idea debido a la dificultad que estos sistemas ofrecen para gestionar la herencia múltiple de propiedades, y sobre todo por la nula estandarización y conectividad existente en este tipo de gestores.

 

Anterior  I  Siguiente  I  Índice capítulo 4  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-35510-2000
Copyright © 2000 Antonio Moreno Ortiz