ISSN: 1139-8736
Depósito Legal: B-35510-2000

4 Representación del Conocimiento y Representación Léxica

Hasta ahora hemos mencionado un buen número de términos tales como base de datos, base de conocimiento, esquemas de representación, modelos de datos, etc., sin haber ofrecido una descripción adecuada de lo que éstos denotan. Puesto que el objetivo primero de este trabajo es el diseño e implementación de un sistema de almacenamiento de información léxica, deberíamos estudiar en profundidad cuáles son los sistemas candidatos, sus características y posibles aplicaciones. También hemos de fundamentar la elección que hemos realizado en el diseño de nuestro lexicón computacional y nuestra ontología, y mencionar otras posibles opciones.

La labor que nos proponemos llevar a cabo en este capítulo es recopilar un conjunto de criterios bien fundamentados que nos permitan realizar una elección en consonancia con nuestras necesidades de representación y almacenamiento planteadas en los Capítulos 1, 2 y 3. El o los sistemas candidatos habrán de cumplir una serie de requisitos fundamentales, que podríamos resumir en los siguientes:

Concretamente, en el presente capítulo nos proponemos desarrollar los siguientes puntos:

Hablando en términos muy generales, los dos tipos de sistemas de representación computacionales de que disponemos hoy en día son las bases de datos y las bases de conocimiento. Cuando hablamos de representación de conocimiento, en muchas ocasiones nos estamos refiriendo a cualquiera de estos dos tipos de sistemas. Sin embargo, existen diferencias sustanciales entre ambos, pues responden a necesidades, metodologías y aplicaciones diferentes. Esta distinción no es fácil de exponer. Los expertos en este campo han organizado multitud de conferencias sobre este tema con el objeto de alcanzar estándares que sirvan para el desarrollo de sistemas funcionales.

Las bases de conocimiento son aplicaciones de IA relativamente novedosas. La mayoría han ido apareciendo desde la segunda mitad de los años 80, por lo que tan sólo recientemente se han alcanzado criterios definitorios de lo que son, cuáles son sus metodologías y objetivos y su relación con otros sistemas de información. Por otro lado, las bases de datos cuentan con una larga tradición en el mundo de los sistemas de información, no existiendo duda de cuáles han de ser sus aplicaciones, objetivos y metodologías. Sin embargo, no dejan de aparecer sistemas de bases de datos que presentan grandes diferencias con respecto a los sistemas más establecidos. En el siguiente apartado tratamos de elucidar estos puntos.

Nuestro objetivo fundamental es exponer las razones que nos han llevado a la adopción de un determinado sistema de representación. En multitud de ocasiones se han adoptado metodologías que después no han podido responder a las necesidades de representación de sus implementadores; en otras, aunque el sistema de representación escogido era adecuado para esas necesidades, la aplicación que después se ha hecho de la información almacenada no ha sido la deseada, por tratarse de sistemas autónomos sin posibilidades de conexión con otros tipos de aplicaciones (es el caso de la mayoría de los sistemas basados en conocimiento). El sistema de representación que escogeremos habrá de ofrecer todas las garantías en cuanto a posibilidades de representación léxica y en cuanto a compatibilidad con los lenguajes de programación más potentes, que serán capaces de hacer uso intensivo de la información léxica almacenada para desarrollar, no sólo sistemas de TA, sino cualquier tipo de aplicación que necesite de información léxica.

Una consideración importante que postulamos como punto de partida, es que la información léxica no es, de forma inherente, diferente a otros tipos de información (p, ej. sistemas de CAD o empresariales), por lo que, en principio, debería ser posible utilizar los sistemas de almacenamiento de estos entornos.

En este sentido, el título de este capítulo puede llevar a engaño en el sentido de que se pueden considerar estos dos tipos de conocimiento como dispares, cuando en realidad, el conocimiento léxico no es sino un tipo específico de conocimiento. Esto lo confirma el hecho de que los sistemas de representación léxica específica que se han propuesto hasta la fecha y que describimos en el apartado 4.4, no son más que especializaciones de los sistemas de representación genéricos que mostramos en los apartados precedentes.

También es importante aclarar lo que generalmente se entiende por "representación léxica" porque este término ha significado diferentes cosas en diferentes momentos y siempre dependiendo de la perspectiva de quien lo ha utilizado.

Desde el punto de vista de la lexicografía y la lexicología, este concepto adquiere exclusivamente una dimensión representacional. Con esto queremos decir que se hace una división más o menos tajante entre representación y proceso. En este sentido, la información contenida en un diccionario clásico sería un buen ejemplo: entradas léxicas a las que se les asigna un número determinado de "trozos de información", que actúan a modo de descripciones de las mismas.

Desde el punto de vista de los desarrolladores de gramáticas y los investigadores en NLP, sin embargo, "representación léxica" incluye, además, la especificación de reglas que indican cómo las entradas del lexicón (que es sólo una parte del sistema representacional) pueden combinarse para formar oraciones en una lengua determinada. Así, se plantea una igualdad representación = gramática (p. ej. Gazdar & Mellish 1989), que pensamos desafía uno de nuestros requisitos iniciales: la independencia de los datos y de la teoría gramatical. En el resto del capítulo nos proponemos estudiar el modo en que estos puntos de vista pueden conciliarse. En el último apartado mostraremos nuestra propuesta de implementación, que desarrollaremos en el siguiente capítulo.

Lo que pretendemos con el estudio sobre representación del conocimiento en general (no sólo lingüístico) que nos disponemos a desarrollar es alcanzar un conocimiento adecuado del cuadro general en el que vamos a trabajar, y que en muchos estudios lingüísticos es totalmente ignorado.

 

Anterior  I  Siguiente  I  Índice capítulo 4  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-35510-2000
Copyright © 2000 Antonio Moreno Ortiz
-----------------------------90971679623236 Content-Disposition: form-data; name="camino"