ISSN: 1139-8736
Depósito Legal: B-35510-2000

4.4 Representación léxica específica

Los sistemas de representación que mostramos en este apartado no se apartan en lo básico de los sistemas de representación del conocimiento en general que hemos expuesto en los apartados anteriores, sino que son especializaciones de ellos. Concretamente se trata de sistemas de representación no procedimentales, por tanto declarativos, con muchos puntos en común con la representación basada en redes semánticas y especialmente en marcos que acabamos de mostrar, con los que comparten características esenciales como la herencia de propiedades.

En la última década se ha venido dando una tendencia a usar una serie de formalismos gramaticales que tienen como característica común el estar basados en el concepto de unificación. El uso de la unificación en la lingüística computacional fue introducido por Martin Kay (Kay 1979, 1984) y desde entonces los desarrollos lingüísticos y computacionales han sido sustanciales. Entre los formalismos gramaticales que incorporan la noción de unificación se encuentran algunos cuyas características principales ya hemos comentado: la gramática Léxico-Funcional o la gramática sintagmática de control nuclear (HPSG: Head-Driven Phrase Structure Grammar) (Pollard & Sag 1994) y algunas otras de uso menos extendido, como la gramática categorial de unificación (CUG: Categorial Unification Grammar) (Haddock, et al. 1987; Karttunnen 1989; Uszkoreit 1986) o la gramática funcional de unificación (FUG: Functional Unification Grammar).

Estos formalismos, también llamados formalismos basados en restricciones (constraint-based) y basados en la superficie (puesto que no contemplan otro nivel de estructura gramatical más que el superficial), van más allá que otros lenguajes de representación en el sentido de que permiten la codificación del conocimiento gramatical de forma independiente a cualquier algoritmo de procesamiento (Uszkoreit & Zaenen 1995).

Una característica fundamental de estos formalismos es, como ya hemos mencionado, el ser declarativos. Desde este punto de vista, el estudio de la gramática es considerado como una rama de la representación del conocimiento: una gramática es simplemente una manera de representar ciertos aspectos conocidos sobre una lengua, y que son lo suficientemente explícitos como para ser entendidos por una máquina (Gazdar & Mellish 1989). En este sentido, una lengua es considerada como un conjunto cuya pertenencia puede ser especificada de forma precisa mediante reglas. Por tanto, una gramática no es sino un sistema matemático que define la pertenencia de los conjuntos infinitos (de estructuras sintácticas, etc.) que componen la lengua.

En este entorno, una gramática es considerada como un conjunto de restricciones que han de ser satisfechas por un objeto lingüístico determinado: el análisis y la generación difieren únicamente en la naturaleza del input, usando el mismo mecanismo evaluador de restricciones.

Las gramáticas de este tipo favorecen un enfoque composicional al significado, en el que cada una de las expresiones bien formadas tiene un significado propio, que se deriva de las subexpresiones que lo componen.

Otro calificativo que reciben estos formalismos es el de basados en rasgos (feature-based). Esto es algo fundamental que los diferencia de los formalismos precedentes, las gramáticas sintagmáticas libres de contexto. Como ya mencionamos en el Capítulo 2, estas gramáticas tienen algunas ventajas, como el ofrecer un mecanismo computable y el contar con una larga tradición en los sistemas computacionales, pero también conllevan desventajas, principalmente dos: la sobre-generación (generan más estructuras de las deseadas) y la arbitrariedad (no hay ningún modo de restringir la aplicación de reglas). Mediante el uso de los rasgos, se consigue, entre otras cosas, desplazar a los objetos léxicos, la mayor parte de la información sintáctica, que antes era asociada con las reglas. Además, se hace posible trabajar con información semántica del mismo modo, adscribiéndola mediante restricciones a los objetos léxicos.

Por lo que respecta al entorno computacional para la implementación de gramáticas basadas en restricciones, Zajac (1992) define las siguientes propiedades:


NOTAS

  1. La estructura de datos más extendida para este tipo de formalismos son sin duda las estructuras de rasgos tipificadas (TFS), que analizamos en el apartado 4.4.2.
  2. Esto también tiene repercusiones sobre la dicotomía clásica "representación vs. proceso" que presentábamos al principio de este capítulo. En los formalismos basados en restricciones, la línea divisoria es realmente fina, planteándose los procesos (de análisis o generación) en términos declarativos, es decir, de representación.

 

Anterior  I  Siguiente  I  Índice capítulo 4  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-35510-2000
Copyright © 2000 Antonio Moreno Ortiz