El primer paso en cualquier tarea de modelado de datos es sin duda la especificación concreta de la información que se pretende modelar, así como de las aplicaciones a las que el sistema de información resultante deberá dar soporte. Estos dos parámetros: contenido y aplicación, determinan en gran medida la implementación del sistema.
Ya hemos delimitado las dos aplicaciones principales a las que nuestro sistema de información pretende dar soporte: la lexicografía computacional y la traducción automática, aunque postulamos la reutilización de los recursos lexicográficos para otros tipos de aplicaciones que requieran este tipo de información.
En cuanto a la especificación de la información a modelar, en nuestro caso, esto viene determinado por los resultados obtenidos por los integrantes del grupo de investigación mencionado, siguiendo la teoría lexicológica del FLM. Por supuesto, esto se refiere a la información contenida en los lexicones monolingües, ya que este proyecto no consideraba inicialmente la creación de un sistema de TA.
Como ya hemos apuntado, en las últimas décadas el léxico ha recobrado una gran importancia en las teorías gramaticales. El término "teorías lexicalistas" no hace referencia a ninguna teoría concreta, sino que se suele utilizar para englobar a una serie de teorías que tienen un elemento común: son teorías lingüísticas que hacen del lexicón el eje central de su análisis. La profusión de teorías lingüísticas diferentes propuestas en los últimos años (lexicalistas o no), no nos permite hacer un repaso exhaustivo de cada una de ellas, ni tampoco pensamos que esto sea relevante para la exposición de nuestro trabajo. Nos limitaremos, por tanto, a ofrecer una visión de conjunto de lo que implica el término "lexicalista".
Siguiendo la propuesta hecha por Hudson (1990), podemos distinguir una serie de parámetros o tendencias que, aunque son en apariencia inconexos, ponen de relieve las características de lo que se ha dado en llamar el "resurgimiento del estudio del léxico":
El modelo lingüístico-lexicográfico que mostramos a continuación, el FLM, puede ser clasificado como una teoría lexicalista, pues cumple la mayor parte de estos parámetros.
Describimos a continuación de forma sucinta este marco teórico que sirve de base para la generación de la información léxica que nos proponemos modelar, propuesto por el Profesor Leocadio Martín Mingorance (1984, 1985a, 1985b, 1990, 1995).
Básicamente, este modelo supone la integración de dos teorías lingüísticas: la lexemática de E. Coseriu (1977, 1981) y la Gramática Funcional (FG: Functional Grammar) de S. Dik (1978a, 1978b, 1989)1. La compatibilidad de ambos modelos se establece en los siguientes términos (Martín Mingorance 1990:229): dado que la FG de Dik pertenece a las gramáticas de tipo sintético, desarrolla exhaustivamente el eje sintagmático del lexicón, por lo que parece que existe una relación de complementariedad con un modelo analítico como es la Lexemática de Coseriu, cuyo objetivo central es la organización del vocabulario de una lengua en campos semánticos (y por consiguiente, desarrolla el eje paradigmático en la descripción del lexicón).
Los objetivos generales a los que el modelo está orientado a dar respuesta se encuentran definidos en Martín Mingorance (1990:228):
Además de estos objetivos generales, el modelo lexemático-funcional se caracteriza por los siguientes rasgos (Faber & Mairal 1994a:200 y ss.):
En este sentido, el modelo de análisis léxico retoma la noción de linking (Carter 1976, 1988; Ostler 1980), de gran importancia en las teorías lingüísticas modernas más relevantes, pero a diferencia del modo no estructurado en que éstas hacen uso de este concepto (p. ej. Levin 1993, 1995), sobre todo en cuanto a la organización del eje paradigmático, el FLM propone una estructuración siguiendo unas pautas muy concretas. Ofrecemos a continuación una breve descripción del proceso de elaboración de ambos ejes.
En el eje paradigmático, los lexemas se organizan en campos léxicos siguiendo los presupuestos teóricos de la Lexemática de Coseriu. El establecimiento de los campos léxicos implica un análisis en dimensiones, un análisis sémico y un análisis clasemático3.
Las dimensiones se establecen a partir de las oposiciones funcionales, formuladas en base a la estructura de la definición de las entradas léxicas. De este modo, las dimensiones se basan en los principios lexemáticos de oposición y funcionalidad.
En la configuración interna de cada dimensión, se encuentra un archilexema junto con el resto de sus hipónimos, siendo cada uno de éstos definidos a través de su hiperónimo correspondiente. Para justificar la inclusión de un predicado en un campo, se descompone léxicamente, siguiendo el mecanismo de descomposición léxica gradual (stepwise lexical decomposition) propuesto por Dik (1978b), de forma que su definición consiste en una palabra nuclear y uno o varios rasgos distintivos que lo diferencian de los predicados circundantes. La palabra nuclear es el definiens que da nombre a la dimensión y esta palabra, a su vez, contiene un definiens que da nombre al campo léxico en cuestión. Es importante señalar aquí que la FG no permite la descomposición léxica abstracta de los predicados. Tanto en las definiciones léxicas como en las predicaciones, los predicados utilizados son lexemas existentes en una lengua determinada4. Martín Mingorance (1990:78).
Los postulados sobre los que se rige el mecanismo de la descomposición léxica gradual son los siguientes (Dik 1978b en Martín Mingorance 1990:79):
El resultado final de este proceso es una configuración jerarquizada de definiciones de predicados, tal y como puede observarse en el siguiente ejemplo del campo léxico de sonido en inglés5:
1. SOUNDS PRODUCED BY HUMANS
1. 1 TO MAKE A SOUND BY SPEAKING
1.1.1 TO MAKE A LOUD SOUND BY SPEAKING
- shriek to scream sharply and loudly in a very shrill way as in great terror or distress.
- screech to scream with disagreeable shrillness and harshness.
- holler to yell to get sbs attention (AmE infml).
El verbo superordinado de esta dimensión es shout y sus hipónimos (yell, whoop, cry out, vociferate, etc.) son definidos mediante el superordinado inmediato más un parámetro semántico opositivo.
En esta dimensión, el verbo yell es, a su vez, superordinado de scream, por lo que aparece como definiens en la definiciones de su hipónimos, scream y holler. Los verbos shriek y screech son hipónimos de scream, de modo que sus definiciones están constituidas por este predicado junto con los parámetros semánticos opositivos que los diferencian.
En el eje sintagmático se especifican los patrones de complementación de cada uno de los predicados, utilizando los marcos predicativos propuestos por la Gramática Funcional de S. C. Dik (1978a, 1989) como fórmulas integradoras, aunque la información contenida en los marcos predicativos se enriquece enormemente en lo que se refiere a la descripción de los complementos verbales, dando cabida a la descripción tanto de sus propiedades extensionales como intensionales6. Mairal Usón (1993:VI) apunta al respecto:
[...] Based on the assumption that the internal make-up of the lexicon component thus far has been concerned with those aspects that would pertain to Hallidays (1985) ideational metafunction, we postulate an expansion of the notion of predicate frame, in such a way that predicate frames are composed of four layers, and thus can explain those aspects of meaning that would pertain to Hallidays interpersonal metafunction. This type of lexicon has been called "a four layered lexicon" and the representation of complement meanings within this new component has been termed "the functional lexicon analysis".
El modelo lexemático-funcional especifica, por tanto, la siguiente información en el eje sintagmático:
- Agente (agent): la entidad que controla la acción.
- Posicionario (positioner): la entidad que controla una posición.
- Fuerza (force): la entidad no controladora que instiga un proceso.
- Procesado (processed): la entidad que experimenta un proceso.
- Experimentador (experiencer): entidad que experimenta un proceso sensorial o mental.
- Meta (goal): la entidad afectada o creada por la operación llevada a cabo por una entidad controladora.
- Recipiente (recipient): la entidad a la que se le transfiere algo.
- Ubicación/lugar (location): sitio donde se ubica una entidad.
- Dirección (direction): entidad hacia donde algo se mueve.
- Origen (origin): entidad desde donde algo se mueve.
- Referencia (reference): segundo o tercer término de una relación con referencia a la cual se dice que se establece la relación.
Tal y como reconoce Mairal Usón(1994a:20), esta lista de funciones semánticas no se considera cerrada dentro del ámbito del modelo lexemático-funcional. A estas funciones básicas se han añadido, por ejemplo, la de Hablante (Speaker), Mensaje (Message), Fenómeno (Phenomenon), etc., ya que se han considerado necesarias para la descripción de determinados argumentos en un campo léxico7.
(...) en la restricción de selección del primer argumento del predicado verbal "eat" sólo es necesario indicar el rasgo (+Animado), mientras que en la del segundo argumento habrá que utilizar la combinación de dos predicados, uno nominal y otro adjetival, quedando el segundo restringido por el primero ("solid food"). En un predicado monádico como "spawn", las restricciones de selección se expresarán mediante un clasema (- Masculino) con las especificación de que sólo se aplica a "fishes and frogs".
De nuevo, es muy importante recalcar a este respecto que las restricciones de selección se consideran, dentro del marco de la FG, como predicados de la lengua objeto. En palabras de Dik (1989:78) "just as predicates in general are interpreted in a language-dependent way, so selectional predicates are also given such a language-dependent interpretation". En capítulos posteriores veremos las consecuencias que este postulado tiene en nuestra implementación computacional.
Como ya hemos mencionado anteriormente (ver nota a pie número ), la descripción de los complementos verbales dentro del modelo Lexemático-Funcional ha sido desarrollada por el trabajo de Mairal Usón (1993:112), quien define la complementación de la siguiente forma:
Complementation is a matter of matching the semantics of the higher predicate (as specified in the paradigmatic axis of our Lexicon) with the semantics of the complement phrase.
La semántica de los predicados se especifica, como ya hemos señalado, por medio de la estructuración del eje paradigmático en forma de dimensiones y campos léxicos. En lo que se refiere a la semántica de los complementos, la orientación "cognitivo-funcional" del modelo da cabida a la descripción de la propiedades extensionales e intensionales de los complementos.
Las propiedades extensionales de los complementos determinan la forma y el comportamiento de los complementos verbales y se hallan definidas por medio de una escala denominada "Scale of Knowledge and Behaviour". Dicha escala se combina con otra, la denominada "Scale of Evaluation", en la que se reflejan las propiedades intensionales de los complementos verbales. Este tipo de propiedades reflejan la "evaluación" que el hablante realiza a la información presentada en un acto comunicativo, y por tanto determinan el valor extensional de una expresión lingüística.
En la primera de las dos escalas (Scale of Knowledge and Behaviour) se distinguen seis valores extensionales en los complementos verbales (Mairal Usón 1993:121 y ss.; 1994a:4). Los tres primeros se relacionan con los actos de habla y poseen, por tanto, una función de contenido (content function); los tres últimos se relacionan con las narraciones y poseen una función descriptiva.
Ej. "Get out of my house!" he cried out angrily8.
La descripción de este tipo de complementos se completa con la inclusión de los valores intensionales de los actos de habla (ver la escala de evaluación, más adelante).
Ej. He cried out that the law was unfair.
El significado de estos complementos refleja también el grado de compromiso que el hablante muestra con respecto al contenido de la proposición expresada en el complemento (ver la escala de evaluación, más adelante).
Ej. I expect that she will pass the exam.
Ej. I saw smoke coming out of the house.
Ej. He yelled at the students to come in.
- [+Concrete]
indica entidades que poseen forma y/o sustancia por sí mismas o en virtud de que las percibamos como tales.- [-Concrete]
designa entidades que no poseen sustancia o forma.- [+Living]
representa el concepto de "forma viva"- [-Living]
refiere a entidades que no poseen vida.- [+Human]
designa a personas.- [- Human]
refiere a animales y a vegetales.- [+Shape]
representa entidades que poseen un tamaño y una forma perceptible.- [-Shape]
refiere a entidades que no poseen un tamaño o forma perceptible.- [+Male]
designa a los hombres.- [- Male]
designa a las mujeres.- [+Animal]
se refiere a entidades del reino animal.- [-Animal]
refiere a entidades del reino vegetal.- [+Artifact]
designa objetos hechos por el hombre.- [-Artifact]
designa objetos que no han sido creados por el hombre.- [+Perceptible]
indica entidades no concretas relacionadas con la experiencia sensorial, emocional o intelectual.- [-Perceptible]
se refiere a abstracciones intelectuales.- [+State]
designa entidades que se refieren a condiciones físicas o mentales.- [-State]
se refiere a conceptos que denotan un proceso.- [+Action]
designa conceptos que hacen referencia a procesos volitivos.- [-Action]
se refiere a procesos que no son volitivos.- [+Physical]
designa conceptos que se refieren a estados o acciones percibidas a través de los sentidos.- [-Physical]
designa conceptos relacionados con las emocionenes o la actividad intelectual.- [+Attribute]
representa cualidades que no son inherentes a un objeto, estado o proceso y que son atribuidas por la mente de alguien.- [-Attribute]
denota todo aquello que no es una propiedad de algo, sino una entidad abstracta.- [+Evaluative]
se refiere a cualidades que son peyorativas o ameliorativas y que son, por tanto, de carácter emotivo.- [-Evaluative]
se refiere a atributos que están basados en un juicio intelectual.
En el presente trabajo nos centraremos en los problemas de representación de los valores extensionales de los complementos verbales, y más concretamente en las propiedades del tipo Individual, ya que, al denotar entidades, suponen ser indivisibles conceptualmente, es decir, hacen referencia a otras entidades que existen en el Universo de Discurso9 relevante, y por tanto han de contar con una especificación concreta que sea capaz de instanciar éstas a las variables independientes que suponen los distintos complementos verbales en cuanto que parte de un marco predicativo. En este sentido, cuestionaremos la validez de las restricciones de selección arriba señaladas como descriptores de entidades en un sistema de KBMT como el que proponemos.
La segunda de las escalas, la evaluativa (Scale of Evaluation), se articula en torno a cuatro tipos principales de evaluación o propiedades intensionales:
De este modo, al describir el significado de los complementos verbales por medio de estas dos escalas se llega a una caracterización semántica muy afinada, desde el punto de vista lexicográfico, de los complementos que un predicado verbal puede tomar en un patrón de complementación determinado. Esta caracterización es, por tanto, susceptible de ser utilizada como restricciones de selección. Mairal Usón (1993:115) define del modo siguiente la función de las restricciones de selección:
We regard selection restrictions as presuppositions that indicate, on the one hand the extensional properties of complement meanings and on the other, depending on the type of extension, (i) the degrees of acceptability of a given predicate in a communicative context; (ii) the degrees of occurrence of a given state of affairs in a predication; (iii) the degrees of the speaker's commitment to the truth contained in the complement proposition and (iv) the degrees of felicity or appropriateness of a given speech act. More importantly, selection restrictions, under the form of presuppositions, are said to be part of the speaker and addressee's communicative contract.
No podemos finalizar nuestro breve repaso del Modelo Lexemático-Funcional sin hacer referencia explícita a una serie de estudios llevados a cabo principalmente por Faber y Mairal en los que, siguiendo con el carácter integrador del modelo, se han incorporado una serie de postulados provenientes de la lingüística cognitiva (Faber & Mairal 1994b; en prensa).
Siguiendo la noción de esquema propuesta por Langacker (1987), el FLM postula que la organización de las unidades léxicas en dimensiones y su descripción en marcos predicativos dan como resultado esquemas cognitivo-conceptuales que son fiel reflejo de una estructura conceptual. En la actualidad se está desarrollando una tipología de esquemas cognitivo-conceptuales que se derivan de la estructuración jerárquica del lexicón:
No podemos ocuparnos aquí de este importante y prometedor aspecto del Modelo Lexemático-Funcional, ya que es un tema tan amplio que ha sido el tema central de las tesis doctorales de algunos de los miembros del grupo de investigación (cf. Fernández Sánchez 1997). Sin embargo, hemos de señalar a este respecto que la integración de los postulados cognitivos no se hallan reflejados explícitamente en nuestra implementación, debido a que este aspecto del proyecto se ha desarrollado experimentalmente, en términos temporales, a la vez que el trabajo de investigación que aquí presentamos.
Es innegable, sin embargo, que los postulados cognitivos han tenido un enorme impacto (aunque sea de forma indirecta) en el contenido de las complementaciones, así como en la estructuración del campo léxico del sonido que hemos usado para nuestra implementación computacional, por lo que no descartamos que puedan ser integrados en el futuro. Hemos de recordar aquí, una vez más, que el campo léxico ha sido estructurado y elaborado por los miembros del proyecto, por lo que, aunque nosotros no vayamos a extraer conclusiones de carácter cognitivo-conceptual directas de la información contenida en el lexicón que hemos implementado, esta información debe estar en consonancia con lo propuesto por Faber y Mairal (ver referencias indicadas más arriba).
NOTAS
Anterior I Siguiente I Índice capítulo 1 I Índice General