ISSN: 1139-8736 Depósito Legal: B-25223-99 |
1.1. El problema
Presentación del tema de investigación
En los últimos quince o veinte años, la Semántica se ha desarrollado de una manera espectacular. Una de las razones de este desarrollo ha sido la necesidad por parte de las teorías gramaticales de modelos léxico-semánticos claros y de análisis semánticos de la oración que pudieran mejorar los resultados obtenidos en el análisis sintáctico.
Las aplicaciones de la Lingüística Computacional, en su intento por mejorar el procesamiento del lenguaje natural y manejar así las grandes masas de información escrita y oral que existen ya en formato electrónico, toparon desde un principio con el obstáculo de tratar los contenidos de los textos y no sólo su forma. Por ejemplo, el despegue de los sistemas de recuperación de información, sobre todo en los últimos siete años debido a Internet y a las Intranets, han hecho que muchos estudiosos se concentraran en cómo analizar los contenidos de los textos y en utilizar los hallazgos de la semántica teórica rápidamente, a medida que se iban produciendo, extendiendo su aplicación a grandes conjuntos de datos y extendiendo, en consecuencia, sus contenidos. Además, otras disciplinas (Informática, Lógica, Inteligencia Artificial, Psicología y Psicolingüística, entre otras) han contribuido con herramientas teóricas y metodológicas a desarrollar la Lingüística Computacional, abriendo de esta forma nuevas vías de tratamiento de las lenguas naturales.
La Semántica Léxica también ha ocupado un lugar privilegiado dentro de esta evolución. La tradición semántico-estructural, así como otras, como la gramática generativa y sus estructuras de papeles semánticos y semántica de rasgos, está siendo aprovechada por la Lingüística Computacional para la elaboración de prototipos y sistemas más completos, que respondan a necesidades como la recuperación de información multilingüe, la elaboración de resúmenes automáticos, la clasificación de documentos y, cómo no, la traducción automática.
Los modelos más utilizados en los últimos años dentro de la Lingüística Computacional han sido los relacionales. La cantidad de estudios sobre representaciones léxico-semánticas, los campos semánticos, el desarrollo de modelos cognitivos de ontologías y taxonomías, el estudio de las relaciones lógicas del léxico e incluso la Inteligencia Artificial y sus esfuerzos en la representación del conocimiento han hecho posible este desarrollo de los modelos relacionales.
La reciente aparición de WordNet, red semántica del inglés americano de uso, elaborada por George Miller y su grupo de investigación en la Universidad de Princeton (Miller et al. 1993), ha sido el corolario de esta trayectoria y un revulsivo para este tipo de trabajos.
Todos los modelos léxicos-semánticos han sido construidos en torno a la relación de hiponimia. Las experiencias con taxonomías y la clarificación de propiedades lógico-matemáticas de la relación ISA (es un) de la Inteligencia Artificial (I.A.) hicieron que las redes semánticas se plantearan a partir de una estructura básica jerárquica de hiponimia. Por otro lado, las relaciones lineales, como la sinonimia y la antonimia, también fueron extensamente utilizadas debido a la experiencia que sobre éstas proporcionaban los tesauros.
Motivación de la investigación
También desde un primer momento, aunque de manera más tímida, aparecieron diversas relaciones meronímicas o relaciones PARTE-DE. En la I.A. se denominó HASA (tiene un). Sin embargo, una falta de acuerdo sobre el funcionamiento y las implicaciones lógicas y estructurales de esta relación, así como una falta de estudios que aclararan la naturaleza de esta relación, al contrario de lo que ocurrió con la hiponimia, han hecho que el uso de la meronimia no haya sido homogéneo. Incluso desde la Lingüística Teórica no se ha llegado a un acuerdo. Cuestiones como el carácter primitivo o derivado de la meronimia, la subclasificación de relaciones meronímicas o su transitividad han centrado los estudios sobre esta relación. Para mostrar el desconcierto alrededor de esta relación basta ver que las posturas de la Lingüística Teórica y de la Lingüística Computacional han ido desde su negación de existencia, hasta su consideración como la segunda más importante, después de la hiponimia, sobre todo en la representación de los sustantivos.
La situación es aún peor si repasamos la bibliografía y observamos que apenas hay estudios sobre la meronimia en el léxico español. Sólo el inglés ha sido estudiado en profundidad.
Presupuestos
No es fácil navegar en el mar del significado sin perder el rumbo, sin contradicciones, incoherencias y problemas de representación. Cualquier contribución teórica a la semántica léxica computacional ha de tener en cuenta estos problemas para evitarlos, en la medida de lo posible, o asumirlos y poner los medios para controlarlos.
Garrido Medina (1988) apunta las advertencias de Werner sobre las falacias de las distintas teorías semánticas rivales y nos da una jerarquía de las falacias, en la que cada una posterior resuelve algunas deficiencias de sus precedentes:
1) Falacia de la semántica lexicografista. Puesto que el objeto de la semántica son las expresiones complejas y no sólo las unidades léxicas simples. Esto no afecta a la lexicografía en sí.
En el caso que nos ocupa, la fuente utilizada ha impuesto que las unidades léxicas simples centren nuestro trabajo. Este hecho es más un límite consciente que una limitación.
2) Falacia simbolista. El mero uso de símbolos aunque confiera un aspecto riguroso no añade nada (pseudonotaciones).
Nuestro estudio no utiliza metalenguajes y operaciones simbólicas, sino que la denotación y la referencia son estructuras anidadas o frames que se relacionan entre sí, sobre las que pueden aplicarse operaciones y mecanismos que utilizan esas relaciones para generar o reconocer conocimiento nuevo o inferencias, no explícitamente codificados, pero deducibles de un conjunto de relaciones y propiedades.
3) Falacia metasintacticista. Propia de la gramática transformacional, consiste, según Garrido Medina, «en definir y explicar sólo la sintaxis del lenguaje empleado para el análisis semántico; de este modo no hay interpretación explícita de este lenguaje de análisis, es decir, no hay semántica». Esto, siempre que no se trate de notaciones incoherentes y ad hoc, que suponen un retroceso a la situación de la falacia simbolista. La descripción de la forma lógica se ha de llevar a cabo rigurosamente con un formalismo matemático.
El formalismo matemático que utilizan las bases de datos relacionales se fundamenta en la teoría de conjuntos, en las propiedades booleanas, en la teoría de grafos y redes y en las propiedades de herencia y encapsulación (dos de los tres elementos básicos de la programación orientada a objetos: mensajes, herencia y encapsulación).
4) Falacia de la interpretación intuicionista. Es lo que queda de la falacia de una gramática simbolista cuando se dota a los símbolos de una sintaxis explícita y bien definida. Se cree que basta interpretar este lenguaje formal de manera intuitiva y formal.
Este riesgo, siempre presente en el estudio de la semántica, se ha intentado soslayar utilizando de forma apegada una fuente lexicográfica como el diccionario de María Moliner (1986, 1996), con el fin de evitar intuiciones personalistas, además de haberse utilizado distintas pruebas sobre los datos con el objetivo de comprobar su naturaleza y validez metodológica.
5) Falacia metasemioticista. Se considera que los símbolos del lenguaje formal empleado en el análisis semántico son los propios significados de la lengua. Con ello se confunde el metalenguaje con el lenguaje objeto, es decir, no se distingue lo que sirve para designar y lo que es designado.
En nuestro estudio no utilizamos un metalenguaje, sino el propio lenguaje con ciertas convenciones de representación del significado léxico (la numeración de cada una de las acepciones y, en algunas ocasiones, los grupos de sinónimos con sus números de acepción en una sola entrada (o synsets)1.
6) Falacia isomorfista. Hay una relación de isomorfismo entre las representaciones simbólicas y los significados de la lengua que describen. Sin interpretación del lenguaje formal empleado sólo quedan las ideas y concepciones del lingüista que lo formula.
En nuestra investigación esta falacia no es aplicable, pues nos proponemos presentar una descripción de la meronimia en el léxico del castellano y analizar y proponer elementos que creemos importantes para su clasificación, su estudio, su representación y los mecanismos mediante los cuales obtener inferencias y relaciones derivadas válidas.
7) Falacia formalista. Consiste en asignar a cada significado una entidad formal unidimensional. Con ello resulta imposible dar cuenta de la diferencia entre intensión y extensión.
La representación por medio de estructuras anidadas, con pares atributo-valor, unidas mediante relaciones, (entre otros elementos, como veremos) permite tratar el significado de forma intensiva y extensiva, con la descomposición del mismo.
8) Falacia Computacional. Según Garrido «los programas disponen de una interpretación de las expresiones del lenguaje de programación , pero no de las expresiones que aparecen como datos». Continúa señalando que la afirmación de Werner de que la situación no ha cambiado en 1984 con respecto a la crítica de Woods (según la cual no hay ninguna red semántica que siquiera se acerque al objetivo de conseguir un formalismo lógicamente adecuado) sigue vigente. Sigue sin dotarse a las notaciones semánticas de una interpretación semántica explícita y con ello se está a la altura de la falacia de la interpretación intuitiva.
Este punto es de especial relevancia en nuestra investigación, ya que partimos de una concepción explícita del significado. Se trata de un nodo en una red de relaciones y su posición relativa (y absoluta, como veremos en el capítulo 4 y siguientes), así como la información, en forma de pares-atributo valor, contenida en ese nodo. Parte del significado son también las relaciones potenciales derivadas a partir de su posición relativa y absoluta en la red.
9) Falacia procedimental. Se considera que los significados son procedimientos (o, en el mejor de los casos, algoritmos), precisamente aquellos que se emplean en los programas de ordenador. Con ello se cae en una nueva versión de la falacia metasemiótica. Ante esta falacia dice Garrido que se puede proponer simular los estados cognoscitivos humanos mediante ordenador y simular asimismo, mediante procedimientos construidos como programas, el uso de la lengua como procesos de esos estados.
A esto tendríamos que añadir las características, arquitectura, diseño y especificaciones de las base de datos que hemos de utilizar. Para Werner esto último corresponde a la psicología del lenguaje.
10) Falacia psicologicista. Se considera el significado como concepto elaborado por el individuo concreto. Se rechaza así la existencia de los significados como objetos abstractos. Sin embargo, contradictoriamente, se echa mano precisamente de aquello cuya existencia se rechaza, los conceptos como objetos abstractos, para explicar el carácter interindividual de los significados. Werner pone como ejemplo a Miller y Johnson Laird (1976), que adoptan la versión de Church de la distinción de Frege entre sentido y referencia: el sentido es un concepto de la denotación.
Según Garrido Medina, Miller y Johnson Laird (1976) mantienen que el significado de la oración es el programa, no la proposición, que expresa. No parece justa la crítica de Werner. Miller y Johnson Laird no consideran la estructura conceptual que proponen para explicar el significado léxico como algo construido subjetivamente por cada individuo concreto, sino más bien como «parte del mobiliario básico de la mente». Explícitamente defienden la existencia de los conceptos como «tales entes abstractos», por ser imprescindibles en la teoría psicológica.
Nosotros asumimos también la existencia de objetos léxicos de significación, pero no sólo como «entes abstractos», sino como «entes abstractos relacionales» representados de manera composicional. Es básica la aportación de áreas como la representación del conocimiento en esta visión del significado.
11) Falacia analiticista o del análisis componencial. Consiste en traducir el significado léxico a un lenguaje artificial que no es más que una versión de la lengua dotada de terminología especializada. Da cuenta de los llamados significados gramaticales mediante términos especializados (por ejemplo, el significado del tiempo verbal de presente se explica mediante el correspondiente término especializado).
Con ello, según Werner, se deja sin explicar el significado de las expresiones complejas, o se ofrece la explicación de las relaciones de casos (semánticos), con lo que se confunde el significado léxico con el de las expresiones complejas, además de no ofrecerse ningún análisis formal de tales relaciones. Otra solución análoga, la de la amalgama de significados léxicos en conjuntos, ordenados o no, retrotrae el análisis a la etapa previa a la semántica de Katz2.
«La alternativa a los diversos lenguajes de representación semántica es para Werner dice Garrido un lenguaje que esté dotado de una interpretación modelo-teórica, construida mediante la teoría (axiomática) de conjuntos, es decir un lenguaje de carácter matemático. Es el único lenguaje suficientemente rico, fundamentado desde el punto de vista de teoría de la ciencia, y comprensible sin ser una lengua natural, por estar basado en un único concepto no definido, el de elemento (de un conjunto). Puede servir por ello de auténtica «interlingua» para el análisis semántico. Y a Montague se debe concluye Werner la creación de tal lenguaje, que permite la matematización de la Lingüística y, por tanto, su constitución como ciencia».
En el marco teórico y metodológico adoptado en esta investigación se garantiza en gran medida que las interrelaciones resultantes de los significados y la variada información de las estructuras aseguren la utilización de las mismas en aplicaciones de procesamiento del lenguaje natural. El concepto no definido no es tan sólo el elemento de un conjunto, sino que dicho elemento posee juicios de pertenencia a determinados conjuntos de maneras diferentes. Esto puede mejorar el análisis de la oración mediante reglas semánticas, a partir de las propias relaciones entre los elementos léxicos, añadidas a las estructuraciones sintácticas.
Por último, hemos de aclarar que la especial importancia que los datos tienen en el presente trabajo (en el que proporcionamos una amplia muestra de ellos, aunque tan sólo incluyamos en las siguientes páginas un 25% del total recogido) obedece a un intento de evitar una parcial y estrecha visión de la realidad. En palabras de Givón3:
«The complex interaction between data, formal model, and explanation within any scientific discipline, sits at the core of what ultimately emerges as "theory". None of the three can by itself be the theory. Nor can a viable theory be constructed if the role of any of the three is ignored or the nature of their interdependency distorted. For example, one of the most damaging practices in the history of linguistics has been the arbitrary -and a priori- delimitation of the data base, that is, the range of facts to serve as input for the investigation and, ultimately, as input fot building the theory. There are a number of ways this can be done. First, one may adopt a formalism that is incompatible with a certain range of data, then disallow data that cannot be digested by the formalism. Alternatively, one may choose to limit one's range of the explanatory parameters bearing on the phenomenon under study, and then rule out various segments of potentially crucial data as "belonging to other disciplines". Both methods are equally destructive to the wellbeing of a science.»
NOTAS
1 Miller, G, WordNet 1.5, 1995.
2 Garrido Medina (1988) menciona también la critica de las pseudonotaciones de Wunderlich com análisis causativos y de la lógica natural de Lakoff en la que desaparecen casi todas las diferencias semánticas, así como la critica de Lewis a los rasgos semánticos de Katz & Postal como símbolos de un lenguaje artificial que Lewis llama "rasgués" (markerese).
3 Givón, Talmy (1979), pág. 3.
Siguiente I Índice capítulo 1 I Índice General
ISSN: 1139-8736 Depósito Legal: B-25223-99 |