ISSN: 1139-8736
0. Introducción
En este trabajo me he propuesto tratar de la codificación en el lenguaje del conocimiento parte-todo y de su representación computacional. Me ceñiré a la semántica léxica nominal del español, e intentaré dar, en dicho ámbito, con un tratamiento global e unificado del fenómeno.
Se trata de un tema aparentemente heterogéneo, dado que abarca aspectos tales como la meronimia (o relaciones parte-todo entre lexemas), la pluralización (o expresión morfológica de una relación de elemento a multiplicidad), la polisemia lógica (como en la alternacia léxica entre la denotación de una entidad y la de la sustancia que la conforma), o los sintagmas partitivos (o expresión no léxica de relaciones parte-todo). Mi hipótesis es que todo ese abanico de fenómenos lingüísticos corresponde a un único y reducido conjunto de esquemas cognitivos, y puede ser explicado y representado en base a los mismos.
En lo que resta de capítulo plantearé mi aproximación genérica
al tema, para concluir con la presentación del esquema del trabajo.
Planteamiento
La capacidad de referirse a entidades como unidades discretas y diferenciables es un mecanismo del que, muy probablemente, cualquier lenguaje existente o concebible deba disponer. Algunos autores, como Lyons (1977), han denominado a dicho mecanismo, mediante el cual las lenguas entresacan entidades individuales de un continuum de referencia, individuación. De forma genérica, entenderemos por individuación la capacidad que tienen los hablantes para referirse a una determinada entidad o suceso de forma distinta y separada de un todo más inclusivo del que se concibe que forma parte.
Con las debidas matizaciones, puede convenirse que el objeto de la comunicación humana, el mundo que nos rodea o cualquier otro mundo posible o imaginable, está conformado por una amalgama más o menos continua de entidades y sucesos que es preciso desbrozar para que la propia comunicación sea posible. Centrándonos en el caso de la individuación de entidades, se observa que las lenguas utilizan múltiples recursos para llevarla a cabo. En español, por ejemplo, puede usarse la referencia deíctica ('aquéllo') u otros pronombres ('él'), así como una gran variedad de sintagmas nominales ('dos árboles', 'una rama', 'muchas copas de vino', 'ese equipo', 'un montón de gente', 'una cabeza de ganado'). Otras lenguas utilizan recursos ligeramente diferentes; por ejemplo las lenguas con clasificadores (japonés, chino mandarín, thai) construyen la referencia individualizada mediante grupos nominales en los que el nombre o su especificador combinan con un morfema o lexema, denominado clasificador, el cual tiene una doble función: la de indicar que la entidad denotada es una entidad discreta y contable, y la de clasificarla de acuerdo con ciertas especificaciones semánticas y perceptuales, tales como tipo, forma, animacidad, consistencia, tamaño o disposición. Dichos clasificadores, utilizados en ausencia del nombre, tienen, como los pronombres en español, capacidad de referencia anafórica.
De acuerdo con la corriente teórica habitualmente denominada gramática cognitiva, en el origen de la mencionada capacidad de individuación, se halla la capacidad de categorización. Desde dicho punto de vista (p.e. vid Lakoff, 1987; Rosch, 1976), determinados elementos del continuo son percibidos por los hablantes como propietarios de rasgos recurrentes, por lo que son considerados como pertenecientes a una categoría conceptual. Por ejemplo, observado que la gran mayoría de las cosas a las que en castellano se denominan 'árbol' presentan en su parte superior un número indeterminado de apéndices en los que se situan las hojas y los frutos, es posible convenir que, pese a la gran diversidad de aspectos que ofrecen y a que físicamente forman una única unidad continua con el árbol, tales apéndices pueden reputarse como pertenecientes a una categoría de cosas, que en castellano recibe el nombre de 'rama'.
La expresión lingüística de las categorías conceptuales está directamente relacionada con el fenómeno de la convencionalización, y por consiguiente con múltiples factores dependientes en último término de cada lengua en particular: cada lengua designa a los diversos rangos de entidades y sucesos de acuerdo con los mecanismos de que dispone. El grado máximo de convencionalización es la lexicalización, o expresión de un determinado concepto en una lengua mediante un determinado lexema. Grados menores de convencionalización resultan en la expresión de un concepto mediante construcciones expuestas a diversos grados de variabilidad, desde expresiones complejas prácticamente invariables, como las lexías, hasta estructuras sintagmáticas sujetas a un mayor o menor espectro de realizaciones alternativas, tanto en lo relativo a su estructura como a los elementos léxicos que en ella pueden insertarse.
Sea de forma lexicalizada o sintagmática, diversos tipos de entidades pueden ser referidos de forma discreta e individualizada: individuos ('un árbol', 'un palo'); conjuntos o pluralidades de individuos ('una manada de elefantes', 'un comité', 'gente', 'personas'); cantidades de masas o substancias ('un vino', 'un vaso de vino', 'una madera', 'una barra de madera'); o partes, porciones o elementos de entidades individualizadas ('una rama', 'la cima de una montaña', 'una cabeza de ganado', 'uno del equipo').
De modo íntimamente relacionado con la anterior apreciación, se constata que pueden definirse diversos tipos de relaciones de inclusión entre entidades (o, desde otro punto de vista, entre expresiones que las designan), como por ejemplo las existentes entre 'árbol' y 'rama', 'manada de elefantes' y 'elefante', 'barra de madera' y 'madera', o 'animal doméstico' y 'ganado'. Se trata éste de un tipo de conocimiento del que disponen los hablantes y que es profusamente utilizado en la construcción del significado del discurso lingüístico; por ejemplo, en una emisión lingüística en la que se manejen conceptos o palabras tales como 'ramas', 'copa', 'fruto', 'hojas', 'raíces', 'savia' o 'bosque', un hablante del español podrá deducir que, aunque no se cite de forma explícita, se está hablando de árboles.
Tal tipo de información semántica, la información parte-todo, ha sido estudiada en profundidad desde el punto de vista lexicalista por autores como Cruse (1986) o Winston et al. (1987), los cuáles han postulado diversos tipos de relaciones entre todos y partes, o relaciones meronímicas, entendidas como uno de los medios de estructuración interna del lexicón. Dichas aproximaciones, por ser esencialmente léxico-semánticas, no abordan de manera directa el hecho de que las relaciones parte-todo no únicamente se realizan en el lenguaje en forma de relaciones tácitas entre lexemas, sino que también, como he sugerido antes, pueden ser expresadas a partir de unidades lingüísticas más complejas. Por ejemplo, un caso de individuación que da lugar a una relación meronímica nominal, como es el de 'meandro' respecto a 'río', es perfectamente análogo al que establece el sintagma 'brazo de río' en relación al mismo tipo de entidad global: en ambos casos se designa a una parte del río concebida como una entidad individual y diferenciada.
Este tipo de grupos nominales partitivos, como 'brazo de río', -compuestos de un nombre en función partitiva, la preposición 'de' y un nombre en posición de complemento que designa la entidad global de referencia-, constituyen uno de los modos fundamentales de denotación de categorías conceptuales no lexicalizadas en español, y realizan funciones semánticas análogas en muchos aspectos a las que realizan los nombres comunes, como por ejemplo la de establecer relaciónes parte-todo entre entidades; pero no únicamente éstas, sino que, del mismo modo que los clasificadores en otras lenguas, también aportan información de otros tipos (forma, magnitud, etc.).
El análisis de las construcciones partitivas en español y de sus clases nos llevará a examinar qué tipos de nombre pueden ocupar en diferentes casos cada una de las posiciones del sintagma. La observación de la posición del complemento y el objetivo de definir sus características semánticas conducirá a su vez al planteamiento un problema de polisemia nominal que denominaré polimorfismo referencial.
Tómense en consideración dos sintagmas partitivos como 'un montón de café' y 'un montón de cafés', en los que en ambos casos se formula una cuantificación respecto a un todo de referencia -café- pero con diferentes matices de significado. El primer sintagma es monosémico: en él se cuantifica en relación a la sustancia denominada 'café'. El segundo sintagma, en cambio, es ambiguo, y, además, en él el todo de referencia es semánticamente distinto del del primero: 'un montón de cafés' podrá referirse, bien a tazas -o dosis convencionales- de café (como en 'para mantenerme despierto tomé un montón de cafés'), bien a clases -o subtipificaciones de la clase genérica- de dicha sustancia (como en 'en el nuevo supermercado puedes elegir entre un montón de cafés'). La situación que sugieren los anteriores ejemplos es la siguiente: un mismo lexema es susceptible de denotar conceptos que son distintos, pero que sin embargo se hallan estrechamente relacionados tanto entre sí como con lo que pudiera considerarse un significado común básico subyacente a todos ellos.
Éste y otros tipos similares de lo que podría calificarse como fenómenos de polisemia débil -denominados polisemia lógica por diferentes autores, como Pustejovsky (1995)- constituyen un fenómeno del que es preciso dar cuenta en el lexicón por las múltiples implicaciones semánticas que plantea, entre las que se cuenta la caracterización de los referentes de las construcciones partitivas, pero también otros aspectos del fenómeno parte-todo como la alternancia sustancia-entidad ('cordero' como animal vs. 'cordero' como plato o alimento) o la pluralización (expresión de una relación de elemento a multiplicidad).
A lo largo de este trabajo analizaré los aspectos de la semántica
nominal hasta aquí planteados con el objetivo de proponer una representación formal de
los mismos en un lexicón computacional para el tratamiento del castellano. De forma más
específica, trataré en primer lugar del conocimiento meronímico, y a continuación de
la individuación mediante sintagmas partitivos y del fenómeno relacionado del
polimorfismo referencial, aspecto este último para el cual me basaré en el trabajo
desarrollado por Jackendoff (1991) sobre formalización del sustrato conceptual que desde
su punto de vista subyace al conocimiento léxico.
Esquema del trabajo
Tras un primer capítulo destinado a cuestiones preliminares (Cap.
1) presentaré las distintas aproximaciones al fenómeno parte-todo (Cap. 2)
y los modelos computacionales de representación del conocimiento que son relevantes para
el presente trabajo (Cap. 3). En el siguiente capítulo (Cap. 4) formularé
mi propio análisis, para pasar a continuación a examinar con más detalle el problema de
las relaciones parte-todo expresadas mediante construcciones partitivas (Cap. 5).
En Cap. 6 describiré el marco de representación del conocimiento léxico, basado
en Pustejovsky (1995), dentro del cual desarrollaré (en Cap. 6.2) la
formalización de diversos modos de individuación sintagmática del conocimiento
parte-todo, mostrando sus implicaciones para el tratamiento de la semántica compositiva
de la oración. Para un adecuado tratamiento de los sintagmas partitivos y también de
otros aspectos del fenómeno, como la pluralización o la alternancia léxica
sustancia-entidad, presentaré en Cap. 7 un modelo de representación del
polimorfismo referencial. Para finalizar expondré las conclusiones del trabajo y las
líneas futuras de investigación.
Volver al índice
Capítulo siguiente
Climent S. (1999) Individuación e información Parte-Todo. Representación para el procesamiento computacional del lenguaje. Estudios de Lingüística Española (ELiEs).
ISSN: 1139-8736
Depósito Legal: B-8929-00