ISSN: 1139-8736
Depósito Legal: B-25223-99

4.4.1. Selección de los datos

Queremos discutir ahora brevemente las razones por las cuales en nuestro estudio de las meronimias de los sustantivos del léxico español hemos utilizado como fuente principal el Diccionario de Uso de María Moliner (1986, 1996) para la selección de los datos (además de una serie de informantes).

En cualquier trabajo sobre semántica léxica, las fuentes principales, dependiendo del enfoque de la investigación, son:

1. Diccionarios monolingües de uso.
2. Informantes.
3. Enunciados de laboratorio.
4. Enunciados de corpus.
5. Diccionarios terminológicos.
6. Enciclopedias.
7. Redes semánticas.

En este trabajo hemos utilizado fuentes de los dos primeros tipos, pero la fuente principal la constituyen los diccionarios monolingües. Obviamente, el denominado léxico común es el que presenta mayores dificultades de estudio en cuanto a sus relaciones semánticas, pero es un objetivo prioritario. Esta es la razón por la acudimos al lugar en el que ese léxico común se describe.

A pesar de ser esta fuente la más accesible y manejable, sus limitaciones son claras: nuestro conocimiento sobre el significado de las palabras es la suma del significado compartido por toda la comunidad, más el significado compartido por una parte de la comunidad (por razones sociales, regionales o profesionales), más el significado de la experiencia personal, normalmente no compartido o compartido de forma muy restringida1.

Nuestra investigación, en cambio, sólo se sitúa en el primer plano (el compartido por toda la comunidad), con lo que dejamos fuera el enfoque terminológico, aunque pueda ser tratado esporádicamente, y, por supuesto, la experiencia personal del lenguaje. Las enciclopedias quedan fuera del ámbito de este trabajo.

Por su parte, las razones principales por las que hemos seleccionado como fuente principal el Diccionario de Uso de María Moliner han sido dos:

1) La primera reside en el hecho de que este diccionario ha sido creado por una sola persona, lo que podía suponer una mayor coherencia en los patrones utilizados en las definiciones.
2) La segunda, reside en el hecho de conocer que la versión en CD-ROM aparecería pronto, al igual que ha ocurrido con otros diccionarios.

Para la localización de las relaciones meronímicas hemos seleccionado una serie de palabras que pueden servir de indicios de dichas relaciones en las definiciones. La lista de patrones que hemos seleccionado tiene una procedencia múltiple. Empero, es necesario recordar que aunque el planteamiento del método de búsqueda de relaciones meronímicas en el diccionario es el mismo que se utiliza en la investigación con medios informáticos plenos (diccionario en versión electrónica), la ausencia de estos medios en la fase inicial condiciona y limita seriamente su efectividad. Es difícil recordar 250 términos que nos permitan localizar una relación meronímica. No obstante, con el tiempo, pudieron llegarse a identificar una buena parte. En este sentido es necesario decir que nuestra descripción no pretende agotar las meronimias existentes en español, pero sí pretende en cambio dar una muestra lo suficientemente amplia y no manipulada como para que los resultados tengan un grado aceptable de fiabilidad.

Las fuentes utilizadas para la elaboración de la lista son varias. En un primer momento, tradujimos los términos utilizados en algunos estudios (Cruse [1986], Cruse y Iris, M.A., Litowitz, B. y Evens M. [1988], Chaffin, R., Herrmann, D. y Winston, M.E. [1987]). Después acudimos a fuentes castellanas, fundamentalmente a Casares (1992). Los patrones (parte de y sinónimos; adverbios de lugar y tiempo) son los siguientes:


Sustantivos

(A/a)ñico(s)
(A/a)ccesorio(s)
(A/a)la(s)
(A/a)partadijo(s)
(A/a)still(ón/ones)
(A/a)stilla(s)
(Á/á)pice(s)
(Á/á)tomo(s)
(B/b)ocado(s)
(B/b)rizna(s)
(C/c)éntimo(s)
(C/c)abo(s)
(C/c)acho(s)
(C/c)asco(s)
(C/c)ercenadura(s)
(C/c)ercenamiento(s)
(C/c)hispa(s)
(C/c)ombinaci(ón/ones)
(C/c)ompartimento(s)
(C/c)ompartimiento(s)
(C/c)orpúsculo(s)
(C/c)ota(s)
(C/c)uaderna(s)
(C/c)uarter(ón/ones)
(C/c)uadrante(s)
(C/c)uartel(es)
(C/c)uerpo(s)
(C/c)uota(s)
(D/d)ecimal(es)
(D/d)esportilladura(s)
(D/d)etalle(s)
(D/d)ivisi(ón/ones)
(E/e)lemento(s)
(E/e)scote(s)
(E/e)squirla(s)
(E/e)xtremo(s)
(F/f)racci(ón/ones)
(F/f)ragmento(s)
(G/g)ajo(s)
(G/g)ota(s)
(G/g)rano(s)
(I/i)ngrediente(s)
(J/j)ir(ón/nes)
(L/l)óbulo(s)
(L/l)ad(o/os)
(L/l)imadura(s)
(L/l)oncha(s)
(L/l)onja(s)
(L/l)ote(s)
(M/m)aterial(es)
(M/m)azamorra(s)
(M/m)eaja(s)
(M/m)eajuela(s)
(M/m)iaja(s)
(M/m)iembro(s)
(M/m)iga(s)
(M/m)igaja(s)
(M/m)igajuela(s)
(M/m)olécula(s)
(M/m)ordisco(s)
(N/n)úcleo(s)
(P/p)arcela(s)
(P/p)artícula(s)
(P/p)arte(s)
(P/p)artecilla(s)
(P/p)artija(s)
(P/p)avesa(s)
(P/p)ecezuela(s)
(P/p)edazo(s)
(P/p)edazuelo(s)
(P/p)equeñe(z/ces)
(P/p)ie(s)
(P/p)iecezuela(s)
(P/p)ierna(s)
(P/p)ieza(s)
(P/p)izca(s)
(P/p)orci(ón/ones)
(P/p)ormenor(es)
(P/p)osta(s)
(P/p)resa(s)
(P/p)roporci(ón/ones)
(P/p)unta(s)
(P/p)unto(s)
(R/r)aci(ón/ones)
(R/r)aedura(s)
(R/r)aja(s)
(R/r)amal(es)
(R/r)amo(s)
(R/r)ebanada(s)
(R/r)epel(ón/ones)
(R/r)escaño(s)
(R/r)esiduo(s)
(R/r)odaja(s)
(R/r)oedura(s)
(R/r)oncha(s)
(R/r)otura(s)
(R/r)ueda(s)
(S/s)alpic(ón/ones)
(S/s)ecci(ón/ones)
(S/s)ector(es)
(S/s)egmento(s)
(T/t)émpano(s)
(T/t)ajada(s)
(T/t)araz(ón/ones)
(T/t)erzuelo(s)
(T/t)iesto(s)
(T/t)ramo(s)
(T/t)ranco(s)
(T/t)riza(s)
(T/t)rozo(s)
(U/u)ncia(s)
(V/v)iruta(s)


Numerales

(B/b)illonésimo(s)
(B/b)ipartido(s)
(C/c)atorzavo(s)
(C/c)entésimo(s)
(C/c)entavo(s)
(C/c)enteno(s)
(C/c)ienmilésimo(s)
(C/c)ienmillonésimo(s)
(C/c)ienmilmillonésimo(s)
(C/c)incuentavo(s)
(C/c)incuenteno(s)
(C/c)uadragésimo(s)
(C/c)uadrigentésimo(s)
(C/c)uarentavo(s)
(C/c)uarentena(s)
(C/c)uarta(s)
(C/c)uarto(s)
(Tamb.sustvo)
(D/d)écima(s)
(D/d)écimo(s)
(D/d)iecinueveavo(s)
(D/d)ieciochavo(s)
(D/d)ieciseisavo(s)
(D/d)iecisieteavo(s)
(D/d)iezmilésimo(s)
(D/d)iezmillonésimo(s)
(D/d)iezmilmillonésimo(s)
(D/d)oceno(s)
(D/d)odrante(s)
(D/d)ozavado(s)
(D/d)ozavo(s)
(D/d)uocentésimo(s)
(D/d)uodécimo(s)
(D/d)uodecimal(es)
(D/d)uodeno(s)
(M/m)ilésimo(s)
(M/m)illonésimo(s)
(M/m)ilmillonésimo(s)
(M/m)itad(es)
(N/n)onagésimo(s)
(N/n)oningentésimo(s)
(N/n)oveno(s)
(N/n)oventavo(s)
(O/o)chava(s)
(O/o)chentavo(s)
(O/o)chenteno(s)
(O/o)ctavo(s)
(O/o)ctingentésimo(s)
(O/o)ctogésimo(s)
(O/o)nceno(s)
(O/o)nzavo(s)
(Q/q)uincuagésimo(s)
(Q/q)uindécimo(s)
(Q/q)uingentésimo(s)
(Q/q)uinto(s)
(Q/q)uinzavo(s)
(R/r)equinto(s)
(S/s)éptimo(s)
(S/s)étimo(s)
(S/s)eisavo(s)
(S/s)epteno(s)
(S/s)eptingentésimo(s)
(S/s)eptuagésimo(s)
(S/s)esentavo(s)
(S/s)esma(s)
(S/s)esquiáltero(s)
(S/s)etentavo(s)
(S/s)exagésimo(s)
(S/s)excentésimo(s)
(S/s)exma(s)
(S/s)exto(s)
(S/s)ubduplo(s)
(T/t)erci(o/a/os/as)
(T/t)rec(én/enos)
(T/t)reintaidosavo(s)
(T/t)reintavo(s)
(T/t)reintena(s)
(T/t)reinteno(s)
(T/t)rezavo(s)
(T/t)ricésimo(s)
(T/t)ricótomo(s)
(T/t)ricentésimo(s)
(T/t)ricotómico(s)
(T/t)rigésimo(s)
(T/t)rimembre(s)
(T/t)ripartito(s)
(U/u)ndécimo(s)
(V/v)eintésimo(s)
(V/v)eintavo(s)
(V/v)einteno(s)
(V/v)icésimo(s)
(V/v)igésimo(s)


Participios y adjetivos


(A/a)rrancad(o/a/os/as)
(B/b)ífido(s)
(C/c)omp1uesto(s)
(Tamb. sustantivo)
(C/c)onstituido(s)
(C/c)ontingente(s)
(C/c)ortado(s)
(D/d)escompuest-
(o/a/os/as)
(D/d)icotómico(s)
(D/d)ividido(s)
(D/d)ivisional(es)
(D/d)ivisionario(s)
(D/d)iviso(s)
(F/f)ormado(s)
(F/f)raccionario(s)
(F/f)ragmentado(s)
(F/f)ragmentario(s)
(G/g)rand(e/es)
(I/i)ncompleto(s)
(I/i)ntegral(es)
(I/i)ntegrante(s)
(L/l)adead(o/a/os/as)
(M/m)ínima(s)
(M/m)igajada(s)
(P/p)arcial(es)
(P/p)artid(o/a/os/as)
(P/p)artitivo(s)
(P/p)equeñ(o/a/os/as)
(Q/q)uebrado(s)
(Tamb.sustvo)
(R/r)odead(o/a/os/as)
(R/r)oto(s)
(S/s)eparad(o/a/os/as)
(T/t)rífid(o/a/os/as)
(U/u)nilateral(es)
 
Palabras funcionales y adverbios

(B/b)ajo
(C/c)ada
(D/d)delante
(D/d)espués
(D/d)etrás
(E/e)ncima
(J/j)unto
(P/p)arcialmente
(T/t)ras

También podemos intentar dividir las palabras que hemos denominado patrones léxicos en distintos grupos, de acuerdo con las relaciones meronímicas que suelen expresar. A pesar de que la mayoría de ellas son poco polisémicas, los tipos de meronimias que pueden representar no son constantes, ni regulares, ni responden a reglas fijas de comportamiento. Como vemos, este hecho no ocurre sólo en castellano, sino también en inglés y posiblemente en otras lenguas2.

No se ha observado la existencia de patrones sencillos para la selección automática, sin embargo sí parecen existir ciertas constantes estructurales y léxicas que nos permiten preseleccionar un número más reducido de acepciones susceptibles de contener una meronimia en su definición y consecuentemente en su relaciones de significado.

Como vimos en el proyecto Sift, uno de los patrones de reconocimiento de meronimias más abundante en el LDOCE es N + de + Complemento. En el proceso manual de recogida de meronimias hemos observado que también en el María Moliner existe este tipo de estructuras:

astilla-#2 Trozo de madera partido toscamente, de los que se gastan para leña.
balasto-#1 Lecho de piedra y grava sobre que se asientan las traviesas del ferrocarril.
balumba-#1, montón Conjunto de cosas amontonadas en desorden: Tenía una balumba de cosas
bancada-#2 Trozo de obra en construcción.
cazoleta-#1 Parte de la pipa en que se coloca el tabaco.
cazoleta-#3 Pieza de forma semiesférica de las armas de chispa, inmediata al oído del...
coronamiento-#2 Particularmente, parte superior ornamental de un edificio.
correaje-#1 Conjunto de correas que forman parte de algo.
corva-#1 Parte por donde se dobla la pierna, detrás de la rodilla.
cartela-#1 Trozo de cartón, madera u otra materia en que se escribe algo, por ejemplo...

Otros términos no tan frecuentes, como dividir, borde, mezcla, cada, lonja, etc, pueden servir también de indicio:

cartiero-#1 Una de las cuatro partes en que se dividía el año para algunos fines.
cortadura-#2 Borde o superficie que queda en cada una de las partes separadas, por el...
célula-#1 Elemento primordial, generalmente microscópico, de los seres vivos, que...
adobo-#1 Mezcla de ingredientes para curtir las pieles, aprestar las telas, etc.
aire-#1, compás, cadencia Cada uno de los distintos grados de velocidad con que se tocan las obras.
albardilla-#1 Lonja de tocino que se pone encima de las aves para asarlas.

Parece que necesitamos un análisis más amplio de las definiciones, no sólo sintáctico, sino también semántico, para lograr un cierto alcance de los patrones de reconocimiento de relaciones meronímicas. La variedad es en cualquier caso amplia: términos meronímicos (patrones léxicos), estructuras de enumeración, estructuras de composición (secuencial, integral, subtancias, etc.), términos de cuantificación de meronimia, términos de cualificación de meronimia (funcionales, formales, etc) y términos de localización espacio-temporal de meronimia.


NOTAS

1  Esta división de la experiencia lingüística presenta importantes problemas en la búsqueda de fuentes para la Representación del Conocimiento como disciplina general.

2  Ver con respecto al alcance de los patrones de reconocimiento de relaciones meronímicas Iris, Madelyn A.; Litowitz, Bonnie & Evens Martha, 1988.

 

Anterior  I  Siguiente  I  Índice capítulo 4  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-25223-99