ISSN: 1139-8736 Depósito Legal: B-25223-99 |
3.3.2. WordNet
WordNet es una base de datos que contiene una red semántica del inglés y ha sido desarrollada por George Miller y su grupo de investigación en la Universidad de Princeton (Miller et al. 1993). Está diseñada utilizando un modelo semántico relacional y una base de datos también relacional y ha sido elaborada desde el punto de vista de la Psicolingüística. Está considerada como la red semántica del inglés (o de cualquier otra lengua) más completa que existe.
En esta sección no sólo vamos a describir WordNet a partir de la documentación existente, sino también a partir de un estudio directo sobre esta base de datos relacional. Esto es debido a que no todas las relaciones que describe la documentación son utilizadas en realidad en la base de datos. En palabras de Bloksma, Díez-Orzas & Vossen (1996:33):
Not all the relations described in the documentation of WordNet1.5 (Miller et al 1993) also occur in the database. The documentation gives the theoretical background for the architecture of their database rather than a description of the actual relations. For example, in the papers 7 types of meronymy relations are mentioned while in practice only three occur in the database (Díez-Orzas 1996). Similarly, for verbs a detailed hierarchy of entailment relations is described while in practice mostly hyponymy relations are present with incidental entailment and causal links. To describe the content of WordNet 1.5 we therefore use the description of the WN1.5 database by Díez-Orzas (1996).
En las páginas siguientes presentaremos una descripción y algunas estadísticas del contenido de WordNet, versión 1.5. Estas estadísticas son el resultado de haber procesado todos los datos contenidos en WordNet 1.5.
Los elementos primitivos de WordNet 1.5 son tres: Words (palabras, cadenas de caracteres), Meanings (significados, synsets, esto es, conjuntos de sinónimos, representados por un número identificador) and Relationships (relaciones, punteros relacionales). Otro tipo de informacion, como categoría gramatical, esquemas de subcategorización verbal y marcadores sintácticos para adjetivos, forma parte también de esta base de datos, WordNet 1.5.
Las estadísticas que proporcionamos a continuación están organizadas en torno a estos tres niveles (words, meanings y relationships o pointers). Comentaremos también algunos aspectos relevantes al respecto.
Word Forms y Word Meanings
Vamos a presentar como punto de partida la cantidad de word forms (palabras) y word meanings (significados o synsets) que contiene WordNet 1.5. Presentamos en primer lugar el número de synsets y el total de palabras ligadas a cada uno de esos synsets por categoría gramatical:
Cantidades globales de WordForms/Synsets
ARCHIVO | SYNSETS | miembros de los synsets ( Wordforms) |
Noun.dat | 60557 | 107484 |
Verb.dat | 11363 | 25768 |
Adj.dat | 16428 | 28762 |
Adv.dat | 3243 | 6203 |
Total | 91591 | 168217 |
Las cantidades de la columna de la derecha, WORDFORMS (miembros de los synsets), no muestran el número total de formas léxicas únicas, sino todas las palabras que son parte de los synsets, es decir, una palabra con polisemia 2, vendrá dos veces. The media de sinonimia, o unidales léxicas por synset para todas las categorías gramaticales es de 1.8, siendo los verbos los más ricamente representados en los synsets. Por otra parte, la riqueza de los synsets de sustantivos es muy desigual, pero no necesariamente errónea (a causa de los sublenguajes o vocabulario no general en WordNet 1.5). El número de palabras por synset y por categoría gramatical puede presentarse también de la siguiente manera:
Cómputo general de Word-Form/Synset
Cómputo |
SUSTANTIVOS |
VERBOS |
ADJETIVOS |
ADVERBIOS |
1 |
30629 |
3719 |
9476 |
1559 |
2 |
19766 |
4167 |
4193 |
941 |
3 |
6208 |
1922 |
1499 |
443 |
4 |
2406 |
795 |
643 |
172 |
5 |
860 |
374 |
300 |
79 |
6 |
390 |
167 |
152 |
23 |
7 |
163 |
94 |
59 |
12 |
8 |
67 |
52 |
43 |
6 |
9 |
27 |
28 |
32 |
3 |
10 |
12 |
13 |
10 |
3 |
11 |
8 |
8 |
6 |
1 |
12 |
7 |
7 |
6 |
1 |
13 |
4 |
7 |
4 |
0 |
14 |
5 |
2 |
2 |
0 |
15 |
2 |
1 |
0 |
0 |
16 |
0 |
1 |
1 |
0 |
17 |
0 |
2 |
0 |
0 |
18 |
1 |
1 |
0 |
0 |
20+ |
2 |
3 |
2 |
0 |
Total |
60557 |
11363 |
16428 |
3243 |
La cantidad de unidades léxicas (word forms) únicas (tanto palabras simple como expresiones lexicalizadas o palabras múltiples) que hay en WN 1.5 es:
Palabras simples/múltiples
ARCHIVO | PALABRAS MÚTIPLES | PALABRAS SIMPLES | TOTAL |
Noun.idx | 43731 | 43911 | 87642 |
Verb.idx | 7039 | 7688 | 14727 |
Adj.idx | 747 | 18354 | 19101 |
Adv.idx | 1499 | 3551 | 5050 |
Total | 53016 | 73504 | 126520 |
Como muestra esta tabla, la distribución entre palabras simples y múltiples es de un 58.1% para las palabras simples y un 41.9% para las múltiples, pero para sustantivos y verbos el porcentaje es casi de un 50%. Podemos decir que el enfoque psicolingüístico explica estas cifras en gran medida. Posiblemente, un enfoque más lexicográfico hubiera proporcionado una distribución muy diferente, lo que puede significar además que existe una gran necesidad de utilizar también estructuras conceptuales no lexicalizadas. Desgraciadamente, no poseemos estadísticas que revelen cuántas palabras múltiples están lexicalizadas y cuántas no. Por otra parte, con respecto a las aplicaciones de este recurso, en la recuperación de información, por ejemplo, el hecho de que existan expresiones no lexicalizadas ayuda a ver más claramente las taxonomía a los usuarios no expertos.
Con respecto a la polisemia en WordNet 1.5, hemos analizado los archivos *.idx y hemos obtenido los siguientes resultados (debemos decir que las unidades léxicas aquí son cadenas de caracteres de acceso (access strings), no palabras únicas, por ejemplo, state and State tendrán una sola cadena de caracteres de acceso:
Cómputo general de Synsets de Noun.idx. Synsets por WordForm (access string)
Synsets por Access String |
Nº de Access String con ese Nº de Synsets |
Nº parcial de Synsets |
1 |
76128 |
76128 |
2 |
7618 |
15236 |
3 |
2081 |
6243 |
4 |
824 |
3296 |
5 |
422 |
2110 |
6 |
227 |
1362 |
7 |
123 |
861 |
8 |
81 |
648 |
9 |
49 |
441 |
10 |
23 |
230 |
11 |
22 |
242 |
12 |
14 |
168 |
13 |
9 |
117 |
14 |
9 |
126 |
15 |
3 |
45 |
16 |
4 |
64 |
17 |
1 |
17 |
19 |
1 |
19 |
20 |
1 |
20 |
24 |
1 |
24 |
27 |
1 |
27 |
Total |
87642 |
107424 |
Cómputo general de Synsets de Verb.idx. Synsets por WordForm (access string)
Synsets por Access String |
Nº de Access String con ese Nº de Synsets |
Nº parcial de Synsets |
1 |
10033 |
10033 |
2 |
2411 |
4822 |
3 |
975 |
2925 |
4 |
507 |
2028 |
5 |
289 |
1445 |
6 |
182 |
1092 |
7 |
96 |
672 |
8 |
65 |
520 |
9 |
44 |
396 |
10 |
26 |
260 |
11 |
24 |
264 |
12 |
9 |
108 |
13 |
15 |
195 |
14 |
3 |
42 |
15 |
11 |
165 |
16 |
4 |
64 |
17 |
7 |
119 |
18 |
7 |
126 |
19 |
2 |
38 |
20 |
2 |
40 |
21 |
4 |
84 |
25 |
3 |
75 |
26 |
1 |
26 |
27 |
2 |
54 |
28 |
1 |
28 |
31 |
1 |
31 |
33 |
1 |
33 |
35 |
1 |
35 |
41 |
1 |
41 |
Total |
14727 |
25761 |
Cómputo general de Synsets de Adj.idx Synsets por WordForm (access string)
Synsets por Access String |
Nº de Access String con ese Nº de Synsets |
Nº parcial de Synsets |
1 |
13798 |
13798 |
2 |
3296 |
6592 |
3 |
1105 |
3315 |
4 |
411 |
1644 |
5 |
197 |
985 |
6 |
120 |
720 |
7 |
56 |
392 |
8 |
28 |
224 |
9 |
25 |
225 |
10 |
11 |
110 |
11 |
14 |
154 |
12 |
10 |
120 |
13 |
6 |
78 |
14 |
8 |
112 |
15 |
5 |
75 |
16 |
4 |
64 |
17 |
4 |
68 |
18 |
1 |
18 |
26 |
1 |
26 |
29 |
1 |
29 |
Total |
19101 |
28749 |
Cómputo general de Synsets de Adv.idx. Synsets por WordForm (access string)
Synsets por Access String |
Nº de Access String con ese Nº de Synsets |
Nº parcial de Synsets |
1 |
4279 |
4279 |
2 |
554 |
1108 |
3 |
131 |
393 |
4 |
48 |
192 |
5 |
20 |
100 |
6 |
6 |
36 |
7 |
5 |
35 |
8 |
6 |
48 |
10 |
1 |
10 |
Total |
5050 |
6201 |
Cómputo total de Synsets por WordForm (access string)
Archivo |
Nº total de WordForms (Access Strings) |
Nº total de Synsets asociados a WordForms (Access strings) |
Noun.idx | 87642 |
107424 |
Verb.idx | 14727 |
25761 |
Adj.idx | 19101 |
28749 |
Adv.idx | 5050 |
6201 |
Total | 126520 |
168135 |
De acuerdo con esta última tabla y considerando el hecho de que estamos tratando con cadenas de caracteres de acceso, access strings, y no con unidades léxicas, la media total de polisemia es 1.32. Esta media se explica por la diferencia de polisemia entre léxico central, general o de uso y el vocabulario más específico o terminológico en el cual no es tan ambiguo.
Otras piezas clave de información que contienen los synsets son las glosas (glosses, breve definición con ejemplos). Hemos detectado un enorme esfuerzo del equipo de Miller para proporcionar glosas al mayor número posible de synsets, pero no a todos:
Información sobre las glosas
ARCHIVO | SYNSETS | Nº de Glosas | Con ejemplos |
NOUN.DAT | 60557 | 51253 | 3792 |
VERB.DAT | 11363 | 8847 | 3097 |
ADJ.DAT | 16428 | 13460 | 9507 |
ADV.DAT | 3243 | 3145 | 2973 |
Total | 91591 | 76705 | 19369 |
El número de ejemplos es mucho menor que el número de glosas y, en muchos casos, sobre todo en los verbos, las glosa consiste en un ejemplo de uso.
Relaciones
La tercera entidad son las relaciones o los punteros relacionales, que expresan distintas relaciones semántico-léxicas. Estas relaciones afectan de distinta manera a unas categorías gramaticales y a otras, es decir, podemos dividir las relaciones semánticas entre las que conectan dos synsets con la misma categoría gramatical, por ejemplo dos sustantivos, y las que conectan dos synsets con distinta categoría. La siguiente tabla muestra una visión general de las relaciones o punteros relacionales que contiene WordNet 1.5.
Relaciones
RELACIÓN | PUNTERO | SUST. (n) |
VERBOS (v) |
ADJECTIVOS (a,s) |
ADVERBIOS (r) |
Antónimo | ! |
SÍ |
SÍ |
SÍ |
SÍ |
Hiperónimo | @ |
SÍ |
SÍ |
NO |
NO |
Hipónimo | ~ |
SÍ |
SÍ |
NO |
NO |
Merónimo Miembro | #m |
SÍ |
NO |
NO |
NO |
Merónimo Substancia | #s |
SÍ |
NO |
NO |
NO |
Merónimo Parte | #p |
SÍ |
NO |
NO |
NO |
Holónimo Miembro | %m |
SÍ |
NO |
NO |
NO |
Holónimo Substancia | %s |
SÍ |
NO |
NO |
NO |
Holónimo Parte | %p |
SÍ |
NO |
NO |
NO |
Atributo | = |
SÍ |
NO |
SÍ |
NO |
Implica (Entailment) | * |
NO |
SÍ |
NO |
NO |
Causa | > |
NO |
SÍ |
NO |
NO |
Ver también (Also see) | ^ |
NO |
SÍ |
SÍ |
NO |
Pertenece a (morfológica) |
\ |
NO |
NO |
SÍ |
NO |
Derivado de (morfológica) |
\ |
NO |
NO |
NO |
SÍ |
Similar a | & |
NO |
NO |
SÍ |
NO |
Los punteros semánticos que conectan a significados con la misma categoría gramatical son:
Antónimo |
Hiperónimo |
Hipónimo |
Merónimo Miembro |
Merónimo Substancia |
Merónimo Parte |
Holónimo Miembro |
Holónimo Substancia |
Holónimo Parte |
Implica (Entailment) |
Causa |
Ver también (Also see) |
Similar a |
Las relaciones que conectan significados con distinta categoría son:
Atributo (Attribute) entre sustantivos y adjetivos |
Pertenece a (morfológica) de adjetivo a sustantivo |
Derivado de (morfológica) de adverbio a adjetivo |
Para cada categoría gramatical la distribución y, consecuentemente, la red resultante y las formas que forman las jerarquías cambian. Aquí, mostraremos tan sólo cómo se distribuye el uso de punteros para cada categoría gramatical:
Uso de punteros en NOUN.DAT
Puntero | Relación | Entre synsets | Entre palabras | Ambos | Total | Synsets donde aparecen | Máximo en un synset |
! | Antónimo | 0 | 1711 | 2 | 1713 | 1574 | 4 |
@ | Hiperónimo | 61123 | 0 | 0 | 61123 | 60546 | 4 |
~ | Hipónimo | 61123 | 0 | 0 | 61123 | 13447 | 395 |
#m | Merónimo Miembro | 11472 | 0 | 0 | 11472 | 11382 | 4 |
#s | Merónimo Substancia | 366 | 0 | 0 | 366 | 309 | 5 |
#p | Merónimo Parte | 5695 | 0 | 0 | 5695 | 4922 | 27 |
%m | Holónimo Miembro | 11472 | 0 | 0 | 11472 | 5250 | 176 |
%s | Holónimo Substancia | 366 | 0 | 0 | 366 | 327 | 5 |
%p | Holónimo Parte | 5695 | 0 | 0 | 5695 | 2721 | 65 |
= | Atributo | 636 | 0 | 0 | 1713 | 326 | 8 |
Hay once nodos de partida o topes (primer nivel en la jerarquía) que estructuran la taxonomía de sustantivos en once jerarquías:
{entity-0}
{psychological_feature-0}
{abstraction-0}
{location-0}
{shape-0, form-0}
{state-0}
{event-0}
{act-0, human_action-0, human_activity-0}
{group-0, grouping-0}
{possession-0}
{phenomenon-0}
La estructura o nivel más profundo tiene 15 niveles. Existen también múltiples hiperónimos en WN1.5 (4 es el número máximo de hiperónimos de un synset).
Uso del puntero en VERB.DAT
Puntero | Relación | Entre synsets | Entre palabras | Ambos | Total | Synsets donde aparecen | Máximo en un synset |
! | Antónimo | 0 | 1025 | 0 | 1025 | 981 | 2 |
@ | Hiperónimo | 10817 | 0 | 0 | 10817 | 10790 | 3 |
~ | Hipónimo | 10817 | 0 | 0 | 10817 | 2917 | 289 |
* | Implica (Entailment) | 435 | 0 | 0 | 435 | 416 | 3 |
> | Causa | 204 | 0 | 0 | 204 | 201 | 2 |
^ | Ver también (Also see) | 4 | 829 | 7 | 840 | 401 | 25 |
Hay 573 topes que estructuran la taxonomía de verbos:
breathe-0 (take_a_breath-0, respire-0)
act-0 (behave-0)
rest-0 (repose-0, be_quiescent-0)
be_active-0 (move-6)
oversleep-0
nod-3
fall_asleep-0 (dope_off-0, flake_out-0,
drift_off-0, go_to_sleep-0, nod_off-0,
drop_asleep-0, drop_off-0, doze_off-0,
drowse_off-0)
go_to_bed-0 (turn_in-0, crawl_in-0,
kip_down-0, hit_the_hay-0,
hit_the_sack-0, get_into_bed-0,
sack_out-0, go_to_sleep-1, retire-0)
get_up-0 (turn_out-0, arise-0, rise-8,
get_out_of_bed-0)
wake-0
sedate-0 (calm-0, tranquilize-0,
tranquillize-0)
break_down-0 (collapse-0)
look-0 (appear-0)
wear-0 (have_on-0)
propagate-1
bear-0 (carry-0, expect-0)
carry_to_term-0
purge-0
keep_down-0
treat-0 (care_for-0)
relapse-0 (lapse-0, recidivate-0,
regress-0, retrogress-0, fall_back-0)
exercise-0 (work_out-0)
etiolate-0 (make_pale-0, make_sickly-0)
discharge-0 (expel-0, eject-0, release-1)
change-0
keep_up-0 (keep_abreast_of-0, follow-1)
change-2 (alter-0, vary-1)
change-1 (alter-1)
leave-2 (leave_unchanged-0, leave_unaltered-0)
remove-0 (take-0, take_away-1)
add-0
insert-0 (stick_in-0, put_in-0,
introduce-3)
decay-0 (fall_into_decay-0,
crumble_away-0, delapidate-0,
fall_into_ruin-0)
strengthen-0 (get_strong-0,
become_strong-0, become_stronger-0,
gain_strength-0)
weaken-0 (die_down-2, get_weak-0, get_weaker-0, become_weak-0)
die-2
grow-1 (cause_to_grow-0)
leak-0 (have_a_leak-0)
color-0 (give_color_to-0)
untune-0 (put_out_of_tune-0)
happen-0 (hap-0, go_on-0, pass_off-0, occur-0, pass-0, come_to_pass-0, come_about-0, take_place-0)
anticipate-0 (occur-2)
begin-0 (start_out-0, start-0, set_about-0, set_out-0, commence-0)
begin-1 (start-1, commence-1, set_in_motion-0, cause_to_start-0)
go_on-1 (continue-0, go_along-0, persist_in-0)
root-0 (take_roots-0, take_root-0)
leave-3 (leave_behind-0,
be_survived_by-0)
condense-0 (concentrate-7, contract-3)
cool-2 (cool_off-0, cool_down-2)
demagnetize-0 (degauss-0, make_nonmagnetic-0)
settle-0 (locate-0, relocate-0, take_up_residence-0)
settle-1 (form_a_community-0)
set_in-0 (become_established-4)
appear-0
appear-2 (come_along-0)
disappear-0 (vanish-0, go_away-0)
decelerate-1 (slow_down-2)
accelerate-1 (speed_up-1)
decelerate-0 (slow-0, slow_down-0, slow_up-1, retard-0)
flush-3
rush-1 (hurry-1)
stimulate-0 (excite-0)
seethe-3 (foam-1)
issue-0 (emerge-2, come_out-4, come_forth-0)
flow_out-0 (emanate-0, effuse-1, flow_forth-0)
turn_to-0
switch-2 (shift-2, change-5)
disrupt-1
understand-0
understand-1 (realize-0, see-1)
click_with-0 (came_to-0, click-0,
get_through-0, dawn_on-0,
come_home_to-0, get_across-0,
sink_in-0, penetrate-1,
fall_into_place-0)
resonate-0 (be_received-0,
come_across-0)
sympathize-0 (empathize-0, understand-4)
know-0
know-1 (cognize-0)
ignore-1 (be_ignorant_of-0)
know-2 (be_convinced_of-0, be_certain_of-0)
know-3 (have_a_familiarity_with-0, have_experience_with-0,
have_a_grasp_of-0)
master-0 (control-0, get_hip_to-0)
master-1 (get_the_hang_of-0,
have_a_mastery_of-0,
be_proficient_in-0, be_skilled_in-0)
learn-0 (larn-0, acquire_knowledge-0, gain_knowledge-0, acquire_skills-0)
learn-1 (hear-0, get_word-0,
get_wind_of-0, pick_up-0, find_out-0,
get_a_line_on-0, hear_about-0, hear_of-0, get_to_know-0, discover-1, become_aware_of-0, see-2)
learn-2 (study-0, read-5, take-2)
plunge-1 (immerse-1)
welter-0
study-3 (be_a_student-0)
remember-0 (retrieve-0, recall-0, call_back-0, recollect-0, remind-1, know-5, think-2)
think-8
slip-1 (escape_from_memory-0, slip_one's_mind-0)
forget-0 (blank_out-0,
draw_a_blank-0,
be_unable_to_remember-0, fail_to_remember-0)
come_to_mind-0 (spring_to_mind-0)
remember-1 (think_of-0)
forget-1 (put_out_of_mind-0, bury-0, dismiss_from_the_mind-0, stop_remembering-0)
remind-0
remember-2 (think_back-0)
commemorate-0 (remember-9)
abandon-1 (give_up-0)
leave-5 (leave_behind-5)
neglect-0 (leave_undone-0, omit-0, drop-0, miss-0, leave_out-0, overlook-0, overleap-0)
neglect-5 (fail_to_attend_to-0)
err-0 (mistake-1, make_a_mistake-0, commit_an_error-0, slip-0, be_in_the_wrong-0, be_incorrect-0)
confuse-1 (blur-0, obscure-0, make_unclear-0, make_indistinct-0)
confuse-3 (perplex-0, throw-0, fox-0, befuddle-0, fuddle-0, bedevil-0, puzzle-0, mystify-0, baffle-0, bewilder-0, flummox-0, stupefy-0, stupify-0, nonplus-0, gravel-0, amaze-1, dumbfound-0, trounce-0, confound-2, be_confusing_to-0, make_confused-0)
think-0 (cogitate-0, cerebrate-0)
reason-1 (reason_out-0, conclude-0, arrive_at-0,
come_to_the_conclusion-0)
establish-3 (base-0, ground-0, found-0)
get-3
analyze-1 (analyse-1, break_down-0, dissect-0, take_apart-0)
analyze-0 (analyse-0, study-2, examine-0)
identify-1 (discover-3, key-0, key_out-0, distinguish-1, describe-0, name-1)
come_round-0 (come_around-0)
categorize-0
(place_into_a_category-0)
confirm-0 (corroborate-0, sustain-0, substantiate-0, support-0, affirm-0)
judge-0 (form_an_opinion_of-0, pass_judgment_on-0)
choose-2 (prefer-0, opt_for-0,
choose_as_an_alternative-0,
choose_instead-0)
dispose-0 (incline-3,
make_receptive-0, make_willing-0)
indispose-0 (disincline-0,
make_unwilling-0)
decide-0 (make_up_one's_mind-0, decide_upon-0, determine-0)
will-0 (wish-0)
expect-1 (look-0, await-0, wait_for-0, wait-0, look_forward_to-0)
surprise-0 (take_unawares-0, take_by_surprise-0)
observe-0 (keep-0, maintain-0)
arrange-0 (set_up-0, put-0, order-1)
awaken-0
analyze-4
inflict-0 (bring_down-0, visit-1, impose-0, cause_to_be_endured-0)
induce-0 (stimulate-1, cause-0, have-0, get-0, make-0)
convince-1 (assure-1)
rest-1
refuse-0 (decline-0)
retreat-0 (back_out-0, back_away-0, crawfish-0, crawfish_out-0, withdraw-0)
permit-0 (allow-0, let-2, countenance-0)
disagree-0 (differ-0, take_issue-0)
agree-0 (concur-0)
disapprove-0 (refuse_to_approve-0, reject-0)
avoid-0
insist-0 (be_insistent-0, be_firm-0, take_a_firm_stand-0)
accuse-0 (impeach-0, charge-2, incriminate-0, criminate-0)
overpraise-0
cheer-3 (cheer_up-1, jolly_along-0, jolly_up-0)
curse-1 (beshrew-0, damn-0, anathemize-0, imprecate-1, maledict-0)
bless-0 (give_a_benediction_to-0)
misadvise-0 (misadvize-0, misguide-0, advize-2)
guarantee-3 (ensure-0, insure-4, assure-3, secure-0)
apologize-0 (apologise-0)
get_off-1 (cause_to_be_acquitted-0)
complain-0 (plain-0, sound_off-0, express_complaints-0,
express_unhappiness-0,
express_displeasure-0, quetch-0, kvetch-0, express_discontent-1)
determine-0 (find-0, find_out-0, ascertain-1)
determine-1 (check-10, find_out-1, see-0, ascertain-0, watch-9, learn-2)
mean-3 (intend-2, signify-2, stand_for-0)
out-0 (come_out-0, be_disclosed-0, be_revealed-0)
break-5 (get_out-0, get_around-0, be_released-0, become_known-0)
express-0 (utter-1, give_tongue_to-0)
take_a_dare-1 (be_dared-1)
consider-0 (count-3, weigh-0)
air-2
pronounce-1 (articulate-0, enounce-0, enunciate-1, say-2)
utter-2 (emit-0, let_loose-0, express_audibly-0)
address-2 (speak_to-1,
give_a_speech_to-0, speak-3)
take_the_floor-0
correspond-0 (exchange_messages-0, send_messages-0)
affirm-1
complete-0 (fill_out-0)
go_by-0 (go_under-0,
go_under_the_name_of-0)
designate-0 (denominate-0)
agree-4
close_up-0 (clam_up-0, dummy_up-0, shut_up-0, belt_up-0, button_up-0, be_quiet-0, keep_mum-0)
compete-0 (vie-0, contend-0)
move-0 (go-0)
confront-1 (face-1)
meet-0 (encounter-0, play-2, take_on-1)
enter-0 (participate-0)
drop_out-0 (give_up-0, throw_in-0, throw_in_the_towel-0, quit-5, leave-0, admit_defeat-0,
chuck_up_the_sponge-0)
arm-0 (build_up-0, fortify-0, gird-0)
disarm-0 (demilitarize-2,
demilitarise-2)
fight-0 (struggle-0, have_a_fight-0)
fight-1 (oppose-1, struggle_against-0, fight_back-0, fight_down-0, defend-5)
campaign-0 (go_on_a_campaign-0, take_the_field-1, go_off_to_war-0)
lose-0 (fail_to_win-0)
win-0
beat-0 (beat_out-0, defeat-0, crush-0, trounce-0, vanquish-0, overcome-0)
gain-0 (advance-0, win-1, make_headway-0, get_ahead-0, gain_ground-0)
drive_in-0
keep_up-0 (maintain_the_pace-0, maintain_the_level-0)
yield-0 (cease_opposition-0, stop_fighting-0)
submit-0
assail-0 (assault-0, set_on-0, attack-2)
fire-0 (discharge-1)
fire-2 (discharge-2, go_off-0)
trigger-0 (pull_the_trigger_on-0)
retire-0 (put_out-0)
overtake-0 (catch_up_with-0)
consume-0 (ingest-0, take-0, have-0)
use-0 (expend-0)
use-1 (utilize-0, utilise-0, make_use_of-0, put_to_use-0, apply-0, employ-0)
use-2 (use_regularly-0, be_a_user_of-0)
be_full-0 (be_sated-0)
need-1
want-1 (lack-0)
delight_in-0 (take_delight_in-0, enjoy-0, revel_in-0)
go-9
abstain-0 (abstain_from-0, refrain-0, desist-0, desist_from-0,
refrain_from-0)
forgo-0 (give_up-0)
metabolize-0
(produce_by_metabolism-0)
trip-0 (trip_out-0, turn_on-0, get_off-0, get_high-0, get_stoned-0, get_drugged-0)
touch-1 (adjoin-3, meet-0)
touch-0
feel-0 (finger-5)
take-0 (get_hold_of-0)
hold-0 (take_hold-0)
hold-1 (support-0, sustain-0, hold_up-0)
prod-0 (incite-0, egg_on-0)
miss-0
degrade-0
search-0 (seek-0, look_for-0)
kill-0
cover-0
uncover-0
(remove_the_covering_from-0, expose-0)
close-0 (shut-0)
open-0 (open_up-0, cause_to_open-0)
connect-0 (link-0, tie-1,
connect_together-0, put_together-0)
splash-2
spread-0 (distribute-1, extend-1, cause_to_spread-7)
redeploy-0 (deploy_again-0)
gather-0 (garner-0, collect-0)
accumulate-0 (get_together-0, bring_together-4, collect-1, pull_in-1)
beat-1 (beat_up-1)
bat-0 (clobber-0, drub-0, thrash-2, lick-1, beat-2)
bring-2 (be_accompanied_by-0)
percolate-2
receive-0 (take_in-1, invite-12)
let_go_of-0 (let_go-0, release-0)
free-1 (make_free-0, disengage-1)
obstruct-0 (impede-0, block-1, occlude-0, jam-2)
hang-5
hang-6 (hang_over-0)
hang-3
overload-1 (become_overloaded-0)
function-0 (work-2, operate-3, go-0, run-0)
idle-0 (run_idle-0,
run_disconnected-0)
absorb-0 (suck-0, imbibe-1, soak_up-0, sop_up-0, suck_up-0, draw-4, take_in-4, take_up-3)
hang-2 (fall-0)
sit-0
lie-0
collide-1 (cause_to_collide-0)
destroy-0 (ruin-0)
install-1 (instal-1, set_up-4, establish-0)
hold-2 (carry-1, bear-1)
create-0
make-0 (create-0)
unmake-0 (undo-0)
fruit-1
spell-0 (write-3)
play-4
play-5 (run-1)
premier-1 (premiere-1)
enter-0 (come_on_stage-0)
clarion-0 (blow_the_clarion-0)
cultivate-0 (foster_the_growth_of-0)
create-2
calm-0 (calm_down-0, make_calm-0, tranquilize-0, tranquillize-0, quieten-0, lull-0, still-0)
worry-0
affect-0 (impress-1,
make_an_impression_on-0, move-0, strike-0)
feel-0 (experience-0)
embitter-0 (envenom-0, acerbate-0, cause_to_be_bitter-0, make_bitter-0)
grudge-0 (accept_unwillingly-0)
love-0 (feel_deep_affection_for-0)
dislike-0 (feel_distaste_for-0)
like-4
like-5
fear-0 (dread-0)
madden-2 (craze-0, drive_insane-0, drive_mad-1)
rage-0 (be_in_a_rage-0)
repent-1 (atone-0, do_penitence-0)
express_emotion-0
(express_feelings-0)
attract-0 (appeal_to-0, click_with-0)
attract-1 (fetch-0, pull-0, pull_in-0, draw-3, draw_in-0)
despair-0 (abandon_hope-0, lose_hope-0)
gladden-1 (joy-1, make_glad-0)
satisfy-0 (gratify-0)
displease-0 (be_offensive_to-0)
rise-0 (be_lifted-0)
discourage-0
enjoy-0 (bask_in-0, relish-0, savor-0, savour-0)
bore-0 (tire-1)
begrudge-0 (wish_ill-0, resent-1)
desire-0 (want-0)
flare-0 (flare_up-0, erupt-1)
move-0 (change_position-0)
stand_still-0 (hold_still-0, be_immobile-0, be_fixed-0)
mire-1 (bog_down-1)
travel-0 (go-0, move-3, locomote-0)
travel-1 (take_a_trip-0,
make_a_trip-0, take_trips-0, trip-2, jaunt-0)
visit-1 (inspect-0)
fly-7
stay_in_place-0
go-1 (go_away-5, depart-4, travel_away-0)
come-0 (come_up-2)
move-1 (displace-2, make_move-0)
move-2 (change_residence-0)
start-1 (start_up-0, set_in_motion-0)
stop-1 (halt-5)
stop-0 (halt-1, come_to_a_halt-0, stop_moving-0)
stop-2 (stop_over-0,
interrupt_a_trip-0)
start-0 (go-9, get_going-0)
beat-3
call-0 (call_off-0)
trip-1 (trip_up-0, cause_to_stumble-0)
levitate-0 (hover-1)
jump-1 (cause_to_jump-0)
down-0 (shoot_down-0, land-6)
back-1 (cause_to_travel_backward-0)
lead-1 (take-9, direct-0, conduct-1, guide-0)
arrive-0 (get-0, come-4)
stay-1 (remain_behind-0)
enter-0 (come_in-2, get_into-0, get_in-1, go_into-0, go_in-0, move_into-0)
reach-1 (attain-1, get_through_to-0, make-0, get_to-1, hit-0, arrive_at-0, gain-0)
meet-1 (ran_into-1, forgather-0, foregather-0, encounter-0,
run_across-0, come_across-0, see-0)
separate-1 (divide-0)
overarch-0 (arch_over-0)
dress-8 (bring_into_line-0)
pass-4 (make_pass-0)
flow-2
bring_in-0 (introduce-0)
stampede-1
record-0 (register-0)
feel-0 (sense-0, perceive-0, pick_up-0)
experience-0 (receive-3, have-6, get-0, undergo-0)
hit-0 (strike-0, come_to-0)
sensitize-0 (cause_to_sense-0, make_sensitive-0)
notice-0 (mark-0, note-0)
note-2 (observe-1,
observe_with_care-0)
ignore-0 (fail_to_notice-0)
cause_to_be_perceived-0
reach_one's_nostrils-0
sniff_out-0 (scent_out-0, smell_out-0, nose_out-0)
handle-0
miss-0 (fail_to_perceive-0)
discover-0 (see_for_the_first_time-0)
watch-2 (look_on-0)
look-0
see-4 (watch-3)
sound-3 (give_off_sound-0)
show-0 (make_visible-0,
make_noticeable-0,
cause_to_appear-0,
cause_to_be_seen-0)
hide-0 (conceal-1)
hide-1 (be_in_hiding-0)
conceal-0 (hold_back-0, hold_in-0)
demonstrate-0
(give_a_demonstration_of-0, show-3)
look_at-0 (take_a_look_at-1, examine-0, examine_by_sight-0)
watch-0 (look_attentively-0)
watch-1 (look_out-0, watch_out-0)
produce-0 (bring_on-0, bring_out-1)
study-0 (consider-0)
bethink-0
blind-1
sound-1 (cause_to_sound-0, cause_to_make_a_sound-0)
assault_the_ear-0
split_the_ears-0
(split_the_eardrums-0)
deafen-1
season-0 (flavor-0, flavour-0, give_flavor-0)
recognize-1 (distinguish-0, discern-0, pick_out-0, make_out-0, tell_apart-0)
taste-2 (savor-2, savour-2, have_flavor-0)
lose-0
greet-0
give-1 (gift-0, present-0,
give_as_a_present-0,
make_a_present_of-0)
have-0 (have_got-0, hold-0)
own-0 (have-4, possess-0,
have_possession_of-0)
have-1 (have_left-0)
take-0 (take_away-0)
take-1
take-15 (accept-12)
get-0 (acquire-0, get_hold_of-0)
transfer-0
get_rid_of-1 (remove-0)
abandon-1 (give_up-0)
refuse-0 (reject-0, pass_up-0, turn_down-0, decline-0)
take_it_or_leave_it-0
(reject_or_accept-0)
sell_for-0 (fetch-0, go_for-0, bring_in-0, bring-0)
find-2 (happen_upon-1,
chance_upon-1, hit_upon-0,
bump_into-0, encounter-0, run_into-0, come_across-1, come_upon-2)
owe-1
trade-1 (deal_in-0, merchandise-0)
account-0 (keep_an_account_of-0, calculate-0)
save-1 (lay_aside-0, save_up-0)
save-2 (spend_less-0)
break_even-0
lose-1
(miss_from_one's_possessions-0, lose_sight_of-0)
lose-2 (fail_to_keep-0,
fail_to_maintain-0)
lose-0 (fail_to_get-0)
lose-6 (lose_money-0, make_a_loss-0, fail_to_profit-0)
offer-1 (bid-0, tender-2)
give-3 (cause_to_have-0)
grant-5 (give-11)
rid-0 (free-2, disembarrass-0)
leave-0 (leave_behind-1)
act-0 (move-0, take_measures-0, take_steps-0, take_a_step-0, take_action-0, perform_an_action-0, do_something-0)
lie_dormant-0 (be_inactive-0)
start-0 (take_up-0)
install-0 (put_into_office-0)
take_orders-1 (be_ordained-0)
remove-0
take_out-1 (move_out-0, remove-2)
succeed-1 (come_after-0, follow-1)
precede-0 (precede_in_office-0, come_before-0)
hire-0 (engage-1, employ-0, give_employment_to-0)
retain-1 (continue-0, keep-2, keep_on-0)
work-0 (do_work-0)
get_off-0 (be_released_temporarily-0)
work-2 (exert_effort-0, exert_oneself-0)
go_to_work-0 (start_working-0)
idle-0 (laze-0, stagnate-0, twiddle_one's_thumbs-0, be_idle-0)
play-0 (amuse_oneself-0)
play-3
free-0 (liberate-2, release-0, let_out-0, set_free-0, turn_loose-0, unloose-0, loose-0)
free-2 (free_from_duty-0, discharge-1)
let-0 (allow-0, permit-0)
give_up-0 (allow-1)
oppress-0 (suppress-1, crush-0)
open-0 (open_up-0)
close-0 (fold-0, shut_down-0, close_down-0)
abolish-0 (get_rid_of-0)
preside-1 (chair-1)
separate-2 (part-0, split_up-1, split-0, break_up-0)
join-0 (fall_in-0, get_together-2)
disorganize-0
control-0 (command-0, have_control_over-0, have_power_over-0)
decertify-0 (derecognize-0)
be-0 (work-6)
prevent-0 (keep-1)
prevent-1 (forestall-1, foreclose-0, preclude-0)
refrain_from-0 (forbear_from-0, avoid-3, desist_from-0, abstain_from-0, keep_from-0)
appoint-0 (charge-0)
cancel-3 (call_off-0)
desegregate-0 (integrate-0, mix-0)
meet-1 (get_together-1)
send_in-0
confine-0 (deprive_of_freedom-0, detain-0)
arraign-0
punish-0 (penalize-0)
get_it-0
catch_it-0
reward-0 (give_a_reward_to-0)
indulge-1
do-3 (manage-2)
fail-1 (flunk-0, bomb-0, flush_it-0)
succeed-0 (come_through-0)
fail-0 (go_wrong-0, miscarry-0)
fail-2 (neglect-0)
waive-0 (relinquish-0, forgo-0, foreswear-0, dispense_with-0)
woo-0 (court-0, romance-0, solicit-0)
woo-1 (court-1)
take_the_stage-0 (take_stage-0)
rear-0 (raise-0, bring_up-0, nurture-0, parent-0)
dishonor-0 (disgrace-0, dishonour-0, attaint-0, shame-0)
deliver-3 (redeem-4, save-2)
save-0 (carry_through-0, pull_through-0, bring_through-0, bring_into_safety-0)
support-0 (back_up-0,
lend_support_to-0, give_aid_to-0)
effect-0 (carry_out-0, make-0, do-1)
exempt-0 (relieve-2, free-7, release_from_obligation-0, free_from_a_rule-0)
practice-0 (practise-0, exercise-0, carry_out-3, do-2)
observe-2 (celebrate-1, keep-5)
observe-4 (keep-3)
prosecute-0 (be_the_prosecutor_of-0)
defend-0 (represent-6)
stampede-1
rest-0
meet-3 (get_to_know-0, get_acquainted-0)
stag-0
come_near-0
mingle-0 (get_involved-1, get_mixed_up-0)
appear-3
assemble-3 (gather-2, get_together-3)
exist-0 (be-0)
be-3 (have_the_quality_of_being-0)
begin-0 (start-0)
end-0 (finish-0, terminate-0)
be-4 (occur-0)
be-1 (live-0, have_life-0)
live-6 (lead_a_life-0)
be-6 (be_identical_to-1)
exist-1 (survive-0, live-1, subsist-0)
go-3
survive-1 (last-1, live-4, go-14, endure-0, hold_up-0, hold_out-0)
last_out-0 (stay-3, ride_out-0, outride-0)
outlive-0 (outlast-0, survive-3)
constitute-0 (represent-0, make_up-0, be-2)
separate-0 (divide-0)
connect-0 (link-0, join-0, unite-0)
become-0
originate_in-0 (come_from-0, hail_from-0, be_from-0)
necessitate-0 (ask-0, need-0, require-0, take-0, involve-7, call_for-0, demand-0)
obviate-0 (rid_of-0, eliminate-1)
have-0 (feature-0)
miss-0 (lack-0)
miss-2
include-0 (be_made_up_of-0)
wait-0 (stay_in_one_place-0)
hesitate-0 (waver-0, swiver-0)
predominate-0 (dominate-0, rule-0, reign-0, prevail-2)
go-6
be-5 (occupy_a_certain_position-0, occupy_a_certain_area-0)
conform-6
equal-0 (be_identical_to-0, be-7)
differ-0
violate-0 (fail_to_agree_with-0, go_against-0, break-0, be_in_violation_of-0)
exceed-1 (transcend-0, go_beyond-1, surpass-1)
fall_short_of-0 (fail_to_satisfy-0)
unbalance-0
excel-0 (stand_out-0, surpass-0)
refer-0 (pertain-1, relate-0, concern-0, come_to-3, bear_on-0, be_about-0, touch-0, touch_on-0,
have_to_do_with-0)
concern-1 (interest-1, occupy-4, worry-0)
discontinue-0 (stop-0, cease-0, give_up-0, quit-4, lay_off-0)
keep-0 (maintain-0, hold-0)
roll-0 (undulate-0)
lead-1
go-12
go-13
yield-0 (relent-0, soften-0)
straddle-0 (be_noncommittal-0)
lend_oneself-0 (be_applicable-0, apply-1, be_subject-0)
defy-1 (resist-1, refuse-0)
spend-0 (pass-0)
diverge-0
(extend_in_a_different_direction-0)
converge-0 (meet-2, be_adjacent-0)
depend_on-0 (devolve_on-0, depend_upon-0, ride_on-0, turn_on-0, hinge_on-0, hinge_upon-0)
predate-0 (precede-0, forego-0, antecede-0, antedate-0)
postdate-0 (follow-0)
stick_out-1 (protrude-0, jut_out-0, project-0)
attach_to-1 (attend-1, accompany-0, come_with-0, go_with-1)
sulk-0 (pout-0, brood-0)
can-0
can-1 (may-1, might-1)
must-0 (have-5, have_got-0, need-1)
should-1 (had_better-0, ought-1)
must-1 (have-8)
shall-0 (will-0)
should-0 (ought-0, must-3, need-2)
would-0
may-0
must_not-0 (may_not-0)
could-0 (might-0)
belong_to-0 (be_part_of-1)
follow-3
play-0
should-2
refrain-0 (forebear-0, forbear-0)
sell-0
persist-1 (remain-1, stay-4)
accommodate-3 (hold-5)
go_down-0
photograph-0
go_in-0 (be_installed-0)
go_into-0
derive-0 (descend-0, come_from-1)
have-12 (deal_with-2)
hold_one's_own-0
hang-1
range-3
admit-0
agree-3
draw-0
drive-0 (ride-3)
mean-3
precipitate-0 (come_down-0, fall-0)
ice_up-0 (frost_over-0, ice_over-0)
extinguish-0 (obliterate-0, put_out-0)
burn-2 (cause_to_burn-0)
shine-0 (emit_light-0, be_bright-0)
absorb-0 (take_in-0)
emit-0 (give_out-0, give_off-0)
blow-0 (be_blowing-0)
storm-1
thunder-0 (boom-0)
clear_up-0 (clear-0, light_up-0, brighten-0)
Una clara implicación de este número de primeros niveles de jerarquía es que la taxonomía de verbos no es tan profunda como la de los sustantivos. La capacidad de atravesar la estructura de verbos por distintos niveles de nodos es muy inferior.
Finalmente, la distribuciones de relaciones para adjetivos y adverbios es la siguiente:
Uso de punteros en ADJ.DAT
Puntero | Uso (relación) | Entre synsets | Entre palabras | Mixto | Total | Synsets donde ha sido usado | Máx. Nº de Punteros |
! | Antónimo | 4 | 3744 | 0 | 3748 | 3561 | 3 |
& | Similar a | 20050 | 0 | 0 | 20050 | 12583 | 71 |
\ | Pertenece a | 0 | 3537 | 2 | 3539 | 2832 | 6 |
= | Atributo | 636 | 0 | 0 | 636 | 616 | 2 |
^ | Ver también (Also see) | 2686 | 0 | 0 | 2686 | 1303 | 8 |
Uso de punteros en ADV.DAT
Puntero | Uso (relación) | Entre synsets | Entre palabras | Mixto | Total | Synsets donde ha sido usado | Máx. Nº de Punteros |
! | Antónimo | 0 | 704 | 0 | 704 | 617 | 4 |
\ | Pertenece a | 1 | 2886 | 7 | 2894 | 2169 | 7 |
La organización de los adjetivos (como núcleo, head, y satélites) puede considerarse como un tipo de taxonomía. Tanto los adjetivos como los adverbios están organizados a través de las relaciones de sinonimia y antonimia y derivación con cambio de categoría.
Como hemos podido ver, WordNet 1.5 distingue las tres siguientes relaciones meronímicas:
Merónimo | Holónimo | Meronimia tipo |
Merónimo Miembro | Holónimo Miembro | Miembro-colección |
Merónimo Substancia | Holónimo Substancia | Substancia-objeto |
Merónimo Parte | Holónimo Parte | Parte-Objeto integrado |
Podemos, a modo de ejemplo, citar las siguientes relaciones en las que se muestra la utilización de estos tipos de meronimias.
Parte-Objeto Integrado | Sense 2 flower, bloom, blossom -- (reproductive organ of angiosperm plants esp. one having showy or colorful parts)
|
Miembro-Colección | Sense 1 womankind -- (women as distinguished from men)
|
Substancia-Objeto | Sense 1 glassware, glasswork -- (articles made of glass)
|
Una característica importante de WordNet que debemos mencionar es el uso de la herencia de las propias relaciones meronímicas, no explícitamente1 de otras propiedades. Este uso consiste en utilizar la relación de hiponimia como esqueleto para heredar relaciones meronímicas. Supongamos que tenemos los siguientes merónimos:
Vehículo rodado (rueda, dirección)
Automóvil (chasis, motor, techo, chapa, rueda, dirección, freno, ...)
Descapotable (chasis, motor, chapa, rueda, dirección, freno, ...)
La redundancia que puede llegar a darse mediante la repetición de las partes similares, tanto de hipónimos y como de hiperónimos, puede evitarse mediante la distribución de los merónimos en los distintos niveles jerárquicos de hiperónimos e hipónimos, de tal manera que sólo hereden las relaciones meronímicas aquellos que se hallan por debajo en la jerarquía:
Este tipo de diseño, sin duda preferible a la excesiva redundancia que supondría repetir cada una de las relaciones para cada uno de los nodos, impone nuevas restricciones al diseño de la red semántica, pues depende de cómo esté organizada la jerarquía, lo merónimos se heredarán correcta o incorrectamente. La selección de hipónimos irá pues también en función de la capacidad y corrección de heredar ciertas meronimias, no sólo propiedades y atributos.
Entre otras decisiones tomadas en WordNet para la clasificación y representación de ciertas meronimias, podemos destacar que los nombres geográficos se conectan mediante la relación has parts (Madrid es parte de España), al igual que las partes denominadas componente-objeto (El ventilador es parte del procesador). Sin embargo, parece que su capacidad de herencia es distinta en ambos casos, así como el tipo de inclusión, ya que en el segundo caso entre «ventilador» y «procesador» parece existir una intersección:
Madrid - España - Europa - Eurasia
Ventilador - Procesador - Ordenador
Por otra, parte debemos mencionar el hecho de que la clasificación biológica (clase, género, tipo, género, especie) se representa mediante la relación miembro-colección (has member). Las unidades de medida también son consideradas como componente-objeto, cuando todo indica que existe una motivación para la existencia de la meronimia porción-masa, sobre todo en cuanto al grado de predicción de herencia de propiedades.
Concluiremos esta sección diciendo que WordNet ha sido un revulsivo para el estudio de la Semántica Léxica y su aplicación en la Semántica Computacional.
NOTAS
1 De hecho, el carácter psicolingüístico de los criterios de construcción de WordNet hace que el diseño de la red tenga en cuenta más el punto de vista de las inferencias lógicas que el punto de vista de la herencia de propiedades.
Anterior I Siguiente I Índice capítulo 3 I Índice General
ISSN: 1139-8736 Depósito Legal: B-25223-99 |