ISSN: 1139-8736
Depósito Legal: B-25223-99

3.3.2. WordNet

     WordNet es una base de datos que contiene una red semántica del inglés y ha sido desarrollada por George Miller y su grupo de investigación en la Universidad de Princeton (Miller et al. 1993). Está diseñada utilizando un modelo semántico relacional y una base de datos también relacional y ha sido elaborada desde el punto de vista de la Psicolingüística. Está considerada como la red semántica del inglés (o de cualquier otra lengua) más completa que existe.

    En esta sección no sólo vamos a describir WordNet a partir de la documentación existente, sino también a partir de un estudio directo sobre esta base de datos relacional. Esto es debido a que no todas las relaciones que describe la documentación son utilizadas en realidad en la base de datos. En palabras de Bloksma, Díez-Orzas & Vossen (1996:33):

Not all the relations described in the documentation of WordNet1.5 (Miller et al 1993) also occur in the database. The documentation gives the theoretical background for the architecture of their database rather than a description of the actual relations. For example, in the papers 7 types of meronymy relations are mentioned while in practice only three occur in the database (Díez-Orzas 1996). Similarly, for verbs a detailed hierarchy of entailment relations is described while in practice mostly hyponymy relations are present with incidental entailment and causal links. To describe the content of WordNet 1.5 we therefore use the description of the WN1.5 database by Díez-Orzas (1996).

    En las páginas siguientes presentaremos una descripción y algunas estadísticas del contenido de WordNet, versión 1.5. Estas estadísticas son el resultado de haber procesado todos los datos contenidos en WordNet 1.5.

    Los elementos primitivos de WordNet 1.5 son tres: Words (palabras, cadenas de caracteres), Meanings (significados, synsets, esto es, conjuntos de sinónimos, representados por un número identificador) and Relationships (relaciones, punteros relacionales). Otro tipo de informacion, como categoría gramatical, esquemas de subcategorización verbal y marcadores sintácticos para adjetivos, forma parte también de esta base de datos, WordNet 1.5.

    Las estadísticas que proporcionamos a continuación están organizadas en torno a estos tres niveles (words, meanings y relationships o pointers). Comentaremos también algunos aspectos relevantes al respecto.

 
Word Forms y Word Meanings

    Vamos a presentar como punto de partida la cantidad de word forms (palabras) y word meanings (significados o synsets) que contiene WordNet 1.5. Presentamos en primer lugar el número de synsets y el total de palabras ligadas a cada uno de esos synsets por categoría gramatical:

    Cantidades globales de WordForms/Synsets

ARCHIVO SYNSETS miembros de los synsets
( Wordforms)
Noun.dat 60557 107484
Verb.dat 11363 25768
Adj.dat 16428 28762
Adv.dat 3243 6203
Total 91591 168217

     Las cantidades de la columna de la derecha, WORDFORMS (miembros de los synsets), no muestran el número total de formas léxicas únicas, sino todas las palabras que son parte de los synsets, es decir, una palabra con polisemia 2, vendrá dos veces. The media de sinonimia, o unidales léxicas por synset para todas las categorías gramaticales es de 1.8, siendo los verbos los más ricamente representados en los synsets. Por otra parte, la riqueza de los synsets de sustantivos es muy desigual, pero no necesariamente errónea (a causa de los sublenguajes o vocabulario no general en WordNet 1.5). El número de palabras por synset y por categoría gramatical puede presentarse también de la siguiente manera:

    Cómputo general de Word-Form/Synset

Cómputo

SUSTANTIVOS

VERBOS

ADJETIVOS

ADVERBIOS

1

30629

3719

9476

1559

2

19766

4167

4193

941

3

6208

1922

1499

443

4

2406

795

643

172

5

860

374

300

79

6

390

167

152

23

7

163

94

59

12

8

67

52

43

6

9

27

28

32

3

10

12

13

10

3

11

8

8

6

1

12

7

7

6

1

13

4

7

4

0

14

5

2

2

0

15

2

1

0

0

16

0

1

1

0

17

0

2

0

0

18

1

1

0

0

20+

2

3

2

0

Total

60557

11363

16428

3243

     La cantidad de unidades léxicas (word forms) únicas (tanto palabras simple como expresiones lexicalizadas o palabras múltiples) que hay en WN 1.5 es:

    Palabras simples/múltiples

ARCHIVO PALABRAS MÚTIPLES PALABRAS SIMPLES TOTAL
Noun.idx 43731 43911 87642
Verb.idx 7039 7688 14727
Adj.idx 747 18354 19101
Adv.idx 1499 3551 5050
Total 53016 73504 126520

    Como muestra esta tabla, la distribución entre palabras simples y múltiples es de un 58.1% para las palabras simples y un 41.9% para las múltiples, pero para sustantivos y verbos el porcentaje es casi de un 50%. Podemos decir que el enfoque psicolingüístico explica estas cifras en gran medida. Posiblemente, un enfoque más lexicográfico hubiera proporcionado una distribución muy diferente, lo que puede significar además que existe una gran necesidad de utilizar también estructuras conceptuales no lexicalizadas. Desgraciadamente, no poseemos estadísticas que revelen cuántas palabras múltiples están lexicalizadas y cuántas no. Por otra parte, con respecto a las aplicaciones de este recurso, en la recuperación de información, por ejemplo, el hecho de que existan expresiones no lexicalizadas ayuda a ver más claramente las taxonomía a los usuarios no expertos.

    Con respecto a la polisemia en WordNet 1.5, hemos analizado los archivos *.idx y hemos obtenido los siguientes resultados (debemos decir que las unidades léxicas aquí son cadenas de caracteres de acceso (access strings), no palabras únicas, por ejemplo, state and State tendrán una sola cadena de caracteres de acceso:

     Cómputo general de Synsets de Noun.idx. Synsets por WordForm (access string)

Synsets por Access String

Nº de Access String con ese Nº de Synsets

Nº parcial de Synsets

1

76128

76128

2

7618

15236

3

2081

6243

4

824

3296

5

422

2110

6

227

1362

7

123

861

8

81

648

9

49

441

10

23

230

11

22

242

12

14

168

13

9

117

14

9

126

15

3

45

16

4

64

17

1

17

19

1

19

20

1

20

24

1

24

27

1

27

Total

87642

107424

    Cómputo general de Synsets de Verb.idx. Synsets por WordForm (access string)

Synsets por Access String

Nº de Access String con ese Nº de Synsets

Nº parcial de Synsets

1

10033

10033

2

2411

4822

3

975

2925

4

507

2028

5

289

1445

6

182

1092

7

96

672

8

65

520

9

44

396

10

26

260

11

24

264

12

9

108

13

15

195

14

3

42

15

11

165

16

4

64

17

7

119

18

7

126

19

2

38

20

2

40

21

4

84

25

3

75

26

1

26

27

2

54

28

1

28

31

1

31

33

1

33

35

1

35

41

1

41

Total

14727

25761

    Cómputo general de Synsets de Adj.idx Synsets por WordForm (access string)

Synsets por Access String

Nº de Access String con ese Nº de Synsets

Nº parcial de Synsets

1

13798

13798

2

3296

6592

3

1105

3315

4

411

1644

5

197

985

6

120

720

7

56

392

8

28

224

9

25

225

10

11

110

11

14

154

12

10

120

13

6

78

14

8

112

15

5

75

16

4

64

17

4

68

18

1

18

26

1

26

29

1

29

Total

19101

28749

    Cómputo general de Synsets de Adv.idx. Synsets por WordForm (access string)

Synsets por Access String

Nº de Access String con ese Nº de Synsets

Nº parcial de Synsets

1

4279

4279

2

554

1108

3

131

393

4

48

192

5

20

100

6

6

36

7

5

35

8

6

48

10

1

10

Total

5050

6201

     Cómputo total de Synsets por WordForm (access string)

Archivo

Nº total de WordForms (Access Strings)

Nº total de Synsets asociados a WordForms (Access strings)

Noun.idx

87642

107424

Verb.idx

14727

25761

Adj.idx

19101

28749

Adv.idx

5050

6201

Total

126520

168135

     De acuerdo con esta última tabla y considerando el hecho de que estamos tratando con cadenas de caracteres de acceso, access strings, y no con unidades léxicas, la media total de polisemia es 1.32. Esta media se explica por la diferencia de polisemia entre léxico central, general o de uso y el vocabulario más específico o terminológico en el cual no es tan ambiguo.

Otras piezas clave de información que contienen los synsets son las glosas (glosses, breve definición con ejemplos). Hemos detectado un enorme esfuerzo del equipo de Miller para proporcionar glosas al mayor número posible de synsets, pero no a todos:

     Información sobre las glosas

ARCHIVO SYNSETS Nº de Glosas Con ejemplos
NOUN.DAT 60557 51253 3792
VERB.DAT 11363 8847 3097
ADJ.DAT 16428 13460 9507
ADV.DAT 3243 3145 2973
Total 91591 76705 19369

    El número de ejemplos es mucho menor que el número de glosas y, en muchos casos, sobre todo en los verbos, las glosa consiste en un ejemplo de uso.

   Relaciones

    La tercera entidad son las relaciones o los punteros relacionales, que expresan distintas relaciones semántico-léxicas. Estas relaciones afectan de distinta manera a unas categorías gramaticales y a otras, es decir, podemos dividir las relaciones semánticas entre las que conectan dos synsets con la misma categoría gramatical, por ejemplo dos sustantivos, y las que conectan dos synsets con distinta categoría. La siguiente tabla muestra una visión general de las relaciones o punteros relacionales que contiene WordNet 1.5.

    Relaciones

RELACIÓN PUNTERO SUST.
(n)
VERBOS
(v)
ADJECTIVOS
(a,s)
ADVERBIOS
(r)
Antónimo

!

Hiperónimo

@

NO

NO

Hipónimo

~

NO

NO

Merónimo Miembro

#m

NO

NO

NO

Merónimo Substancia

#s

NO

NO

NO

Merónimo Parte

#p

NO

NO

NO

Holónimo Miembro

%m

NO

NO

NO

Holónimo Substancia

%s

NO

NO

NO

Holónimo Parte

%p

NO

NO

NO

Atributo

=

NO

NO

Implica (Entailment)

*

NO

NO

NO

Causa

>

NO

NO

NO

Ver también (Also see)

^

NO

NO

Pertenece a
(morfológica)

\

NO

NO

NO

Derivado de
(morfológica)

\

NO

NO

NO

Similar a

&

NO

NO

NO

     Los punteros semánticos que conectan a significados con la misma categoría gramatical son:

Antónimo
Hiperónimo
Hipónimo
Merónimo Miembro
Merónimo Substancia
Merónimo Parte
Holónimo Miembro
Holónimo Substancia
Holónimo Parte
Implica (Entailment)
Causa
Ver también (Also see)
Similar a

     Las relaciones que conectan significados con distinta categoría son:

Atributo (Attribute) entre sustantivos y adjetivos
Pertenece a (morfológica) de adjetivo a sustantivo
Derivado de (morfológica) de adverbio a adjetivo

     Para cada categoría gramatical la distribución y, consecuentemente, la red resultante y las formas que forman las jerarquías cambian. Aquí, mostraremos tan sólo cómo se distribuye el uso de punteros para cada categoría gramatical:

    Uso de punteros en NOUN.DAT

Puntero Relación Entre synsets Entre palabras Ambos Total Synsets donde aparecen Máximo en un synset
! Antónimo 0 1711 2 1713 1574 4
@ Hiperónimo 61123 0 0 61123 60546 4
~ Hipónimo 61123 0 0 61123 13447 395
#m Merónimo Miembro 11472 0 0 11472 11382 4
#s Merónimo Substancia 366 0 0 366 309 5
#p Merónimo Parte 5695 0 0 5695 4922 27
%m Holónimo Miembro 11472 0 0 11472 5250 176
%s Holónimo Substancia 366 0 0 366 327 5
%p Holónimo Parte 5695 0 0 5695 2721 65
= Atributo 636 0 0 1713 326 8

    Hay once nodos de partida o ‘topes’ (primer nivel en la jerarquía) que estructuran la taxonomía de sustantivos en once jerarquías:

{entity-0}
{psychological_feature-0}
{abstraction-0}
{location-0}
{shape-0, form-0}
{state-0}
{event-0}
{act-0, human_action-0, human_activity-0}
{group-0, grouping-0}
{possession-0}
{phenomenon-0}

    La estructura o nivel más profundo tiene 15 niveles. Existen también múltiples hiperónimos en WN1.5 (4 es el número máximo de hiperónimos de un synset).

     Uso del puntero en VERB.DAT

Puntero Relación Entre synsets Entre palabras Ambos Total Synsets donde aparecen Máximo en un synset
! Antónimo 0 1025 0 1025 981 2
@ Hiperónimo 10817 0 0 10817 10790 3
~ Hipónimo 10817 0 0 10817 2917 289
* Implica (Entailment) 435 0 0 435 416 3
> Causa 204 0 0 204 201 2
^ Ver también (Also see) 4 829 7 840 401 25

     Hay 573 ‘topes’ que estructuran la taxonomía de verbos:

breathe-0 (take_a_breath-0, respire-0)
act-0 (behave-0)
rest-0 (repose-0, be_quiescent-0)
be_active-0 (move-6)
oversleep-0
nod-3
fall_asleep-0 (dope_off-0, flake_out-0,
drift_off-0, go_to_sleep-0, nod_off-0,
drop_asleep-0, drop_off-0, doze_off-0,
drowse_off-0)
go_to_bed-0 (turn_in-0, crawl_in-0,
kip_down-0, hit_the_hay-0,
hit_the_sack-0, get_into_bed-0,
sack_out-0, go_to_sleep-1, retire-0)
get_up-0 (turn_out-0, arise-0, rise-8,
get_out_of_bed-0)
wake-0
sedate-0 (calm-0, tranquilize-0,
tranquillize-0)
break_down-0 (collapse-0)
look-0 (appear-0)
wear-0 (have_on-0)
propagate-1
bear-0 (carry-0, expect-0)
carry_to_term-0
purge-0
keep_down-0
treat-0 (care_for-0)
relapse-0 (lapse-0, recidivate-0,
regress-0, retrogress-0, fall_back-0)
exercise-0 (work_out-0)
etiolate-0 (make_pale-0, make_sickly-0)
discharge-0 (expel-0, eject-0, release-1)
change-0
keep_up-0 (keep_abreast_of-0, follow-1)
change-2 (alter-0, vary-1)
change-1 (alter-1)
leave-2 (leave_unchanged-0, leave_unaltered-0)
remove-0 (take-0, take_away-1)
add-0
insert-0 (stick_in-0, put_in-0,
introduce-3)
decay-0 (fall_into_decay-0,
crumble_away-0, delapidate-0,
fall_into_ruin-0)
strengthen-0 (get_strong-0,
become_strong-0, become_stronger-0,
gain_strength-0)
weaken-0 (die_down-2, get_weak-0, get_weaker-0, become_weak-0)
die-2
grow-1 (cause_to_grow-0)
leak-0 (have_a_leak-0)
color-0 (give_color_to-0)
untune-0 (put_out_of_tune-0)
happen-0 (hap-0, go_on-0, pass_off-0, occur-0, pass-0, come_to_pass-0, come_about-0, take_place-0)
anticipate-0 (occur-2)
begin-0 (start_out-0, start-0, set_about-0, set_out-0, commence-0)
begin-1 (start-1, commence-1, set_in_motion-0, cause_to_start-0)
go_on-1 (continue-0, go_along-0, persist_in-0)
root-0 (take_roots-0, take_root-0)
leave-3 (leave_behind-0,
be_survived_by-0)
condense-0 (concentrate-7, contract-3)
cool-2 (cool_off-0, cool_down-2)
demagnetize-0 (degauss-0, make_nonmagnetic-0)
settle-0 (locate-0, relocate-0, take_up_residence-0)
settle-1 (form_a_community-0)
set_in-0 (become_established-4)
appear-0
appear-2 (come_along-0)
disappear-0 (vanish-0, go_away-0)
decelerate-1 (slow_down-2)
accelerate-1 (speed_up-1)
decelerate-0 (slow-0, slow_down-0, slow_up-1, retard-0)
flush-3
rush-1 (hurry-1)
stimulate-0 (excite-0)
seethe-3 (foam-1)
issue-0 (emerge-2, come_out-4, come_forth-0)
flow_out-0 (emanate-0, effuse-1, flow_forth-0)
turn_to-0
switch-2 (shift-2, change-5)
disrupt-1
understand-0
understand-1 (realize-0, see-1)
click_with-0 (came_to-0, click-0,
get_through-0, dawn_on-0,
come_home_to-0, get_across-0,
sink_in-0, penetrate-1,
fall_into_place-0)
resonate-0 (be_received-0,
come_across-0)
sympathize-0 (empathize-0, understand-4)
know-0
know-1 (cognize-0)
ignore-1 (be_ignorant_of-0)
know-2 (be_convinced_of-0, be_certain_of-0)
know-3 (have_a_familiarity_with-0, have_experience_with-0,
have_a_grasp_of-0)
master-0 (control-0, get_hip_to-0)
master-1 (get_the_hang_of-0,
have_a_mastery_of-0,
be_proficient_in-0, be_skilled_in-0)
learn-0 (larn-0, acquire_knowledge-0, gain_knowledge-0, acquire_skills-0)
learn-1 (hear-0, get_word-0,
get_wind_of-0, pick_up-0, find_out-0,
get_a_line_on-0, hear_about-0, hear_of-0, get_to_know-0, discover-1, become_aware_of-0, see-2)
learn-2 (study-0, read-5, take-2)
plunge-1 (immerse-1)
welter-0
study-3 (be_a_student-0)
remember-0 (retrieve-0, recall-0, call_back-0, recollect-0, remind-1, know-5, think-2)
think-8
slip-1 (escape_from_memory-0, slip_one's_mind-0)
forget-0 (blank_out-0,
draw_a_blank-0,
be_unable_to_remember-0, fail_to_remember-0)
come_to_mind-0 (spring_to_mind-0)
remember-1 (think_of-0)
forget-1 (put_out_of_mind-0, bury-0, dismiss_from_the_mind-0, stop_remembering-0)
remind-0
remember-2 (think_back-0)
commemorate-0 (remember-9)
abandon-1 (give_up-0)
leave-5 (leave_behind-5)
neglect-0 (leave_undone-0, omit-0, drop-0, miss-0, leave_out-0, overlook-0, overleap-0)
neglect-5 (fail_to_attend_to-0)
err-0 (mistake-1, make_a_mistake-0, commit_an_error-0, slip-0, be_in_the_wrong-0, be_incorrect-0)
confuse-1 (blur-0, obscure-0, make_unclear-0, make_indistinct-0)
confuse-3 (perplex-0, throw-0, fox-0, befuddle-0, fuddle-0, bedevil-0, puzzle-0, mystify-0, baffle-0, bewilder-0, flummox-0, stupefy-0, stupify-0, nonplus-0, gravel-0, amaze-1, dumbfound-0, trounce-0, confound-2, be_confusing_to-0, make_confused-0)
think-0 (cogitate-0, cerebrate-0)
reason-1 (reason_out-0, conclude-0, arrive_at-0,
come_to_the_conclusion-0)
establish-3 (base-0, ground-0, found-0)
get-3
analyze-1 (analyse-1, break_down-0, dissect-0, take_apart-0)
analyze-0 (analyse-0, study-2, examine-0)
identify-1 (discover-3, key-0, key_out-0, distinguish-1, describe-0, name-1)
come_round-0 (come_around-0)
categorize-0
(place_into_a_category-0)
confirm-0 (corroborate-0, sustain-0, substantiate-0, support-0, affirm-0)
judge-0 (form_an_opinion_of-0, pass_judgment_on-0)
choose-2 (prefer-0, opt_for-0,
choose_as_an_alternative-0,
choose_instead-0)
dispose-0 (incline-3,
make_receptive-0, make_willing-0)
indispose-0 (disincline-0,
make_unwilling-0)
decide-0 (make_up_one's_mind-0, decide_upon-0, determine-0)
will-0 (wish-0)
expect-1 (look-0, await-0, wait_for-0, wait-0, look_forward_to-0)
surprise-0 (take_unawares-0, take_by_surprise-0)
observe-0 (keep-0, maintain-0)
arrange-0 (set_up-0, put-0, order-1)
awaken-0
analyze-4
inflict-0 (bring_down-0, visit-1, impose-0, cause_to_be_endured-0)
induce-0 (stimulate-1, cause-0, have-0, get-0, make-0)
convince-1 (assure-1)
rest-1
refuse-0 (decline-0)
retreat-0 (back_out-0, back_away-0, crawfish-0, crawfish_out-0, withdraw-0)
permit-0 (allow-0, let-2, countenance-0)
disagree-0 (differ-0, take_issue-0)
agree-0 (concur-0)
disapprove-0 (refuse_to_approve-0, reject-0)
avoid-0
insist-0 (be_insistent-0, be_firm-0, take_a_firm_stand-0)
accuse-0 (impeach-0, charge-2, incriminate-0, criminate-0)
overpraise-0
cheer-3 (cheer_up-1, jolly_along-0, jolly_up-0)
curse-1 (beshrew-0, damn-0, anathemize-0, imprecate-1, maledict-0)
bless-0 (give_a_benediction_to-0)
misadvise-0 (misadvize-0, misguide-0, advize-2)
guarantee-3 (ensure-0, insure-4, assure-3, secure-0)
apologize-0 (apologise-0)
get_off-1 (cause_to_be_acquitted-0)
complain-0 (plain-0, sound_off-0, express_complaints-0,
express_unhappiness-0,
express_displeasure-0, quetch-0, kvetch-0, express_discontent-1)
determine-0 (find-0, find_out-0, ascertain-1)
determine-1 (check-10, find_out-1, see-0, ascertain-0, watch-9, learn-2)
mean-3 (intend-2, signify-2, stand_for-0)
out-0 (come_out-0, be_disclosed-0, be_revealed-0)
break-5 (get_out-0, get_around-0, be_released-0, become_known-0)
express-0 (utter-1, give_tongue_to-0)
take_a_dare-1 (be_dared-1)
consider-0 (count-3, weigh-0)
air-2
pronounce-1 (articulate-0, enounce-0, enunciate-1, say-2)
utter-2 (emit-0, let_loose-0, express_audibly-0)
address-2 (speak_to-1,
give_a_speech_to-0, speak-3)
take_the_floor-0
correspond-0 (exchange_messages-0, send_messages-0)
affirm-1
complete-0 (fill_out-0)
go_by-0 (go_under-0,
go_under_the_name_of-0)
designate-0 (denominate-0)
agree-4
close_up-0 (clam_up-0, dummy_up-0, shut_up-0, belt_up-0, button_up-0, be_quiet-0, keep_mum-0)
compete-0 (vie-0, contend-0)
move-0 (go-0)
confront-1 (face-1)
meet-0 (encounter-0, play-2, take_on-1)
enter-0 (participate-0)
drop_out-0 (give_up-0, throw_in-0, throw_in_the_towel-0, quit-5, leave-0, admit_defeat-0,
chuck_up_the_sponge-0)
arm-0 (build_up-0, fortify-0, gird-0)
disarm-0 (demilitarize-2,
demilitarise-2)
fight-0 (struggle-0, have_a_fight-0)
fight-1 (oppose-1, struggle_against-0, fight_back-0, fight_down-0, defend-5)
campaign-0 (go_on_a_campaign-0, take_the_field-1, go_off_to_war-0)
lose-0 (fail_to_win-0)
win-0
beat-0 (beat_out-0, defeat-0, crush-0, trounce-0, vanquish-0, overcome-0)
gain-0 (advance-0, win-1, make_headway-0, get_ahead-0, gain_ground-0)
drive_in-0
keep_up-0 (maintain_the_pace-0, maintain_the_level-0)
yield-0 (cease_opposition-0, stop_fighting-0)
submit-0
assail-0 (assault-0, set_on-0, attack-2)
fire-0 (discharge-1)
fire-2 (discharge-2, go_off-0)
trigger-0 (pull_the_trigger_on-0)
retire-0 (put_out-0)
overtake-0 (catch_up_with-0)
consume-0 (ingest-0, take-0, have-0)
use-0 (expend-0)
use-1 (utilize-0, utilise-0, make_use_of-0, put_to_use-0, apply-0, employ-0)
use-2 (use_regularly-0, be_a_user_of-0)
be_full-0 (be_sated-0)
need-1
want-1 (lack-0)
delight_in-0 (take_delight_in-0, enjoy-0, revel_in-0)
go-9
abstain-0 (abstain_from-0, refrain-0, desist-0, desist_from-0,
refrain_from-0)
forgo-0 (give_up-0)
metabolize-0
(produce_by_metabolism-0)
trip-0 (trip_out-0, turn_on-0, get_off-0, get_high-0, get_stoned-0, get_drugged-0)
touch-1 (adjoin-3, meet-0)
touch-0
feel-0 (finger-5)
take-0 (get_hold_of-0)
hold-0 (take_hold-0)
hold-1 (support-0, sustain-0, hold_up-0)
prod-0 (incite-0, egg_on-0)
miss-0
degrade-0
search-0 (seek-0, look_for-0)
kill-0
cover-0
uncover-0
(remove_the_covering_from-0, expose-0)
close-0 (shut-0)
open-0 (open_up-0, cause_to_open-0)
connect-0 (link-0, tie-1,
connect_together-0, put_together-0)
splash-2
spread-0 (distribute-1, extend-1, cause_to_spread-7)
redeploy-0 (deploy_again-0)
gather-0 (garner-0, collect-0)
accumulate-0 (get_together-0, bring_together-4, collect-1, pull_in-1)
beat-1 (beat_up-1)
bat-0 (clobber-0, drub-0, thrash-2, lick-1, beat-2)
bring-2 (be_accompanied_by-0)
percolate-2
receive-0 (take_in-1, invite-12)
let_go_of-0 (let_go-0, release-0)
free-1 (make_free-0, disengage-1)
obstruct-0 (impede-0, block-1, occlude-0, jam-2)
hang-5
hang-6 (hang_over-0)
hang-3
overload-1 (become_overloaded-0)
function-0 (work-2, operate-3, go-0, run-0)
idle-0 (run_idle-0,
run_disconnected-0)
absorb-0 (suck-0, imbibe-1, soak_up-0, sop_up-0, suck_up-0, draw-4, take_in-4, take_up-3)
hang-2 (fall-0)
sit-0
lie-0
collide-1 (cause_to_collide-0)
destroy-0 (ruin-0)
install-1 (instal-1, set_up-4, establish-0)
hold-2 (carry-1, bear-1)
create-0
make-0 (create-0)
unmake-0 (undo-0)
fruit-1
spell-0 (write-3)
play-4
play-5 (run-1)
premier-1 (premiere-1)
enter-0 (come_on_stage-0)
clarion-0 (blow_the_clarion-0)
cultivate-0 (foster_the_growth_of-0)
create-2
calm-0 (calm_down-0, make_calm-0, tranquilize-0, tranquillize-0, quieten-0, lull-0, still-0)
worry-0
affect-0 (impress-1,
make_an_impression_on-0, move-0, strike-0)
feel-0 (experience-0)
embitter-0 (envenom-0, acerbate-0, cause_to_be_bitter-0, make_bitter-0)
grudge-0 (accept_unwillingly-0)
love-0 (feel_deep_affection_for-0)
dislike-0 (feel_distaste_for-0)
like-4
like-5
fear-0 (dread-0)
madden-2 (craze-0, drive_insane-0, drive_mad-1)
rage-0 (be_in_a_rage-0)
repent-1 (atone-0, do_penitence-0)
express_emotion-0
(express_feelings-0)
attract-0 (appeal_to-0, click_with-0)
attract-1 (fetch-0, pull-0, pull_in-0, draw-3, draw_in-0)
despair-0 (abandon_hope-0, lose_hope-0)
gladden-1 (joy-1, make_glad-0)
satisfy-0 (gratify-0)
displease-0 (be_offensive_to-0)
rise-0 (be_lifted-0)
discourage-0
enjoy-0 (bask_in-0, relish-0, savor-0, savour-0)
bore-0 (tire-1)
begrudge-0 (wish_ill-0, resent-1)
desire-0 (want-0)
flare-0 (flare_up-0, erupt-1)
move-0 (change_position-0)
stand_still-0 (hold_still-0, be_immobile-0, be_fixed-0)
mire-1 (bog_down-1)
travel-0 (go-0, move-3, locomote-0)
travel-1 (take_a_trip-0,
make_a_trip-0, take_trips-0, trip-2, jaunt-0)
visit-1 (inspect-0)
fly-7
stay_in_place-0
go-1 (go_away-5, depart-4, travel_away-0)
come-0 (come_up-2)
move-1 (displace-2, make_move-0)
move-2 (change_residence-0)
start-1 (start_up-0, set_in_motion-0)
stop-1 (halt-5)
stop-0 (halt-1, come_to_a_halt-0, stop_moving-0)
stop-2 (stop_over-0,
interrupt_a_trip-0)
start-0 (go-9, get_going-0)
beat-3
call-0 (call_off-0)
trip-1 (trip_up-0, cause_to_stumble-0)
levitate-0 (hover-1)
jump-1 (cause_to_jump-0)
down-0 (shoot_down-0, land-6)
back-1 (cause_to_travel_backward-0)
lead-1 (take-9, direct-0, conduct-1, guide-0)
arrive-0 (get-0, come-4)
stay-1 (remain_behind-0)
enter-0 (come_in-2, get_into-0, get_in-1, go_into-0, go_in-0, move_into-0)
reach-1 (attain-1, get_through_to-0, make-0, get_to-1, hit-0, arrive_at-0, gain-0)
meet-1 (ran_into-1, forgather-0, foregather-0, encounter-0,
run_across-0, come_across-0, see-0)
separate-1 (divide-0)
overarch-0 (arch_over-0)
dress-8 (bring_into_line-0)
pass-4 (make_pass-0)
flow-2
bring_in-0 (introduce-0)
stampede-1
record-0 (register-0)
feel-0 (sense-0, perceive-0, pick_up-0)
experience-0 (receive-3, have-6, get-0, undergo-0)
hit-0 (strike-0, come_to-0)
sensitize-0 (cause_to_sense-0, make_sensitive-0)
notice-0 (mark-0, note-0)
note-2 (observe-1,
observe_with_care-0)
ignore-0 (fail_to_notice-0)
cause_to_be_perceived-0
reach_one's_nostrils-0
sniff_out-0 (scent_out-0, smell_out-0, nose_out-0)
handle-0
miss-0 (fail_to_perceive-0)
discover-0 (see_for_the_first_time-0)
watch-2 (look_on-0)
look-0
see-4 (watch-3)
sound-3 (give_off_sound-0)
show-0 (make_visible-0,
make_noticeable-0,
cause_to_appear-0,
cause_to_be_seen-0)
hide-0 (conceal-1)
hide-1 (be_in_hiding-0)
conceal-0 (hold_back-0, hold_in-0)
demonstrate-0
(give_a_demonstration_of-0, show-3)
look_at-0 (take_a_look_at-1, examine-0, examine_by_sight-0)
watch-0 (look_attentively-0)
watch-1 (look_out-0, watch_out-0)
produce-0 (bring_on-0, bring_out-1)
study-0 (consider-0)
bethink-0
blind-1
sound-1 (cause_to_sound-0, cause_to_make_a_sound-0)
assault_the_ear-0
split_the_ears-0
(split_the_eardrums-0)
deafen-1
season-0 (flavor-0, flavour-0, give_flavor-0)
recognize-1 (distinguish-0, discern-0, pick_out-0, make_out-0, tell_apart-0)
taste-2 (savor-2, savour-2, have_flavor-0)
lose-0
greet-0
give-1 (gift-0, present-0,
give_as_a_present-0,
make_a_present_of-0)
have-0 (have_got-0, hold-0)
own-0 (have-4, possess-0,
have_possession_of-0)
have-1 (have_left-0)
take-0 (take_away-0)
take-1
take-15 (accept-12)
get-0 (acquire-0, get_hold_of-0)
transfer-0
get_rid_of-1 (remove-0)
abandon-1 (give_up-0)
refuse-0 (reject-0, pass_up-0, turn_down-0, decline-0)
take_it_or_leave_it-0
(reject_or_accept-0)
sell_for-0 (fetch-0, go_for-0, bring_in-0, bring-0)
find-2 (happen_upon-1,
chance_upon-1, hit_upon-0,
bump_into-0, encounter-0, run_into-0, come_across-1, come_upon-2)
owe-1
trade-1 (deal_in-0, merchandise-0)
account-0 (keep_an_account_of-0, calculate-0)
save-1 (lay_aside-0, save_up-0)
save-2 (spend_less-0)
break_even-0
lose-1
(miss_from_one's_possessions-0, lose_sight_of-0)
lose-2 (fail_to_keep-0,
fail_to_maintain-0)
lose-0 (fail_to_get-0)
lose-6 (lose_money-0, make_a_loss-0, fail_to_profit-0)
offer-1 (bid-0, tender-2)
give-3 (cause_to_have-0)
grant-5 (give-11)
rid-0 (free-2, disembarrass-0)
leave-0 (leave_behind-1)
act-0 (move-0, take_measures-0, take_steps-0, take_a_step-0, take_action-0, perform_an_action-0, do_something-0)
lie_dormant-0 (be_inactive-0)
start-0 (take_up-0)
install-0 (put_into_office-0)
take_orders-1 (be_ordained-0)
remove-0
take_out-1 (move_out-0, remove-2)
succeed-1 (come_after-0, follow-1)
precede-0 (precede_in_office-0, come_before-0)
hire-0 (engage-1, employ-0, give_employment_to-0)
retain-1 (continue-0, keep-2, keep_on-0)
work-0 (do_work-0)
get_off-0 (be_released_temporarily-0)
work-2 (exert_effort-0, exert_oneself-0)
go_to_work-0 (start_working-0)
idle-0 (laze-0, stagnate-0, twiddle_one's_thumbs-0, be_idle-0)
play-0 (amuse_oneself-0)
play-3
free-0 (liberate-2, release-0, let_out-0, set_free-0, turn_loose-0, unloose-0, loose-0)
free-2 (free_from_duty-0, discharge-1)
let-0 (allow-0, permit-0)
give_up-0 (allow-1)
oppress-0 (suppress-1, crush-0)
open-0 (open_up-0)
close-0 (fold-0, shut_down-0, close_down-0)
abolish-0 (get_rid_of-0)
preside-1 (chair-1)
separate-2 (part-0, split_up-1, split-0, break_up-0)
join-0 (fall_in-0, get_together-2)
disorganize-0
control-0 (command-0, have_control_over-0, have_power_over-0)
decertify-0 (derecognize-0)
be-0 (work-6)
prevent-0 (keep-1)
prevent-1 (forestall-1, foreclose-0, preclude-0)
refrain_from-0 (forbear_from-0, avoid-3, desist_from-0, abstain_from-0, keep_from-0)
appoint-0 (charge-0)
cancel-3 (call_off-0)
desegregate-0 (integrate-0, mix-0)
meet-1 (get_together-1)
send_in-0
confine-0 (deprive_of_freedom-0, detain-0)
arraign-0
punish-0 (penalize-0)
get_it-0
catch_it-0
reward-0 (give_a_reward_to-0)
indulge-1
do-3 (manage-2)
fail-1 (flunk-0, bomb-0, flush_it-0)
succeed-0 (come_through-0)
fail-0 (go_wrong-0, miscarry-0)
fail-2 (neglect-0)
waive-0 (relinquish-0, forgo-0, foreswear-0, dispense_with-0)
woo-0 (court-0, romance-0, solicit-0)
woo-1 (court-1)
take_the_stage-0 (take_stage-0)
rear-0 (raise-0, bring_up-0, nurture-0, parent-0)
dishonor-0 (disgrace-0, dishonour-0, attaint-0, shame-0)
deliver-3 (redeem-4, save-2)
save-0 (carry_through-0, pull_through-0, bring_through-0, bring_into_safety-0)
support-0 (back_up-0,
lend_support_to-0, give_aid_to-0)
effect-0 (carry_out-0, make-0, do-1)
exempt-0 (relieve-2, free-7, release_from_obligation-0, free_from_a_rule-0)
practice-0 (practise-0, exercise-0, carry_out-3, do-2)
observe-2 (celebrate-1, keep-5)
observe-4 (keep-3)
prosecute-0 (be_the_prosecutor_of-0)
defend-0 (represent-6)
stampede-1
rest-0
meet-3 (get_to_know-0, get_acquainted-0)
stag-0
come_near-0
mingle-0 (get_involved-1, get_mixed_up-0)
appear-3
assemble-3 (gather-2, get_together-3)
exist-0 (be-0)
be-3 (have_the_quality_of_being-0)
begin-0 (start-0)
end-0 (finish-0, terminate-0)
be-4 (occur-0)
be-1 (live-0, have_life-0)
live-6 (lead_a_life-0)
be-6 (be_identical_to-1)
exist-1 (survive-0, live-1, subsist-0)
go-3
survive-1 (last-1, live-4, go-14, endure-0, hold_up-0, hold_out-0)
last_out-0 (stay-3, ride_out-0, outride-0)
outlive-0 (outlast-0, survive-3)
constitute-0 (represent-0, make_up-0, be-2)
separate-0 (divide-0)
connect-0 (link-0, join-0, unite-0)
become-0
originate_in-0 (come_from-0, hail_from-0, be_from-0)
necessitate-0 (ask-0, need-0, require-0, take-0, involve-7, call_for-0, demand-0)
obviate-0 (rid_of-0, eliminate-1)
have-0 (feature-0)
miss-0 (lack-0)
miss-2
include-0 (be_made_up_of-0)
wait-0 (stay_in_one_place-0)
hesitate-0 (waver-0, swiver-0)
predominate-0 (dominate-0, rule-0, reign-0, prevail-2)
go-6
be-5 (occupy_a_certain_position-0, occupy_a_certain_area-0)
conform-6
equal-0 (be_identical_to-0, be-7)
differ-0
violate-0 (fail_to_agree_with-0, go_against-0, break-0, be_in_violation_of-0)
exceed-1 (transcend-0, go_beyond-1, surpass-1)
fall_short_of-0 (fail_to_satisfy-0)
unbalance-0
excel-0 (stand_out-0, surpass-0)
refer-0 (pertain-1, relate-0, concern-0, come_to-3, bear_on-0, be_about-0, touch-0, touch_on-0,
have_to_do_with-0)
concern-1 (interest-1, occupy-4, worry-0)
discontinue-0 (stop-0, cease-0, give_up-0, quit-4, lay_off-0)
keep-0 (maintain-0, hold-0)
roll-0 (undulate-0)
lead-1
go-12
go-13
yield-0 (relent-0, soften-0)
straddle-0 (be_noncommittal-0)
lend_oneself-0 (be_applicable-0, apply-1, be_subject-0)
defy-1 (resist-1, refuse-0)
spend-0 (pass-0)
diverge-0
(extend_in_a_different_direction-0)
converge-0 (meet-2, be_adjacent-0)
depend_on-0 (devolve_on-0, depend_upon-0, ride_on-0, turn_on-0, hinge_on-0, hinge_upon-0)
predate-0 (precede-0, forego-0, antecede-0, antedate-0)
postdate-0 (follow-0)
stick_out-1 (protrude-0, jut_out-0, project-0)
attach_to-1 (attend-1, accompany-0, come_with-0, go_with-1)
sulk-0 (pout-0, brood-0)
can-0
can-1 (may-1, might-1)
must-0 (have-5, have_got-0, need-1)
should-1 (had_better-0, ought-1)
must-1 (have-8)
shall-0 (will-0)
should-0 (ought-0, must-3, need-2)
would-0
may-0
must_not-0 (may_not-0)
could-0 (might-0)
belong_to-0 (be_part_of-1)
follow-3
play-0
should-2
refrain-0 (forebear-0, forbear-0)
sell-0
persist-1 (remain-1, stay-4)
accommodate-3 (hold-5)
go_down-0
photograph-0
go_in-0 (be_installed-0)
go_into-0
derive-0 (descend-0, come_from-1)
have-12 (deal_with-2)
hold_one's_own-0
hang-1
range-3
admit-0
agree-3
draw-0
drive-0 (ride-3)
mean-3
precipitate-0 (come_down-0, fall-0)
ice_up-0 (frost_over-0, ice_over-0)
extinguish-0 (obliterate-0, put_out-0)
burn-2 (cause_to_burn-0)
shine-0 (emit_light-0, be_bright-0)
absorb-0 (take_in-0)
emit-0 (give_out-0, give_off-0)
blow-0 (be_blowing-0)
storm-1
thunder-0 (boom-0)
clear_up-0 (clear-0, light_up-0, brighten-0)

   Una clara implicación de este número de primeros niveles de jerarquía es que la taxonomía de verbos no es tan profunda como la de los sustantivos. La capacidad de atravesar la estructura de verbos por distintos niveles de nodos es muy inferior.

    Finalmente, la distribuciones de relaciones para adjetivos y adverbios es la siguiente:

    Uso de punteros en ADJ.DAT

Puntero Uso (relación) Entre synsets Entre palabras Mixto Total Synsets donde ha sido usado Máx. Nº de Punteros
! Antónimo 4 3744 0 3748 3561 3
& Similar a 20050 0 0 20050 12583 71
\ Pertenece a 0 3537 2 3539 2832 6
= Atributo 636 0 0 636 616 2
^ Ver también (Also see) 2686 0 0 2686 1303 8

    Uso de punteros en ADV.DAT

Puntero Uso (relación) Entre synsets Entre palabras Mixto Total Synsets donde ha sido usado Máx. Nº de Punteros
! Antónimo 0 704 0 704 617 4
\ Pertenece a 1 2886 7 2894 2169 7

    La organización de los adjetivos (como ‘núcleo’, head, y ‘satélites’) puede considerarse como un tipo de taxonomía. Tanto los adjetivos como los adverbios están organizados a través de las relaciones de sinonimia y antonimia y derivación con cambio de categoría.

    Como hemos podido ver, WordNet 1.5 distingue las tres siguientes relaciones meronímicas: 

Merónimo Holónimo Meronimia tipo
Merónimo Miembro Holónimo Miembro Miembro-colección
Merónimo Substancia Holónimo Substancia Substancia-objeto
Merónimo Parte Holónimo Parte Parte-Objeto integrado

     Podemos, a modo de ejemplo, citar las siguientes relaciones en las que se muestra la utilización de estos tipos de meronimias.

Parte-Objeto Integrado Sense 2
flower, bloom, blossom -- (reproductive organ of angiosperm plants esp. one having showy or colorful parts)
  • HAS PART: stamen -- (the male reproductive organ of a flower)
  • HAS PART: pistil, gynoecium -- (the female ovule-bearing part of a flower composed of ovary and style and stigma)
  • HAS PART: carpel -- (a simple pistil or one element of a compound pistil)
  • HAS PART: ovary -- (the organ that bears the ovules of a flower)
  • HAS PART: floral leaf -- (a modified leaf that is part of a flower)
  • HAS PART: perianth, floral envelope -- (collective term for the outer parts of a flower consisting of the calyx and corolla and enclosing the stamen and carpel)
Miembro-Colección Sense 1
womankind -- (women as distinguished from men)
  • HAS MEMBER: womanhood, woman -- (women as a class; "it's an insult to American womanhood"; "woman is the glory of creation")
Substancia-Objeto Sense 1
glassware, glasswork -- (articles made of glass)
  • HAS SUBSTANCE: glass -- (a brittle transparent solid with irregular atomic structure)

     Una característica importante de WordNet que debemos mencionar es el uso de la herencia de las propias relaciones meronímicas, no explícitamente1 de otras propiedades. Este uso consiste en utilizar la relación de hiponimia como esqueleto para heredar relaciones meronímicas. Supongamos que tenemos los siguientes merónimos:

Vehículo rodado (rueda, dirección)
Automóvil (chasis, motor, techo, chapa, rueda, dirección, freno, ...)
Descapotable (chasis, motor, chapa, rueda, dirección, freno, ...)

    La redundancia que puede llegar a darse mediante la repetición de las partes similares, tanto de hipónimos y como de hiperónimos, puede evitarse mediante la distribución de los merónimos en los distintos niveles jerárquicos de hiperónimos e hipónimos, de tal manera que sólo hereden las relaciones meronímicas aquellos que se hallan por debajo en la jerarquía:

    Este tipo de diseño, sin duda preferible a la excesiva redundancia que supondría repetir cada una de las relaciones para cada uno de los nodos, impone nuevas restricciones al diseño de la red semántica, pues depende de cómo esté organizada la jerarquía, lo merónimos se heredarán correcta o incorrectamente. La selección de hipónimos irá pues también en función de la capacidad y corrección de heredar ciertas meronimias, no sólo propiedades y atributos.

    Entre otras decisiones tomadas en WordNet para la clasificación y representación de ciertas meronimias, podemos destacar que los nombres geográficos se conectan mediante la relación has parts (Madrid es parte de España), al igual que las partes denominadas componente-objeto (El ventilador es parte del procesador). Sin embargo, parece que su capacidad de herencia es distinta en ambos casos, así como el tipo de inclusión, ya que en el segundo caso entre «ventilador» y «procesador» parece existir una intersección:

Madrid - España - Europa - Eurasia

Ventilador - Procesador - Ordenador

    Por otra, parte debemos mencionar el hecho de que la clasificación biológica (clase, género, tipo, género, especie) se representa mediante la relación miembro-colección (has member). Las unidades de medida también son consideradas como componente-objeto, cuando todo indica que existe una motivación para la existencia de la meronimia porción-masa, sobre todo en cuanto al grado de predicción de herencia de propiedades.

    Concluiremos esta sección diciendo que WordNet ha sido un revulsivo para el estudio de la Semántica Léxica y su aplicación en la Semántica Computacional.


NOTAS

1   De hecho, el carácter psicolingüístico de los criterios de construcción de WordNet hace que el diseño de la red tenga en cuenta más el punto de vista de las inferencias lógicas que el punto de vista de la herencia de propiedades.

 

Anterior  I  Siguiente  I  Índice capítulo 3  I  Índice General


ISSN: 1139-8736
Depósito Legal: B-25223-99