ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez

6.1.5 Key-KeyWords: comparación de palabras clave en los textos145

Key-KeyWords pueden definirse como aquellas palabras que son clave en varios textos que componen un corpus. Es decir, a diferencia de las palabras clave que obtuvimos anteriormente, en este caso el índice de relevancia se consigue, primero, comparando el corpus de estudio con un corpus de referencia y segundo, teniendo en cuenta su diferente frecuencia en ambos córpora y la frecuencia de cada una de las palabras clave dentro del corpus de estudio. Por tanto, el índice de relevancia es proporcional al número de textos en los que se repite una palabra clave.

Como puede verse en la Tabla 12 y la Tabla 13, muchas de las palabras clave que se obtienen por este procedimiento no aparecían en los listados anteriores y algunas de las identificadas hasta ahora desaparecen. Esto puede ser útil para el terminógrafo, puesto que de esta forma, no sólo se enriquecen los grupos semánticos con lo que contábamos hasta el momento, sino que, además, es posible identificar otros nuevos. En este sentido, pensamos que el uso de ambos tipos de palabras clave (las keywords y las key-keywords) ha de plantearse como un procedimiento cíclico y aditivo.

En el caso del corpus de oncología, aparecen key-keywords no identificadas hasta ahora, como es el caso de metastasis, metastases e infections y el adjetivo metastatic. Es destacable también la aparición de un grupo de key-keywords que hacen referencia a aspectos preventivos del cáncer: detection, incidence, risk, prevention, screening, health y control, junto con otros referidos al tratamiento: drug, radiation y los adjetivos therapeutic, genetic, recombinant y adjuvant.


Tabla 12: Key-key words del corpus de oncología comparándolo con el corpus de referencia (BNC)

Por otra parte, entre las palabras clave a las que tenemos acceso por medio de la comparación del corpus de leucemia con el corpus de oncología, merece la pena destacar la proliferación de denominaciones específicas de tipos células implicadas en el proceso de la enfermedad, algunas de las cuales no habían aparecido hasta ahora (monocytes, neutrophils, basophils, eosinophils, phagocytes, myeloblasts, blast) y términos relacionados con el tratamiento de la leucemia, concretamente con los transplantes de médula ósea: transplantation, donor, apheresis, recipient, donors, immunophenotype, donated, autologous, BMT (Bone Marrow Transplantation) y TBI (Total Body Irradiation). Estos dos tipos de información completan áreas de la estructura conceptual de la ontología que hasta ahora quedaban bastante incompletas. La Tabla 13 muestra las 100 primeras key-keywords del corpus de leucemia.


Tabla 13: Key-key words del subcorpus de leucemia comparándolo con el corpus de oncología.

Aunque no nos es posible detallar el contenido de todos y cada uno de los listados mostrados hasta ahora, el pequeño resumen que hemos ofrecido muestra que la combinación de estas tres estrategias de índices de relevancia en el corpus (palabras clave, enlaces entre palabras clave y key-keywords) puede ser de gran utilidad para delimitar los elementos léxicos más importantes del corpus y, por tanto, constituye una información muy relevante para trazar la estructura conceptual del ámbito de especialidad, puesto que dichos elementos léxicos señalan conceptos importantes en el contenido de los textos. A partir de la información extraída de estos listados, comenzamos a posicionar dichos conceptos en los lugares apropiados de la ontología de Mikrokosmos (véase § 5.3.3). Sin embargo, estos listados ofrecen muy poca información sobre las relaciones y las propiedades de cada uno de estos conceptos, y este tipo de información es la que enriquece y hace útil la estructuración conceptual. Para obtener este tipo de información, debimos estudiar los conceptos de forma pormenorizada, analizando los contextos de uso y los patrones léxicos más frecuentes. Nos ocupamos del estudio de las relaciones conceptuales y de la forma en la que corpus puede ayudar a localizarlas en el apartado siguiente.


Notas

145 No hemos traducido la expresión Key-KeyWord al español porque las posibles traducciones (por ejemplo, palabras archi-clave, palabras super-clave) nos parecían muy ajenas a la lengua española y no capturan el sentido aumentativo que las repeticiones adjetivales poseen en la lengua inglesa.


Índice General I Índice Capítulo 6 I Siguiente

ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez