ISSN: 1139-8736
Depósito Legal: B-37271-2002
Copyright: © Silvia Montero Martínez

5.2.1 La cadena léxica HAVE-NEOPLASM

Según López Rodríguez (2000: 584) "el contenido de un texto se crea a partir de cadenas léxicas que tratan sobre el mismo tema y que están formadas por lexemas semánticamente relacionados en un texto". En nuestro caso, para establecer la cadena correspondiente a HAVE-NEOPLASM, aquellas UL simples que hagan referencia a esta área de significado, hemos utilizado la aplicación WORDLIST. Ésta permite generar listas de palabras a partir de uno o más archivos que se pueden mostrar bien en orden alfabético o de frecuencia. Esta última posibilidad nos ha permitido generar una lista de frecuencias de las UL de nuestro corpus (Apéndice II), tras cuyo análisis se han establecido los lexemas de la tabla 5.1 como integrantes de la cadena léxica.

Hay que tener en cuenta que el programa WordSmith Tools® recoge bajo el encabezado 'Word', en la columna de la izquierda, la forma léxica más frecuente del lexema correspondiente. El resto de formas léxicas asociadas a esa misma raíz aparece bajo el encabezado 'Lemmas', en el margen derecho de la tabla. Por tanto, el concepto de lema se entiende como conjunto de formas derivadas de la misma raíz independientemente de su categoría gramatical, frente a un sentido más restringido de lema como conjunto de formas flexivas asociadas a un mismo lexema:

Word
Absolute Freq.
Lemmas
1. CANCER 5.106 CANCERS (273)
2. TUMOR 4.346 TUMORS (2140), TUMOURS (41), TUMOUR (10)
3. DISEASE 2.341 DISEASES (81)
4. CARCINOMA 1.572 CARCINOMAS (156)
5. METASTASES 1.460 METASTASIS (420), METASTATIC (538)
6. LEUKEMIA 1.099 LEUKAEMIA (46), LEUKEMIAS (26), LEUKEMIC (24), LEUKAEMIAS (2)
7. LYMPHOMA 1.071 LYMPHOMAS (204)
8. SARCOMA 594 SARCOMAS (215)
9. MELANOMA 288 MELANOMAS (79)
10. ADENOCARCINOMA 224 ADENOCARCINOMAS (36)
11. RHABDOMYOSARCOMA 218 RHABDOMYOSARCOMAS (5)
12. MASS 179 MASSES (85)
13. GLIOMA 174 GLIOMAS (106)
14. MALIGNANCY 163 MALIGNANCIES (91)
15. ASTROCYTOMA 161 ASTROCYTOMAS (58)
16. NEOPLASM 152 NEOPLASMS (112)
17. NEUROBLASTOMA 134 NEUROBLASTOMAS (8)
18. MYELOMA 131  
19. EPENDYMOMA 122 EPENDYMOMAS (43)
20. OSTEOSARCOMA 115 OSTEOSARCOMAS (5)
21. MEDULLOBLASTOMA 104 MEDULLOBLASTOMAS (6)
22. PHEOCHROMOCYTOMA 96 PHEOCHROMOCYTOMAS (9)
23. RETINOBLASTOMA 91  
24. HEPATOBLASTOMA 89 HEPATOBLASTOMAS (8)
25. SEMINOMA 89 SEMINOMAS (7)
26. TERATOMA 84 TERATOMAS (32)
27. NONSEMINOMA 82 NONSEMINOMAS (8), NONSEMINOMATOUS (50)
28. MESOTHELIOMA 70 MESOTHELIOMAS (4)
29. THYMOMA 65 THYMOMAS (11)
30. NEOPLASIA 61 NEOPLASIAS (2)
31. DYSGERMINOMA 44 DYSGERMINOMAS (2)
32. MENINGIOMA 41 MENINGIOMAS (16)
33. ADENOMA 37 ADENOMAS (24), ADENOMATOUS (5)
34. PINEOBLASTOMA 36 PINEOBLASTOMAS (12)
35. PLASMACYTOMA 35 PLASMACYTOMAS (10)
36. NONRHABDOMYOSARCOMA 33 NONRHABDOMYOSARCOMATOUS (26)
37. LEIOMYOSARCOMA 31 LEIOMYOSARCOMAS (8)
38. OLIGODENDROGLIOMA 30 OLIGODENDROGLIOMAS (7)
39. GERMINOMA 29 GERMINOMAS (9)
40. CHORIOCARCINOMA 25 CHORIOCARCINOMAS (2)
41. HEPATOMA 22 HEPATOMAS (3)
42. PAPILLOMA 19  
43. GANGLIOGLIOMA 18 GANGLIOGLIOMAS (2)
44. HISTIOCYTOMA 18  
45. PINEOCYTOMA 17 PINEOCYTOMAS (4)
46. FIBROSARCOMA 14 FIBROSARCOMAS (2)
47. HEMANGIOPERICYTOMA 11  
48. CHOLANGIOCARCINOMA 11 CHOLANGIOCARCINOMAS (2)
49. GLIOBLASTOMA 10 GLIOBLASTOMAS (7)
50. LIPOSARCOMA 10  
51. INSULINOMA 9 INSULINOMAS (5)
52. GASTRINOMA 8 GASTRINOMAS (3)
53. GRANULOMA 7  
54. CARCINOSARCOMA 6  
55. CHONDROSARCOMA 6  
56. EPENDYMOBLASTOMA 5 EPENDYMOBLASTOMAS (2)
57. PARAGANGLIOMAS 5  
58. ANGIOSARCOMA 4  
59. CYSTADENOCARCINOMA 4 CYSTADENOCARCINOMAS (3)
60. CYSTADENOMAS 4  
61. ERYTHROLEUKEMIA 4  
62. GLUCAGONOMA 4  
63. CHORIOADENOMA 3  
64. NEPHROBLASTOMA 3  
65. NONMELANOMA 3  
66. CYSTOMAS 2  
67. ERYTHROPLASIA 2  
68. HEMANGIOMA 2  
69. HEPATOCARCINOMA 2  
70. MESENCHYMOMA 2  
71. NEUROEPITHELIOMA 2  

Tabla 5.1:Composición de la cadena léxica HAVE-NEOPLASM

Una de las consecuencias de la utilización del concepto de CL es la detección de unidades que, en principio, no parecerían tener el estatus de términos, ya que responden a unidades propias del discurso general. Sin embargo, aunque formen parte del léxico general, es su coocurrencia con otras unidades léxicas la que les confiere un carácter especializado. Si bien en este caso los ejemplos son reducidos ('mass', 'disease') debido a que el corpus está destinado a especialistas, creemos que la noción de CL es necesaria en todo trabajo terminográfico descriptivo, ya que permitirá identificar y recoger todas aquellas UL simples o compuestas que tengan significado especializado y que puedan constituir variaciones de determinadas UT. De aquí se deduce que nuestra postura no defenderá, como hacen la mayor parte de los autores, la necesidad de que una colocación del discurso especializado deba contener un término que además suele ser el núcleo (§3.5.1), sino una unidad que transmita contenido especializado, una USE.

Así, los lemas de la CL se han utilizado como palabras de búsqueda en la aplicación CONCORD, que ha permitido generar concordancias de cada una de ellas; es decir, mostrar las ocurrencias de una forma léxica dentro de su contexto (Sinclair 1991: 32). A partir de las líneas de concordancia, mediante la utilidad CLUSTERS hemos identificado aquellas UL que coaparecen de forma frecuente y que denominan clusters. Según la terminología utilizada en WordSmith Tools®, éstos pueden ser fruto de la dependencia gramatical ('depend on') o colocacional. Nuestro interés se centra en esta última, donde un 'colocado' se define como aquella UL que aparece cerca de la palabra de búsqueda y cuya unidad forma combinaciones libres o restringidas de tipo conceptual y léxico. Según las directrices de este paquete de herramientas, para acceder a éstas se debe establecer un span u horizonte colocacional máximo de ± 5 (§3.4.1), ya que a partir de esta distancia se produce demasiado ruido. En nuestro caso, se buscarán clusters de 2 a 5 unidades léxicas y la mínima frecuencia de aparición se establecerá en 2 como se muestra en los siguientes ejemplos:

(103)

A partir del análisis de los clusters obtenidos se excluyeron tanto los casos de dependencia gramatical como de combinaciones libres y se elaboró una primera lista de nuestros candidatos a FT (Apéndice III) para posteriormente ser validados o no a través de un análisis conceptual fruto del cual surgirá la propuesta de estructuración ontológica.


Índice general I Índice Capítulo 5  I Siguiente


ISSN: 1139-8736
Depósito Legal: B-37271-2002
Copyright: © Silvia Montero Martínez