ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez

6 El uso del corpus para extracción de información y su representación

Una vez que hemos expuesto en detalle los fundamentos teóricos y metodológicos de nuestra investigación, nos proponemos ahora mostrar la utilidad que el uso de un corpus textual informatizado ha tenido para extraer al información que después hemos vertido tanto en el Ontology Editor (§ 5.4) como en el Termbase Editor (§ 5.6). Hemos organizado este capítulo en tres bloques fundamentales:

El primero de ellos (§ 6.1) lo hemos dedicado a detallar la forma en la que hemos examinado nuestro corpus, procesándolo de forma global, para obtener información sobre la estructura conceptual del ámbito de especialidad. Los primeros análisis que realizamos usando las herramientas del programa WordSmith Tools nos sirvieron para tres objetivos fundamentales: (i) comprobar si la recopilación de textos hecha (siguiendo los criterios generales expuestos en § 4.3) se ajusta a las necesidades de nuestro proyecto; (ii) analizar de qué forma la composición del corpus influencia los resultados que obtenemos; y (iii) valorar la utilidad que el uso de las herramientas de WordSmith tiene en la delimitación global del dominio de especialidad y de los conceptos implicados en su estructura conceptual.

En el segundo bloque (§ 6.2) hemos examinado la forma en la que el corpus puede ayudarnos a organizar dicha estructura conceptual. Para acotar nuestra exposición, nos hemos centrado en una sección del subdominio del cáncer, la leucemia (y sus subtipos) y hemos examinado las expresiones lingüísticas que representan relaciones conceptuales.

Por último, en el tercer bloque (§ 6.3) nos hemos centrado en el corpus como herramienta para extraer información sobre el comportamiento lingüístico de los términos y el uso que de ellos hacen los especialistas.

Es necesario tener en cuenta que esta separación en tres bloques diferentes la hemos hecho por conveniencia de la exposición, pero no siempre se ha correspondido con la realidad de nuestro proceder en la investigación. Al igual que en las unidades terminológicas es imposible disociar las tres dimensiones que las componen (la conceptual, la lingüística y la comunicativa), es también muy difícil aislar los casos en los que en el corpus hemos buscado, o hemos extraído, información de sólo un tipo. Nosotros hemos partido de la materia lingüístico-comunicativa (el texto producido por el especialista) para estudiar cómo dicha materia vehicula el conocimiento, para volver a reflexionar después sobre la forma en la que los especialistas expresan y comunican el conocimiento especializado por medio de la materia lingüística.112

Por tanto, si bien en el primer bloque centramos nuestra atención en los conceptos del ámbito de especialidad, en el segundo en su estructuración conceptual y en el tercero en su comportamiento lingüístico dentro de la situación comunicativa en la que son creados, en todos los casos hemos sido conscientes de que la separación la hacíamos de forma artificial. En nuestra experiencia, y especialmente partiendo de la materia lingüística como ha sido nuestro caso, es muy difícil separar forma lingüística y significado: un contexto de uso diferente es en muchos casos indicador de una conceptualización distinta, o apunta a un tipo de relación diferente; una expresión o patrón lingüístico determinado es la materia con la que el terminógrafo cuenta para acercarse a conceptos diferentes.


Notas

112 Esto es lo que la Profesora Cabré denomina la "teoría de las puertas" (comunicación personal). Según esta teoría, al estudio terminológico se puede acceder por una de sus puertas (que pensamos corresponden a las dimensiones expuestas en el capítulo 4, apartado 4.1 y ss.) para establecer después los enlaces pertinentes: puede accederse desde el conocimiento, para llegar a la materia lingüística y la comunicativa o viceversa.


Índice General I Índice Capítulo 6 I Siguiente

ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez