ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez

4.3.1 Criterios generales para la selección de los textos de un corpus especializado

Se ha escrito muy poco sobre el diseño de los córpora especializados y menos aún sobre los criterios de selección de los textos que han de formar parte de un corpus. Meyer han de formar parte de un corpus. Meyer & Mackintosh Mackintosh57 (1996a: 267), Bowker (1996: 42) y Pearson (1998: 56) son las únicas autoras, de las que tengamos constancia, que han abordado el tema. En el primer y segundo caso, las autoras ofrecen una serie de indicaciones generales sobre los aspectos y particularidades que deben tenerse en cuenta a la hora de recopilar un corpus especializado, indicaciones que, en palabras de las autoras, no pretenden ser una receta para conseguir un corpus representativo. Por su parte, Pearson detalla los criterios que guiaron la elección de los textos usados para su investigación, centrada en el estudio de un tipo específico de definiciones científicas, por lo que rechazó algunos de los criterios que a nosotros nos parecen bastante útiles.

Los criterios que exponemos a continuación integran algunos de los propuestos por dichas autoras, junto con otros que han resultado necesarios para la recopilación de nuestro corpus de textos de oncología. Como se podrá apreciar por su contenido, muchos de estos criterios requieren que un especialista aconseje al terminógrafo en la selección, ya que es la persona que posee los conocimientos necesarios para emitir juicios, por ejemplo, sobre la calidad o autoridad de un texto.58

Los primeros criterios que deben tenerse en cuenta en la recopilación de un corpus especializado son los ya citados atributos de composición propuestos por EAGLES (1996b: 4). Tratan cuatro aspectos que son muy generales pero no por ello menos importantes:

Además de estos criterios generales, pensamos que son útiles otros, de carácter más específico, aunque muy relacionados con los anteriores:

Los tres criterios siguientes han de considerarse conjuntamente y en relación a las diferentes situaciones comunicativas expuestas en la sección anterior. Los tres están interrelacionados y las combinaciones posibles entre ellos crean subcategorías de tipos de textos:


Notas

57 Dubuc & Lauriston (1997: 85) hacen unas recomendaciones generales para la selección de textos de los que los terminógrafos han de extraer contextos, aunque estas recomendaciones (representatividad y tipo de publicación) hacen referencia al análisis manual de los textos.

58 En nuestro caso, hemos contado con el asesoramiento del la Dra. Mercedas Rodríguez del Castillo (documentalista especializada en textos médicos) y el Dr. Pedro Ballesteros (oncólogo), ambos miembros del hospital Virgen de las Nieves e integrantes del proyecto OncoTerm.

59 En algunos córpora de propósito general se han aplicado criterios de muestreo (sampling), de modo que, para hacer que todos los componentes sean del mismo tamaño, no se incluyen textos completos sino partes de ellos.

60 Para la compilación de nuestro corpus hemos considerado como texto publicado también los textos que se encuentran en la red, siempre y cuando éstos se hayan hecho públicos por instituciones de reconocido prestigio dentro del ámbito de especialidad, con registro de la propiedad intelectual.

61 En MEDLINE el país de publicación de los textos está identificado, aunque el hecho de que un artículo escrito en inglés esté publicado en Francia no es indicativo de que el autor no es hablante inglés nativo, sobre todo teniendo en cuenta que la mayoría de los textos extraídos de MEDLINE han sido escritos por tres o más autores, en muchos casos de países diferentes.


Índice General I Índice Capítulo 3 I Siguiente

ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez