ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez

2.5 Análisis cualitativo y cuantitativo: herramientas para el tratamiento de los córpora

Se suele hacer una distinción entre dos tipos generales de análisis del corpus: cualitativo, en el que se hace una descripción detallada y completa de un fenómeno lingüístico o del comportamiento de una palabra o grupo de palabras y cuantitativo, en el que se asignan índices de frecuencia a los fenómenos lingüísticos observados en el corpus y éstos pueden servir para construir modelos estadísticos más complejos, que expliquen la evidencia hallada en el texto.

Estos dos tipos de análisis no deben considerarse excluyentes, sino más bien complementarios, ya que el análisis cualitativo, por un lado, ofrece una gran riqueza y precisión en las observaciones realizadas; los fenómenos poco frecuentes pueden recibir igual atención que los muy frecuentes. Por otro lado, el análisis cuantitativo puede ofrecer al lingüista o lexicógrafo información que sea estadísticamente significativa y resultados que pueden considerarse generalizables (McEnery & Wilson 1996: 63), por lo que es hoy muy frecuente que se combinen ambos tipos de análisis. Mario Bunge (1995: 3) argumenta al respecto:

There can be no opposition between quantitative and qualitative methods, since quantity and quality are mutually complementary rather than exclusive. Indeed, every quantity is either the numerosity of a collection of items sharing a certain quality, or the intensity of a quality. Hence, in the process of concept formation, quality precedes quantity.

La mayoría de los paquetes informáticos que se han desarrollado en los últimos años ofrecen la posibilidad de llevar a cabo ambos tipos de análisis, y en este sentido se han hecho enormes progresos y han aparecido diversas publicaciones que sirven de guía para el análisis estadístico con fines lingüísticos o lexicográficos (Butler 1985; Fielding & Lee 1991; Charniak 1993; Wilks, Slator & Guthrie 1996; Oakes 1998). Existe también en el mercado un importante número de programas (tanto comerciales como gratuitos para fines académicos) con interfaces de usuario fáciles de manejar y a la vez muy versátiles y sofisticados, aunque la mayoría de las grandes editoriales y centros de investigación han desarrollado herramientas de análisis específicas para el corpus que poseen y que por tanto se adaptan perfectamente a cualquier tipo de información meta-textual que se haya añadido a su corpus (información sintáctica y sobre la clase morfológica de las palabras, identificación del texto y especificaciones sobre su procedencia, tipo o variedad lingüística a la que pertenece, etc.) y además suelen adaptarse y desarrollarse para satisfacer las necesidades específicas de los investigadores, ya sean éstos lingüistas, lexicógrafos o terminólogos.

Algunos programas de manejo de corpus disponibles se distribuyen de forma gratuita para ser usados con fines académicos (por ejemplo Conc, del Summer Institute of Linguistics; FreeText Browser, de la Universidad de Michigan o TACT, del departamento de Computing in the Humanities and Social Sciences de la Universidad de Toronto). Dentro de los programas comerciales, los más usados han sido tradicionalmente Oxford Concordancing Program, MicroConcord (ambos de Oxford University Press) y WordCruncher (Wordcruncher Publishing Technologies), junto con un nuevo conjunto de herramientas para el manejo de corpus desarrollado por Michael Scott para Oxford University Press, conocido como WordSmith Tools.21

En la parte final de este capítulo, centraremos nuestra descripción en esta sección en algunas de las herramientas computacionales más usadas en el análisis lingüístico en general y en el lexicológico-lexicográfico en particular, ya que, como veremos en el capítulo 6, muchas de las técnicas lexicográficas usadas con mayor frecuencia en el análisis de corpus pueden ayudar en el trabajo que un terminógrafo debe realizar.


Notas

21 Bruno M. Schulze y Ulrich Heid realizaron en 1994 un estudio comparando los más destacados programas de concordancias, tanto comerciales como académicos. Este informe puede obtenerse a través del servidor de EURALEX en http://www.ims.uni_stuttgart.de/euralex


Índice General I Índice Capítulo 2 I Siguiente

ISSN: 1139-8736
Depósito Legal: B-39120-2002
Copyright: © Chantal Pérez