ISSN: 1139-8736
Depósito Legal: B-35783-2001

2.2.3.1 Los corpora informatizados como fuente de información

La iniciativa pionera en la introducción del uso de corpora electrónicos en la compilación de diccionarios, fue la tomada por la Universidad de Birmingham y la editorial Collins (en la actualidad Harper-Collins), conocida como COBUILD (Collins Birmingham University International Language Database). El diccionario Collins Cobuild Dictionary of English Language (Cobuild) supuso, sin duda alguna, una revolución no sólo en el mundo editorial, sino además en otros ámbitos del estudio lingüístico y lexicológico.

Lo más destacable e innovador de ese proyecto fue que, por primera vez, un diccionario se compilaba por medio del examen detallado de un corpus informatizado representativo de textos ingleses, orales y escritos, de 20 millones de palabras. Se incluían, entre otros, revistas, periódicos, libros de texto, panfletos o conversaciones. Esto significaba que además de las herramientas con las que los lexicógrafos han contado durante años, es decir, un profundo conocimiento de la lengua y muchas lecturas, otros diccionarios y por supuesto la competencia lingüística individual, este diccionario está basado en evidencia mensurable (Sinclair 1987: XV):

The lexicographic team would use the computer output to supplement the traditional lexicographical tools and the results of the lexicographers' work would be fed straight back into the computer in the form of a structured database (Clear 1987: 41).

De esta forma, el equipo lexicográfico de Cobuild fue capaz de calcular la frecuencia de los elementos léxicos en su corpus y decidir, en función de criterios bastante fundamentados, si incluir o no una entrada léxica. Aunque mucha de la información (definiciones, categorías gramaticales, sinónimos, etc.) se tuvo que incluir de forma manual (Clear 1987: 41), la utilización de corpora informatizados así como de programas para su gestión facilitaron en gran medida la manipulación de tal cantidad de información; así, se extrajeron concordancias, por ejemplo, para poder estructurar las definiciones, seleccionar ejemplos e identificar restricciones de ocurrencia.

Por tanto, las posibilidades de análisis lingüístico que los lexicógrafos pueden llevar a cabo en el proceso de compilación de las entradas y estructuración definicional se han multiplicado de forma notable. La lingüística de corpus ha hecho patente la importancia de derivar la descripción lingüística de un análisis detallado de la lengua usada de forma natural, ya que este estudio puede ayudar a revelar muchas regularidades (e irregularidades) en nuestro uso de la lengua que antes no se habían observado, o pueden ayudarnos a verlas de forma más uniforme, con una perspectiva más amplia y con índices de frecuencia relativa más fiables. En este sentido, a diferencia de muchos diccionarios de su tipo, según los principios lexicográficos seguidos en Cobuild, los ejemplos han de ser extraídos del uso real y, aunque complementan a la definición, nunca la constituyen.

Para concluir, queremos ilustrar con el siguiente ejemplo extraído de la página oficial, http://titania.cobuild.collins.co.uk/, consultada el 15 de abril de 2000 los aspectos que hemos calificado como innovadores de este diccionario: la estructura de las definiciones y la organización y estructuración de las entradas :

Mother

mothers, mothering, mothered

l

Your mother is the woman who gave birth to you.
I always did everything my mother told me.
You are looking wonderful, Mother.

COUNT N, VOCATIVE

l

2 

The way that a mother mothers her children is the way that she looks after them and brings them up.
Female monkeys who were badly mothered became bad mothers themselves.

VB WITH OBJ

l

3 

If someone mothers you, they treat you with great affection, and often spoil you.
Both the other senior typists tended to mother me.

VB WITH OBJ

Figura 2.2: Entrada en el Cobuild

Como se puede observar, la información así como la estructuración de la misma en la entrada mother es totalmente diferente a la de la misma entrada en un diccionario tradicional, el OED por ejemplo. Para empezar los ejemplos son representativos del uso y no tienen una aparente fuente documental con probada autoridad. Sin embargo, son plenamente ilustrativos e indicativos de los distintos usos.

En lo que se refiere a la estructura definicional, siempre se buscan hiperónimos, al menos a nivel conceptual, ya sea en el caso del sustantivo woman, como en el caso de las dos acepciones verbales, look after y treat with affection, but spoil.

Es evidente que algunos de los principios que mantiene el equipo Cobuild están estrechamente relacionados con la determinadas necesidades de la terminografía. En ésta es necesaria una evidencia mensurable, aunque también se utilice abiertamente la competencia lingüística del experto. Los ejemplos, así, han de pertenecer al corpus y las definiciones han de estructurarse según principios lexico-terminográficos. De esta manera, las definiciones alcanzarán una sistematicidad, no ya a la hora de su elaboración sino en el resultado final. Al mismo tiempo, gracias a esta estructura determinada y dinámica, el usuario podrá acceder de forma personalizada a cada uno de los términos y/o conceptos del dominio oncológico, en nuestro caso. Sirva esto como adelanto de la estructuración definicional que abarcaremos de forma completa en el capítulo destinado a tal efecto (veáse capítulo 5).

Anterior   I  Siguiente   I  Índice capítulo 2   I   Índice General


ISSN: 1139-8736
Depósito Legal: B-35783-2001