ISSN: 1139-8736


4. Corpus y metodología

El material analizado en esta investigación es, como ya se anunció, un macrocorpus compuesto por dos corpus recogidos en 1977 y 19879. Ambos corpus, que pertenecen al Instituto de Filología "Andrés Bello" de la Universidad Central de Venezuela, provienen de grabaciones (de media hora de duración cada una) de hablantes nativos caraqueños. El corpus recogido en 1977 consta de 70 grabaciones, distribuidas según la edad (dos grupos generacionales: GG1 = de 14 a 30 años (34 hablantes); GG2 = de 30 a 45 años (36 hablantes)), el nivel socieconómico (tres niveles: alto (35 hablantes); medio (35 hablantes) y bajo (36 hablantes)) y el sexo (35 hombres y 35 mujeres) de los hablantes. El corpus recogido en 1987 consta de 160 grabaciones distribuidas equitativamente según la edad (GG1 = de 14 a 30 años; GG2 = de 30 a 45; GG3 = 45 a 60; GG4 = de 60 en adelante), el nivel socioeconómico (cinco niveles: alto, medio alto, medio, medio bajo y bajo) y el sexo de los hablantes (80 hombres y 80 mujeres)10. El cuadro 2 recoge las características de ambos corpus:

Cuadro 1. Distribución de los hablantes en los corpus analizados


 

Corpus 1977

Corpus 1987

Total

 

Nivel socioeconómico

Nivel socioconómico

 

 

alto

medio

bajo

alto

medio alto

medio

medio bajo

bajo

 

Edad

H

M

H

M

H

M

H

M

H

M

H

M

H

M

H

M

 

GG1

6

5

6

5

6

6

4

4

4

4

4

4

4

4

4

4

74

GG2

6

6

6

6

6

6

4

4

4

4

4

4

4

4

4

4

76

GG3

-

-

-

-

-

-

4

4

4

4

4

4

4

4

4

4

40

GG4

-

-

-

-

-

-

4

4

4

4

4

4

4

4

4

4

40

Total

12

11

12

11

12

12

16

16

16

16

16

16

16

16

16

16

230

H = hombre; M = mujer.


La búsqueda inicial de las cláusulas SH y SF fue realizada mediante la utilización del programa WordSmith Tools (Scott 1999), que sirvió para buscar todas las construcciones con el verbo ser conjugado.

Para la preparación del material sometido a estudio se seleccionaron en una primera instancia todas las construcciones con la estructura ilustrada en los ejemplos (1a-b) al inicio de esta comunicación. Después se procedió a eliminar aquellas oraciones que, bajo la apariencia de seudohendidas, no podían considerarse tales por lo siguiente: i) el relativo inicial tenía un antecedente léxico implícito, contextualmente recuperable; ii) el constituyente postcópula funcionaba como atributo de la entidad referencial presentada en la cláusula precópula. A continuación se suministra un ejemplo de cada tipo:

(3) a. hay óperas mucho más... digamos, dramáticas, y más pesadas, que a lo mejor te gusta oírlas cuando estás un poquito... deprimido, etc. ¿no? y obras mucho más alegres como el principio de La Traviata, por ejemplo, algo así que [...] estás contento y te pones a bañar y metes el cassette... entonces... depende mucho, pero realmente la que más me gusta es... Ballo in maschera de Verdi (87-ca1ma)11
  b. lo que está escrito es literatura y eso es para enseñar… (77-ca3me)


En (3a) el antecedente implícito de "la que más me gusta" es "opera" u "obra" (la ópera/obra que más me gusta). En (3b), “lo que está escrito” funciona como una entidad referencial, sustituible por el pronombre "eso", a la que se le adjudica el atributo de ser “literatura”12.

Además de eliminar del corpus las construcciones ilustradas en (3a-b), se procedió a excluir también otras que, si bien podían considerarse seudohendidas, no estaban en alternancia con las SF porque no se encontraron SF verdaderamente similares.13 Se trata de tres tipos de SH: i) las que comienzan por sintagmas limitativos como lo único que, lo primero que, lo último que, lo máximo que, etc., como en (4a) (102 casos); ii) las que cuentan con el proverbo hacer en la cláusula precópula, como en (4b) (139 casos); iii) las que se inician con lo que pasa, lo que ocurre, 14 cuando ese constituyente puede considerarse un marcador conversacional, como en (4c) (140 casos). A continuación se ofrecen ejemplos de los tres tipos de SH eliminados del presente estudio:

(4) a. Lo único que como es langosta (77-cb1ff)
  b. yo lo que hacía era rezar (87-ca3fb)
  c. lo que pasa es que pelea mucho (77-cb1fa)

Para haber poder hablar de variación entre las SH ilustradas en (4a-c) y las SF correspondientes, deberían haberse encontrado en el corpus SF como las ilustradas en (5a-c), respectivamente, cosa que no sucedió:

(5) a. únicamente como es langosta
  b. yo hacía era rezar
  c. pasa es que pelea mucho


En el corpus sí se incluyeron los casos en que dentro de la CLA estaba presente el adverbio más, como se ilustra en (6)15:

(6) a. la que más así discute con ella soy yo (77-cb5fe)
  b. también me gustan los "surps" pero me gusta más es la salsa (77-ca5fe)
  c. más que todo se ve es política (77-ca3ma)




Notas

9 El estudio de la variación entre SH y SF d el corpus-77 ya fue parcialmente realizado en Sedano 1995, y el del corpus-87, en Sedano 2003 . Lo que no se ha hecho hasta ahora es analizar ambos corpus conjuntamente y someter los datos al programa GoldVard.

10 Sobre las características de la muestra, puede consultarse Bentivoglio y Sedano 1993.

11 El código que sigue a los ejemplos de este trabajo ha de interpretarse de la manera siguiente, de izquierda a derecha: i) los dos primeros números identifican el corpus: 77 (1977), 87 (1987); ii) inmediatamente después del guión la identificación es como sigue: la primera letra, que es siempre "c", indica que los ejemplos provienen del habla de Caracas; la segunda letra remite al grupo generacional al que pertenece el hablante (a = de 14 a 30 años; b = de 30 a 45; c = de 45 a 60; d = de 60 años en adelante); el número que sigue identifica el nivel socioeconómico (1 = alto; 2 = medio alto; 3 = medio; 4 = medio bajo; 5 = bajo); la letra que aparece a continuación se refiere al sexo (m = masculino; f = femenino); la última letra identifica a cada hablante dentro de su propio grupo: en el corpus-77: a, b, c, d, e, f; en el corpus-87: a, b, c, d.

12 Todos los autores que han analizado las construcciones pertenecientes al grupo de las hendidas coinciden en afirmar que las oraciones tipificadas en (3b) no son seudohendidas sino oraciones destinadas a predicar algo de la entidad sujeto (cf. por ejemplo Declerck 1988:55-74). Una prueba para demostrar que lo que está escrito es literatura de (3b) no es una SH es que no existe una oración simple de la que esa oración pueda considerarse una paráfrasis.

13 Las SH ilustradas en (4a-c) también fueron excluidas del estudio realizado por Sedano 2003 . Dichas construcciones, sin embargo, sí fueron incluidas en la investigación de Sedano 1995.

14 En el corpus se encontraron sobre todo casos con lo que pasa, pero también algunos con lo que ocurre y lo que sucede. Aunque muy escasos, también se registraron casos con lo que es ( lo que es es que a él se le olvidó decirme que en el pie tenía frenos, 77-cb1fd) y con lo que tiene (su forma es de pastor, lo que tiene es que es un poco más pequeño, 77-cb3fe).

15 Las construcciones con más fueron eliminadas del corpus estudiado por Sedano 2003 porque la única SF con más encontrada contenía el proverbo hacer: ¿Qué más se iba a hacer sino era pasear por las calles a ver qué se veía? (87-ca3ma). En el presente análisis se ha tomado en cuenta esta SF, así como las SH con más del corpus-87, para poder incluir también las SH y SF con más del corpus-77.





Volumen 23 (2006)
ISSN: 1139-8736