ISSN: 1139-8736
Depósito Legal: B-39200-99

Conclusiones.

    La información fónica en los diccionarios del español es un aspecto tradicionalmente descuidado, la opinión generalizada coincide en señalar el alto grado de concordancia entre pronunciación y ortografía: no existen grandes dificultades en los hablantes-lectores para interpretar fónicamente una representación ortográfica; por el mismo motivo, la transcripción fonética automática no entraña grandes dificultades. Evidentemente, la gran regularidad de la ortografía evita los problemas constatados en otras lenguas; sin embargo, hemos mostrado que también existen fenómenos fonológicos idiosincrásicos en el léxico para los que no es suficiente la información grafemática cuando han de ser tratados en un sistema automático de fonetización que quiera actuar con un margen de error virtualmente nulo: los hiatos no marcados ortográficamente deben ser transcritos; no son un sector importante del léxico, en cuanto a número de unidades, pero constituyen excepciones de la lengua; los extranjerismos, que en la medida de lo posible, han de ser tratados mediante reglas de aplicación regular y no mediante listas de excepciones.

    Hemos abordado la transcripción fonética automática del español como un estudio lingüístico, lo que se observa en el diseño general del sistema, en la elección de las unidades representadas y en la búsqueda de soluciones a los problemas de la fonetización.

    Proponemos un sistema ordenado de módulos de reglas que realizan las operaciones regulares, es decir, que se aplican en todas las unidades léxicas en las que se dan las condiciones indicadas. El objetivo del primer módulo de reglas es obtener una cadena de signos que representan segmentos fónicos desde una interpretación regular de la ortografía. El segundo módulo separa los segmentos formando sílabas, atendiendo a restricciones fonotácticas, no grafemáticas, para que, posteriormente, se pueda aplicar el acento. Esta última operación requiere el borrado de todo aquel material fónico no realizable por su distribución en la cadena.

    Al realizar el proceso en este orden surgen problemas derivados de las irregularidades ortográficas de la lengua: la reglas de asignación de la tilde, de las que se ha de partir para asignar el acento prosódico, tienen en cuenta las letras finales de palabra, y no los segmentos fónicos que representan, por lo que se han aplicar mecanismos que resuelvan los desajustes. Es evidente que la ordenación elegida complica el sistema y es más costosa que aquella que primero dividiría sílabas ortográficas, asignaría el acento y, finalmente, convertiría letras en símbolos que representan segmentos fónicos; es un orden seguido en las aplicaciones industriales de la transcripción, en los sistemas de conversión texto a habla. Sin embargo, nuestro sistema tiene una mayor capacidad descriptiva desde el punto de vista fonológico. Una silabación derivada de la secuencia segmental ya fue realizada por Howard y Goldman (1994), pero estos autores la abordaron desde la regularidad, sin atender a los hiatos que no pueden deducirse de la representación ortográfica de partida.

    Derivamos una representación final en caracteres fonéticos a partir de una representación inicial abstracta que se obtiene de la representación ortográfica. También esa operación es mas costosa para un sistema automático que aquella que derive la representación en caracteres fonéticos directamente desde la ortográfica, pero tiene mayor interés lingüístico, porque obliga a establecer distintos grados de abstracción, a establecer distintos tipos de segmentos y a estudiar las relaciones existentes entre ambas representaciones. El transcriptor de López (1993) también deriva una representación en alófonos de una representación en fonemas, pero una representación ancha, sin apenas aumento del número de segmentos.

    Si una representación en caracteres fonéticos ha de dar cuenta de la pronunciación de los enunciados de una lengua, ha de reflejar la variación que existe en el habla: establecer distintos grados de abstracción permite estudiar los fenómenos fónicos. Por otro lado, no existe un común acuerdo en el repertorio de fonemas del español, problema que deriva, en parte, del concepto funcionalista a partir del cual se ha establecido. Para determinar de modo objetivo las unidades que han de constar en las representaciones, partimos de un concepto formal de fonema, precisando las ideas de Jones (1950), y diferenciamos tres tipos de segmentos:

- Fonos, o sonidos concretos, los sonidos realmente emitidos por el hablante en una situación comunicativa concreta (que no transcribimos)

- Alófonos, o sonidos abstractos pronunciables, una abstracción que hacemos de sonidos concretos prescindiendo de las particularidades de la pronunciación del hablante en una situación comunicativa concreta

- Fonemas, en los que, además, hacemos abstracción de la variaciones que se producen por la adyacencia de los segmentos en la cadena.

    Si establecemos tres tipos de segmentos en el habla, también debemos establecer tres tipos de representaciones, dependiendo de la unidad transcrita: fonética, alofónica y fonémica. Proponemos que el conjunto de estas tres representaciones constituyan la representación fonológica, entendida como la representación del conocimento que el hablante tiene de la pronunciación de su lengua.

    Defendemos un concepto formal de fonema: un segmento que se realiza en una posición no marcada por la variación contextual, del que se pueden derivar un conjunto de sonidos emparentados, marcados por la variación. Los fonemas no se definen en función de los demás sino en función de sus alófonos. Las reglas que relacionan la representación final y la inicial formalizan la variación.

    Hemos tomado como posición no marcada la inicial absoluta y, desde esa premisa, hemos fijado el repertorio de fonemas de un modo objetivo, resolviendo los desacuerdos que han surgido en los estudios del español. Así, incluimos la aproximante labiovelar /w/, por ejemplo, el segmento inicial de hueso: si en posición inicial siempre se tiende a realizar una consonante, el fonema es consonante, y no vocal /u/; y hemos caracterizado como oclusivo /Ipa039f.gif (59 bytes)/ al fonema descrito tradicionalmente como fricativo palatal sonoro, por ejemplo, el segmento inicial de yate. Consideramos que las realizaciones con oclusiva y aproximante velares descritas para hueso y las realizaciones oclusiva y africada palatales descritas para yate no pertenecen al habla estándar que transcribimos.

    También hemos establecido un criterio objetivo para determinar los segmentos que se deben transcribir en una representación alofónica como realización de los fonemas oclusivos sordos y sonoros en la distensión silábica (en la que existe una gran variación), analizando el proceso de debilitamiento a través de las modificaciones que se producen en el cierre de los órganos articulatorios y en la vibración de las cuerdas vocales. El análisis que realizamos no ha permitido sistematizar la variación y muestra que el fenómeno tiene una mayor complejidad que la descrita por D’Introno et al. (1995).

    Para poder transcribir el léxico del español con un margen de error virtualmente nulo se han de estudiar todos los fenómenos, como hemos llevado a cabo: los regulares y los irregulares.

    Hemos examinado las relaciones de adyacencia entre los segmentos en la palabra, para establecer la variación alofónica, comparándolas con las relaciones que se dan en el enlace entre palabras. Defendemos que no existen diferencias en ambas posiciones, salvo que actúen condicionamientos morfológicos o semánticos. Partiendo de este principio, hemos diseñado un conjunto de reglas de fonética sintáctica para dar cuenta de la variación alofónica de los segmentos adyacente en el enlace entre palabras, y los fenómenos de resilabación. No se aplican en la generación del DEFE, pero lo complementan para tratar los aspectos segmentales en la fonetización de textos.

    También hemos examinado todas la unidades susceptibles de formar hiato (no reflejado en la ortografía), estableciendo unos principios, basados en la complejidad formal de la palabra y en la posición del acento, que permitan decidir cuál ha de ser la división silábica entre vocales. En las formas simples, el hiato es una propiedad idiosincrásica de los elementos léxicos. En las formas complejas, se observa que existen sufijos que tienden a mantener el hiato de la forma simple a la que se adjuntan, mientras que otros lo rompen; aunque también existen peculiaridades en los derivados de los verbos vocálicos: el mantenimiento o la ruptura depende de cada tipo de verbo, y no de los sufijos. Cuando el proceso de sufijación es recursivo, siempre se rompe el hiato de la raíz. En las combinaciones de vocales adyacentes que se forman en la unión de un prefijo a una raíz o entre los miembros de un compuesto, la tendencia a realizar o no un hiato depende de la posición del acento en el grupo de vocales adyacentes. Los procesos de prefijación y composición mantienen el hiato del segundo componente de la forma compleja.

    El resultado del transcriptor que hemos construido es un diccionario fonético de 557.000 entradas, formas simples flexivas, representadas mediante una transcripción en caracteres fonéticos que da cuenta de los fenómenos regulares e idiosincrásicos de la pronunciación del léxico del español, en una variante que hemos considerado estándar. Nuestro estudio muestra que un sistema de transcripción fonética automática que quiera actuar con un margen de error virtualmente nulo, e ir más allá de la aplicación industrial, ha de partir de un estudio fonológico en el léxico.


  Anterior I Siguiente I  Índice General