ISSN: 1139-8736
Depósito Legal: B-39200-99

Introducción.

Nuestra investigación se inscribe en los estudios desarrollados en el Laboratorio de Lingüística Informática del Departamento de Filología Española de la Universidad Autónoma de Barcelona (LALI ), cuyo objetivo es la creación de una Base de Conocimiento Ligüístico a través de la construcción de una gramática léxica. Nuestro trabajo se centra en la creación del Diccionario Electrónico Fonético del Español (DEFE) mediante un sistema modular de reglas de transcripción fonética automática que se aplica sobre la representación ortográfica del Diccionario Electrónico de Formas Simples Flexivas del Español (DEFSFE). Este sistema ha de alcanzar un margen de error virtualmente nulo, es decir, debe transcribir todo el léxico del español, lo regular y lo irregular, y debe señalar las unidades léxicas sujetas a irregularidades. Nuestro trabajo aborda la fonetización como un estudio lingüístico. El diccionario y el sistema de transcripción que lo genera ha de constituir una descripción del sistema fonológico del español.

Las indicaciones sobre la pronunciación de los elementos léxicos apenas se ha contemplado en la lexicografía española, al contrario de lo que sucede en otras lenguas. Se considera inncesario por la gran correspondencia entre la ortografía y la pronunciación. En el primer capítulo, describiremos las características generales de la información fónica en las obras lexicográficas a través de ejemplos tomados de los diccionarios del inglés y del francés, lenguas en las que existe una arraigada tradición de incluir la pronunciación de los lemas; analizaremos la escasa información fónica de los diccionarios del español y mostraremos las ventajas de incluirla en un diccionario electrónico.

El DEFE se genera aplicando un sistema de transcripción fonética automática; en el segundo capítulo descibiremos las características generales de los sistemas de transcripción. También se considera que la fonetización automática no entraña grandes dificultades en la lengua española, por el mismo motivo antes aducido, y eso se refleja en la escasa información bibliográfica sobre el tema, relegada a unas líneas en la descripción de los sistemas de síntesis, o inaccesible, en los informes técnicos de las empresas privadas que los han desarrollado. Dedicamos el tercer capítulo a describir el marco teóri