ISSN: 1139-8736
Depósito Legal: B-8714-2001

5.2 Módulo Léxico para Diccionarios Lineales

El Módulo Léxico permite modificar el diccionario de palabras asociado a una gramática, sin necesidad de modificar la gramática ni alterar los módulos del sistema. Debe tenerse en cuenta que, durante el desarrollo de una aplicación de reconocimiento o de comprensión de habla, es frecuente tener que incorporar nuevas palabras en el reconocedor con el fin de aumentar la cobertura del mismo desde el punto de vista del léxico. Este caso se acentúa, como nos ocurre a nosotros, si utilizamos una gramática general de la lengua entrenada u obtenida a partir de córpora de datos diversos, que no tienen relación con el dominio semántico de la aplicación. La gramática nos aportará información sobre las posibles secuencias de categorías morfosintácticas encontradas en los textos pero las palabras obtenidas de los mismos pueden no ofrecer una cobertura aceptable sobre los textos de nuestro dominio, siendo necesario elaborar nuevos diccionarios y categorizarlos, en base al etiquetado semiautomático de nuestros textos. Si la gramática está bien entrenada podemos suponer que no es necesario modificarla o adaptarla, aunque la perplejidad de la misma no es la más conveniente (suele ser alta como nos ha ocurrido a nosotros).

Fig.5.7 Módulo Léxico para Diccionarios Lineales Categorizados. Detalle de las Entradas y Salidas.

La información léxica necesaria para el funcionamiento del Módulo Acústico vendrá modelada y almacenada en un conjunto de ficheros, que serán las entradas del Módulo Léxico:

Veamos un ejemplo sencillo que complete la gramática del ejemplo descrita en el Módulo Gramatical.

Diccionario Categ. (*.LEX)
Palabra Cat Probab
Pal1 2 0.30
Pal2 2 0.70
Pal3 3 1.00
Pal1 4 0.30
Pal4 4 0.20
Pal5 4 0.50
Pal6 5 0.40
Pal7 5 0.60
SilencioInicial 7 0.35
SilencioFinal 7 0.30
SilencioInterno 7 0.35
Diccionario de Transcripciones (*.TRP)
Número Alófo. Secuencia de Alófon.
n1 alof11 alof12 ... alof1n1
n2 alof21 alof22 ... alof2n2
n3 alof31 alof32 ... alof3n3
n1 alof11 alof12 ... alof1n1
n4 alof41 alof42 ... alof4n4
n5 alof51 alof52 ... alof5n5
n6 alof61 alof62 ... alof6n6
n7 alof71 alof72 ... alof7n7
  1 alofsi
  1 alofsf
  1 alofsx

En esta Tabla de Transcripciones ni indica el número de alófonos que forma parte de la transcripción de una palabra, siendo este 1 en el caso de los silencios (inicial, final e interno entre palabras), y con alofij indicamos el código del alófono de la palabra i-ésima y posición j-ésima dentro de la misma. Es un modo de indicar genéricamente la estructura de este fichero.

Anterior   I  Siguiente   I  Índice capítulo 5   I  Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001