ISSN: 1139-8736
Depósito Legal: B-8714-2001

3.7.2 Base de Datos de Habla

Con 87 de las 370 frases de evaluación seleccionadas se decidió generar un corpus de evaluación del Sistema de Comprensión con frases obtenidas como salida de un reconocedor de habla continua, utilizando una gramática BI-POS (bigrama de categorías) de 160 POS (“part of speech” o categorías lingüísticas) del Castellano, y modelos SCHMM (Modelos Ocultos de Markov Semicontinuos) independientes del contexto con 3 codebooks (10 parámetros Mel-Frequency Cepstrum y la energía, su primera derivada y la segunda derivada). De este modo se puede evaluar la robustez del sistema frente a los errores característicos de un reconocedor acústico.

Anterior   I  Siguiente   I  Índice capítulo 3   I   Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001