ISSN: 1139-8736
Depósito Legal: B-8714-2001

2.6 Habla Espontánea

Cuando una persona dicta a un sistema de reconocimiento (sistema de dictado) su objetivo es comunicarle las palabras en sí mismas, preocupándose más de enunciar con cuidado e interesándose más sobre cómo se están produciendo las palabras. Sin embargo, cuando su intención es resolver un problema de forma interactiva, el objetivo no es o no debería ser el habla en sí misma, sino el problema que se quiere resolver. Por tanto, el habla es producida menos cuidadosamente y de forma más espontánea, más casual. Existe más variabilidad en todo el proceso, borrando o reduciendo ciertos segmentos y sílabas, y formas gramaticales “no estándar” son pronunciadas con mayor frecuencia (interjecciones, dudas, repeticiones, falsos comienzos, etc.).

Principalmente, las variaciones típicas [PRI90] del habla espontánea podrían resumirse en los siguientes casos:

Para el desarrollo del sistema de comprensión de habla que se ha desarrollado y evaluado en el marco de esta tesis, se han considerado parcialmente estos efectos. El motivo es la utilización de una base de datos de habla leída que no incorpora falsos comienzos, interjecciones, repeticiones, etc. Sin embargo, el sistema de comprensión cuenta, de algún modo, con un mecanismo de robustez (un concepto BASURA) capaz de tratar (absorber) algunos de ellos en el caso de que apareciesen. Además, se ha estudiado el modelado de palabras compuestas con un solo modelo o con varios, con la inclusión de un modelo de pausa o no entre las palabras, con el fin de mejorar el módulo acústico. Para ello, nos hemos basado en el hecho de que un locutor, suele pronunciar como si de una sola palabra se tratase, las palabras compuestas, locuciones, etc., sin realizar ninguna pausa entre ellas o introduciendo, como mucho, pequeñas pausas.

Anterior   I  Siguiente   I  Índice capítulo 2   I   Índice General


ISSN: 1139-8736
Depósito Legal: B-8714-2001