Reconocimiento de dígitos aislados mediante Alineación Temporal Dinámica y Modelos de Markov Ocultos 上市 Deposited

Uno de los problemas que se presentan en los sistemas de reconocimiento de patrones y en este caso el reconocimiento de dígitos fonéticos, es la dificultad de extraer las características fonéticas de una señal proveniente de un micrófono de una manera automática. Los sistemas comerciales son propietarios y normalmente tienen derechos de patente por lo que no es posible analizar con detalle el código fuente de dichos sistemas. Es conveniente contar con un código con el objeto de analizar a detalle los algoritmos matemáticos que se requieren en la extracción de dichas características. En esta tesis se presenta la programación de dos algoritmos de reconocimiento de dígitos fonéticos con base a la técnica de modelos de Markov ocultos (HMM, Hidden Markov Models) y la técnica de alineación temporal dinámica DTW (Dynamic Time Warping). Los prototipos de los algoritmos se desarrollan en el lenguaje de alto nivel Mathematica y en el lenguaje también de alto nivel MatLab. La entrada y salida de sonido en formato WAV de Microsoft se hace en bajo nivel utilizando la biblioteca de MatLab. Se utliza un corpus (base de datos fonéticos) cuyo varios corpora (elemento del corpus) como referencia de los fonemas acústicos de diez dígitos. Cabe mencionar que se utilzó P rodivoz, el cual es un proyecto de base de datos fonéticos realizado en la Universidad Nacional del Rosario, Argentina. Por otro lado en este trabajo se diseñaron algunos corpora realizados dentro de la UAMI para comprobar el prototipo tema de esta tesis. Los resultados que se presentan son tablas de las ejecuciones de los programas que reconocen dígitos hablados y aislados utilizando una computadora digital con un micrófono para la extracción de las características fonéticas. También se presentan pantallas que muestran los resultados de forma gráfica. Así mismo se proporciona el código fuente que permite la generación de los resultados.

关联

管理集内:

描述

属性名称属性值
Creador
贡献者
Tema
Editor
Idioma
Identificador
关键词
Año de publicación
  • 2009
Tipo de Recurso
Derechos
División académica
Línea académica
Licencia
最新修改: 11/28/2023
引文:

EndNote | Zotero | Mendeley

单件