Detección de patologías en señales de voz mediante HMM empleando entrenamiento discriminativo
Tipo de contenido
Trabajo de grado - Maestría
Idioma del documento
EspañolFecha de publicación
2009Resumen
En esta tesis se presenta una metodología orientada a mejorar la identificación de patologías en señales de voz. El problema puede ser abordado desde diferentes enfoques, concentrándose en tareas o etapas específicas que deben ser desarrolladas durante elproceso del diseño de un sistema de reconocimiento de patrones. Para clasificar datos que se desarrollan a lo largo de un argumento como el tiempo entre otras técnicas, es de amplio conocimiento el uso de modelos ocultos de Markov. Al emplear un sistema de clasificación basado en modelos ocultos de Markov, necesariamente se debe resolver el problema de entrenamiento, que implica el ajuste de los parámetros del modelo mediante la optimización de una función objetivo. La forma y características de dicha función viene determinado por el criterio de entrenamiento que puede ser generativo o discriminativo, donde las técnicas de entrenamiento discriminativo se consideran mucho más adecuadas en la solución de problemas como el que se ha puesto en consideración. Por lo tanto abordando la filosofía de entrenamiento discriminativo se propone emplear un criterio de entrenamiento que no solo esté enfocado minimizar la probabilidad del error o generar fronteras de decisión adecuadas, si no también en la optimización de una medida de desempeño mucho más general que el error de clasificación, para tal fin se sugiere el empleo de una función de costo que se relacione indirectamente con el área que encierra una curva de desempeño mediante una distancia entre modelos de clases. En particular se propone emplear la distancia de Mahalanobis como función objetivo, y como medida de desempeño el area de la curva ROC, complementando esto con una técnica de selección y/o extracción de características relativamente simple. Los resultados experimentales se presentan sobre dos bases de datos de patologías de voz y muestran que la metodología propuesta permite mejorar el desempeño de un sistema de clasificación, incluso cuando la dimensión del espacio de entrenamiento se ha reducido significativamente.Palabras clave
Colecciones
Esta obra está bajo licencia internacional Creative Commons Reconocimiento-NoComercial 4.0.Este documento ha sido depositado por parte de el(los) autor(es) bajo la siguiente constancia de depósito