Show simple item record

dc.rights.licenseAtribución-NoComercial 4.0 Internacional
dc.contributor.advisorCastellanos Domínguez, Germán (Thesis advisor)
dc.contributor.authorSepúlveda Sepúlveda, Franklin Alexander
dc.date.accessioned2019-06-24T12:53:38Z
dc.date.available2019-06-24T12:53:38Z
dc.date.issued2004
dc.identifier.urihttps://repositorio.unal.edu.co/handle/unal/2723
dc.description.abstractEn este trabajo se presenta la extracción de características de señales de voz basada en transformada wavelet. Las características se pueden clasificar en los tipos acústico y de representación. Dentro de las características acústicas aparecen la frecuencia fundamental y la de medida de ruido de señales de voz. Para la estimación de la frecuencia fundamental se aplica un nuevo método, el cual usa la correlación de distancias entre las escalas de descomposición en lugar de usar la correlación de posiciones de máximos locales en las escalas. Para la obtener la medida de ruido de las señales de voz se usa un método basado en la transformada wavelet packet. Para la obtención de las características de representación se usan varia estrategias, la más simple de ella es usando la transformada wavelet diádica, y las otras se basan en el diccionario de bases generado a partir de la transformada wavelet packet, entre ellas Local Discriminant Bases. / Abstract. This work present methods for feature extraction of speech signals based on wavelet transform. The features can be organized in two categories, acoustic and representation. Present a new method for pitch estimation and use the wavelet packet transform for noise estimation. For extraction of representation features use the dyadic wavelet transform and schemes based on wavelet packet transform, por ejemplo, Local Discriminant Bases. This features are used for pathological voices classification and are evaluated using Linear Discriminant Analysis. As preprocessing technique we use an algorithm for voiced/unvoiced decision an later apply pitch estimation. The results are compared with other methods. An improvement pitch detection algorithm based on the Wavelet Transform (WT) of speech signal is proposed. The method obtains a value of the fundamental frequency for each pitch period, is described and evaluated. In contrast with other methods, which chooses maximums if they occur in two adjacent wavelet coefficient scales, distances between adjacent local maximums are chosen for each scale. This method is computationally inexpensive and through real speech experiments shows that it is both accurate and robust to noise.
dc.format.mimetypeapplication/pdf
dc.language.isospa
dc.relation.ispartofUniversidad Nacional de Colombia Sede Manizales Facultad de Ingeniería y Arquitectura
dc.relation.ispartofFacultad de Ingeniería y Arquitectura
dc.rightsDerechos reservados - Universidad Nacional de Colombia
dc.rights.urihttp://creativecommons.org/licenses/by-nc/4.0/
dc.subject.ddc62 Ingeniería y operaciones afines / Engineering
dc.titleExtracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia
dc.typeTrabajo de grado - Maestría
dc.type.driverinfo:eu-repo/semantics/masterThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion
dc.identifier.eprintshttp://bdigital.unal.edu.co/1092/
dc.description.degreelevelMaestría
dc.relation.referencesSepúlveda Sepúlveda, Franklin Alexander (2004) Extracción de parámetros de señales de voz usando técnicas de análisis en tiempo - frecuencia. Maestría thesis, Universidad Nacional de Colombia - Sede Manizales.
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.subject.proposalProcesamiento de señales
dc.subject.proposalSistemas de procesamiento de la voz
dc.type.coarhttp://purl.org/coar/resource_type/c_bdcc
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.contentText
dc.type.redcolhttp://purl.org/redcol/resource_type/TM
oaire.accessrightshttp://purl.org/coar/access_right/c_abf2


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record

Atribución-NoComercial 4.0 InternacionalThis work is licensed under a Creative Commons Reconocimiento-NoComercial 4.0.This document has been deposited by the author (s) under the following certificate of deposit