Dynamic characterization of non-stationary signals using entropy-based relevance analysis
Cargando...
Autores
López Montes, Juan Camilo
Director
Tipo de contenido
Document language:
Español
Fecha
Título de la revista
ISSN de la revista
Título del volumen
Documentos PDF
Resumen
Hoy en dia tratar con datos de alta dimensión, que contengan señales complejas cuya información puede estar contaminada de ruido, redundancia o información irrelevante puede ser un problema recurrente en procesos como las señales de EEG o señales de vibraciones producidas por
máquinas rotatoria. Es necesario, proponer una etapa de análisis de relevancia que selecciona los
componentes más importantes y reduzca el alto costo computacional.
Sin embargo, todavía no existe un método estándar para seleccionar componentes relevantes que
puede variar de acuerdo con el objeto de estudio, por lo tanto, para desarrollar una metodología
precisa, se debe incluir información inherente y tener un entendimiento del problema.
En este trabajo, se propone una metodología para revelar patrones relevantes en las dimensiones
del espacio, tiempo y frecuencia considerando el escenario del experimento.
La propuesta consiste en dos etapas una etapa de extracción de características y una etapa donde
se comparan las características guiados por las etiquetas, fue puesta a prueba en las señales de
vibraciones y de encefalograma (EEG) enfocado en la tarea de motor imagery (MI).
En la tarea de MI la metodología se usa para mejorar el rendimiento de clasificación, el procedimiento consiste en filtrar cada canal en diferentes bandas de frecuencia previamente establecidas
para extraer un conjunto de características basado en la entropía, para ser guiadas por una medida
de similitud guiada por las etiquetas, finalmente se selecciona el conjunto de componentes que mejor discrimina las clases, las componentes significativas serán en conjunto más pequeño que logre
el mejor acierto de clasificación.
La propuesta consiste en dos etapas de las cuales pueden ajustarse según la tarea, la etapa de extracción de características que debe ser seleccionado por el tipo de señal, codificando las dinámicas
relevantes de la señal, la etapa medida de similitud se selecciona según el tipo de característica y
su dimension.
En esta tesis probamos dos diferentes configuraciones de las etapas con el fin de mostrar la versatilidad de nuestro método y revelar que configuración codifica mejor las dinámicas relevantes.
La primera configuración se basa en caracterizar las bandas filtradas por la entropia de Renyi y
entropia Permutation para realizar un test estadístico guiado por las clases sobre estas, revelando
el nivel de significancia de cada banda. La segunda configuración caracteriza mediante la construcción un kernel basado en la cross-correlation de cada banda, para posteriormente compararla
contra el kernel de etiquetas por CKA obteniendo el valor de relevancia de cada banda y canal. Las
metodologías fueron probadas en tres bases de datos de BCI y comparado contra distintos métodos
del estado del arte donde nuestro análisis de relevancia mejora estadísticamente la clasificación de
las tareas de MI con una menor cantidad de canales y bandas de frecuencia.
En las señales de vibraciones se propone un índice de salud basado en un análisis de relevancia
que revela el estado actual de la máquina rotativa e identifica de manera temprana fallos en la
misma, la propuesta codifica cada registro del sensor por Ordinal Symbolic Dynamical (OSD) y a
partir de este se construye una función de densidad de probabilidad (fdp) para el registro actual y
un conjunto de registros sanos, finalmente se obtiene un índice de salud comparando estos por la divergencia de Jensen. El orden del OSD debe ser ajustado de manera óptima debido a que este
controla la cantidad de símbolos que pueden existir en el diccionario y por lo tanto la cantidad
de bins o eventos de la fdp. Este parámetro fue ajustado según el estado del arte y teniendo en
cuanto que el orden que es directamente proporcional al costo computacional. En comparación con
métodos del estado arte nuestra propuesta logra identificar el inicio de degradación del rodamiento
más temprano.
En general, el análisis de relevancia permite una reducción considerable de características, esto
facilita la interpretación fisiológica de los experimentos y puede mejorar el rendimiento y el costo
computacional de los sistemas que utilizan estas características.
Abstract
Nowadays deal with data of high dimension, that contain complex signals whose information can
be contaminated noise, redundancy or irrelevant information can be a recurring problem in processes such as EEG signals or signs of vibrations produced by machines rotating basis. In order
to solve this problem, you can deploy an analysis phase of relevance to select the most important
components and reduce the high computational cost.
However, there is still no standard method for selecting relevant components that may vary according to the object of study, therefore, in order to develop a precise methodology, inherent information should be included and an understanding of the problem.
This thesis proposes three methodologies to reveal relevant patterns in the dimensions of space,
time and frequency considering the scenario of the experiment.
The proposal consists of two stages the first is the feature extraction stage and the second stage is
where the characteristics guided by the labels are compared, the methodology which was tested in
the vibration and EEG signals, focused on the Motor imagery task (MI).
In the MI task the methodology is used to improve the performance of classification in tasks of
Brain Computer Interface (BCI), the procedure is to filter each channel in different bands to extract
a set of characteristics based on the entropy, subsequently, the characteristics of class one against
class two are compared by a measure of dissimilarity, in order to select the set of components
that best discriminates the classes, finally, the significant components will be smaller together that
achieves the best classification success.
The proposal consists of two stages of which can be adjusted according to the task, first the method
of extraction of characteristics which must be selected by the type of signal, the type of extraction
selected must be able to codify the relevant dynamics of the signal, second the measure of similarity
is selected according to the type of features and its dimension.
In this document we tested two different stage configurations in order to show the versatility of our
method and reveal which configuration better encodes relevant dynamics. The first configuration is based on characterizing the bands filtered by the entropy of Renyi and Ordinal symbolic Dynamics
to perform a statistical test guided by the classes on these revealing the level of significance of each
band. The second configuration characterized by building a kernel based on the cross-correlation
of each band, comparing the array built against the kernel of labels per CKA getting the value
relevance of each band and channel.
For MI task our methodology was tested in three different BCI datasets and compared against
different methods of the state of the art where our relevance analysis statistically improves the
classification of MI tasks with a lesser amount of channels and frequency bands.
For vibration signals, the condition of the machine must be evaluated by a health index reveals
the current state of the rotary machine and identifies early failures in it, first encodes each sensor
record by Ordinal Symbolic Dynamical (OSD ) and is built a probability density function (FDP)
based on the coding, to be compared against sound records by the Jensen divergence.
The order of the OSD must be adjusted optimally because it controls the number of symbols that
can exist in the dictionary and therefore the quantity of bins or events of the FDP. This parameter
was adjusted according to the state of the art and taking in as far as the order that is directly proportional to the computational cost. In comparison with state methods art our proposed approach
succeeds in identifying the start of degradation of bearing more early.
In general, the relevance analysis allows a considerable reduction of characteristics, this facilitates the physiological interpretation of the experiments and can improve the performance and the
computational cost of the systems that use these characteristics.