RED NEURONAL PARA LA CLASIFICACIÓN DE FALLAS EN LÍNEAS DE TRANSMISIÓN A PARTIR DE REGISTROS DE OSCILOPERTURBOGRAFÍA

NEURAL NETWORK FOR FAULT CLASSIFICATION IN TRANSMISSION LINES BASED ON OSCILOPERTUBOGRAPHY RECORDS

JHON ALBEIRO CALDERÓN
Especialista de Operación, Dirección Gestión Red, ISA: Interconexión Eléctrica S.A, jacalderon@isa.com.co

JULIAN MORENO CADAVID
Universidad Nacional de Colombia, Docente Escuela de Sistemas, Facultad de Minas, jmoreno1@unalmed.edu.co

DEMETRIO ARTURO OVALLE
Universidad Nacional de Colombia, Director Escuela de Sistemas, Facultad de Minas, dovalle@unalmed.edu.co

Recibido para revisar Febrero 14 de 2008, aceptado Mayo 06 de 2008, versión final Mayo 13 de 2008


RESUMEN: El diagnóstico de fallas eléctricas en líneas de transmisión a alto voltaje es una tarea compleja no solo por la cantidad de información involucrada que puede provenir de diversas fuentes como SOE, SCADA y registradores, si no también por la variabilidad misma de las fallas. Dicha complejidad impacta en la oportunidad y certeza del diagnóstico, factores particularmente importantes para el análisis en tiempo real donde rápidamente deben tomarse pautas adecuadas para el restablecimiento del sistema eléctrico de potencia. En este artículo se propone el uso de de una red neuronal con aprendizaje por regularización bayesiana y finalización temprana para la clasificación de fallas a partir de registros de osciloperturbografía provenientes de registradores de falla y se muestra su efectividad para una amplia variedad de casos de entrenamiento y validación, los cuales son obtenidos por medio de un modelo de ATP con el cual se simularon la cantidad de fallas eléctricas requeridas.

PALABRAS CLAVE: Sistema Eléctrico de Potencia, Diagnóstico de Fallas, ATP, Redes Neuronales, Regularización Bayesiana.

ABSTRACT: The electric fault diagnostics in high voltage transmission lines is a complex task not only because of the amount of information which can come from different sources as SOE, SCADA and recorders, but also because of the variability of such faults. Such complexity impacts the opportunity and accuracy of diagnostic, and these issues are particularly important for actual time analisis where adecuate actions should be taken in order to restablish the electric power system. In this paper a neural network with bayessian regularization learning and early finalization is proposed for fault classification ussing osciloperturbography records and its efectivity is shown for a wide variety of training and validation cases which are obtenied with an ATP model where the required electric faults were simulated.

KEYWORDS: Power System, Fault Diagnostics, ATP, Neural Networks, Bayessian Regularization.


1. INTRODUCCIÓN

Cuando se presenta una falla en un Sistema Eléctrico de Potencia (SEP) los esquemas de protección que se encuentren instalados en las subestaciones deben actuar sobre los respectivos equipos de interrupción para aclarar la falla. Lo anterior produce un impacto sobre el sistema que debe ser analizado por los centros de control no solo con el fin de definir pautas adecuadas para su restablecimiento, si no también para determinar el estado de los activos y diagnosticar el funcionamiento de los equipos involucrados.

Para detectar este tipo de eventualidades y realizar los análisis respectivos, las empresas encargadas de la transmisión y distribución de electricidad disponen de diversas herramientas que brindan información tanto analógica como digital. Entre estas fuentes se encuentra el SOE (Sequence of Events) que consiste en una bitácora de las señales producidas por los sistemas de protección; el SCADA (Supervisory Control And Data Acquisition) que puede interpretarse como una base de datos donde se almacenan los estados de todos los equipos; los DFR (Digital Fault Recorder) que producen los registros de osciloperturbografía en los que se reportan las corrientes, tensiones, y otras medidas de interés en un elemento específico.

De esta manera, al producirse una falla (y en especial una que involucre varias líneas) se produce una avalancha de información de estas fuentes hacia los centros de control donde los analistas tienen un tiempo determinado para tomar acciones que propendan por asegurar el correcto funcionamiento del sistema y para generar un reporte preliminar sobre la falla ocurrida.

Como un apoyo a estas labores que son llevadas a cabo prácticamente a mano y gracias a la experiencia de los analistas, en este artículo se propone una herramienta para la clasificación automática de las fallas empleando la información de los registros de osciloperturbografía, y más específicamente los valores de las corrientes y voltajes para las tres fases medidas durante el evento.

A manera de ejemplo en la Figura 1 se ilustra un registro típico capturado por un DFR durante una falla. En este caso el procesamiento de estos datos debería dar como resultado que el evento corresponde a una falla bifásica para las fases A y B. En este caso de ejemplo la clasificación de la falla es relativamente simple debido a las diferencias considerables en las corrientes y voltajes, sin embargo este no es siempre el caso. Igualmente, cabe señalar que la clasificación de la falla es tan solo una parte del diagnóstico que deben realizar los analistas, el cual debe complementarse con información de causa, dirección, localización, evolución del evento y operación de los sistemas de protección. Por ejemplo un diagnóstico más completo diría algo como “Recierre bifásico no exitoso ante falla en las fases A y B debido a descarga atmosférica. La falla se presentó hacia delante y se localizó a 50 kms de la subestación asociada con el registro. La falla fue aclarada a los 260 milisegundos después de iniciada mediante el disparo trifásico del interruptor de bahía”.


Figura 1.
Registro de falla
Figure 1. fault record

Como llegar a dicho análisis completo no hace parte del alcance de este artículo, pero si hace parte del proyecto de investigación al que está vinculado. Dicho proyecto contempla además el análisis integrado con la información de SOE y SCADA. Para mayor información al respecto el lector puede dirigirse a [2, 8].

El resto de este artículo está organizado de la siguiente manera: En la sección 2 se describe el modelo utilizado para obtener los datos de entrada con registros de osciloperturbografía, mientras que en la sección 3 se describen los diferentes métodos utilizados para su preprocesamiento. En la sección 4 se explica la arquitectura de la red neuronal seleccionada para llevar a cabo la clasificación de fallas, y en la sección 5 se muestran los resultados obtenidos mediante su entrenamiento y validación. Finalmente en la sección 6 se listan algunas de las conclusiones obtenidas con este trabajo.

2. OBETENCIÓN DE LOS DATOS

Con el fin de obtener una cantidad considerable de datos que correspondan a una amplia variedad de fallas se diseñó un modelo en ATP (Alternative Transient Program) [3] para representar una línea de transmisión entre dos subestaciones. Como se observa en la Figura 2 este modelo consta básicamente de dos fuentes con sus respectivos equivalentes de Thevenin que representan los aportes de cortocircuito, una línea de transmisión típica y resistencias para representar las impedancias de falla de cada una de las fases.


Figura 2.
Modelación en ATP del sistema eléctrico analizado
Figure 2. Model in ATP of the analyzed electric system

Con el fin de llevar a cabo la exploración exhaustiva de casos en ATP se realizó un análisis de sensibilidad considerando un conjunto representativo de condiciones eléctricas esperadas en cualquier SEP del mundo. Para ello, se consideraron las situaciones que se presentan a continuación:

2.1 Variabilidad del valor de la impedancia fuente tanto del extremo emisor como del extremo receptor
Se consideraron 10 condiciones de impedancia fuente con diferentes grados de fortaleza y aterrizamiento cubriendo condiciones extremas entre un nivel de corto cercano a los 50 kA y un nivel de cortocircuito inferior a 1 kA.

2.2 Variabilidad de las condiciones de carga de la línea de transmisión en estado estacionario
La variabilidad de las condiciones de carga de una línea de transmisión se encuentra relacionada con la diferencia angular entre el ángulo de carga del extremo emisor y el ángulo de carga del extremo receptor. Para variaciones angulares positivas el flujo de potencia resultante va desde el extremo emisor hacia el extremo receptor (exportación) y para las variaciones angulares negativas desde el extremo receptor al extremo emisor (importación). Con base en esto, se consideran cuatro escenarios de carga para exportación y cuatro para importación, para representar cuatro condiciones de cargabilidad en estado estable: Muy alta cargabilidad (diferencias angulares superiores a 40 grados), alta cargabilidad (diferencias angulares entre los 30 y los 40 grados), media cargabilidad (entre los 10 y los 30 grados) y baja cargabilidad (inferior a los 10 grados).

2.3 Variabilidad de la longitud de la línea de transmisión
Se consideran cinco conjuntos para clasificar las líneas de transmisión de acuerdo con su longitud: Líneas muy largas (longitudes superiores a 300 km), líneas largas (longitudes entre los 200 km y los 300 km), líneas medianamente largas (longitudes entre los 50 km y los 200 km), líneas cortas (longitudes entre los 10 km y los 50 km) y líneas muy cortas (longitudes inferiores a los 5 km).2.4 Variabilidad de la localización de la falla
Se consideraron seis tipos de ubicación de la falla de acuerdo con el grado de cercanía al extremo emisor: Muy cercanas (por debajo del 10% de la longitud de la línea), Cercanas (entre el 10% y el 30% de la línea), Medianamente cercanas (entre el 30% y el 50% de la línea), Medianamente lejanas (entre el 50% y el 70% de la línea), Lejanas (fallas ubicadas entre el 70% y el 90% de la longitud de la línea) y Muy lejanas (fallas ubicadas mas allá del 90% de la longitud de la línea)2.5 Variabilidad de la impedancia de la falla
Se consideraron seis tipos de valores para representar la impedancia de falla: muy baja impedancia (inferior a 1 ohm), baja impedancia (entre 1 y 20 ohm), impedancia medio-baja (entre los 20 y 40 ohm), impedancia medio-alta (entre los 40 y los 60 ohm), alta impedancia (entre 60 y 90 ohm) y muy alta impedancia (superior a los 90 ohm).2.6 Variabilidad del tipo de falla
Se consideraron los tipos de falla típicos en los sistemas de transmisión: Falla monofásica por cada fase, Falla bifásica aislada (AB, BC y CA), Falla bifásica a tierra (AB-g, BC-g, CA-g) y Falla trifásica (ABC).

Como resultado del análisis de sensibilidad anterior se generaron cerca de 47000 casos que corresponden a la combinación de posibles valores considerados para los 6 aspectos mencionados. De dichos casos, 36500 se utilizaron para el entrenamiento y los restantes para la validación y el chequeo de la red neuronal. Estos casos de validación y chequeo se tomaron como condiciones intermedias de los patrones de entrenamiento con el fin de verificar que no hubiera sobreentrenamiento (etapa de validación) y que el modelo tuviera una adecuada capacidad de generalización (etapa de chequeo).

3. PREPROCESAMIENTO DE LOS DATOS

Antes de pasar por la clasificación, los datos utilizados son preprocesados para agilizar y facilitar esta tarea. Dicho preprocesamiento

contempla varias etapas para los registros de osciloperturbografía: la selección de la técnica de filtrado analógico, la selección de la técnica de filtrado digital y el escalamiento.

3.1 Filtrado analógico y digital
Una vez analizadas las referencias [1, 4, 10, 11] se consideraron para el filtrado analógico los métodos: Butterworth, Chebyshev I, Chebyshev II y Elíptico; mientras que para el filtrado digital se consideraron los métodos de Fourier, Coseno y Seno.

De la evaluación que se llevó a cabo, se obtuvo que el filtro análogo pasabajos del tipo Butterworth de orden 2 con frecuencia de corte de 360 Hz es adecuado para mitigar el efecto de aliasing en el muestreo de un registro de osciloperturbografía ya que presenta las menores oscilaciones y sobreimpulsos lo que implica un menor tiempo de retardo en la respuesta final del filtro. En la Figura 3 se ilustra el comportamiento de cada uno de los filtros analizados.


Figura 3.
Comportamiento de los cuatro filtros análogos comparados con el ideal
Figure 3. Behavior of the tour analog filters compared to the ideal filter

En el caso del filtrado digital se seleccionó, con base en la teoría analizada en la bibliografía, el filtro de Fourier como el más apropiado para determinar las componentes de 60 Hz debido a que utiliza un ciclo completo para muestreo y por lo tanto es más preciso. En aplicaciones de tiempo real los algoritmos de seno y coseno sacan provecho del muestreo de medio ciclo con el fin de aumentar velocidad de respuesta. En aplicaciones Off-line, sin embargo, como es el caso del procesamiento de registros la velocidad no es el factor preponderante y en cambio sí resulta más importante la precisión en el cálculo.

3.2 Escalamiento de datos
La metodología del escalamiento ha sido utilizada por diversos investigadores [7, 12, 13] para el preprocesamiento de señales de registros de osciloperturbografía. Este método, consiste fundamentalmente en escalar los valores de los patrones de entrada de tal manera que sean comparativamente similares. En el presente caso de estudio se adoptó un factor de escala de 1000 para los valores de corriente y de 230000/√3 para los valores de voltajes.

4. ARQUITECTURA DE LA RED NEURONAL

Para la detección y clasificación de la falla se utilizó un perceptrón multicapa [6] con una sola capa oculta de s neuronas. La capa de entrada tiene 7 neuronas que corresponden con los valores de las tensiones y corrientes de las 3 fases más la corriente de secuencia cero. La capa de salida tiene 4 neuronas que corresponden a los valores binarios que indican la fase fallada (los 3 primeros bits) y si involucra o no falla a tierra (último bit), como se muestra en la Tabla 1.

Tabla 1. Tipos de falla considerados
Table 1. Considered fault types

En este caso el valor de s utilizado fue de 12, el cual se obtuvo luego de realizar diversas pruebas de verificación buscando minimizar el error resultante pero a su vez garantizando un adecuado nivel de generalización.

El modelo general de la red utilizada consta entonces de tres capas (entrada, oculta y salida), totalmente conectada y con alimentación hacia delante (feedforward), como se ilustra en la Figura 4. Se utilizaron las funciones de activación de MATLAB tansig en la capa oculta y la de transferencia lineal purelin en la capa de salida. Para el algoritmo de aprendizaje de la red se utilizaron conjuntamente los métodos que se describen en las secciones 4.1 y 4.2, dado que mostraron mejores resultados que otros más comunes en la bibliografía como los basados en el gradiente descendente del error.


Figura 4.
Arquitectura de la red neuronal utilizada
Figure 4. Used neural network architecture

4.1 Regularización bayesiana
El punto de partida de este método es emplear una función de rendimiento diferente del error cuadrático medio (MSE) de los datos de entrenamiento, común para muchos algoritmos. En este caso se emplea una función modificada que involucra un término que consiste en la media de la suma de los cuadrados de los pesos de las conexiones de la red (incluyendo los bias) como se describe a continuación.

Se calcula el MSE de la manera tradicional:

Se calcula la función de desempeño modificada como:

Donde g es el radio de rendimiento y

Usar esta función fuerza a la red a tener pesos pequeños, lo cual suaviza la salida y disminuye la posibilidad de sobreentrenar. El problema sin embargo radica en la dificultad de elegir el radio de rendimiento. Si este parámetro es muy grande se puede producir sobreentrenamiento, pero si es muy pequeño la red no se ajusta adecuadamente a los patrones de entrenamiento.

Una manera de resolver este problema es encontrar una rutina de regularización automatizada que optimice la definición de parámetros. Un enfoque para lograrlo se conoce como regularización bayesiana [9] en el que los pesos de la red se asumen como variables aleatorias con distribuciones especificas de manera que los parámetros de la regularización son asociados a las varianzas desconocidas asociadas a dichas distribuciones. De esta manera es posible estimar los parámetros empleando técnicas estadísticas. Una descripción más detallada de este enfoque y su combinación con otras técnicas puede encontrarse en [5].

En Matlab es posible emplear esta rutina por medio del algoritmo trainbr que puede pasarse como argumento a la hora de definir la red por medio de la función newff Una característica de este algoritmo es que provee una medida de cuantos parámetros de la red (pesos y bias) son efectivamente usados por la red. Una manera de determinar cuando el algoritmo converge es si la suma del cuadrado de los errores (SSE) y la suma del cuadrado de los pesos (SSW) son relativamente constantes durante varias iteraciones.

4.2 Finalización temprana
Este método consiste en dividir los datos de entrenamiento en tres conjuntos. El primero es el conjunto de entrenamiento que es usado para calibrar los pesos de la red. El segundo es el conjunto de validación cuyo error es monitoreado durante el proceso de entrenamiento. Este error generalmente decrece durante la fase inicial de entrenamiento, de la misma manera a como lo hace el error de entrenamiento. Sin embargo, en el momento en que la red empieza a sobreentrenarse el error de validación comienza a crecer aunque el de entrenamiento no lo haga. De esta manera cuando el error de validación crece durante un número determinado de iteraciones el entrenamiento debe detenerse y los pesos obtenidos durante el mínimo error de validación son retornados. El tercer conjunto, el de chequeo, no es usado durante el entrenamiento, pero puede ser útil para comparar diferentes redes. También puede ser útil si se grafica contra el error de validación ya que si alcanzan un mínimo en una iteración significativamente diferente puede ser una señal de una división de los datos deficiente.

Como consideración final, es importante resaltar que al utilizar ambos métodos al tiempo, regularización bayesiana y finalización temprana, como fue el caso en este trabajo, es una buena idea entrenar la red a partir de diferentes condiciones iniciales de manera que se verifique la robustez del rendimiento de la red.

5. RESULTADOS OBTENIDOS

Una vez definidas la arquitectura y algoritmo de aprendizaje de la red se procedió a realizar el entrenamiento utilizando los datos obtenidos mediante el modelo descrito en la sección 2. Se comenzó inicialmente con un número bajo de patrones de entrenamiento (2214) y a medida que se verificaba el desempeño del modelo se comenzó a incrementar el número de patrones (12250) hasta llegar a verificar el desempeño de la red con un total de 36500 patrones de entrenamiento y 10496 patrones de validación y chequeo.

Como consecuencia importante de estas pruebas se concluyó que al utilizar una red neuronal con el algoritmo trainbr que contempla tanto regularización como finalización temprana se obtuvieron buenos resultados para la clasificación de la falla. En este caso se obtuvieron errores inferiores al 1% para los 46996 patrones simulados con el ATP de acuerdo a las características contempladas.

Cabe mencionar que tales errores fueron calculados como una ponderación entre los errores de entrenamiento (0%), validación (0.74%) y chequeo (1.39%), medidos a su vez como la diferencia porcentual entre la salida de la red y la salida (target) real.

Error = α1*error entrenamiento + α2*error validación + α3*error chequeo

Donde 0 ≤ α1, α2, α3 ≤ 1 y α123 = 1

Los valores escogidos para α1, α2 y α3 fueron 0.2, 0.4 y 0.4 respectivamente con el fin de darle más peso a los errores de validación y chequeo, buscando garantizar precisamente la generalización y la robustez del algoritmo.

Los resultados obtenidos se pueden observar en la Figura 5 la cual está dividida en tres partes. En la parte superior se muestran los resultados del entrenamiento, en la del medio los de la validación, y en la inferior los del chequeo. En los tres casos las líneas continuas representan los targets (valores reales) y los asteriscos las salidas de la red. El eje de las abscisas representa los patrones utilizados y el de las ordenadas el tipo de falla. Vale la pena recordar que las falla se representan mediante 4 bits por lo que en esta figura lo que se muestra es su correspondiente valor decimal. Así por ejemplo un estado de no falla o estado estacionario (0000) corresponde al tipo 0, mientras que una falla bifásica AB a tierra (1101) corresponde al tipo 13.


Figura 5.
Targets vs. Salida de la red
Figure 5. Targets vs. Net’s outputs

Por su parte en la Figura 6 se puede observar la evolución de la calibración de la red tanto para la medida SSE como SSW.


Figura 6.
Evolución de la calibración de la red
Figure 6. Net’s calibration evolution

6. CONCLUSIONES

La investigación presentada en este artículo respecto a la clasificación automática de fallas en líneas de transmisión se enfocó en los siguientes aspectos: modelo de simulación de fallas, técnicas de filtrado de señal, técnicas de preprocesamiento de los datos y por último la clasificación de fallas como tal.

De las técnicas de filtrado analizadas se concluyó que para su aplicación al procesamiento de registros de osciloperturbografía el filtro Butterworth de segundo orden y frecuencia de corte de 360 Hz es adecuado para el filtrado analógico, mientras que para el filtrado digital lo es el filtro de Fourier.

Con relación a las técnicas de preprocesamiento y normalización de los datos se determinó que el escalamiento de señal utilizado produjo un Desempeño satisfactorio en cuanto al error de clasificación resultante.

Por su parte, los resultados de la investigación muestran que la metodología propuesta para la exploración sistemática de las condiciones eléctricas por medio de un modelo ATP es amplia y robusta. Es decir, los patrones de entrenamiento, validación y chequeo que se obtienen con este método (siempre y cuando se generen de una forma adecuadamente espaciados dentro del conjunto total) permiten abarcar de una manera efectiva el universo de entrada de condiciones eléctricas esperadas durante fallas en cualquier SEP real del mundo.

Los resultados de la evaluación realizada al modelo de red neuronal analizado para la clasificación de fallas mostraron que se obtienen errores inferiores al 1% para las 46996 fallas simuladas. Cabe resaltar, que a pesar de que el modelo neuronal con regularización bayesiana y finalización temprana ofrece errores relativamente bajos, presenta el inconveniente de ser una caja negra rígida (es decir, la red neuronal simplemente evalúa sus entradas y produce sus salidas pero no se sabe cómo). Por este motivo, cuando se presenta una clasificación errada no hay manera de realizar modificaciones y la red debe ser reentrenada completamente lo cual es inapropiado a nivel práctico. Precisamente este problema de reentrenamiento y aprendizaje se postula como trabajo futuro.

7. AGRADECIMIENTOS

Este trabajo presenta los resultados de la investigación realizada por la Universidad Nacional de Colombia - Sede Medellín e Interconexión Eléctrica S.A. – ISA, como parte del desarrollo del proyecto de investigación “Herramientas informáticas para el diagnóstico automático de eventos en líneas de transmisión de energía eléctrica” cofinanciado por Colciencias.

REFERENCIAS

[1] ALBARDAR, A., “Procesamiento de señales analógicas y digitales”, Segunda Edición, Ed. Thomson Learning, México D.F, 2002.
[2] CALDERON, J. Modelo adaptativo de inteligencia artificial para diagnostico automático de fallas a partir de registros de osciloperturbografia. Tesis de Maestría. Universidad Nacional. 2007.
[3] CANADIAN/AMERICAN EMTP USER GROUP. Alternative Transients Program (ATP) - Rule Book. 1992.
[4] DÍAZ I., ALTUVE J. y VÁSQUEZ E., Estudio comparativo de filtros analógicos pasabajos para relevadores digitales de distancia. VIII Reunión de Verano de Potencia del IEEE Sección México, Acapulco, Gro., Julio de 1995.
[5] FORESEE, F, and HAGAN, M. "Gauss-Newton approximation to Bayesian regularization," Proceedings of the 1997 International Joint Conference on Neural Networks, 1997, pp. 1930-1935.
[6] HAGAN, M., DEMUTH, H. and BEALE, M. Neural Network Design, Boston, MA: PWS Publishing, 1996.
[7] KEZUNOVIC, MLADEN and VASILIC. Fuzzy ART Neural Network Algorithm for Classifying the Power System Faults. IEEE Transactions on power delivery, Vol. 20, No. 2, April 2005.
[8] LLANO, L. Diagnóstico automático de eventos en tiempo real en un sistema de transporte de energía a través del SOE y SCADA usando técnicas de inteligencia artificial. Tesis de Maestría. Universidad Nacional. 2007.
[9] MACKAY, D., "Bayesian interpolation," Neural Computation, Vol. 4, No. 3, 1992, pp. 415-447.
[10] MITRA, S. Digital Signal Processing. A Computer-Based Approach, Second Edition, Mc. Graw Hill, New York, 1998.
[11] MITRA, S. Digital Signal Processing Laboratory Using MATLAB, Mc. Graw Hill, New York, 1999.
[12] SONG, Y., XUAN, Q. and JOHNS, A. Comparison studies of five neural network based fault classifiers for complex transmission lines. Electrical Power and Energy Systems. Elsevier. 43 (1997) 125-132.
[13] VASILIC, S. Fuzzy Neural Pattern Reconigtion Algorithm for classification of the events in power system networks. 2004.