Análisis de señales por métodos estadísticos

Anuncio
Análisis de señales por métodos estadísticos
Paula Brudny1, Laura Pérez2, Carlos D´Attellis3
División Aplicaciones Científicas
Centro de Cálculo Científico
Comisión Nacional de Energía Atómica
Av. Del Libertador 8250 (1429) Buenos Aires
ARGENTINA-
Resumen
El trabajo trata acerca de la aplicación de dos metodologías basadas en conceptos
probabilísticos al análisis de señales perturbadas con ruido de características desconocidas.
En ambos casos, el objetivo es definir parámetros que permitan detectar cambios en la
forma, periodicidad o amplitud de las señales que permitan una comparación con patrones
dados, para clasificar las señales obtenidas en grupos como funcionamiento “normal” o no de
un proceso, reconocimiento de patrones. Se trata de obtener alguna ventaja sobre los métodos
tradicionales (análisis de Fourier, por ejemplo), o una alternativa que permita aprovechar
información oculta en las señales registradas.
Uno de los enfoques se basa en el estudio de las distribuciones de amplitud de las señales.
Más allá del rango de valores de esta distribución, que depende fuertemente de las
condiciones de cada experimento, la “forma” de esta distribución habla a su vez de la “forma”
de las ondas que constituyen la señal, aspecto descuidado por las técnicas habituales de
análisis espectral. Se buscan entonces cambios en la forma de esta distribución.
El otro enfoque se basa en el concepto de “distancia entrópica”, que da una medida
probabilística de la diferencia entre las dos señales. Para esto, primero se ajusta cada señal
(centrada) a un modelo autoregresivo (AR), y luego se comparan estos modelos mediante un
coeficiente de verosimilitud. Este método, originalmente orientado a la detección de pequeños
terremotos en señales sísmicas, diferenciándolos del ruido, permite comparar una señal
obtenida con otra previamente dada, o seguir la evolución de un proceso para controlar su
apartamiento del comportamiento esperado.
Los resultados se aplicaron sobre señales de emisión acústica (SEA) producidas en
laboratorio: la evolución del desgaste de una pieza a lo largo de un proceso prolongado, con el
objetivo de detectar un umbral de tolerancia del desgaste admisible.
1. Estudio de la distribución de amplitudes
1.1 Parámetros estudiados
-
2
CONICET-Actualmente en la Universidad Nacional de Rio Cuarto, Argentina.
Actualmente en la Universidad de San Andrés Argentina.
3
Actualmente en la Universidad Favaloro y Universidad Nacional de San Martín, Argentina.
E-mail:
[email protected]
Este trabajo fue parcialmente subvencionado por la International Atomic Energy Agency, Research Contract
5987/RB
1
Este método se basa en los resultados obtenidos por Kannatey-Asibn y Dornfeld [4] e intenta
reconocer diferencias entre señales a través del estudio de la distribución de amplitudes.
Básicamente la distribución de amplitudes se obtiene haciendo un gráfico de las frecuencia
con que se dan las diferentes ordenadas de la señal. Se traza un conjunto de paralelas al eje x y
se cuenta el número de cruces de tales líneas. Una zona de baja pendiente de la señal
incrementará el valor de la frecuencia relativa en el intervalo correspondiente a sus ordenadas.
De este modo el “aspecto” de la curva (por ejemplo la curvatura de los extremos) se verá
reflejada en el aspecto de la distribución (Fig. 1).
En este punto aparecen dos puntos a considerar. Uno es el rango de valores de la
distribución y otro es la forma de la misma. La caracterización de texturas a través del estudio
de perfiles de superficies (problema análogo si pensamos la altura del perfil en función del
espacio como la señal en función del tiempo) ha mostrado que es en la forma de la
distribución donde aparecen los aspectos reveladores de cambios en la “forma” de las curvas.
Son los momentos de orden 3 y 4 los que están relacionados con la forma de una
distribución. Se define la asimetría (skew) como el momento normalizado de orden 3 o sea
S=
∞
1
σ
3
∫ [x − E ( x)]
3
f ( x )dx,
−∞
donde f es la función de densidad de probabilidad de la variable x, y σ la desviación standard.
Es esencialmente una medida de la asimetría de la señal alrededor de su línea media. Por
ejemplo con “picos” apuntando hacia arriba tendría asimetría positiva mientras que una con
“picos” apuntando hacia abajo tendría asimetría negativa. Esta regla es generalmente válida.
Otra característica es que la mayoría de las ordenadas aparecen en el lado opuesto de la línea
media hacia la dirección de la asimetría.
La curtosis muestra un aspecto completamente diferente. Se define como el momento de
orden 4 normalizado o sea:
K=
∞
1
σ
4
∫ [x − E ( x )]
4
f ( x )dx ,
−∞
y mide la “agudeza” del trazo de la señal. Los valores se comparan con el valor de la curtosis
de la distribución de Gauss, que es 3. Un valor mayor implica, generalmente, una distribución
con un pico más agudo, o sea que la mayoría de los valores están concentrados en un rango
pequeño. Un valor menor habla de una distribución más chata.
Cuando no se conocen las distribuciones de las variables pero se dispone de datos discretos
pueden usarse estimadores. En general un estimador del momento centrado de orden r es
Mr =
donde N es el número de datos y x =
respectivamente:
1 N
∑ ( x k − x )r ,
N k =1
1 N
∑ x k . Estimadores de la asimetría y la curtosis son
N k =1
S=
M3
K=
y
3
M22
M4
M 22
.
S y K podrían ser utilizados como parámetros característicos de la curva para diferenciarla de
otra de distinta forma. Un problema con estos parámetros es que son muy sensibles a los datos
extremos aislados, ya que los valores de la variable entran al cubo y a la cuarta en su cálculo.
Además no son independientes, esto es, un valor alto de asimetría va generalmente con un
valor alto de curtosis. Para solucionar esta cuestión se asimilan los datos a una distribución
Beta.
Esta distribución es la de una variable definida entre 0 y 1, que depende de dos parámetros
a y b, cuya función de densidad está dada por
f ( x) =
1
x a −1 (1 − x ) b−1 ,
β ( a , b)
1
donde β ( a, b) = ∫ y a −1 (1 − y ) b−1 dy .
0
Puede verse que para esta distribución
m = E ( x) =
a
a+b
σ 2 = Var ( x ) =
(1)
ab
(2)
(a + b + 1)(a + b )2
1
2( b − a )  a + b + 1  2
Sβ =


a + b + 2  ab 
Kβ =
[
]
3 ( a + b + 1) 2 (a − b )2 + ab (a + b + 2 )
,
(a + b + 2 )(a + b + 3) ab
donde Sβ y Kβ son la asimetría y la curtosis respectivamente.
La forma de la distribución cambia según los valores de los parámetros a y b. Por ejemplo
si alguno de ellos es menor que 1 la distribución es en forma de “U”, si son distintos la
distribución es asimétrica, si ambos son mayores que 2 es unimodal, etc.
Estos parámetros, que caracterizan totalmente a la distribución Beta, son independientes
entre sí. De este modo, cada par (a, b) caracteriza una forma de distribución de amplitudes.
Además pueden ser estimados a partir de los datos. Para ello se escala previamente la señal
para transformarla en una variable cuyo rango se extiende ente 0 y 1. Definimos
y=
x − x min
.
x max − x min
Despejando de las ecuaciones (1) y (2) y reemplazando m y σ por los estimadores antedichos
calculados en base a la variable y, se obtiene
aˆ =
(
M 1 M 1 − M 12 − M 2
M2
(
)
)
(1 − M 1 ) M 1 − M 12 − M 2
bˆ =
.
M2
De este modo, representando cada conjunto de datos por un punto en el dominio ( aˆ , bˆ) , se
podrían detectar cambios en la forma de la distribución de amplitudes correspondientes a
cambios en el aspecto de la señal debidos, a su vez, al desgaste o falla en la herramienta
actuante.
1.2. Resultados obtenidos
Mostramos los resultados de un experimento en que se tomaron muestras de SEA en dos
etapas del rodamiento de una crapodina sin lubricación, al principio y hacia el final, antes de
que se desgastara totalmente. Para cada una de las muestras se calcularon M1 , M2 , M3 y M4,
la asimetría y la curtosis de la muestra, y los estimadores de los parámetros a y b de la
distribución Beta, tomando subconjuntos que abarcaran aproximadamente 10 veces el período
fundamental . Se graficaron en el plano K contra S, Kβ contra Sβ , y aˆ contra bˆ. Puede
observarse en las figuras 2, 3, y 4 que sería factible establecer límites entre la zona donde se
ubican los datos producidos por la crapodina al comienzo de la experiencia y aquéllos
emitidos momentos antes de la destrucción.
2. Distancia entrópica
2.1. Introducción
Esta sección da cuenta de los elementos para el análisis basado en el concepto de distancia
entrópica [3].
El método se basa en comparar la señal obtenida con otra preexistente, que se utiliza como
referencia. Para esto, la señales se ajustan a un modelo AR de orden p a determinar:
p
∑ a i x t −i = ε t ,
i =0
a 0 = 1,
{ε t } variables aleatorias gaussianas con E [ε t ] = 0 ; E [ε i ε j ] = δ ijσ ε , y ai los coeficientes del
modelo.
Dadas las primeras p observaciones de una muestra x = ( x1 ,..., x N ) t , donde t indica transposición, llamand
a = ( a1 ,..., x p ) t ; b = (1, a1 ,..., x p ) t resultan los estimadores por mínimos cuadrados :
aˆ = − D −1d ;
σˆ ε 2 = bˆ t C bˆ,
donde :
[ ]
C = Cij ;
Cij =
1 N
∑ X t −i X t − j ,
N ´ t = p +1
i, j = 0,..., p;
bˆ = (1, aˆ1 ,..., aˆ p ) t ;
N ´ = N − p;
 C11 ... C1 p 


...
. ;
D= .
C p1 ... C pp 


d = (C 01 ,..., C 0 p ) t .
Suponemos que el modelo es asintóticamente estacionario, es decir, todas las raíces µ i del
polinomio a ( z ) = 1 + a1z + ... + ak z k satisfacen µi > 1 . Una vez identificados los parámetros
(esto es, los coeficientes ai ,1 ≤ i ≤ p, y σ t ), es posible escribir la función de probabilidad de la
muestra.
Se desea comparar una muestra de referencia {xR}, de longitud NR, con otra de “test” {xT},
de longitud NT . Ajustando ambas a un modelo del mismo orden p, es posible calcular también
la probabilidad conjunta.
Bajo la hipótesis H0 = “ambas muestras responden al mismo modelo”, se tendrán
parámetros σ p y a p y resulta la máxima probabilidad Lo,
L0 =
1
(σˆ p 2π )
N ´ R N ´T
{
}
Exp − 1 ( N ´ R + N ´T .
2
Bajo la hipótesis H1 = “las muestras responden a distintos modelos” , se tendrán dos
juegos de parámetros (σ R , a R ), (σ T , a T ) , y entonces
L1 =
1
σˆ RN ´R σˆ TN ´T ( 2π ) N ´R + N ´T
{
}
Exp − 12 ( N ´ R + N ´T .
Por lo tanto el cociente de verosimilitud resulta:
N´
N´
L0 σˆ R R σˆ T T
λ=
=
.
L1
σˆ pN ´R + N ´T
Se define entonces la distancia entrópica
d = −2 ln λ = ( N ´ R + N ´ T ) ln(σˆ 2p ) − N ´ R ln(σˆ R2 ) − N ´ T ln(σˆ T2 ) )-
En condiciones normales, éste es un número no negativo (se debe estar alerta a la aparición
de matrices mal condicionadas), y, además, es cero si y sólo si σˆ R = σˆ T y aˆ R = aˆ T , es
decir, si los modelos identificados resultan iguales.
Una variación en la amplitud de las señales modificará el estimador de la varianza, sin
modificar los coeficientes del polinomio, en tanto que modificaciones en las frecuencias
afectarán a todo el modelo.
2.2. Resultados obtenidos
Al implementar este criterio, hay dos decisiones que deben tomarse: el orden de los modelos a
ajustar, y la cantidad de puntos a considerar. Para elegir el orden, se tomaron en consideración
el modelo FPE de Akaike y diversas pruebas hechas sobre distintos grupos de datos. Se
observó que, para los datos analizados, si bien el mínimo de FPE se obtiene para órdenes
relativamente altos (7 o más) su valor cae abruptamente del orden 2 al 3, y luego las
variaciones son muy pequeñas. Asimismo, las distancias calculadas con distintos órdenes de
ajuste (mayores que 3) preservan la monotonía (al menos en las muestras tomadas; no se
intentó una demostración teórica). Por esto, frente al ahorro computacional que significa,
pensando en la implementación en tiempo real, se decidió trabajar con ajustes de orden 3.
La cantidad de puntos en cada segmento a identificar es una variable de trabajo dentro del
problema. Si la señal presenta una marcada periodicidad, una vez incluidos un cierto número
de períodos la información es redundante y el modelo identificado no se altera mayormente.
En cambio, si presenta grandes variaciones, pretender un único modelo de ajuste que
contenga toda la señal resulta una pérdida de información. Por eso, los algoritmos de
segmentación descriptos más abajo detectan las variaciones cuando los modelos identificados
al tomar sólo parte de los puntos resultan diferentes. Es sin embargo un problema a explorar
la longitud óptima de los segmentos.
Se presentan aquí los resultados de aplicar estos conceptos a SEA provenientes del
desgaste de la crapodina.
En primer lugar, se buscaron variaciones dentro de la señal haciendo sucesivas
fragmentaciones “anidadas” de la misma (semejantes a un algoritmo de bisección),
comparando las distancias computadas entre los segmentos.
Las muestras provenientes del desgaste de la crapodina mostraban grandes diferencias,
evidentes a simple vista, incluso dentro del mismo grupo (las del comienzo y las del final).
Estas diferencias se detectan en las distancias calculadas, lo que es un comportamiento
deseable para permitir la automatización del sistema, si bien no permiten discriminar con
fineza los dos grupos (ver Tablas I y II; ya que las matrices son simétricas, los valores se
consignan sólo una vez).
3. Referencias
[1] André-Obbrecht, R., “On line segmentation of speech signals without prior recognition”, en Detection in
Abrupt Changes in Signals and Dynamical Systems, Ed. Basseville y Benveniste, Springer Verlag, 1986.
[2] Basseville, M., “The two-models approach for the on-line detection of changes in AR processes”, en
Detection in Abrupt Changes in Signals and Dynamical Systems, Ed. Basseville y Benveniste, Springer
Verlag, 1986.
[3] Chen, C., “On a segmentation algorthm for seismic signals”, Geoexploration, 23(1984/85)35-40.
[4] Kannatey-Asibu, E. Jr. y Dornfeld, D.A., “A study of tool wear using statistical analysis of metal- cutting
acoustic emission”, Wear, 76(1982)247-261.
[5] Whitehouse, D.J., “Beta functions for surface topology”, Ann. CIRP, 27(1978)491-497.
Tabla I: Distancias calculadas con ajustes de orden 3 tomando segmentos de 4096 puntos (los
segmentos ca y cb corresponden al comienzo del experimento y los fa, fb y fc al final.
cb
fa
fb
fc
1034.7
3389.7
2821.6
5671.1
ca
0.0
1253.1
1889.5
3572.7
cb
0.0
1209.1
1563.9
fa
0.0
3297.5
fb
Tabla II: Distancias calculadas con ajustes de orden 3 tomando segmentos de 2048 puntos (los segmentos 1 y 2
son las dos mitades de los correspondientes en la Tabla I).
ca1
ca2
cb1
cb2
fa1
fa2
fb1
fb2
fc1
522.1
0.0
ca2
1470.3
711.8
0.0
cb1
164.9
227.1
777.9
0.0
cb2
1866.1
1839.8
731.2
1397.5
0.0
fa1
1384.2
1546.3
565.4
957.1
114.4
0.0
fa2
1434.9
1153.3
1169.3
1154.2
670.1
594.4
0.0
fb1
1502.9
1160.7
1107.0
1196.4
580.5
523.8
4.6
0.0
fb2
3311.6
2738.3
1716.4
2810.9
676.2
1166.4
1727.5
1673.9
0.0
fc1
3092.1
2601.4
1435.7
2554.4
542.4
974.1
1647.2
1574.5
35.1
fc2
Descargar