Medidas de Distancia (ó Distorsión)

Anuncio
Medidas
Medidas de
de Distancia
Distancia (ó
(ó Distorsión)
Distorsión)
• Una característica fundamental de los sistemas de reconocimiento (de palabra o de locutor) es la forma en que los vectores
característicos son combinados y comparados con los patrones de
referencia.
• Para poder realizar estas operaciones es necesario definir una
medida de distancia entre vectores característicos.
Definición: Una distancia entre dos vectores x e y de un
espacio vectorial X es una función a valores reales d(x, y) sobre el
producto Cartesiano X × X , que verifica las propiedades
(a ) 0 ≤ d (x, y ) < ∞ , ∀ x, y ∈ X , y d (x, y ) = 0
(b ) d (x, y ) = d (y, x ), ∀ x, y ∈ X
(c ) d (x, y ) ≤ d (x, z ) + d (y, z ), ∀ x, y, z ∈ X
si y solo si x = y
ProDiVoz
1
• Algunas de las medidas de distancia más utilizadas son las
distancias o métricas inducidas por las normas en espacios Lp .
Por ejemplo, si f i , f i ' con i = 1,2,L, D son las componentes
de dos vectores característicos f y f ' , pueden definirse las
siguientes métricas inducidas por las normas Lp
D
d1 = ∑ f i − f i
'
distancia
i =1
d2 =
ProDiVoz
∑(f − f )
D
i =1
' 2
i
i
L1
distancia Euclidea (o
L2
)
2
• Una medida de distancia muy utilizada cuando se emplean como
característica los coeficientes cepstral, que ha probado tener una
muy buena performance en tareas de reconocimiento, es la
distancia Euclidea ponderada,
ponderada definida como
∑ (w (c − c ))
D
d2w =
i =1
donde
wi =
'
i
i
2
i
1
σi
siendo σ i una estima de la varianza del i-ésimo coeficiente
cepstral ci . Aquí, los datos que son menos confiables (con
mayor varianza) son pesados menos.
2
ProDiVoz
3
• Cuando se utiliza el power cepstrum como vector característico,
a la distancia en L2 se la denomina distancia cepstral. Teniendo
en cuenta la identidad de Parseval, resulta
d ceps =
∑ (c
∞
m = −∞
m
− cm
)
' 2
1
=
2π
π
∫π
(
) (
ln X (ω ) − ln X ′(ω )
2
2
)
2
dω
−
En la práctica, sólo se computa un número finito Q de coeficientes power cepstral, resultando
d ceps ≅
ProDiVoz
∑ (c
Q
m =1
m − cm
)
' 2
4
• Una formulación más general, que tiene en cuenta la interacción
entre coeficientes a traves de una matriz de covarianza es la denominada distancia de Mahalanobis,
Mahalanobis definida como
dM =
(x − µ )T Σ −1 (x − µ )
donde
1
µ≈
Ne
1
Σ≈
Ne
Ne
e
x
∑i
i =1
Ne
∑ (x
− µ )(xie − µ )
T
e
i
i =1
1
x=
Nr
ProDiVoz
Media de los vectores de entree
namiento xi
Nr
∑x
i =1
r
i
Matriz de Covarianza de los
e
vectores de entrenamiento xi
Media de los vectores de recor
5
nocimiento xi
Descargar