Medidas Medidas de de Distancia Distancia (ó (ó Distorsión) Distorsión) • Una característica fundamental de los sistemas de reconocimiento (de palabra o de locutor) es la forma en que los vectores característicos son combinados y comparados con los patrones de referencia. • Para poder realizar estas operaciones es necesario definir una medida de distancia entre vectores característicos. Definición: Una distancia entre dos vectores x e y de un espacio vectorial X es una función a valores reales d(x, y) sobre el producto Cartesiano X × X , que verifica las propiedades (a ) 0 ≤ d (x, y ) < ∞ , ∀ x, y ∈ X , y d (x, y ) = 0 (b ) d (x, y ) = d (y, x ), ∀ x, y ∈ X (c ) d (x, y ) ≤ d (x, z ) + d (y, z ), ∀ x, y, z ∈ X si y solo si x = y ProDiVoz 1 • Algunas de las medidas de distancia más utilizadas son las distancias o métricas inducidas por las normas en espacios Lp . Por ejemplo, si f i , f i ' con i = 1,2,L, D son las componentes de dos vectores característicos f y f ' , pueden definirse las siguientes métricas inducidas por las normas Lp D d1 = ∑ f i − f i ' distancia i =1 d2 = ProDiVoz ∑(f − f ) D i =1 ' 2 i i L1 distancia Euclidea (o L2 ) 2 • Una medida de distancia muy utilizada cuando se emplean como característica los coeficientes cepstral, que ha probado tener una muy buena performance en tareas de reconocimiento, es la distancia Euclidea ponderada, ponderada definida como ∑ (w (c − c )) D d2w = i =1 donde wi = ' i i 2 i 1 σi siendo σ i una estima de la varianza del i-ésimo coeficiente cepstral ci . Aquí, los datos que son menos confiables (con mayor varianza) son pesados menos. 2 ProDiVoz 3 • Cuando se utiliza el power cepstrum como vector característico, a la distancia en L2 se la denomina distancia cepstral. Teniendo en cuenta la identidad de Parseval, resulta d ceps = ∑ (c ∞ m = −∞ m − cm ) ' 2 1 = 2π π ∫π ( ) ( ln X (ω ) − ln X ′(ω ) 2 2 ) 2 dω − En la práctica, sólo se computa un número finito Q de coeficientes power cepstral, resultando d ceps ≅ ProDiVoz ∑ (c Q m =1 m − cm ) ' 2 4 • Una formulación más general, que tiene en cuenta la interacción entre coeficientes a traves de una matriz de covarianza es la denominada distancia de Mahalanobis, Mahalanobis definida como dM = (x − µ )T Σ −1 (x − µ ) donde 1 µ≈ Ne 1 Σ≈ Ne Ne e x ∑i i =1 Ne ∑ (x − µ )(xie − µ ) T e i i =1 1 x= Nr ProDiVoz Media de los vectores de entree namiento xi Nr ∑x i =1 r i Matriz de Covarianza de los e vectores de entrenamiento xi Media de los vectores de recor 5 nocimiento xi