Firma Manuscrita Dinámica Firma Manuscrita On-Line La biometría basada en firma manuscrita dinámica (‘on-line’) hace uso de la información instantánea proporcionada por la tableta de firma Por contraposición, se habla de firma estática (‘off-line’) cuando no se tienen acceso al acto de firma, y sólo se dispone de su forma como imagen Azimuth (0°-359°) Altitude (0°-90°) X 0° 270° Y Javier Ortega García Az P EPS-UAM 90° Al 180° 0 100 200 Firma Manuscrita On-Line Ventajas de la Biometría de Firma On-Line Alta aceptación personal, social y legal como medio de autenticación. Baja invasividad. invasividad Baja influencia del entorno sobre el proceso de adquisición. Buena adaptación a entornos móviles y/o de bajo control. 300 2 Retos de la Biometría de Firma On-Line Alta variabilidad intraintra-clase Variabilidad temporal entre sesiones Los impostores pueden producir falsificaciones entrenadas (‘skilled forgeries’) Baja compatibilidad con imágenes estáticas de firma Eclosión de dispositivos móviles/portátiles con interfaz tipo puntero (TabletPC, PDA, ultra-portable PC, Móviles 3G, PocketPC, etc.) Disponible en diversas aplicaciones comerciales (TPVs, mensajería express, tiendas “Opencor”) Firma Manuscrita On-Line 3 Firma Manuscrita On-Line 4 Base de Datos MCYT (i) Métodos de Rec. de Firma Dinámica Basados en Parámetros: Parámetros: Representación: vector de características global. Similitud: Medida de distancia entre vectores (e.g., Mahalanobis, euclídea, …). Basados en Secuencias (Funciones): Funciones): Métodos Segmentales: Segmentales: Representación: secuencia de vectores (e.g., trazos, segmentos, ventanas espaciales, etc.), funciones temporales (x, y, p…). Similitud: comparación de vectores, atendiendo a la estructura temporal de la secuencia (e.g., HMM). Tableta Digitalizadora WACOM Intuos. Firmando con tinta sobre un papel apoyado en la tableta Æ corpus estático y dinámico. Al usuario se le propone una casilla para firmar. Protocolo de Adquisición: Adquisición: Métodos Locales: Representación: funciones temporales (e.g., x, y, p, …). Similitud: comparación elástica de secuencias temporales (e.g., DTW). Firma Manuscrita On-Line Procedimiento de Adquisición: Adquisición: 330 sujetos. De cada sujeto: 25 firmas genuinas (en cinco tramos) + 25 firmas falsificadas (de los cinco usuarios posteriores) J. Ortega-Garcia, et al., “MCYT Baseline Corpus: a Bimodal Biometric Database”, IEE Proc. Vision, Image and Signal Processing, Vol. 150, No. 6, pp. 391-401, 2003. Firma Manuscrita On-Line 5 6 MCYT: Protocolo Experimental Base de Datos MCYT (ii) Contenidos: Número de firmantes: firmantes: 330 Entrenamiento: Entrenamiento: 330 personas x 25 realizaciones genuinas = 8.250 muestras de usuario 330 personas x 25 realizaciones falsificadas = 8.250 muestras de falsificadores 8.250 muestras de usuario x 329 usuarios = 2.714.250 muestras de impostores “casuales” por cada usuario • Reconocimiento: Reconocimiento: • • • Genuinas Auténticas: Auténticas: 5 ó 20 firmas genuinas. Auténticas: Auténticas: Las 20 ó 5 firmas restantes. Imitaciones Casuales: Casuales: La primera firma de cualquier otro usuario, distinto del cliente en cada caso. Falsificaciones: Falsificaciones: Las 25 falsificaciones disponibles. Falsificaciones Firma Manuscrita On-Line 7 Firma Manuscrita On-Line 8 SVC-04: Protocolo Experimental Base de Datos SVC: Corpus de Desarrollo • • • • • 40 sujetos. 20 firmas auténticas (2 2 sesiones) sesiones + 20 falsificaciones (de 5 falsificadores distintos) Publicly available: • BIOSECURBIOSECUR-ID (1): 400 sujetos, sujetos 3 sesiones, sesiones 4 labs. participantes Modalidades: cara, voz, huella, iris, firma, firma escritura, mano, tecleo. Escenario: Basado en PC, PC oficina de trabajo BioSecure NoE (2): 1.000 sujetos, sujetos 2 sesiones, 11 labs. participantes Modalidades: cara + voz, huella, iris, firma, firma mano. Escenarios: Basado en PC, PC oficina de trabajo Internet, Internet modalidades voz y cara Dispositivo portátil 9 Entrenamiento: Entrenamiento: • Auténticas: Auténticas: 3, 5 ó 10 firmas genuinas de la primera sesión. Reconocimiento: Reconocimiento: • Auténticas: Auténticas: Las 10 firmas restantes de la segunda sesión. Imitaciones Casuales: Casuales: 20 firmas tomadas aleatoriamente de 20 usuarios distintos (entre sí y del usuario objetivo). Falsificaciones: Falsificaciones: Las 20 falsificaciones disponibles. D. Yeung, et al., “SVC2004: First International Signature Verification Competition”, Proc. of Intl. Conf. on Biometric Authentication, ICBA-04, pp.: 16–22, Springer LNCS3072, July 2004. Firma Manuscrita On-Line 10 Esquema basado en Parámetros Globales Perspectiva directa, directa muy utilizada en la literatura La etapa de extracción de características se basa en la extracción de parámetros que definen de forma general (‘global global’) a la firma Tras esta etapa de extracción se aplican técnicas de medida de distancia entre vectores de características Ventajas: Ventajas sencillez y rapidez de cómputo Desventajas: Desventajas poca flexibilidad ante variabilidad intra-usuario W. Nelson, and E. Kishon, “Use of Dynamic Features for Signature Verification”, Proc. IEEE Intl. Conf. on Systems, Man, and Cybernetics, Vol. 1, pp.: 201-205, 1991. W. Nelson, W. Turin, and T. Hastie, “Statistical Methods for On-Line Signature Verification”, Intl. Journal of Pattern Rec. and Artif. Intell., Vol. 8, No. 3, pp.: 749-770, 1994. (1) TIC2003-08382-C05, “Seguridad Multimodal basada en Autenticación Biométrica mediante Fusión de Expertos Unimodales”. (2) • Otras Bases de Datos Número de firmantes: firmantes: 40 • http://www.cs.ust.hk/svc2004/ Firma Manuscrita On-Line Protocolo de adquisición: adquisición: • Tableta WACOM Intuos con puntero sin tinta (i.e., sin realimentación visual). Firmas genuinas ‘inventadas’ inventadas’ (diferentes a las usadas en la vida real). Firmas Occidentales y Orientales. Orientales Los falsificadores conocen la dinámica de la firma a falsificar. Genuinas Datos complejos: complejos: Falsificaciones L. L. Lee, T. Berger, and E. Aviczer, “Reliable On-Line Human Signature Verification Systems”, IEEE Trans. on PAMI, Vol. 18, No. 6, pp.: 643-647, 1996. BioSecure NoE, “Biometrics for Secure Authentication”, FP6-IST-507634 Firma Manuscrita On-Line 11 Firma Manuscrita On-Line 12 Capacidad Discriminativa Individual de cada Parámetro Global (i) Esquema Global basado en Parámetros Revisión exhaustiva y extracción de 100 parámetros globales Combinación de parámetros nuevos, adaptados y existentes (respecto a referencias citadas). 1) Para cada parámetro global, global Fk , calculamos la distancia de Mahalanobis escalar entre su valor medio en los datos de entrenamiento del cliente i y la distribución que dicho parámetro presenta para todas las firmas de todo el resto de usuarios. 2) Esta medida , di,Fk , es un indicador de la distancia entre cada usuario i y el resto de usuarios, usuarios en base a Fk . 3) Generalizando, calculamos todas las distancias cruzadas entre usuarios, usuarios lo que nos permite estimar la separabilidad entre usuarios como: Ordenados según su capacidad discriminativa individual Selección de los n más discriminantes De los 40 primeros, primeros 12 son propuestas nuevas y 18 más son adaptados X S(Fk ) = ∑∑ di,Fk − d j,Fk Y Matching basado en modelado estadístico (mediante ventanas de Parzen gaussianas) gaussianas j P i Al Az Así estimamos la capacidad discriminativa individual de este parámetro Fk . 0 100 200 300 J. Fierrez-Aguilar, L. Nanni, J. Lopez-Peñalba, J. Ortega-Garcia, and D. Maltoni, “An On-Line Signature Verification System Based on Fusion of Local and Global Information”, Proc. 5th IAPR Intl. Conf. on Audio- and Video-based Biometric Person Authentication, AVBPA-05, pp. 523-532, July 2005, LNCS-3546. Firma Manuscrita On-Line Firma Manuscrita On-Line 13 Capacidad Discriminativa Individual de cada Parámetro Global (ii) Firmas auténticas (todas) Falsificaciones (todas) Firmas auténticas (mostradas) Falsificación (mostrada) 2 Firmas auténticas (todas) Falsificaciones (todas) Firmas auténticas (mostradas) Falsificación (mostrada) 0.5 0.4 1.5 Parámetro Global 4 Parámetro Global 2 Modelado basado en Parámetros Globales mediante Ventanas de Parzen Procedimiento de estimación de distribuciones de probabilidad basado en el concepto clásico de histograma. histograma En el caso unidimensional, los histogramas están divididos en varios sectores de anchura h , que son las regiones en las que puede ocurrir la muestra x. En el caso multidimensional, el espacio l-dimensional queda dividido en sectores en forma de hipercubos de lado h y volumen hl. La estimación de Parzen aplica una serie de ventanas o funciones base (una por cada Gaussianas) y centradas en dicha muestra. muestra xi ), suavizadas (Gaussianas De esta forma, a partir de los datos de entrada se obtiene un modelo de mezcla de Gaussianas para cada usuario j, En reconocimiento, reconocimiento calculamos una puntuación basada en medida de similitud logarítmica. 0.6 2.5 1 0.5 0 14 0.3 0.2 0.1 0 -0.1 -0.2 -0.5 -0.3 -1 -0.6 -0.4 -0.2 0 0.2 Parámetro Global 1 0.4 0.6 0.8 -0.4 -0.6 -0.4 Firma Manuscrita On-Line -0.2 0 0.2 0.4 Parámetro Global 3 0.6 0.8 15 Firma Manuscrita On-Line 16 Selección Paramétrica: Resultados 5 firmas de entrenamiento Dep.-usuario Indep.-usuario Dep.-usuario 11 11 10 10 5 Realizaciones TR 6.89 5.61 2.02 1.27 9 9 20 Realizaciones TR 5.14 3.92 1.53 0.87 8 8 EER (%) 7 6 5 5 4 4 3 3 2 2 1 10 1 10 20 30 40 50 60 70 80 90 100 4.5 4.5 4 4 3.5 3.5 EER (%) 5 3 2.5 2 20 30 40 50 60 70 80 90 100 3 2.5 2 1 1.5 0.2 1 0.1 0.5 0.5 30 40 50 60 70 80 90 0 10 100 0.1 0.2 0.5 1 20 30 40 50 60 70 80 90 100 5 10 20 40 Firma Manuscrita On-Line 17 xn: componente horizontal de la trayectoria yn: componente vertical de la trayectoria pn: presión ejercida 18 Normalización y Modelado 2 funciones adicionales: Azimuth (0°-359°) γn: azimuth en el plano de firma Elevación (0°-90°) Фn: elevación sobre el plano de firma Normalización geométrica • Se normaliza en posición según el centro de masas • Se normaliza en rotación según el ángulo tangente a la trayectoria promedio Normalización estadística • Las funciones descriptoras se normalizan en media y varianza • Cada firma es representada finalmente por un conjunto de 14 funciones descriptoras normalizadas 0° x • El conjunto de 14 funciones descriptoras por firma es modelado mediante un HMM y Modelado Estadístico • Topología de izquierda-a-derecha p 270° 4 funciones extendidas: extendidas: • HMMs continuos, continuos salida de cada estado modelada mediante mezcla de fdps gaussianas multivariadas • Fase de Entrenamiento: Entrenamiento algoritmo de BaumBaum-Welch, Welch permitiendo varias realizaciones por modelo • Fase de Reconocimiento: Reconocimiento cálculo de verosimilitud mediante algoritmo de Viterbi γ Ángulo de la tangente a la trayectoria: θn = tan−1 ( y n x n ) Módulo de la velocidad: v n = x n2 + y n2 ρn = log90° 180° (1 kn ) = log ( v n θn ) Radio de curvatura logarítmico: 2 2 Módulo de la aceleración: an = tn + cn = v n2 + v n2θn2 Ф • • • • 2 Tasa de Falsa Aceptación (%) 3 funciones básicas (obtenidas a 100 Hz): • • 5 1 Funciones Descriptoras Dinámicas 10 0.5 2 Firma Manuscrita On-Line 20 1.5 20 Falsificaciones, 5 realiz. TR Falsificaciones, 20 realiz. TR Casuales, 5 realiz. TR Casuales, 20 realiz. TR 40 Tasa de Falso Rechazo (%) EER (%) EER (%) Indep.-usuario 5 • • • Casuales (40 Parám. + V. de Parzen), MCYT 0 10 Falsificaciones 12 6 Casuales Global, EER (%) 20 firmas de entrenamiento 12 7 Falsificadas Sistema de Parámetros Globales: Resultados 1ª derivada temporal: 0 100 200 300 2 2 fn ≈ Δfn = ∑τ =1τ ⋅ ( fn +τ − fn −τ ) 2 ⋅ ∑τ =1τ 2 Firma Manuscrita On-Line 19 Firma Manuscrita On-Line 20 Resultados Comparativos Iniciales 5 firmas de entrenamiento 11 MCYT Indep.-usuario Dep.-usuario Indep.-usuario Dep.-usuario 10 10 9 9 5 realiz. realiz. de TR 9.39 2.51 4.86 0.59 8 8 20 realiz. realiz. de TR 3.48 0.88 0.42 0.08 6 7 6 5 5 4 4 3 3 2 2 20 30 40 50 60 70 80 90 100 Global (Parzen) Segmental (HMM) 1 10 4.5 4 4 3.5 3.5 3 2.5 2 1.5 30 40 50 60 70 80 90 100 3 2.5 2 1 1 0.5 20 30 40 50 60 70 80 90 100 0 10 20 10 5 2 1 0.5 1.5 0.5 0 10 20 5 4.5 Falsificaciones, 20 realiz. TR Falsificaciones, 5 realiz. TR Casuales, 20 realiz. TR Casuales, 5 realiz. TR 40 Tasa de Falso Rechazo (%) 7 EER (%) EER (%) Casuales Segmental (HMM), EER (%) 11 5 Casuales Falsificaciones 12 1 10 20 firmas de entrenamiento 12 EER (%) EER (%) Falsificadas Rendimiento del Sistema basado en HMMs 0.2 0.1 20 30 40 50 60 70 80 90 0.10.2 0.5 1 100 Firma Manuscrita On-Line 2 5 10 20 40 Tasa de Falsa Aceptación (%) Firma Manuscrita On-Line 21 Evaluación del Esquema Segmental: SVC-04 22 Esquema Local Basado en DTW Se emplean 3 funciones base (obtenidas a 100 Hz): Δx n , Δy n , pn , cuyas muestras constituyen los vectores de características 1er puesto en SVCSVC-04 para imitaciones casuales Se aplica normalización geométrica en posición, tamaño y rotación Se calcula la función de alineamiento entre vectores del patrón de Referencia referencia, i, y del test, j, como: 2º puesto en SVCSVC-04 para falsificaciones ⎧D(i − 1, j − 1) + d E (i, j) ⎪D(i − 1, j) + c ⋅ d (i, j) ⎪ E D(i, j) = min ⎨ D ( i, j − 1 ) + c ⋅ d E (i, j) ⎪ ⎪⎩d E (i, j) < umbral → 0 Donde: Entrada • D permite determinar el alineamiento óptimo entre el punto i de la firma de referencia (patrón), y el punto j en la firma de entrada (test) Correspondencias halladas por el algoritmo DTW Correspondencias halladas por • El cálculo se realiza mediante procedimientos de programación dinámica Sistema ATVSATVS-UAM • Se emplea una constante c >1, multiplicada por la distancia euclídea entre el valor del patrón y el del test, en lugar de emplear valores fijos • No se penaliza si la distancia euclídea toma un valor pequeño Firma Manuscrita On-Line 23 Firma Manuscrita On-Line 24 Esquema Local basado en DTW: Resultados Esquema Local basado en DTW: Algunos Ejemplos Firmas orientales (SVC-04), con la referencia (en en azul), en azul la firma de entrada (en negro), en verde). negro y las correspondencias a través de DTW (en verde Las distancias D<3 son aceptadas como correctas; correctas por encima de este valor, son rechazadas como falsas. falsas Local (DTW), EER (%) Falsificaciones Casuales SVCSVC-04 Indep.-usuario Dep.-usuario Indep.-usuario Dep.-usuario 3 Realizaciones REF 17.02 12.98 1.83 0.96 5 Realizaciones REF 14.26 10.20 0.57 0.24 10 Realizaciones REF 11.57 6.76 0.24 0.24 J. Fierrez-Aguilar, S. Krawczyk, J. Ortega-Garcia, and A. K. Jain, “Fusion of Local and Regional Approaches for On-Line Signature Verification”, Proc. of IWBRS, pp.: 188-196, Springer LNCS3781, 2005. Firma auténtica aceptada correctamente (D=1.68) Falsificación rechazada correctamente (D=3.15) Firma casual rechazada correctamente (D=10.54) Firma Manuscrita On-Line 25 Líneas de futuro Firma Manuscrita On-Line 26 Retos Análisis exhaustivo del poder discriminante (frente a falsificaciones e imitaciones casuales) de combinaciones de parámetros globales Gran diferencia en el comportamiento de usuarios Æ adaptación de las técnicas utilizadas a usuarios concretos Variabilidad temporal a largo plazo Æ modelado con múltiples firmas de entrenamiento, técnicas de adaptació adaptación temporal de patrones, patrones umbrales, etc. Estudio de la estructura y complejidad de las firmas, firmas y su relación con la variabilidad y rendimiento dependiente de usuario Gran diversidad de información discriminante a diferentes niveles Æ técnicas de fusió fusión de información multinivel Desarrollo de criptosistemas biométricos basados en firma dinámica, p.ej., generación de claves criptográficas Estudio de posibles ataques a sistemas de verificación de firma dinámica, como ataques de fuerza bruta o tipo ‘hill‘hill-climbing’, climbing’ y contramedidas Mejor entendimiento de la estructura y capacidad discriminante de la firma dinámica (nombre, rúbrica, trazos, caracteres, …) Aplicación de las técnicas desarrolladas a diferentes escenarios de firma dinámica, como Tablet PC, PC o PDA (NoE Biosecure) Diversidad en la problemática de impostores falsificadores y casuales: casuales evaluación del rendimiento frente a ambos, pero… Æ ajuste del sistema dependiendo del escenario de aplicació aplicación Nuevas BBDD multimulti-sensor (tableta, Tablet PC, PDA, …), multimulti-sesión a largo plazo (años), con diferentes grados de imitación (esfuerzos en NoE Biosecure) Interoperabilidad entre dispositivos; firma en papel / firma con puntero en pantalla; extensiones a firma está estática Estudio de interoperabilidad de sensores y seguimiento de los esfuerzos de estandarización Firma Manuscrita On-Line Extensión a reconocimiento de escritor: escritor dependiente / independiente de alfabeto / idioma; grafística forense 27 Firma Manuscrita On-Line 28