Subido por Angello Santisteban Chiroque

Bacci et al 2021b.en.es

Anuncio
Traducido del inglés al español - www.onlinedoctranslator.com
Revista Internacional de Medicina Legal
https://doi.org/10.1007/s00414-021-02512-3
ARTÍCULO ORIGINAL
Validación de comparación facial forense mediante análisis morfológico
en muestras fotográficas y CCTV
Nicolás Bacci1
&Tobías
MR Houlton1
&Nanette
&mariana
espinos1
steyn1
Recibido: 10 noviembre 2020 / Aceptado: 14 enero 2021
#
Los autores, bajo licencia exclusiva de Springer-Verlag GmbH, DE parte de Springer Nature 2021
Resumen
Entre la disponibilidad cada vez mayor de pruebas de vigilancia y la comparación facial forense basada en expertos que se consideran
admisibles en los tribunales, confirmar su validez es primordial. La comparación facial se realiza más comúnmente mediante el análisis
morfológico (MA), un enfoque basado en características en gran parte no probado. Este estudio tuvo como objetivo validar la práctica
recomendada actual de MA en muestras de vigilancia tanto estandarizadas como subóptimas. Se compilaron grupos de rostros de 175
hombres sudafricanos con una serie de fotografías faciales, utilizando imágenes de la base de datos Wits Face. Los primeros 75 grupos de
rostros consistieron en fotografías de objetivos de alta calidad de tipo salvaje (no estandarizadas), mientras que los 100 grupos de rostros
restantes consistieron en imágenes de objetivos de televisión de circuito cerrado (CCTV) subóptimas. Las imágenes objetivo se compararon
con fotografías estandarizadas de alta calidad. Los grupos de rostros se analizaron utilizando las pautas y la lista de características del
Grupo de trabajo científico de identificación facial. Se utilizaron matrices de confusión para determinar el desempeño de MA en cada
cohorte. MA se encontró altamente preciso (precisión corregida al azar (CCA): 99,1%) y confiable (κ = 0,921) en la muestra fotográfica y
menos preciso (CCA: 82,6%) y confiable (κ = 0,743), en la muestra de CCTV. Se observaron tasas más altas de falsos positivos y falsos
negativos para la muestra de CCTV, y la mayoría de los errores resultaron en resultados falsos negativos. La disminución del rendimiento en
la muestra de CCTV se atribuyó a varios factores, como la calidad de la imagen, el ángulo de grabación y la iluminación. Otros estudios que
probaron la comparación facial identificaron precisiones y confiabilidad más bajas en varias condiciones.
Palabras claveComparación facial forense. Mapeo de rostros. Identificación facial. Análisis morfológico . circuito cerrado de televisión FISWG
Introducción
Tribunales sudafricanos donde los FFC han contribuido a condenas
exitosas. Esto destaca la importancia del uso de imágenes y grabaciones
La identificación facial forense hace uso de pruebas fotográficas o de video del
de alta calidad en el proceso de análisis, especialmente porque la
rostro de un objetivo para confirmar su identidad y/o su posible asociación
capacitación y la experiencia pueden no ayudar particularmente a
con un evento delictivo. Históricamente, la comparación facial forense (FFC,
identificar correctamente rostros desconocidos en grabaciones de
por sus siglas en inglés) ha sido empleada por expertos presentados en
circuito cerrado de televisión (CCTV) de "muy mala calidad" ( [2], pags.
defensa de los sospechosos para impugnar la evidencia basada en imágenes,
25).
con el fin de excluir a un sospechoso en función de rasgos faciales
Debido al aumento de las pruebas fotográficas y de vídeo
inconsistentes [1]. En los últimos 20 años, el testimonio pericial ha sido
disponibles, el FFC, o mapeo de rostros, es ahora una práctica común en
considerado admisible para la condena, siempre que las imágenes sean de
muchos sistemas judiciales [3]. Si bien los esfuerzos hacia los sistemas
buena calidad [1]. Varios casos también han servido en
de reconocimiento facial automatizados y semiautomáticos están
aumentando tanto en el sector privado como en el gubernamental (por
ejemplo, [4]), los métodos y sistemas resultantes parecen ser efectivos
*
Nicolás Bacci
nicholas.bacci@wits.ac.za ; nicholasbacci@gmail.com
solo en entornos altamente estandarizados (p. ej. [5]). Este requisito de
configuración estandarizada resulta principalmente de la dependencia
de estos sistemas en la información antropométrica facial para
1
Unidad de Investigación de Identificación y Variación Humana, Facultad
comparar caras con precisión [6,7]. A pesar de los recientes intentos de
de Ciencias Anatómicas, Universidad de Witwatersrand, 7 York Road,
estandarización [8], la fotoantropometría, la aplicación de la
Parktown, Johannesburgo 2193, Sudáfrica
antropometría facial a la comparación de imágenes, ha sido
Int J Legal Med
demostrado ser incapaz de discernir a los individuos objetivo tanto
Fotografías e imágenes seleccionadas de imágenes de CCTV dentro de grupos
para la identificación como para la exclusión [9,10]. Esto se complica
de rostros.
aún más por el requisito de la aplicación de fotogrametría para
extraer dimensiones en muchas imágenes con el fin de efectuar
una comparación, algo que no es posible si las imágenes no están
Materiales y métodos
altamente estandarizadas [11] o de calidad suficiente [9]. Como
resultado, el método recomendado para realizar comparaciones
Este proyecto forma parte de un estudio más amplio. Todas las imágenes fueron extraídas de la base de datos
faciales individuales para procesos penales o judiciales es el análisis
Wits Face [30]. La muestra incluyó fotografías faciales e imágenes extraídas de grabaciones de CCTV de un total
morfológico.9,12].
de 175 participantes individuales conocidos que dieron su consentimiento. Todos los participantes eran adultos
El análisis morfológico se usa regularmente en el contexto judicial en
jóvenes sudafricanos de ascendencia africana. Estas fotografías fueron capturadas a una altura de 1600 mm,
todo el mundo a pesar de que universalmente se considera de
resultando un ángulo de incidencia efectivo de 0° en relación al rostro del participante. Las fotografías
naturaleza altamente subjetiva [11] y las pruebas limitadas de su
estandarizadas (ST) se capturaron con una cámara DSLR Canon 1300D de 18 MP (lente Canon de 18–55 mm DC) a
exactitud o eficacia [12,13]. De hecho, ningún otro estudio experimental
una distancia del objetivo a la cara de 1500 mm con un fondo de tela de terciopelo negro y tela para ocultar la
ha probado la precisión de la comparación facial mediante análisis
ropa de los participantes. Las fotografías de "tipo salvaje" no estandarizadas (WT), destinadas a simular
morfológico.11]. El análisis morfológico se basa en la opinión de un
fotografías subóptimas pero con una cámara de calidad similar, se capturaron con una Sony SLT A57 (18–250
experto en análisis facial sobre el grado de similitud facial entre rostros
mm Sony Zoom Lens) a una distancia de 5000 mm. Estas fotografías fueron capturadas en cinco vistas o poses
desconocidos [14]. En circunstancias que involucran rostros familiares,
faciales: vista anterior, 45° derecho, lateral derecho, 45° izquierdo y lateral izquierdo. La resolución de imagen
incluso sin el uso de análisis morfológico, los testigos presenciales y
para las fotografías ST y las fotografías WT fue de 3456 × 4320 píxeles a 300 ppp y 3264 × 4080 píxeles a 350 ppp,
otras personas no capacitadas previamente familiarizadas se consideran
respectivamente. Las grabaciones de CCTV se extrajeron de una cámara de Protocolo de Internet (IP) (HikVision,
adecuadamente capaces de identificar a las personas incluso en
modelo: DS-2CD2142FWD-I, 4 megapíxeles) previamente instalada para vigilancia en la Universidad de
imágenes de baja calidad y filmaciones de CCTV.15,dieciséis]. Sin
Witwatersrand. La distancia entre el objetivo y la cara de la cámara CCTV fue de aproximadamente 3030 mm, y el
embargo, el público ha sido evaluado como generalmente pobre en la
ángulo de incidencia fue de aproximadamente 27°, calculado en base a la altura media de la población del
identificación de caras desconocidas [dieciséis–18] y la evidencia de
estudio (hombres sudafricanos) de 1708 mm [ La resolución de imagen para las fotografías ST y las fotografías
testigos oculares ha sido cuestionada cuando se trata de rostros
WT fue de 3456 × 4320 píxeles a 300 ppp y 3264 × 4080 píxeles a 350 ppp, respectivamente. Las grabaciones de
desconocidos [19,20]. Se han realizado pruebas del rendimiento de
CCTV se extrajeron de una cámara de Protocolo de Internet (IP) (HikVision, modelo: DS-2CD2142FWD-I, 4
conceptos amplios de FFC, pero se centraron principalmente en la
megapíxeles) previamente instalada para vigilancia en la Universidad de Witwatersrand. La distancia entre el
influencia de la experiencia de los analistas para lograr los mejores
objetivo y la cara de la cámara CCTV fue de aproximadamente 3030 mm, y el ángulo de incidencia fue de
resultados [2,21] o para probar las interacciones psicológicas implicadas
aproximadamente 27°, calculado en base a la altura media de la población del estudio (hombres sudafricanos)
en la identificación facial (p. ej. [18,22,23]). Para que los expertos en FFC
de 1708 mm [ La resolución de imagen para las fotografías ST y las fotografías WT fue de 3456 × 4320 píxeles a
realicen correctamente el proceso de análisis morfológico, se
300 ppp y 3264 × 4080 píxeles a 350 ppp, respectivamente. Las grabaciones de CCTV se extrajeron de una
recomienda realizar una comparación sistemática para comparar una
cámara de Protocolo de Internet (IP) (HikVision, modelo: DS-2CD2142FWD-I, 4 megapíxeles) previamente
lista específica de características en cada análisis [12]. Esta comparación
instalada para vigilancia en la Universidad de Witwatersrand. La distancia del objetivo a la cara de la cámara
característica por característica del rostro entre una imagen de destino y
CCTV fue de aproximadamente 3030 mm, y el ángulo de incidencia fue de aproximadamente 27°, calculado en
una muestra de referencia se puede realizar siguiendo cualquiera de las
base a la altura media de la población del estudio (hombres sudafricanos) de 1708 mm [31]. Las imágenes fijas se
múltiples listas de características disponibles [12,24,25]. Si bien estudios
obtuvieron de las grabaciones de CCTV de los individuos coincidentes en las mismas cinco vistas capturadas en la
recientes han demostrado que tanto las instrucciones de características
muestra fotográfica. Estas imágenes y fotografías se combinaron en ensayos de grupos de rostros basados en
como las comparaciones característica por característica benefician la
individuos visualmente similares en términos generales para probar la eficacia de la lista de características
precisión de las comparaciones faciales [26,27], las listas de
faciales del FISWG para la identificación individual.
características específicas no se han probado exhaustivamente. Aunque
se han realizado algunas pruebas limitadas de la eficacia de la
comparación facial utilizando listas de características faciales [24,28], el
Este estudio incluyó un total de 175 pruebas de grupo de caras, cada una
más extenso, aunque en gran parte no probado [13], la lista de
compuesta por una fotografía facial de un solo objetivo agrupada con nueve
componentes y descriptores faciales fue publicada por el Grupo de
imágenes de lámina y una imagen que coincidía correctamente (pruebas de
trabajo científico de identificación facial (FISWG) [29]. Como tal, se
prueba) o 10 imágenes de lámina (pruebas sin coincidencia). Las imágenes de
requiere una prueba detallada de análisis morfológico basado en la
aluminio se asignaron a conjuntos de rostros en función del parecido facial
comparación característica por característica para confirmar la precisión
relativo y la edad aparente. Esto fue realizado por un asistente de
y validar el uso de este enfoque en la identificación facial forense.
investigación, para asegurar el cegamiento del analista principal. Estos
Por lo tanto, el objetivo de este estudio fue utilizar la lista FISWG
prescrita de características morfológicas, para evaluar su capacidad para
conjuntos de rostros se agruparon por el tipo objetivo de imágenes faciales y
se organizaron en vistas o poses faciales correspondientes. Los primeros 75
identificar con precisión a individuos desconocidos tanto en fotografías
grupos de caras incluían una fotografía de objetivo de alta resolución de "tipo
no estandarizadas como en imágenes de CCTV. Para ello, se compararon
salvaje" (WT), cada una comparada con 10 imágenes faciales de una base de
fotografías estandarizadas de una gran base de datos de individuos
datos compuesta por fotografías óptimas estandarizadas (ST) con ropa
sudafricanos con fotografías no estandarizadas.
oscurecida. Las 100 piscinas restantes estaban compuestas por un
Int J Legal Med
fotograma capturado de grabaciones CCTV estándar e imágenes faciales
Directrices FISWG [12]. La revisión holística se realizó como una breve
10 ST. A lo largo de todas las comparaciones faciales, cada imagen
revisión de toda la cara, con un límite de tiempo autoimpuesto y
objetivo se comparó con una sola fotografía de las 10 fotografías del
controlado de 5 s para evitar una revisión detallada de los rasgos
grupo de rostros agrupados a la vez. Las imágenes extraídas de CCTV se
faciales. Luego se tomó una decisión sobre si los individuos podían ser
recortaron con la misma relación de aspecto (4:5) que las imágenes
compatibles o no, o si la comparación no era posible. Las comparaciones
fotográficas con el rostro centrado de la misma manera, lo que dio como
holísticas se calificaron como una posible coincidencia prospectiva (1),
resultado que las imágenes tuvieran una resolución aproximada de 368
no una coincidencia (2) o ningún análisis posible (3). Solo las
× 460 píxeles a los 96 ppp nativos de CCTV. cámara. De esta forma, el
coincidencias prospectivas se compararon más mediante el análisis
rostro representó aproximadamente 1/9 de la imagen completa,
morfológico. El análisis morfológico (MA) se realiza de manera similar al
resultando en un rostro compuesto por aproximadamente 41 × 52
uso de un enfoque de análisis, comparación, evaluación y verificación
píxeles. Se permitió un número limitado de 15 usos repetidos como
(ACE-V) [12]. ACE-V es la metodología más común empleada en los
máximo por fotografía ST mientras se compilaban grupos de rostros
exámenes de huellas dactilares y consiste en un proceso sistemático por
para evitar la familiarización del analista principal.
etapas que se ha comparado con el método científico [32]. Cuando un
analista forense aplica una metodología ACE-V, primero analizará la
Cada grupo de caras incluía una distribución relativamente
anatomía y el detalle de los datos disponibles, seguido de una
uniforme de vistas, o poses faciales, del objetivo y las caras
comparación entre los conjuntos de datos disponibles y, por último,
correspondientes (Tabla1). Se incluyeron diferentes poses faciales
evaluará la información obtenida de la comparación para llegar a una
en el estudio para permitir una revisión variada de la cara completa
conclusión.32]. La fase de verificación luego incluye la confirmación por
de los individuos comparados. La distribución uniforme de las
parte de un analista adicional que vuelve a probar la conclusión original [
poses faciales a lo largo de la composición de los grupos de rostros
32]. La fase de verificación no se llevó a cabo en todos los análisis del
permitió que todas las partes de la lista de características se usaran
presente estudio debido a limitaciones de tiempo. La comparación de
y exploraran a lo largo de este análisis. Incluir una sola vista,
MA se realizó utilizando la lista de descriptores y características de
aunque fortalece el poder del análisis, limitaría las características
componentes faciales del FISWG [29] resumido en la Tabla3.
faciales revisadas y no sería representativa de la cara completa. A
su vez, esto permitió una comparación de la eficacia de la lista de
El análisis morfológico se llevó a cabo colocando ambas imágenes
funciones en las diversas poses.
una al lado de la otra en Microsoft PowerPoint (365, v. 16) y se ajustó
para que se asemejaran en la rotación y el tamaño de una a otra,
Es importante asegurarse de que las observaciones sean fiables y
repetibles. Entre estos grupos de caras, se incluyeron ensayos repetidos
manteniendo la relación de aspecto original. Luego se compararon y
para permitir el cálculo del error intraobservador. Estos rastros
contrastaron las características morfológicas de la cara en busca de
repetidos se distribuyeron dentro de la muestra de análisis de modo que
similitudes o diferencias (Fig.1). Estos se destacaron en orden numérico
la primera aparición original del mismo grupo de rostros y el orden de
según la lista de componentes faciales del FISWG y se utilizaron para
las fotografías dentro del grupo de rostros fueran lo suficientemente
tomar una decisión final para cada posible coincidencia. Las decisiones
distantes como para descartar la familiarización. El desglose de la
finales para cada comparación facial se tomaron utilizando una versión
muestra para cada cohorte de análisis se detalla en la Tabla2.
adaptada del sistema de niveles de acuerdo utilizado por el Servicio de
Policía de Sudáfrica [14].
Para evaluar el acuerdo entre observadores, un experto en comparación
Las clasificaciones y definiciones de los niveles de acuerdo
facial realizó una serie de comparaciones faciales en un subconjunto de cinco
conjuntos de rostros de cada cohorte (un total de 10 conjuntos de rostros,
adaptados y declaraciones resumidas empleadas por los Servicios
incluidas 100 comparaciones faciales individuales en total). Luego, esto debía
de Policía de Sudáfrica (adaptado de Steyn et al. [14]) se describen a
contrastarse con el primer conjunto de análisis realizado por el investigador
continuación:
principal para el cálculo de la concordancia entre observadores.
1.Conclusión: positiva. Teniendo en cuenta la correspondencia de las
La comparación facial se realizó utilizando las pautas del FISWG
sobre comparación facial. Para replicar un escenario realista, el analista
características generales de clase y la presencia de características
primero examinó brevemente cada una de las coincidencias potenciales
únicas de identificación individual que se encontraron durante el
de un grupo de rostros utilizando una revisión holística de acuerdo con
análisis entre la persona en las Imágenes objetivo y
tabla 1Distribución de poses faciales en toda la muestra de grupo de rostros
Cohorte de análisis
Vista anterior Vista 45° izquierda Vista lateral izquierda Vista 45° derecha Vista lateral derecha Pruebas de análisis totales
Fotografía WT a fotografías ST
14
18
Norma CCTV a fotografías ST
14
17
S T,estándar;peso,tipo salvaje;circuito cerrado de televisión,circuito cerrado de televisión
13
17
13
20
13
22
67
94
Int J Legal Med
Tabla 2Ensayos de grupos de personas por análisis: desglose de submuestras de cohortes
Cohorte de análisis
Fotografía WT a fotografías ST
CCTV a fotografías ST
Ensayos de prueba
Ensayos sin coincidencia
Repita los ensayos
Ensayos de análisis
Ensayos totales
59
86
8
8
8
6
67
94
75
100
Los ensayos de prueba fueron ensayos normales únicos que incluyeron un objetivo y nueve floretes y una coincidencia correcta; Los ensayos sin coincidencias incluyeron un objetivo y diez imágenes de lámina. S T,estándar;peso,tipo
salvaje;circuito cerrado de televisión,circuito cerrado de televisión
en las Fotografías de Control, se encuentra que la persona en las
visible entre la persona en las imágenes objetivo y en las fotografías
imágenes objetivo y en las imágenes de control probablemente
de control. Sin embargo, debido a la mala calidad, los niveles de luz,
representan a la misma persona.
el ángulo y la distancia de las cámaras objetivo, el metraje objetivo
es demasiado pobre para marcar suficientes puntos de referencia
2.Conclusión: no concluyente (pero con cierta correspondencia en
morfológicos faciales específicos. Por lo tanto, no se pudo realizar
algunas características morfológicas visibles). No es posible obtener
una comparación facial detallada entre las imágenes objetivo y las
resultados concluyentes con respecto a la identificación/
imágenes de control. Por lo tanto, no es posible obtener resultados
individualización porque, durante la evaluación, se descubrió que la
concluyentes con respecto a la identificación porque se encontró
calidad de las imágenes objetivo era demasiado mala para
que las imágenes de destino eran demasiado pobres.
distinguir suficientes características identificables y únicas. Sin
embargo, algunas similitudes morfológicas fueron visibles entre la
4.Conclusión: negativa. Teniendo en cuenta la falta de correspondencia
persona en las imágenes objetivo y en las fotografías de control.
de las características generales de clase y las características únicas
Debido a pruebas insuficientes, la persona en las imágenes objetivo
de identificación individual que se encontraron durante el análisis
y las fotografías de la base de datos no pudieron identificarse como
entre la persona en las imágenes objetivo y en las fotografías de
la misma persona, pero tampoco pudieron eliminarse por no ser la
control, se encontró que la persona en las imágenes objetivo y en
misma persona.
las imágenes de control no es la misma persona.
3.Conclusión: no concluyente (pero con alguna correspondencia en
apariencia holística). De acuerdo con una comparación
holística, existen características generales correspondientes
Tabla 3Lista resumida de componentes
faciales para comparación facial por
análisis morfológico [29]
Número
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
dieciséis
17
18
5.Conclusión: ningún análisis es posible. Las imágenes del metraje
de destino eran de mala calidad. Debido a la baja calidad
componente facial
Piel (textura, color, tono, etc.) Contorno de la cara/
cabeza (contorno) Composición de la cara/cabeza
(proporciones) Línea del cabello/patrón de calvicie
(forma detallada) Frente (tamaño y contorno
relativos)
Cejas (ángulo, forma, tamaño relativo y detalles del cabello)
Ojos (color, posición, ángulo, tamaño relativo, etc.) Mejillas
(prominencia y hoyuelos)
Nariz (forma, posición, simetría, tamaño relativo, etc.) Orejas
(forma, posición, protuberancia y tamaño relativo) Boca
(angulación, forma, simetría, tamaño relativo, etc.)
Mentón/mandíbula (forma, tamaño relativo, simetría, prominencia y definición) Cuello
(tamaño relativo, prominencia, pliegues, venas, etc.)
Vello facial (presencia, distribución, longitud, estilo, detalles del cabello, etc.)
Líneas faciales (pliegues, arrugas, etc.)
Cicatrices (ubicación, forma, orientación, tamaño relativo, tonalidad, profundidad, etc.)
Marcas faciales (lunares, manchas de decoloración, pecas, etc.) Alteraciones (tatuajes,
piercings, etc.)
Int J Legal Med
Figura 1Ejemplo de análisis de
comparación facial. Se colocó una imagen
objetivo de CCTV o fotografía de tipo
salvaje (WT) junto a cada posible
coincidencia en función de la posible
coincidencia positiva durante el análisis
holístico. La fotografía estandarizada (ST)
de la derecha se comparó con la imagen
objetivo extraída de CCTV de la izquierda
usando el
Lista de componentes faciales FISWG [
29]. Los componentes faciales similares
(azul) y diferentes (rojo) se destacaron
por número de componente facial
de las imágenes y un ángulo de cámara o distancia de cámara
o la mayor proporción de las clases observadas [36], de dondepags
deficientes, no se pudieron identificar suficientes puntos de
El valor se calcula para confirmar si la precisión es mayor que el NIR
referencia morfológicos faciales y, por lo tanto, no se pudo realizar
como indicador de un buen modelo predictivo [35]. También se
una comparación facial.
calcula una prueba de McNemar como parte de la función para
determinar si las coincidencias puntuadas tienen una proporción de
Para facilitar el análisis estadístico, estas posibles conclusiones se
errores similar o diferente en la cohorte de prueba [37], donde un
ajustaron para el cálculo de la tasa de aciertos como coincidencia correcta
valor de p por debajo de α = 0,05 indica una diferencia en la
(puntuaciones 1, 2), no coincidencia (puntuaciones 3, 4) o análisis no
proporción de errores. Esta comparación indica efectivamente si el
concluyente (puntuación 5). Estas conclusiones, que incluyeron los ensayos
método de análisis falla relativamente por igual en falsos positivos y
excluidos como "no coincidentes" en la fase de revisión holística del análisis,
falsos negativos.
se compararon luego con el verdadero emparejamiento de las imágenes para
La serie de fórmulas utilizadas para calcular la calidad del poder predictivo
calcular la tasa de aciertos del investigador principal. Los resultados de cada
para el análisis morfológico dentro de cada cohorte de submuestra se extrajo
comparación se clasificaron como tales, en función del emparejamiento
del paquete Caret R [35,36], se definen a continuación y se presentan en su
verdadero, ya sea como un verdadero positivo (TP), un falso positivo (FP), un
totalidad comoInformación suplementaria(SI). La sensibilidad, o tasa de
falso negativo (FN), un verdadero negativo (TN) o un análisis no concluyente ( I
verdaderos positivos o recuerdo, se define como la medida de la eficacia con
A).
la que una prueba puede realizar coincidencias correctas (SI: Eq.1). La
Todos los análisis estadísticos se realizaron con el programa de
especificidad, o tasa de verdaderos negativos, es una medida de cuán efectiva
estadísticas R Studio (versión 3.6.3) [33]. La precisión de la identificación
una prueba puede descartar correctamente una coincidencia (SI: Eq.2). La
facial para cada tipo de grupo de ensayos se obtuvo mediante el cálculo
prevalencia es el número total de coincidencias verdaderamente correctas en
de la tasa de aciertos y la mitigación de la probabilidad mediante la
toda la muestra de la cohorte (SI: Eq.3). El valor predictivo positivo (VPP) indica
realización de un kappa de Cohen ponderado. La precisión real objetivo
la probabilidad de un
para que el método se considere exitoso fue un valor kappa de 0,80 o
superior [34]. Los acuerdos intra e interobservador se calcularon
utilizando el kappa de Cohen ponderado con respecto a las decisiones
de emparejamiento.
A partir de la tasa de aciertos de las comparaciones, se calculó una
Tabla 4Referencia de tabla de contingencia para matriz de confusión de
coincidencias positivas y negativas (adaptado de Kuhn [35])
matriz de confusión completa que incluye múltiples medidas de poder
predictivo a partir de una tabla de contingencia (Tabla4). La función de
matriz de confusión en R calcula a partir de la tabla de contingencia una
precisión general bruta al dividir las puntuaciones correctas totales por
Coincidencia de cara verdadera
Exclusión de cara verdadera
Emparejado por el analista
Verdadero positivo (TP)
Falso positivo (FP)
Excluido por el analista
Falso negativo (FN)
Verdadero negativo (TN)
la muestra total, junto con un intervalo de confianza del 95 %. Esta
Las fórmulas empleadas en cada subconjunto de análisis para comparar la calidad predictiva
precisión general se compara luego con una tasa sin información (NIR),
de los análisis se basan en esta tabla de contingencia
Int J Legal Med
prueba calificada como una coincidencia siendo verdaderamente una
coincidencia correcta (SI: Eq.4) y el valor predictivo negativo (VAN) es la
probabilidad de que un ensayo calificado como una exclusión sea
realmente una exclusión correcta (SI: Eq.5). La tasa de detección es la
proporción de la muestra de la cohorte que coincide correctamente (SI:
Eq.6), y la prevalencia de detección es la proporción de puntajes
emparejados por el analista a lo largo de la cohorte de análisis (SI: Eq.7).
Idealmente, en esta muestra, la tasa de detección sería lo más cercana
posible al 9 o 10 % debido a cómo se organizó la muestra. Un cálculo de
precisión ajustada que considera la distribución desequilibrada de la
muestra es la precisión equilibrada calculada utilizando la ecuación.8 (SI)
haciendo uso de la sensibilidad y la especificidad. La relación entre las
En las Figs.2y3tanto para la fotografía a fotografía (Fig.2)
y comparaciones de CCTV a fotografía, respectivamente
(Fig.3). Ninguna comparación facial de la cohorte de ensayo
de fotografía a fotografía se clasificó como no concluyente,
y ningún ensayo se excluyó del análisis adicional de esta
cohorte (Fig.2). No se pudo completar un total de 26
coincidencias potenciales y se clasificaron como análisis no
concluyentes en la cohorte de análisis de CCTV y se
excluyeron del análisis (Fig.3). Esto se debió a una
combinación de mala calidad y mala iluminación en algunas
de las grabaciones de CCTV.
Las matrices de confusión confirmaron un mejor rendimiento
coincidencias correctamente asignadas y el total de coincidencias
general de MA dentro de la muestra de fotografía a fotografía. Este
positivas realizadas por el analista se denomina precisión y se calcula
mejor desempeño se destaca en las tablas de contingencia para cada
utilizando la ecuación.9(SI). Por último, elFLa puntuación es una media
cohorte de análisis (Tablas6y7). La precisión general sin procesar entre
ponderada (armónica) de precisión y sensibilidad calculada utilizando la
las cohortes de análisis fue notablemente mayor para el MA de
ecuación.10(SI) y considera las designaciones de falsos positivos y falsos
fotografía a fotografía (0,997, IC = 0,989–0,999) sobre CCTV, aunque los
negativos. Esto se calcula ajustando el peso de la precisión y la
MA de la cohorte de CCTV también fueron bastante precisos (0,942, IC =
sensibilidad en la ecuación; en este estudio, se dio la misma ponderación
0,925–0,956) (Tabla8). La precisión bruta tiene un uso limitado en el
a ambos. Como tal en la Ec.10, a β se le asigna un valor de 1 y la
análisis del rendimiento de MA, ya que no tiene en cuenta la
puntuación se denominaF1puntaje.
composición de la muestra y el azar, ya que es un cálculo directo de la
Las tasas de falsos positivos y falsos negativos para todas las
tasa de aciertos. Todos los grupos de análisis tuvieron una mayor
cohortes de análisis también se calcularon por separado para
precisión que el NIR (Tabla8), lo que es indicativo de un buen modelo
resaltar el tipo de errores asociados con cada cohorte. Todos
predictivo de análisis morfológico en general.
los análisis descritos anteriormente se realizaron en dos
umbrales diferentes para comparar el rendimiento del análisis
Las precisiones corregidas al azar (CCA) de MA indicaron una
disminución en la fuerza predictiva de las comparaciones de
morfológico dentro de una iteración indulgente y estricta. La
fotografía a fotografía (κ = 0.982;pag <0,001) con las comparaciones
iteración indulgente se describió anteriormente, incluidas las
de CCTV (κ = 0,710;pag <0,001) (Tabla8). La precisión de la cohorte
comparaciones calificadas como 1 y 2 como coincidencias y 3 y
de CCTV se mantuvo por debajo de la puntuación considerada "casi
4 como no coincidentes; sin embargo, la iteración estricta
perfecta" de 0,80 [34]. Dentro de la cohorte de fotografía a
incluye estrictamente puntajes de 1 como coincidencias
fotografía no hubo una proporción estadísticamente significativa de
positivas mientras consolida puntajes de 2 a 4 y los trata como
errores (Tabla8), lo que es indicativo de los resultados falsos
no coincidentes. . Esto tenía la intención de permitir que solo se
positivos y falsos negativos marcadamente bajos (Tablas6y7). Una
considerara el nivel más alto de coincidencias basadas en la
mayor tasa de falsos positivos (Tabla9) se evidencia por la mayor
confianza, para intentar reducir los resultados falsos positivos.
prevalencia de detección frente a la tasa de detección de la cohorte
Se utilizaron pruebas de chi-cuadrado para comparar la
de análisis de CCTV, lo que resulta en una precisión marcadamente
ocurrencia de coincidencias positivas verdaderas,
menor (Tabla9). UnF1También se observa una puntuación inferior a
0,8 como resultado de la mayor tasa de falsos positivos en el
análisis de CCTV (Tabla9).
Se llevó a cabo una segunda iteración estricta de análisis estadísticos
ajustando el umbral de coincidencias correctas para incluir solo
Resultados
conclusiones positivas (puntuación de 1). Esta interpretación más
estricta pretendía reducir el riesgo de resultados falsos positivos. En esta
La comparación del acuerdo intraobservador e interobservador en
iteración, las precisiones corregidas al azar fueron mayores para
grupos de rostros analizados por MA indicó un nivel de acuerdo
fotografía a fotografía (κ = 0,991;pag < 0,001) y CCTV (κ = 0,826;pag <
bueno a alto. La concordancia intraobservador fue mayor para MA
0.001) cohortes que la anterior iteración indulgente del análisis. El
(κ = 0,934;pag <0,001) en las comparaciones de fotografía a
aumento en la precisión resulta de la iteración estricta que asigna
fotografía sobre la comparación de CCTV a fotografía (κ = 0,807;
correctamente algunas de las coincidencias positivas falsas presentes en
pags < 0,001) (Tabla5). La concordancia entre observadores en los
la iteración indulgente a coincidencias negativas verdaderas. Las
ensayos de fotografía a fotografía fue casi perfecta (κ = 0,921;p =
matrices de confusión también demostraron una marcada disminución
0,001) (Tabla5), pero los ensayos de CCTV a fotografía mostraron
de falsos positivos (Tablas10y11) y un ligero aumento de falsos
una ligera disminución en la concordancia pero aún con un nivel
negativos en la cohorte de CCTV (Tabla11). La precisión bruta de la
sustancial de concordancia (κ = 0,743;pag <0,001) (Tabla5).
predicción también pareció
Int J Legal Med
Tabla 5Resumen de acuerdos entre
Acuerdo intra-observador
pagsvalor
Acuerdo entre observadores
pagsvalor
De fotografía a fotografía
0.934
< 0.001
0.921
= 0.001
CCTV a fotografía
0.807
< 0.001
0.743
< 0.001
observadores e intraobservador en todas
las cohortes de análisis
incremento basado en la matriz de confusión (Tabla12). La falta de
dio como resultado que la prueba de McNemar no indicara una
resultados falsos positivos y los resultados falsos generales
proporción estadísticamente significativa de errores (Tabla12). El cambio
extremadamente bajos en la cohorte de fotografía a fotografía (Tabla10)
en falsos positivos y negativos se evidenció por la disminución de
Figura 2Gráficos de barras de los resultados de la comparación facial bajo un indulgente (a)y estricto (B)iteración dentro de la cohorte de fotografía a fotografía por ensayo. TP,
verdadero positivo; FP, falso positivo; NT, verdadero negativo; FN, falso negativo; IA, análisis no concluyente
Int J Legal Med
Fig. 3Gráficos de barras de los resultados de la comparación facial bajo un indulgente (a)y estricto (B)iteración dentro de la cohorte de CCTV a fotografía por prueba. TP,
verdadero positivo; FP, falso positivo; NT, verdadero negativo; FN, falso negativo; IA, análisis no concluyente
sensibilidad en la cohorte de CCTV y, en particular, el aumento de la
(Mesa13), lo que indica un mejor rendimiento general de la
especificidad en ambas cohortes en la iteración de análisis estricto (Tabla13).
interpretación de puntuación estricta y lo destaca como el enfoque
Esta disminución de la sensibilidad en la cohorte de CCTV da como resultado
ideal para aplicaciones forenses. Las tasas de falsos positivos (FPR) y
una precisión equilibrada ligeramente disminuida. Sin embargo, también
las tasas de falsos negativos (FNR) calculadas en las cohortes de
resultó en una precisión notablemente mayor yF1puntaje
análisis indican una FPR más alta y una FNR más alta en el CCTV
Int J Legal Med
Tabla 6Tabla de contingencia para
matriz de confusión de comparación
cara real
cara real
cara real
cara real
fotografía a fotografía iteración
partido
exclusión
partido
exclusión
Emparejado por el analista
PT = 61
FP = 1
Combinación perfecta ideal
PT = 62
FP = 0
Excluido por el analista
FN = 1
TN = 607
Exclusiones perfectas ideales
FN = 0
TN = 608
indulgente
tp,verdadero positivo;FP,falso positivo;TENNESSE,verdadero negativo;fn,falso negativo;I A,análisis no concluyente
cohorte sobre la única cohorte fotográfica (Tabla14), lo que
encontrados por expertos en el entorno forense. La eficacia de MA
demuestra el beneficio general del uso de imágenes de mayor
en esta muestra actual dio como resultado precisiones
calidad en la comparación facial. Al considerar la iteración estricta,
notablemente altas, que oscilaron entre el 71 y el 99 %, según el
aunque se observó una disminución notable en FPR en la muestra
tipo de muestra y la rigurosidad del análisis. Además, también se
de CCTV, también se identificó una duplicación paralela de FNR
identificó un nivel particularmente alto de concordancia
(Tabla14). En todos los ensayos, exactitud equilibrada, precisión yF1
intraobservador e interobservador entre las cohortes, que va desde
las puntuaciones fueron más altas en la muestra de fotografía a
sustancial (κ = 0,743) hasta casi perfecto (κ = 0,934). Se observó un
fotografía.
rendimiento notablemente mejor en la muestra fotográfica, tanto
Por último, las pruebas de chi-cuadrado que compararon el rendimiento
de MA en diferentes vistas no demostraron diferencias estadísticamente
en términos de precisión (precisión bruta (RA): 99,7 %; precisión
equilibrada (BA): 99,2 %, precisión corregida al azar (CCA): 96,8 %)
significativas en el rendimiento de ninguna vista facial en particular. Este
como intra y concordancia interobservador (κ = 0,934 y κ = 0,921,
resultado indicó que no se puede determinar una relación real con la
respectivamente). Se esperaba este resultado, teniendo en cuenta
obtención de un mayor número de coincidencias correctas en una vista facial
la calidad marcadamente superior y la mejor correspondencia de
específica. Esto sugiere que siempre que se vean suficientes características en
ángulo de visión de las fotografías estandarizadas y de tipo salvaje.
imágenes de CCTV subóptimas, cada vista puede proporcionar suficiente
La correspondencia y mayor calidad de las imágenes permitió a su
información para comparar caras con precisión.
vez una revisión profunda del componente facial y por ende, una
decisión más informada. Cuando MA no pudo identificar
coincidencias correctamente, resultó predominantemente en falsos
Discusión
negativos tanto en muestras fotográficas (1,61%) como de CCTV
(11,63%). Los resultados falsos positivos fueron, de hecho,
El uso común de las pruebas faciales fotográficas y de
notablemente más bajos que los falsos negativos en ambas
videovigilancia en el ordenamiento jurídico [38,39] ha llevado a una
muestras (fotografía: 0,16 % y CCTV: 5,19 %).
mayor necesidad de comparación facial forense (FFC). Por lo tanto,
Los falsos positivos y los falsos negativos se consideran sensibilidad y
probar la validez de FFC es crucial para la admisibilidad de esta
especificidad al comparar el rendimiento del método de prueba. En un
evidencia y procesos legales precisos. FFC empleado en una
entorno práctico, el límite predictivo de cualquier prueba se escala para
muestra de cara desconocida es un campo muy poco estudiado en
obtener la proporción óptimamente aceptable de sensibilidad y
la identificación craneofacial, y la mayoría de los estudios se centran
especificidad. Esto no fue del todo posible en este estudio, ya que los
en el beneficio de la experiencia en FFC (por ejemplo, [2,21]).
resultados de las comparaciones faciales se asignan en función de un
Confirmar que el trabajo de los expertos en comparación facial es
sistema de puntuación ordinal limitado de cuatro escalas que solo se
valioso y admisible es vital para la consideración de sus informes.
puede ajustar razonablemente en dos niveles. Sin embargo, al realizar
Sin embargo, es importante evitar que esta evidencia basada en la
una iteración indulgente y estricta del análisis de datos, fue posible
experiencia se integre en la corte sin confirmación sobre la
controlar, dentro de los límites, el rendimiento del análisis morfológico
precisión de este método [39]. Como tal, la validez del enfoque más
para identificar la iteración óptima que se utilizará en el entorno forense.
aceptado y utilizado para FFC, a saber. análisis morfológico,
En la iteración estricta, se evidenció una drástica reducción de falsos
necesita ser probado y confirmado.
positivos tanto para la muestra fotográfica (de 0,16 a 0%) como para las
El presente estudio es el primero en probar exhaustivamente la
precisión de MA en un escenario actual, simulando condiciones
Tabla 7Referencia de tabla de
cohortes de análisis de CCTV (de 5. 19 a 0,60%). Esta baja tasa de falsos
positivos es indicativa de la
contingencia para matriz de confusión
cara real
cara real
cara real
cara real
de CCTV a fotografía
partido
exclusión
partido
exclusión
Emparejado por el analista
PT = 76
FP = 43
Combinación perfecta ideal
PT = 86
FP = 0
Excluido por el analista
FN = 10
TN = 785
Exclusiones perfectas ideales
FN = 0
TN = 828
comparación indulgente iteración
tp,verdadero positivo;FP,falso positivo;TENNESSE,verdadero negativo;fn,falso negativo;I A,análisis no concluyente
Int J Legal Med
Tabla 8Resultados de la función de
Fotografía a fotografía
matriz de confusión y precisiones
corregidas al azar a lo largo de la
iteración indulgente del análisis
CCTV a fotografía
Precisión bruta general
0.997
Intervalo de confianza del 95 % Tasa
0.989–1.000
0,925–0,956
de ausencia de información (NIR)
0.908
0.906
Valor de p (Acc>NIR)
Valor p de la prueba de McNemar
Exactitud corregida al azar (CCA) Valor p
(para CCA)
< 0.001
1
0.942
< 0.001
< 0.001
98,2%
71,0%
< 0.001
< 0.001
importancia de una escala de niveles de concordancia con criterios
precisiones corregidas al azar (99.1 y 82.6%) en ambas cohortes de
distintos como el empleado en el presente estudio [14], lo que
muestra. La precisión equilibrada disminuyó ligeramente en la
puede permitir asignar conclusiones finales de una manera más
muestra de CCTV (88,1 %) como resultado de la disminución de la
estricta que la sugerida anteriormente por el Bromby [40] escala de
sensibilidad (0,767) de la iteración estricta como resultado de la
apoyo. La desventaja de este enfoque más estricto es que casi se
mayor tasa de falsos negativos. Incluso los valores predictivos
duplica la tasa de falsos negativos encontrada en las imágenes
positivos fueron más altos para la iteración estricta en ambas
subóptimas de la muestra de CCTV (de 11,63 a 23,26 %). Esta tasa
cohortes (1,000 y 0,930) con valores predictivos negativos
más alta de resultados falsos negativos identificados podría
relativamente constantes (0,998 y 0,977). Lo más importante, la
atribuirse parcialmente al efecto del carácter distintivo. Las caras
precisión más alta (1.00 y 0.930) yF1También se lograron
que se componen de características más distintas o únicas son
puntuaciones (0,992 y 0,841) en la iteración estricta, lo que indica el
intrínsecamente más fáciles de igualar [41,42] o descartar, mientras
mejor rendimiento general de un modelo estricto. Debido a su
que es más probable que se reconozcan las caras que son más
menor precisión corregida al azar, y menor precisión yFpuntajes, el
típicas con tipos de características más "habituales" [41], lo que
modelo indulgente solo debe aplicarse en un contexto forense
daría lugar a que se les asignen como posibles coincidencias.
cuando se dispone de otra evidencia de respaldo. La fiscalía no
Mientras que el ajuste de escala utilizado en el estudio actual dio
debe considerar que la similitud en ciertos rasgos morfológicos
como resultado más falsos rechazos que otros estudios (10,5 % y 8
(puntuación de 2), por sí sola, promueva una gran probabilidad de
%) [2,21], debe considerarse en el contexto médico-legal donde las
que un acusado sea el objetivo en cuestión, ya que esas
consecuencias e implicaciones de aceptar una metodología con una
puntuaciones a veces pueden ser falsos positivos.
mayor tasa de falsos positivos pueden ser nefastas. Las condenas
Independientemente de la iteración, la cohorte de CCTV resultó en
injustas de personas inocentes pueden resultar de métodos
una proporción desigual de errores, con una tendencia a falsos positivos
basados en una alta tasa de falsos positivos, y generalmente se
en la iteración indulgente y falsos negativos en la iteración estricta. En la
acepta que se debe priorizar una tasa más baja de falsos positivos
muestra fotográfica no se encontraron falsos positivos con el análisis
en metodologías forenses aceptables y admisibles [43].
estricto y la tasa de falsos negativos persistió en los bajos niveles
Más allá de la marcada reducción en las tasas de falsos positivos a
expensas de tasas más altas de falsos negativos, la iteración estricta
originales (1,61%). En un entorno forense, este es un resultado
preferible, ya que es importante errar en el
también produjo precisiones brutas más altas (99.9 y 97.3%) y
Tabla 9Tabulación de todos los
Fotografía a fotografía
CCTV a fotografía
Sensibilidad (recordar)
0.984
0.884
especificidad
0.998
0.948
Predominio
0.093
0.094
Valor predictivo positivo (PPV) Valor
0.984
0.639
predictivo negativo (NPV) Tasa de
0.998
0.987
detección (DR)
0.091
0.083
Prevalencia de detección (DP)
0.093
0.130
Precisión equilibrada
0.991
0.916
Precisión
0.984
0.639
F1puntaje
0.984
0.742
valores de calidad predictiva
calculados a través de la iteración
indulgente de los análisis
Int J Legal Med
Tabla 10Referencia de la tabla de contingencia para la matriz de confusión de la iteración estricta de las comparaciones de fotografía a fotografía analizadas (izquierda), en comparación con
las coincidencias perfectas ideales y las exclusiones para la comparación directa del rendimiento de las comparaciones faciales (derecha)
coincidencia de cara real
Exclusión de cara real
Emparejado por el analista
PT = 61
FP = 0
Excluido por el analista
FN = 1
TN = 608
coincidencia de cara real
Exclusión de cara real
Combinación perfecta ideal
PT = 70
FP = 0
Exclusiones perfectas ideales
FN = 0
TN = 608
tp,verdadero positivo;FP,falso positivo;TENNESSE,verdadero negativo;fn,falso negativo;I A,análisis no concluyente
lado del acusado para que personas potencialmente inocentes no estén
vinculadas a un delito.
La coincidencia incorrecta podría deberse a una multitud de factores,
incluida la calidad de la imagen, las condiciones fotográficas/de
En resumen, en todas las métricas utilizadas para determinar la
grabación, la iluminación y la posición de las cámaras. Las imágenes
eficacia de MA, quedó claro que MA se desempeñó mejor en el entorno
fotográficas utilizadas en el estudio actual, con su resolución mucho más
óptimo y estandarizado de las comparaciones de fotografía a fotografía.
alta (3456 × 4320 píxeles, 300 y 350 ppp), se consideraron como tales
Esto se demuestra por la extremadamente alta precisión, sensibilidad,
conducentes a análisis más precisos que la calidad drásticamente
especificidad, valores predictivos positivos y negativos identificados (que
inferior (358 × 460 píxeles, 96 ppp) CCTV imágenes. En particular, la
oscilan entre 0,984 y 0,998). Estos resultados son indicativos de que, a
calidad del metraje utilizado en este estudio se consideró de alta
pesar de su naturaleza subjetiva, en condiciones ideales, MA es capaz de
resolución (>2 megapíxeles) y con una densidad de píxeles muy por
identificar coincidencias correctas y rechazar coincidencias falsas con
encima del estándar reconocido de aproximadamente 25 ppp requerido
una probabilidad muy alta de ser correcta. Sin embargo, cuando se
para un análisis facial adecuado [45]. Lee y colegas [2] encontraron
toman en consideración imágenes subóptimas, que es a menudo lo que
precisiones del 67 % y 67,3 % para evaluadores capacitados y no
se les presenta a los analistas forenses de imágenes [44], el desempeño
capacitados, respectivamente, al utilizar imágenes de mala calidad para
de MA disminuyó. En particular, en la cohorte subóptima de CCTV, se
las comparaciones faciales. Esta tasa de aciertos de nivel inferior entre
encontró que MA era menos efectivo en el emparejamiento correcto (RA:
los expertos y el público enfatiza aún más la necesidad de imágenes de
94,2 %; BA: 91,4 % CCA: 73,6 %) y menos confiable (intraobservador κ =
alta calidad, a pesar de la capacitación. Otras investigaciones sobre
0,807 e interobservador κ = 0,743 acuerdo), mientras que es casi
faciales basadas en CCTV de mayor calidad en comparación informaron
idénticamente capaz de descartar coincidencias incorrectas. El PPV más
un 46 % y un 83 % de identificaciones correctas por parte del público y
bajo observado destacó la disminución de la probabilidad de que una
los expertos, respectivamente [21]. La precisión reportada por Wilkinson
coincidencia sea correcta. Dado que la disminución del valor predictivo
y Evans [21] para expertos está en un rango similar a las precisiones
negativo en la muestra de CCTV es menor en comparación, el efecto
reportadas para la muestra de CCTV en el presente estudio,
sobre el VPP podría haber sido magnificado por el diseño del estudio y la
dependiendo del cálculo de precisión realizado. Además, Wilkinson y
organización de la muestra analizada. La muestra se dispuso de modo
Evans [21] identificaron que los expertos en análisis facial tenían una
que la mayoría de las comparaciones fueran verdaderos negativos,
mayor tasa de falsa aceptación (17 %) que de falso rechazo (8 %). Lee et
como lo demuestra la prevalencia del 9,4%, que representa el porcentaje
al. [2] descubrió que la falsa aceptación en imágenes de CCTV de mala
de la muestra que se puede atribuir correctamente como verdadero
calidad era dos veces (22,4 %) más probable que un falso rechazo (10,5
positivo. Como resultado, un cambio en cómo se asignan los casos
%). Comparativamente, el presente estudio identificó tasas de falsa
positivos (verdaderos o falsos) sería más evidente. Curiosamente, el
aceptación (falsos positivos) drásticamente más bajas del 0,15 % para la
aumento en la prevalencia de detección (0,130), junto con la disminución
muestra fotográfica y del 5,22 % para la cohorte de CCTV, y tasas
en la tasa de detección (0,083), puede ser indicativo de una mayor
variables de falso rechazo (falsos negativos) del 1,43 % para la muestra
probabilidad de asignar coincidencias falsas, mientras que en general se
fotográfica, y 11,96%, para las cohortes de CCTV. Estos resultados
asignan más coincidencias, cuando las condiciones de la imagen son
demuestran la importancia de la buena calidad de las imágenes, lo que
subóptimas.
también ha sido reiterado previamente por otros investigadores, cuando
se solicitó el testimonio de expertos.
Tabla 11Referencia de la tabla de contingencia para la matriz de confusión de la iteración estricta de las comparaciones de CCTV a fotografía analizadas (izquierda), en comparación con las
coincidencias perfectas ideales y las exclusiones para la comparación directa del rendimiento de las comparaciones faciales (derecha)
coincidencia de cara real
Exclusión de cara real
Emparejado por el analista
PT = 66
FP = 5
Excluido por el analista
FN = 20
TN = 823
coincidencia de cara real
Exclusión de cara real
Combinación perfecta ideal
PT = 86
FP = 0
Exclusiones perfectas ideales
FN = 0
TN = 828
tp,verdadero positivo;FP,falso positivo;TENNESSE,verdadero negativo;fn,falso negativo;I A,análisis no concluyente
Int J Legal Med
Tabla 12Resultados de la función de
Fotografía a fotografía
CCTV a fotografía
Precisión bruta general
0.999
0.973
Intervalo de confianza del 95 % Tasa
0.992–1.000
0,960–0,982
de ausencia de información (NIR)
0.908
0.906
Valor de p (Acc>NIR)
< 0.001
< 0.001
Valor p de la prueba de McNemar
1
0.005
Exactitud corregida al azar (CCA) Valor p
99,1%
82,6%
(para CCA)
< 0.001
< 0.001
matriz de confusión en la iteración
estricta de cada cohorte de análisis
se considerará admisible para la condena, siempre que las imágenes sean de
La muestra de CCTV iluminó a los participantes de manera desigual (Fig.
buena calidad [1].
1). La iluminación desigual comúnmente da como resultado grandes
Más allá de la calidad de las imágenes analizadas, la posición de la cámara
cambios de contraste en los sujetos grabados [47]. Este cambio de
de CCTV también puede haber influido en la capacidad del analista para
contraste puede provocar una sobreexposición de los sujetos
comparar con precisión los rasgos faciales, ya que se modifican la parte del
directamente bajo la fuente de luz y la cámara no puede atenuar la gran
rostro que es visible y el ángulo del rostro. Se capturaron fotografías
variación de contraste, lo que provoca la pérdida de detalles [47]. En la
estandarizadas en un ángulo perpendicular, mientras que el circuito cerrado
muestra de CCTV del presente estudio, estos efectos de iluminación
de televisión grababa a los participantes desde una mayor altura y con un
fueron claramente perceptibles (Fig.1) y afectó la capacidad del analista
ángulo de incidencia en torno a los 27°, como ocurre en situaciones de la vida
para comparar detalles de manera efectiva.
real. El ángulo máximo de incidencia recomendado para la captura de detalles
A pesar de estas diferencias en las condiciones de adquisición de
faciales en CCTV es de 15° [46]. Este ángulo se recomienda especialmente
imágenes, el análisis morfológico funcionó bien, lo que sugiere que
porque algunas personas tienden a tener una inclinación natural de la cabeza
la variación de las condiciones, dentro de lo razonable, no socava
inferior de 15 a 20° al caminar [46]. En el estudio actual, sin embargo, los
las comparaciones faciales.11]. Además, independientemente de las
participantes se quedaron quietos mirando hacia adelante en las cinco vistas
dificultades creadas por las condiciones de adquisición de imágenes
capturadas, lo que mitigó la inclinación natural de la cabeza. A pesar de esto,
que no coinciden, las posturas faciales o las vistas no parecieron
el ángulo de 27° redujo la visibilidad y pudo haber alterado las proporciones
afectar el rendimiento del análisis morfológico tanto en fotografías
de los rasgos faciales (Fig.1) lo suficiente como para contribuir a la mayor
como en CCTV, ya que no se identificaron diferencias en la muestra
dificultad en la comparación facial. En la mayoría de las imágenes de CCTV se
proporcionada, ya que todos los rostros estaban dispuestos en
observó una visibilidad limitada o inexistente de los ojos, independientemente
poses coincidentes (es decir, imagen estandarizada lateral izquierda
de la vista de la cara, como se identifica generalmente en situaciones con un
frente a imagen extraída de CCTV lateral izquierda). Esto parece
ángulo de incidencia superior a 15° [46].
sugerir que, a pesar de la gran cantidad de variación en los rasgos
faciales expuestos y visibles, se observaron y compararon
Además del ángulo y la calidad general de la imagen sin procesar como
suficientes rasgos entre imágenes de poses coincidentes. También
deficiencias de CCTV en la comparación facial, la iluminación a menudo puede
se observó cualitativamente durante el análisis que las
ser subóptima para visualizar claramente todas las características faciales. La
comparaciones faciales se basaban más en ciertas características,
iluminación estandarizada en la muestra fotográfica permitió claras
dependiendo de la vista utilizada. Por ejemplo,
comparaciones, mientras que la luz natural del sol en la
Tabla 13Tabulación de los
valores de calidad predictiva
calculados a través de la
Fotografía a fotografía
CCTV a fotografía
iteración estricta de cada
Sensibilidad (recordar)
0.984
0.767
cohorte de análisis
especificidad
1.000
0.994
Predominio
0.093
0.094
Valor predictivo positivo (PPV) Valor
1.000
0.930
predictivo negativo (NPV) Tasa de
0.998
0.977
detección (DR)
0.091
0.072
Prevalencia de detección (DP)
0.091
0.078
Precisión equilibrada
0.992
0.881
Precisión
1.000
0.930
F1puntaje
0.992
0.841
Int J Legal Med
Tabla 14Tasas de falsos positivos (FPR) y
Fotografía a fotografía
tasas de falsos negativos (FNR) calculadas
a través de las iteraciones tanto
indulgentes como estrictas de las
Iteración indulgente de FPR
cohortes de análisis
iteración estricta FPR
0,16%
0%
CCTV a fotografía
5,19%
0,60%
Iteración indulgente de FNR
1,61%
11,63%
iteración estricta FNR
1,61%
23,26%
características comparables, mientras que la boca, la nariz y los ojos (cuando
El riesgo de condenas erróneas es una preocupación importante en el sistema
eran visibles) fueron los preferidos durante las comparaciones de vista
legal.
anterior. El efecto de la variación de la pose ha sido ampliamente investigado
A pesar de la importancia del enfoque sistemático aconsejado por
en el reconocimiento facial basado en computadora como uno de los mayores
FISWG y otros [12,24,51], solo un puñado de estudios que investigaron la
desafíos a superar, con algunas perspectivas prometedoras para futuras
comparación facial desarrollaron, probaron o revisaron listas de
investigaciones.48]. Esto es evidente cuando incluso el famoso enfoque de
características específicas [24,28,52], con la lista de características más
caras propias para el modelado de reconocimiento facial requeriría una
detallada y reciente publicada [29] permaneciendo sin probar hasta el
inclusión más específica de diferentes puntos de vista [49], una capacidad
presente estudio. Un gran beneficio de la lista de características del
pensada intrínseca al reconocimiento facial basado en humanos [50]. A pesar
FISWG, además de su naturaleza extensa, es la inclusión de descriptores
de esta conciencia, ningún otro estudio de comparación facial ha informado
para guiar al analista forense en sus esfuerzos, un aspecto que falta en
sobre los efectos de varias poses en la identificación facial, específicamente en
otros atlas donde las definiciones o los descriptores tienden a ser
relación con un enfoque basado en características como el análisis
simplistas o asumidos [24,28,52,53]. Algunos de estos estudios
morfológico. Como tal, más pruebas en una muestra más grande con
informaron principalmente la prevalencia de estas morfologías de
consideración de puntos de vista coincidentes y no coincidentes podrían
características específicas identificadas dentro de su muestra y limitaron
ayudar a confirmar los resultados de este estudio.
su discusión a qué características pueden ser más útiles para la
discriminación en la comparación facial sin probarlas en ese ámbito
En general, se ha informado que la confiabilidad es
inconsistente para la comparación facial y las listas de
características faciales morfológicas en particular. Una lista
de características faciales dignas de mención fue
establecida por el FISWG, uno de los grupos de trabajo de la
organización de Comités Científicos de Ciencias Forenses,
que opera en conjunto con el Instituto Nacional de Ciencia y
Tecnología de los Estados Unidos. FISWG está compuesto
por expertos que tienen como objetivo guiar la práctica y
las técnicas en el campo. Usando la lista de características
FISWG, el presente estudio encontró una alta tasa de
concordancia en un método de análisis de características
puramente morfológico (intraobservador: 93,4% y 80,7%
para fotografías y CCTV, respectivamente; interobservador:
92,1% y 74,3% para fotografías y circuito cerrado de
televisión, respectivamente). En comparación,28]. Otros
indicaron márgenes de error mucho más altos a pesar de
las listas detalladas de características morfológicas (error
intraobservador: 19 % y error interobservador: 39 %) [24].
Teniendo en cuenta la alta confiabilidad y la disminución de falsos
específico (por ejemplo, [47,48]). Un estudio reciente encontró un mejor
rendimiento de las tareas de coincidencia de rostros al hacer uso de las
instrucciones de rasgos faciales [27]. Aunque los observadores no eran
analistas faciales expertos y las instrucciones de características no eran
tan extensas como la lista de características del FISWG, se observó un
mejor rendimiento al comparar rostros de un grupo de población similar
al del observador [27]. Megreya y Bindemann [27] también hizo hincapié
en la importancia de la selección de características específicas que
pueden aumentar la precisión sobre otras, citando las cejas como una
característica particularmente beneficiosa para observar, más que los
ojos y los oídos. Se informaron hallazgos similares en una investigación
sobre comparaciones directas característica por característica [26].
Según Towler y colegas [26], las comparaciones faciales usando
características produjeron mayores precisiones con analistas forenses
capacitados, hasta una discriminación de identidad casi perfecta cuando
se consideraron las puntuaciones agregadas de múltiples analistas.
El enfoque más estricto empleado en el presente estudio
pretendía alinearse con el principio legal de presunción de
inocencia que un gran número de territorios reconocidos por las
Naciones Unidas respetan en los procesos penales (Artículo 11,
positivos encontrados en el presente estudio, se puede presentar un
Declaración Universal de Derechos Humanos de las Naciones
argumento sólido para el uso de una lista de características faciales al realizar
Unidas y Artículo 14 (2) Pacto Internacional de Derechos Civiles). La
MA. Esta recomendación está de acuerdo con estudios recientes que resaltan
ley sudafricana también respeta constitucionalmente este principio
la importancia de que los observadores experimentados usen un enfoque
(sección 35(3)(h) de la Constitución de la República de Sudáfrica de
sistemático, basándose en una lista de características consistente en todos los
1996). Mantener la presunción de inocencia es una preocupación
análisis, para lograr un alto nivel de confiabilidad en la comparación facial [24,
creciente, ya que muchas industrias y gobiernos están
51]. Establecer un enfoque preciso y confiable para la comparación facial es
considerando el despliegue de sistemas de reconocimiento facial
primordial para disminuir la
semiautomáticos, con tasas deliberadamente altas de falsos
Int J Legal Med
positivos [54–56] y prejuicios raciales [57,58]. Para mitigar la gran
Conclusión
cantidad de errores de falsos positivos a los que son propensos estos
sistemas, será crucial confiar en un método basado en un observador
humano con una tasa baja de falsos positivos durante la selección de
partidos como método de contingencia. La prevención de conclusiones
falsas positivas es una cuestión de gran relevancia ética, ya que una
coincidencia falsa puede dar lugar a que personas inocentes sean
acosadas o condenadas [58]. Como tal, se recomienda la iteración
estricta cuando los datos de vigilancia son la única evidencia disponible,
para evitar condenas injustas. Sin embargo, en circunstancias en las que
se dispone de evidencia de respaldo adicional, la iteración indulgente
todavía se considera de gran valor para contribuir a construir un caso
sólido.
La falta de información sobre la validación del análisis morfológico
en la literatura es comprensible si se tiene en cuenta la complejidad de
diseñar un estudio verdaderamente representativo. Un desafío
importante encontrado en este y otros estudios similares se relaciona
con la accesibilidad y disponibilidad de imágenes faciales coincidentes
de calidad apropiada para permitir pruebas de comparación facial. Si
Este es el primer estudio que prueba la lista de
características del FISWG para FFC en una muestra grande,
dentro de un contexto actualizado, centrándose
específicamente en la precisión que se puede obtener al
usar esta lista de características. Se encontraron precisiones
excelentes a través de condiciones de prueba óptimas y
subóptimas, con un alto nivel de confiabilidad. Se
identificaron tasas bajas de falsos positivos, lo que sugiere
que el uso del análisis morfológico es preciso, confiable y
tiene un bajo riesgo de acusación falsa cuando lo aplican
analistas experimentados en condiciones óptimas. Se
identificó un aumento notable de falsos negativos cuando
solo se consideraban positivas las coincidencias con el nivel
más alto de confianza. Sin embargo, es probable que este
sea un sacrificio aceptable, ya que prevenir condenas
injustas por pecar de precavido se considera generalmente
una práctica más aceptable en el contexto judicial.
bien existen muchas bases de datos, la mayoría son inconsistentes en
sus procedimientos y calidad de captura de imágenes, al mismo tiempo
Con los resultados predominantemente buenos, superando a los
que tienen iteraciones limitadas o números de participantes incluidos
de la mayoría de los otros estudios que no utilizaron listas de
(por ejemplo, [59–61). El presente estudio se basó en la base de datos
características faciales [2,21], se puede hacer un fuerte argumento
Wits Face creada a propósito [30] con múltiples individuos conocidos
para justificar el uso de un análisis morfológico basado en listas de
coincidentes, que se presta bien para probar la comparación facial
características en el contexto judicial, con el fin de reducir la
debido a su estandarización. Además, el requisito de organizar una serie
subjetividad. Como tal, se recomienda confiar principalmente en el
de grupos de personas ciegas que incluyan múltiples participantes es
análisis morfológico, basado en una extensa lista de características,
una tarea laboriosa que requiere una participación externa
al emplear la comparación facial en el contexto médico legal. Esta
independiente. Es necesario crear grupos de rostros ciegos para evitar
recomendación se da con la condición de que no debe ser
sesgar a los analistas y para evitar que se familiaricen con los rostros
considerada como la única prueba. Es imperativo utilizar más
controlando la cantidad de veces que un analista está expuesto a ellos.
pruebas de apoyo que puedan asociarse con un análisis facial para
Es necesario controlar el exceso de familiarización, ya que los rostros
la condena. Esto es particularmente importante en circunstancias
familiares son intrínsecamente procesados de manera diferente por los
en las que los análisis se consideran no concluyentes, a pesar de
humanos [62–64] y no sería una prueba verdaderamente representativa
cierto nivel de similitud (morfológica u holística).
de la comparación facial forense. La familiarización generalmente no se
Para evitar condenas erróneas, se deben considerar
discute en los estudios que investigan la comparación facial, ya que
iteraciones estrictas del análisis como la práctica preferida,
generalmente no se consideran los límites de tiempo o la exposición
para mitigar el riesgo de falsos positivos. La iteración más
limitada a las muestras faciales (por ejemplo, [2,28,58]). Sin embargo, en
indulgente solo debe usarse cuando se dispone de otra
la mayoría de los estudios de esta naturaleza, varios analistas revisan las
evidencia de respaldo. Aunque se encontró una tasa más alta
mismas fotografías, lo que limita la preocupación por la familiarización
de falsos negativos usando el enfoque más estricto, se puede
(por ejemplo, [2,21]).
argumentar que este enfoque sigue siendo beneficioso cuando
se usa para la exclusión en imágenes de menor calidad para
El análisis morfológico también es un proceso que requiere
eliminar posiblemente a posibles sospechosos. Una aplicación
mucho tiempo, y el análisis promedio generalmente requiere más
modelo estricta también se alinea mejor con los estándares
de 2 h [sesenta y cinco], lo que hace más complejo el proceso de
forenses necesarios para la admisibilidad de la evidencia y los
control de la exposición. Esto es particularmente problemático
derechos humanos fundamentales.
cuando se considera que realizar comparaciones faciales durante
períodos prolongados de tiempo, al ser una tarea extensa y
repetitiva, puede dificultar gravemente la precisión de los analistas [
66]. Todos estos son factores que deben tenerse en cuenta no solo
al diseñar estudios que investiguen la precisión de la identificación
facial, sino también para garantizar un enfoque científico firme de
los estudios de identificación craneofacial.11].
Información suplementariaLa versión en línea contiene material
complementario disponible enhttps://doi.org/10.1007/s00414-021-02512-3.
AgradecimientosAgradecemos a todos los participantes que aceptaron ser
fotografiados y grabados para el desarrollo de la base de datos Wits Face a partir de
la cual se compusieron las muestras de grupos de rostros. Un agradecimiento
especial también a Joshua Davimes por sus contribuciones instrumentales en
Int J Legal Med
desarrollando la base de datos Wits Face. También estamos especialmente
agradecidos con Tamara Lottering por su ayuda en la composición de los
grupos de caras y con Gideon LeRoux por su ayuda en la captura y extracción
Disponibilidad de códigoNo aplicaInformación suplementariaLa versión
en línea contiene material complementario disponible enhttps://doi. org/
10.1007/s00414-021-02512-3.
de las grabaciones de CCTV de los sistemas de seguridad de la Universidad.
También se agradece a los voluntarios que ayudaron en el reclutamiento de
participantes: Jesse Fredericks, Kiveshen Pillay, Rethabile Masiu, Sameerah
Sallie, Daniel Munesamy, Laurette Joubert, Jordan Swiegers, Betty Mkabela,
Johannes P. Meyer, Amy Spies, Natasha Loubser, Nicole Virgili , Dan-Joel
Lukumbi, Tamara Lottering, Mathabatha Ntjie, Claudia Landsman, Raheema
Dalika, Merete Goosen, Stephanie Souris, Rabelani Negota, Mahlatse Mahasha
y Jessica Manavhela.
Contribución del autorConceptualización: Nicholas Bacci, Maryna Steyn y
Nanette Briers. Metodología: Nicholas Bacci, Maryna Steyn, Nanette
Briers y Tobias Houlton. Análisis e investigación formales: Nicholas Bacci
y Tobias Houlton. Redacción (preparación del borrador original):
Nicholas Bacci. Redacción (revisión y edición): Nicholas Bacci, Maryna
Steyn, Nanette Briers y Tobias Houlton. Adquisición de fondos: Nicholas
Bacci, Maryna Steyn y Nanette Briers. Recursos: Maryna Steyn y Nanette
Briers. Supervisión: Maryna Steyn y Nanette Briers.
FondosEl estudio actual se realizó con el apoyo de la Fundación Nacional
de Investigación de Sudáfrica (NRF) y la Beca JJJ Smieszeck de la Facultad
de Ciencias Anatómicas de la Universidad de Witwatersrand (DAAD-NRF
y los fondos de la Beca JJJ Smieszeck otorgados a N. Bacci (Grant No .:
11858) y fondos NRF otorgados a N. Briers como parte de la Mejora de
metodologías y prácticas en identificación craneofacial (Concesión No.:
CSUR160425163022; UID: 106031). Todas las opiniones, hallazgos y
conclusiones o recomendaciones expresadas en este estudio son
aquellas de los autores y, por lo tanto, la NRF y la Universidad de
Witwatersrand, Johannesburgo, no aceptan ninguna responsabilidad al
respecto.
Referencias
1. Davis JP, Valentine T, Wilkinson C (2012) Comparación de imágenes
faciales. En: Wilkinson C, Rynn C (eds) Identificación craneofacial, 1.ª ed.
Cambridge University Press, Nueva York, págs. 136–153
2. Lee WL, Wilkinson C, Memon A, Houston K (2009) Coincidencia de caras
desconocidas de metraje de circuito cerrado de televisión (CCTV) de mala
calidad: una evaluación del efecto del entrenamiento en la capacidad de
identificación facial. AXIS Online J Cent Anat Hum Identificador 1:19–28
3. Jain AK, Klare B, Park U (2012) Coincidencia y recuperación de rostros en
aplicaciones forenses. IEEE Multimed 19:20–27.https://doi.org/10.1109/
MMUL.2012.4
4. Phillips PJ (2011) Mejora de la tecnología de reconocimiento facial.
Computadora (Long Beach California) 44: 84–86.https://doi.org/
10.1109/MC.2011.87
5. Urbanová P (2016) Rendimiento de algoritmos de coincidencia basados en la
distancia en la identificación facial 3D. Egipto J Forensic Sci 6:135–151. https://
doi.org/10.1016/j.ejfs.2016.04.004
6. Davis JP, Valentine T, Davis RE (2010) Análisis fotoantropométricos
asistidos por computadora de imágenes faciales de rostro completo y
de perfil. Ciencia forense Int 200: 165–176.https://doi.org/10.1016/
j.forsciint. 2010.04.012
7. Heyer R, Semmler C (2013) Sesgo de confirmación forense: el caso de la
comparación de imágenes faciales. J Appl Res Mem Cogn 2:68–70.
https://doi.org/10.1016/j.jarmac.2013.01.008
Disponibilidad de datos y materialLos conjuntos de datos analizados durante el
estudio actual no están disponibles públicamente debido a la naturaleza sensible de
la base de datos Wits Face. La base de datos tiene el identificador.https://doi.org/
10.17605/OSF. IO/Q8V2R. Una muestra de la base de datos (que consiste en una de
8. Caple J, Stephan CN (2016) Una nomenclatura estandarizada para la
antropometría craneofacial y facial. Int J Legal Med 130: 863–879.
https://doi.org/10.1007/s00414-015-1292-1
9. Kleinberg KF, Vanezis P, Burton AM (2007) Fracaso de la antropometría
las imágenes y grabaciones faciales del autor) está disponible enhttps://
como técnica de identificación facial utilizando fotografías de alta
hdl.handle.net/10539/29924. Se aplican restricciones para acceder a la base de datos
calidad. J Forensic Sci 52:779–783.https://doi.org/10.1111/j.1556-
o parte de ella, que se utilizó bajo licencia para el estudio actual y, por lo tanto, no
está disponible públicamente. El acceso está limitado a solicitud formal y aprobación
condicional por parte del Comité de Colecciones de la Facultad de Ciencias
Anatómicas, estrictamente para investigación no comercial.
4029.2007.00458.x
10. Moreton R, Morley J (2011) Investigación sobre el uso de la
fotoantropometría en la comparación de imágenes faciales. Ciencia
forense Int 212: 231–237.https://doi.org/10.1016/j.forsciint.2011.06.023
11. Stephan CN, Caple JM, Guyomarc'h P, Claes P (2019) Una descripción
general de los últimos avances en imágenes faciales. Ciencia forense
Declaraciones
Aprobación ética y consentimiento para participarEl estudio fue aprobado
incondicionalmente por el Comité de Ética de Investigación Humana (Médico) de la
Universidad de Witwatersrand, Johannesburgo. Número de certificado de
autorización de ética: M171026. Todos los participantes incluidos en el estudio
firmaron un consentimiento informado otorgando a los autores el uso de sus datos.
Consentimiento para publicaciónNo se publica información ni fotografías de los
participantes como parte del estudio, según lo acordado en el consentimiento informado
antes mencionado firmado para la participación.
Conflicto de interesesLos autores declaran no tener conflicto de intereses.
Res 4:10–28.https://doi.org/10.1080/20961790.2018.1519892
12. Grupo de trabajo científico de identificación facial (2019) Resumen de
comparación facial y pautas metodológicas. Disponible en:https://
fiswg.org/
fiswg_facial_comparison_overview_and_methodology_guidelines_V1.0_20191025.p
13. Houlton TMR, SteynM (2018) Encontrar a Makhubu: una comparación facial
forense morfológica. Ciencia forense Int 285: 13–20.https://doi. org/
10.1016/J.FORSCIINT.2018.01.022
14. Steyn M, Pretorius M, Briers N et al (2018) Comparación facial
forense en Sudáfrica: estado de la ciencia. Ciencia forense Int 287:
190–194.https://doi.org/10.1016/J.FORSCIINT.2018.04.006
15. Burton AM, Wilson S, Cowan M, Bruce V (1999) Artículo de
investigación evidencia de vigilancia de seguridad. Psychol Sci
10:243–248. https://doi.org/10.1111/1467-9280.00144
16. Bruce V, Henderson Z, Newman C, Burton AM (2001) Coincidencia de identidades
de rostros familiares y desconocidos captados en imágenes de CCTV.
Int J Legal Med
J Exp Psychol Appl 7:207–218.https://doi.org/10.1037//1076898X.7.3.207
17. Burton AM, Wilson S, Cowan M, Bruce V (1999) Reconocimiento facial en
video de mala calidad: evidencia de vigilancia de seguridad. Psicología
Sci 10:243–248.https://doi.org/10.1111/1467-9280.00144
18. Henderson Z, Bruce V, Burton AM (2001) Coincidencia de rostros de
ladrones capturados en video. Appl Cog Psychol 15:445–464.https://
doi.org/10.1002/acp.718
19. Megreya AM, Burton AM (2008) Coincidencia de rostros con fotografías: desempeño
deficiente en la memoria de testigos presenciales (sin la memoria). j
Exp Psychol Appl 14:364–372.https://doi.org/10.1037/a0013464
20. Megreya AM, Memon A, Havard C (2012) El efecto del pañuelo en la cabeza:
evidencia directa del paradigma de identificación de testigos presenciales.
Appl Cog Psychol 26:308–315.https://doi.org/10.1002/acp.1826
21. Wilkinson C, Evans R (2009) ¿Los expertos en análisis de imágenes faciales son
mejores que el público en general para identificar personas a partir de
imágenes de CCTV? Justicia científica 49: 191–196.https://doi.org/10.1016/
37. Dietterich TG (1998) Pruebas estadísticas aproximadas para comparar algoritmos
de aprendizaje de clasificación supervisada. Computación neuronal 10: 1895–
1923.https://doi.org/10.1007/978-3-319-50926-6_6
38. Norris C, McCahill M, Wood D (2004) Editorial. El crecimiento de CCTV: una
perspectiva global sobre la difusión internacional de la videovigilancia
en espacios de acceso público. Vigilancia Soc 2:110–135. https://doi.org/
10.24908/ss.v2i2/3.3369
39. Edmond G (2013) ¿Solo verdad? Aplicar cuidadosamente la historia, la filosofía y
la sociología de la ciencia al uso forense de imágenes de CCTV.
Stud Hist Philos Sci Parte C Stud Hist Philos Biol Biomed Sci 44: 80–
91.https://doi.org/10.1016/j.shpsc.2012.09.004
40. Bromby M (2003) ¿A su valor nominal? New Law J Expert Witn Suppl
28:302–303
41. Dewhurst SA, Hay DC, Wickham LHV (2005) Distinción, tipicidad y
experiencia de recuerdo en el reconocimiento facial: un análisis de
componentes principales. Psychon Bull Rev 12: 1032–1037.https://
doi.org/10.3758/BF03206439
de Glasgow. Behav Res Methods 42:286–291.https://doi.org/10.3758/
42. Lee K, Byatt G, Rhodes G (2000) Efectos de caricatura, distinción e
identificación: prueba del marco del espacio facial. Psicología
Sci 11:379–385.https://doi.org/10.1111/1467-9280.00274
BRM.42.1.286
43. Thompson WC, Taroni F, Aitken CGG (2003) Cómo la probabilidad de un
j.scijus. 2008.10.011
22. Burton M, White D, McNeill A (2010) La prueba de coincidencia de rostros
23. Megreya AM, Bindemann M, Havard C (2011) Diferencias de sexo en la
identificación de rostros desconocidos: evidencia de tareas de
emparejamiento. Acta Psychol (Amst) 137: 83–89.https://doi.org/10.1016/
j.actpsy.2011. 03.003
24. Ritz-Timme S, Gabriel P, Obertovà Z et al (2011) Un nuevo atlas para
la evaluación de rasgos faciales: ventajas, límites y aplicabilidad.
Int J Legal Med 125:301–306.https://doi.org/10.1007/
s00414-010-0446-4
25. Ritz-Timme S, Gabriel P, Tutkuviene J et al (2011) Evaluación métrica y
morfológica de los rasgos faciales: un estudio sobre tres
poblaciones europeas. Ciencia forense Int 207:239.e1-239.e8.
https://doi.org/10.1016/j.forsciint.2011.01.035
26. Towler A, White D, Kemp RI (2017) Evaluación de la estrategia de comparación de
características para la identificación forense de rostros. J Exp Psychol Appl
23:47–58.https://doi.org/10.1037/xap0000108
27. Megreya AM, Bindemann M (2018) Las instrucciones de características mejoran la
precisión de la coincidencia de rostros. PLoS Uno 13:1–16.https://doi.org/10.
1371/diario.pone.0193455
falso positivo afecta el valor de la evidencia de ADN. J Forensic Sci
48:2001171.https://doi.org/10.1520/jfs2001171
44. Gibelli D, Obertová Z, Ritz-Timme S et al (2016) La identificación de personas vivas
en imágenes: una revisión de la literatura. Pierna Media 19:52–60. https://
doi.org/10.1016/j.legalmed.2016.02.001
45. Damjanovski V (2014) CCTV de la luz a los píxeles, 3.ª ed.
Elsevier, Oxford
46. Ward D (2013) Prueba de la altura de la cámara frente a la calidad de la
imagen. Pensilvania, EE. UU. Disponible en:https://ipvm.com/reports/
testing-camera-height
47. Cohen N, Gattuso J, MacLennan-Brown K (2009) Manual de requisitos
operativos de CCTV. Subdivisión de Desarrollo Científico del Ministerio
del Interior. Sandridge, Reino Unido Disponible en:https://activos.
publishing.service.gov.uk/government/uploads/system/uploads/
aptached_data/file/378443/28_09_CCTV_OR_Manual2835.pdf
48. Zhang X, Gao Y (2009) Reconocimiento facial a través de la pose: una revisión.
Reconocimiento de patrón 42:2876–2896.https://doi.org/10.1016/j.patcog.
2009.04.017
28. Porter G, Doran G (2000) Una técnica anatómica y fotográfica para la
identificación facial forense. Ciencia forense Int 114: 97–105.
https://doi.org/10.1016/S0379-0738(00)00290-5
49. Burton A, Bruce V, Hancock PJB (1999) De los píxeles a las personas: un
29. Grupo de trabajo científico de identificación facial (2018) Lista de funciones de
50. Bruce V (1994) Estabilidad de la variación: el caso del reconocimiento facial
comparación de imágenes faciales para el análisis morfológico. Disponible en:
https://fiswg.org/FISWG_Morph_Analysis_Feature_List_v2.0_ 20180911.pdf
modelo de reconocimiento de rostros familiares. Cog Sci 23:1–31.
https://doi. org/10.1016/S0364-0213(99)80050-0
The MD Vernon Memorial Lecture. QJ Exp Psychol Sect A 47:5– 28.
https://doi.org/10.1080/14640749408401141
51. Davis JP, Maigut A, Forrest C (2019) La sabiduría de la multitud: un caso de
30. Bacci N, Davimes J, Steyn M, Briers N (2020) Base de datos de rostros Wits.
Wits Repos Institucionales. Reinar. DSP, entradahttps://hdl.handle.net/
10539/29924
31. Steyn M, Smith JR (2007) Interpretación de estimaciones de estatura antemortem en sudafricanos. Ciencia forense Int 171: 97–102.https://
doi.org/10.1016/j.forsciint.2006.10.006
32. Speckeis C (2011) ¿Se puede validar ACE-V? J Forensic Identif 61: 201–
209 Disponible en:https://www.ncjrs.gov/pdffiles1/nij/225329. pdf
comparación de rostros post-to-ante-mortem por superreconocedores
policiales. Ciencia forense Int 302:109910.https://doi.org/10.1016/
j.forsciint.2019.109910
52. Roelofse MM, Steyn M, Becker PJ (2008) Identificación con foto:
rasgos morfológicos y métricos faciales en hombres sudafricanos.
Ciencia forense Int 177: 168–175.https://doi.org/10.1016/j.forsciint.
2007.12.003
53. Vanezis P, Lu D, Cockburn J et al (1996) Clasificación morfológica de rasgos
faciales en hombres adultos caucásicos basada en una evaluación de
33. R Core Team (2020) R: un lenguaje y entorno para la computación
estadística. Disponible en:https://www.r-project.org/
34. Watson PF, Petrie A (2010) Análisis de acuerdo de métodos: una revisión de
fotografías de 50 sujetos. J Ciencias Forenses 41:13998J. https://doi.org/
10.1520/jfs13998j
54. Dodd V (2018) El uso de la tecnología de reconocimiento facial por parte de la policía del
la metodología correcta. Teriogenol 73:1167–1179.https://doi. org/
Reino Unido fue un fracaso, dice el informe. Guardia. Disponible en:https://
10.1016/j.theriogenology.2010.01.003
www.theguardian. com/uk-news/2018/may/15/uk-police-use-of-facial-
35. Kuhn M (2008) Construcción de modelos predictivos en R usando el
paquete caret. J Stat Softw 28:1–26.https://doi.org/10.18637/jss.v028.
i05
36. KuhnM (2020) Caret: paquete R de entrenamiento de clasificación y
regresión. Disponible en:https://cran.r-project.org/package=caret
recognitiontechnology-failure
55. Press Association (2018) La policía galesa identifica erróneamente a miles
como posibles delincuentes. Guardia. Disponible en:https://www.
theguardian.com/uk-news/2018/may/05/welsh-police-identificar
erróneamente a miles de delincuentes potenciales
Int J Legal Med
56. Wall M (2019) ¿Sesgado y equivocado? Tecnología de reconocimiento facial en el
muelle. Noticias de la BBC 1–12. Disponible en:https://www.bbc.com/news/
business-48842750
57. Grother P, Ngan M, Hanaoka K (2019) Prueba de proveedor de reconocimiento
facial, parte 3: efectos demográficos. Gaithersburg, MD.https://doi.org/10.
6028/NIST.IR.8280
58. Morrison R (2019) La tecnología de reconocimiento facial 'racista' utilizada
en las fuerzas del orden, la banca y las escuelas identifica erróneamente
a los afroamericanos y asiáticos 100 veces más que a los blancos, según
muestra un estudio. Correo diario en línea. Disponible en:https://www.
dailymail.co.uk/sciencetech/article-7811779/Massive-errorsfacialrecognition-tech-US-study.html
59. Belhumeur PN, Jacobs DW, Kriegman DJ, Kumar N (2013) Localización
de partes de rostros usando un consenso de ejemplares. IEEE
Trans Pattern Anal Mach Intel 35:2930–2940.https://doi.org/10.
1109/TPAMI.2013.23
60. Burgos-Artizzu XP, Perona P, Dollar P (2013) Estimación robusta de puntos
de referencia faciales bajo oclusión. Proc IEEE Int Conf Comput Vis:
1513–1520.https://doi.org/10.1109/ICCV.2013.191
61. Sagonas C, Antonakos E, Tzimiropoulos G et al (2015) 300 Faces In-TheWild Challenge: base de datos y resultados. Imagen Vis Comput 47:3–
18.https://doi.org/10.1016/j.imavis.2016.01.002
62. Ellis HD, Shepherd JW, Davies GM (1979) Identificación de rostros familiares y
desconocidos a partir de características internas y externas: algunos
Implicaciones para las teorías del reconocimiento facial. Percepción 8: 431–
439. https://doi.org/10.1068/p080431
63. Megreya AM, Burton AM (2006) Las caras desconocidas no son evidencia de caras
de una tarea de emparejamiento. Mem Cognit 34:865–876.https://doi.org/
10.3758/BF03193433
64. Bindemann M, Johnston RA (2017) Comprender cómo las caras desconocidas se
vuelven familiares: Introducción a un número especial sobre el aprendizaje de
rostros. QJ Exp Psychol 70:859–862.https://doi.org/10.1080/
17470218.2016.1267235
65. Grupo de trabajo científico de identificación facial (2012)
Directrices del FISWG para métodos de comparación facial.
Disponible en :https://www. fiswg org / FI SWG _ Pautas
para métodos de comparación facial_v1.0_2012_02_02. pdf
66. Alenezi HM, Bindemann M, Fysh MC (2015) Johnston RA (2015) Coincidencia de
rostros en una tarea larga: el descanso forzado y el cambio de escritorio no
pueden mantener la precisión de la identificación. PeerJ 3:e1184.https://
doi.org/10.7717/peerj.1184
nota del editorSpringer Nature se mantiene neutral con respecto a los reclamos
jurisdiccionales en mapas publicados y afiliaciones institucionales.
Descargar