14 - Cimat

Anuncio
Caracterización de Micro Textura Visual de Papel
Utilizando los Métodos de Clasificación Basados en la
Representación de Imágenes por Cúmulos Coordinados
J.M. Hernández Alvarado*, J.T. Guillén Bonilla* y E.V. Kurmyshev*.
*
Centro de Investigaciones en Óptica A.C., Departamento de Metrología Óptica.,
C.P. 37150, León, Gto, México. jhernandez@cio.mx, jguillen@cio.mx, kev@cio.mx
RESUMEN: Caracterización y clasificación de papel es una tarea importante en procesos de
control de calidad en la industria papelera [1] y en la identificación de pruebas forenses, entre
otras. En este trabajo, adaptamos los métodos de clasificación de imágenes basados en la
representación de imágenes por cúmulos coordinados [2] para la clasificación de papel a
través de imágenes obtenidas por un microscopio. Clasificamos diversos tipos de papel
tomando imágenes en tonos de gris de hojas de papel provenientes de revistas, libros,
publicidad en general y papel de envoltura. Para formar la base de datos de entrenamiento y
pruebas de diferentes clasificadores, tomamos 10 fotografías mediante un microscopio para
cinco amplificaciones primarias: 2.5x, 3x, 4x, 5x y 6x, para cada muestra de papel disponible,
preparando de este manera imágenes de 50 clases (tipos de papel). Probamos clasificadores
de dos tipos, en clases múltiples con un clasificador de distancia mínima y a una clase,
alcanzando la eficiencia de reconocimiento (clasificación) mayor de 99.9 % con el
clasificador a clases múltiples y 99.2 % con el clasificador a una clase, usando imágenes
obtenidas a la amplificación de 3x.
1. INTRODUCCIÓN: En problemas de clasificación se distinguen dos grupos de métodos,
clasificación a clases múltiples y a una sola clase. Clasificación en clases múltiples requiere el
conocimiento de características y un conjunto de representantes en cada clase de interés para
el entrenamiento de un clasificador. En este caso, el número de clases para asignar los objetos
se conoce a priori. Cuando se conocen las características de objetos (imágenes) de una sola
clase y los objetos de otras clases no están caracterizados o están fuera de nuestro interés, nos
enfrentamos el problema de clasificación a una sola clase. Los criterios (clasificadores)
basados en la Representación de Imágenes por Cúmulos Coordinados (RICC) permiten
resolver ambos tipos de problemas de clasificación [1][4].
En este trabajo, adaptamos los métodos de clasificación de imágenes basados en la
RICC para la clasificación de papel a través de imágenes obtenidas por un microscopio.
Usamos clasificadores de dos tipos, clasificación en clases múltiples y a una clase. Además,
implementamos las técnicas novedosas reportadas en [5][6], para definir la escala óptima de
imágenes y para calibrar el clasificador a una clase, con el fin de alcanzar la mas alta
eficiencia de clasificadores en la tarea de caracterización de papel.
2. IMÁGENES PARA LOS EXPERIMENTOS DE CLASIFICACION: Con el fin de
tener una base de datos representativa, mediante un microscopio tomamos las imágenes de
papel de diferentes libros, revistas y envolturas. Obtuvimos imágenes de 50 clases (tipos de
papel), tomando 10 imágenes de tamaño 640x480 píxeles de cada fuente. Algunos ejemplos
de imágenes de nuestra base de datos se muestran en la Figura 1. Siguiendo la metodología
del trabajo [5], calculamos la escala óptima de imágenes de cada clase y, según los resultados
obtenidos, reducimos imágenes originales al tamaño 320x240 píxeles, posteriormente
recortando de las últimas las subimágenes (imágenes maestra) de 240x180 píxeles (10 por
cada clase).
B1_7_1_3x (C1)
B4_9_1_3x (C4)
B7_9_1_3x (C7)
B2_51_1_3x (C2)
B3_37_1_3x (C3)
B5_33_1_3x (C5)
B6_31_1_3x (C6)
B8_11_1_3x (C8)
B9_11_1_3x (C9)
B10_15_1_3x (C10
Figura 1. Imágenes de papel de 10 diferentes libros (clases C1 a C10).
3. TRABAJO EXPERIMENTAL: En experimentos implementamos clasificadores de dos
tipos, en clases múltiples y a una solo clase, en el espacio característico de la RICC. La
metodología de experimentos y resultados se describen a continuación. En todos
experimentos de este trabajo se usa la ventana de escaneo de 3x3 píxeles para calcular la
RICC.
3.1 Clasificador en múltiples clases: Se usa el clasificador de distancia mínima, usando la
distancia de Manhattan en el espacio de la RICC. En la etapa de aprendizaje del clasificador,
se calcula la RICC de una de las 10 imágenes 240x180 píxeles de cada una de las 50 clases.
Ésta RICC se usa como el prototipo de la clase correspondiente. En la etapa de
reconocimiento, se clasifican (asignación a la clase del prototipo mas cercano) las 500
imágenes de prueba de 240x180 píxeles, 10 imágenes por cada una de las 50 clases. De la
Tabla 1 vemos que la eficiencia de reconocimiento (clasificación) es de 100% para todas las
clases de papel de nuestra base de datos; todas las imágenes de prueba fueron correctamente
asignados a su respectiva clase.
Tabla 1. Eficiencia de clasificación de imágenes de papel a múltiples clases
Clase
Eficiencia
Clase
Eficiencia
Clase
Eficiencia
Clase
Eficiencia
Clase
Eficiencia
C1
100
C11
100
C21
100
C31
100
C41
100
C2
100
C12
100
C22
100
C32
100
C42
100
C3
100
C13
100
C23
100
C33
100
C43
100
C4
100
C14
100
C24
100
C34
100
C44
100
C5
100
C15
100
C25
100
C35
100
C45
100
C6
100
C16
100
C26
100
C36
100
C46
100
C7
100
C17
100
C27
100
C37
100
C47
100
C8
100
C18
100
C28
100
C38
100
C48
100
C9
100
C19
100
C29
100
C39
100
C49
100
C10
100
C20
100
C30
100
C40
100
C50
100
3.2 Clasificador a una sola clase: Para entrenar el clasificador a una clase [1] [3], se extraen
30 subimágenes cada una de las 10 imágenes maestra de una clase bajo estudio (clase blanco
– target class). Estas subimágenes permiten calcular los parámetros del clasificador a la clase
blanco. Se queda por asignar el valor al parámetro de selectividad del clasificador, C. Con
este fin usamos el procedimiento de calibración de trabajo [1][4]. Para la calibración se
usaron como “outliers” las imágenes de 7 clases, aparte de la clase blanco, y pasos de 0.1 en
la variación del parámetro de selectividad C. De esta manera se determinaron valores óptimos
del C para el clasificador destinado para la clasificación de papel a la clase blanco. El
entrenamiento del clasificador y su calibración se produce para cada uno de las 50 clases de
nuestra base de datos de imágenes.
En la etapa de reconocimiento se usaron 500 imágenes de prueba (10 imágenes x 50
clases) de 240x180 píxeles, extrayendo de cada una de estas las 30 subimágenes de 80x60
píxeles, como se requiere según trabajos [1][3][6]. En la Tabla 2 presentamos valores óptimos
del parámetro de selectividad C y la eficiencia de clasificación a cada clase blanco. La
eficiencia mas baja resultó de 99.2%.
Tabla 2. Eficiencia de clasificación de imágenes de papel a una clase
Clase blanco
Parámetro C
Eficiencias
Clase Blanco
Parámetro C
Eficiencias
Clase Blanco
Parámetro C
Eficiencias
Clase Blanco
Parámetro C
Eficiencias
Clase Blanco
Parámetro C
Eficiencias
C1
1.5
100
C11
1.5
100
C21
1.5
100
C31
1|.5
100
C41
1.8
100
C2
1.6
99.8
C12
1.6
100
C22
1.5
100
C32
1.5
100
C42
1.5
99.4
C3
2.0
100
C13
1.4
99.4
C23
1.6
100
C33
1.6
100
C43
1.5
100
C4
1.8
100
C14
1.7
99.8
C24
1.7
100
C34
1.4
99.8
C44
1.4
100
C5
1.4
100
C15
1.7
100
C25
1.1
99.2
C35
1.1
99.8
C45
1.6
100
C6
1.1
99.2
C16
1.8
99.4
C26
1.7
100
C36
1.8
100
C46
1.4
100
C7
1.7
100
C17
1.7
100
C27
1.7
99.8
C37
1.4
100
C47
2.0
100
C8
1.5
99.6
C18
1.4
99.8
C28
1.4
99.8
C38
2.0
100
C48
1.4
100
C9
1.9
99.8
C19
2.0
100
C29
2.0
100
C39
2.0
100
C49
2.0
100
C10
2.0
100
C20
1.8
100
C30
1.8
100
C40
2.0
100
C50
2.0
100
4. CONCLUSIONES: En este trabajo, estudiamos la eficiencia de los métodos de
clasificación basados en la representación de imágenes por cúmulos coordinados para la
clasificación y identificación de papel a través de imágenes obtenidas por un microscopio.
Clasificamos diversos tipos de papel tomando imágenes en tonos de gris de hojas de papel
provenientes de revistas, libros, publicidad en general y papel de envoltura. Probamos
clasificadores de dos tipos, en clases múltiples y a una clase, alcanzando la eficiencia de
reconocimiento (clasificación) mayor de 99.9 % con el clasificador a clases múltiples y 99.2
% con el clasificador a una clase, usando imágenes obtenidas a la amplificación de 3x. Con
estos resultados previos demostramos una alta eficiencia de clasificadores a clases múltiples y
a una solo clase en el espacio característico de la RICC, para las tareas de control de calidad
en la industria papelera y de la identificación de pruebas forenses, entre otras.
REFERENCIAS:
[1] M. Turtinen, M. Pietikäinen and O. Silvén, Visual Characterization of Paper Using Isomap and Local
Binary Patterns, University of Oulu, Finland, 2006.
[2] E.V. Kurmyshev, “Classification of texture images using coordinated clusters representation”: In “Recent Advances
in Optical Metrology” (Research Signpost, Kerala, India, 2007), Chapter 7, pp.155-226.
[3] R.E. Sánchez-Yáñez, E.V. Kurmyshev and A. Fernández, “One-class texture classifier in the CCR feature space”,
Pattern Recognition Letters, 24 / 9-10, 2003, pp.1503-1511.
[4] E.V. Kurmyshev and R.E. Sánchez-Yáñez, “Comparative experiment with colour texture classifier using the CCR
feature space”, Pattern Recognition Letters, 26/9, 2005, pp.1346-1353.
[5] E. V. Kurmyshev, M. Poterasu, and J. T. Guillen-Bonilla, “Image scale determination for optimal texture
classification using coordinated clusters representation”, Appl. Optics, 46/9, 2007, pp.1467-1476.
[6] J.T. Guillen-Bonilla, E. Kurmyshev and E. González, “An algorithm for training the minimum error one-class
classifier of images”, Appl. Optics, 47/4, 2008, pp.541-547.
Descargar