Caracterización de Micro Textura Visual de Papel Utilizando los Métodos de Clasificación Basados en la Representación de Imágenes por Cúmulos Coordinados J.M. Hernández Alvarado*, J.T. Guillén Bonilla* y E.V. Kurmyshev*. * Centro de Investigaciones en Óptica A.C., Departamento de Metrología Óptica., C.P. 37150, León, Gto, México. jhernandez@cio.mx, jguillen@cio.mx, kev@cio.mx RESUMEN: Caracterización y clasificación de papel es una tarea importante en procesos de control de calidad en la industria papelera [1] y en la identificación de pruebas forenses, entre otras. En este trabajo, adaptamos los métodos de clasificación de imágenes basados en la representación de imágenes por cúmulos coordinados [2] para la clasificación de papel a través de imágenes obtenidas por un microscopio. Clasificamos diversos tipos de papel tomando imágenes en tonos de gris de hojas de papel provenientes de revistas, libros, publicidad en general y papel de envoltura. Para formar la base de datos de entrenamiento y pruebas de diferentes clasificadores, tomamos 10 fotografías mediante un microscopio para cinco amplificaciones primarias: 2.5x, 3x, 4x, 5x y 6x, para cada muestra de papel disponible, preparando de este manera imágenes de 50 clases (tipos de papel). Probamos clasificadores de dos tipos, en clases múltiples con un clasificador de distancia mínima y a una clase, alcanzando la eficiencia de reconocimiento (clasificación) mayor de 99.9 % con el clasificador a clases múltiples y 99.2 % con el clasificador a una clase, usando imágenes obtenidas a la amplificación de 3x. 1. INTRODUCCIÓN: En problemas de clasificación se distinguen dos grupos de métodos, clasificación a clases múltiples y a una sola clase. Clasificación en clases múltiples requiere el conocimiento de características y un conjunto de representantes en cada clase de interés para el entrenamiento de un clasificador. En este caso, el número de clases para asignar los objetos se conoce a priori. Cuando se conocen las características de objetos (imágenes) de una sola clase y los objetos de otras clases no están caracterizados o están fuera de nuestro interés, nos enfrentamos el problema de clasificación a una sola clase. Los criterios (clasificadores) basados en la Representación de Imágenes por Cúmulos Coordinados (RICC) permiten resolver ambos tipos de problemas de clasificación [1][4]. En este trabajo, adaptamos los métodos de clasificación de imágenes basados en la RICC para la clasificación de papel a través de imágenes obtenidas por un microscopio. Usamos clasificadores de dos tipos, clasificación en clases múltiples y a una clase. Además, implementamos las técnicas novedosas reportadas en [5][6], para definir la escala óptima de imágenes y para calibrar el clasificador a una clase, con el fin de alcanzar la mas alta eficiencia de clasificadores en la tarea de caracterización de papel. 2. IMÁGENES PARA LOS EXPERIMENTOS DE CLASIFICACION: Con el fin de tener una base de datos representativa, mediante un microscopio tomamos las imágenes de papel de diferentes libros, revistas y envolturas. Obtuvimos imágenes de 50 clases (tipos de papel), tomando 10 imágenes de tamaño 640x480 píxeles de cada fuente. Algunos ejemplos de imágenes de nuestra base de datos se muestran en la Figura 1. Siguiendo la metodología del trabajo [5], calculamos la escala óptima de imágenes de cada clase y, según los resultados obtenidos, reducimos imágenes originales al tamaño 320x240 píxeles, posteriormente recortando de las últimas las subimágenes (imágenes maestra) de 240x180 píxeles (10 por cada clase). B1_7_1_3x (C1) B4_9_1_3x (C4) B7_9_1_3x (C7) B2_51_1_3x (C2) B3_37_1_3x (C3) B5_33_1_3x (C5) B6_31_1_3x (C6) B8_11_1_3x (C8) B9_11_1_3x (C9) B10_15_1_3x (C10 Figura 1. Imágenes de papel de 10 diferentes libros (clases C1 a C10). 3. TRABAJO EXPERIMENTAL: En experimentos implementamos clasificadores de dos tipos, en clases múltiples y a una solo clase, en el espacio característico de la RICC. La metodología de experimentos y resultados se describen a continuación. En todos experimentos de este trabajo se usa la ventana de escaneo de 3x3 píxeles para calcular la RICC. 3.1 Clasificador en múltiples clases: Se usa el clasificador de distancia mínima, usando la distancia de Manhattan en el espacio de la RICC. En la etapa de aprendizaje del clasificador, se calcula la RICC de una de las 10 imágenes 240x180 píxeles de cada una de las 50 clases. Ésta RICC se usa como el prototipo de la clase correspondiente. En la etapa de reconocimiento, se clasifican (asignación a la clase del prototipo mas cercano) las 500 imágenes de prueba de 240x180 píxeles, 10 imágenes por cada una de las 50 clases. De la Tabla 1 vemos que la eficiencia de reconocimiento (clasificación) es de 100% para todas las clases de papel de nuestra base de datos; todas las imágenes de prueba fueron correctamente asignados a su respectiva clase. Tabla 1. Eficiencia de clasificación de imágenes de papel a múltiples clases Clase Eficiencia Clase Eficiencia Clase Eficiencia Clase Eficiencia Clase Eficiencia C1 100 C11 100 C21 100 C31 100 C41 100 C2 100 C12 100 C22 100 C32 100 C42 100 C3 100 C13 100 C23 100 C33 100 C43 100 C4 100 C14 100 C24 100 C34 100 C44 100 C5 100 C15 100 C25 100 C35 100 C45 100 C6 100 C16 100 C26 100 C36 100 C46 100 C7 100 C17 100 C27 100 C37 100 C47 100 C8 100 C18 100 C28 100 C38 100 C48 100 C9 100 C19 100 C29 100 C39 100 C49 100 C10 100 C20 100 C30 100 C40 100 C50 100 3.2 Clasificador a una sola clase: Para entrenar el clasificador a una clase [1] [3], se extraen 30 subimágenes cada una de las 10 imágenes maestra de una clase bajo estudio (clase blanco – target class). Estas subimágenes permiten calcular los parámetros del clasificador a la clase blanco. Se queda por asignar el valor al parámetro de selectividad del clasificador, C. Con este fin usamos el procedimiento de calibración de trabajo [1][4]. Para la calibración se usaron como “outliers” las imágenes de 7 clases, aparte de la clase blanco, y pasos de 0.1 en la variación del parámetro de selectividad C. De esta manera se determinaron valores óptimos del C para el clasificador destinado para la clasificación de papel a la clase blanco. El entrenamiento del clasificador y su calibración se produce para cada uno de las 50 clases de nuestra base de datos de imágenes. En la etapa de reconocimiento se usaron 500 imágenes de prueba (10 imágenes x 50 clases) de 240x180 píxeles, extrayendo de cada una de estas las 30 subimágenes de 80x60 píxeles, como se requiere según trabajos [1][3][6]. En la Tabla 2 presentamos valores óptimos del parámetro de selectividad C y la eficiencia de clasificación a cada clase blanco. La eficiencia mas baja resultó de 99.2%. Tabla 2. Eficiencia de clasificación de imágenes de papel a una clase Clase blanco Parámetro C Eficiencias Clase Blanco Parámetro C Eficiencias Clase Blanco Parámetro C Eficiencias Clase Blanco Parámetro C Eficiencias Clase Blanco Parámetro C Eficiencias C1 1.5 100 C11 1.5 100 C21 1.5 100 C31 1|.5 100 C41 1.8 100 C2 1.6 99.8 C12 1.6 100 C22 1.5 100 C32 1.5 100 C42 1.5 99.4 C3 2.0 100 C13 1.4 99.4 C23 1.6 100 C33 1.6 100 C43 1.5 100 C4 1.8 100 C14 1.7 99.8 C24 1.7 100 C34 1.4 99.8 C44 1.4 100 C5 1.4 100 C15 1.7 100 C25 1.1 99.2 C35 1.1 99.8 C45 1.6 100 C6 1.1 99.2 C16 1.8 99.4 C26 1.7 100 C36 1.8 100 C46 1.4 100 C7 1.7 100 C17 1.7 100 C27 1.7 99.8 C37 1.4 100 C47 2.0 100 C8 1.5 99.6 C18 1.4 99.8 C28 1.4 99.8 C38 2.0 100 C48 1.4 100 C9 1.9 99.8 C19 2.0 100 C29 2.0 100 C39 2.0 100 C49 2.0 100 C10 2.0 100 C20 1.8 100 C30 1.8 100 C40 2.0 100 C50 2.0 100 4. CONCLUSIONES: En este trabajo, estudiamos la eficiencia de los métodos de clasificación basados en la representación de imágenes por cúmulos coordinados para la clasificación y identificación de papel a través de imágenes obtenidas por un microscopio. Clasificamos diversos tipos de papel tomando imágenes en tonos de gris de hojas de papel provenientes de revistas, libros, publicidad en general y papel de envoltura. Probamos clasificadores de dos tipos, en clases múltiples y a una clase, alcanzando la eficiencia de reconocimiento (clasificación) mayor de 99.9 % con el clasificador a clases múltiples y 99.2 % con el clasificador a una clase, usando imágenes obtenidas a la amplificación de 3x. Con estos resultados previos demostramos una alta eficiencia de clasificadores a clases múltiples y a una solo clase en el espacio característico de la RICC, para las tareas de control de calidad en la industria papelera y de la identificación de pruebas forenses, entre otras. REFERENCIAS: [1] M. Turtinen, M. Pietikäinen and O. Silvén, Visual Characterization of Paper Using Isomap and Local Binary Patterns, University of Oulu, Finland, 2006. [2] E.V. Kurmyshev, “Classification of texture images using coordinated clusters representation”: In “Recent Advances in Optical Metrology” (Research Signpost, Kerala, India, 2007), Chapter 7, pp.155-226. [3] R.E. Sánchez-Yáñez, E.V. Kurmyshev and A. Fernández, “One-class texture classifier in the CCR feature space”, Pattern Recognition Letters, 24 / 9-10, 2003, pp.1503-1511. [4] E.V. Kurmyshev and R.E. Sánchez-Yáñez, “Comparative experiment with colour texture classifier using the CCR feature space”, Pattern Recognition Letters, 26/9, 2005, pp.1346-1353. [5] E. V. Kurmyshev, M. Poterasu, and J. T. Guillen-Bonilla, “Image scale determination for optimal texture classification using coordinated clusters representation”, Appl. Optics, 46/9, 2007, pp.1467-1476. [6] J.T. Guillen-Bonilla, E. Kurmyshev and E. González, “An algorithm for training the minimum error one-class classifier of images”, Appl. Optics, 47/4, 2008, pp.541-547.