UNIVERSIDAD DE CHILE FACULTAD DE CIENCIAS FÍSICAS Y MATEMÁTICAS DEPARTAMENTO DE INGENIERÍA ELÉCTRICA DESARROLLO ANALÍTICO DE LA REACTIVIDAD PUPILAR Y SU USO COMO MARCADOR FISIOLÓGICO EN ENFERMEDADES PSIQUIÁTRICAS MEMORIA PARA OPTAR AL TÍTULO DE INGENIERO CIVIL ELÉCTRICO SAMUEL ANDRÉS MADARIAGA ROMÁN PROFESOR GUIA: PEDRO MALDONADO ARBOGAST MIEMBROS DE LA COMISIÓN: JUAN VELÁSQUEZ SILVA HECTOR AGUSTO ALEGRÍA SANTIAGO DE CHILE 2015 RESUMEN DE LA MEMORIA. PARA OPTAR AL TÍTULO DE INGENIERO CICIL ELECTRICO POR: SAMUEL ANDRÉS MADARIAGA ROMÁN FECHA: 09/05/2015 PROF. GUÍA: DR. PEDRO MALDONADO ARBOGAST DESARROLLO ANALÍTICO DE LA REACTIVIDAD PUPILAR Y SU USO COMO MARCADOR FISIOLÓGICO EN ENFERMEDADES PSIQUIÁTRICAS El propósito de la presente memoria es analizar si las diferencias anteriormente reportadas en el sistema nervioso central entre pacientes con diagnóstico de esquizofrenia y sujetos de control pueden ser capturadas y cuantificadas a partir de la reactividad pupilar, y estudiar si es posible utilizar esta señal como un marcador fisiológico que pudiese delatar la patología. En primer lugar, se estudió, desarrolló y realizó un experimento por parte del grupo de neurocientíficos que fuese capaz de capturar la señal pupilar de los individuos, utilizando para esto conocimientos, acerca del estado del arte en registros oculográficos y en estudios de la reactividad pupilar. Esta señal se extrae y se procesa gracias al desarrollo de un completo grupo de funciones computacionales, las cuales permitieron abordar el problema desde un punto de vista general con relación a los demás experimentos enmarcados en el laboratorio de investigación. El problema de la clasificación se abordó en dos etapas. Primeramente se analizó las señales promedio resultantes entre los distintos grupos de interés y a partir de conocimientos de expertos se escogió el conjunto de valores que caracterizarían la curva o señal. A continuación se aplicó un análisis estadístico para validar los parámetros elegidos. La clasificación se generó a partir del entrenamiento supervisado de redes neuronales artificiales las cuales tuvieron un desempeño aceptable debido a que estas estaban orientadas a apoyar la decisión clínica y no ser una respuesta única. Queda registrado como un indicio la diferenciación de la reactividad pupilar entre pacientes y sujetos de control, pero se necesita una mayor cantidad y diversidad de datos para tener resultado plenamente satisfactorios. I Dedicado a mi incondicional familia la cual amo II Agradecimientos Quisiera agradecer, en primer lugar, a quienes a pesar de las vicisitudes nunca dejaron de ser una influencia ni han dejado de ser mi cable a tierra. En particular quiero agradecer a mi padre Edgar Madariaga Rubilar y mi madre Judith Román Parra por ser un ejemplo a seguir y por enseñarme que todo se puede mientras sea en Cristo, ya que es él quien te fortalece. En segundo lugar quiero agradecer a mis hermanos, y particularmente a los dos menores, Diego y Javier, quienes siempre me prestaron una mano cuando lo necesitaba y me sacaron una sonrisa en los tiempos de adversidad. Amigos a quienes agradecer por su apoyo y cariño no cabrían en las páginas de esta memoria, pero destacan los que hasta el día de hoy me acompañan y me estuvieron dando ánimo durante este proceso. Destaco a Kristofher Muñoz quien nunca dudó en ayudarme como pudiese y mi compañera en el tema de esta memoria, Claudia Acevedo. Al profesor guía de este trabajo, el Dr. Pedro Maldonado, por sus observaciones, buena voluntad y buen humor, y al profesor Juan Velásquez, por sumarse sin dudar como profesor co-guía en este proyecto. Quiero agradecer especialmente al equipo de trabajo y al staff completo del laboratorio de neurosistemas, siempre tuvieron una palabra amena para solucionar dudas y discutir temas situados en áreas poco exploradas desde la facultad de ingeniería, pero de gran relación con este trabajo y de gran interés personal. Finalmente quiero agradecer a Valentina Alegría, por su apoyo, paciencia, compañía, cariño y por ser uno de los más grandes soportes en mi vida a lo largo de estos años. III Tabla de Contenido Resumen .................................................................................................................................................. I Agradecimientos ...................................................................................................................................III Índice de Figuras .................................................................................................................................. VI Índice de Tablas ................................................................................................................................... IX Capítulo 1 Introducción ..........................................................................................................................1 1.1 Objetivos y Aporte de la Memoria ...............................................................................................2 1.1.1 Objetivos Generales ...................................................................................................2 1.1.2 Objetivos Específicos ................................................................................................3 1.2 Estructura de la Memoria .............................................................................................................3 Capítulo 2 Revisión Bibliográfica .........................................................................................................4 2.1 Esquizofrenia................................................................................................................................5 2.1.1 Evolución del Concepto y Manifestaciones Clínicas ................................................5 2.1.2 Disfunciones Psicomotoras ........................................................................................6 2.1.3 Disfunciones Cognitivas ............................................................................................6 2.2 Sistema Nervioso Autónomo .......................................................................................................7 2.2.1 Sistema Nervioso Autónomo en Esquizofrenia .........................................................8 2.3 Primeros Descubrimientos en Oculografía ..................................................................................9 2.4 Yarbus y el siglo XX ..................................................................................................................10 2.5 Experimentos Recientes .............................................................................................................11 2.6 Eye-Tracking ..............................................................................................................................13 2.7 Estudios Señal Pupilar................................................................................................................14 2.8 Reactividad Pupilar como Marcador Fisiológico .......................................................................16 2.8.1 Reactividad Pupilar en Esquizofrenia, Resultados Previos .....................................19 2.9 Análisis de Frecuencia ...............................................................................................................20 2.9.1 Filtros Lineales de Tiempo Continuo ......................................................................20 2.10Prueba t de Student.....................................................................................................................21 IV 2.11Redes Neuronales Artificiales ....................................................................................................24 2.11.1 Modelo de una Red Neuronal Artificial ..................................................................24 2.11.2 Funciones de Activación ..........................................................................................26 2.11.3 RNA con Aprendizaje Supervisado .........................................................................27 2.11.4 Validación de Modelos de RNA ..............................................................................28 2.11.5 Validación de Modelos de RNA ..............................................................................29 2.11.6 Algoritmos de Entrenamiento Supervisado .............................................................30 Capítulo 3 Implementación ..................................................................................................................32 3.1 Experimento ...............................................................................................................................33 3.1.1 Comité de Ética ........................................................................................................33 3.1.2 Universo Muestral....................................................................................................33 3.1.3 Condiciones de Registros.........................................................................................34 3.1.4 Registro Pupilar .......................................................................................................35 3.1.5 Imágenes Naturales con diferente Complejidad Visual ...........................................36 3.2 Toolbox ......................................................................................................................................38 3.2.1 Extracción ................................................................................................................39 3.2.2 Pre-Procesamiento ...................................................................................................43 3.2.3 Análisis ....................................................................................................................47 Capítulo 4 Análisis y Resultados .........................................................................................................52 4.1 Procesamiento de Datos .............................................................................................................53 4.1.1 Interpolación de Parpadeos ......................................................................................53 4.1.2 Filtrado del ruido .....................................................................................................53 4.1.3 Curvas Finales..........................................................................................................55 4.2 Características de las Curvas ......................................................................................................57 4.3 Clasificador ................................................................................................................................61 4.3.1 Clasificador por curvas de categorías ......................................................................62 4.3.2 Clasificador por curvas de categorías ......................................................................66 Capítulo 5 Conclusiones y Discusión ...................................................................................................69 5.1 Conclusiones ..............................................................................................................................69 5.2 Trabajo futuro.............................................................................................................................72 Bibliografía ...........................................................................................................................................73 V Índice de Figuras Figura 2.1: Comportamiento ocular humano en el contexto de lectura: Los ojos se mantienen fijos en un lugar y luego rápidamente se mueven hacia otra palabra en vez de hacer un seguimiento suave del texto. ............................................................................ 10 Figura 2.2: ‘El viajero de Yarbus’ muestra las distintas tareas de búsqueda de información influyentes en el comportamiento ocular. ............................................................................ 12 Figura 2.3: A la izquierda se ubica el Eyelink 1000 y a la derecha el Eyelink I. Se puede ver que el modelo I tiene la ventaja de tener las cámaras más cerca de la pupila pero no permite utilizar Eye-Tracker y electro encefalograma (EEG). Ambos modelos tienen el desempeño suficiente para ser usados en contexto de investigación. .............................. 13 Figura 2.4: Aspectos en el patrón de la reactividad pupilar registrados por Canver. Destacan las características significativas como la contracción, dilatación y el cálculo y registro de las velocidades de estas. .................................................................................................. 14 Figura 2.5: Experimento y registro de la pupila. Procesamiento por filtrado wavelet y por filtrado de Kalman. Trabajo de P. Ren. ............................................................................... 15 Figura 2.6: Curvas promedio de variaciones del diámetro pupilar en respuesta a imágenes de valencia negativa, positiva y neutra en 30 sujetos. Las curvas de respuesta pupilar muestran diferencias entre los estímulos con diferente valencia emocional, entre éstos y el “ruido rosa” (imagen en todo gris sin contenido presentada después de los 4000 ms). El tiempo 0 corresponde a la presentación del estímulo emocional. ........................... 18 Figura 2.7: Las funciones de transferencia de filtros polinomiales de quinto orden. El filtro de Butterworth es ideal para evitar el rizado, pero tiene la respuesta de corte más lenta. ..................................................................................................................................... 22 Figura 2.8: Ejemplo de una distribución t de Student. .................................................................. 23 Figura 2.9: Esquema de las partes de una neurona artificial ......................................................... 25 Figura 2.10: Estructura típica de una Red Neuronal Artificial Multicapa. ................................... 26 VI Figura 2.11: Esquema del aprendizaje supervisado en una Red Neuronal Artificial. ................... 28 Figura 3.1: Esquema sistema Eye-Tracker, modelo EyeLink 1000. Fuente: SR Research .......... 35 Figura 3.2: Tipos de Imágenes mostradas en el experimento. (a) Ambiente Urbano; (b) Ambiente Natural; (c) Fractal; (d) Ruido Rosa; (e) Ruido Blanco; (f) Gris; (g) Negro ...... 36 Figura 3.3: Esquema que representa las distintas etapas del experimento desde el despliegue de este, la adquisición y el procesamiento de los datos obtenidos. ..................................... 37 Figura 3.4: Diagrama de bloques del Toolbox que muestra las etapas necesarias en el procesamiento de los datos. ................................................................................................. 38 Figura 3.5: Extracto del archivo ASCII del sujeto as170712. Se puede apreciar que los primeros valores corresponden a datos logísticos tales como la fecha, la localización del archivo resultante, y valores referentes a la versión y modelo del dispositivo. ............. 39 Figura 3.6: Extracto del archivo ASCII del sujeto as170712 de la línea 48669 a la 48686. Se puede apreciar que en este punto del archivo se encuentra por columnas los valores referentes a posiciones oculares como al tamaño de la dilatación para ambos ojos. ........... 40 Figura 3.7: Señal de la posición de ojo Izquierdo en el eje X. El gráfico A) muestral la señal cruda obtenida por el sistema EyeLink, el gráfico B) despliega esta misma sección del gráfico luego de aplicarse la función cleanSaccades.................................................. 44 Figura 3.8: La señal corresponde a la reactividad a una imagen. Los puntos en color rojo son los valores correspondientes a las dilataciones máximas pre y post estímulo y la contracción máxima. ............................................................................................................ 49 Figura 4.1: Diferencias entre las curva de la señal pupilar antes y después de corregir los eventos de los pestañeos. ..................................................................................................... 54 Figura 4.2: Diferencias entre las curva de la señal pupilar antes y después del filtrado del ruido externo. ....................................................................................................................... 54 Figura 4.3: Resultado promedio de pacientes con esquizofrenia versus sujetos de control de todas las curvas sin considerar las curvas correspondientes a las imágenes negras. ........... 55 Figura 4.4: Resultado promedio de pacientes con esquizofrenia versus sujetos de control de todas las curvas respectivas a la categoría de Ambiente Urbano. ....................................... 56 Figura 4.5: Resultado promedio de pacientes con esquizofrenia versus sujetos de control de todas las curvas respectivas a la categoría de Ruido Blanco. .............................................. 56 VII Figura 4.6: Esquema de las características que se asociaron a la curva. (a) valor de contracción máxima post-estímulo; (b) velocidad de contracción; (c) velocidad de dilatación en el primer segundo; (d) velocidad de contracción media. ............................... 58 Figura 4.7: Gráfico de barras para el promedio de cada una de las 4 características con sus respectivos errores, separadas por pacientes con esquizofrenia y sujetos de control. ......... 62 Figura 4.8: Matriz de confusión del clasificador considerando todos los parámetros. En este caso, 1 corresponde a esquizofrénico y 0 a control. ............................................................ 63 Figura 4.9: Matriz confusión del conjunto de test para otra red neuronal de mismas características. ...................................................................................................................... 64 Figura 4.10: Curvas ROC del conjunto de test y de todos los datos para la red de la Figura 4.8. ....................................................................................................................................... 64 Figura 4.11: Curvas ROC del conjunto de test y de todos los datos para la red de la Figura 4.9. ....................................................................................................................................... 65 Figura 4.12: Matriz de confusión del clasificador considerando solo 4 parámetros por sujeto. En este caso, 1 corresponde a esquizofrénico y 0 a control. ................................................ 66 Figura 4.13: Matriz confusión del conjunto de test para otra red neuronal de mismas características. ...................................................................................................................... 67 Figura 4.14: Curvas ROC de la red neuronal con mejor desempeño. ........................................... 68 VIII Índice de Tablas Tabla 3.1: Valores de cada columna generados por el sistema EyeLink. ..................................... 40 Tabla 4.1: Características escogidas para representar la curva de reacción pupilar. Las mediciones se hicieron sobre la curva previamente normalizada por z-score. .................... 57 Tabla 4.2: Valores de características promedio para cada uno de los sujetos con diagnóstico de esquizofrenia. .................................................................................................................. 59 Tabla 4.3: Valores de características promedio para cada uno de los sujetos de control. ............. 59 Tabla 4.4: Valores obtenidos del test de normalidad Shapiro-Wilk. ............................................ 60 Tabla 4.5: Valores obtenidos de la realización del test de Student. .............................................. 61 IX Capítulo 1 Introducción A medida que la sociedad ha avanzado hacia una vida moderna donde las presiones por destacar, la lucha por mantener un estatus social determinado y el aumento de la violencia registrada alrededor del mundo se hacen cada vez más presentes, muchos expertos alertan del aumento progresivo de las enfermedades psiquiátricas que estas tendencias conllevan. No es menor el número de personas que sufren de esquizofrenia a nivel mundial, la que se cree podría llegar al 1%. Esta patología se inicia en la adolescencia y suele ser de gran impacto en la funcionalidad de los sujetos afectados. El gran problema es que pese a los esfuerzos, aún no se disponen de herramientas que permitan la detección precoz, ni remisión total de esta enfermedad. Sobre la esquizofrenia se tiene conocimiento que los sujetos presentan una amplia gama de manifestaciones clínicas, como alteraciones en afectividad, percepción, lenguaje, pensamiento, atención y alteraciones psicomotoras. Debido a los altos costos psicosociales y económicos, se han realizado enormes esfuerzos de investigación, los que han generado una serie de aproximaciones que intentan dar cuenta de los fenómenos subyacentes en función de disminuir la probabilidad de cometer equivocaciones en el diagnóstico de la enfermedad por otro trastorno psiquiátrico con similares manifestaciones. Una de estas aproximaciones consiste en la búsqueda de marcadores fisiológicos, siendo uno de éstos el Sistema Nervioso Autónomo (SNA), que, además de cumplir funciones como regulador de múltiples funciones fisiológicas, se ha visto involucrado en procesamientos cognitivos, emocionales, así como en la toma de decisiones, las que se han reportado en sujetos aquejados por esquizofrenia. Considerando los recientes hallazgos que indican una mayor mortalidad que la población general, resulta de especial interés acceder a una medida de funcionamiento del SNA. 1 En este estudio se usará la reactividad pupilar como métrica de funcionamiento del SNA. Hasta ahora no se ha evaluado si la dinámica pupilar en pacientes varía frente a imágenes naturales, situación que intenta aproximarse a un ambiente ecológico. En este proyecto se propone evaluar si frente a este paradigma de exploración libre de imágenes naturales, existen cambios en la dinámica pupilar en pacientes versus sujetos de control. Esto permitirá obtener una medida del funcionamiento del SNA en ambos grupos durante una situación que se aproxima bastante bien a condiciones naturales, para finalmente construir un clasificador inteligente que sea la base de un sistema de apoyo en la toma de decisiones a la hora de diagnosticar el trastorno psiquiátrico. 1.1 Objetivos y Aporte de la Memoria El aporte de esta memoria es el estudio, análisis y construcción de un clasificador capaz de determinar, a través del comportamiento pupilar, si determinado sujeto podría catalogarse con diagnóstico de esquizofrenia y con qué grado de certeza. También aportará con la creación de un Toolbox computacional amplio y de fácil uso, que permitirá a investigadores del Laboratorio de Neurosistemas de la Facultad de Medicina de la Universidad de Chile, acceder y manejar los datos de comportamiento ocular de manera global y expedita. 1.1.1 Objetivos Generales Implementar un Toolbox computacional que permita extraer, procesar y analizar la señal pupilar registrada. Extender metodologías y resultados a los distintos experimentos de conducta ocular desarrollados en el laboratorio de Neurosistemas. 2 1.1.2 Objetivos Específicos Implementar herramientas de extracción de datos de experimentos oculares y formar parte del equipo de discusión de estructura de experimento. Analizar y eliminar tanto ruido como los distintos artefactos que dificultan el análisis de los datos a través de funciones creadas específicamente para estos fines. Generar un sistema basado en conocimientos como apoyo en la toma de decisiones, y comparar su desempeño con distintos clasificadores neuronales. 1.2 Estructura de la Memoria En el capítulo dos se expondrá sobre la esquizofrenia y los avances del área de la neurociencia, como también los experimentos y desarrollos en los oculógrafos, hasta llegar al estado del arte, hablando de los últimos trabajos y resultados. También se hablará de nociones matemáticas necesarias para el análisis y desarrollo posterior. En el capítulo tres se abordan las metodologías necesarias para la elaboración del clasificador. Se centrará y tratará de abordar completamente el experimento utilizado para rescatar los datos de la reactividad pupilar, dando detalles sobre la manera de proceder, los resultados esperados de estos, y del trabajo realizado sobre el Toolbox computacional, desarrollado en MATLAB, que permite la adquisición, procesamiento y final análisis de los datos. El capítulo cuatro expondrá los resultados que se fueron suscitando en cada una de las etapas hasta llegar al clasificador entre los que destacan los procesamientos de la señal pupilar, los resultados estadísticos sobre las características de esta señal, y finalmente se mostrarán los desempeños de los distintos clasificadores. Finalmente el capítulo cinco despliega una pequeña discusión de lo obtenido anteriormente y las conclusiones finales realizadas. 3 Capítulo 2 Revisión Bibliográfica El presente capítulo tiene como principal objetivo orienta al lector con las principales nociones sobre la esquizofrenia y el análisis pupilar, a través de los avances y desarrollos que se han dado en el ámbito de la neurociencia hasta llegar al actual estado del arte. Se tendrá en cuenta en todo momento que la contextualización está dirigida hacia la ingeniería, por tanto se pondrá especial énfasis en el rol de dicha área y en las metodologías en las que ésta pueda aportar. A partir de este acercamiento, se pretende que quede en evidencia la importancia actual de los trabajos interdisciplinarios, paradigma que no solo existe en el área de la neurociencia, sino también en el desarrollo de nuevas metodologías científicas en general. En primer lugar se hablará sobre la esquizofrenia, contextualizándola de manera general y enfocándose en el tema de interés de este trabajo. Se hablará también de temas relacionados tales como el sistema nervioso autónomo, y por qué resulta interesante su estudio en pacientes con diagnóstico de esquizofrenia. En segundo lugar se hablará de la historia, los avances y el actual estado del arte respecto a los oculógrafos o sistemas capaces del registro del comportamiento ocular y pupilar, hasta llegar a los Eye-Trackers que son utilizados hoy en día, y cómo éstos están siendo de gran valor dentro de la investigación. Finalmente se expondrán algunos principios matemáticos fundamentales para este trabajo, tales como el análisis de señales en la frecuencia, análisis estadísticos y sistemas inteligentes, donde destacan las redes neuronales artificiales y su uso como clasificadores. 4 2.1 Esquizofrenia 2.1.1 Evolución del Concepto y Manifestaciones Clínicas La esquizofrenia es un trastorno psiquiátrico dentro de la categoría de trastornos mentales crónicos y graves. Las personas aquejadas de trastornos esquizofrénicos presentan distorsiones fundamentales y típicas de la percepción, del pensamiento y de las emociones, estas últimas en forma de embotamiento o falta de adecuación de las mismas. El trastorno compromete las funciones esenciales que dan a la persona normal la vivencia de su individualidad, singularidad y dominio de sí misma. La capacidad de relacionarse con el medio se deteriora, así como su funcionamiento social y la participación en actividades compartidas. El aislamiento se explica porque la persona no es capaz de comportarse de acuerdo a las expectativas de su grupo y comunidad, como también por el rechazo que estas conductas producen en los otros [1]. La esquizofrenia es uno de los principales problemas de salud mental a nivel mundial, afectando al 1% de la población [2]. Generalmente se inicia en la adolescencia y edad adulta temprana, evolucionando crónicamente y generando un gran impacto en la funcionalidad psíquica, física y social de las personas afectadas. Las alteraciones emocionales y de memoria fueron reconocidas como elementos esenciales del diagnóstico, incluso antes que el término Esquizofrenia fuera introducido [3] [4]. Eugen Bleuler, psiquiatra Suizo, es quién introduce en 1911 el término de Esquizofrenia, reemplazando así el de “Demencia Precoz”. Blueler además es responsable de clasificar las manifestaciones clínicas en Síntomas Fundamentales y Accesorios [4]. a) Síntomas Fundamentales: Aplanamiento Afectivo, Autismo, Alteraciones en Atención, Laxitud de Asociaciones, Ambivalencia, Abulia. b) Síntomas Accesorios: Alucinaciones, Delirios, Catatonia y problemas de conducta Otro modelo conceptual es el propuesto por Crow en 1980, quién clasifica la Esquizofrenia en tipo I y tipo II. Las ampliaciones y distorsiones de la percepción, las creencias y las conductas normales se agrupan bajo el término Síntomas Positivos, por otra 5 parte los déficits del habla, motivación, emoción y placer se agrupan bajo el término Síntomas Negativos [5]. Una de las principales contribuciones de este modelo se centra en la elaboración de escalas de clasificación basadas en los síntomas positivos y negativos de la Esquizofrenia. Considerando la amplia gama de manifestaciones clínicas de la esquizofrenia, se destacarán para efectos de este proyecto las disfunciones Psicomotoras y Cognitivas. 2.1.2 Disfunciones Psicomotoras Respecto a manifestaciones Psicomotoras Kahlbaum, en el siglo XIX describe el fenómeno de la catatonía analizando las relaciones entre los síntomas somáticos y los síntomas mentales, concluyendo que los síntomas psíquicos aparecen en estrecha relación con las manifestaciones motoras, con un paralelismo en su evolución. Él se esforzó en unir dos campos de la patología hasta entonces separados, el de las perturbaciones psíquicas y alteraciones motoras. Seleccionó el término catatonia para describir una “locura de tensión”, conjunto de anormalidades neuromotoras que incluyen mutismo, negativismo, estereotipias, catalepsia y verbigeración. Respecto a las manifestaciones corporales, si bien las destaca, no logra precisar una clara relación con los estados mentales. Respecto a los hallazgos somáticos de las psicosis, Karl Jaspers en su Tratado de Psicopatología General de 1913, hace mención a hallazgos como aumento de los reflejos, alteraciones pupilares, cianosis de extremidades, cambios en las glándulas sudoríparas, “cara ungüentosa”, pigmentaciones y perturbaciones tróficas. A través del tiempo reporta cambios en el peso y falta de menstruación [6]. 2.1.3 Disfunciones Cognitivas Un área de especial interés durante los últimos años ha sido la relacionada a las funciones cognitivas en la Esquizofrenia. El 90% de los sujetos afectados presenta deterioro en al menos un dominio cognitivo, y el 70% al menos en dos dominios cognitivos. Dentro de los principales hallazgos descritos se encuentran déficits cognitivos heterogéneos globales, donde los déficits en atención, memoria (verbal y de trabajo) y 6 funciones ejecutivas se encuentran presentes desde el primer brote de la enfermedad, lo que podría explicar gran parte de los problemas sociales y vocacionales. En un análisis posterior publicado el 2012 que incluyó los datos publicados hasta el año 2010 (247 paper y 18.300 casos), se consideraron 5 dominios cognitivos: memoria, función cognitiva global, lenguaje, funciones ejecutivas y atención. Se comparó el desempeño entre pacientes con diagnóstico de esquizofrenia y sujetos controles. Se encontró que en todos los dominios y frente a todos los análisis realizados para cada dominio, los pacientes mostraron una significativa reducción del desempeño cognitivo en comparación a los sujetos controles. Estos resultados confirman los hallazgos previos de que existiría un deterioro de varias funciones cognitivas en los sujetos diagnosticados con esquizofrenia al ser comparados con sujetos controles. 2.2 Sistema Nervioso Autónomo El Sistema Nervioso Autónomo (SNA) cumple una importante función de regulación sobre la actividad de muchos componentes somáticos, por ejemplo actividad cardiaca, intestinal, pupilar y cutánea. El estado de reposo está regulado básicamente por el sistema Parasimpático y el estado de alerta por el sistema Simpático. Dentro de las medidas del SNA se encuentran Reactividad Pupilar, Conductancia y Reactividad galvánica de la piel y Variabilidad de la Frecuencia Cardiaca (VFC). Este proyecto de investigación se centrará en el estudio del funcionamiento del SNA en sujetos afectado por esquizofrenia, utilizando la Reactividad Pupilar como marcador fisiológico durante una situación que se aproxima a condiciones naturales de funcionamiento. 7 2.2.1 Sistema Nervioso Autónomo en Esquizofrenia La Esquizofrenia se ha asociado a una disfunción autonómica, lo que podría aumentar la mortalidad cardiovascular. Se ha reportado ampliamente una mortalidad incrementada en personas con esquizofrenia en comparación a la población general. Esta mortalidad había sido atribuida a causas de muerte no naturales, como suicidio, accidentes u homicidios, sin embargo, durante los últimos años se ha mostrado un incremento en las causas naturales de muerte, siendo de origen cardiovascular en el 29% de los casos. Se ha visto que la regulación entre las diferentes ramas del SNA se encuentra alterada en esta entidad, lo que podría explicar una condición neurofisiológica basal que aumentaría el riesgo de complicaciones médicas [7]. Se ha mostrado que la disfunción autonómica en esquizofrenia no se limita solo al sistema cardiovascular. Existiría una desregulación autonómica a nivel pupilar y cardiaco en pacientes con diagnóstico de esquizofrenia. Mediante la evaluación de Variabilidad en la Frecuencia Cardiaca se ha encontrado una disminución en la modulación Parasimpática. Frente a la exposición de fotografías con expresiones faciales que representaban miedo e imágenes emocionalmente neutras, las respuestas de conductancia galvánica de la piel resultaron diferentes entre los sujetos con diagnóstico de esquizofrenia (Paranoide y No Paranoide) y los sujetos de control. Esta respuesta tuvo mayor amplitud en el grupo de sujetos con esquizofrenia que en el de controles, tanto frente a las imágenes que evocaban miedo, como para las imágenes emocionalmente neutras, sin una diferencia significativa entre ambos grupos. Dentro del grupo con diagnóstico de esquizofrenia, el subgrupo Paranoide presentó mayor amplitud frente a la exposición de imágenes que representaban miedo en comparación al subgrupo No Paranoide. En sujetos diagnosticados con esquizofrenia aguda, no medicados, el patrón respiratorio sería significativamente más lento y superficial que controles sanos. 8 2.3 Primeros Descubrimientos en Oculografía Las primeras observaciones del comportamiento ocular datan de inicios del siglo XIX. Ya en 1879 Louis Emile Javal observó en el movimiento ocular del ser humano al leer oraciones un fenómeno que hasta hoy en día se investiga (Figura 2.1): los movimientos sacádicos [8], que corresponden a movimientos rápidos realizados por el ojo, en donde se dirige el área especializada de la visión hacia una región que al parecer es planificada; una posible región de interés. Este comportamiento de lectura a simple vista no es un gran descubrimiento, ya que no es un mecanismo intrincado difícil de notar e incluso en el comportamiento de cada uno se puede percibir el actuar de las sacadas. Aun así existe un detalle importante en este fenómeno: al parecer es un movimiento planificado del ojo hacia una región, descrito como si el cerebro supiera de antemano que es una región de interés, lo cual no es trivial ya que se podría decir que existe un proceso cognitivo rápido, que califica una escena antes de procesarla de manera consiente; ¿Es este un proceso paralelo o secuencial? ¿Cómo, a qué y por qué se activa un movimiento sacádico? Estas fueron preguntas planteadas que no encontraron respuestas convincentes en esta época y que científicos enfocaron su tiempo en responderlas al ser preguntas que vinculaban un fenómeno sicológico a posibles procesos cognitivos de bajo nivel. En palabras simples: ser capaz de definir los subprocesos de la caja negra llamada cerebro observando manifestaciones fisiológicas desde afuera. 9 Figura 2.1: Comportamiento ocular humano en el contexto de lectura: Los ojos se mantienen fijos en un lugar y luego rápidamente se mueven hacia otra palabra en vez de hacer un seguimiento suave del texto. 2.4 Yarbus y el siglo XX Al llegar el siglo XX la tarea principal de esta disciplina era la de responder las preguntas que los experimentos de lectura del siglo pasado habían dejado, que se pueden resumir en: ¿Existe una relación entre el comportamiento de la fijación-sacada con las palabras y su significado cognitivo? Si se lograra responder esta pregunta se abriría un abanico de posibilidades para estudiar el cerebro desde afuera a través de la pupila como un claro marcador fisiológico de lo que ocurre a nivel neuronal, y si bien los científicos tuvieron la capacidad de ver el potencial a nivel investigativo que podría surgir, también pudieron reconocer el principal obstáculo en sus investigaciones: una herramienta para registro ocular de manera más sistemática y rigurosa era necesaria. Ocurrió entonces que uno de los primeros oculógrafos o Eye-Trackers, fue construido en esta época por Guy 10 Thomas Buswell, utilizando rayos de luz que eran reflejados en el ojo y luego grabados en una cinta de película [9], lo que permitió una observación sistemática en procesos de lectura y observación de imágenes. A mediados de siglo, Alfred L. Yarbus [10] logra una contribución importante a las investigaciones en comportamiento ocular de la época y sus resultados de patrones de búsqueda de información son referenciados hasta el día de hoy con mucha frecuencia. Lo que Yarbus logra con su experimento es demostrar que existe una componente independiente de la imagen en sí, que rige el patrón de búsqueda de información y que a la vez aquella búsqueda se ve reducida a ciertos objetos claves dentro de la imagen (Figura 2.2), por lo que no sería descabellado sugerir que al estudiar su comportamiento y frente a cuáles objetos se observa un grado de atracción se podría llegar a deducir el proceso cognitivo interno del sujeto. 2.5 Experimentos Recientes A partir de este periodo en adelante las metodologías y teorías que surgen de los oculógrafos aumentan y son expandidas de manera mucho más efectiva que antes. Una aseveración muy relevante fue formulada en 1980 por Just y Carpenter, llamada la Strong Eye-Mind Hypothesis [11]. Esta hipótesis argumenta que "no existe retraso entre lo que es fijado por la visión y lo que es procesado a nivel cognitivo". En caso de ser correcta esta hipótesis se puede asumir entonces que en el momento que un sujeto observa una palabra o una imagen, al mismo tiempo está pensando en ella a nivel cognitivo mientras dure la fijación en el objeto. Podemos notar que esta hipótesis es la base de la investigación con Eye-Tracking hoy en día, pues se asume que la medición de la máquina tiene relación directa con lo que se muestra al sujeto en un instante de tiempo. 11 Figura 2.2: ‘El viajero de Yarbus’ muestra las distintas tareas de búsqueda de información influyentes en el comportamiento ocular. En la década de 1980, la hipótesis de Just y Carpenter fue cuestionada en numerosas ocasiones debido al fenómeno de Covert Attention o atención encubierta, que se refiere a la capacidad de poner atención de manera extra-fovial, o en palabras simples, el poner atención a lo que no estamos enfocando. Si un sujeto practicara esta acción en un experimento entonces se tendría un estímulo y reacción asociado a algo incorrecto. En 1998, Hoffman hace un aporte en esta disyuntiva llegando al consenso de que la atención siempre se encuentra aproximadamente 100 a 250 milisegundos antes de la mirada, pero que al momento de tener la obtención en ese objeto, los ojos tenderían a moverse hacia esa fuente (al menos que el sujeto de manera consciente lo evite) [12]. Hoy en día existe un sinnúmero de experimentos utilizando la pupila como marcador fisiológico: Estudios de capacidades cognitivas, seguimientos de pacientes post-cirugía láser, realidad virtual, simuladores de conducción, entrenamiento avanzado en deportes, páginas web, marketing, etc. 12 2.6 Eye-Tracking El sistema Eye-Tracker (Figura 2.3) es un video-oculógrafo que registra, a través de una cámara infrarroja, el comportamiento ocular y pupilar de un individuo. Entre los datos registrados, se encuentra el punto de observación (donde una persona mira en el espacio) y los movimientos de este punto en el tiempo, donde generalmente se proyecta la posición del ojo a un plano en frente del sujeto, ya sea en dos o tres dimensiones, como también la dinámica natural de la pupila. Un Eye-Tracker por lo tanto, es un dispositivo hardware y software que registra la posición de la visión a la vez que es capaz de registrar otras variables como la velocidad, tamaño pupilar (área o diámetro), etc. A lo largo de la historia, los Eye-Tracker han ido evolucionando de la mano de las investigaciones de neurociencia, que demanda cada vez una mayor precisión en la medición de variables y una mayor portabilidad para experimentos que se asemejan, poco a poco, a cómo nos comportamos en la realidad. Figura 2.3: A la izquierda se ubica el EyeLink 1000 y a la derecha el EyeLink I. Se puede ver que el modelo I tiene la ventaja de tener las cámaras más cerca de la pupila pero no permite utilizar EyeTracker y electro encefalograma (EEG). Ambos modelos tienen el desempeño suficiente para ser usados en contexto de investigación. 13 2.7 Estudios Señal Pupilar Los últimos estudios que se han llevado a cabo tienen mucha mayor precisión que los primeros experimentos realizados en los años 60, esto principalmente debido a los nuevos equipos disponibles. Uno de estos últimos experimentos es el de Canver [13], quien registró el patrón pupilar y estableció los significados estadísticos a la curva resultante. Se determinó que entre los aspectos más comunes existía un patrón en la forma de la curva. Ésta estaba dada por una contracción pupilar seguida de una dilatación, la que siempre se manifestaba después de la aparición del estímulo (Figura 2.4). La latencia de esta contracción se encuentra habitualmente entre los 500 a 1000 milisegundo. Figura 2.4: Aspectos en el patrón de la reactividad pupilar registrados por Canver. Destacan las características significativas como la contracción, dilatación y el cálculo y registro de las velocidades de estas. 14 El tratamiento de la señal de la pupila evolucionó naturalmente en un procesamiento y filtrado más complejo, principalmente debido al uso que se le ha comenzado a dar. A pesar de esto, los mayores esfuerzos y la costumbre o el consenso se basan en la búsqueda de una manera de tratar la ausencia de datos causada por parpadear u otras menos evidentes como la compensación necesaria debido a la generada por los movimientos sacádicos en la señal. Un ejemplo de cómo se ha empezado a trabajar en la señal se aprecia en el trabajo de P. Ren [14], el cual aplica en primea instancia un filtro wavelet para posteriormente procesar la señal a través de un filtro de Kalman (Figura 2.5). Figura 2.5: Experimento y registro de la pupila. Procesamiento por filtrado wavelet y por filtrado de Kalman. Trabajo de P. Ren. 15 2.8 Reactividad Pupilar como Marcador Fisiológico Desde hace varias décadas las Reactividad Pupilar ha sido considerada como un método de aproximación directa a las funciones autonómicas asociadas a procesos mentales. El estado pupilar representa un equilibrio entre el tono del sistema pupiloconstrictor parasimpático y pupilo-dilatador simpático. La respuesta pupilar a la luz consiste principalmente en la contracción de la pupila en respuesta al aumento de la luminancia en el ambiente. La más importante función natural de la pupila es responder dinámicamente a los cambios en la luminancia ambiental en humanos con una constricción inicial que es relacionada al estímulo luminoso. La contracción pupilar en respuesta a la luz es secundaria a la acción de células del ganglio retiniano. Estas células a su vez inervan las células del ganglio ciliar, que controla el esfínter de la pupila. La dilatación pupilar está regulada por una vía descendente desde el hipotálamo. Esta vía se proyecta por el lado externo del tronco encefálico hasta las neuronas preganglionares simpáticas de los tres primeros segmentos de la columna cervical. Estas células envían proyecciones al ganglio cervical superior, a partir del cual los axones simpáticos discurren a lo largo de la arteria carótida hasta la órbita inervando el músculo dilatador de la pupila. De esta manera, la reactividad pupilar refleja el funcionamiento diferenciado y coordinado de los sistemas simpático y parasimpático, aproximándose así al funcionamiento del sistema central. La variación del diámetro pupilar ha sido un parámetro utilizado en investigación, se han descrito varias características de la variación del diámetro que describen la respuesta pupilar al procesamiento cognitivo y emocional de un estímulo [15]. La respuesta pupilar no sólo es reflejo de la reactividad a los cambios de luminancia, también es un índice de la actividad del sistema nervioso cuando se realiza tanto el procesamiento cognitivo como el procesamiento emocional de un estímulo, considerándose de esta forma como un marcador psicofisiológico válido para el estudio de estados cognitivos, emocionales y sus correlatos neuronales. 16 Para entender cómo se relaciona esta métrica con el funcionamiento central cabe señalar que existe una relación entre el nivel de activación central (Arousal) y la actividad del SNA. A nivel pupilar existe un estado tónico o estable que determina el tamaño pupilar en reposo y otro que es indicador del estado de alerta del organismo. Existen cambios físicos en el estado pupilar, los que se asocian a la presentación de estímulos, siendo estos por lo tanto considerados como marcadores de estados cognitivos o emocionales. Respecto a respuesta pupilar y procesamiento cognitivo, Lowenstein ya en 1920 relaciona el diámetro pupilar con procesos atencionales. La magnitud de la dilatación pupilar reflejaría la carga de trabajo y la atención requerida durante la realización de la tarea [16]. El diámetro pupilar también tiende a incrementar durante decisiones exploratorias [17]. En cuanto a procesamiento emocional una de las tareas más utilizadas se centra en la presentación de fotografías seleccionadas del International Affective Picture System (IAPS). El diámetro pupilar aumenta al procesar estímulos emocionales. Existen diferencias en cuanto a magnitud y curso temporal de la dinámica pupilar entre sujetos meditadores y controles al ser expuestos a las imágenes del IAPS, evidenciándose una menor contracción pupilar y una mayor dilatación pupilar frente a imágenes negativas, junto con una menor velocidad de respuesta para las imágenes con valencia negativa. En relación al tono hedónico de sujetos de población general, la respuesta pupilar mostró diferencias estadísticamente significativas de los parámetros pupilares entre la respuesta frente a estímulos de valencia positiva versus negativa, y entre éstas dos versus las respuestas a estímulos neutros. Las diferencias se observaron durante la contracción y la dilatación pupilar [18] (Figura 2.6). 17 Figura 2.6: Curvas promedio de variaciones del diámetro pupilar en respuesta a imágenes de valencia negativa, positiva y neutra en 30 sujetos. Las curvas de respuesta pupilar muestran diferencias entre los estímulos con diferente valencia emocional, entre éstos y el “ruido rosa” (imagen en todo gris sin contenido presentada después de los 4000 ms). El tiempo 0 corresponde a la presentación del estímulo emocional. Actualmente se encuentran disponibles sofisticados video-oculógrafos infrarrojos que entregan un registro continuo de la dinámica pupilar durante la ejecución de tareas. Esta técnica nos permite obtener una métrica precisa del funcionamiento del SNA. Por lo tanto, la reactividad pupilar, medida por las variaciones de su diámetro, es considerada como una herramienta válida, de acceso fácil y rápido a la actividad del SNA en respuesta a estímulos físicos y psicológicos. Puede resultar entonces de especial interés evaluar dicha respuesta en sujetos con antecedentes reportados previamente de dificultades en el procesamiento cognitivo, emocional y alteraciones psicomotoras, como es el caso de la Esquizofrenia, para así aproximarnos a los mecanismos autonómicos de base de la patología en cuestión. En general, los esfuerzos de investigación se han centrado en evaluar la reactividad pupilar en relación a aspectos específicos del procesamiento cognitivo. No se han realizado estudios en relación a una situación que intente integrar distintas funciones. Un modelo 18 integrativo de funciones cognitivas es el paradigma de Visión Libre de Imágenes Naturales. 2.8.1 Reactividad Pupilar en Esquizofrenia, Resultados Previos Existe información contradictoria al respecto. Por una parte se ha encontrado un aumento significativo del diámetro pupilar en sujetos con diagnóstico de esquizofrenia no medicados versus un grupo control al evaluar reflejo pupilar a la luz. Existiría una disminución de la modulación Parasimpática y un aumento en la modulación Simpática. Cortas latencias de contracción pupilar fueron asociadas a severidad de los síntomas. Sin embargo, también existen reportes de un menor diámetro pupilar en sujetos afectados por esquizofrenia durante la realización de una tarea que intentaba evaluar la relación entre atención y alteraciones del pensamiento. La dilatación pupilar fue similar a la de sujetos controles durante las tareas de simple desempeño, pero las diferencias descritas fueron encontradas durante las tareas que requerían mayor esfuerzo cognitivo. Se han evaluado respuestas pupilares durante tareas de enmascaramiento, como medida de evaluación de procesos atencionales. Esto permitió diferenciar dos subgrupos de respuestas, uno con respuesta Pupilar Normal y otro con respuesta Pupilar disminuida [19]. Es de destacar que en las investigaciones mencionadas existen varias condiciones experimentales desventajosas, por ejemplo, la evaluación de reflejo pupilar a luz, tasas de muestreo de 60 Hz, registros monoculares, evaluación en unidades de medida y no en unidades normalizadas y mediciones pupilares durante tareas que involucraban distintas funciones cognitivas en forma simultánea, sin una clara integración entre ellas. 19 2.9 Análisis de Frecuencia Un filtro es un dispositivo o proceso que elimina de una señal las componentes o características no deseadas que se encuentran en esta. Así, el filtrado es una clase de procesamiento de señales y se caracteriza por suprimir la totalidad o parcialmente algún aspecto de la señal. Lo más común es la eliminación de algunas frecuencias específico dentro del espectro de frecuencias de la señal, principalmente las frecuencias asociadas a los ruidos, que pueden ser de diferentes orígenes, y la de señales de interferencia. Los tipos de filtros se pueden clasificar de muchas formas, pero las más destacadas son las siguientes: Lineal o no lineal. Invariante en el tiempo o variable en el tiempo. Si el filtro opera en un dominio espacial, entonces se habla de invariante en el espacio. Causal o no-causal. Un filtro causal es uno en donde la salida depende únicamente de las entradas en el mismo tiempo o de tiempos anteriores. Los filtros no causales, donde la salida depende de las entradas futuras son irrealizables en la práctica. Analógico o digital. En tiempo discreto (muestras) o de tiempo continuo. Pasivo o activo. Un filtro pasivo, en electrónica, es un filtro que se compone solo de elementos pasivos (resistencias, inductancias y capacitadores), mientras que los activos se conforman por al menos un elemento activo como los transistores. Respuesta de impulso infinito (IIR de su sigla en inglés) o respuesta de impulso finito (FIR por su sigla en inglés). Filtros normalmente digitales. 2.9.1 Filtros Lineales de Tiempo Continuo Un filtro lineal de tiempo continuo es quizás uno de los filtros más comunes y mayormente usados en el mundo del procesamiento de señales. Esta clase de circuitos están diseñados para eliminar frecuencias específicas y permitir por el otro lado que las 20 demás frecuencias si pasen distorsionándose lo menos posible. Los circuitos que están encargados de esta función son generalmente de respuestas lineales o aproximadamente lineales, y de presentarse cualquier no-linealidad, esta normalmente origina frecuencias en la señal salida que no estaban presentes en la señal entrada. Algunas familias de filtros importantes diseñados de esta manera son (Figura 2.7): Filtro de Chebyshev. Tiene la mejor aproximación a la respuesta ideal de cualquier filtro para un orden y rizado específico. Filtro de Butterworth. Tiene una respuesta de frecuencia plana máximo. Filtro de Bessel. Tiene un retraso de fase plana máximo. Filtro Elíptico. Tiene el punto de corte más empinado que cualquier filtro para un determinado el orden y rizado. La diferencia entre estas familias de filtros, es que todos ellos usan una función polinomial diferente para aproximar la respuesta del filtro ideal. Esto da lugar a que cada filtro tenga una función de transferencia diferente. 2.10Prueba t de Student Un t-test es cualquier test de hipótesis estadística en el que el test estadístico sigue una distribución t de Stundent si se admite la hipótesis nula. Se puede utilizar para determinar si dos conjuntos de datos son significativamente diferentes el uno del otro, y se aplica más comúnmente cuando el test estadístico seguiría una distribución normal, si el valor de un parámetro de escala en el test estadístico se conoce. Cuando el parámetro de escala es desconocido y se sustituye por una estimación basada en los datos, el test estadístico (bajo ciertas condiciones) sigue una distribución “Stundent’s t”. La mayoría de los t-test estadísticos tienen la forma 𝑡 = 𝑍/𝑠, donde 𝑍 y 𝑠 son funciones de los datos. Típicamente, 𝑍 está diseñado para ser sensible a la hipótesis 21 alternativa (es decir, su magnitud tiende a ser mayor cuando la hipótesis alternativa es verdadera), mientras que 𝑠 es un parámetro de escala que permite la distribución de t sea determinada. Figura 2.7: Las funciones de transferencia de filtros polinomiales de quinto orden. El filtro de Butterworth es ideal para evitar el rizado, pero tiene la respuesta de corte más lenta. Como ejemplo, en la una muestra de t-test 𝑡 = 𝑋̅/(𝑠/√𝑛), donde 𝑋̅ es la media de la muestra de los datos, 𝑛 es el tamaño de la muestra, y 𝑠 es la la desviación estándar muestral. 𝜎̂ es la desviación estándar de la población de datos. Los supuestos que subyacen a una prueba t son las siguientes: 𝑍 sigue una distribución normal estándar bajo la hipótesis nula. 𝑆² sigue una 𝜒² de distribución con 𝑝 grados de libertad bajo la hipótesis nula, donde 𝑝 es una constante positiva. 𝑍 y 𝑠 son independientes. 22 En un tipo específico de t-test, estas condiciones son consecuencias de la población en estudio y de la manera en que los datos son muestreados. Por ejemplo, en el t-test comparando las medias de dos muestras independientes, los siguientes supuestos se deben cumplir: Cada una de las dos poblaciones que se comparan deben seguir una distribución normal. Esto se puede comprobar mediante un test de normalidad, como el test de Shapiro-Wilk o Kolmogorov-Smirnov. Si se utiliza la definición original de Student del t-test, las dos poblaciones comparadas deberán tener la misma varianza (comprobable utilizando F-test, el test de Levene, el test de Bartlett, o el test de Brown-Forsythe; o evaluable gráficamente utilizando un plot Q-Q). Si los tamaños de las muestras en los dos grupos comparados son iguales, el t-test original de Student es muy robusto a la presencia de varianzas desiguales [20]. El t-test de Welch es insensible a la igualdad de las varianzas independientemente de si los tamaños de muestra son similares. Los datos utilizados para llevar a cabo el test deben ser muestreados de forma independiente de las dos poblaciones que se comparan. Esto, en general, no es testeable a partir de los datos, pero de saber que los datos son muestreados de forma dependiente (es decir, si se muestrearon en racimos), entonces los clásicos t-test discutidos aquí pueden dar resultados engañosos. Figura 2.8: Ejemplo de una distribución t de Student. 23 2.11 Redes Neuronales Artificiales Mediante el ajuste adecuado de cierto parámetros, llamados pesos sinápticos, las RNA (reden neuronales artificiales) aprenden el comportamiento de los datos y lo generalizan para tomar decisiones ante situaciones conocidas e incluso desconocidas. Nótese que se usa la palabra aprenden y no memorizan, debido a que las RNA necesitan un tipo de aprendizaje para lograr los resultados esperados. Las RNA poseen una reconocida eficiencia en problemas con relaciones no lineales inmiscuidas [21]. Por otra parte, las redes neuronales no son capaces de reconocer fenómenos que no tengan algún tipo de patrón o relación inherente; no pueden predecir, por ejemplo, la lotería que es un proceso al azar. El gran auge de las RNA se refleja en el considerable número de publicaciones y congresos dedicados exclusivamente a ellas. Entre las publicaciones más importantes dedicadas a su estudio están: Neural Computation, Neural Networks, Connection Science, Intl. Journal of Neural systems; además de otras publicaciones que le dedican a las redes importantes espacios: Artificial Intelligence, Pattern Recognition e IEEE Transactions on Systems, entre otras. 2.11.1 Modelo de una Red Neuronal Artificial Una RNA es un modelo matemático obtenido a partir de un arreglo de elementos, llamados neuronas, interconectados entre sí, que posee la capacidad de almacenar conocimiento en su interior, que emula a las redes neuronales biológicas y la forma como las personas realizan el proceso de aprendizaje. La Figura 2.9 presenta el esquema de una neurona artificial y su analogía con la biológica. Se observan las entradas provenientes de otras neuronas o estímulos externos. Los pesos sinápticos indican la fuerza de la conexión entre las entradas y las dendritas de la neurona. El punto de suma, que hace las veces del cuerpo celular, tiene como función acumular todas las señales recibidas. La llamada función de activación o transformación, 24 determina el estado inhibitorio o exitatorio de la neurona. Por último, la salida, análoga al axón, es la encargada de transmitir las señales de la neurona activada a otras neuronas. Figura 2.9: Esquema de las partes de una neurona artificial De allí, se puede inferir que el modelo matemático de una neurona artificial es: 𝑝 𝑛 = ∑ 𝜔𝑗 𝑥𝑗 (1) 𝑗=1 Donde 𝜔𝑗 representa el peso sináptico de la j-ésima entrada (𝑥𝑗 ). La salida de la neurona depende de la función de transformación empleada (𝐹(𝑛) ). Debido a que una sola neurona sólo es capaz de resolver problemas linealmente separables, se han ideado estructuras compuestas por un grupo de neuronas artificiales, cada una con una forma como la señalada anteriormente, y es a ese arreglo de neuronas lo que se le conoce como RNA. En la Figura 2.10 se muestra un arreglo de neuronas artificiales; para simplificar, cada elemento enumerado representa una neurona artificial. Está formada por una capa de entrada (con 7 neuronas), una de salida (con 3 neuronas) y una sola capa oculta (con 10 neuronas). Las RNA pueden tener tantas capas ocultas como se desee, al igual que el número de neuronas en cada capa oculta. No existen reglas para la determinación del número de capas y de neuronas en cada una de ellas, esta elección debe hacerse de forma empírica y en base a los resultados que arroje cada arquitectura. 25 Figura 2.10: Estructura típica de una Red Neuronal Artificial Multicapa. El modelo se modifica, ya que ahora existen salidas para cada neurona: 𝑝 𝑛𝑖 = ∑ 𝜔𝑖𝑗 𝑥𝑗 (2) 𝑗=1 Donde 𝑛𝑖 corresponde a la salida de la i-ésima neurona y 𝜔𝑖𝑗 representa el peso para la j-ésima entrada (𝑥𝑗 ) de la i-ésima neurona. Esta fórmula es conocida como la regla de propagación. 2.11.2 Funciones de Activación El resultado de la regla de propagación (𝑛𝑖 ) es un valor escalar, comúnmente conocido como umbral. A partir de este umbral y mediante una función de transformación, la neurona modifica este valor escalar para generar su salida (𝑎𝑖 ). En los inicios las RNA eran empleadas para proporcionar salidas cuyos valores eran 0 ó 1, que representan muy bien a una gran cantidad de fenómenos (alto/bajo, cierto/falso, bueno/malo, encendido/apagado entre otro). Por esto, anteriormente estas funciones que modifican la regla de propagación se les solía llamar función de activación, ya que dependiendo del valor de 𝑛𝑖 , la función permitía determinar si la neurona estaba activa o 26 no, es decir, cuándo se supera el umbral para pasar de estado inhibido a excitado. Sin embargo, hoy en día el uso de la función representa mucho más que este tipo de fenómenos y es más común hablar de función de transformación, aunque el de activación siga siendo empleado. Las funciones de activación más empleadas son: Función Escalón o Signo Acotada 1 ⇔ 𝑛𝑖 ≥ 0 𝑓(𝑛𝑖 )= { 0 ⇔ 𝑛𝑖 < 0 Función Lineal 𝑓(𝑛𝑖 ) = 𝑛𝑖 −1 ⇔ 𝑛𝑖 < −1 = {0 ⇔ −1 ≤ 𝑛𝑖 < 1 1 ⇔ 𝑛𝑖 ≥ 1 (5) 1 1 + 𝑒 𝜆𝑛𝑖 (6) 1 − 𝑒 𝜆𝑛𝑖 = 1 + 𝑒 𝜆𝑛𝑖 (7) Función Sigmoide o Logística 𝑓(𝑛𝑖 ) = (4) Función Lineal por Tramos 𝑓(𝑛𝑖 ) (3) Función Tangente Hiperbólica 𝑓(𝑛𝑖 ) 2.11.3 RNA con Aprendizaje Supervisado Ciertos tipos de RNA generan sus propias “reglas” para asociar las respuestas a sus entradas, es decir, aprenden por ejemplos y de sus propios errores. Para ello deben contar con un conjunto de datos de entradas con sus respectivas salidas deseadas. Bajo este enfoque, el entrenamiento de la red consiste en modificar los pesos sinápticos hasta que se alcance un error considerado bajo; el error representa una medida de la diferencia entre lo arrojado por el modelo y el valor deseado. El hecho de conocer las salidas deseadas implica que el entrenamiento se realiza bajo la supervisión de éstas, ya que el proceso de ajuste de los pesos es controlado por este error. 27 El esquema bajo el que trabaja esta perspectiva se muestra en la Figura 2.11, donde puede observarse que el algoritmo de entrenamiento no sólo recibe las salidas del modelo en una iteración cualquiera, sino también los valores supervisores, en este caso, las salidas deseadas correspondientes. Figura 2.11: Esquema del aprendizaje supervisado en una Red Neuronal Artificial. 2.11.4 Validación de Modelos de RNA En las RNA con algoritmos de aprendizaje supervisado, una vez que la red es entrenada y se conoce el valor de los pesos, puede generar predicciones de las salidas proporcionándole entradas. Sin embargo, es posible validar previamente el modelo o someterlo a una fase de prueba, para demostrar que realmente es fiable para datos distintos a los que le fueron suministrados durante la fase de entrenamiento. Se dividen los datos iniciales en dos grupos: el conjunto o patrones de entrenamiento y el conjunto o patrones de prueba. Los primeros se le proporcionan al algoritmo que modifica los pesos, de tal forma que minimice el error entre la salida deseada de estos datos y la proporcionada por la red. El segundo grupo, los patrones de prueba, se reservan 28 para probar el modelo obtenido con datos que no han sido suministrados durante el proceso de entrenamiento. Aunque algunos autores recomiendan un porcentaje de datos de entrenamiento de entre el 70 y el 90% de los datos disponibles, la proporción de datos de entrenamiento y validación depende en buena medida de la cantidad y calidad de los datos disponibles. Si se cuenta con muy pocos datos, quizás no se puedan reservar muchos para validar el modelo, y por el contrario, si se cuenta con una buena cantidad, tal vez no sea necesario utilizar un gran porcentaje de ellos para construir los modelos, porque probablemente un porcentaje menor sea suficiente. 2.11.5 Validación de Modelos de RNA Existen varias medidas empleadas para evaluar la diferencia entre las salidas proporcionadas por el modelo y las deseadas. Una de las más usadas es conocida como el Error Cuadrático Medio (ECM). Sea 𝑛 el número de patrones de entrenamiento, 𝑞 el número de salidas y donde 𝑌𝑖𝑗 represente la salida deseada de la i-ésima neurona para el j-ésimo patrón y 𝑎𝑖𝑗 el valor arrojado por el modelo de la i-ésima neurona para el j-ésimo patrón, el error cuadrático medio del entrenamiento es: 𝐸𝐶𝑀𝑒𝑛𝑡 = ∑𝑛𝑖=1 ∑𝑞𝑗=1(𝑌𝑗𝑖 − 𝑎𝑗𝑖 ) 2 (8) 𝑛𝑞 Análogamente, siendo 𝑟 el número de patrones de prueba, el error de validación o prueba es: 𝐸𝐶𝑀𝑝𝑟𝑢𝑒 = ∑𝑟𝑖=1 ∑𝑞𝑗=1(𝑌𝑗𝑖 − 𝑎𝑗𝑖 ) 𝑟𝑞 2 (9) Algunas veces en el proceso de minimización del error (entrenamiento), se omiten los denominadores, ya que son valores constantes. 29 2.11.6 Algoritmos de Entrenamiento Supervisado Para las RNA con aprendizaje supervisado, el objetivo es ajustar los pesos minimizando la diferencia entre el valor arrojado y el valor esperado, es decir, el error de entrenamiento. Este grupo de algoritmos son conocidos como algoritmos supervisados y representan sólo una parte de estos procedimientos que sirven para realizar el proceso de ajuste de los pesos. Los pesos iniciales se eligen aleatoriamente y este proceso de cambio permite obtener un modelo que guarde en su interior el patrón que siguen los datos. Para las redes multicapa de conexión hacia adelante, el algoritmo supervisado base para el desarrollo de buena parte de los procedimientos es conocido como Algoritmo de Retropropagación (Backpropagation). Aunque el inicio del desarrollo de las RNA ocurrió en la década de los 50, fue realmente con la aparición de este método, a mediados de los años 80, cuando comenzaron a dar resultados realmente llamativos y se produjo el auge importante en torno a ellas. La filosofía del Backpropagation es tan eficiente, que actualmente las técnicas más empleadas son modificaciones provenientes del Backpropagation original desarrollado por David Rumelhart, Geoffrey Hinton y Ronal Williams, David Parker y Yann LeCun [22]. El nombre Retropropagación proviene de la forma cómo se calculan los pesos, ya que se comienza por ajustar los de la capa de salida y de allí se propagan los cambios realizados hacia la capa de entrada, ajustando los pesos de las capas ocultas. Al principio, cada patrón de entrenamiento se propaga hacia adelante a través de la red y sus parámetros para producir una respuesta en la capa de salida, la cual se compara con las salidas deseadas para calcular el error de entrenamiento; este error marca el camino más adecuado para la actualización de los pesos, que se realiza propagando hacia atrás los valores ya calculados. El Backpropagation es un algoritmo iterativo, es decir se espera que en cada iteración se vaya aproximando más al mínimo de la función de error. Al final del entrenamiento produce una respuesta satisfactoria a todos los patrones de entrenamiento, que se logra minimizando el error cuadrático medio en cada iteración del proceso de aprendizaje. 30 Se han desarrollado numerosas variaciones con el propósito de mejorar la velocidad y la calidad del proceso de entrenamiento de las redes, muchas de ellas tomando como base al Backpropagation. Entre ellas destacan: Algoritmo de Entrenamiento de Retropropagación por descenso del gradiente. Retropropagación por descenso del gradiente y factor de momentum. Retropropagación por descenso del gradiente, momentum y tasa de aprendizaje adaptativa. Retropropagación por gradientes conjugados. Retropropagación de Newton y Cuasi-Newton. Retropropagación de Levenberg-Marquardt. 31 Capítulo 3 Implementación Este capítulo abordará dos tópicos sumamente importantes, en los cuales se concentró la mayor parte del trabajo de esta memoria. Para esto dos pruebas que se pusieron en marcha, por un lado se tiene el experimento físico necesario para recabar datos de la conducta pupila. Sobre este se hablará de la motivación que llevó su desarrollo como todas las características específicas de sí mismo. Por el otro lado se encuentra el enfoque en el análisis computacional de los datos. Para realizar este trabajo, y debido también a que sobre esta tarea se encontraba el mayor interés del laboratorio de investigación de Neurosistemas, se realizó un Toolbox computacional de alrededor de 60 clases distintas y 3000 líneas de código, necesarias para poder adquirir, procesar y analizar los datos obtenidos del experimento anterior. Es importante señalar que la memoria está enfocada principalmente a la diferenciación de sujetos mediantes su comportamiento pupilar, y la elaboración con su respectiva puesta en marcha del Toolbox computacional, queda situada como una implementación necesaria, y por esto no se hablará a fondo de la totalidad de ésta, a pesar de que gran parte del trabajo consistió en su construcción. 32 3.1 Experimento Para cumplir de manera satisfactoria los objetivos de esta memoria, se hizo imprescindible contar con una base de datos lo suficientemente amplia la cual genere los datos necesarios en la construcción final de los sistemas inteligentes. Esto se logró con un experimento que se realizó a distintos sujetos desde Agosto del 2011 hasta Marzo del 2014. Este experimento contó, finalmente, con la participación de un total de 19 pacientes diagnosticados con esquizofrenia y con 13 sujetos sin diagnóstico, ni indicios de sufrir alguna enfermedad psiquiátrica, los cuales serán considerados como sujetos de control. 3.1.1 Comité de Ética El inicio de esta investigación se enmarca dentro del proyecto (028-2011) aprobado por el comité de ética de la Facultad de Medicina de la Universidad de Chile con fecha 29 de Junio del 2012. Todos los participantes fueron informados verbalmente sobre el proceso al cual fueron sometidos y debieron firmar previamente el documento de consentimiento informado que contiene información detallada acerca del estudio. Se complementó la información verbalmente por parte del investigador previo al registro. Se informó acerca de la posibilidad de suspender el registro en caso que el sujeto lo solicite. 3.1.2 Universo Muestral Como se mencionó en un comienzo, el total de sujetos a los cuales se les aplicó el experimento consistió en 19 pacientes con diagnóstico de esquizofrenia, y 13 sujetos de control. Estos sujetos se caracterizaron por edad y género, y además los pacientes con diagnóstico de esquizofrenia se separaron en grupos por los psicofármacos que ingerían actualmente. Todos los datos relacionados con información privada e indiferente al 33 proyecto, ya sea nombre o RUT no se utilizó manteniendo así la confidencialidad del paciente. Inevitablemente del espacio muestral completo surgieron individuos los cuales presentaban un comportamiento errático con respecto a los demás. En primera instancia estos pudieron haberse considerado dentro de la aleatoriedad de la muestra y de los individuos, pero al estudiarlos a fondo estos no presentaban ningún patrón establecido, lo cual puede deberse a problemas con la calibración de las máquinas de registro. A pesar de estas suposiciones se realizaron medidas tales como el promedio de la señal o la cantidad de singularidades (pestañeos o movimientos erráticos), y debido a que estos sujetos se escapaban de las medias universales de estos parámetros en más de dos desviaciones estándar, se procedió a su segregación. Como este experimento ser realizó a lo largo de dos años, más de un investigador realizó controló los experimentos, y debido a esto existen sujetos cuyos datos no fueron ingresados correctamente y por lo tanto faltaban datos cruciales y no podían ser leídos por el Toolbox. Finalmente, el número de pacientes con diagnóstico de esquizofrenia disminuyo de 19 a 13, y de los sujetos de control disminuyó de 11 a 9. Para mantener una distribución homogénea se tomaron 9 sujetos de los 13 con esquizofrenia, de modo que los rangos de edad sean lo más cercanos a los sujetos de control, y así se determinaron 9 registros para cada grupo. 3.1.3 Condiciones de Registros El registro tenía como objetivo evaluar la conducta neurofisiológicas de los sujetos y pacientes, esto a través de la pupilometría y un electro encefalograma (EEG). Este procedimiento se realizó en una sala aislada y equipada especialmente para los registros, ubicada físicamente en el Laboratorio de Neurosistemas perteneciente al Programa de Fisiología y Biofísica de la Facultad de Medicina de la Universidad de Chile. 34 3.1.4 Registro Pupilar El registro de la actividad pupilar se efectuó mediante un video-oculógrafo, también conocido como sistema Eye-Tracker, del cual se habló en el capítulo anterior. El modelo utilizado fue el EyeLink 1000 de SR Research (Figura 3.1). Este sistema consiste en una cámara infrarroja de video, colocada en frente del sujeto, que permite el registro de la dinámica pupilar en forma mono y/o binocular, con distintas tasas de muestreo. Para esta investigación se estableció en 500 Hz (1 registro cada 2 milisegundos). Figura 3.1: Esquema sistema Eye-Tracker, modelo EyeLink 1000. Fuente: SR Research El objetivo principal de este estudio consistió en registrar de manera continua la dinámica de cambio pupilar durante la exploración visual libre del set de imágenes seleccionado. Se realizó una calibración del Eye-Tracker previa a la presentación de la secuencia de imágenes al iniciar cada registro. El procedimiento de calibración se repitió durante el registro, interrumpiéndose este durante el tiempo que demore la calibración. 35 3.1.5 Imágenes Naturales con diferente Complejidad Visual Se evaluó a los sujetos sentados frente a un monitor de 21 pulgadas ubicado a 70 cm de distancia. Se les presentó un set de 70 imágenes, en escala de grises, correspondientes a siete categorías diferentes: Ambiente Urbano; Ambiente Natural; Fractal; Ruido Rosa; Ruido blanco; Gris; Negro (Figura 3.2). Figura 3.2: Tipos de Imágenes mostradas en el experimento. (a) Ambiente Urbano; (b) Ambiente Natural; (c) Fractal; (d) Ruido Rosa; (e) Ruido Blanco; (f) Gris; (g) Negro Se presentaron 10 imágenes distintas por cada una de estas categorías. Cada una de las imágenes fue presentada durante 4 segundos en orden aleatorio para cada sujeto. Las categorías descritas fueron presentadas en orden decreciente de complejidad visual, la que está determinada por el poder espectral de su frecuencia espacial [23]. Se les entregó la instrucción de explorar visual y libremente cada una de las imágenes. Para evitar la influencia de los cambios de luminancia en la reactividad pupilar, en un comienzo se ideó controlar cada una de las imágenes pero no se realizó debido a que este ruido podía eliminarse fácilmente en etapas posteriores normalizando por z-score. La resolución del set de imágenes presentado es de 1024x768. Luego del tiempo de presentación de las imágenes (4 segundos) se visualizó un punto de calibración central que 36 consistía en una imagen completamente negra con un punto color rojo en el centro, y se dio la instrucción de fijar la mirada en el punto y luego presionar el joystick para la presentación de la imagen siguiente. En la Figura 3.3 se muestra un esquema del experimento completo. Figura 3.3: Esquema que representa las distintas etapas del experimento desde el despliegue de este, la adquisición y el procesamiento de los datos obtenidos. 37 3.2 Toolbox Luego de la etapa de registros, a través del sistema EyeLink, se obtuvo un archivo en formato ASCII con los datos de este. Ya que el comportamiento ocular fue registrado con una tasa de muestreo de 500 Hz, vale decir, 500 muestras por segundo y con experimentos de alrededor de 10 minutos de duración, estos archivos llegaban a contener del orden de 250 mil a 300 mil líneas de datos. Para lograr trabajar de forma clara y ordenada, se debió crear un conjunto de herramientas computacionales que lograsen optimizar y generalizar la adquisición y extracción de los datos provenientes de los archivos ASCII, no solo para este proyecto, sino para los proyectos en general dentro del laboratorio del Neurosistemas de donde es parte este trabajo e investigación. Con lo anterior en mente, se generó un Toolbox completamente funcional el cual contiene más 60 clases distintas y más de 3000 líneas de código. Hasta la fecha no se descarta seguir ampliando y mejorando el Toolbox. El Toolbox se creó usando el software MATLAB versión 2014b. Para entender su estructura, este se puede separar en 3 conjuntos de funciones, o 3 bloques por los que deben pasar los datos provenientes de los registros. El esquema se aprecia en la Figura 3.4. Figura 3.4: Diagrama de bloques del Toolbox que muestra las etapas necesarias en el procesamiento de los datos. 38 3.2.1 Extracción El principal desafío en la etapa de extracción era que a partir del archivo ASCII se debía reconocer, diferenciar y rescatar de manera óptima los valores buscados (datos), en este caso el comportamiento pupilar. Este archivo no era necesariamente igual para cada experimento realizado, por tanto el Toolbox debía ser lo suficientemente robusto para lograr diferenciar y actuar de forma correcta antes los distintos escenarios. En el archivo ASCII se pueden diferenciar al menos dos secciones, primero se encuentran los datos relacionados con el software y hardware que registraron el experimento, en este caso el sistema Eye-Tracker llamado EyeLink, y a continuación una serie de líneas con los datos crudos del registro. En la Figura 3.5 y 3.6 se pueden apreciar estas secciones para el caso del sujeto as170712. Figura 3.5: Extracto del archivo ASCII del sujeto as170712. Se puede apreciar que los primeros valores corresponden a datos logísticos tales como la fecha, la localización del archivo resultante, y valores referentes a la versión y modelo del dispositivo. 39 Figura 3.6: Extracto del archivo ASCII del sujeto as170712 de la línea 48669 a la 48686. Se puede apreciar que en este punto del archivo se encuentra por columnas los valores referentes a posiciones oculares como al tamaño de la dilatación para ambos ojos. Los datos crudos separados por columnas que se obtienen, específicamente para este experimento (recordar que según cada investigador esto puede variar) se muestran en la siguiente tabla. Columna Tipo de dato Columna 1 Tiempo en milisegundos Columna 2 Posición en eje X del ojo izquierdo Columna 3 Posición en eje Y del ojo izquierdo Columna 4 Dilatación pupilar del ojo izquierdo Columna 5 Posición en eje X del ojo derecho Columna 6 Posición en eje Y del ojo derecho Columna 7 Dilatación pupilar del ojo derecho Columna 8 Velocidad en eje X del ojo izquierdo Columna 9 Velocidad en eje Y del ojo izquierdo Columna 10 Velocidad en eje X del ojo derecho Columna 11 Velocidad en eje Y del ojo derecho Tabla 3.1: Valores de cada columna generados por el sistema EyeLink. 40 Las unidades para las posiciones en los ejes X e Y se encuentran en pixeles, mientras que las velocidades en pixeles sobre milisegundo, por otro lado las dilataciones se miden como áreas pupilares en pixeles cuadrado. A pesar de contar con todos estos datos, las columnas 1, 4 y 7 son de interés para este experimento (tiempo y dilataciones de ambos ojos). Los datos de las columnas pueden variar dependiendo si el investigador desea o no registrar las velocidades o si considera necesario o no registrar ambos ojos. Debido a estas diferencias entre investigadores las funciones de extracción debían ser lo suficientemente robusta para abordar todas las opciones. Ya que el Toolbox se implementó en el lenguaje computacional de MATLAB, la solución planteada fue, en un primer paso, leer y transferir en el archivo ASCII completo a MATLAB en forma de un vector en donde cada casilla correspondiese a una línea del archivo ya visto. Así se obtenían vectores de entre 200 mil y 300 mil componentes. Paso seguido, para lograr extraer los datos, y sabiendo previamente que donde se encontraban estos no se apreciaban ningún símbolo alfabético u otra información, se leía cada componente del vector y se discriminaba según lo mencionado. Los valores numéricos se asignan a una matriz que contiene finalmente solo los datos. Teniendo los datos numéricos en una matriz, se procedió a extraer los eventos del archivo ASCII y así obtener la mayor cantidad de información de este. Llamaremos como eventos a distintos mensajes o banderas que escribe el sistema EyeLink luego del inicio o fin de algún hecho natural o artificial dentro del experimento, y que es detectado por este. Entre los eventos se encuentra, el inicio y fin de parpadeos, sacadas (o movimientos rápidos de los ojos), fijaciones de cada ojo, el clic en algún botón en un joystick o teclado, un punto de sincronización con un electro encefalograma, etc. Ejemplo de eventos se aprecian en la Figura 3.6 donde aparecen el fin de las fijaciones para ojos derecho e izquierdo (EFIX L y EFIX R) y el inicio de las sacadas para ambos ojos (SSACC L y SSACC R). Para obtener estas informaciones se generó la función getInternalEventData la cual recibe como argumento el vector con todos los datos y el evento interno o preestablecido por el EyeLink que se desea buscar, por ejemplo “EFIX” correspondiente a una fijación, y entrega una estructura con los datos. Siguiendo con el ejemplo de la fijación, esta estructura contiene un vector con el tiempo de inicio de cada fijación, uno 41 con el tiempo de fin de cada fijación y la posición espacial de esta en X e Y. Debido a que distintos eventos generan distintos tipos y tamaños de estructuras (las fijaciones tienen puntos promedio en el espacio, mientras que las sacadas cuentan con las velocidades promedios y máximas alcanzadas) se construyó un algoritmo del tipo switch-case, principalmente debido a la imposibilidad de plantear clases heredadas ya que no son soportadas por el lenguaje computacional de MATLAB. A continuación se muestra el código de esta función ejemplificando con los casos más conocidos en la función señalada. function output = getInternalEventData(event,asc) %Busca los índices de las líneas donde aparece el evento foundLines = countLines(event, asc); %Genera la salida dependiendo del tipo de evento switch true case ~isempty(regexp(event,'^EBLINK','once')) %Caso de Pestañeo (...) %Creación estructura según el evento case ~isempty(regexp(event,'^ESACC','once')) %Caso de Sacada (...) case ~isempty(regexp(event,'^EFIX','once')) %Caso de Fijación (...) (...) %Otros casos Otherwise %Evento no encontrado disp('Warning: This might not be an internal event data'); disp('Please use the documentation of getInternalEventData'); output = []; return; end end Para capturar otros tipos de eventos los cuales deben programarse aparte en el EyeLink se usó una función hermana llamada getEventData, la cual, de la misma manera que la función anterior, buscaba entre todas las líneas la aparición de evento requerido, en este caso un evento cualquier, y generaba una estructura de un vector con el tiempo en que aparecía el evento y un vector con datos adicionales de existir estos. El caso en el cual se utilizó esta función fue con las imágenes las cuales eran desplegadas con el mensaje “imagen” y tenían la información referente a la categoría de esta misma. Esta función se puede apreciar a continuación. 42 function output = getEventData(event,asc) % Busca los índices de las líneas donde aparece el evento foundLines = countLines(event, asc); %Inicializa la salida tipo del evento foundEvents = {foundLines}; output.startTimes = NaN(length(foundLines),1); output.unknown = NaN(length(foundLines),1); dataPosition = {[1 2]}; variables = fieldnames(output); counter = 0; %Rellena la salida con los valores del evento for i = 1:length(foundEvents) (...) end end 3.2.2 Pre-Procesamiento El pre-procesamiento nace naturalmente como un paso necesario siempre que se desea analizar datos. Debido a que los sensores no son perfectos, en la mayoría de los casos se cuentan con ruidos de alta frecuencia que muchas veces dificultan en análisis posterior. Entre otros, uno de los mayores problemas en la medición de la respuesta pupilar se centra en los pestañeos, esto debido a que mientras se pestañea la pupila pareciese decrecer y desaparecer por unos momentos. Para solucionar este error común en los registros que requieran de análisis de pupila primero se debe estandarizar y normalizar los que se considera un pestañeo. El caso más frecuente sucede cuando mientras se pestañea se cambia la ubicación de los ojos, de forma que el sistema interpreta esto como una sacada seguida del pestañeo para volver a la sacada. Para no cometer errores con estos datos, se amplió el pestañeo de forma que contenga a ambas sacadas. Gráficamente esto se puede apreciar en la Figura 3.7. La función encargada de esto, cleanSaccades, leía los tiempos de ambos eventos y en donde se diera estos casos transformaba las estructuras previas. 43 Figura 3.7: Señal de la posición de ojo Izquierdo en el eje X. El gráfico A) muestral la señal cruda obtenida por el sistema EyeLink, el gráfico B) despliega esta misma sección del gráfico luego de aplicarse la función cleanSaccades. A pesar que para esta investigación no se usaron los eventos de fijaciones o sacadas debido a que no se estudió el comportamiento ocular, sino el pupilar, este trabajo de preprocesamiento se realizó de forma estándar a las demás investigaciones. Teniendo los tiempos de los pestañeos, su procedió a usar la función llamada interpolateBlink, la cual como su nombre lo indica, realiza una interpolación entre un punto antes y uno después del parpadeo con el objetivo de eliminar medidas erronas y la falta de datos. La función utiliza los tiempos de inicio y tiempo final de cada parpadeo obtenidos con la función getInternalEventData, y además requiere un valor extra que indica cuanto se debe ampliar la ventana donde se lleva a cabo la interpolación, esto debido a que el pestañeo es considerado en el momento que la pupila desaparece, pero antes de esto ya comienza a manifestar una reducción errónea de su tamaño. La función entrega la señal pupilar de vuelta con los parpadeos interpolados. 44 Sobre la interpolación se puede decir que se probaron distintos métodos, entre los que destacan las interpolaciones cuadráticas y filtros de Kalman, pero en la práctica estos no se justifican ya que debido a que el parpadeo dura alrededor de 300 milisegundos el comportamiento pupilar no debería tener grandes cambios, y las diferencias al comparar estas interpolaciones con una interpolación lineal resultan mínimas. A continuación se puede apreciar la función interpolateBlink. function output = interpolateBlinks(time,input,blink,timeExtension) output = input; for i = 1:length(blink.startTimes) %Busca los índices más cercanos de los intervalos de pestañeo first = find(time<=blink.startTimes(i),1,'last'); last = find(time>=blink.endTimes(i),1,'first'); %Extiende el intervalo en 'timeExtension' ms while(first > 1 ... && blink.startTimes(i)-time(first) < timeExtension) first = first - 1; end while(last < length(time) ... && time(last)-blink.endTimes(i) < timeExtension) last = last + 1; end %Interpola linealmenete entre los intervalos elegidos output(first:last) = linspace(input(first),input(last),last-first+1); end end Se tiene cierta certeza que por la falta de luz mientras el parpadeo ocurre, la pupila tiende a dilatarse y a entorpecer los datos, ya que, eliminados los pestañeos, se puede atribuir erróneamente esta dilatación a algún otro comportamiento. Este comportamientos se observa en los primeros momentos luego de un parpadeo por lo que basta encontrar adecuadamente en la señal pupilar donde se encontraban y posterior a eso restarles un delta el cual disminuirá exponencialmente a medida que se aleja de este punto en la señal durante una ventana de tiempo. 45 Quizás uno de los pre-procesamientos más importantes es el filtrado de la señal, usado principalmente para eliminar los pequeños artefactos y ruidos de alta frecuencia los cuales pueden aparecer por diversos motivos no medibles, como el ruido asociado a la calidad de la cámara, etc. El filtrado se realizó con un filtro digital IIR (Infinite Impulse Response o Respuesta Infinita al Impulso), en el cual la salida depende de entradas anteriores y salidas anteriores. Se utilizó la función de MATLAB filtfilt (un filtro filt en ambas direcciones) para que no exista desfase, y los coeficientes del filtro se generaron a partir de la función butter la que genera un filtro digital pasa-bajos del tipo Butterworth. En este caso sencillo se diseñó un filtro de un polo con una frecuencia de corte de 2.5 𝐻𝑧. Si la tasa de muestre es de 500 𝐻𝑧, la frecuencia de corte normalizada es de 0.01 𝜋𝑟𝑎𝑑/𝑠𝑎𝑝𝑙𝑒𝑠. La implementación de estas funciones se puede apreciar en el código a continuación. %Filtro pasa-bajo Butterwoth de 1-polo con frecuencia de corte 2.5Hz %Wn = 2.5/250 = 0.01 [b,a] = butter(1,0.01); eyeLeftPupilSizeFilt = filtfilt(b,a,eyeLeftPupilSize); eyeRightPupilSizeFilt = filtfilt(b,a,eyeRightPupilSize); Debido a que todas las funciones generadas tanto para la adquisición o extracción de datos más las funciones necesarias para su pre-procesamiento son similares y necesarias independiente de la investigación, cualquier experimento que necesite obtener el comportamiento ocular y pupilar, requiere implementar estas funciones. Se decidió debido a esto agruparlas en una sola función que realiza de forma automática todos estos pasos ya mencionados, y que recibiendo el directorio del archivo ASCII, lo leía, lo procesaba y finalmente guardaba la totalidad de los datos, independiente si el experimentador los necesitase, en un archivo de extensión mat. Esto resultaba conveniente pues se podía acelerar la generación de la base de datos y de esta forma sólo se debía leer estos archivos para realizar los análisis correspondientes. Se generó decidió generar todos los datos pues en trabajos futuros no se descarta que estos se necesitasen. 46 3.2.3 Análisis Esta memoria, tal como se ha mencionado, fue realizada en conjunto con un grupo de investigadores parte del equipo del laboratorio de neurosistemas, donde la finalidad del trabajo consistía en poder encontrar en la pupila un marcador fisiológico fidedigno, con el cual se pudiese diferenciar algún tipo de comportamiento que se presente en sujetos que posean algún grado de esquizofrenia, y poder así ayudar prematuramente en el diagnóstico. Por lo tanto el análisis de resultados para este trabajo recaerá principalmente en encontrar diferencias significativas entre estos dos grupos, sin ahondar mayormente en el significado del por qué se suscitan estas desigualdades. Teniendo lo anterior en mente se procedió a generar el análisis requerido, el cual consistió principalmente en segregar la señal según la categoría que se observaba, desplegar visualmente estas curvas para encontrar diferencias entre ellas, obtener un set de características que pudiese representar la curva, analizar estadísticamente estas características, y entrenar una red neuronal con esta información para posteriormente utilizarla como un clasificador. Teniendo en mente que se desea comparar el comportamiento de la reactividad pupilar entre sujetos y no su tamaño real, y ya que como sucede con otras medidas anatómicas, el tamaño basal pupilar entre sujetos es distinto, se debió normalizar la señal pupilar. Para esto se llevó el tamaño pupilar, inicialmente en pixeles cuadrados, a una unicidad tipificada o normalizada llamada z-score. Teniendo en cuenta que la distribución de los datos podían agruparse como un conjunto aleatorio con una distribución normal, la idea de esta normalización es llevar esta distribución a otra cuya media fuese igual a cero y cuya desviación estándar fuese igual a 1, de esta forma al aplicarse a cada sujeto se compararían finalmente muestras con medias y desviaciones iguales, y así destacar diferencias de comportamiento. Esta normalización z-scores se aplicó con la función de MATLAB zscore la cual se anidó dentro de la función pupil2zscore. Para generar las curvas por categorías, y recordando que las imágenes en el experimento aparecen en orden aleatorio, se procedió a leer la información recopilada previamente y según los tiempos de cada imagen, se aisló el extracto de la señal pupilar 47 correspondiente. Con esto, para cada sujeto, se generaron celdas en donde se agruparon las curvas correspondientes a cada categoría. Se concibió una función la cual leyendo los tiempos y categorías de las imágenes con las señales pupilares realizara la tarea de la extracción, considerando una ventana de tiempo de 4 segundos desde la aparición de la imagen, agrupando la señal según la categoría en una celda la que posteriormente se convertiría en una matriz de datos. La función generateMatrixOfPupilSignal se puede ver a continuación. function pupilMatrix = generateMatixOfPupilarSignal(List,Path) %Generación de indices de las imágenes Indexes = pupils2events(List,Path,'imageEvents'); for i = 1:length(List) disp(['Analizando ' List{i}]); mySignals = cell(120,1); myIndexes = Indexes{i}; %Lectura de los datos para cada sujeto load([Path '\' List{i}],'eyeLeftPupilSizeFilt',... 'eyeRightPupilSizeFilt','imageEvents','time'); %normalización según z-score psl = pupil2zscore(time,imageEvents,eyeLeftPupilSizeFilt); psr = pupil2zscore(time,imageEvents,eyeRightPupilSizeFilt); ps = 0.5*(psl+psr)'; %trans' %Extracción de la señal correspondiente a cada categoría for j = 1:length(myIndexes) try mySignals{j,imageEvents.categories(j)} = ... ps(myIndexes(j,1):myIndexes(j,1)+1999); end end %Conversión de celda a matriz de datos for j = 1:9 pupilMatrix {i,j} = cell2mat(mySignals(:,j))'; end end end Obtenidos los datos por categoría y por consiguiente las curvas (se pueden apreciar algunos ejemplos de estas en el capítulo 4, Figuras 4.3, 4.4 y 4.5), se analizaron visualmente, y, en base a conocimientos de expertos y trabajo previos, se escogieron las 48 características que definirían la curva. La búsqueda de las características se realizó sobre las curvas individuales y sobre las curvas promedio de cada individuo y de cada categoría, esto debido a dos razones. Por un lado las curvas individuales presentaban, en algunos casos, comportamientos erráticos los cuales a pesar de generar herramientas robustas escapaban de la norma entregando datos erróneos, y por otro lado, debido a que las características escogidas se establecieron a partir de las curvas promedio. Se definieron, siguiendo con lo anterior, 4 características (contracción máxima; velocidad de contracción velocidad de dilatación; velocidad de vuelta a estado basa) de las cuales se hablará más ampliamente en el capítulo 4 sección 2. Teniendo en cuenta el comportamiento típico pupilar (una dilatación seguida de una contracción brusca y luego el regreso a su estado basal), se buscó en el extracto de señal los puntos correspondientes a las dilataciones máximas pre y post estímulo y la contracción máxima (el valor mínimo) del estímulo (Figura 3.12), para con estos generar las características buscadas. Figura 3.8: La señal corresponde a la reactividad a una imagen. Los puntos en color rojo son los valores correspondientes a las dilataciones máximas pre y post estímulo y la contracción máxima. 49 Debido a que la búsqueda de las características se resume a la búsqueda de dichos puntos, se generó una función la cual, a partir de un índice típico (alrededor de 500 milisegundos) buscase la contracción mínima, y luego las dilataciones máximas pre y post contracción. El extracto de esta función, ezqFindFeatures, que encuentra los puntos y genera las características se puede apreciar a continuación. %Busqueda de los índices realIndex = index; while realIndex < length(time) && sign(psignal(realIndex)) == sign(psignal(realIndex+1)) realIndex = realIndex + 1; %Contracción máxima end startIndex = realIndex-10; endIndex = realIndex+10; while startIndex > 1 && zsignal(startIndex-1) >= zsignal(startIndex) startIndex = startIndex-1; %Dilatación máxima pre-estímulo end while endIndex < length(time) && zsignal(endIndex + 1) >= zsignal(endIndex) endIndex = endIndex + 1; %Dilatación máxima post-estímulo end %Cálculo de Características %Cálculo de pendietes para las velocidades slope = polyfit(time(startIndex:endIndex)-time(startIndex), zsignal(startIndex:endIndex),2); preSlope = polyfit(time(startIndex:realIndex)-time(startIndex), zsignal(startIndex:realIndex),1); postSlope = polyfit(time(realIndex:endIndex)-time(realIndex), zsignal(realIndex:endIndex),1); %Cálculo de las Características feats = [zsignal(startIndex)-zsignal(realIndex) preSlope(1) postSlope(1) (endIndex-startIndex)*2 zsignal(endIndex)zsignal(realIndex)]; %save slopes slopes = [slope preSlope postSlope]; end indexes = [startIndex realIndex endIndex]; end Con esto se pudo obtener los valores de los parámetros o características de cada curva, generando así conjuntos de datos los cuales pasarían a ser estudiados estadísticamente. Para esto se realizaron estudios sobre la distribución de los datos y finalmente se compararon usando distintos test estadísticos. Los resultados discutirán en el capítulo 4. 50 Para la red neuronal, se utilizaron los datos de las características obtenidas previamente. Ya que MATLAB tiene un Toolbox fácil de usar y óptimo para la generación de redes neuronales (Neural Network Start), se utilizó la variación de este diseñado especialmente como herramienta en la búsqueda de patrones y clasificación (Neural Network Pattern Recognition Tool). Sobre esta herramienta previamente diseñada se creó la red neuronal y tanto los parámetros como los resultados serán tratados en el capítulo 4. 51 Capítulo 4 Análisis y Resultados El presente capítulo se dividirá en tres partes, las cuales abordarán los resultados obtenidos en las distintas etapas de desarrollo de la memoria. En la primera parte se ahondará en los resultados obtenidos en la extracción de datos, principalmente en la etapa de procesamiento de la señal pupilar, vale decir, filtrados de la señal, extracción de eventualidades, categorización, etc. En la segunda parte se abordarán los resultados referentes al análisis de los resultados. Teniendo ya las curvas de comportamiento pupilar, se expondrán las razones de la elección de ciertas características de la curva con las cuales se decidió definirlas. Se mostrarán los resultados referentes a los test estadísticos utilizados, y la forma final de cómo quedaron representadas las curvas a través de las caracteristicas. Finalmente se expondrán los resultados del entrenamiento del clasificador, en este caso neuronal, con las características elegidas, y sus respectivos desempeños. 52 4.1 Procesamiento de Datos A partir de la extracción de datos generados por el Toolbox se obtuvieron vectores numéricos referentes al comportamiento ocular del individuo. Debido a que el punto de interés en este proyecto recae sobre el comportamiento pupilar, son estas curvas donde se puso mayor interés y donde se verán los resultados del procesamiento. Cabe mencionar que el comportamiento ocular referente a qué lugar de la pantalla los sujetos fijan la mirada en función del tiempo, también recaba información del SNA, y este se investigó en un trabajo anterior por lo que no se descarta la posibilidad de fusionar ambos estudios a futuro. 4.1.1 Interpolación de Parpadeos Obtenida la curva y teniendo los tiempos de los parpadeos dados por el software de registro, se procede a “limpiar” la señal de eventos como los parpadeos, los cuales nos dan información errónea del tamaño pupilar. Debido a que se conoce el tamaño pupilar antes y después del parpadeo se decidió interpolar estos puntos suponiendo que la pupila no sufría grandes variaciones mientras se encontraba tapada por el párpado. Un ejemplo de la señal antes y después de la interpolación de estos elementos, se pude apreciar en la Figura 4.1. 4.1.2 Filtrado del ruido Posterior a la eliminación de elementos, se procedió a corregir la dilatación de la curva producida por los movimientos oculares rápidos, denominados sacadas. Finalmente, se estudió el espectro de frecuencia para cerciorar que además de la señal pupilar la cual se encontraba principalmente en las bajas frecuencias existía un ruido añadido, que puede deberse a múltiples motivos, en el espectro de alta frecuencia. Debido a esto se procedió a filtrar la señal con un filtro digital pasa bajos. El resultado se puede ver en la Figura 4.2. 53 Figura 4.1: Diferencias entre las curva de la señal pupilar antes y después de corregir los eventos de los pestañeos. Figura 4.2: Diferencias entre las curva de la señal pupilar antes y después del filtrado del ruido externo por un filtro Butterworth pasa-bajos. 54 4.1.3 Curvas Finales Una vez eliminados los artefactos de las señales, y esta vez gracias a los tiempos de las imágenes, encontrados en el archivo ASCII que se obtuvo a partir del EyeLink, la señal pupilar fue segmentada, clasificada por categoría y nuevamente procesada. Se le aplicó una normalización z-score, debido a que entre sujetos las pupilas basales tienden a ser diferentes y las imágenes del experimento no tenían completamente controlada la luminosidad. Para la aplicación del z-score se debía tener primeramente que la distribución de los valores de la curva siguiera una distribución normal con media y varianza propia, para esto se aplicó el test de Kolmogorov-Smirnov. Se generaron seguido de esto las curvas o señales promedio. Debido que las curvas fueron normalizadas por z-score, y por lo tanto sus valores seguían una distribución normal, se aplicó una prueba T-Student o T-Test para obtener los rangos de confianza de estas nuevas señales promedios. Los resultados de las curvas promedios con sus respectivos intervalos de confianza para los pacientes con esquizofrenia y los sujetos de control se pueden ver en las Figuras 4.3, 4.4 y 4.5. Figura 4.3: Resultado promedio de pacientes con esquizofrenia versus sujetos de control de todas las curvas sin considerar las curvas correspondientes a las imágenes negras. 55 Figura 4.4: Resultado promedio de pacientes con esquizofrenia versus sujetos de control de todas las curvas respectivas a la categoría de Ambiente Urbano. Figura 4.5: Resultado promedio de pacientes con esquizofrenia versus sujetos de control de todas las curvas respectivas a la categoría de Ruido Blanco. 56 A partir de estas curvas es donde se puede visualizar que existen diferencias a simple vista entre el grupo de los pacientes con esquizofrenia y el conjunto de los sujetos de control. Entre las característica en la curva se puede aprecia que el grupo de los pacientes con esquizofrenia para todas las categorías comienzan con una dilatación pupilar menor, pero luego su recuperación es mucho más rápida, llegando a quedar por encima del grupo de control. Ya que resulta infructuoso comparar todas las curvas punto por punto, naces la necesidad de expresar la curva a través de un grupo menor de parámetros o características de la curva. 4.2 Características de las Curvas Vistas las diferencias en las curvas obtenidas, en conjunto con el laboratorio de investigación se decidió en primera instancia elegir 4 características de la curva, las cuales se aprecian en la siguiente Tabla. Parámetro o Característica Valor medido Característica 1 Contracción máxima post estímulo (medida en unidad tipificada z-score) Característica 2 Velocidad de contracción post estímulo (z-score/seg) Característica 3 Velocidad de dilatación post estímulo (z-score/seg) Característica 4 Velocidad de dilatación máxima post estímulo durante el primer segundo (z-score/seg) Tabla 4.2: Características escogidas para representar la curva de reacción pupilar. Las mediciones se hicieron sobre la curva previamente normalizada por z-score. 57 Estas características se pueden apreciar en la Figura 4.6. Los valores en este punto se encuentran normalizados, por lo que las unidades serán del tipo tipificadas y se les llamará z-score, debido que esta fue la normalización aplicada Figura 4.6: Esquema de las características que se asociaron a la curva. (a) valor de contracción máxima post-estímulo; (b) velocidad de contracción; (c) velocidad de dilatación en el primer segundo; (d) velocidad de contracción media. Gracias a la función eqzFindFeautures, parte del Toolbox y vista en el capítulo 3, se logró extraer las características mencionadas de las curvas por promedio. Cabe recordar que el experimento constaba de visualizar 70 imágenes en total, de 7 categorías distintas. Debido a que las diferencias no se hacen explícitamente presentes en las curvas individuales, la extracción de características se realizó para los promedio totales de las personas, vale decir, 9 curvas para pacientes con esquizofrenia y 9 curvas para sujetos de control, además se extrajo las características por cada categoría en partícula, es decir, 7 curvas por cada sujeto. En la Tabla 4.2 se puede observar los parámetros promedio para cada paciente con esquizofrenia, y en la Tabla 4.3 se puede observar los parámetros de los sujetos de control. 58 Pacientes con diagnóstico de esquizofrenia Contracción máxima (z-score) Velocidad de contracción (z-score/seg) Velocidad de dilatación (z-score/seg) Velocidad de dilatación al primer segundo (z-score/seg) Paciente 1 2,67 -3,89 0,71 1,12 Paciente 2 2,97 -3,70 0,29 0,67 Paciente 3 3,03 -5,23 0,61 1,05 Paciente 4 3,38 -5,94 0,68 1,02 Paciente 5 2,73 -3,78 0,52 0,67 Paciente 6 2,68 -5,26 0,52 0,55 Paciente 7 2,99 -4,18 0,61 0,85 Paciente 8 2,88 -4,42 0,60 0,61 Paciente 9 3,22 -5,63 0,81 1,11 Tabla 4.3: Valores de características promedio para cada uno de los sujetos con diagnóstico de esquizofrenia. Pacientes con diagnóstico de esquizofrenia Contracción máxima (z-score) Velocidad de contracción (z-score/seg) Velocidad de dilatación (z-score/seg) Velocidad de dilatación al primer segundo (z-score/seg) Sujeto 1 2,96 -4,35 0,33 0,41 Sujeto 2 3,02 -4,27 0,32 0,46 Sujeto 3 3,01 -3,5 0,56 0,80 Sujeto 4 3,06 -4,13 0,39 0,55 Sujeto 5 2,92 -2,24 0,19 0,21 Sujeto 6 2,93 -4,63 0,27 0,54 Sujeto 7 2,95 -3,63 0,54 0,85 Sujeto 8 3,01 -6,03 0,66 0,84 Sujeto 9 2,97 -4,04 0,30 0,46 Tabla 4.4: Valores de características promedio para cada uno de los sujetos de control. 59 Para conocer si las diferencias de los parámetros entre los sujetos con esquizofrenia versus los de control son significativas, se procedió a realizar un test de Student, conocido también como T-Test, entre las distribuciones obtenidas anteriormente. Para poder realizar el test, se necesita tener certeza que los conjuntos de valores siguen una distribución normal o gaussiana. Para lograr esto existe distintos test aplicables, entre los que destacan el test de Kolmogorov-Smirnov y el test de Shapiro-Wilk. El primero y más conocido, es mayormente utilizado para conjuntos numerosos de valores, normalmente superiores a 100 datos, por otro lado, el test de Shapiro-Wilk se usa mayoritariamente para conjuntos pequeños. Debido a que el espacio muestral en este caso es pequeño (limitado por el número de sujetos estudiados) se optará por el último mencionado. En la Tabla 4.4 se puede ver el resultado del test de Shapiro-Wilk, en donde H = 0 significa decir que no se rechaza la hipótesis nula (distribución es normal o gaussiana), con una significancia de 95%, y H = 1 que esta hipótesis si se rechaza. P-Value es el valor probabilístico de la hipótesis antes mencionada. Característica 1 Característica 2 Característica 3 Característica 4 Ezq Ctrl Eqz Ctrl Eqz Cltr Eqz Ctrl H 0 0 0 0 0 0 0 0 p-Value 0,5634 0,8512 0,2387 0,0544 0,396 0,3866 0,826 0,7935 Tabla 4.5: Valores obtenidos del test de normalidad Shapiro-Wilk. Ya que todas las distribuciones analizadas siguen una distribución normal con un grado de significancia superior al 95%, se aplicó el t-test a los parámetros. En la Tabla 4.5 se observan los resultados del test de Student. H = 0 en este caso significa que no se rechaza la hipótesis nula (que ambas distribuciones tengan una misma media establecida) con una significancia del 95%, mientras que H = 1 significa que esta hipótesis si se rechaza. Al igual que en el caso anterior, el p-Value es el valor probabilístico de dicha hipótesis. 60 Característica 1 Característica 2 Característica 3 Característica 4 H 0 0 1 1 p-Value 0,8428 0,0716 0,015 0,0323 Tabla 4.6: Valores obtenidos de la realización del test de Student. De la tabla se puede observar que las características 3 y 4 (la velocidad de dilatación en el primer segundo y la velocidad de contracción media) son diferentes entre pacientes con esquizofrenia y sujetos de control con un 95% de significancia, por otro lado la característica dos (la velocidad de contracción), a pesar de no presentar diferencias significativas, ya que su p-Value no es de 0.05 o menor, presenta una baja probabilidad de tener iguales medias (0.07), lo que indica que tendrá un aporte importante a la hora de entrenar el clasificador neuronal. Finalmente la primera característica (valor de contracción máxima post-estímulo) un valore de P cercano a cero, por lo que se puede concluir que no hay diferencias entre ambos grupos para este parámetro, pero será incluida de todas formas en el clasificador pues esto no entorpecerá el rendimiento final. La Figura 4.7 muestra los promedios de estos valores con sus respectivos errores. 4.3 Clasificador Teniendo ya los datos de las curvas, se generaron 2 set de datos para entrenar dos clasificadores supervisado de tipo neuronales. El primero con 28 parámetros, o 7 sets de 4 parámetros por sujeto correspondientes a 4 parámetros por cada curva promedio de cada categoría, y el segundo con 4 parámetros por sujeto correspondiente a los parámetros de la curva promedio de todas las imágenes. En ambos casos se entrenaron distintas redes variando la cantidad de neuronas en la capa oculta. La red neuronal final consideró 12 neuronas en la capa oculta. Los conjuntos para entrenamiento, validación y testeo se definieron en 70%, 15% y 15% respectivamente. 61 Figura 4.7: Gráfico de barras para el promedio de cada una de las 4 características con sus respectivos errores, separadas por pacientes con esquizofrenia y sujetos de control. 4.3.1 Clasificador por curvas de categorías En primera instancia se consideró entrenar una red neuronal con los parámetros de cada sujeto para cada categoría, vale decir con el conjunto de 28 parámetros por sujeto, esto debido a que las diferencias vistas entre pacientes con diagnóstico de esquizofrenia y sujetos de control se mantiene a lo largo de las categorías, como se pudo apreciar en la sección 4.1. La red neuronal constó de 54 sets de 4 parámetros para cada grupo, es decir, 108 sets de entradas distintas, y las salidas se asumieron como 1 para pacientes con esquizofrenia y 0 para sujetos de control. Se obtienen 54 sets debido a que existen 7 categorías distintas, de 62 las cuales una, la imagen negra, no presenta ningún tipo de señal, por lo cual se eliminó al momento de generar comparaciones, así se tienen 6 sets en 9 pacientes, 54 en total. Los resultados se pueden apreciar en la Figura 4.8 y Figura 4.9, en donde se muestran distintos desempeños para una red neuronal de 12 neuronas en la capa oculta. Figura 4.8: Matriz de confusión del clasificador considerando todos los parámetros. En este caso, 1 corresponde a esquizofrénico y 0 a control. 63 Figura 4.9: Matriz confusión del conjunto de test para otra red neuronal de mismas características. Se puede apreciar que el desempeño para distintos entrenamientos se encuentra en el 60% para los peores casos y cerca del 90% para los mejores casos. Esto se debe en parte a que como se vio en la sección 4.1, las curvas mantienen las diferencias entre si pertenecen al grupo de pacientes esquizofrénicos o de sujetos de control, pero no las mantienen tan fehacientemente entre categorías. Figura 4.10: Curvas ROC del conjunto de test y de todos los datos para la red de la Figura 4.8. 64 Figura 4.11: Curvas ROC del conjunto de test y de todos los datos para la red de la Figura 4.9. 65 4.3.2 Clasificador por curvas de categorías En primera instancia se consideró entrenar una red neuronal con los parámetros de cada sujeto para cada categoría, en otras palabras, cada sujeto estaría aportando con 7 curvas distintas y por lo tanto 7 sets de 4 parámetros. Los resultados se pueden apreciar en la Figura 4.12 y la Figura 4.13. Figura 4.12: Matriz de confusión del clasificador considerando solo 4 parámetros por sujeto. En este caso, 1 corresponde a esquizofrénico y 0 a control. 66 Figura 4.13: Matriz confusión del conjunto de test para otra red neuronal de mismas características. 67 Figura 4.14: Curvas ROC de la red neuronal con mejor desempeño. Es importante destacar que a pesar de tener excelentes resultados, el conjunto de parámetros es tan pequeño que no se puede generar un sistema inteligente que discrimine con grados altos confiabilidad. 68 Capítulo 5 Conclusiones y Discusión 5.1 Conclusiones Sobre el trabajo computacional, dos puntos son importantes mencionar. Por un lado se puede concluir que, debido a que se trabajó en equipo sobre un mismo código, y que el Toolbox sería posteriormente usado por otros investigadores, se requirió una cuota extra de orden y documentación, no solamente apuntando al hecho de que se debe comentar todo el código de manera clara, sino de tener claro la estructura de esta herramienta previa a su construcción con el grupo de trabajo. Por otro lado es importante destacar la importancia de considerar el estado del arte y los trabajos previos, como las funciones ya construidas de MATLAB, las cuales facilitan el trabajo, disminuyen los tiempos de programación y de depuración de estos mismos. Con respecto a la elaboración del Toolbox, y el procesamiento de los datos en particular, se puede concluir que fue todo un éxito, no solo a que se completó de forma satisfactoria, sino que a la fecha se ocupó e implementó en 6 otras investigaciones del laboratorio de neurosistemas con excelentes resultados. Gran parte de éxito recae sobre los muchos estudios previos que existían y la gran cantidad de trabajos con el mismo enfoque, donde muchas de las herramientas necesarias que facilitaron la construcción de este Toolbox se encontraban ya realizadas y fueron de fácil adquisición e implementación. 69 Del pre-procesamiento se puede decir que los pasos necesarios que se siguieron en esta investigación, son las mismas estrategias que se realiza recurrentemente en cualquier tipo de señales difíciles de medir, por lo tanto los esfuerzos previos en este ámbito guiaron este trabajo. Importante es señalar que la motivación fue implementar esto en forma de Toolbox que sea específico para el comportamiento ocular y que sea sencillo e intuitivo para los investigadores del laboratorio en el cual se trabajó. Sobre el trabajo en las características se puede decir que a pesar de obtener las curvas promedios con sus respectivos intervalos de confianza, y que estos puedan ser diferentes visualmente, el análisis estadístico de las características escogidas en la curva, realizado a través de los distintos test, demostró que estas diferencias no eran completamente significativas, lo cual era de esperar, pues las diferencias de existir serían mínimas. A pesar de lo anterior, las máquinas de aprendizaje o redes neuronales mostraron no ser suficientemente robustas como para generar resultados positivos, a pesar que la performance se encontraba sólo sobre el 60%. Independiente de lo anterior, se demostró que un clasificador a partir de redes neuronales es capaz de diferenciar dos tipos de sujetos, inclusive con la poca cantidad de datos con las que se contaba. Propuesto queda realizar un clasificador del tipo Support Vector Machine, para estudiar si existen diferencias significativas en otro espacio. Con respecto a la finalidad de este trabajo, la generación de un sistema inteligente que lograse apoyar en la toma de decisiones, podría llevarse a cabo con los resultados obtenidos, ya que estos denotan claramente diferencias entre grupos. El problema recae en que el grupo de estudio es muy acotado, por lo tanto resulta riesgoso generalizar los resultados globalmente. 70 Sobre los pacientes con diagnóstico de esquizofrenia se debe mencionar que sus identidades e información asociada como fármacos consumidos, necesarios en esta investigación, son resguardados según el protocolo médico actual. Cabe mencionar que la investigación se hizo cargo de los posibles efectos de los medicamentos en el comportamiento pupilar debido a que no todos los sujetos los consumían, y que es imposible, debido a la poca ética asociada, quitarle a un sujeto sus medicamentos, con el fin de obtener datos libres de esta variable. Importante es destacar que los objetivos se cumplieron, debido a que por una parte se generaron herramientas computacionales robustas y versátiles, útiles para el laboratorio de neurosistemas. Con respecto a la utilización de la pupila como marcador fisiológico que delate la patología, se puede decir que sí se encontraron diferencias, y se destaca el uso de la pupilometría sobre métodos como el electro-encefalogramas para percibir reacciones en el sistema motor autónomo, debido a que estas últimas resultan ser demasiado invasivos comparados con el registro del comportamiento pupilar. Finalmente se puede mencionar que los resultados obtenidos de esta memoria incentivan que se continúe la búsqueda de patrones oculares y pupilares que permitan, con bases de datos más amplias, construir instrumentos que diagnostiquen con mayor seguridad y a temprana edad a los sujetos que sufran de esquizofrenia 71 5.2 Trabajo futuro Dos líneas existen para la continuación de esta investigación. - Quizás la más impórtate y en donde se enfoca este estudio, es la continuación de patrones fisiológicos que faciliten el diagnóstico y permitan establecer a temprana edad si un paciente puede tener o desarrollar síntomas de esquizofrenia. En este sentido se pretende en un futuro fusionar los distintos estudios y métodos investigados, y aumentar las bases de datos, todos con el fin de hacer cada vez más robustos y globales los resultados. - Usar la misma metodología desarrollada en esta investigación y plantearla en pacientes con otras alteraciones psiquiátricas con el fin, motivado por el hallazgo de rangos distintivos entre sujetos de control con pacientes con esquizofrenia, encontrar diferencias en estas nuevas patologías, y en el mejor de los casos que estas diferencias se logren ver entre distintas patologías. 72 Bibliografía [1] Minsal, Departamento de Epidemiología. Estudio Carga de Enfermedad y Carga Atribuible. 2007. [2] Van Os J, Kapur S., Schizophrenia. Lancet; 374:635-45, 2009. [3] Brendan T. Carroll, Md; Rob Kirkhart, Katatonia: A New Conceptual Understanding of Catatonia and a New Rating Scale. Psychiatry (Edgemont); 5(12):42–50, 2008. [4] Silva H. De Kraepelin al DSM IV. Ed Universitaria, Chile, 1993. [5] Aaron T. Beck; Neil A. Rector; Neal Stolar; Paul Grant: En Esquizofrenia, Teoría Cognitiva y Terapia .Ed Paidos, Cap 1, 2010. [6] Jaspers K. en “Psicopatología General” 1913. Ed. Fondo de Cultura Económica, México D.F., México, 5° reimpresión 2006. [7] Karl-Jürgen Bär, Michael Karl Boettger, Steffen Schulz, The interaction between pupil function and cardiovascular regulation in patients with acute schizophrenia. Clinical Neurophysiology 119, 2209–2213, 2008. [8] Edmund Huey. The psychology and pedagogy of reading. MIT Press, 1908-1968. [9] G. T. Buswell C.H. Judd. Silent reading: A study of the various types. University of Chicago Press, 1922. [10] A. L. Yarbus. Eye movements and vision. new york: plenum. (Originally published in Russian 1962), 1967. [11] P. A. Carpenter M. A. Just. Eye fixations and cognitive processes. Cognitive Psychology 8, 441-480. 1976. 73 [12] J. E. Hoffman. Visual attention and eye movements. H. Pashler (Ed.), Attention. London: University College London Press, 119-154, 1998. [13] Karen E. Revere Defne Amado jean Bennett Daniel C.Chung Matthew C. Canver, Adam C. Canver. Novel mathematical algorithm for pupilometric data analysis. Comput Methods Programs Biomed, 2013. [14] Jian Huang Ying Gao Peng Ren, Armando Barreto. Off-line and on-line stress detection through processing of the pupil diameter signal. Annals of Biomedicals Engieneering, 2013. [15] Beatty, B Lucero-Wagoner, En Handbook of psychophysiology, Cambridge University Press, 2000. [16] Willem j. M. Levelt. Pupillary dilation as a measure of attention: A quantitative system analysis. Behavior Research Methods, Instruments, & Computers, 25 (1), 16-26. [17] Matthew R Nassar, Katherine M Rumsey, Robert C Wilson, Kinjan Parikh, Benjamin Heasly & Joshua I Gold. Rational regulation of learning dynamics by pupil-linked arousal systems. Volume 15, Number 7, Nature Neuroscience, 2012. [18] Fullerton, C, Reactividad pupilar y tono hedónico ante estímulos con valencia emocional. Tesis Magíster en Ciencias Biomédicas Mención Neurociencias, Escuela de Postgrado Facultad de Medicina, Universidad de Chile. 2012. [19] Granholm E, Scot.t C. Fishb,C, Verneyd S. Pupillometric Measures of Attentional Allocation to Target and Mask Processing on the Backward Masking Task in Schizophrenia. Psychophysiology. May; 46(3): 510–520, 2009. [20] Shlien JM. Hess EH., Seltzer AL. Pupil response of hetero-and homosexual males to pictures of men and women: A pilot study. Journal of Anormal Psychology, vol. 70, no. 3, p. 165, 1965. 74 [21] Acosta, J., Fernandez, J. & Becerra, L., ‘Aplicación de las redes neuronales para la identificación de un sistema no lineal’, Mayo 2008. [22] Zuloaga, C. & Acosta, M. ‘Tutorial de redes neuronales’, Universidad tecnológica de Pereira, 2000. [23] Egaña, J. I., Devia, C., Mayol, R. V., & Parrini, J. Small saccades and image complexity during free viewing of natural images in schizophrenia. Frontiers in Psychiatry. 2013. 75