Capítulo 5: Visión y Percepción Ingeniero Técnico de Telecomunicación. Esp. Sonido e Imagen. 1er Curso. Fundamentos Físicos de la Ingeniería. Profesores responsables: Begoña Hernández Salueña, Carlos Sáenz Gamasa (Dpto de Física) M.C. Escher. Waterfall (1961) Capítulo 5: Visión y percepción 1.- El proceso visual 2.- Sensibilidad espectral del sistema visual 3.- Visión del color 4.- Visión espacial 5.- Visión de formas 6.- Visión binocular 7.- Propiedades temporales del sistema visual 8.- Visión humana y visión artificial Objetivos del capítulo: • Conocer las características principales de los fotorreceptores y su distribución en la retina • Conocer los principales fenómenos relacionados con la visión del color • Dar una introducción a los aspectos fundamentales de la visión espacial: agudeza visual, reconocimiento de formas y teoría de la Gestalt • Conocer como percibimos la tridimensionalidad del espacio • Dar una introducción a los aspectos temporales de la visión: persistencia visual, frecuencia crítica de fusión, percepción del movimiento y adquisición temporal de la información 1 Capítulo 5: Visión y Percepción 1.- El proceso visual La mayor parte de la información que recibimos de nuestro entorno lo hacemos a través del sentido de la vista. La visión puede subdividirse en tres etapas: 1.- Óptica: permite la formación de una imagen en la retina 2.- Fotorrecepción: registro de dicha imagen por los fotorreceptores 3.- Procesado neural de la imagen para su interpretación, último eslabón de la percepción visual Estímulo Sistema óptico Neurona sensitiva (Ojo) (Células retinianas) Transmisión nerviosa (Nervio óptico) Sistema nervioso central (Corteza visual) Esquema del proceso visual La etapa óptica ha sido estudiada en el tema anterior, en el que vimos el ojo como sistema óptico y en los mecanismos de formación de imágenes, aquí profundizaremos un poco más en el conocimiento de los aspectos más importantes de las demás etapas de procesado. Fotorrecepción La retina es la membrana fotosensible del ojo que contiene los fotorreceptores: - conos (cortos y gruesos). Los conos responden a niveles elevados de luminosidad y son los responsables de la visión diurna y en color. Nuestra retina posee tres tipos diferentes de conos con sensibilidades espectrales diferentes. - bastones (largos y cilíndricos). Los bastones responden a muy bajas intensidades luminosas y permiten la visión nocturna sin detalles ni color. Son los responsables de nuestra capacidad para ver la luz de la luna o de las estrellas. Sólo tenemos un tipo de bastones que nos ofrecen una percepción en grises sin ninguna información del color. Imagen de los dos tipos de fotorreceptores tomada por un microscopio electrónico La retina se puede dividir en dos partes: central y periférica, la primera, en la que se encuentra la fóvea, responsable de la agudeza visual y la segunda responsable de la percepción del movimiento. Estructura de la retina 2 Capítulo 5: Visión y Percepción Los conos y los bastones se distribuyen por toda la retina, pero con muy diferente densidad. En la zona central de la fóvea solamente hay conos y su densidad, que en el centro es de unos 150.000 /mm2, disminuye bruscamente hacia el borde de la retina, donde apenas se encuentran (4000- 5000). La densidad de bastones, por el contrario crece a partir de la fóvea pasando por un máximo de 160.000/mm2 a unos 6 mm del centro de la fóvea (20º) para terminar con 50.000/mm2 al borde de la retina. La zona donde desemboca el nervio óptico, punto ciego, no tiene células fotorreceptoras. Distribución de los fotorreceptores en la retina Dada la diferente distribución de conos y bastones en la retina, en condiciones de baja luminosidad no sólo no se distinguen los colores sino que además se pierde el detalle ya que se emplean aquellas partes del ojo de peor calidad óptica. En visión diurna los bastones están prácticamente saturados y el proceso de la visión se realiza a través de los conos. La visión diurna y la nocturna se debe, por lo tanto a diferente tipo de fotorreceptores, esto hace que exista un desplazamiento de la longitud de onda de mayor sensibilidad entre la visión diurna y la visión nocturna llamado efecto Purkinje (1823) y hace que un objeto que de día aparece como rojo, de noche se vea negro y uno que de día es azul sin embargo aparezca gris claro. Sensibilidad espectral del sistema visual y efecto Purkinje Trivarianza visual El ojo al contrario que el oído es incapaz de descomponer un estímulo luminoso en sus frecuencias o longitudes de onda. Si definimos la varianza como el mínimo número de parámetros independientes necesarios para describir un fenómeno, se puede comprobar experimentalmente que se necesitan 3 parámetros para caracterizar un estímulo luminoso. Este fenómeno se conoce con el nombre de trivarianza visual y de el se puede deducir que es necesaria la mezcla de tres colores para conseguir cualquier otro. Asimismo, cualquier estímulo luminoso podrá ser descrito por tres parámetros: intensidad, tono y saturación. 3 Capítulo 5: Visión y Percepción Procesado neural Cuando los fotorreceptores reciben el estímulo luminoso adecuado se excitan y transmiten señales a través de sucesivas neuronas en la propia retina. Estas señales alcanzan la corteza cerebral a través de las fibras del nervio óptico y es allí donde se integra finalmente la información luminosa. Después de la etapa de la fotorrecepción las informaciones provenientes de los dos ojos se cruzan posteriormente, de tal manera que la información de la parte derecha de los ojos va al hemisferio izquierdo y la de la parte izquierda al hemisferio derecho. El procesamiento termina finalmente en la corteza visual. 2.- Sensibilidad espectral del sistema visual Una de las características más importantes de cualquier detector es su respuesta espectral. El ojo es un receptor selectivo que no responde por igual a las radiaciones de diferentes longitudes de onda. Por ejemplo no da respuesta por debajo de 380 nm ni por encima de 780 nm. Aun para luces entre estas longitudes de onda, una misma cantidad de flujo radiante puede generar una respuesta distinta. La curva que caracteriza la sensibilidad del sistema visual se denomina Vλ. Esta sensibilidad se refiere únicamente al atributo de la luminosidad o la claridad, ambas relacionadas con la cantidad de luz que muestra un campo. Esta curva es la que nos permite pasar de las magnitudes fotométricas a las radiométricas. Recordemos que existen en realidad dos curvas Vλ, una para alta luminosidad y otra para baja (Efecto Purkinje). 3.- Visión del color Teorías y modelos de visión del color A lo largo de la historia se han elaborado teorías y modelos que intentan explicar el funcionamiento del sistema visual en lo que se refiere a la visión del color. Históricamente la primera investigación moderna sobre el color fue realizada por Newton en 1666, cuando encontró que la luz blanca no era una radiación única, sino que podía ser dispersada por un prisma en un espectro de gradaciones de color. - Tricromatismo: Newton (propiedad de la luz) Young (naturaleza retiniana) - Modelos oponentes: Hering (1870) - Unificación de modelos, dos etapas de procesado. Se supuso durante mucho tiempo que el tricromatismo visual era una propiedad de la luz. Casi 100 años después, Young intuyó la naturaleza retiniana de la trivarianza visual y propuso en consecuencia una teoría tricromática básica. En ella suponía la presencia en la retina de tres tipos de conos, capaces de ser estimulados en mayor o menor medida por las distintas radiaciones. Las sensaciones de color dependerían de las razones de activación de estos tres tipos de receptores. Estas ideas fueron desarrolladas antes de que se conocieran los elementos principales de la fisiología de la retina y las ideas de Young fueron ignoradas. Young murió en 1829 y hasta 1852 sus ideas no fueron retomadas por Helmholtz y apoyadas por Maxwell. Aunque con grandes aciertos la teoría tricromática dejaba sin explicar muchos aspectos de la apariencia de los colores. Hering hacia 1870, intentó resolver las dificultades 4 Capítulo 5: Visión y Percepción encontradas por las teorías tricromáticas y basándose en que no se observaban colores verde rojizos ni amarillo azulados, propuso la existencia de unos sistemas oponentes en algún punto de la ruta visual: un proceso claro-oscuro, otro rojo-verde y otro amarillo-azul. La teoría de Hering permaneció en el olvido durante muchos años por ausencia de soporte experimental. Cada una de las teorías puede explicar un conjunto de fenómenos visuales muy específicos. La unificación de ambos enfoques, considerados opuestos durante muchos años, comenzó a finales del siglo XIX. A partir de entonces se elaboraron teorías zonales que combinan una primera fase tricromática, con un segundo estadio de procesamiento regido por mecanismos oponentes. Esta construcción mixta proporciona mayor número de grados de libertad y enriquece la explicación de los fenómenos relacionados con la percepción. Sensibilidad espectral de los diferentes fotorreceptores Adaptación cromática, constancia de color y contraste simultáneo Adaptación cromática: Los fenómenos de adaptación son procesos por los cuales el sistema visual cambia su sensibilidad como consecuencia de la intensidad de las luces que observa (la adaptación a la luz y a la oscuridad es bien conocida por todos). Este cambio en las sensibilidades de los mecanismos de respuesta visual puede también producirse como consecuencia de la composición espectral de las luces observadas, en este caso se habla de adaptación cromática. Si permanecemos en una habitación iluminada por lámparas de incandescencia el estado de adaptación cromática vendrá dominado por la composición espectral de este tipo de luz, o si estamos al aire libre, el estado de adaptación cromática tendrá que ver con la composición espectral de lo que conocemos como luz de día. Constancia de color. Un caso extremo de adaptación cromática es la constancia de color, en la que se asocia un color a un objeto independientemente del iluminante bajo el que se observa. En este caso la sensibilidad de los mecanismos de visión cambia para mantener la apariencia de color de un objeto. La constancia de color nos hace ver los objetos conocidos siempre del mismo color aunque cambie la iluminación. Sin embargo la constancia de color no se presenta siempre, en numerosas ocasiones podemos comprobar como cambia el color de los objetos al cambiar la iluminación, objetos que aparecen de idéntico color bajo una iluminación son totalmente distintos en otras condiciones (metamerismo). En este caso el efecto de la adaptación no llega a compensar totalmente el cambio colorimétrico. Contraste simultáneo: El último fenómeno que nos queda por Contraste simultáneo: los dos rectángulos interiores son idénticos comentar es el contraste simultáneo, se trata de los cambios de apariencia de un color que 5 Capítulo 5: Visión y Percepción se experimentan según el color del campo circundante. El contraste simultáneo no se puede calificar estrictamente de adaptación cromática, ya que no es una modificación de la sensibilidad de los fotorreceptores, es más bien una adaptación espacial, cuya explicación puede encontrarse a nivel neural por la acción inductora de unas partes del campo visual sobre otras. Anomalías y deficiencias en la visión cromática Suponemos implícitamente que los observadores que están contemplando una pintura perciben los colores tal y como los percibimos nosotros. El pintor supone que quien vea su cuadro verá los mismos tonos que él. Esta suposición es cierta en el 92% de los hombres y en el 99,5% de las mujeres. Alrededor del 8% de los hombres y sólo el 0.5% de las mujeres poseen una visión anormal del color. Estas personas pueden distinguir generalmente algunos colores, pero tienen dificultades para discriminar otros. El problema más común es el de la discriminación rojo-verde. Los defectos en la visión del color pueden ser congénitos o adquiridos por algún accidente o algún agente tóxico, los primeros no se pueden curar, aunque con el aprendizaje pueden minimizarse, pero los segundos si que pueden tener tratamiento. (Existen diferentes test para detectar estas anomalías). Un observador normal puede apreciar los colores de manera incorrecta si las condiciones de observación no Test para detectar deficiencias de color. Los individuos con visión son las adecuadas: normal deben ver el número 16 - Visión indirecta, visión con la parte lateral del ojo dentro del círculo fuera de la fóvea, disminuye la capacidad de discriminación entre rojo y verde. - Tamaño insuficiente, si percibimos una imagen que sólo estimula la región de la fóvea, el tamaño puede ser insuficiente para percibir el color correcto, la discriminación amarillo azul puede verse seriamente reducida debido a la particular distribución de los conos en la retina. - Baja luminosidad, ya hemos hablado que en este caso la visión es monocromática. - Tiempo insuficiente, se produce discriminación claro-oscuro, pero no hay tiempo de dar una respuesta de discriminación cromática. 4.- Visión espacial Cuando contemplamos una fotografía en blanco y negro el estímulo que recibe nuestro sistema visual es una distribución espacial de luminancias, de la cual la parte óptica del sistema forma una imagen sobre la retina. La parte neural del sistema (retina-cerebro) procesa la información espacial contenida en la imagen y la percepción complete el proceso visual. El resultado de este proceso lleva a reconocer unos objetos, determinar tamaños y posiciones relativas entre ellos o distinguir entre objetos de igual forma y tamaño por algunos detalles. El estudio de todas estos procesos es lo que se recoge dentro la visión espacial. El límite de la visión espacial está íntimamente relacionado con el tamaño del detalle más pequeño que un observador es capaz de detectar o de reconocer. 6 Capítulo 5: Visión y Percepción Agudeza visual La agudeza visual es una medida de la capacidad del sistema visual para detectar, reconocer o resolver detalles espaciales en un test de alto contraste y con un buen nivel de iluminación. Una agudeza visual buena significa que el sujeto es capaz de apreciar pequeños detalles en una imagen, mientras que una mala agudeza visual implica que e sujeto aprecia solo a grandes rasgos la imagen. La agudeza visual se mide con Optotipos que evalúan la capacidad de resolución Factores que influyen: Tipo de test, Luminancia, localización retiniana y orientación - Mínimo visible (1’’) - Anillos de Landolt - Mínimo separable (40’’-1’) - Agudeza de red - Agudeza de vernier(1’-2’’) - Letras de Snellen Si el contraste disminuye estos límites varían. 5.- Visión de formas Vamos a tratar a continuación de una manera muy esquemática el reconocimiento de formas, qué pautas sigue nuestro sistema visual para a través de la información recogida por los fotorreceptores elaborar una respuesta o señal de salida. • Percepción de bordes Distinguir el contorno de las figuras y objetos es uno de los aspectos importantes del reconocimiento de formas y esto depende de la capacidad para distinguir bordes luzoscuridad. La existencia de discontinuidades en el estímulo es condición necesaria para que la percepción de la imagen se mantenga. • Distinción entre figura y fondo La diferenciación entre figura y fondo es un paso fundamental para llegar al reconocimiento de la forma. - Creamos contornos al identificar una figura - La parte más pequeña se suele identificar como figura - Cuando algo se identifica como figura parece más cercano y más luminoso - Cuando se presenta por primera vez no se reconoce si no está en su orientación habitual 7 Capítulo 5: Visión y Percepción • Agrupamiento (Teoría de la Gestalt) A principios del siglo XX un grupo de sicólogos alemanes formaron la escuela de la Gestalt (palabra alemana que significa forma). Su idea básica es que “La percepción del todo es cualitativamente diferente de la suma de las partes”, contraria al estructuralismo que intenta llegar al conocimiento del sistema visual por el conocimiento de las distintas partes que lo constituyen. Según esta teoría el sistema visual realiza agrupamientos según los siguientes criterios: -Proximidad: los elementos se agrupan en función de su separación -Semejanza: si la proximidad es igual se asocian semejanzas en la forma -Mejor continuación: se agrupan los que parecen seguir la misma línea -Destino común: se agrupan los elementos paralelos -Unidad: entre varias posibles agrupaciones se elige aquella que conduce a una figura más completa -Principio de mejor configuración • Ilusiones ópticas: Son percepciones que producen sensación de irrealidad o imposibilidad. 8 Capítulo 5: Visión y Percepción 6.-Visión binocular Las imágenes que se forman en la superficie de la retina son bidimensionales y sin embargo la información que se extrae de ellas permite percibir o reconocer objetos en tres dimensiones. Para llegar a la percepción del espacio el sistema visual utiliza sobre todo los indicios derivados de emplear simultáneamente la imagen de los dos ojos que es ligeramente diferente (disparidad binocular), sin embargo, también en una imagen monocular se pueden encontrar claves que permiten reconocer las distintas perspectivas que pueden presentar los objetos, su proximidad o lejanía. En la naturaleza existen animales que tienen los ojos muy separados para tener campos de visión muy amplios mientras que otros tienen los ojos más juntos para tener más información de la tridimensionalidad y por lo tanto calcular mejor las distancias. Cuando miramos a objetos lejanos los dos ojos están básicamente paralelos, mientras que cuando miramos a objetos cercanos los dos ojos convergen para focalizar la misma imagen, esto hace que la profundidad se observe para objetos cercanos, mientras que se pierde para los lejanos. El ojo fusiona las imágenes de los dos ojos para obtener una única percepción, en cada retina existen puntos correspondientes. Disparidad ocular La estereopsis permite la discriminación de la profundidad de las escenas observadas Existen también claves monoculares que nos dan idea de la profundidad como son la perspectiva, la interposición de objetos, las sombras, los gradientes de texturas, y los tamaños relativos entre objetos. 9 Capítulo 5: Visión y Percepción 7.- Propiedades temporales del sistema visual Vamos a ver a continuación algunos fenómenos y conceptos relacionados con las propiedades temporales del sistema visual. Persistencia visual y postimágenes La persistencia visual es el fenómeno por el cual se sigue apreciando durante un tiempo más o menos largo un estímulo luminoso aun cuando este ha desaparecido. La impresión visual que produce esta persistencia se denomina postimagen. Frecuencia critica de fusión (FCF) Si en lugar de tener un estímulo simple tenemos un estímulo periódico, cuando la frecuencia es inferior a un determinado valor, el sistema visual percibe una sensación de parpadeo luminoso, cuando por el contrario la frecuencia es superior a dicho valor deja de percibirse el parpadeo y el resultado es una sensación de luz estable. La frecuencia a la que se elimina el parpadeo de una luz periódica se denomina frecuencia crítica de fusión. La fusión temporal de las luces es consecuencia del solapamiento del estímulo con el periodo de persistencia del estímulo anterior a la repetición. * El valor de la frecuencia crítica de fusión está condicionado por distintos parámetros: luminancia, localización retiniana, tamaño del test y cromaticidad entre otros (tiene un máximo en unos 60Hz, para un nivel normal de luminancia podemos tomar 30 Hz). * FCF crece con L, luces débiles se fusionan antes * A bajas luminancias el parpadeo se observa mejor en la periferia que en la fovea * FCF aumenta con el tamaño del test. Adquisición temporal de la información Nuestra percepción del espacio es continua, sin embargo nuestros ojos observan una escena saltando de un punto de fijación a otro La fóvea subtiende 2º, necesitamos ir situando sobre la fóvea las distintas partes del campo visual a una frecuencia superior a la frecuencia crítica de fusión. La imagen obtenida de la integración espacial y temporal es almacenada en una memoria de corto periodo como una imagen estable y desaparece tras un tiempo de entre 1 y 3 s. Percepción del movimiento La sensibilidad al movimiento es un aspecto fundamental de la visión. Por un lado, muchos objetos situados en el campo visual se mueven, por otro nosotros mismos nos movemos dentro de nuestro entorno, lo cual puede producir movimientos en la imagen retiniana. La primera pregunta que podemos hacernos es cual es la mínima velocidad detectable por el sistema visual o el desplazamiento mínimo que podemos detectar en la posición de un objeto. Los estudios realizados por diferentes investigadores dan los siguientes resultados: - La velocidad mínima disminuye (se detecta mejor el movimiento) cuanto mayor es el tiempo de exposición del test y la luminancia - menor en la fóvea, es decir detectamos mejor el movimiento en la parte lateral del ojo - menor con referencia que sin ella, se detecta antes el movimiento si tenemos un punto de referencia fijo. (con referencia se obtiene un umbral de 1 o 2 min de arco/s, sin referencia aumenta hasta 10 veces 10 a 20 min arc/s) 10 Capítulo 5: Visión y Percepción 8.- Visión humana y visión artificial Por visión artificial se entiende la adquisición y el uso de información visual por una máquina para controlar un proceso determinado. El desarrollo de ordenadores cada vez más potentes y sofisticados provoca que muy a menudo nos planteemos su comparación con el cerebro humano. La rapidez y el volumen de operaciones son capaces de llevar a cabo, producen la sensación de que su capacidad es cuanto menos comparable a la de nuestro cerebro. En principio nos puede parecer que la velocidad de procesamiento de un ordenador es mucho mayor que la del cerebro, sin embargo aunque el funcionamiento del cerebro es mucho más lento, la información es tratada de forma concurrente por millones de canales especializados en distintos aspectos, atributos o dimensiones de la imagen, por lo que la lentitud de funcionamiento no se traduce en lentitud de procesamiento. Cuando hay que realizar una tarea simple pero repetitiva el ordenador no tiene competencia en exactitud y velocidad, pero cuando hay que llevar a cabo una tarea más o menos compleja, la forma de procesar del cerebro es infinitamente más eficaz. ¿Se puede comparar entonces el cerebro con un ordenador?. ¿Se puede comparar un pájaro con un avión?. Si en el sentido de que los dos vuelan. Existen tareas en común entre un ordenador y el cerebro entonces son comparables en cuanto a la realización de esa tarea se refiere. Cuando se pretende desarrollar un sistema de visión artificial, lo primero que hay que preguntarse es para qué se desea y cuales son las tareas que tendrá que realizar. Por ejemplo detectar una determinada figura o contorno geométrico. Conforme la tarea asignada es cada vez más complicada, el sistema tendrá que ser capaz de detectar más detalles. Llegar al nivel de sofisticación de la visión humana es todavía algo muy lejano. La visión artificial tiene importantes aplicaciones industriales, sobre todo en lo que se refiere a la automatización de las labores de inspección y clasificación de objetos, así como el control de máquinas. (ejemplo: códigos de barras) Visión humana Visión artificial Enlaces de interés: http://www.webvision.med.utah.edu http://www.3d-web.com http://www.magiceye.com 11