Visión y Percepción

Anuncio
Capítulo 5: Visión y Percepción
Ingeniero Técnico de Telecomunicación. Esp. Sonido e Imagen. 1er Curso.
Fundamentos Físicos de la Ingeniería.
Profesores responsables: Begoña Hernández Salueña, Carlos Sáenz Gamasa
(Dpto de Física)
M.C. Escher. Waterfall (1961)
Capítulo 5: Visión y percepción
1.- El proceso visual
2.- Sensibilidad espectral del sistema visual
3.- Visión del color
4.- Visión espacial
5.- Visión de formas
6.- Visión binocular
7.- Propiedades temporales del sistema visual
8.- Visión humana y visión artificial
Objetivos del capítulo:
•
Conocer las características principales de los fotorreceptores y su distribución en la
retina
•
Conocer los principales fenómenos relacionados con la visión del color
•
Dar una introducción a los aspectos fundamentales de la visión espacial: agudeza visual,
reconocimiento de formas y teoría de la Gestalt
•
Conocer como percibimos la tridimensionalidad del espacio
•
Dar una introducción a los aspectos temporales de la visión: persistencia visual,
frecuencia crítica de fusión, percepción del movimiento y adquisición temporal de la
información
1
Capítulo 5: Visión y Percepción
1.- El proceso visual
La mayor parte de la información que recibimos de nuestro entorno lo hacemos a través
del sentido de la vista. La visión puede subdividirse en tres etapas:
1.- Óptica: permite la formación de una imagen en la retina
2.- Fotorrecepción: registro de dicha imagen por los fotorreceptores
3.- Procesado neural de la imagen para su interpretación, último eslabón de la percepción
visual
Estímulo
Sistema
óptico
Neurona
sensitiva
(Ojo)
(Células retinianas)
Transmisión
nerviosa
(Nervio óptico)
Sistema
nervioso
central
(Corteza visual)
Esquema del proceso visual
La etapa óptica ha sido estudiada en el tema anterior, en el que vimos el ojo como sistema
óptico y en los mecanismos de formación de imágenes, aquí profundizaremos un poco más
en el conocimiento de los aspectos más importantes de las demás etapas de procesado.
Fotorrecepción
La retina es la membrana fotosensible del ojo que contiene los fotorreceptores:
- conos (cortos y gruesos). Los conos responden a niveles
elevados de luminosidad y son los responsables de la visión
diurna y en color. Nuestra retina posee tres tipos diferentes de
conos con sensibilidades espectrales diferentes.
- bastones (largos y cilíndricos). Los bastones responden a
muy bajas intensidades luminosas y permiten la visión
nocturna sin detalles ni color. Son los responsables de nuestra
capacidad para ver la luz de la luna o de las estrellas. Sólo
tenemos un tipo de bastones que nos ofrecen una percepción
en grises sin ninguna información del color.
Imagen de los dos tipos de
fotorreceptores tomada por un
microscopio electrónico
La retina se puede dividir en dos partes: central y periférica, la
primera, en la que se encuentra la fóvea, responsable de la agudeza visual y la segunda
responsable de la percepción del movimiento.
Estructura de la retina
2
Capítulo 5: Visión y Percepción
Los conos y los bastones se distribuyen por toda la retina, pero con muy diferente
densidad. En la zona central de la fóvea solamente hay conos y su densidad, que en el
centro es de unos 150.000 /mm2, disminuye bruscamente hacia el borde de la retina, donde
apenas se encuentran (4000- 5000). La densidad de bastones, por el contrario crece a partir
de la fóvea pasando por un máximo de 160.000/mm2 a unos 6 mm del centro de la fóvea
(20º) para terminar con 50.000/mm2 al borde de la retina. La zona donde desemboca el
nervio óptico, punto ciego, no tiene células fotorreceptoras.
Distribución de los fotorreceptores en la retina
Dada la diferente distribución de conos y bastones en la retina, en condiciones de baja
luminosidad no sólo no se distinguen los colores sino que además se pierde el detalle ya
que se emplean aquellas partes del ojo de peor
calidad óptica. En visión diurna los bastones
están prácticamente saturados y el proceso de la
visión se realiza a través de los conos. La visión
diurna y la nocturna se debe, por lo tanto a
diferente tipo de fotorreceptores, esto hace que
exista un desplazamiento de la longitud de onda
de mayor sensibilidad entre la visión diurna y la
visión nocturna llamado efecto Purkinje (1823) y
hace que un objeto que de día aparece como rojo,
de noche se vea negro y uno que de día es azul sin
embargo aparezca gris claro.
Sensibilidad espectral del
sistema visual y efecto Purkinje
Trivarianza visual
El ojo al contrario que el oído es incapaz de descomponer un estímulo luminoso en sus
frecuencias o longitudes de onda.
Si definimos la varianza como el mínimo número de parámetros independientes
necesarios para describir un fenómeno, se puede comprobar experimentalmente que se
necesitan 3 parámetros para caracterizar un estímulo luminoso. Este fenómeno se conoce
con el nombre de trivarianza visual y de el se puede deducir que es necesaria la mezcla de
tres colores para conseguir cualquier otro.
Asimismo, cualquier estímulo luminoso podrá ser descrito por tres parámetros:
intensidad, tono y saturación.
3
Capítulo 5: Visión y Percepción
Procesado neural
Cuando los fotorreceptores reciben el estímulo luminoso adecuado se excitan y
transmiten señales a través de sucesivas neuronas en la propia retina. Estas señales alcanzan
la corteza cerebral a través de las fibras del nervio óptico y es allí donde se integra
finalmente la información luminosa.
Después de la etapa de la fotorrecepción las informaciones provenientes de los dos ojos
se cruzan posteriormente, de tal manera que la información de la parte derecha de los ojos
va al hemisferio izquierdo y la de la parte izquierda al hemisferio derecho. El
procesamiento termina finalmente en la corteza visual.
2.- Sensibilidad espectral del sistema visual
Una de las características más importantes de cualquier detector es su respuesta
espectral. El ojo es un receptor selectivo que no responde por igual a las radiaciones de
diferentes longitudes de onda. Por ejemplo no da respuesta por debajo de 380 nm ni por
encima de 780 nm. Aun para luces entre estas longitudes de onda, una misma cantidad de
flujo radiante puede generar una respuesta distinta. La curva que caracteriza la sensibilidad
del sistema visual se denomina Vλ. Esta sensibilidad se refiere únicamente al atributo de la
luminosidad o la claridad, ambas relacionadas con la cantidad de luz que muestra un
campo. Esta curva es la que nos permite pasar de las magnitudes fotométricas a las
radiométricas. Recordemos que existen en realidad dos curvas Vλ, una para alta
luminosidad y otra para baja (Efecto Purkinje).
3.- Visión del color
Teorías y modelos de visión del color
A lo largo de la historia se han elaborado teorías y modelos que intentan explicar el
funcionamiento del sistema visual en lo que se refiere a la visión del color. Históricamente
la primera investigación moderna sobre el color fue realizada por Newton en 1666, cuando
encontró que la luz blanca no era una radiación única, sino que podía ser dispersada por un
prisma en un espectro de gradaciones de color.
- Tricromatismo:
Newton (propiedad de la luz)
Young (naturaleza retiniana)
- Modelos oponentes:
Hering (1870)
- Unificación de modelos, dos etapas de procesado.
Se supuso durante mucho tiempo que el tricromatismo visual era una propiedad de la
luz. Casi 100 años después, Young intuyó la naturaleza retiniana de la trivarianza visual y
propuso en consecuencia una teoría tricromática básica. En ella suponía la presencia en la
retina de tres tipos de conos, capaces de ser estimulados en mayor o menor medida por las
distintas radiaciones. Las sensaciones de color dependerían de las razones de activación de
estos tres tipos de receptores. Estas ideas fueron desarrolladas antes de que se conocieran
los elementos principales de la fisiología de la retina y las ideas de Young fueron ignoradas.
Young murió en 1829 y hasta 1852 sus ideas no fueron retomadas por Helmholtz y
apoyadas por Maxwell.
Aunque con grandes aciertos la teoría tricromática dejaba sin explicar muchos aspectos
de la apariencia de los colores. Hering hacia 1870, intentó resolver las dificultades
4
Capítulo 5: Visión y Percepción
encontradas por las teorías tricromáticas y basándose en que no se observaban colores
verde rojizos ni amarillo azulados, propuso la existencia de unos sistemas oponentes en
algún punto de la ruta visual: un proceso claro-oscuro, otro rojo-verde y otro amarillo-azul.
La teoría de Hering permaneció en el olvido durante muchos años por ausencia de soporte
experimental. Cada una de las teorías puede explicar un conjunto de fenómenos visuales
muy específicos. La unificación de ambos enfoques, considerados opuestos durante
muchos años, comenzó a finales del siglo XIX. A partir de entonces se elaboraron teorías
zonales que combinan una primera fase tricromática, con un segundo estadio de
procesamiento regido por mecanismos oponentes. Esta construcción mixta proporciona
mayor número de grados de libertad y enriquece la explicación de los fenómenos
relacionados con la percepción.
Sensibilidad espectral de los diferentes fotorreceptores
Adaptación cromática, constancia de color y contraste simultáneo
Adaptación cromática: Los fenómenos de adaptación son procesos por los cuales el
sistema visual cambia su sensibilidad como consecuencia de la intensidad de las luces que
observa (la adaptación a la luz y a la oscuridad es bien conocida por todos). Este cambio en
las sensibilidades de los mecanismos de respuesta visual puede también producirse como
consecuencia de la composición espectral de las luces observadas, en este caso se habla de
adaptación cromática. Si permanecemos en una habitación iluminada por lámparas de
incandescencia el estado de adaptación cromática vendrá dominado por la composición
espectral de este tipo de luz, o si estamos al aire libre, el estado de adaptación cromática
tendrá que ver con la composición espectral de lo que conocemos como luz de día.
Constancia de color. Un caso extremo de adaptación cromática
es la constancia de color, en la que se asocia un color a un objeto
independientemente del iluminante bajo el que se observa. En este
caso la sensibilidad de los mecanismos de visión cambia para
mantener la apariencia de color de un objeto. La constancia de
color nos hace ver los objetos conocidos siempre del mismo color
aunque cambie la iluminación. Sin embargo la constancia de color
no se presenta siempre, en numerosas ocasiones podemos
comprobar como cambia el color de los objetos al cambiar la
iluminación, objetos que aparecen de idéntico color bajo una
iluminación son totalmente distintos en otras condiciones
(metamerismo). En este caso el efecto de la adaptación no llega a
compensar totalmente el cambio colorimétrico.
Contraste simultáneo: El último fenómeno que nos queda por
Contraste simultáneo: los
dos rectángulos interiores
son idénticos
comentar es el contraste simultáneo, se trata de los cambios de apariencia de un color que
5
Capítulo 5: Visión y Percepción
se experimentan según el color del campo circundante. El contraste simultáneo no se
puede calificar estrictamente de adaptación cromática, ya que no es una modificación de la
sensibilidad de los fotorreceptores, es más bien una adaptación espacial, cuya explicación
puede encontrarse a nivel neural por la acción inductora de unas partes del campo visual
sobre otras.
Anomalías y deficiencias en la visión cromática
Suponemos implícitamente que los observadores que están contemplando una pintura
perciben los colores tal y como los percibimos nosotros. El pintor supone que quien vea su
cuadro verá los mismos tonos que él. Esta suposición es cierta en el 92% de los hombres y
en el 99,5% de las mujeres.
Alrededor del 8% de los hombres y sólo el 0.5% de las mujeres poseen una visión
anormal del color. Estas personas pueden distinguir generalmente algunos colores, pero
tienen dificultades para discriminar otros. El problema más
común es el de la discriminación rojo-verde.
Los defectos en la visión del color pueden ser
congénitos o adquiridos por algún accidente o algún
agente tóxico, los primeros no se pueden curar, aunque
con el aprendizaje pueden minimizarse, pero los segundos
si que pueden tener tratamiento. (Existen diferentes test
para detectar estas anomalías).
Un observador normal puede apreciar los colores de
manera incorrecta si las condiciones de observación no Test para detectar deficiencias de
color. Los individuos con visión
son las adecuadas:
normal deben ver el número 16
- Visión indirecta, visión con la parte lateral del ojo dentro del círculo
fuera de la fóvea, disminuye la capacidad de discriminación
entre rojo y verde.
- Tamaño insuficiente, si percibimos una imagen que sólo estimula la región de la fóvea,
el tamaño puede ser insuficiente para percibir el color correcto, la discriminación amarillo
azul puede verse seriamente reducida debido a la particular distribución de los conos en la
retina.
- Baja luminosidad, ya hemos hablado que en este caso la visión es monocromática.
- Tiempo insuficiente, se produce discriminación claro-oscuro, pero no hay tiempo de
dar una respuesta de discriminación cromática.
4.- Visión espacial
Cuando contemplamos una fotografía en blanco y negro el estímulo que recibe nuestro
sistema visual es una distribución espacial de luminancias, de la cual la parte óptica del
sistema forma una imagen sobre la retina. La parte neural del sistema (retina-cerebro)
procesa la información espacial contenida en la imagen y la percepción complete el proceso
visual. El resultado de este proceso lleva a reconocer unos objetos, determinar tamaños y
posiciones relativas entre ellos o distinguir entre objetos de igual forma y tamaño por
algunos detalles. El estudio de todas estos procesos es lo que se recoge dentro la visión
espacial. El límite de la visión espacial está íntimamente relacionado con el tamaño del
detalle más pequeño que un observador es capaz de detectar o de reconocer.
6
Capítulo 5: Visión y Percepción
Agudeza visual
La agudeza visual es una medida de la capacidad del sistema visual para detectar, reconocer
o resolver detalles espaciales en un test de alto contraste y con un buen nivel de
iluminación.
Una agudeza visual buena significa que el sujeto es capaz de apreciar pequeños detalles en
una imagen, mientras que una mala agudeza visual implica que e sujeto aprecia solo a
grandes rasgos la imagen.
La agudeza visual se mide con Optotipos que evalúan la capacidad de resolución
Factores que influyen: Tipo de test, Luminancia, localización retiniana y orientación
- Mínimo visible (1’’)
- Anillos de Landolt
- Mínimo separable (40’’-1’)
- Agudeza de red
- Agudeza de vernier(1’-2’’)
- Letras de Snellen
Si el contraste disminuye estos límites varían.
5.- Visión de formas
Vamos a tratar a continuación de una manera muy esquemática el reconocimiento de
formas, qué pautas sigue nuestro sistema visual para a través de la información recogida
por los fotorreceptores elaborar una respuesta o señal de salida.
•
Percepción de bordes
Distinguir el contorno de las figuras y objetos es uno de los
aspectos importantes del reconocimiento de formas y esto
depende de la capacidad para distinguir bordes luzoscuridad. La existencia de discontinuidades en el estímulo
es condición necesaria para que la percepción de la imagen
se mantenga.
•
Distinción entre figura y fondo
La diferenciación entre figura y fondo es un paso fundamental para llegar al
reconocimiento de la forma.
- Creamos contornos al identificar una figura
- La parte más pequeña se suele identificar como figura
- Cuando algo se identifica como figura parece más cercano
y más luminoso
- Cuando se presenta por primera vez no se reconoce si no
está en su orientación habitual
7
Capítulo 5: Visión y Percepción
•
Agrupamiento (Teoría de la Gestalt)
A principios del siglo XX un grupo de sicólogos alemanes formaron la escuela de la Gestalt
(palabra alemana que significa forma). Su idea básica es que “La percepción del todo es
cualitativamente diferente de la suma de las partes”, contraria al estructuralismo que intenta llegar
al conocimiento del sistema visual por el conocimiento de las distintas partes que lo
constituyen.
Según esta teoría el sistema visual realiza agrupamientos según los siguientes criterios:
-Proximidad: los elementos se agrupan en función de su separación
-Semejanza: si la proximidad es igual se asocian semejanzas en la forma
-Mejor continuación: se agrupan los que parecen seguir la misma línea
-Destino común: se agrupan los elementos paralelos
-Unidad: entre varias posibles agrupaciones se elige aquella que conduce a una figura más
completa
-Principio de mejor configuración
•
Ilusiones ópticas:
Son percepciones que producen sensación de irrealidad o imposibilidad.
8
Capítulo 5: Visión y Percepción
6.-Visión binocular
Las imágenes que se forman en la superficie de la retina son bidimensionales y sin embargo
la información que se extrae de ellas permite percibir o reconocer objetos en tres
dimensiones. Para llegar a la percepción del espacio el sistema visual utiliza sobre todo los
indicios derivados de emplear simultáneamente la imagen de los dos ojos que es
ligeramente diferente (disparidad binocular), sin embargo, también en una imagen
monocular se pueden encontrar claves que permiten reconocer las distintas perspectivas
que pueden presentar los objetos, su proximidad o lejanía.
En la naturaleza existen animales que tienen los ojos
muy separados para tener campos de visión muy
amplios mientras que otros tienen los ojos más juntos
para tener más información de la tridimensionalidad y
por lo tanto calcular mejor las distancias.
Cuando miramos a objetos lejanos los dos ojos están
básicamente paralelos, mientras que cuando miramos
a objetos cercanos los dos ojos convergen para
focalizar la misma imagen, esto hace que la
profundidad se observe para objetos cercanos,
mientras que se pierde para los lejanos.
El ojo fusiona las imágenes de los dos ojos para
obtener una única percepción, en cada retina existen
puntos correspondientes.
Disparidad ocular
La estereopsis permite la discriminación de la
profundidad de las escenas observadas
Existen también claves monoculares que nos dan idea de la profundidad como son la
perspectiva, la interposición de objetos, las sombras, los gradientes de texturas, y los
tamaños relativos entre objetos.
9
Capítulo 5: Visión y Percepción
7.- Propiedades temporales del sistema visual
Vamos a ver a continuación algunos fenómenos y conceptos relacionados con las
propiedades temporales del sistema visual.
Persistencia visual y postimágenes
La persistencia visual es el fenómeno por el cual se sigue apreciando durante un tiempo
más o menos largo un estímulo luminoso aun cuando este ha desaparecido. La impresión
visual que produce esta persistencia se denomina postimagen.
Frecuencia critica de fusión (FCF)
Si en lugar de tener un estímulo simple tenemos un estímulo periódico, cuando la
frecuencia es inferior a un determinado valor, el sistema visual percibe una sensación de
parpadeo luminoso, cuando por el contrario la frecuencia es superior a dicho valor deja
de percibirse el parpadeo y el resultado es una sensación de luz estable. La frecuencia a
la que se elimina el parpadeo de una luz periódica se denomina frecuencia crítica de
fusión. La fusión temporal de las luces es consecuencia del solapamiento del estímulo
con el periodo de persistencia del estímulo anterior a la repetición.
* El valor de la frecuencia crítica de fusión está condicionado por distintos parámetros:
luminancia, localización retiniana, tamaño del test y cromaticidad entre otros (tiene un
máximo en unos 60Hz, para un nivel normal de luminancia podemos tomar 30 Hz).
* FCF crece con L, luces débiles se fusionan antes
* A bajas luminancias el parpadeo se observa mejor en la periferia que en la fovea
* FCF aumenta con el tamaño del test.
Adquisición temporal de la información
Nuestra percepción del espacio es continua, sin embargo
nuestros ojos observan una escena saltando de un punto de
fijación a otro
La fóvea subtiende 2º, necesitamos ir situando sobre la fóvea
las distintas partes del campo visual a una frecuencia
superior a la frecuencia crítica de fusión.
La imagen obtenida de la integración espacial y temporal es almacenada en una memoria de
corto periodo como una imagen estable y desaparece tras un tiempo de entre 1 y 3 s.
Percepción del movimiento
La sensibilidad al movimiento es un aspecto fundamental de la visión. Por un lado, muchos
objetos situados en el campo visual se mueven, por otro nosotros mismos nos movemos
dentro de nuestro entorno, lo cual puede producir movimientos en la imagen retiniana.
La primera pregunta que podemos hacernos es cual es la mínima velocidad detectable por
el sistema visual o el desplazamiento mínimo que podemos detectar en la posición de un
objeto. Los estudios realizados por diferentes investigadores dan los siguientes resultados:
- La velocidad mínima disminuye (se detecta mejor el movimiento) cuanto mayor es el
tiempo de exposición del test y la luminancia
- menor en la fóvea, es decir detectamos mejor el movimiento en la parte lateral del ojo
- menor con referencia que sin ella, se detecta antes el movimiento si tenemos un punto de
referencia fijo. (con referencia se obtiene un umbral de 1 o 2 min de arco/s, sin referencia
aumenta hasta 10 veces 10 a 20 min arc/s)
10
Capítulo 5: Visión y Percepción
8.- Visión humana y visión artificial
Por visión artificial se entiende la adquisición y el uso de información visual por una
máquina para controlar un proceso determinado.
El desarrollo de ordenadores cada vez más potentes y sofisticados provoca que muy a
menudo nos planteemos su comparación con el cerebro humano. La rapidez y el volumen
de operaciones son capaces de llevar a cabo, producen la sensación de que su capacidad es
cuanto menos comparable a la de nuestro cerebro. En principio nos puede parecer que la
velocidad de procesamiento de un ordenador es mucho mayor que la del cerebro, sin
embargo aunque el funcionamiento del cerebro es mucho más lento, la información es
tratada de forma concurrente por millones de canales especializados en distintos aspectos,
atributos o dimensiones de la imagen, por lo que la lentitud de funcionamiento no se
traduce en lentitud de procesamiento. Cuando hay que realizar una tarea simple pero
repetitiva el ordenador no tiene competencia en exactitud y velocidad, pero cuando hay que
llevar a cabo una tarea más o menos compleja, la forma de procesar del cerebro es
infinitamente más eficaz. ¿Se puede comparar entonces el cerebro con un ordenador?. ¿Se
puede comparar un pájaro con un avión?. Si en el sentido de que los dos vuelan. Existen
tareas en común entre un ordenador y el cerebro entonces son comparables en cuanto a la
realización de esa tarea se refiere.
Cuando se pretende desarrollar un sistema de visión artificial, lo primero que hay que
preguntarse es para qué se desea y cuales son las tareas que tendrá que realizar. Por ejemplo
detectar una determinada figura o contorno geométrico. Conforme la tarea asignada es cada
vez más complicada, el sistema tendrá que ser capaz de detectar más detalles. Llegar al nivel
de sofisticación de la visión humana es todavía algo muy lejano.
La visión artificial tiene importantes aplicaciones industriales, sobre todo en lo que se
refiere a la automatización de las labores de inspección y clasificación de objetos, así como
el control de máquinas. (ejemplo: códigos de barras)
Visión humana
Visión artificial
Enlaces de interés:
http://www.webvision.med.utah.edu
http://www.3d-web.com
http://www.magiceye.com
11
Descargar