El Sistema de Audición Rafael Martínez Olalla Grupo de Informática Aplicada al Procesamiento de Señal e Imagen (GIAPSI) Universidad Politécnica de Madrid, Campus de Montegancedo, s/n, 28660 Boadilla del Monte, Madrid, Spain e-mail: rmolalla@junipera.datsi.fi.upm.es Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 1/47 Física acústica del sonido Si se cae un árbol en el bosque y no hay nadie para oirlo, ¿hace ruido? Definiciones de sonido: Movimiento organizado de moléculas, causado por un cuerpo vibrante en algún medio (agua, aire, sólidos...). (Fenómeno físico). Sensación auditiva producida a través del oído por la alteración en presión, desplazamiento de partículas o velocidad de las partículas, que se propaga por un medio elástico. (Sensación). Naturaleza del sonido: se produce cuando un cuerpo se mueve hacia delante y hacia atrás con suficiente rapidez como para enviar una onda a través del medio en el que está vibrando. Cualquier sonido “real” se compone de infinitas sinusoides de distintas amplitudes y frecuencias (análisis de Fourier). El nivel sonoro de un sonido se mide en dB Umbral del dolor: SL de I=1 Watt/m2 Umbral audición: SL de I = 10-12 Watt/m2 I1 SL( dB) = 10 • log 10( ) I0 SL=120dB SL=0dB Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 2/47 El pabellón auricular y el canal auditivo Pabellón auricular permite localizar sonidos. Protege al oído Canal auditivo Cilindro irregular con diámetro medio menor de 8 mm. , y longitud de unos 2.5 cm. Actúa como tubo resonante. Realza frecuencias audibles. Para frecuencias 2-5.5 kHz el nivel de presión en el tímpano es aproximadamente 10 veces la presión del sonido en el pabellón auditivo. Esquema del sistema auditivo. Se divide en: • Oído externo • Oído medio • Oído interno Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 3/47 Tímpano Interfaz entre el oído externo y el medio. Las ondas de presión acústica sólo alcanzan el tímpano. A partir de allí: vibraciones mecánicas Las ondas de presión del aire provocan vibraciones en la membrana timpánica (de modo similar a algunos micrófonos). Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 4/47 Oído medio I Contiene: martillo, yunque, lenticular y estribo. Constituyen una cadena de amplificación (el estribo recorre una distancia tres veces inferior al tímpano) Los músculos del oído medio modifican el comportamiento del sistema de huesecillos (sistema de seguridad, análogo a un control automático de ganancia): Esos músculos se pueden mover de forma voluntaria, pero lo habitual es que se muevan de forma refleja al superarse un cierto nivel. Al aumentar el sonido, los músculos se contraen para evitar una presión excesiva sobre la ventana oval. La trompas de Eustaquio comunican el tracto vocal con el oído medio para nivelar presiones Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 5/47 Oído Medio II Tímpano + cadena de huesecillos Transforman vibraciones de aire en vibraciones de fluido Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 6/47 La ventana oval Interfaz entre el oído medio y el interno El estribo pasa las vibraciones a la ventana oval (membrana que cubre una abertura en la cápsula ósea de la cóclea) Ventana oval 15 a 30 veces menos que el tímpano => amplificación necesaria para adaptar las impedancias entre las ondas de sonido en el aire y en el fluido coclear. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 7/47 Resumen de la amplificación desde el oído externo al interno En los 4 cm. Ocupados por el oído externo y el medio tenemos 3 principios físicos para magnificar las vibraciones débiles que llegan, de modo que puedan establecer ondas de presión en un líquido: El tubo de resonancia del canal del oído incrementa la presión del aire unas 10 veces. La cadena de huesecillos la triplica de forma mecánica. La diferencia de superficies entre el tímpano y la ventana oval realiza otra amplificación de unas 30 veces. El resultado de los tres mecanismos es una amplificación de la onda de más de 800 veces. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 8/47 El oído interno Se encuentra alojado dentro del hueso temporal (el más duro del cuerpo). Dentro del oído interno se distinguen: Los canales semicirculares: son el mecanismo de equilibrio del cuerpo y no juegan papel alguno en la audición La cóclea: convierte el sonido en impulsos eléctricos que viajan hasta el cerebro. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 9/47 El oído interno: La cóclea La fuerza mecánica amplificada es transformada en presión hidráulica en la cóclea Esta presión imprime un movimiento en el conducto coclear y en el órgano de Corti. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 10/47 Sección de la cóclea Canales vestibular y timpánico: contienen perilinfa (líquido similar al fluido espinal). Conducto coclear ó medio: contiene endolinfa (similar al fluido celular). Membrana de Reissener (muy estrecha, dos paredes celulares de anchura). Membrana basilar: separa los sonidos en función de su frecuencia. Cualquier rotura de las membranas impediría la audición. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 11/47 Sección de la cóclea Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 12/47 Transmisión de las ondas en la cóclea I Las ondas de presión en la cóclea recorren un camino desde la ventana oval, hasta disiparse en la ventana circular. La membrana basilar es estrecha y tensa al comienzo de la cóclea (junto a la ventana oval), y ancha y distendida al final. Las ondas de presión acústica inducen una onda en la membrana basilar. Los tonos altos provocarán crestas (resonancias) en las zonas tensas de la membrana y los graves en las distendidas. La posición de la cresta determina qué fibras enviarán señales al cerebro. La membrana basilar también recoge la vibraciones del cráneo. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 13/47 Transmisión de las ondas en la cóclea II Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 14/47 Vibración de la membrana basilar I Posición de las resonancias en la cóclea Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 15/47 Vibración de la membrana basilar II Ventana oval Ventana circular Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 16/47 El Órgano de Corti Masa gelatinosa de unos 4 cm. Relacionado con vesículas sensitivas de los peces. Está lleno de fluido y rodeado por otro fluido, así se absorben impactos. (Está incluso aislado de las líneas de suministro del cuerpo, ya que los latidos del corazón serían percibidos como ruido). Los nutrientes se transportan hasta el órgano de Corti a través del fluido endolinfático. La membrana basilar soporta este órgano que consiste en una masa de células que casi tocan el nervio auditivo. De esas células salen unos pelos finos (unos 23500) agrupados ordenadamente como los pelos de un cepillo. Los pelos tienen su parte superior hundida en la membrana basilar y sus raices en las células auditivas. Los pelos actúan como transductores: al moverse la membrana basilar, empuja y tira de los pelos. Esto genera señales eléctricas que estimulan el nervio auditivo. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 17/47 Cortex Auditivo Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 18/47 Camino del impulso al cerebro El sistema de transmisión del impulso desde la cóclea al cerebro contiene 30000 fibras nerviosas que forman el nervio auditivo. Las fibras se agrupan por frecuencias. La medida de la intensidad de un sonido la da el número de fibras que transmiten señal. Desde el cerebro retornan otras fibras que pueden llevar instrucciones al oído para que filtre ciertas frecuencias y se concentre en otras. Tras pasar por el núcleo coclear algunas de las fibras de retorno llegan al oído medio donde controlan los músculos de la cadena de huesecillos. Las fibras que transportan las señales desde la cóclea llegan a zonas diferentes del córtex auditivo dependiendo de la frecuencia que codifiquen. El córtex auditivo está situado en la fisura de Silvio. Los tonos agudos terminan en la parte Digital de la Señal profunda, y losTratamiento graves en la zona másde Voz, Curso 2010/2011. Sistema de Audición fi i l 19/47 Percepción El margen de frecuencias de audición es aproximadamente de 16 Hz a 16.000 Hz. El límite superior decae con la edad (20 KHz en la juventud. 10 KHz en la tercera edad). Los sonidos se distinguen gracias a las propiedades subjetivas del tono, la Tono: relacionado con la frecuencia Elevación: relacionado con la Intensidad Timbre: sobretonos y armónicos El oído es un elemento no lineal: su comportamiento es logarítmico Percepción de direccionalidad: elevación y el timbre Para frecuencias bajas está basada en la diferencia de tiempos en llegar la onda a cada oído. Para frecuencias altas -> diferencia de intensidad Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 20/47 Sensibilidad Sensibilidad: Depende de la frecuencia. Más sensible en el margen 1-5 KHz, (se requiere menos intensidad) Varía con el sujeto y la edad: > 60 años, pierden unos 40 dB para frecuencias mayores de 8.000 Hz. Nivel de Audición: mínima intensidad que produce una sensación de audición. Nivel de Sensación: intensidad a la que se “siente” el sonido. Nivel de Dolor: la intensidad a la que la audición produce ruido. Estos dos últimos umbrales se caracterizan por variar menos con la frecuencia que el nivel de audición. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 21/47 Tono El oído distingue frecuencias. Dependiendo de la frecuencia se estimula un punto u otro de la membrana basilar. El oído es muy sensible a Δf, sobre todo a ⇓f. Discriminación de Frecuencia: mínimo Δf que se puede apreciar en un tono. Considerando el oído como un filtro, este tiene una Q constante, con lo que la resolución espectral es mayor a bajas frecuencias que a altas. Frecuencia Fundamental: no hay una relación lineal entre la frecuencia real fundamental, de un tono puro y la frecuencia subjetiva con la que es percibido. La relación depende en gran medida de la intensidad. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 22/47 Elevación I La elevación aumenta con la intensidad, pero no es lo mismo que ella. Debido a la mayor sensibilidad del oído a las frecuencias medias, los sonidos de igual intensidad parecen más altos en esas frcuncias (a igualdad de intensidades, se oirá más alto un tono de 2000 Hz que uno de 50 Hz.) Gran sensibilidad a variaciones de intensidad: un oyente puede detectar variaciones de 0.5 dB, a f medias e I moderada. A f extremas, así como I bajas, se requieren grandes variaciones de intensidad. Discriminación de intensidad, como el cambio más pequeño en la intensidad del tono que se puede apreciar. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 23/47 Elevación II La intensidad subjetiva del tono (elevación), para tonos de corta duración, depende de esta duración: cuando un sonido se escucha durante un tiempo relativamente alto, su elevación disminuye, aumentando el nivel de audición (es la llamada fatiga auditiva). Al oír dos sonidos simultáneamente (f1 y f2), uno de ellos puede enmascarar al otro. El enmascaramiento es mayor cuando f1~f2. Por lo general, los sonidos bajos enmascaran a los altos más efectivamente que los altos a los bajos. Cuando un tono de intensidad débil se escucha en presencia de un tono próximo, el nivel de audición necesario para oír el primer tono aumenta. Este fenómeno ocurre dentro de unas bandas críticas situadas alrededor del tono enmascarado Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 24/47 Medidas Esta magnitud puede ser o la potencia media de la señal u otra relacionada con ella, que es el volumen. La caracterización en términos de potencia media debe incluir el tiempo de integración en el que se evalúa aquella. La caracterización en términos de volumen incluye ya el tiempo de integración incorporado en la característica del vú-metro. La respuesta auditiva es función de la potencia de señal (proporcional al cuadrado de su amplitud) y la sensación sonora varía con el logaritmo (Ley de Weber-Fechner). Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 25/47 Curvas de Fletcher-Munson I Indican la intensidad de un sonido puro de frecuencia variable necesaria para que produzca una determinada sensación sonora Se mide en fonios y expresa la intensidad de un tono de igual sensación sonora, en dB, con relación al tono de 1000 Hz. I1 SL( dB) = 10 • log 10( ) I0 I0=10-12 Watt/m2 Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 26/47 Curvas de Fletcher-Munson II Igual sonoridad en fonios Igual sonoridad percibida por el oído humano promedio El oído es menos sensible a las bajas frecuencias, y su discriminación de los bajos es más pendiente para los sonidos más débiles Curva del umbral de audición promedio La región de mayor sensibilidad para el oído humano es hacia los 3-4 kHz, y está asociada con la resonancia en el canal auditivo La intensidad sonora en dB no refleja directamente los cambios en la sensibilidad del oído con la frecuencia y con el nivel sonoro Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 27/47 Curvas de Fletcher-Munson III Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 28/47 Audiometrías Prueba o test que determina las pérdidas auditivas de un sujeto Tipos: De conducción aérea. ) Audiometrías de tonos puros ) Audiometría vocal De conducción ósea. La comparación de ambas o Rinne audiométrico. Audiometría de un paciente con audición normal en el oído derecho (triángulos) y una ligera pérdida de audición en el oído izquierdo (círculos). Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 29/47 Audiometría de tonos puros Se realiza exponiendo al paciente a tonos de distinta frecuencia y de distinta amplitud. Umbral de detectabilidad, en el que se empieza a sentir, para un sonido continuo, una sensación interrumpida, irregular, en la cual no es posible reconocer la frecuencia. Umbral de audibilidad, que es en el que verdaderamente se percibe el sonido. Esta generalmente 5 dB por encima del anterior (de ahí que los saltos de energía en los audiómetros sean de 5 en 5 dB). Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 30/47 Audiometría vocal Umbral de inteligibilidad: el sujeto oye y comprende el vocablo pronunciado. Dos grupos de pruebas vocales: Test de inteligibilidad (o audiometría vocal corriente) Listas de palabras monosilábicas. ) Listas de palabras bisilábicas. ) Listas de frases. ) Test fonéticos. ) Realizados con unos fonemas, que no están siempre incluidos en vocablos, pueden ser efectuados con: • Listas monosilábicas sin significación. • Listas fonéticas. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 31/47 Audiometría ósea Cuando la patología está en el oído externo. En estas condiciones, el sonido no llega perfectamente a la cadena de huesecillos. Se utilizan unos vibradores que se suelen colocar, o bien en la frente, si se pretende testear ambos oídos a la vez, o bien en el mastoides. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 32/47 Patologías del oído Sordera de transmisión pura: se trata de un trastorno más o menos grande de la resistencia al paso de la vibraciones acústicas. Sordera de percepción pura: es mucho más compleja, pues ya no es un simple obstáculo mecánico a sobrepasar para transmitir las vibraciones acústicas hasta una cóclea intacta, como en la afección de la transmisión, sino que es ese mismo órgano el que ya no funciona normalmente. Sordera mixta. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 33/47 Implantes cocleares I La cóclea "clasifica" los sonidos por frecuencia: los tonos más altos hacen vibrar la membrana basilar más cerca de la ventana redonda, y los tonos más bajos hacen vibrar la membrana basilar más cerca al ápice de la cóclea. En algunos tipos de sordera profunda hay una destrucción de las células ciliadas (del órgano de Corti). Transductor que transforma señales acústicas eléctricas que estimulan el nervio auditivo. en señales Consta de una prótesis interna que se fija quirúrgicamente y una parte externa que recoge los sonidos y los selecciona, codifica y transmite al receptor interno. La rehabilitación, es fundamental. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 34/47 Implantes cocleares El sonido se captura por un pequeño micrófono localizado en la cápsula que se sitúa detrás de la oreja. El procesador de voz filtra, analiza y digitaliza el sonido en señales codificadas. Las señales codificadas se envían del procesador de señal a la bobina de transmisión. La bobina de transmisión envía las señales codificadas como señales de FM al implante coclear que se encuentra bajo la piel. El implante coclear entrega la energía eléctrica apropiada al array de electrodos que ha sido insertado en el interior de la cóclea mediante operación, y éstos estimulan las fibras nerviosas remanentes que le quedan al paciente. Implante coclear. Componentes: 1. Array de electrodos. 2. Receptor para el array de electrodos. 3. Procesador de voz, colocado en el bolsillo. 4. Bobina transmisora 5. Micrófono, colocado detrás de la oreja Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 35/47 Implantes cocleares Inserción del implante Medel C40+ Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 36/47 Implantes cocleares Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 37/47 Implantes cocleares Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 38/47 Implantes cocleares Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 39/47 Esquema de un implante Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 40/47 Elementos de un implante Electrodos: Número y configuración (Bipolar/monopolar). Transmisión: Transcutánea o percutánea. Estimulación: Analógica / pulsante. Simultánea/secuencial. Información a transmitir: Forma de onda o parámetros. Electrodes Device Type of stimulation Transmission link Number Spacing Configuration Ineraid 6 4 mm Monopolar Analog percutaneous Nucleus 22 0.75 mm Bipolar Pulsatile transcutaneous Clarion 1.0 8 2 mm Monop./Bipolar Analog/Pulsatile transcutaneous Med-El 8 2.8 mm Monopolar Pulsatile transcutaneous Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 41/47 Electrodos Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 42/47 Tx transcutánea / percutánea Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 43/47 Estimulación Estimulación analógica / pulsante. Analógica: Se excitan los electrodos con la señal de voz. En monoelectrodo con toda la señal, en multielectrodo con salidas de filtros paso banda. Pulsante: Con pulsos proporcionales a la energía de la señal. Estimulación simultánea / secuencial. Simultánea: Todos los electrodos a la vez (produce enmascaramiento de frecuencias). Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 44/47 Excitación de los electrodos palabra “CHOICE” Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 45/47 Inteligibilidad Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 46/47 Medidas de bondad de un implante Se prueba la capacidad para reconocer frases, palabras monosilábicas y fonemas (vocales y consonantes), en este último caso se meten dentro de palabras en las que solo varíe el fonema a estudiar. Hay algunos test estándar para poder comparar resultados: UN-6 (Northwestern University): 50 palabras monosílabas. Test CID (Central Institute for the Deaf): 100 palabras clave. Sentencias de uso cotidiano y 25 palabras bisílabas. Test de IOWA: sentencias, consonantes y vocales, en un CD. Tratamiento Digital de la Señal de Voz, Curso 2010/2011. Sistema de Audición 47/47