Medición de Función de Transferencia con sweeps DIRECTOR’S CUT INCLUDING PREVIOUSLY UNRELEASED MATERIAL SWEN MÜLLER, miembro AES Institut für Technische Akustik, RWTH, 52056 Aachen, Alemania Y PAULO MASSARANI Laboratório de Ensaios Acústicos, INMETRO, Xerém, Duque de Caxias (RJ), Brasil TRADUCIÓN: MAURICIO URIBARRI Y JAIME UNDURRAGA LUCERO Departamento de Acústica, Universidad Pérez Rosales, Santiago, Chile Comparado a usar señales pseudo-aleatorias, las mediciones de función de transferencia usando sweeps como señal de excitación muestran significativamente mayor inmunidad contra la distorsión y varianza de tiempo. Capturar respuestas impulsivas binaurales de salas con propósitos de auralización de alta calidad requiere una relación señal-ruido mayor a 90 dB que no es factible lograr con mediciones con MLS debido a la no linealidad del altavoz, pero fácilmente alcanzables con sweeps debido a la posibilidad de remover completamente la distorsión armónica. Antes de investigar las diferencias y problemas prácticos con mediciones con MLS y sweeps y discutir porque los sweeps son una mejor opción para la mayoría de las mediciones, serán revisados los métodos existentes para obtener la función de transferencia. Será dirigida la necesidad de usar señales de excitación pre-enfatizadas en mediciones acústicas. Es presentado un método para crear sweeps con contenidos espectrales arbitrarios, pero con envolvente temporal con dependencia de frecuencia constante o prescrita. Es investigada la posibilidad de analizar simultáneamente función de transferencia y armónicos. 0 INTRODUCCIÓN La medición de funciones de transferencia y sus respuestas impulsivas asociadas es una de las tareas más importantes en todas las áreas de la acústica. Está técnica prácticamente es necesaria en todo. Un desarrollador de altavoces chequeara la respuesta de frecuencia de un nuevo prototipo muchas veces antes de la entrega para la producción. Como la respuesta en el eje central no es suficiente para caracterizar un altavoz, es necesario un completo conjunto de mediciones polares de los datos. En acústica de salas, la respuesta impulsiva juega un rol central, ya que una gran cantidad de parámetros acústicos relacionados con la calidad de la percepción pueden ser derivados de ésta. En acústica de locales, el aislamiento del ruido depende de la frecuencia. En vibro-acústica, la propagación de las ondas de sonido en los materiales y la radiación desde su superficie tiene un vasto campo de simulación y verificación de las mediciones con vibradores. También es usada para la detección de reflexiones (sonar, radar) y otras áreas relacionadas a la medición de respuestas impulsivas. Mientras muchas de estas tareas de mediciones no requieren un excesivo rango dinámico, es diferente cuando se trata de adquirir la respuesta impulsiva de una sala (RIR) para usarla en la convolución de audio en condiciones de campo libre. Debido al amplio rango dinámico de los sistemas de los auditorios y la relación logarítmica entre el SPL y la sonoridad percibida, cualquier anomalía en la parte final del tiempo de reverberación de una RIR es fácilmente reconocible. Esto se siente especialmente cuando pronunciaciones con largas pausas intermedias son usadas para la convolución y cuando los resultados de la auralización son monitoreados con audífonos, como se requiere para “realidad virtual” basada en respuestas binaurales. Con la tecnología digital de hoy, la relación S/R supera los 110 dB, por lo que no parece ser muy osado atreverse a pedir una relación S/R para la adquisición de RIRs que sea como mínimo equivalente a los 16 bit del CD estándar. Este trabajo ha sido motivado por la constante decepción de las mediciones RIRs basadas en MLS. Bajo condiciones óptimas, con la suposición de ausencia de varianza del tiempo, muy poco ruido de fondo, apropiado pre-énfasis y un número de promedios sincrónicos arbitrarios, parece imposible lograr un rango dinámico superior a ese, supongamos, en un grabador de cinta análogo. En cualquier medición que se utilice ruido como señal de excitación, distorsión (muchas veces inducido por el altavoz) se reparte en todo el período de medición de la respuesta impulsiva, el nivel de ruido resultante puede ser reducido utilizando largas señales de excitación, pero nunca será excluido enteramente. La distorsión puede ser reducida usando un nivel bajo, pero esto conduce a que el ruido de fondo contamine el resultado. Por lo tanto, el nivel comprometido debe ser ajustado arduamente para cada lugar de medición [34], frecuentemente dejando las capacidades del amplificador de potencia y del altavoz poco explotadas. En contraste, el uso de sweeps como señales de excitación muestra un mejor alcance de esas limitaciones. Usando sweeps algo mayores que la RIR a ser recobrada permite excluir toda la distorsión armónica producida, prácticamente dejando solo el ruido de fondo como limitación para alcanzar la relación S/R. De esta manera los sweeps pueden ser alimentados con una potencia considerablemente mayor en el altavoz sin introducir señales artificiales en la RIR adquirida. Además en condiciones anecóicas la distorsión puede ser clasificada como únicos armónicos asociados a la fundamental, permitiendo la medición simultanea de al función de transferencia y la distorsión en función de la frecuencia. Esta posibilidad es anticipada por Griesinger [1] y descrita por Farina [2] y será examinada en la sección 5. Las mediciones basadas en sweeps son considerablemente menos vulnerables a las nocivas varianzas de tiempo. Por esta razón a veces son la única opción para mediciones exteriores de larga distancia bajo condiciones ambientales adversas o mediciones con grabación analógica. 1 MÉTODOS EXISTENTES En el siglo pasado se utilizaron diferentes formas de medición de la Respuesta Impulsiva. El punto en común de todas ellas es que existe una señal de excitación (estímulo) que contiene todas las frecuencias de interés para el dispositivo bajo prueba (device under test, DUT). La respuesta del DUT es capturada y de alguna forma comparada con la señal original. Por supuesto siempre existe una cantidad de ruido que reduce la certeza de la medición. Sin embargo, es deseable usar señales de excitación con alta energía para obtener una buena relación señal-ruido en todo el rango de frecuencias de interés. Usando técnicas gating o compuertas para reducir ruido y reflexiones no deseadas, se puede mejorar la relación Señal-Ruido, pero esto produce variaciones no lineales y varianza de tiempo, como comúnmente se observa en mediciones acústicas. Se realizará una breve descripción del comportamiento de los diferentes métodos de medición. 1.1 Grabador de Nivel (Level Recorder) Uno de los métodos de medición más antiguos de llevar la función de transferencia a un papel ya involucraba sweeps como señal de excitación. La respuesta del DUT a un sweep creado por un generador análogo es rectificada y suavizada por un filtro pasabajo. El voltaje resultante es llevado a un amplificador diferencial cuya otra entrada es el voltaje derivado por un potenciómetro de precisión que es mecánicamente acoplado a un lápiz de escribir. La salida del amplificador diferencial controla el lápiz que pasa sobre un papel que contiene una escala apropiada. El potenciómetro puede ser lineal o logarítmico, para producir lecturas en el papel de dB. Obviamente este método no necesita circuitos digitales y fue usado como estándar de medición de respuesta de frecuencia por muchos años. La señal de excitación usada es un sweep logarítmico, esto quiere decir que la frecuencia aumenta por un factor fijo por unidad de tiempo. El papel se mueve con velocidad constante, la escala de frecuencia en el papel es correspondientemente logarítmica. El espectro de un sweep logarítmico decae 3 dB/oct. Cada octava comparte la misma energía, pero esta energía debe ser repartida sobre un ancho de banda mayor, por lo tanto la magnitud de cada componente de frecuencia disminuye. Una de las ventajas es que la distribución espectral tiene una buena adaptación con el ruido ambiental, resultando una buena relación señal ruido incluso en bajas frecuencias. A pesar que el método de grabador de nivel no puede suprimir el ruido o reflexiones, se puede suavizar la respuesta reduciendo la velocidad del lápiz. El ripple en una respuesta de frecuencia causado por una reflexión es convertido en un movimiento irregular del lápiz, que puede ser “alisado” de esta simple manera. Si los detalles espectrales son muy confusos por la reducción de sensibilidad del lápiz, se puede corregir reduciendo la razón del sweep para obtener la resolución requerida. De esta manera existe un compromiso entre el largo y la certeza de la medición, al igual que en los métodos modernos basados en proceso digital de señales. La deficiencia del método Grabador de Nivel (level recorder) es que no entrega información de la fase y el espectro es almacenado en una hoja de papel, en vez de ser almacenado en un disco duro como otros métodos. Claramente la exactitud horizontal de las frecuencias no es comparable con las de procesos digitales como los basados en clock de cuarzo de los conversores AD-DA. En la escala vertical, la resolución de las lecturas de amplitud en dB están restringidas por la naturaleza discreta de los servopotenciómetros que está compuesto por un número discreto de resistencias de precisión. 1.2 Espectrometría por retardo de tiempo (TDS) TDS (time delay spectrometry) es otro método para encontrar las funciones de transferencia con ayuda de sweeps, diseñado por Heyser [3-6] especialmente para la medición de altavoces, también es aplicable para las mediciones de acústica de salas o cualquier otro sistema LTI en general. La principal funcionalidad de un analizador TDS se muestra en la fig.1. Fig1: Procesamiento de señal TDS El analizador muestra un generador que produce dos señales sinusoidales simultáneamente en fase. El seno es llevado al altavoz bajo prueba (LUT, loudspeaker under test) y la respuesta capturada es multiplicada separadamente por ambas señales originales, el seno (para obtener la parte real de la función de transferencia) y el coseno (que tiene un desfase de 90 grados respecto al seno), para obtener la parte imaginaria. La salida del multiplicador es filtrada por un filtro pasa bajos con frecuencia de corte fija. El multiplicador actúa similar a los mixers usados en etapas de frecuencia intermedia de receivers HF (principio superhet), produciendo la suma y diferencia de las frecuencias de entrada. La suma de los términos de ambas salidas de los multiplicadores es rechazada por el filtro pasa bajos, mientras que los términos de la diferencia pueden pasar dependiendo de su frecuencia. Si ambas frecuencias, la generada y la capturada, son iguales, la frecuencia de salida de la diferencia será mucho menor y de ésta manera no será atenuado por el filtro pasa bajos. Como el sonido que viaja desde el LUT al micrófono llega con un retardo, su frecuencia momentáneamente será menor que la del generador de señales. Esto causa una diferencia de frecuencia mayor a la salida del mixer que, dependiendo de su frecuencia de corte, será atenuado por el filtro pasa bajos. Por esta razón la señal generada debe tener un “retardo de tiempo” por una cantidad equivalente a la distancia entre el alto parlante y el micrófono antes que sea multiplicada por la respuesta del LUT. De esta manera, la diferencia de frecuencia será cercana a una señal DC. Como sabemos, las reflexiones siempre tendrán un camino mayor que el sonido directo, de esta manera llegaran con una frecuencia instantánea menor, causando mayores componentes de frecuencia en la salida del multiplicador por lo que serán atenuados por el filtro pasa bajos. Con una selección apropiada de la razón del sweep y la frecuencia de corte del filtro pasa bajos, al utilizar TDS es posible simular mediciones casi en campo abierto. No solo las reflexiones molestas serán atenuadas, también serán atenuados las distorsiones (que llegan con una frecuencia instantánea mayor y producen una frecuencia mayor a la salida del mixer, por lo tanto serán suprimidas por los filtros) y ruidos (gran parte del rango de frecuencias sobre la frecuencia de corte del filtro pasa bajos). La cancelación controlada de las reflexiones es la causa por la cual los analizadores TDS utilizan sweep lineal ( df dt = cte como señal de excitación). La diferencia de frecuencia entre el sonido directo entrante y las reflexiones quedarán en su totalidad sobre el rango del sweep, manteniendo la atenuación de cada reflexión independiente de la frecuencia. Si se utiliza un sweep logarítmico el filtro pasa bajo podría incrementar su frecuencia de corte por un factor constante por tiempo para evitar el estrechamiento de la ventana de tiempo impuesta (el impacto del filtro pasa bajos en realidad es similar a la ventana de una respuesta impulsiva en los métodos de la FFT). Por otra parte las componentes de altas frecuencias de la típica respuesta de impulso de un altavoz decaerán mucho más rápido que las de baja frecuencia. Así un estrechamiento de la ventana en altas frecuencias (correspondiente a “ventanas adaptativas” propuesto por Rife para los procesos de respuesta impulsiva) serán deseables para muchos escenarios de medición. Esto podría incrementar la relación señal ruido en altas frecuencias, sin dañar la respuesta impulsiva más que en las bajas frecuencias. Existen un sinnúmero de inconvenientes asociado con la medición de TDS. El más serio es el hecho de que TDS la utiliza sweep lineales y por lo tanto tiene un espectro de excitación blanco. En muchas configuraciones de medición, esto dejara una pobre relación señal ruido en baja frecuencia. Si todo el rango de audición de 20 – 20 kHz es barrido en 1 segundo, entonces el rango hasta los 100 Hz sólo recibirá energía durante 4 ms. Esto muchas veces es insuficiente en una región de frecuencias donde la salida del altavoz disminuye mientras el ruido ambiente se incrementa. Para mejorar esta mala distribución de energía espectral los sweeps son hechos muy largos, o las mediciones separadas en dos rangos, por ejemplo bajo y sobre los 500 Hz. Ambos métodos extienden el tiempo de medición mucho más de lo que sería necesario físicamente para el desarrollo de una medición de una resolución espectral particular. Otro problema es el ripple que ocurre en baja frecuencia. Como previamente se mencionó el multiplicador produce los términos de la suma y diferencia de la señal de excitación “retardada en el tiempo” y la respuesta en camino. En frecuencias altas, la suma es suficientemente grande para ser atenuada por el filtro pasa bajos de salida. Pero en el rango bajo del sweep, donde la suma se aproxima o es menor que la frecuencia de corte del pasa bajos, aparecerá un “golpe” (beating) en la magnitud de la respuesta obtenida. Para remediar esto los sweep pueden ser hechos muy largos y la frecuencia de corte del filtro pasa bajos disminuirá por este mismo factor. Sin embargo el mejor método es repetir la medición con una configuración espejo, que consiste en excitar el DUT con un coseno en vez de un seno y tratar de capturar la señal como se muestra con las líneas punteadas en la fig.1b. La parte real del resultado complejo de esta segunda medición es añadida a la parte real obtenida en la medición anterior, mientras la parte imaginaria es restada. El efecto de esta operación es que la suma de los términos a la salida del mixer será cancelada, como se muestra en [7-9]. Como una consecuencia, gracias a la ausencia de la interferencia de los términos sumados sobre todo el rango del sweep, las etapas del filtro pasa bajos siguientes del multiplicador pueden ser omitidas. De hecho ellas tienen que ser omitidas si es recuperada una respuesta al impulso completa, un caso en que obviamente el impacto de la atenuación de las reflexiones causado por el filtro pasa bajos no es deseada Ciertamente las mediciones de salas acústicas, en las que siempre implica obtener largas respuestas impulsivas, son solo realizables con el método de excitación doble. Si sin embargo el objeto de interés es un altavoz, se requiere mantener el filtro pasa bajos insertado en orden para rechazar las reflexiones, ruido y armónicos. Fig 1b: Completo procesamiento de señal TDS. La ruta de la línea punteada es usada en la segunda partida de una medición de excitación doble. Igual que la cancelación de los términos sumados en el método de doble excitación, algún ripple podría aparecer al comienzo y al final del rango de frecuencias del sweep debido al abrupto principio del sweep lineal. Por la teoría de sistemas el comienzo de una señal sinusoidal corresponde a un espectro corrugado cerca de la frecuencia inicial ver fig.15. Una manera común de enfrentar este problema es permitir que el comienzo del sweep de excitación este muy por debajo de la frecuencia de interés, esto podría implicar comenzar el sweep en frecuencias negativas que en la práctica quiere decir se comenzará en la correspondiente frecuencia positiva, bajando a 0 Hz y después incrementando la frecuencia normalmente [8]. Una mejor posibilidad podría ser formular un sweep de excitación en el dominio espectral para crear una señal que no sufra pérdida espectral (ver fig.16), como se demostrará en el capitulo 4.2. Por supuesto, es necesario el uso del método de excitación doble para recobrar un completa IR que se extienda más allá del tiempo necesario para completar la medición del TDS. Por otra parte los métodos de FFT o MLS que utilizan estímulos periódicos en la practica requieren una señal de excitación que se emita dos veces para recobrar la respuesta impulsiva periódica. Con estos métodos la respuesta periódica del DUT es capturada sólo en la segunda emisión después de la estabilización. Por el contrario el método de la doble excitación TDS utiliza ambas, lo que atribuye la ventaja de aumentar 3 dB de relación señal ruido sobre MLS, con la misma longitud de excitación (ambos tienen espectro blanco). Con la ausencia del filtro pasa bajos la resolución espectral de la medición TDS es tan alta como con una excitación periódica de una misma longitud de periodo. Así una medición de doble excitación TDS requiere el mismo tiempo que una edición MLS para conseguir la misma resolución espectral, esto contrasta de algunas comparaciones entre TDS y MLS en la literatura [13] en donde se asume un cierto filtro pasa bajo y se calcula una correspondiente resolución de frecuencia, en un intento por demostrar que se necesita un largo sweep para obtener la resolución de una medición MLS sin ventana. Pero por supuesto el impacto del filtro pasa bajo TDS es equivalente a aplicar una ventana para recuperar la IR, y cualquier ventana reduce la resolución espectral. La posibilidad de realizar mediciones simulando campo libre y el efecto de suavizado de las reflexiones es muy bien recibido en las mediciones de altavoces con ambos métodos (al menos en las octavas superiores). Sin embargo, la relación entre la razón del sweep TDS, la frecuencia de corte del filtro pasa bajos y la atenuación conseguida por las reflexiones tardías no es evidente inmediatamente, a pesar de que no es muy difícil de calcular [10]. Pero es más intuitivo analizar la IR completa derivada por mediciones MLS y FFT (o excitación dual TDS) y posicionar una ventana cuyo lóbulo derecho termina justo antes de la primera reflexión molesta. De esta manera, todas las reflexiones siguientes son eliminadas. En contraste, después de varios ajustes de la frecuencia de corte, TDS no es capaz de suprimir las reflexiones debido a la pendiente limitada de los filtros pasa bajos (permitiendo solo el uso de una versión digital FIR de alto orden). El efecto de suavizado en las funciones de transferencia recuperadas no es muy definido, mientras que el uso de ventanas [33] ofrece un buen y claro compromiso entre el ensanchamiento del lóbulo principal y la supresión del lóbulo lateral. Usando solamente sweeps en conjunto con análisis FFT, sin multiplicadores produce resultados inmediatos, obviamente muchos problemas inherentes a TDS, especialmente la insuficiencia de energía en bajas frecuencias y los largos ciclos de medición. Sin embargo no pueden ser ignoradas muchas ventajas de las mediciones TDS sobre MLS. El mencionado aumento de la relación señal ruido en una medición de doble excitación TDS puede ser aumentada aun más tomando ventaja del bajo factor de cresta de solo 3 dB inherente al barrido senoidal. En la práctica, MLS tiene un factor de cresta de cresta de al menos 8 dB como se dará a conocer posteriormente. La medición TDS también ofrece alta tolerancia contra la varianza del tiempo y mejor rechazo a la distorsión armónica que puede ser filtrada junto con el ruido y las reflexiones. 1.3 Análisis FFT de dos canales El principio básico del análisis FFT de dos canales (dual-channel) consiste en dividir el espectro de salida el DUT con el de la señal de entrada, como en todos los métodos de medición de la función de transferencia basados en FFT. Sin embargo, la fuente de ruido tradicional de los analizadores de dos canales es no determinístico y por lo tanto su espectro no puede ser conocido previamente. Esto influye en capturar y procesar la entrada y la salida simultáneamente. Aunque esto parece una desventaja en comparación con otras técnicas que solo requieren un canal, el principal inconveniente la FFT tradicional de dos canales es la naturaleza de la señal de entrada comúnmente empleada. Esta usualmente tiene un espectro blanco (o rosado) cuando es promediada por un largo tiempo, pero una foto instantánea del ruido de la señal tiene un espectro corrugado que sufre profundas depresiones de magnitud. Así, un analizador de dos canales debe promediar varias mediciones antes de presentar un resultado confiable. Como en algunos intervalos del análisis, la relación señal ruido es deficiente en algunas frecuencias, estas deben ser eliminadas del proceso de promediado debido a la división de ambos canales, ya que ésta podría provocar un gran error que impedirá mostrar la respuesta de frecuencia. La detección de la deficiencia de la relación señal ruido comúnmente es realizada por la función de coherencia [12], [13]. Debido a la necesidad de promediar muchos bloques de datos para obtener un resultado consistente, la sensibilidad del análisis de dos canales es bastante deficiente y la hace poco atractiva para propósitos de ajuste. Fig 2. Etapas del procesamiento de señales para un análisis de FFT de dos canales usando un programa musical como señal de excitación. En mediciones acústicas tiene que ser conocido el retardo preciso del camino de transmisión acústica, pues la señal directa será retrazada en ésta cantidad de tiempo para analizar los correspondientes trozos de la señal de excitación (ver fig. 12). Además, con el fin de evitar los efectos de pérdida, los bloques de señal considerados en el análisis de FFT deben ser pasados por una ventana. Esta es una importante fuente de error, ya que las componentes retrasadas son atenuadas más que el sonido directo. El análisis de dos canales puede ser mejorado considerablemente, generando la IR de cada medición mediante la IFFT. El uso de ventanas en la IR ofrece una libertad importante para controlar la cantidad de reflexiones consideradas en el resultado y para eliminar el ruido fuera del intervalo de la ventana, así mejora el proceso de convergencia. No todos los analizadores de dos canales ocupan esta útil característica que no es incluida en la fig.2. Hay una aplicación bien conocida para el análisis de dos canales que ninguna otra tecnología de medición ofrece: La posibilidad para medir sistemas de sonidos discretamente durante un espectáculo, usando el mismo material del programa como señal de la excitación. Sin embargo, música con distribución espectral impredecible es usualmente una peor señal de excitación que lo ruidos no correlacionados y requiere periodos de promediado incluso mayores para obtener resultados confiables. De este modo, cuando no se necesita ser discreto, es aconsejable usar un generador de ruido como fuente. Se pueden obtener resultados mejores en un tiempo más corto usando señales determinísticas hechas a la medida con técnicas FFT. 1.4 Senos paso a paso (Stepped Sine) Probablemente el método que ocupa la mayor cantidad de tiempo para obtener la función de transferencia del DUT es la excitación paso a paso (stepped sine) con tonos puros incrementando su frecuencia. La respuesta del DUT a la estabilidad de la excitación puede ser analizada filtrando y rectificando la fundamental, o realizando la FFT y recuperando la fundamental del espectro. El método anterior requiere el uso de un seno que es exactamente periódico dentro de las fronteras de una longitud del bloque de la FFT para evitar una pérdida espectral (leakage). En la práctica, esto solo puede ser realizado generando un seno digital, y emitiéndolo vía el conversor DA que es sincronizado con el conversor AD. Además el método de la FFT permite la completa eliminación de todas las otras frecuencias, por lo que este método es preferido sobre el análisis del dominio del tiempo que involucra filtros pasa banda, con una restringida selectividad y precisión. Después de cada medición la frecuencia del sweep de excitación es elevada al valor acorde a la resolución espectral deseada. En mediciones acústicas la frecuencia será incrementada por la multiplicación al valor previo por un factor para obtener el espaciamiento logarítmico. Claramente la resolución espectral en las mediciones de stepped sine es baja en altas frecuencias comparada con la obtenida usando una señal de excitación de banda ancha con análisis FFT. Pero no necesariamente es una desventaja ya que la resolución fina es poco usada en altas frecuencias mientras que la pérdida de información en bajas frecuencias, proveída por la FFT en el mismo intervalo de tiempo usado, es más pequeña. La mayor ventaja del método stepped sine es la enorme relación señal ruido que puede ser obtenida para una medición. Toda la energía es concentrada en una única frecuencia, y la onda senoidal de alimentación tiene un factor de cresta de solo 3 dB, permitiendo la estabilidad en un alto nivel continuo. De esta manera, la certeza y repetibilidad para una frecuencia puede ser mucho mayor comparado con una excitación de banda ancha, especialmente cuando usamos la técnica de sincronización de FFT. Es por esto que a pesar de la considerable cantidad de tiempo para completar la evaluación de la función de transferencia, este método es aun popular para mediciones de precisión y calibración de equipamiento electrónico, o transductores acústicos como micrófonos. Este método también es estable cuando se requiere precisión para medir la distorsión. Cada armónico puede ser escogido con una alta precisión del espectro de la FFT. Sin embargo, cuando solamente la función de transferencia es de interés, el método de stepped sine no es bueno. Sólo parte de la energía emitida por el DUT puede ser usada para el análisis, ya que después de cada cambio a una nueva frecuencia, debe ser esperado un cierto tiempo antes que el DUT quede en estado estable. Especialmente cuando existen resonancias de alto Q (correspondiente a largas IR), este tiempo debe ser muy largo para reducir errores a niveles insignificantes. Por otro lado, cuando el sistema es muy ruidoso y deben ser realizados muchos promedios sincrónicos para obtener una mejor certeza en la medición, el tiempo juega un rol menor [14]. En mediciones acústicas con tonos puros, solo es posible eliminar las reflexiones cuando la diferencia de tiempo entre el sonido directo y reflejado es mayor que el intervalo del análisis. Esta es una clara desventaja comparada con los métodos que recuperan la respuesta impulsiva. La precisión alcanzable con la medición de un tono (single tone) también debe ser puesta en duda. Debe quedar claro que la misma precisión puede ser obtenida con una medición de banda ancha en un tiempo menor. Mientras las mediciones stepped sine entregan magnitudes de una única frecuencia con una muy alta relación señal ruido, una medición de banda ancha entrega muchos valores en un intervalo particular de frecuencias. Claramente cada uno de ellos tiene menor certeza, pero realizando una suavización espectral sobre un ancho correspondiente al incremento de frecuencia usado en la medición de tonos puros, el ruido aleatorio debe disminuir a valores comparables. Esto, sin embargo, asume que la distorsión armónica producida puede ser totalmente eliminada de la medición de banda ancha, una condición que sólo puede ser realizada por mediciones con sweep, como se dará a conocer posteriormente. 1.5 Impulsos Usar un impulso como señal de excitación es la manera natural de obtener la IR y también la más sencilla aproximación para el desarrollo de la medición de función de transferencia basada en la FFT. El impulso puede ser creado por medios análogos o preferentemente enviándola por un conversor DA y amplificándola. Este alimenta al DUT cuya respuesta es capturada por el micrófono, amplificada y digitalizada por un conversor AD (Fig. 3). Como el nombre lo indica, esta respuesta capturada ya es la IR deseada, siempre que el estilo del pulso Dirac utilizado tenga una respuesta de frecuencia lineal. Para aumentar la relación Señal-Ruido el pulso puede ser repetido periódicamente, y las respuestas de cada periodo sumadas. Esto permite que la respuesta periódica al impulso (PIR) sea prácticamente igual a la no periódica (IR) si es que esta es más corta que la medición periódica (en la práctica: si la IR se desaparece con el ruido de fondo antes del fin del período). Como es sabido tales promedios sincronizados permiten una reducción de ruido de 3 dB cuando el ruido es no correlacionado, relativo a la IR por cada duplicación del número de promedios. Fig 3: Procesamiento de señales para la medición de la función de transferencia con impulsos. La IR opcionalmente puede ser desplazada a la izquierda (o la PIR desplazada de manera cíclica) para compensar el retardo producido por el tiempo de llegada entre el altavoz y el micrófono de la medición acústica. La aplicación de ventanas elimina reflexiones indeseadas y aumenta la relación S/R. La IR puede entonces ser transformada en una función de transferencia por la FFT. Para aumentar considerablemente la precisión de la medición, el resultado debe ser multiplicado por un espectro de referencia. Este espectro de referencia es obtenido por la conexión de la entrada y la salida del sistema de medición e invirtiendo la función de transferencia medida. Aplicando esta técnica (independientemente del tipo de la señal de excitación) ofrece la libertad de realizar un pre-énfasis de la señal de excitación para adaptarla a las contribuciones espectrales del ruido de fondo. Este pre-énfasis será automáticamente eliminado del resultado de la función de transferencia aplicando el espectro de referencia obtenido en todas las mediciones subsiguientes. Los impulsos son una simple y no tan mala manera de medición cuando es puramente eléctrica (cuando no hay un camino acústico en la cadena de medición) y la medición debe ser lo más rápida posible. Sin embargo, ellos requieren un bajo nivel de ruido de fondo del DUT para obtener certeza razonable de la medición. Cuando se miden equipos de audio con bajo nivel de ruido, este requerimiento es fácilmente obtenido. A pesar de que se encuentra lejos de la opima relación S/R los impulsos igualmente pueden ser usados en acústica. En una cámara anecoica donde el ruido ambiente es bajo en altas frecuencias, los tweeters pueden ser medidos con una razonable relación S/R. Debido a su brusquedad, los pulsos, pueden alimentar con un alto voltaje el cono del altavoz, sin considerar el posible daño de sobrecalentamiento. Se debe tener consideración de no causar una excursión en el rango no lineal del altavoz (aunque esto puede ser provocado con un pulso muy estrecho [15]), esto causará que la amplitud sea más pequeña que la esperada y por lo tanto conducirá una aparente pérdida de sensibilidad [16]. Generalmente toda la distorsión en una medición por pulso ocurre simultáneamente con la IR y por lo tanto no puede ser separada de esta. Para aumentar la relación S/R de la medición de un tweeter los impulsos pueden ser repetidos y promediados en intervalos pequeños, cuando la IR recuperada es muy corta y requiere una resolución de frecuencia lineal bastante baja. Las pruebas impulsivas no permiten identificar la distorsión pero son bastante inmunes contra los efectos perjudiciales de la variación del tiempo, no como las mediciones MLS o basadas en ruidos para ambientes exteriores. Esto es simple, no requieren un sofisticado procesamiento de señal y trabajan muy bien para ciertos tipos de medición. Es por esto que han sido un método muy popular [15], [17]. Cuando se disponen de bastantes amplificadores de potencia, el aumento de la relación S/R usando señales de excitación extendidas en el tiempo comparadas con la medición de un pulso, no es tan grande como se esperaba, ya que el altavoz generalmente puede ser alimentado con pulsos de alto voltaje. La ganancia de relación señal ruido disminuye favoreciendo a las mediciones con pulsos, cuando se considera la distorsión en la IR obtenida por mediciones con ruido, como MLS. 1.6 Secuencias de máxima longitud (MLS) Las señales MLS (maximum length sequences) son secuencias binarias que pueden ser generadas de una manera muy fácil con un N-staged shift register y una compuerta XOR (con hasta 4 entradas) conectada con un shift register (alternador de registro) de tal manera que todos los 2N estados son posibles, menos el caso de “todos 0” [18]. Esto puede ser logrado con un hardware con pocos y simples TTL-IC o por un software con menos de 20 líneas de código assembler. Fig.4a. Generación de MLS con shift register fed back sobre generador de paridad En los tiempos en que el código MLS fue popular, la posibilidad de crear secuencias por hardware estaba restringida por la memoria. En los ’80 la memoria máxima en un PC IBM 8088 era de 640 KB. Claramente el tener que almacenar largos arreglos de datos para capturar y procesar la respuesta del DUT era un gran inconveniente. Hoy en día esta desventaja no es tal, ya que con la tecnología existente es mucho más fácil crear secuencias MLS por software y sacar la señal de salida desde la memoria a través de un conversor DA del sistema de medición. Como el caso “todos cero” de la secuencia está excluido, la longitud de la secuencia MLS es 2N-1. Aunque se pierde un valor para tener un bloque de longitud exacto para una FFT, MLS tiene propiedades únicas que los hacen convenientes para la medición de la función de transferencia. Su autocorrelación, es muy cercana de un pulso Dirac, indicando un espectro blanco. Reiterado periódicamente como un tren de pulsos, todas las componentes de frecuencia efectivamente tienen la misma amplitud, por lo que su espectro es perfectamente blanco. Comparado a un pulso de la misma amplitud, mucha más energía puede alimentar al DUT ya que la señal de excitación es alargada sobre el periodo entero de medición. De esta manera aumenta la relación S/R. Normalmente, un MLS no se hace salir como tren de pulso, pues éste significaría la alimentación de energía muy pequeña al DUT subsiguiente. En vez de esto, la salida del hardware generador MLS generalmente se mantiene constante entre dos pulsos de clock. En el caso del hardware generador de MLS, existe una pérdida de apertura sin(x)/x en fs/2 de al menos 4 dB que debe ser compensada posteriormente. Cuando se emite MLS por un conversor DA usando oversampling, el cual es el estándar de hoy, el espectro será plano hasta le frecuencia de corte de filtro digital. En el caso de conversores más baratos, se puede introducir un notable ripple sobre toda la banda de paso. Estas ondulaciones de frecuencia lineal están siempre presentes hasta cierto punto en el oversampling de los conversores de audio. Estás se originan de la fase lineal del filtro FIR anti-alias. Estos son fabricados por medio del algoritmo Parks-McClellan [19], viendo el ripple de banda contra la banda de detención. Además ellos son prácticamente siempre diseñados como filtros de media banda que dividen en dos el cálculo de potencia requerida, pero exhiben una atenuación de solamente 6,02 dB en fs/2. Es por esto que siempre existe una pequeña región de aliasing inválida en las cercanías a la frecuencia de Nyquist cuando la medición esta hecha con conversores de audio. El filtro anti-alias también induce a un fuerte salida de MLS por lo que no pueden ser usados con todo el nivel. En el capitulo 2.2 se clarificara este tema. Señales de excitación con espectro blanco permiten el uso de la correlación cruzada para recuperar la respuesta impulsiva del sistema. Mientras normalmente, una correlación de cruce se desarrolla más eficientemente en el dominio espectral por una multiplicación complejo-conjugado, la conocida transformada de Hadamard (FHT, fast Hadamard transformation) puede desarrollar esta tarea para señales MLS sin dejar el dominio del tiempo. Nosotros omitiremos la teoría que existe detrás de esto ya que ha sido desarrollada y explicada muchas veces, por ejemplo en [18], [20-23]. El algoritmo Butterfly que ha sido empleado en la FHT solo usa sumas y restas y puede operar con los datos enteros entregados por el conversor AD. Anteriormente esto significaba que el desarrollo de estos cálculos era mucho más corto que el de una FFT de similar longitud. Pero hoy día esta diferencia ha disminuido considerablemente. Los procesadores modernos como la familia de Pentium II pueden desarrollar adiciones, multiplicaciones y sustracciones de punto flotante tan rápido como las respectivas operaciones de números enteros. En década de los 80 la propiedad time-saving de la trasformada de Hadamard fue muy bien recibida, a pesar de que los cálculos de la respuesta al impulso en una sala de un gran ancho de banda aun consumían muchos segundos. La ventaja llegó a ser especialmente prominente sólo cuando la IR era de interés, y no la función de transferencia asociada. Esto, por ejemplo, mantiene la evaluación del tiempo de reverberación por la integración hacia atrás de la respuesta impulsiva [24]. En estos casos sólo se requiere de una FHT para transformar la respuesta MLS capturada por el micrófono en la deseada PIR. Esta FHT es más rápida que una FFT. Por el contrario usando una señal de ruido arbitrario, o un sweep como estimulo, requiere al menos una FFT y una IFFT para obtener la IR. Sin embargo, el tiempo de procesamiento ya no es una preocupación debido a los poderosos procesadores de hoy en día, las transformaciones pueden ser desarrolladas más rápidas que en tiempo real. Por ejemplo el procesamiento de un MLS de grado 18 (longitud del periodo de 6 segundos a 44,1 kHz de frecuencia de muestreo, una típica longitud para mediciones de ancho de banda en ambientes reverberantes) se completa en sólo 138 ms en un Pentium III/500, usando un 32-Bit-integer Radix-4 MMX-FHT particionado en sub chunks acomodados en los tamaños de 1° y 2° nivel caché. Esto abarca la permutación necesaria antes y después del algoritmo Butterfly y una búsqueda de peak. Una FFT calculada con números reales [11] para la misma longitud, también usando sub chunks anidados, que puede ser procesado enteramente en el caché termina en el doble del tiempo (280 ms), esto es aún mucho menor que el periodo de la medición. Independientemente del principio de la medición hoy día es posible transmitir la señal de excitación continuamente y completar los cálculos y mostrarlos actualizados dentro de cada periodo, incluso para dos canales de entrada. Para mediciones de cortos períodos se obtiene buenos resultados de una medición en tiempo real, ya que pueden ser manipuladas enteramente en el caché. Por supuesto el número de operaciones por cada muestra de salida también disminuye levemente según la razón del grado (por ejemplo una FFT de grado 12 solo necesita dos tercios de las operaciones por cada muestra de salida que en una de grado 18). En una medición basada en MLS la FHT es el primer paso de procesamiento de la señal, después de la digitalización por el conversor AD (fig. 4). La respuesta al impulso obtenida puede ser desplazada de forma cíclica y se puede aplicar una ventana como con una simple prueba impulsiva. Si la función de transferencia es la que se desea observar, se debe realizar una FFT adicional. Pero como los MLS tienen una longitud de 2N-1 una muestra tiene que ser insertada a la respuesta al impulso para que la longitud sea de 2N. Mientras que computacionalmente esto es una acción trivial, hay que tener cuidado con el lugar donde se pone esta muestra. Esto debe ser una región en donde la Ir haya decaído cercano a cero para evitar grandes errores. Cuando usamos una ventana, la muestra puede ser localizada en el área silenciada. La función de transferencia obtenida nuevamente puede y debe ser corregida por la multiplicación con un espectro de referencia obtenido previamente por una medición de respuesta del sistema. Fig 4: Etapas de procesamiento de señal para la medición de la función de transferencia con MLS. La medición MLS es bastante popular en mediciones acústicas, pero tiene bastantes desventajas. Tiene una alta vulnerabilidad contra la distorsión y la variación del tiempo (estas serán comparadas directamente a las mediciones con sweep en el capitulo 2), pero la más lamentable propiedad del MLS es su espectro blanco. Como será demostrado en el capitulo 3, un espectro no blanco es deseable en casi todas las mediciones acústicas. Este requerimiento puede ser obtenido por la coloración del MLS con un énfasis apropiado. Claramente el MLS perderá su característica binaria por el prefiltrado. Así que esta técnica es viable si el prefiltrado del MLS se hace a la salida por un verdadero conversor DA, no solo una etapa de conmutación de un bit, como utilizan algunos antiguos hardware-analizadores basados de MLS. Estos últimos son confinados al postfiltro análogo para enfatizar el MLS, pero estos no ofrecen la versatilidad de los filtros FIR como una fase lineal, o compensación de la propia respuesta del sistema de medición [25]. La creación del MLS enfatizado puede ser hecha eficientemente por medio de la transformada inversa de Hadamard (IFHT) [25], [26]. La IFHT simplemente es la inversión en el tiempo de la respuesta al impulso del filtro de énfasis deseado (reducido a 2N-1 muestras), aplicando una FHT normal en la IR invertida y entonces nuevamente invertimos el resultado anterior. Esto produce una MLS periódica convolucionada con el filtro de énfasis. Debido a la periodicidad, cada componente discreta de frecuencia de la anterior MLS puede ser influenciada independientemente tanto en amplitud y fase. Cuando usamos como estimulo un MLS enfatizado, en vez de MLS puro, obviamente la respuesta al impulso obtenida por la FHT consistirá en la IR del DUT convolucionada con la IR del filtro de énfasis. Para mediciones acústicas esto es significativo pues dará a la señal de excitación un fuerte estimulo en frecuencias bajas probablemente de unos 20 o 30 dB, como será demostrado mas tarde. En este caso la respuesta al impulso obtenida puede ser más ancha que la medición solamente con el DUT. Este ensanchamiento frecuentemente restringe la realización de la ventana, especialmente cuando las reflexiones que serán silenciadas están cerca del peak principal. En estos casos aplicando una ventana “pre-comp” (pre compensación) a la respuesta impulsiva no ecualizada atenuará la energía de bajas frecuencias extendida en el tiempo. Así que es mejor la aplicación de una ventana “post-comp” (post compensación), lo que significa una posterior transformación de la IR no corregida al dominio espectral, multiplicándola con la respuesta inversa de un filtro de énfasis, y eventualmente trasformándola al dominio del tiempo. Esto producirá la respuesta al impulso sólo del DUT a la cual se le puede aplicar ahora ventanas con menos pérdidas de energía en bajas frecuencias. Fig 5: Etapas de procesamiento de señal para la medición de la función de transferencia con MLS pre-enfatizado. Si la función de transferencia es el resultado deseado de la medición, otra FFT será desarrollada después de la aplicación de la ventana de la respuesta al impulso compensada (fig. 5). Así que el número de las transformaciones es en total una FHT y tres FFT cuando se realiza la medición de la función de transferencia con MLS preenfatizado y aplicando ventanas post-comp de la respuesta impulsiva. 1.7 Señales periódicas de longitud 2N Examinando a fondo la configuración de la medición MLS en la fig. 5, revela que actualmente el uso de MLS y la aplicación de la FHT son bastante innecesarios. Si sólo la señal de excitación tiene 2N muestras en vez de 2N-1 como las MLS, la respuesta del DUT puede ser transformada directamente al dominio espectral, omitiendo la FHT, y esto puede ser implemente multiplicando con el espectro de referencia (la multiplicación de la inversa del espectro de la señal de excitación por la respuesta de frecuencia del sistema de medición). Como esta multiplicación es una operación compleja, no sólo la magnitud, sino también la fase son corregidas para producir la verdadera función de transferencia compleja del DUT, independientemente de la naturaleza de la señal de excitación. Al desarrollar una IFFT en este espectro compensado, se producirá la verdadera respuesta al impulso del DUT (fig. 6). Cuando comparamos esta técnica (FFT, compensación, IFFT) a la FHT queda claro que esta es lejos más poderosa y flexible, permitiendo el uso de señales arbitrarias de longitud 2N. La única restricción es que la señal de excitación debe tener la suficiente cantidad de energía en todo el rango de frecuencias de interés. La FHT, siendo un algoritmo de la correlación cruzada, puede modificar simplemente las fases de una clase especial de señal de excitación, particularmente MLS. Esta operación es la “compresión de pulso” al MLS por medio de una convolución con el correspondiente “filtro acoplado” (matched filter). En contraste, la aproximación de la FFT compensa la fase y la magnitud de cualquier señal de excitación ya sea ruido, sweeps o cortos fragmentos musicales. Esta operación es algunas veces referida como el “filtraje mal acoplado” (mismatched filtering). Aunque en contraste con el matched filter, este no está restringido a señales de excitación con espectro blanco. La única restricción obvia es que la señal de excitación debe tener la suficiente energía sobre todo el rango de frecuencias de interés para evitar ruidos en la función de transferencia obtenida. Fig 6: Etapas de procesamiento de señal para la medición de la función de transferencia con cualquier señal determinística. Claramente el desarrollo de 2 FFT consumen más tiempo de procesamiento que una única FHT, pero con los poderosos microprocesadores de hoy en día, esta desventaja es insignificante. Como nosotros hemos visto, usando MLS pre-enfatizados, y la aplicación de ventanas post-comp (fig. 5) conduce, incluso, a tiempos levemente más largos de cálculo que usando señales arbitrarias de longitud 2N. La técnica se asemeja al viejo análisis FFT de dos canales, pero se diferencia de esta en que la señal de la excitación es conocida por adelantado. Por lo tanto, su espectro necesita ser calculado solo una vez y se puede utilizar en todas las mediciones siguientes. Esto evita la necesidad de un segundo canal, o si esta presente de todos modos, permite analizar dos entradas simultáneamente. Una ventaja adicional es el hecho de que la precisión obtenida de un analizador de FFT de un canal supera a cualquier analizador de dos canales. Con lo último, cualquier diferencia de la respuesta de frecuencia en la entrada de los dos canales, se reflejara en la respuesta de frecuencia medida del DUT. Por supuesto los fabricantes de analizador de dos canales se esfuerzan por hacer que estas diferencias sean lo más pequeñas posibles. Sin embargo, creando un archivo de referencia, por el reemplazo del DUT con un cable, hace que la señal de excitación pase exactamente por las mismas etapas, lo que garantiza una alta precisión. Incluso con cualquier equipamiento, puede ser obtenida una certeza de 1/1000 dB o mejor en una medición eléctrica pura. El voltaje de referencia de la fuente, incluidos los modernos conversores AD y DA, son lo suficientemente estables para permitir esta certeza (cuando ocurre una tendencia de calentamiento, la medición de la referencia puede ser rápidamente repetida). Sin embargo, puede haber errores de la fuente debido a las impedancias de las etapas análogas de entrada y de salida. La salida de impedancia del DA debe ser lo suficientemente baja para prevenir una perdida del voltaje generado cuando lo conectamos al voltaje de salida del DUT. Estas condiciones rara vez se dan cuando usamos simples tarjetas de sonido sin amplificadores de salida. Fig 6a. En el caso de señales de excitación blancas (aquí, se utilizó un sweep lineal como ejemplo) la respuesta impulsiva del DUT puede ser evaluada por el desarrollo de la correlación cruzada con la inversión en el tiempo de la señal de excitación: Esto puede tomar bastante tiempo en el dominio del tiempo, pero la FHT lo hace de una manera rápida para MLS. Fig. 6b: Para cualquier señal de excitación no blanca, la evaluación de la respuesta impulsiva en el dominio del tiempo, sólo puede ser hecha por la convolución con el filtro inverso, el cual debe ser construido en dominio de la frecuencia. La convolución en el dominio del tiempo corresponde a la multiplicación en el dominio de la frecuencia, que puede ser desarrollada muy rápido. Es por esto que la deconvolución es desarrollada en el dominio de la frecuencia. Aún, la gran característica de un análisis de un canal, es el uso de una señal determinística en contraste a la fuente de ruido no correlacionada, normalmente usada en el analizador de FFT de dos canales. Como establecimos antes, el anterior tiene un espectro estable cuando es promediado a lo largo del tiempo, pero en un único snapshot la señal de ruido sufre pérdidas en la magnitud. De esta manera el analizador de dos canales tiene que ser promediado durante muchas mediciones antes de entregar un correcto resultado. Por el contrario, los estímulos determinísticos usados en los métodos de la fig. 6 pueden ser creados a la medida definiendo una magnitud arbitraria del espectro libre de caídas, adaptándola al ruido de fondo predominante, para lograr una independencia de la frecuencia en la relación S/R. De acuerdo al tipo de señal deseada, la correspondiente fase del espectro puede ser construida de muchos modos diferentes. Una señal ruidosa puede ser generada fácilmente por la configuración de sus fases como valores aleatorios. La señal de excitación es obtenida por la IFFT. Repetida periódicamente esta tendrá exactamente la magnitud del espectro previamente definido (por ejemplo plano o rosado). Señales ruidosas tienen propiedades similares a las MLS, especialmente lo que consiste en su vulnerabilidad contra la distorsión y la variación del tiempo. Algunas personas se refieren a las señales ruidosas como “señales sinusoidales múltiples”, pero por supuesto cualquier señal que no sea pura es una señal de múltiples senos. Fig. 6c: Tres señales de excitación blanca: impulso, ruido y sweep. Todas tienen la misma amplitud espectral, pero sus fases son obviamente muy diferentes. Para el impulso la fase tiene que ser ajustada a 0° la cual corresponde a un mismo tiempo de llegada para todas las frecuencias. El espectro de la fase para un ruido debe ser ajustado con valores aleatorios. Para crear el sweep blanco, el retardo de grupo (que es proporcional a la derivada de la fase) tiene que incrementarse proporcionalmente con la frecuencia. Las tres señales de excitación mostradas aquí son normalizadas para tener la misma energía. El sweep tiene el factor de cresta mas bajo de todas, 6 dB menor que el ruido blanco. El impulso necesita una amplitud de varios cientos de Volt para concentrar la misma energía. Esto, por supuesto, restringe su utilidad práctica. Como el espectro predefinido de una señal de ruido es sólo valido para una repetición periódica, la medición o puede ser comenzada inmediatamente después de encender el estimulo, al menos tiene que ser esperado un tiempo correspondiente a la longitud de una respuesta al impulso para que la respuesta del DUT se estabilice. Como la longitud de la IR no siempre es conocida de antemano, resulta práctico ejecutar simplemente dos periodos de la señal de excitación. La adquisición de la señal sólo comienza en la segunda partida, al igual que las mediciones MLS. Similarmente, solo la mitad de la energía emitida es usada para el análisis en una sola medición (single shot). Por otra parte, la periodicidad nuevamente permite la manipulación completamente independiente de cada componente de frecuencia. Por ejemplo, podemos seleccionar una única frecuencia para realzar o atenuar reduciendo o mejorando la energía de la señal en la banda particular de frecuencias. 1.8 Sweeps no periódicos En vez de aleatorizar las fases para obtener una señal de ruido con la forma espectral deseada, la fase del espectro también puede ser ajustada para producir un incremento en el retardo de grupo. La IFFT revelará un sweep en vez de una señal ruidosa. Por varias razones los sweep son una bastante mejor elección para la medición de la función de transferencia que una secuencia de ruido. Primero que todo, en contraste a lo último, el espectro de un único sweep no repetido es idéntico comparado a su repetición periódica. Los sweeps tienen que ser enviados a la salida solo una vez y la respuesta del DUT puede ser inmediatamente capturada y procesada. Así que la duración de la medición se reduce a la mitad, manteniendo en la misma resolución espectral y la relación S/R como un estimulo periódicamente repetido. Las diferencias restantes de menor importancia en el espectro del sweep repetido y no-repetido no son importantes, pues son reflejadas y canceladas más adelante por la medición de referencia que también utiliza el barrido norepetido. La otra enorme ventaja de la medición con sweep es el hecho de que las componentes de la distorsión armónica, pueden ser completamente eliminadas de la IR obtenida. Estas aparecen en los tiempos negativos donde ellas pueden ser separadas completamente de la IR actual. De esta manera la respuesta al impulso queda intacta de la energía de la distorsión. Por el contrario, mediciones que utilizan ruido como estímulos inevitablemente tendrán una distribución de la distorsión producida sobre todo el período. La razón por la que la distorsión es rechazada puede ser explicada con el siguiente ejemplo: Consideremos un sweep que recorre desde los 100 Hz después de 100 ms y llega a 200 Hz en 200 ms. Para comprimir esta señal de excitación en un pulso Dirac, el espectro de referencia necesita tener un correspondiente retardo de grupo de –100 ms en 100 Hz y –200 ms en 200 Hz. Cuando una frecuencia momentánea es 100 Hz y el DUT produce armónicos de segundo orden, una componente de 200 Hz con el mismo retardo de la fundamental de 100 Hz estará presente en la respuesta del DUT, ésta componente de 200 Hz será tratada con el retardo de grupo de –200 ms del espectro de referencia a 200 Hz y por lo tanto aparece –100 ms después del proceso de deconvolución, así los armónicos de alto orden aparecerán en “tiempos negativos mayores”. Para colocar realmente los productos de la distorsión en los tiempos negativos de la respuesta impulsiva obtenida, sería conveniente realizar una deconvolución lineal para señales no periódicas. En vez de esto, también es posible mantener la operación de FFT normal y la multiplicación de referencia como es usada en las mediciones con estímulo periódico, con la condición de que el sweep de la excitación sea considerablemente más largo que la respuesta al impulso del DUT o sean insertados ceros para rellenar la respuesta al sweep del DUT para doblar la longitud (fig. 6b). En ambos casos, la distorsión producida aparecerá al final de la respuesta impulsiva obtenida, donde ellos pueden ser interpretados como portador de tiempos negativos. Estos pueden ser removidos sin afectar la actual respuesta al impulso, como en el primer caso, se encontrará en la última parte del ruido de fondo, y en el segundo caso, cualquier información causal no se puede encontrar en está región. Fig. 6d. Para sweeps no periódicos, la manera más apropiada para obtener la IR es una deconvolución lineal (por ejemplo no cíclica). Esto verdaderamente pondrá los productos de la distorsión armónica en los tiempos negativos, donde pueden ser eliminados fácilmente. La deconvolución lineal puede ser lograda extendiendo con ceros al doble de su longitud el sweep de excitación y la respuesta grabada del sweep. Ambos son llevados a la FFT y el espectro de la respuesta del sweep es dividido por el espectro de la señal de excitación. Una IFFT produce la IR deseada, cuya segunda mitad corresponde los tiempos de llegadas negativos, que pueden ser eliminados. Fig. 6e. Alternativamente a la deconvolución lineal puede ser utilizada una deconvolución circular usando una FFT de igual tamaño de la señal capturada. Sin embargo, en este caso los productos de la distorsión pueden ensuciar el decaimiento de la IR. Esto significa que la longitud de la señal de excitación debe ser elegida lo suficientemente más larga que el tiempo de decaimiento. Los productos de la distorsión aparecen con el ruido de fondo, donde ellos pueden ser eliminados de manera segura mediante el uso de ventanas sin afectar el final de la reverberación. Sin embargo, en ambos casos significa que como primer paso de procesamiento de señales se requerirá un largo de bloque de FFT mayor para la resolución espectral empleada. Para lograr capturar la respuesta al impulso de alta calidad en salas, es recomendable la utilización de sweeps que sean considerablemente mayores que la IR, está es la mejor manera de aumentar la relación S/R y disminuir la influencia de la variación de tiempo. Hay una importante diferencia que concierne al ruido de fonde de la IR obtenida por una deconvolución lineal y circular. Usando una deconvolución circular resulta un ruido de donde que es básicamente constante en distribución de amplitud y frecuencia, sobre el punto donde aparece el primer efecto de distorsión. Sin embargo, la deconvolución lineal produce un decaimiento del ruido que es progresivamente filtrada en bajas frecuencias hacia el final. Esto se debe al hecho de que la última parte del resultado de la deconvolución originada del ruido estable convolucionada con un sweep en orden inverso (por ejemplo desde altas a bajas frecuencias). El usuario debe tener conciencia de este efecto y no confundir la disminución del ruido de fondo con la parte final del tiempo de reverberación de la sala. El periodo de adquisición de datos en mediciones no periódicas debe ser lo suficientemente largo para capturar todos los componentes retardados. Esto significa que el sweep siempre debe ser más corto que el período de captura y el largo de FFT siguiente. En mediciones acústicas de salas, es muy beneficioso que el tiempo de reverberación para altas frecuencias sea usualmente mucho mas corto que el de baja frecuencia. Así el sweep debe ser cortado solo el tiempo correspondiente a la reverberación de alta frecuencia, permitiendo que longitud del sweep sea suficiente para que la reverberación de bajas frecuencias quede atrás de las componentes de alta frecuencia. Fig 6f. Cuando el sweep es mas corto que el tiempo de reverberación, el mínimo intervalo de longitud debe ser calculado mediante la siguiente regla: Para cualquier frecuencia, la longitud del intervalo no debe ser más pequeña que el tiempo anterior a la reverberación para esta frecuencia de decaimiento en el ruido de fondo, menos el tiempo restante del sweep en esa frecuencia. 2 UNA COMPARACIÓN ENTRE SWEEPS Y MEDICIONES MLS 2.1 Duración de la medición En todas las mediciones, el periodo de captura AD debe ser por lo menos del largo de la respuesta impulsiva (en la practica: el tiempo antes de que la respuesta llegue al ruido de fondo) para evitar errores. Esto es obvio para una medición con pulsos no periódicos. Toda su energía es emitida al principio, y el conversor DA simplemente muestrea hasta que la respuesta impulsiva decae. En el caso que sean usados sweep no periódicos como señales de excitación, el período de captura debe ser un poco mayor, pero en general no mucho. Esto gracias a que los sweep comienzan en frecuencias bajas. Con DUTs normales, como altavoces, el mayor retardo de la señal ocurrirá en baja frecuencias. Así, mientras se produce el barrido a través de las altas frecuencias, el tiempo debe ser suficiente para obtener los componentes retrazados de baja frecuencia. Para mediciones de altavoces el decaimiento en frecuencias altas es usualmente tan corto que la captación AD puede ser detenida inmediatamente después que la señal de excitación pasa a través de él (siempre que el sweep sea considerablemente más largo que el retardo en bajas frecuencias y por supuesto, observando el tiempo de llegada entre el altavoz y el micrófono). En mediciones de salas acústicas el trozo de silencio siguiente a la emisión del sweep usualmente debe ser mayor que el tiempo de reverberación en altas frecuencias. En el caso de excitaciones periódicas, el largo del período y el tiempo de captura AD deben ser mayores que el largo de la respuesta impulsiva. Utilizar un largo menor podría provocar time aliasing, que consiste en el pliegue de la parte final de la IR que cruza el periodo con el principio del siguiente, sumando ésta al principio de la IR. Dependiendo de la cantidad de energía plegada hacia atrás, aparecerán errores más o menos tolerables. Comparado con mediciones de pulsos no periódicos o mediciones con sweeps, la necesidad de emitir la señal de excitación dos veces significa que se requiere mayor tiempo para la medición. Por otra parte, solo la mitad de la energía total que alimenta al DUT es usada para el análisis. 2.2 Factor de Cresta El factor de cresta es la relación del voltaje Peak-RMS de una señal expresado en dB. Asumiendo que la medición del sistema o el DUT están limitados por un nivel distinto de voltaje, el valor peak de cualquier señal de excitación considerada, tiene que ser normalizado a este valor para extraer la máxima energía posible en una medición. El nivel RMS entonces será bajo de acuerdo al factor de cresta. Así, el factor de cresta indica cuanta energía se pierde cuando hay una cierta señal de excitación, comparada con el caso ideal de estimulo cuyo voltaje RMS es igual al voltaje peak (cresta = 0 dB). Por esta razón, el diseñar señales con un factor de cresta lo más bajo posible se ha convertido en una especie de deporte para los desarrolladores teóricos de análisis de señales. La suposición que un nivel de voltaje está definiendo el límite superior de una medición, muchas veces es verdadero en mediciones puramente eléctricas (por ejemplo, ecualizadores, mezcladores, etc.). En mediciones acústicas esto es válido sólo cuando el amplificador es el eslabón más débil de la cadena. Aún, muchos amplificadores equipados de una fuente de alimentación basada en una transformación lineal pueden reproducir sobretensiones peaks de 2 o 3 dB más altos que la potencia continua. La primera restricción es el daño por el sobrecalentamiento de la bobina del altavoz, para este caso la energía total emergente del altavoz es más importante que el factor de cresta. Sin embargo, factores de cresta muy grandes deben ser evitados siempre, ya que un único peak de nivel puede causar distorsión. Como primera observación, un MLS mantiene la salida semejante a la señal de excitación ideal. En el sentido de máxima extracción de energía. El valor Peak es igual al valor RMS. Sin embargo, el ideal factor de cresta resultante de 0 dB no puede ser explotado en la práctica. Tan pronto como el MLS salga al mundo real y pase a través de un filtro, la forma de onda rectangular puede cambiar considerablemente. Especialmente los filtros anti-aliasing abruptos usados en la etapa de oversampling de un conversor DA causan dramáticos overshoot (distorsión). Para evitar esta drástica distorsión causada por los clip en las etapas del filtro, el MLS debe alimentar el conversor DA con un nivel de al menos 5 a 8 dB bajo la escala total, dependiendo de las características del filtro anti-aliasing. Esto quiere decir que el MLS no puede ser emitido libre de distorsión con la misma energía de una señal senoidal con un factor cresta de 3.01 dB. Pero aún si el MLS es producido por un hardware generador, este no retendrá el favorable factor de cresta por un gran tiempo. Los amplificadores de potencias siempre equipados con un filtro pasa bajos de entrada que rechaza la interferencia de radio, y evita trancientes de intermodulación inducida por altas slew rate de la señal de audio – precisamente que prevalecen en abundancia en un MLS no filtrado. Un típico filtro de entrada puede ser un Butterworth pasa bajos de 2° orden con un frecuencia de corte de quizás 40 kHz. El overshoot producido por este filtro es mucho más moderado que el de un filtro anti-aliasing abrupto (fig. 7) pero aún merece consideración. Fig 7: MLS pasado a través de un filtro pasa bajo anti-aliasing con sobre-muestreo de 8x (izquierda) y con filtro pasa bajos de 2do orden con angulación en la frecuencia de 40 kHz (derecha). Existen casos en que algunos nodos internos del DUT restringen el driving level y no los voltajes de la salida del sistema de medición. Por ejemplo, si una resonancia con alta ganancia se encuentra en una etapa de ecualización de la cadena, la señal de excitación debería distorsionar a la salida de esa etapa. En esos casos, los sweeps tienen que alimentar con un nivel más bajo determinado por la ganancia en la frecuencia de resonancia de ese filtro específico. En contraste a esto, el MLS filtrado tiende a tomar una amplitud de distribución gausiana, con un 1% de las amplitudes alcanzando un nivel mayor a 11 dB sobre el valor RMS [13]. En muchas mediciones de altavoces y salas acústicas, aun con la presencia de resonancias moderadas, un sweep puede alimentar con un mayor nivel RMS que un MLS. En la práctica la distorsión ocurre gradualmente, con MLS mucho antes que el nivel de clip del amplificador sea alcanzado. Como será examinado en la sección 2.5 2.3 Rechazo de Ruido Cualquier principio de medición usando señales de excitación con igual longitud, distribución espectral y energía total conducirá exactamente a la misma cantidad de rechazo de ruido, si es considerado el período entero de la respuesta al impulso sin ventana. Para cada frecuencia la relación S/R solamente depende de la relación de energía de la respuesta del DUT a ese extraño ruido capturado en el período de medición. Las diferencias entre varios métodos de medición simplemente engañan en la manera de cómo el ruido se distribuye sobre el periodo de la IR recobrada. Claramente usando la misma distribución espectral en una señal de excitación requiere la misma coloración invertida en el proceso de deconvolución. Esto explica el porque la magnitud de la fuente de ruido no varía cuando se cambia el tipo de estimulo. Las fases sin embargo serán muy diferentes. Aún, algunos tipos de fuentes de ruido aparecerán similarmente en todas las mediciones, ya que su característica general no es alterada por la manipulación de la fase. Como por ejemplo un ruido de mono frecuencias (hum). Igualmente el ruido no correlacionado (por ejemplo aire acondicionado) aún aparecerá como ruido. Sin embargo, cualquier otro disturbio será reproducido bastante diferente, dependiendo del tipo de estímulo. Fuentes de ruido impulsivas, como clicks y pops, serán nuevamente transformados en ruido cuando usamos un ruido como estímulo. En contraste en una medición con sweep ellos llegarán a ser audibles como un sweep invertido en el tiempo. Usualmente ruidos estables son considerados más discretos que otras señales de error. Generalmente, si cualquier ruido aparece inesperadamente, la medición simplemente debe ser repetida, o, si se está promediando eliminar el periodo específico del proceso. 2.4 Variación de Tiempo Las variaciones de tiempo tienden a aparecer en las mediciones siempre que se realicen sobre una larga distancia exterior, cuando el promedio sincronizado es realizado sobre largo periodos de tiempo, o cuando el DUT en si mismo no es invariante en el tiempo. El primer caso ocurre en mediciones en estadios, o sitios al aire libre bajo condiciones metereológicas con viento. El segundo se da cuando la relación S/R es muy baja forzando a utilizar muchos cientos o incluso miles de promedios sincrónicos. En periodos de medición largos, una leve variación de temperatura o movimiento puede frustrar el proceso de promediado. Un tipo de DUT que no sea invariante en el tiempo como cualquier tipo de grabadora análoga. Es bien sabido que las secuencias de ruido periódicas en general, y en especial los MLS son extremadamente vulnerables a leves variaciones de tiempo. Una considerable cantidad de trabajos teóricos explican estos efectos en detalle [27-29]. Aunque las ecuaciones allí presentadas se ven amenazadoras, en la práctica es fácil comparar los efectos de variaciones de tiempo, estos tienden a tener una errática e impredecible naturaleza. Es probable que dos mediciones al aire libre realizadas en serie estén afectadas por diferentes ráfagas del viento. Sólo una simulación permite evadir esta “variación del tiempo de la variación del tiempo”. La fig. 8 da un pequeño ejemplo. Una secuencia de ruido y un sweep, ambos con espectro blanco plano, han sido sometidos a una suave variación del tiempo sinusoidal de ±0.5 muestras. Para simular un jitter, las señales han sido sobre muestreadas por un factor de 256 (sin filtrar, simplemente insertando 255 ceros consecutivos después de cada muestra). Entonces el tiempo exacto de llegada de las muestras ha sido desplazada en un rango de ±128 de acuerdo a la curva sinusoidal de jitter. La alteración resultante del espectro de banda base es insignificante en baja frecuencia, pero este aumenta extremadamente para el espectro de ruido con jitter. Por el contrario el espectro del sweep con jitter sólo muestra una mayor corrugación al final de altas frecuencias, y esto puede ser removido con una suave ventana de suavización. Fig 8: Variancia de tiempo sinusoidal artificial de ±0.5 impuestas en la señal de ruido (superior) y sweep (inferior) y el espectro resultante. Otra prueba expresiva es la respuesta de frecuencia de la medición de un grabador análogo, un tipo de maquinas que siempre sufre wow and flutter en alguna proporción. Como el material de cinta magnética tiende a saturarse mucho antes en altas frecuencias, ha sido aplicado un énfasis de 24 dB en baja frecuencia al MLS y al sweep usados en este experimento. Adicionalmente la envolvente del sweep ha sido hecha a la medida para que decrezca 12 dB sobre los 5 kHz, pero manteniendo la coloración inicial. La sección 4.4 nos revelara como esto es realizado. Ambos estímulos fueron normalizados para que contengan la misma energía y fueron grabados con el mismo nivel de entrada. Como los resultados de la fig. 9 muestran, la respuesta de frecuencia medida usando MLS como excitación es tremendamente ruidosa sobre los 500 Hz. En la que se utilizó el sweep como estimulo, también se observa la variación de tiempo inducida por la contaminación pero mucho menos extendida. Además de los efectos de deterioración de la variación de tiempo, la distorsión también juega un papel importante en la contaminación de respuesta recobrada de la grabadora análoga. Para minimizar la ínter-modulación producida, el nivel de grabación ha sido ajustado 20 dB bajo la saturación límite en este experimento. Aun cuando el sistema de medición es virtualmente libre de variaciones de tiempo, el uso de señales de excitación pseudo-ruidosas es desventajoso cuando se realizan ajusten dentro del período de medición (volumen, EQ, otros). En este caso ocurren grandes errores en la visualización de la IR. Los sweep y la medición del impulso no muestran esta molesta reacción a la variación del tiempo y estas son además más agradables de usar para ajustes en mediciones repetitivas. Fig 9: Función de transferencia de un grabador de cinta análogo medido con MLS (izquierda) y con Sweep (derecha). Ambos con idéntica coloración y energía. 2.5 Distorsión Los ingenieros de Hardware de audio se empeñan en optimizar el rango dinámico de sus circuitos que idealmente debe corresponder a nuestro sistema auditivo con valores sobre 130 dB. La relación S/R en mediciones acústicas parece haber sido descuidada por los acústicos en el pasado. En sitios de relativa calma, es menor el ruido de fondo que limita la calidad de las respuestas de las IR obtenidas, pero muy frecuentemente la distorsión es producida por el altavoz empleado. En cualquier medición usando ruido como señal de excitación, estos productos de excitación serán distribuidos como ruido sobre todo el período de la IR. La razón de esto, es que la distorsión de un estímulo con fase pseudo- aleatoria también tiene mayor o menor fase aleatoria, y también el proceso de deconvolución involucra fases aleatorias que eventualmente producen un espectro erróneo con fases aleatorias, correspondientes a una señal de ruido aleatoriamente distribuida. Como esta señal errónea es correlacionada con la señal de excitación, promedios sincrónicos no mejoran esta situación. Mientras es verdad que los niveles de ruido dañan relativamente al valor peak de la IR cuando escogemos una secuencia mayor, esto puede ser reducido difícilmente a un valor aceptable. Mediciones de acústica de salas involucran secuencias largas. Por ejemplo, aumentando el largo de un MLS de grado 18 por un factor de 128 podríamos teóricamente reducir el nivel de ruido de un típico valor de –65 dB a –86 dB. Mientras esto puede ser factible en procesos MLS de grado 25 (largo 12min, 42s con 44,1 kHz de frecuencia de muestreo) en un computador equipado con bastante memoria, podría no funcionar bajar el nivel de ruido a este nivel, porque cuando usamos una secuencia tan larga, la vulnerabilidad contra la variación de tiempo es predominante. En vez de reducir la influencia de la distorsión por un incremento del período de medición, es más beneficioso simplemente excluirla totalmente de la IR recuperada. Esto puede ser logrado fácilmente por el uso de sweeps como señal de excitación, como se explico en la sección 1.8. La mayor mejora que puede ser realizada en mediciones de acústica de salas por el reemplazo de MLS con sweep es demostrada en la fig. 10. Ha sido medida la IR de una cámara reverberante usando MLS y sweeps de grado 20, ambos con la misma energía y el mismo pre-énfasis de 20 dB en baja frecuencia. Para la medición con MLS, el volumen ha sido cuidadosamente ajustado para producir una mínima contaminación a la IR. De hecho, esta búsqueda del óptimo nivel mediante prueba y error es crucial en mediciones con MLS [34], ya que mucha energía produce distorsión excesiva visible por un aumento del ruido de fondo con una estructura abultada, mientras que en bajo nivel conduce al que el ruido de fondo estropee la mayoría de las veces la medición. Fig 10: Medición de la respuesta impulsiva en una cámara reverberante con 1, 10 y 100 promedios sincrónicos. Izquierda: con MLS, derecha: con sweep de idéntica coloración y energía. Las curvas con comprimidas a 1303 valores, cada una de ellas representa el máximo de 805 muestras consecutivas. Después de este ajuste se pueden realizar 1, 10, 100 promedios sincrónicos con ambas señales de excitación. Es claramente visible en la fig. 10, que cuando no se usan promedios, la IR decae al ruido de fondo que es 5 dB menor en mediciones con sweeps. La distorsión acumulada queda al final del período de medición. Como el largo de la señal de excitación ha sido escogida al menos 8 veces mayor que el tiempo de reverberación, esta puede ser separada de la actual IR. Realizando 10 promedios sincrónicos, el ruido de fondo se reduce 10 dB cuando se utilizan sweeps. Por el contrario, cundo se usa MLS como señal de excitación, sólo se observa una pequeña disminución del ruido de fondo, demostrando que el producto de intermodulación correlacionada prevalece en la IR recuperada. Realizando 100 promedios sincrónicos no sucede ninguna mejora en una medición con MLS, mientras que en la medición con sweeps se aprecia una disminución, a pesar de que no alcanza los 10 dB esperados. La variación de tiempo debido a la variación de la temperatura podría explicar esto, ya que la medición de 100 promedios toma alrededor de 40 minutos. En este experimento el nivel de salida ha sido optimizado para el uso con MLS. El nivel del sweep emitido podría haber sido aumentado 15 dB causando una distorsión en el amplificador, y con esto disminuir el nivel del ruido de fondo esta misma cantidad. Así, la relación señal ruido podría haber alcanzado un valor de 100 dB con sólo 10 promedios de sweeps. Por el contrario es imposible conseguir esta calidad con mediciones MLS, independientemente del nivel y del número de promedios. El altavoz utilizado en el experimento fue una combinación woofer/tweeter para PA de 12 pulgadas optimizado para una mayor eficiencia. Este tipo de parlantes claramente produce mayor distorsión que un sistema de alta fidelidad con suspensiones más suaves y mejores bobinas, pero incluso con este último, una relación de señal ruido de 90 dB se puede lograr, algo que es inalcanzable con mediciones MLS. Esto es mostrado con un experimento similar usando un altavoz coaxial de 5’’ con suspensión suave medido en una cámara anecoica con señales de excitación muy pequeñas (fig. 10b). Nuevamente el nivel fue ajustado para alcanzar la óptima relación S/R con el MLS rosado. Alimentado con la misma energía, el sweep rosado produce una mejor relación S/R con sólo una medición. Este nivel ajustado a favor del MLS fue tan bajo que fue posible aumentar 20 dB sin causar saturación en el amplificador de potencia empleado. Haciendo esto, los productos de la distorsión al final del período aumentan considerablemente, pero la relación S/R aumentó aproximadamente a la ganancia adicional del amplificador. Con sólo 10 promedios (largo total de la medición de 3,5 segundos), se alcanzan exitosamente 100 dB. Fig. 10b) Experimento similar al de la figura 10 con un pequeño parlante de 5’’ en una cámara anecoica. El nivel nuevamente ha sido ajustado para producir la mínima contaminación de la IR cuando se mide con MLS. El sweep puede ser emitido con 20 dB más de potencia, lo cual permite obtener relación S/R con sólo 10 promedios (curva verde en el lado derecho). Además de mediciones acústicas, existen más situaciones de medición en que se requiere linealidad que las mediciones con MLS no satisfacen, como por ejemplo codificadores psico-acústicos. Un ejemplo obvio son los teléfonos celulares que usan una muy alta compresión para obtener bajos bit rate. Experimentos preliminares muestran que señales cortas de excitación producen errores impredecibles y erráticos, independientemente si se usa MLS o sweeps. Aumentando el largo del grado 18 a 44.1 kHz de frecuencia de muestreo entregan resultados más o menos confiables con un sweep (lineal entre 100 Hz y 7 kHz), mientras que la medición con MLS del mismo largo y coloración produce una curva muy rugosa que difícilmente permite reconocer la función de transferencia (fig. 11). Sin embargo, hay que admitir que estos resultados son cuando la respuesta impulsiva es transformada al dominio espectral sin un proceso previo. Aplicando una ventana estrecha con un ancho de sólo 80 ms alrededor del peak mayor alivia la situación bastante (fig.12). Aún así, aparecen sorprendentes diferencias sobre los 2 kHz entre las mediciones con MLS y sweeps. El codificador parece producir diferentes resultados para ruido de banda ancha y aparecen señales mono frecuenciales en un corto periodo de análisis. Otro ejemplo que es más frecuente en aplicaciones de audio que la codificación de baja fidelidad telefónica es la popular compresión MPEG 1 / layer 3. La fig.13 muestra la función de transferencia de codificador para la común razón de 128 Kbit/s, con medición de MLS y sweep. La ventaja del sweep es arrolladora en esta aplicación. De hecho, el ruido de banda ancha que el codificador tiene que tratar cuando un MLS se utiliza como señal de excitación presenta el caso peor para la codificación psicoacústica. Todas las bandas de frecuencia contienen energía, así ninguna cae debajo del nivel de enmascaramiento que podría permitir omitirla. Consecuentemente, todas las bandas tienen que ser sometidas a una cuantización para obtener el bit rate requerido, resultando en distorsión que perturba significantemente la medición con MLS. Por el contrario, los sweeps se deslizan solo un par de bandas por intervalo de análisis, permitiendo cuantizar con alta resolución mientras se descartan otras que no contienen energía. Fig. 11: Función de transferencia de un celular GSM (alimentado acústicamente por un audífono), recibido por un teléfono fijo. Izquierda: medición con MLS lineal de grado 18. Derecha: medición con un sweep lineal de igual longitud. Fig 12: Misma medición que en la figura 11, pero con una ventana (Hann, 80 ms) aplicada a la respuesta impulsiva obtenida. Fig 13: Función de transferencia de un codificador MPEG3 a 128 Kbit/s, medido con un MLS lineal de grado 14 (izquierda) y un sweep lineal de igual longitud (derecha). Para resumir, cuando medimos la compresión de datos de los codificadores, los sweeps tienen la considerable ventaja de reducir la complejidad de la señal comparado con las secuencias de ruido. Esto convierte la codificación en una tarea sencilla. Mientras que en mediciones “naturales” usando sweeps, la distorsión puede ser aislada y eliminada por el uso de ventanas, la ventaja en mediciones que involucren codificadores parece mentir más en el hecho que la generación de distorsión es simplemente prevenida. 3 PRE-ÉNFASIS En casi cualquier medición acústica, no es aconsejable usar una señal de excitación con contenido espectral blanco. En el caso de medición de altavoces en una cámara anecoica, se pueden presentar dos efectos para una gran pérdida de relación S/R en bajas frecuencias: La pérdida de sensibilidad (de 12 o 24 dB por octava) debajo de la resonancia de la caja de bajos (bass cabinet), y el aumento del ruido de fondo en esta región de frecuencias debido al deficiente aislamiento de las paredes al ruido de fondo. Así pues, para seguir el roll-off de frecuencia baja de los altavoces (si es posible en todos, vea [30], [31]) sin los efectos de la degradación de bajo S/R, se requiere de un fuerte énfasis de más de 20 dB para establecer una certeza razonable en la medición. Esto también da lugar a una mejor contribución de la energía que alimenta a un altavoz multivía. El woofer soporta mucha más potencia que un tweeter. Pero cuando usamos una señal de excitación con espectro blanco, el tweeter tendrá que soportar el golpe de la energía de la señal de excitación. Un domo de tweeter puede ser sobrecalentado y dañado con unos pocos Watts, y su límite puede ser fácilmente sobrepasado por cualquier amplificador de potencia. Desde este punto de vista, un énfasis en bajas frecuencias es altamente deseable. Una tercera razón a mencionar, de naturaleza social es la siguiente: cuando se realizan mediciones “in situ” (salas de concierto, estadios), una señal de excitación con realce en bajos da calidez al sonido y es más agradable que el ruido blanco, y por lo tanto es más aceptable por otras personas presentes. Además, un fuerte incremento de potencia en la banda de bajos no da la impresión de mucha sonoridad debido a la mala sensibilidad del oído en esta región de frecuencias. Mientras esto puede sonar poco científico, todos los que hayan participado en sesiones de mediciones en público saben que el volumen máximo aplicable es estipulado por las personas que se juntan en el lugar, no por los altavoces ni por los amplificadores (ver [1]). Por ejemplo, los instaladores que suben en los soportes cerca de un cluster de altavoces aprecian definitivamente señales de excitación no molestas. En estos casos, usando ruido blanco como estimulo incluso lleva a un riesgo de salud y un problema potencial de seguridad. Un MLS que alimente accidentalmente con máximo nivel a un sistema potente puede causar daño auditivo o incluso conducir a los accidentes asustando al personal. Esto especialmente cerca de 2 los drivers horn-loaded 2''. Usar señales de excitación con énfasis en bajos relaja la situación a un cierto grado. Con sweeps largos, se puede interrumpir antes de alcanzar las frecuencias medias. 3.1 Ecualizando altavoces para mediciones acústicas de salas. Obtener la IR es una de las tareas más recurrentes en acústica de salas y edificios. Todos los parámetros típicos que describen las propiedades acústicas de una sala (o para ser más precisos, el camino de transmisión acústica entre dos puntos, usando una fuente y receptor con distinta directividad) como reverberación, claridad, definición, tiempo central, STI y muchos otros pueden ser derivados de ella. Una mirada más cercana a la IR puede ayudar a identificar problemas como las reflexiones indeseadas o una proporción deficiente entre el sonido directo y la reverberación. Visualmente examinando la función de transferencia asociada a la sala (obtenida por la FFT) puede dar a conocer modos molestos de la sala o, por supuesto, desbalance tonal de un sistema de refuerzo sonoro. Otra aplicación interesante es la creación de “realidad virtual” por la convolución de la capturación “seca” (anecoica) de audio con la IR binaural de una sala capturada por un dummy head. Posteriormente se demostrará que sólo los sweeps son capaces a realizar tareas con suficiente rango dinámico. Hasta hoy, la capturación de la RIR para mediciones de tiempo de reverberación es ocasionalmente hecha usando fuentes impulsivas no electroacústicas. Las maneras más comunes son disparando una pistola (acción delicada especialmente en iglesias) o explosiones de globos. Mientras se obtiene altos niveles en algunas bandas de frecuencia, estos métodos tienen una baja repetibilidad y producen espectros impredecibles. La energía de baja frecuencia contenida es usualmente baja, especialmente para pistolas debido a sus pequeñas dimensiones. Incluso la omnidireccionalidad no está garantizada [1]. La única forma de evitar estos severos inconvenientes es usar un sistema electroacústico, y por lo tanto el uso de un altavoz. Obviamente, cuando usamos un altavoz sin ninguna precaución, la función de transferencia obtenida de la sala será “coloreada” por la respuesta de frecuencia del altavoz. Este es un problema cuando la RIR será usada para auralización. Para empeorar las cosas, la respuesta de frecuencia es dependiente de la dirección. Para mediciones de acústica de salas, la norma ISO 3382 describe el uso de un altavoz “lo más omnidireccional” posible (condición que en la practica difícilmente puede ser satisfecha sobre 2 kHz). Ningún altavoz será capaz de producir una salida independiente de la frecuencia. Este no es un gran problema en mediciones de tiempo de reverberación en octavas o tercio de octavas, mientras que la desviación dentro de estas bandas no sea muy alta. La coloración del RTF por la respuesta de frecuencia del altavoz es muy indeseable con la intención de auralizar señales. En estos casos, es obligatorio usar un pre-énfasis para remover la coloración. Por supuesto, esta ecualización podría ser hecha post-procesando la RTF con la inversa de la respuesta del altavoz, pero esto no podría mejorar la pobre relación S/R en las regiones de frecuencia donde la salida acústica del altavoz es baja. Es por esto que es favorable pre-filtrar la señal de excitación independientemente de la frecuencia y potencia de salida. Una ecualización del altavoz es el pre-énfasis que debe ser aplicado en mediciones de acústica de salas. Además, la medición puede ser mejorada para un mejor alcance, adaptando el espectro de potencia emitido al espectro del ruido ambiente. Y en el mejor de los casos, el ruido de fondo tiende a ser mucho mayor en la región de bajas frecuencias. Así, en orden de obtener una relación S/R que sea casi independiente de la frecuencia, se debe aplicar un pre-énfasis adicional que siga el espectro del ruido de fondo. Mientras es deseable tener la relación S/R independiente de la frecuencia para análisis de acústica de salas (especialmente para la obtención de tiempo de reverberación en bandas filtradas), podría ser discutible el orden para minimizar el ruido audible, la RIR adquirida para propósitos de auralización tiene un ruido de fondo que es aproximadamente lo contrario de nuestra sensibilidad de la audición en niveles bajos. El uso de noise shaping para reducir el ruido percibido en grabaciones con cuantización fija (por ejemplo los 16 bits de un CD) busca la misma meta. Una buena introducción a esta área se da en [32]. Para conseguir el nivel de ruido que sea particularmente bajo en regiones espectrales de alta sensibilidad del oído, se debe aplicar un énfasis igual a la curva de sensibilidad (por ejemplo E-curve) a la señal de excitación. Por otro lado, dando un aumento extra en la región de frecuencias medias de mayor sensibilidad del oído podría llevar a señales de excitación bastante molestas. De todas formas, la pregunta de cual énfasis satisface lo mejor posible es un problema multifacético y se puede contestar diferentemente para cada medición. Una interrogante es como manejar las mediciones de la ecualización de la potencia acústica de los altavoces. Usualmente, la respuesta de potencia acústica del altavoz es obtenida por promedio de la magnitud de muchas funciones de transferencia medidas en campo difuso en una cámara reverberante. La corrección con la inversa de los tiempos de reverberación con 10*log{1/T(f)} convierte el espectro de presión del campo difuso en un espectro proporcional a la potencia acústica. Fig. 14: Pasos para la construcción de un espectro de potencia acústico de un altavoz. Después de esto, es indispensable un suavizado de 1/6 o 1/3 de octava para no obtener una curva corrugada. Pero esta suavización no es suficiente para bajas frecuencias, como puede ser visto en la fig.14 en la curva superior derecha. En este rango, la función de transferencia de la cámara consiste en solo en algunos modos con alto Q. Es una buena idea reemplazar estos nodos por un declive con la disminución teórica de la sensibilidad del altavoz (12 dB/oct para caja cerrada o 24 dB/oct para sistemas vented). El problema ahora es como tratar la fase y el retardo de grupo asociado. Evidentemente, la fase de la función de transferencia de la cámara reverberante no puede ser usada. Un compromiso factible es combinar la magnitud de la respuesta de potencia acústica (obtenida en la cámara reverberante) con una respuesta de fase en campo libre (obtenida de la medición de sensibilidad en el eje del altavoz). Obviamente, combinando la amplitud de una medición con la fase de la otra entrega un espectro artificial que también corresponde a una IR artificial. Sin embargo, esto parece ser una vía realizable para minimizar la distorsión en amplitud y fase de mediciones en acústica de salas. Es interesante advertir que si se creará un sweep, sólo la magnitud de la respuesta objetivo influenciará la señal de excitación. No teniendo ninguna influencia en la creación del barrido, la medición de la fase del altavoz puede ser ecualizada solamente por el post-proceso (es decir, aplicando lo contrario de esta fase al archivo de la referencia). Así, en general para las mediciones de acústica de salas, el proceso de la señal siempre consiste en una combinación de pre y post-procesamiento. 4 SÍNTESIS DE SWEEPS Los sweeps pueden ser creados directamente en el dominio del tiempo o indirectamente en el dominio de la frecuencia. En este último caso, su magnitud y retardo de grupo son sintetizados y el sweeps es obtenido mediante la IFFT de este espectro artificial. Las formulas dadas aquí no se apegan a los estándar matemáticos típicos, pero son aceptables para su implementación en software. Los dos tipos más comúnmente conocidos son los sweeps lineales y logarítmicos. Los sweep lineales tienen un espectro blanco y aumentan con una razón fija [Hz] por unidad de tiempo. f 2 − f1 = const T2 − T1 (a) Algunos científicos japoneses [35], [36], se refieren al sweep lineal como “pulso expandido en el tiempo” (time stretched pulse, TSP), pero por supuesto cualquier señal de excitación de banda ancha, como un sweep o un ruido, puede ser considerado como un pulso cuya energía ha sido expandida en el tiempo. El sweep logarítmico tiene un espectro rosado, lo que significa que la amplitud desminuye 3 dB/oct. Eso también significa que todas las octavas contienen la misma energía. La frecuencia aumenta con una fracción fija de una octava por unidad de tiempo: log ( f 2 f1 ) = const T2 − T1 4.1 (b) Construcción en el dominio del tiempo Los sweeps pueden ser sintetizados fácilmente en el dominio del tiempo mediante el incremento del paso de la fase que es sumado al argumento de una expresión sinusoidal después de cada cálculo de una muestra de salida. Un sweep lineal como los utilizados en TDS tiene un reajuste del valor sumado al incremento de la fase: x(t ) = A sin(ϕ ) ϕ = ϕ + ∆ϕ ∆ϕ = ∆ϕ + incϕ (1) En contraste un sweep logarítmico es generado por la multiplicación al incremento de la fase por un factor de reajuste después del cálculo de cada nueva salida. Así que la última línea en la ecuación (1) simplemente cambia a: ∆ϕ = ∆ϕ ⋅ Mulϕ (2) El valor de ϕ para la primera muestra es 0, mientras que el valor de ∆ϕ corresponde a la frecuencia de comienzo deseada del sweep: ∆ϕ start = 2π ⋅ fstart fs (3) El factor incϕ usado para la generación del sweep lineal depende de la frecuencia de inicio y de término, la frecuencia de muestreo fs y el número de muestras N a ser generados: incϕ = 2π fstop − fstart fs ⋅ N (4) En contraste, el factor Mulϕ necesario para incrementar un sweep logarítmico es calculado por: Mulϕ = 2 log 2 ( fstop ) − log 2 ( fstart ) N Mientras los sweep generados en el dominio del tiempo tienen una perfecta envolvente y de esta manera un factor cresta ideal (3.02 dB), su espectro no es exactamente el esperado. El abrupto comienzo al iniciar del sweep y el abrupto final al terminar el sweep son responsables del indeseable ripple en los extremos del espectro de excitación, como se ve en la fig. 15. Ventanas half pueden ser utilizadas para disminuir el impacto del inicio y término del sweep, pero no los elimina completamente. Normalmente, no tendrán efecto en la respuesta de frecuencia recuperada cuando se corrige con un espectro de referencia derivado de la inversión del espectro de la señal de excitación (la cual es obtenida por una medición de referencia conectando la salida a la entrada). Sin embargo, si la deconvolución es simplemente hecha con la inversión del tiempo y la forma de la amplitud del estímulo, como es propuesto en [2], o si la corrección no es factible, como con TDS, entonces pueden ser esperados errores en las cercanías del comienzo y término del sweep. Fig. 15: Sweeps creados en el dominio del tiempo y sus propiedades espectrales. (5) 4.2 Construcción en el dominio de la frecuencia La construcción de sweeps en el dominio de la frecuencia evita estos problemas. La síntesis puede ser hecha definiendo la magnitud y el retardo de grupo de un espectro FFT, calculando la parte real y la parte imaginaria de ella y finalmente transformando el espectro del sweep artificial al dominio del tiempo aplicando la IFFT. El retardo de grupo no es fácilmente interpretable para señales compleja, pero es muy bien definido para los sweep sinusoidales, describiendo exactamente en que tiempo ocurre cada frecuencia. Para los sweeps, el retardo de grupo se asemeja a la distribución tiempofrecuencia con los ejes vertical y horizontal intercambiados (a pesar de carecer de la tercera dimensión, contienen la información de la magnitud). Si se desea un sweep con una envolvente temporal constante (garantizado naturalmente por la construcción en el dominio del tiempo), la magnitud y el retardo de grupo tienen que estar relacionado el uno con el otro. En el caso de un sweep lineal, la magnitud del espectro tiene que ser blanco y en el caso del sweep logarítmico debe ser rosado, con una pendiente de –3 dB por octava. El retardo de grupo asociado para el sweep lineal puede ser entonces simplemente: donde k es: τG ( f ) = τG (0) + f ⋅ k (6) ( ) (7) τG fs 2 − τG (0) k= N El retardo de grupo de un sweep logarítmico es levemente más complicado: τG ( f ) = A + B ⋅ Log 2 ( f ) (8) τG ( fend ) − τG ( fstart ) log 2 ( fend − fstart ) (9) Donde: B= A = τG ( fstart ) − B ⋅ log 2 ( fstart ) Normalmente f START será la primera frecuencia del espectro discreto de la FFT, mientras que f END será fs / 2 . Por supuesto, τ G ( fstart ) y τ G ( fend ) deben estar restringidos a valores que se ajusten dentro de intervalo de tiempo obtenido después de la IFFT. La fase es calculada mediante la integración del retardo de grupo. La fase y la magnitud pueden ser convertidas a la parte real y imaginaria por las usuales expresiones sin/cos. Como se estableció antes, la creación de sweeps en el dominio del tiempo causarán algunos efectos de suciedad en el dominio espectral. Igualmente, los sweeps sintetizados en el dominio espectral causarán algunas rarezas en la señal resultante en el dominio del tiempo. Primero que todo, es importante que la fase resultante de la integración del retardo de grupo alcance exactamente 0° o 180° en fs. Esta condición generalmente tiene que ser cumplida por cada espectro de una señal real. Esto puede ser realizado fácilmente restando los valores del espectro de la fase que disminuyen linealmente con la frecuencia hasta exactamente la compensación de la fase anterior del final: ϕ( f ) = ϕ( f ) − f ⋅ ϕ END fs / 2 (10) Esto es equivalente a añadir un retardo de grupo menor de ± 0,5 muestras sobre todo el rango de frecuencias. Aún satisfaciendo esta condición, los sweep no estarán confinados exactamente a los valores dados por τ G ( fstart ) y τ G ( fend ) , pero estas se dispersan más allá en ambas direcciones. Esto es una consecuencia directa de la magnitud del espectro deseado, el cual no presenta las ondulaciones debidas al abrupto comienzo y término de los sweeps (creados en el dominio del tiempo). La ampliación se debe a que, el retardo de grupo para bajas frecuencias no debe ser cero, solo un poco mayor. De esta manera, la primera mitad de la onda del sweep tiene más tiempo para desarrollarse. Sin embargo, este siempre comenzará con un valor mayor a cero, mientras la parte restante izquierda del punto de comienzo se plegara hacia atrás, hacia los “tiempos negativos” en el final del período. Allí, este puede “ensuciar” la parte final de alta frecuencia del sweep si el retardo de grupo escogido para fs / 2 es demasiado cercano a la longitud del intervalo de tiempo de la FFT. Una manera segura de evitar la contaminación en la parte final debido a las componentes de bajas frecuencias es simplemente escogiendo la longitud del bloque de la FFT por lo menos el doble de la longitud del sweep deseado. Para forzar el deseado comienzo y final del sweep al punto cero, son indispensables las operaciones de fade para evitar el ruido switching. Haciendo esto, es claro que ocurre una desviación de la deseada magnitud del espectro. Pero ésta puede ser insignificante al escoger partes suficientemente estrechas al comienzo y final del sweep. El espectro y las señales en el tiempo resultantes para los sweeps lineales y logarítmicos son presentados en la fig. 16. La plataforma horizontal bajo los 20 Hz para el sweep logarítmico ha sido introducida deliberadamente para evitar demasiada energía subsónica. Ambos sweep cubren el rango completo de frecuencias desde el DC (incluido) a fs / 2 . Fig.16: Sweeps creados en el domino de la frecuencia mediante la formulación del retardo de grupo. El ripple introducido por las operaciones de fading (ventanas half-cosine muy adecuadas) puede ser mantenido fácilmente bajo 0.1 dB y no debe causar ninguna preocupación, ya que este impacto en la medición resultante es cancelado al desarrollar y aplicar la medición de referencia. Fig. 17: . Ilustración de la construcción de un sweep de ancho de banda con perfecta respuesta de magnitud. Sin embargo, en los casos donde una compensación exacta de la amplitud no es posible o deseado (por ejemplo, en un dispositivo TDS), el método iterativo mostrado en la figura 17 permite rechazar completamente el ripple, estableciendo la magnitud exacta del espectro deseado mientras se mantiene la longitud deseada del sweep. La iteración consiste del desarrollo consecutivo de operaciones fade in/out, transformando la señal del tiempo al dominio espectral, reemplazando la ligera corrugación de la magnitud espectral por la magnitud deseada, manteniendo las fases, y eventualmente volver a transformar la magnitud del espectro manipulada al dominio del tiempo. Antes de aplicar la ventana fade in/out nuevamente, los residuos fuera del intervalo del sweep son examinados. Si su valor máximo es menor que el LSB de la cuantización final del sweep deseado, la ventana es omitida y la iteración finaliza. Usualmente, el proceso converge rápidamente y aún un sweep con cuantización de 24 bit es disponible solo después de 15 iteraciones. Sin embargo, la respuesta de magnitud perfecta es cambiada por una ligera distorsión de la fase del espectro. Por lo tanto, el retardo de grupo derivado estará ligeramente distorsionado, pero el efecto es casi imperceptible y restringido bandas muy estrechas alrededor de DC y fs / 2 . La iteración trabaja mejor con sweep de un ancho de banda que cubre el rango completo entre 0 Hz y fs / 2 Hz. 4.3 Sweep con magnitud espectral arbitraria y envolvente temporal constante. Hasta ahora hemos estado restringidos a sweeps lineales y logarítmicos. Si su magnitud espectral fue alterada de la contribución de energía blanca o rosada a algo diferente, es claro que su envolvente temporal podría ya no ser constante. Esto puede implicar un incremento del factor cresta y por lo tanto una pérdida de energía, dando un clavado valor peak como máxima amplitud. No obstante, podría ser muy atractivo el uso de sweeps con una arbitraria contribución de energía sin perder la ventaja del bajo factor de cresta. Esto puede ser realizado de manera sorprendentemente fácil simplemente haciendo que el retardo de grupo crezca proporcionalmente a la potencia del espectro de excitación deseado. Generalmente, la energía de un sweep en una región particular de frecuencia puede ser controlada por la amplitud del sweep o la razón del sweep en esa frecuencia. Un incremento con pendiente del retardo de grupo significa que la correspondiente región de frecuencia es emitida en un tiempo considerable, con solo la frecuencia instantánea emergiendo lentamente. De esta forma, mucha energía esta almacenada en la respectiva sección espectral. El retardo de grupo para el sweep de magnitud arbitraria y envolvente constate puede ser construido comenzando con τ G ( fstart ) para la primera frecuencia y entonces incrementando: τ G ( f ) = τ G ( f − df ) + C ⋅ H ( f ) 2 (11) donde C es la longitud del sweep dividido por la por la energía del espectro de excitación: C= τ G ( fend ) − τ G ( fstart ) fs / 2 ∑ H( f ) (12) 2 f =0 El proceso es ilustrado por un ejemplo en la figura 18. El sweep bajo construcción servirá para ecualizar un altavoz y presentar un adicional énfasis de baja frecuencia. El espectro deseado de la señal de excitación se origina de la inversión de la respuesta del altavoz. Este es adicionalmente enfatizado con un filtro de primer orden low-shelf con 10 dB de ganancia y un filtro pasa altos en 30 Hz para evitar que un exceso de energía infrasónica alimente al altavoz por la nueva ecualización de la señal de excitación. El grupo de retardo construido muestra una relativa inclinación pronunciado hasta 0,5 segundos, y la señal resultante en el tiempo revela que en este rango incrementa solo gradualmente desde el valor inicial. De esta manera el sweep contendrá una gran cantidad de energía en esa región de frecuencia. Desde los 80 Hz a los 6 kHz, el retardo de grupo incrementa solamente en 200 ms, así todo el rango de frecuencias medias pasa a través de este corto tiempo. Sobre los 6 kHz, el retardo de grupo nuevamente se inclina debido al incremento de la magnitud deseada y la frecuencia aumenta moderadamente, extendiendo consecuentemente la parte de HF del sweep. Se debe observar que la amplitud del sweep no es completamente constante, como podría ser deseado para lograr el factor de cresta ideal. En el comienzo y en aproximadamente 650 ms, un leve resalto no se puede negar. Esta es otra imperfección causada por la formulación del sweep sintético en el dominio de la frecuencia. Para mantener esta alteración pequeña, una leve suavización de la magnitud del espectro ayuda. Haciendo esto, el factor de cresta del sweep puede mantenerse normalmente bajo los 4 dB, llevando a una perdida de energía menor a 1 dB. Por supuesto, el método iterativo descrito en 4.2 puede ser combinado con este algoritmo para reducir las desviaciones de la deseada respuesta de magnitud espectral cerca de las bandas límites. Haciendo esto, el factor cresta decrece levemente. Fig.18: Generación de sweep con envolvente constante y magnitud espectral arbitraria. 4.4 Sweep establecida. con espectro de magnitud arbitraria y envolvente ¿Es el sweep con envolvente constante y magnitud espectral arbitraria la señal de excitación óptima para mediciones acústicas? Bien, si el amplificador de potencia debe ser la restricción límite del equipamiento de medición, uno debe decir si. La casi constante envolvente de la señal de excitación permite obtener la máxima potencia del amplificador para todo el rango de frecuencias de la medición, por esta razón drenar la máxima energía posible hacia el RUT (room under test) en los distintos intervalos de tiempo. Sin embargo, la falta de potencia es raramente un punto de preocupación hoy en día (quedando solo los equipos portátiles alimentados con batería). Es mucho más común que tenga que ser considerada cuidadosamente la capacidad de manipulación de potencia de los altavoces para evitar dañarlos. En el caso de sistemas multivía, por ejemplo, un dodecaedro compuesto de altavoces coaxiales, posiblemente soportado por un potente subwoofer, cada vía tiene su propia potencia límite. Un sweep con envolvente constante debe tener esta potencia ajustada al enlace más débil del equipamiento, muchas veces los tweeters. Esto podría dejar a las capacidades de manipulación de potencia del woofer (que exceden a los tweeters frecuentemente por un factor de 10 o más) la mayoría de las veces sin uso. Por otro parte, un aumento extra es frecuentemente deseable precisamente en la región de bajas frecuencia para sobreponerse al incremento del ruido de fondo ambiental. Queda claro que en el caso de los altavoces, la potencia instantánea del sweep debe ser controlable de acuerdo a la frecuencia por la que está pasando el sweep. Esto puede ser logrado por el control de la amplitud del sweep en un modelo dependencia-frecuencia. Para hacer esto, solo es necesario hacer una modificación menor al proceso de creación de sweep revelado en la sección 4.3. Como se muestra en la figura 19, el truco es primero dividir el espectro “objetivo” por la envolvente espectral deseada. El espectro resultante es la base para la síntesis del retardo de grupo. Después, creando la parte real e imaginaria, el espectro del sweep ahora será multiplicado con la envolvente del espectro deseado, reestableciendo la magnitud de respuesta deseada. La IFFT producirá ahora un sweep que ya no tiene una envolvente constante, pero finalmente diseñando la amplitud dependiente de la frecuencia impuesta por el espectro de la envolvente deseada. Dos grados de libertad se ofrecen aquí: Una arbitraria distribución espectral junto con una arbitraria definición de la envolvente dependiente de la frecuencia, la cual es transformada en un una barrido senoidal desformado convenientemente en amplitud y tiempo. Fig. 19: Generación de sweep con magnitud y envolvente arbitraria. Se debe admitir que ésta aproximación no es la solución completa para el peligro del sobrecalentamiento de tweeter sensibles. Comparado a un sweep con envolvente constante de idéntico contenido de energía, un sweep con la envolvente deseada solo conduce al estiramiento en el tiempo la misma energía que alimenta al tweeter, resultándole mismo calentamiento si la longitud del tiempo es más pequeña que la constante de capacidad térmica de la bobina. Mediciones acústicas de salas con largos sweeps (muchos segundos) son también una ventaja si el tweeter no sólo es amenazado por sobrecalentamiento, también por daño mecánico causado (por ejemplo, fuerzas excesivas en la compresión de los drivers). La distorsión reducida debido al nivel inferior puede también ser una motivación, aunque esta es la gran ventaja de medición con sweeps donde la distorsión producida puede ser separada de la actual respuesta impulsiva. Otra aplicación de los sweeps con decremento controlado de la envolvente en altas frecuencias es la medición de grabadoras de cinta análoga. La envolvente puede ser adaptada a la curva de saturación que depende de la frecuencia en la cinta analógica de la grabadora, permitiendo así el uso óptimo del rango dinámico de la cinta en todas las frecuencias. De ésta manera, una aparente caída de la respuesta de frecuencia donde el nivel obtenidos cercanos al límite de saturación son obviados. En grabadores de cintas de casetes compactos con su estrecho y muy lento avance, el decremento necesario de la envolvente puede alcanzar 20 dB o más, dependiendo del material de la cinta. La curva de saturación de ésta misma puede ser determinada por la deliberada alimentación con un sweep de excesivo nivel que cause saturación en todas las frecuencias. La distorsión producida es removida de la respuesta impulsiva y el espectro que queda de esta respuesta impulsiva es una buena estimación de la dependencia de la frecuencia a máximo nivel de entrada para mediciones y grabaciones. 4.5 Sweep de dos canales con ecualización de altavoz y funcionalidad de crossover En muchas mediciones acústicas, son empleados altavoces multivía para cubrir lo más posible el rango audible. Por ejemplo, un dodecaedro omnidireccional usualmente exhibirá una pobre respuesta bajo 200 Hz aproximadamente, dependiendo de su tamaño. De esta manera, es una ventaja apoyarlo con un subwoofer para evitar la necesidad de excesivo pre-énfasis. Un diseño normal de caja cerrada o vented con un chasis será lo suficientemente omnidireccional en este rango de frecuencias. Como todas las tarjetas de sonido y algunos sistemas de medición están equipados con conversores estéreo, vale la pena hacer uso de dos canales para incluir una activa funcionalidad de crossover en la señal de excitación. Esto puede ser realizado con algunas extensiones del método de generación de sweep descrito en la sección 4.3 y 4.4. Primero que todo, como en cualquier tarea de ecualización, es necesario medir ambos altavoces en la misma posición para establecer la magnitud, fase y relación de retardo válida. Teniendo en mente las capacidades de manipulación de la potencia del altavoz y acorde a su magnitud de respuesta, un punto apropiado de crossover puede ser seleccionado. En esta frecuencia la diferencia de la fase y del retardo de grupo entre ambos espectros es leída y almacenada. Ellas serán necesarias más tarde. Ahora, después de una suavización opcional, ambos espectros son invertidos y tratados con un filtro pasa banda para confinarlos a ellos al deseado rango de frecuencia a ser barrido (ver figura 20). En este punto, un énfasis deseado adicional es también aplicado al espectro estéreo. Debe ser diseñada ahora la envolvente de frecuencia controlada. Tiene que ser ejecutado ahora una división por la envolvente del espectro deseado. Después de estos pasos de preparación, la función crossover debe ser traída al juego mediante la multiplicación del primer canal con un filtro pasa bajos y el segundo con el correspondiente filtro pasa altos. Fig. 20: Procesamiento para la generación de sweep de dos canales y funcionalidad de crossover activo. Fig. 21: Procesamiento adicional para sweep de dos canales. Aplicación de ventana a la IR, retardo de grupo sintetizado, ajuste de fase y retardo entre canales, fade in/out al sweep. Fig. 22: Creación de archivo de referencia mediante la deconvolución del sweep de dos canales emitido por un parlante de dos vías. Un opcional efecto de suavización (con ancho constante en escala lineal de frecuencia) puede ser obtenido por la aplicación de una ventana a la respuesta impulsiva de ambos espectros. Para este propósito, ambos son transformados al dominio del tiempo después de suprimir su fase. La ventana deseada es aplicada y la respuesta al impulso confinada es transformada devuelta al dominio de la frecuencia (ver figura 21). La ventana no debe ser demasiado estrecha para evitar enturbiar o nublar el detalle de baja frecuencia. Ahora el sweep de dos canales puede ser creado por la formulación de la ya conocida relación entre la magnitud ajustada y el incremento del retardo de grupo. Pero en vez de usar solo un canal, la magnitud ajustada de ambos canales tiene que ser añadida aquí para permitir el crecimiento del valor del retardo de grupo: 2 τ G ( f ) = τ G ( f − df ) + C ⋅ ∑ H ( f ) 2 (13) Ch =1 Así mismo, C es calculado usando la suma de la energía total de ambos canales: C= τ G ( fend ) − τ G ( fstart ) 2 fs / 2 ∑ ∑ H( f ) Ch =1 f =0 2 (14) Como la frecuencia instantánea deberá ser la misma para ambos canales, la síntesis del retardo de grupo tiene que ser desarrollado solo una vez y la fase resultante puede ser copiada en el segundo canal. Si se diseñara la señal de excitación con una envolvente controlada por la frecuencia, este espectro de dos canales tiene que ser multiplicado por la envolvente del espectro después de convertir la magnitud y el sintetizado retardo de grupo a su normal representación real/imaginaria. La IFFT arrojara un sweep de dos canales que primero se deslizara a través de las bajas frecuencias en un canal y entonces las frecuencias restantes en el otro canal, La suma de ambos canales tendrá la deseada envolvente, mientras la relación de sus amplitudes en cada frecuencia instantánea corresponde a la relación establecida en el dominio espectral. En la región de cruce, que no puede ser hecha indefinidamente estrecha debido a la norepetitiva naturaleza del sweep, ambos canales interfieren. Mientras ellos están en fase en la síntesis de la señal de excitación de dos canales, ellos usualmente no pueden llegar en fase al micrófono cuando son emitidos sobre dos altavoces. Así una corrección retardo/fase es necesaria para evitar perdidas de nivel de presión sonora en la región de cruce. Este es el por qué la relación de la fase y el retardo de grupo de la respuesta de los altavoces debe ser almacenada previamente. Esta información puede ahora ser utilizada para desplazar la señal para el altavoz con el menor retardo de grupo al derecho por la diferencia en los tiempos de llegada. Esto puede ser logrado mejor aún en el dominio espectral por la suma del apropiado retardo de grupo. Las fases recibidas en el punto de cruce pueden ser traídas en acuerdo mediante la suma o resta de pequeños adicionales retardos de grupo a uno de los canales. Es discutible que podría ser más ventajoso, si ruidos de dos canales o sweeps con “dos voces” cubriendo independientemente ambos rangos de frecuencia al mismo tiempo, como estos permiten drenar la energía a ambos altavoces sobre el período entero de la medición. Sin embargo, solo un sweep de “una voz” permite descartar adecuadamente los productos de la distorsión de la IR recuperada. Por otra parte la señal estereo puede alimentar con mucho mayor nivel, lo que compensa la desventaja del tiempo de emisión restringido en vías individuales. Obviamente, el espectro de referencia necesario para deconvoluir la señal de excitación recibida no puede ser creado realizando la usual referencia eléctrica de medición. Haciendo esto, la ecualización del altavoz cuidadosamente introducida podría desaparecer en el resultado final. La única manera viable es construir el espectro de referencia por una simulación descrita en la fig.22. Primero, la excitación de dos canales anteriormente generada es transformada al dominio espectral. Allí es multiplicada con la respuesta del altavoz y la respuesta del sistema de medición. Esta última puede incluir la respuesta del camino eléctrico de la señal (conversores, amplificador de potencia, preamplificador de micrófono) y la respuesta del micrófono, que podría no ser suficientemente plana. Después de estas operaciones, ambos canales son sumados produciendo una simulación del espectro del nivel de presión en la posición del micrófono (coloreado por la respuesta del camino de recepción). Este espectro es ahora invertido para negar el retardo de grupo y neutralizar el pre-énfasis escogido, si es que fue aplicado. Al invertir el espectro podría producir un énfasis excesivo en frecuencias fuera del rango seleccionado de transmisión, es indispensable una multiplicación con un filtro pasa banda de aproximadamente la misma frecuencia usada en las etapas de preprocesamiento (fig.20). Para silenciar el ruido efectivo fuera de las bandas, el orden del filtro pasa banda debe ser un tanto mayor que el usado en el pre-procesamiento. La aplicación de este inevitable filtro pasa banda es un paso crítico, lo que significa que son los resultados acústicos de la medición convoluida con su respuesta del impulso. Los efectos resultantes pueden ser un poco inquietantes. Por ejemplo, usando un filtro pasa banda con fase lineal obviamente produciremos un pre-ringing de la IR recuperada de la sala. Para efectos de auralización esto es indeseado. En este caso, es más aconsejable usar un filtro IIR de fase mínima. Por otro lado, un filtro pasa banda de fase lineal puede inducir menos errores en las clásicas evaluaciones de parámetros acústicos de sala. En cualquier caso, el orden del filtro debe ser lo más moderado posible, para mantener la IR del filtro lo suficientemente estrecha. Generalmente, estas consideraciones se aplican a cualquier medición de acústica de salas de banda ancha. Al menos, la técnica de pre-ecualización activa presentada aquí permite obtener la IR de la sala libre de coloración por mediciones de altavoces y presenta una alta relación S/R independiente de la frecuencia. 5 MEDICIÓN DE DISTORSIÓN Anteriormente se ha mostrado que los productos de la distorsión armónica pueden ser eliminados completamente de la IR obtenida cuando la medición es hecha usando sweeps. En mediciones de acústica de salas, usualmente estas son removidas si el altavoz no es el objeto de medición. Sin embargo, en mediciones de altavoces, es muy interesante asociarlas con la fundamental para evaluar el porcentaje de distorsión dependiente de la frecuencia. Esto puede ser hecho separadamente para cada armónico, como propone Farina [2]. Para describir la técnica, la fig. 23 muestra el retardo de grupo de un sweep logarítmico y sus primeros cuatro armónicos y la figura 24 muestra la distribución tiempo-frecuencia de la energía de una señal con similar distorsión. Fig 23: Retardo de grupo de a) fundamental (línea superior) y los primeros cuatro armónicos, b) archivo de referencia, c) sweep deconvolucionado con armónicos, d) posición de los armónicos en la respuesta impulsiva. Fig.24: Diagramas Tiempo-Frecuencia de un sweep logarítmico y armónicos (izquierda) la IR (derecha). Obviamente, para una determinada frecuencia de la fundamental, todos sus correspondientes armónicos tienen el mismo retardo de grupo. En el ejemplo, la fundamental del sweep llega a 400 Hz después de 2 segundos. Por lo tanto, el armónico de 2° orden intersecta la línea de 2 segundos en 800 Hz, el 3° en 1.2 kHz sucesivamente. Concentrándonos en una frecuencia específica en el diagrama, los armónicos que intersectan esta línea vertical tienen un retardo de grupo menor que la fundamental del sweep, como por supuesto ellos pertenecen a fundamentales con menores frecuencias que han sido “sweepeados” anteriormente. Multiplicando las curvas con el espectro de referencia (que es, restar el retardo de grupo de la fundamental) conduce a removerlos a tiempos negativos mientras la fundamental queda en t = 0 s, como se desea. Sólo en el caso de sweeps logarítmicos, los armónicos presentarán un retardo de grupo constante independiente de la frecuencia después de la aplicación del espectro de referencia. Podrían ser usados otros retardos de grupo, pero requeriría el uso de un espectro de referencia separado de cada armónico para convertirlas en líneas rectas. Sin embargo, la distancia entre los componentes de los armónicos individuales podría no ser independiente de la frecuencia. Así un sweep logarítmico es preferible como señal de excitación, ecualizando el que ya ha sido usado desde hace mucho tiempo en el antiguo sistema grabador de nivel (1.1). Una IFFT del espectro deconvoluido produce la actual IR en el borde izquierdo y un par de “armónicos de la IR” (harmonic impulse response, HIR) en tiempo negativos cerca del borde derecho, con la HIR de 2° orden situado en a la derecha y las HIR de mayor orden siguiendo de derecha a izquierda. Esta distancia entre ellos puede ser calculada por: DitsHIR − AB = ld ( ord A / ord B ) sweep _ rate [oct / s ] (15) Para evaluar la fracción de distorsión dependiente de la frecuencia, la señal en el tiempo es separada en la fundamental de la IR y cada HIR mediante ventanas. Cada uno de la HIR aislada es enviado a FFT por separado. El largo del bloque de FFT usado puede ser mucho menor que el usado para la deconvolución inicial de la respuesta del sweep, por esta razón se aumenta la velocidad de todo el proceso. Para relacionar los contenidos de frecuencia de un espectro de HIR con la fundamental, se realiza una operación de cambio acorde al orden del armónico específico. Por ejemplo los componentes espectrales de la HIR de 5° orden son cambiados horizontalmente a un quinto de su frecuencia original. Después de esta operación, el espectro cambiado puede ser dividido en la fundamental produciendo la fracción de distorsión dependiente de la frecuencia (ver fig. 25). Podría ser aplicada una corrección de −10log(orden del armónico) para compensar el énfasis de las frecuencias altas impuesto por el espectro de referencia. Sorprendentemente, como han expuesto muchos experimentos, esta operación ha de ser omitida para permitir corregir los resultados. Fig.25: Etapas de procesamiento de señal para la evaluación de la función de transferencia y armónico de segundo orden con sweep logarítmico. Comparado el estándar de excitación de un tono (single tone) y el análisis con incrementos de frecuencia fija, este método es mucho mas rápido y usualmente establece una mayor resolución de frecuencia, a menos en el rango de medias y altas frecuencias. Sin embargo, no se pueden negar algunas desventajas. Primero que todo, la medición es restringida a ambientes anecoicos, a menos que se usen sweeps muy largos. Mucha reverberación en el sitio de medición podría conducir a ensuciar los distintos armónicos de la IR por componentes retrasados, impidiendo así su separación. Esto ciertamente es un defecto esencial, como el fuerte de las mediciones de IR es precisamente la habilidad de rechazar reverberación, con tal que el desfase entre sonido directo y la primera reflexión sea suficientemente largo. Existen otros problemas relacionados con el uso de ventanas para separar la HIR individualmente. Por supuesto, todos los problemas usuales asociados con el uso de ventanas aplicadas [33]. En particular, la elección del tipo de ventana constituye un compromiso entre el ancho del lóbulo principal, mainlobe width (equivalente a la resolución espectral) y la supresión del lóbulo lateral, sidelobe suppression. Para evitar una pérdida de energía y una subsiguiente subestimación de los componentes de distorsión que no están exactamente situados bajo la parte superior de la ventana, se usa una ventana Tukey-style [33]. Sin embargo este tipo de ventana presenta una pobre sidelobe supresión, de ventana rectangular de sólo 21 dB. Esto puede llevar a rellenar con señal artificial aquellas regiones de frecuencias en cuales la distorsión cae a valores muy bajos. El suavizado espectral causado por cualquier ventana es constante en una escala lineal de frecuencia. En la usual visualización logarítmica, esto significa que la resolución espectral llega a ser extremadamente alta en altas frecuencias, mientras posiblemente existan detalles deficientes en el final bajo del espectro de distorsión. Si se desea una mayor resolución, el sweep debe ser hecho mas largo para espaciar la HIR, así permitiendo el uso de ventanas anchas. El ancho de ventana disminuye según la ecuación (15) para separar las HIR de alto orden. Esto conlleva a reducir la resolución del correspondiente espectro de distorsión. Sin embargo, cuando se comprime a la derecha para relacionar con su fundamental, la resolución queda mayor que la HIR de menor orden. En la práctica, la resolución deseada para armónicos de 2° orden al final del rango de transmisión del altavoz determina la razón del sweep y por lo tanto el largo de la señal de excitación. Fig.26: Comparación de armónico de 2do orden adquirido con un sweep (izquierda) y tradicional prueba de tonos puros en incrementos de 1/24 octava (derecha). Otro problema de la detección rápida de la distorsión es la falta de relación S/R, especialmente para armónicos de mayor orden que usualmente tienen bajos niveles. Mientras que el método de tonos puros resulta en bastante energía en la fundamental y sus armónicos, la técnica de sweeps dispersa la energía continuamente sobre todo el rango de frecuencias. Este es el porque la distorsión del espectro para armónicos de alto orden tiende a ser bastante ruidoso, esencialmente en altas frecuencias. Para aliviar este problema, es bueno extender el sweep a un largo incluso mayor del necesario para obtener la resolución espectral deseada. Las ventanas pueden ser más angostas de lo necesario para aislar la HIR, de este modo rechazando el ruido de fondo que queda entre ellas. Finalmente, incluso cuando se toman todas las precauciones para garantizar una alta precisión en la medición, es innegable que a veces, pueden ocurrir diferencias inexplicables entre el método de steady tone y el sweep en algunas regiones de frecuencia. La fig 26 muestra un ejemplo de tal diferencia. Entre 1.3 y 1.7 kHz, el armónico de 2° orden obtenido con ambos métodos es bastante diferente. Las razones para estas diferencias no son obvias, quizás diferentes temperaturas de la bobina del altavoz pueden jugar un papel importante. Después de todo, el método de stepped tone toma mucho más tiempo y por lo tanto produce un aumento de temperatura en la bobina. A pesar de estas incertezas, las pruebas de distorsión basadas en sweep son muy atractivas, ya que estas son mucho más rápidas que las convencionales con tonos puros. En pruebas de producción esto no solo permite un chequeo rápido, además permite comprobar el 100% de la producción, incluso si la mercadería es una producción masiva económica. 6 CONCLUSIONES Las técnicas de FFT usando sweeps como señal de excitación es la opción más ventajosa para casi todas las situaciones de medición de función de transferencia. Permite alimentar el DUT con mayor potencia con un factor de cresta un poco mayor de 3 dB y son bastante tolerantes contra las variaciones de tiempo y distorsión. Escogiendo un largo de sweep adecuado permite eliminar todos los productos de distorsión. Además, estos se pueden clasificar en armónicos dependientes de la frecuencia, permitiendo un análisis completo y bastante rápido para todo el rango de frecuencia conjuntamente con la evaluación de la función de transferencia. Cuando el propósito es capturar respuestas impulsivas para auralización, no hay alternativa a los sweeps: El alto rango de 90 dB requerido para este propósito no puede ser obtenido con MLS o mediciones de ruido. Pero incluso en las mediciones RT estándar que no requieren un gran rango dinámico, los sweeps son favorables ya que ayudan a aumentar el rango dinámico hasta 15 dB comparado con mediciones basadas en MLS, usando el mismo amplificador, altavoz y largo de medición. Así existen pocos puntos favorables mediante el uso de MLS. Incluso su característica de ahorrar memoria y tiempo de procesamiento ha perdido completamente relevancia con la tecnología computacional actual. Desde el punto de vista de un programador, no incluir la generación de MLS y la transformada de Hadamard, es un ahorro de tiempo de desarrollo de un software de medición. Aunque obtener funciones de transferencia con MLS puede ser matemáticamente elegante, los autores piensan que el uso de sweeps es elegante desde un punto de vista de la teoría del sistema y señales. Además midiendo con sweeps es más natural. Después de todo, los murciélagos no emiten MLS para hacer su perfil acústico. 7 AGRADECIMIENTOS El trabajo ha sido apoyado por el Consejo Nacional de Brasil para desarrollo científico y tecnológico (CNPq). Ha sido patrocinado durante seis meses en el laboratorio de acústica de INMETRO de uno de los autores. Mientras el estudio inicial no fue exactamente propuesto para el desarrollo de tecnología de medición, muchas de las ideas respecto a mediciones con sweep se desarrollaron y han sido probadas en este período, gracias al intenso intercambio de ideas de los dos autores. Los autores agradecen muchísimo a Jaime Undurraga Lucero y Mauricio Uribarri, dos ingenieros que acabaron de formarse en la Universidad Perez Rosales, Santiago de Chile. Los dos no midieron esfuerzos, no solo por traducir todo esto texto muy largo, mas también porque pusieron en practica los conceptos presentados, desarrollando los “Macaquitos das Janelas” (MJ), un programa sofisticado de mediciones de función de transferencia que genera y utiliza sweeps. 8 REFERENCIAS [1] David Griesinger, “Beyond MLS – Occupied Hall Measurement with FFT Techniques”, J.AES, vol. 44 p. 1174 (abstract), 101st AES convention, preprint 4403 [2] Angelo Farina, “Simultaneous Measurement of Impulse Response and Distortion with a Swept-sine technique”, J.AES, vol. 48, p. 350, 108th AES Convention, Paris 2000, Preprint 5093 [3] Richard C. Heyser, “Acoustical Measurements by Time Delay Spectrometry”, J.AES, vol. 15, 1967, pp. 370-382 [4] Richard C. Heyser, “Loudspeaker Phase Characteristics and Time Delay Distortion”, J.AES, vol. 17,1969, pp. 30-41 [5] Richard C. Heyser, “Determination of Loudspeaker Signal Arrival Times, Parts I,II & III”, J.AES, 1971, pp. 734-743, pp. 829-834, pp. 902, or AES Loudspeakers Anthology, vol. 1–25, pp. 225 [6] AES / Richard C. Heyser, “Time Delay Spectrometry - An Anthology of the Works of Richard C. Heyser”, AES, New York 1988 [7] John Vanderkooy, “Another Approach to Time-Delay Spectrometry”, J.AES, vol. 34, July 1986, pp. 523-538 [8] Richard Greiner, Jamsheed Wania, Gerardo Noejovich, “A Digital Approach to Time Delay Spectrometry”, J.AES, vol. 37, July 1989, pp. 593-602 [9] Peter d’Antonio, John Konnert, “Complex Time Response Measurements Using Time-Delay Spectrometry (Dedicated to the late Richard C. Heyser)”, J.AES, vol. Vol. 37, September 1989, pp. 674-690 [10] Henrik Biering, Ole Z. Pederson, “Comments on ‘Another Approach to TimeDelay Spectrometry” and author’s reply, J.AES, vol. 35,March 1987, pp. 145-146 [11] Henrik V.Sorensen, Douglas L. Jones, Michael T. Heideman, Sidney Burrus, ”Real-valued Fast Fourier Transform Algorithms”, IEEE Trans. Acoustics , Speech, Signal Proc., June 1987, p. 849 [12] Johan Shoukens, Rik Pintelon, “Measurement of Frequency Response Functions in Noise Environments”, IEEE Trans. Instrumentation and Measurement, December 1990 [13] Douglas D. Rife & John Vanderkooy, “Transfer Function Measurement with Maximum-Length Sequences”, J.AES, vol. 37,June 1989, pp.419-444 [14] Johan Shoukens, Rik Pintelon, Yves Rolain, “Broadband versus Stepped Sine FRF Measurements”, IEEE Trans. Instrumentation and Measurement, April 2000, No.2 [15] J.M. Berman, L.R. Fincham The Application of Digital Techniques to the Measurement of Loudspeakers J.AES, vol. 25, 1977, pp. 370-384, or AES Loudspeakers Anthology, vol. 1-25, p. 436 [16] Chris Dunn, Malcom Omar Hawksford, “Distortion Immunity of MLS-Derived Response Measurements”, J.AES May 1993, pp. 314 [17] L.R. Fincham, “Refinements in the Impulse Testing of Loudspeakers”, J.AES, vol. 41, March 1985, pp. 133-140 [18] F.J.MacWilliams, N.J.A.Sloane, “Pseudo-Random Sequences and Arrays”, Proc.IEEE, 1976, vol.84, p. 1715 [19] Thomas W. Parks, James H. McClellan, Lawrence R. Rabiner, “A Computer Program for Designing Optimum FIR Linear Phase Digital Filters”, IEEE Trans. Audio Electroacoustics, 1973, p. 506 [20] E.D. Nelson, M.L. Fredman, “Hadamard Spectroscopy”, J.Opt. Soc. Am., 1970, pp.1664 [21] H.Alrutz & Manfred R. Schroeder, “A Fast Hadamard Transform Method for the Evaluation of Measurements using Pseudorandom Test Signals”, Proc. 11th ICA, Paris 1983, pp. 235 [22] Jeffrey Borish & J. Angell, “An Efficient Algorithm for Measuring the Impulse Response Using Pseudo-Random Noise”, J.AES, vol. 33, 1983, pp. 478-488 [23] Jeffrey Borish, “Self-Contained Crosscorrelation Program for Maximum Length Sequences”, J.AES, vol. 33, 1985, pp. 888-891 [24] Manfred R. Schroeder, “Integrated –Impulse Method for Measuring Sound Decay without using Impulses”, J.ASA, 1979, p. 497 [25] Eckard Mommertz, Swen Müller, “Measuring Impulse Responses with Preemphasized Pseudo Random Noise derived from Maximum Length Sequences.”, Applied Acoustics, 1995, vol.44, p. 195 [26] Jeffrey Borish, “An Efficient Algorithm for Generating Colored Noise Using a Pseudorandom Sequence”, J.AES, vol. 33, March 1985, pp. 141-144 [27] Michael Vorländer, Heinrich Bietz, „Der Einfluß von Zeitvarianzen bei Maximalfolgenmessungen“, DAGA, 1995, p. 675 [28] Michael Vorländer, Malte Kob, “Practical Aspects of MLS Measurements in Building Acoustics”, Applied Acoustics, vol.52, p. 239 [29] Peter Svensson, Johan L. Nielsen, “Errors in MLS Measurements Caused by Time Variance in Acoustic Systems”, J.AES, vol. 47, November 1999, pp. 907 [30] C. P. Jane and A. J. M. Kaizer, “Time-Frequency Distributions of Loudspeakers: The Application of the Wigner Distribution”, J.AES, vol. 31, April 1983, pp. 198-223 [31] D. B. Keele Jr., „Low-Frequency Loudspeaker Assessment by Nearfield SoundPressure-Measurements”, J.AES, vol. 22, 1974, pp. 154-162, or AES Loudspeakers Anthology, vol. 1-25, p. 344 [32] John Vanderkooy, Stanley Lipshitz, Robert Wannamaker, “Minimally Audible Noise Shaping”, J.AES, vol. 39, 1991, pp. 836-852 [33] Fredric J.Harris, “On the Use of Windows for Harmonic Analysis with the Discrete Fourier Transform”, Proc. IEEE, January 1978, p. 51 [34] John S. Bradly, “Optimizing the Decay Range in Room Acoustics Measurements using Maximum-Length-Sequence Techniques”, J.AES, vol. 44, pp. 266273, April 1996. [35] Nobuharo Aoshima, “Computer-generated pulse signal applied for sound measurement”, J.ASA, May 1981, p. 1484 [36] Yôiti Suzuki, Futoshi Asano, Hack-Yoon Kim, Toshio Sone, “An optimum computer-generated pulse signal suitable for the measurement of very long impulse responses”, J.ASA, February 1995, p. 1119 9 BIBLIOGRAFÍA [37] A.J. Berkhout, D. de Vries, M. M. Boone, “A New Method to Acquire Impulse Responses in Concert Halls”, J.ASA, 1980, p. 179 [38] A.J. Berkhout, M.M. Boone, C. Kesselman, “Acoustic Impulse Response Measurement: A New Technique”, J.AES, vol. 32, October 1984, pp. 740-746 [39] John D. Bunton, Richard H. Small, “Cumulative Spectra, Tone Bursts, and Apodization”, J.AES, vol. 30, June 1982, pp. 386-395, or AES Loudspeakers Anthology, vol. 26-31, p. 322 [40] Richard C. Cabot, “Audio Measurements”, J.AES, vol. 35, June 1987, pp. 477500 [41] Angelo Farina, “Non-Linear Convolution: A New Approach for the Auralization of Distorting Systems”, presented at the 110th Convention of the AES, Amsterdam, 2001 May. [42] Panagiotis D. Hatziantoniou, John N. Mourjopoulos, „Generalized FractionalOctave Smoothing of Audio and Acoustic Responses“, JAES, vol. 48, pp. 259-280 [43] Paul S. Kovitz, “On the Repeatability of TDS Energy-Time Curve and MLS Impulse Response Measurements”, Sabine Centennial Symposium, 127th ASA Convention, June 1994, p. 129 [44] Stanley P. Lipshitz, Tony C. Scott, John Vanderkooy, “Increasing the Audio Measurement Capability of FFT Analyzers by Microcomputer Postprocessing”, J.AES, vol. 33, 1985, pp. 626-648 [45] Anders Lundeby, Tor Erik Vigran, Heinrich Bietz, Michael Vorländer, “Uncertainties of Measurements in Room Acoustics”, Acustica, 1995, p. 344 [46] Eckard Mommertz, „Mobiles Raumimpulsantworten“, DAGA, 1990, p. 843 Meßsystem zur Aufnahme von [47] Johan L. Nielsen, “Improvement of Signal-to-Noise Ratio in Long-Term Measurements with High-Level Nonstationary Disturbances”, J.AES, 1997, vol. 45, pp. 1063-1066 [48] E.P. Palmer, R.D. Price, S.J. Burton, “ Impulse-response and transfer-function measurements in rooms by m-sequence cross correlation”, J.ASA, 1986, Vol. 80, p. 56 [49] M. Poletti – “Linearly swept frequency measurements, time-delay spectrometry, and the Wigner distribution” – J.AES, vol. 36, 1988 June, pp. 457-468 [50] Douglas Preis, Voula Chris Georgopoulos, “ Wigner Distribution Representation and Analysis of Audio Signals: An Illustrated Tutorial Review”, J.AES, December 1999, pp. 1043-1053 [51] Allan Rosenheck, Kurt Heutschi, “Tone Bursts for the Objective and Subjective Evaluation of Loudspeaker Frequency Response in Ordinary Rooms”, J. AES, vol. 47, April 1999, pp. 252-255 [52] Johan Schoukens, Rik Pintelon, Edwin van der Ouderna, Jean Renneboog, “Survey of Excitation Signals for FFT based Signal Analyzers”, IEEE Trans. Instrumentation and Measurement, September 1988, p. 342 [53] Johan Shoukens, Yves Rolain, Rik Pintelon, “Improved Frequency Response Measurements for Random Noise Excitations”, IEEE Trans. Instrumentation and Measurement, February 1998, No.1, p. 332 [54] Manfred R. Schroeder, “Number Theory in Science and Communication Springer Verlag Berlin Heidelberg New York Tokyo, 1986 [55] Manfred R. Schroeder, “Synthesis of Low-Peak-Factor Signals and Binary Sequences with Low Autocorrelation”, IEEE Trans. Info. Theory, 1970, p. 85 [56] Christopher J. Struck, Steve F. Temme, “Simulated Free Field Measurements”, J.AES, vol. 42, 1994, pp. 467-482 [57] Michael Vorländer, “Application of Maximum Length Sequences in Acoustics”, 17° Encontro da Sociedade Brasileira de Acústica (SOBRAC), December 1996, p. 35 [58] Xiang-Gen Xia, “System Identification Using Chirp Signals and Time-Variant Filters in the Joint Time-Frequency Domain”, IEEE Trans. Signal Proc., August 1997, p. 2072 [59] Edgar Villchur, “A Method for Testing Loudspeakers with Random Noise Input”, AES Loudspeakers Anthology, vol. 1-25, p. 96 [60] John Vanderkooy, “Aspects of MLS measuring systems”, JAES, vol. 42, April 1994, p. 219 [61] Douglas D. Rife, “Comments on “Distortion Immunity of MLS D. Rifed Impulse Response Measurements” and author’s reply, J.AES, June 1994, p. 490 [62] Won-Jin Kim and Youn-Sik Park, “Non-Linearity Identification and Quantification Using an Inverse Fourier Transform”, Mechanical Systems and Signal Processing 1993 7(3) pp. 239-255 [63] G.R. Tomlinson, “Developments in the Use of the Hilbert Transform for Detecting and Quantifying Non-Linearity Associated with Frequency Response Functions,, Mechanical Systems and Signal Processing 1987 1(2), pp. 151-171 [64] Guy-Bart Stan, Jean Jaques Embrechts and Dominique Archambeau, “Comparison of Different Impulse Response Measurement Techniques”, J.AES, April 2002, pp. 249-262