Medición de Función de Transferencia con sweeps

Anuncio
Medición de Función de Transferencia con sweeps
DIRECTOR’S CUT INCLUDING PREVIOUSLY UNRELEASED MATERIAL
SWEN MÜLLER, miembro AES
Institut für Technische Akustik, RWTH, 52056 Aachen, Alemania
Y
PAULO MASSARANI
Laboratório de Ensaios Acústicos, INMETRO, Xerém, Duque de Caxias (RJ), Brasil
TRADUCIÓN:
MAURICIO URIBARRI
Y
JAIME UNDURRAGA LUCERO
Departamento de Acústica, Universidad Pérez Rosales, Santiago, Chile
Comparado a usar señales pseudo-aleatorias, las mediciones de función de transferencia
usando sweeps como señal de excitación muestran significativamente mayor inmunidad
contra la distorsión y varianza de tiempo. Capturar respuestas impulsivas binaurales de
salas con propósitos de auralización de alta calidad requiere una relación señal-ruido
mayor a 90 dB que no es factible lograr con mediciones con MLS debido a la no
linealidad del altavoz, pero fácilmente alcanzables con sweeps debido a la posibilidad
de remover completamente la distorsión armónica. Antes de investigar las diferencias y
problemas prácticos con mediciones con MLS y sweeps y discutir porque los sweeps
son una mejor opción para la mayoría de las mediciones, serán revisados los métodos
existentes para obtener la función de transferencia. Será dirigida la necesidad de usar
señales de excitación pre-enfatizadas en mediciones acústicas. Es presentado un método
para crear sweeps con contenidos espectrales arbitrarios, pero con envolvente temporal
con dependencia de frecuencia constante o prescrita. Es investigada la posibilidad de
analizar simultáneamente función de transferencia y armónicos.
0 INTRODUCCIÓN
La medición de funciones de transferencia y sus respuestas impulsivas asociadas es una
de las tareas más importantes en todas las áreas de la acústica. Está técnica
prácticamente es necesaria en todo. Un desarrollador de altavoces chequeara la
respuesta de frecuencia de un nuevo prototipo muchas veces antes de la entrega para la
producción. Como la respuesta en el eje central no es suficiente para caracterizar un
altavoz, es necesario un completo conjunto de mediciones polares de los datos. En
acústica de salas, la respuesta impulsiva juega un rol central, ya que una gran cantidad
de parámetros acústicos relacionados con la calidad de la percepción pueden ser
derivados de ésta. En acústica de locales, el aislamiento del ruido depende de la
frecuencia. En vibro-acústica, la propagación de las ondas de sonido en los materiales y
la radiación desde su superficie tiene un vasto campo de simulación y verificación de las
mediciones con vibradores. También es usada para la detección de reflexiones (sonar,
radar) y otras áreas relacionadas a la medición de respuestas impulsivas.
Mientras muchas de estas tareas de mediciones no requieren un excesivo rango
dinámico, es diferente cuando se trata de adquirir la respuesta impulsiva de una sala
(RIR) para usarla en la convolución de audio en condiciones de campo libre. Debido al
amplio rango dinámico de los sistemas de los auditorios y la relación logarítmica entre
el SPL y la sonoridad percibida, cualquier anomalía en la parte final del tiempo de
reverberación de una RIR es fácilmente reconocible. Esto se siente especialmente
cuando pronunciaciones con largas pausas intermedias son usadas para la convolución y
cuando los resultados de la auralización son monitoreados con audífonos, como se
requiere para “realidad virtual” basada en respuestas binaurales. Con la tecnología
digital de hoy, la relación S/R supera los 110 dB, por lo que no parece ser muy osado
atreverse a pedir una relación S/R para la adquisición de RIRs que sea como mínimo
equivalente a los 16 bit del CD estándar.
Este trabajo ha sido motivado por la constante decepción de las mediciones RIRs
basadas en MLS. Bajo condiciones óptimas, con la suposición de ausencia de varianza
del tiempo, muy poco ruido de fondo, apropiado pre-énfasis y un número de promedios
sincrónicos arbitrarios, parece imposible lograr un rango dinámico superior a ese,
supongamos, en un grabador de cinta análogo. En cualquier medición que se utilice
ruido como señal de excitación, distorsión (muchas veces inducido por el altavoz) se
reparte en todo el período de medición de la respuesta impulsiva, el nivel de ruido
resultante puede ser reducido utilizando largas señales de excitación, pero nunca será
excluido enteramente. La distorsión puede ser reducida usando un nivel bajo, pero esto
conduce a que el ruido de fondo contamine el resultado. Por lo tanto, el nivel
comprometido debe ser ajustado arduamente para cada lugar de medición [34],
frecuentemente dejando las capacidades del amplificador de potencia y del altavoz poco
explotadas.
En contraste, el uso de sweeps como señales de excitación muestra un mejor alcance de
esas limitaciones. Usando sweeps algo mayores que la RIR a ser recobrada permite
excluir toda la distorsión armónica producida, prácticamente dejando solo el ruido de
fondo como limitación para alcanzar la relación S/R. De esta manera los sweeps pueden
ser alimentados con una potencia considerablemente mayor en el altavoz sin introducir
señales artificiales en la RIR adquirida. Además en condiciones anecóicas la distorsión
puede ser clasificada como únicos armónicos asociados a la fundamental, permitiendo la
medición simultanea de al función de transferencia y la distorsión en función de la
frecuencia. Esta posibilidad es anticipada por Griesinger [1] y descrita por Farina [2] y
será examinada en la sección 5.
Las mediciones basadas en sweeps son considerablemente menos vulnerables a las
nocivas varianzas de tiempo. Por esta razón a veces son la única opción para mediciones
exteriores de larga distancia bajo condiciones ambientales adversas o mediciones con
grabación analógica.
1 MÉTODOS EXISTENTES
En el siglo pasado se utilizaron diferentes formas de medición de la Respuesta
Impulsiva. El punto en común de todas ellas es que existe una señal de excitación
(estímulo) que contiene todas las frecuencias de interés para el dispositivo bajo prueba
(device under test, DUT). La respuesta del DUT es capturada y de alguna forma
comparada con la señal original. Por supuesto siempre existe una cantidad de ruido que
reduce la certeza de la medición. Sin embargo, es deseable usar señales de excitación
con alta energía para obtener una buena relación señal-ruido en todo el rango de
frecuencias de interés. Usando técnicas gating o compuertas para reducir ruido y
reflexiones no deseadas, se puede mejorar la relación Señal-Ruido, pero esto produce
variaciones no lineales y varianza de tiempo, como comúnmente se observa en
mediciones acústicas. Se realizará una breve descripción del comportamiento de los
diferentes métodos de medición.
1.1
Grabador de Nivel (Level Recorder)
Uno de los métodos de medición más antiguos de llevar la función de transferencia a un
papel ya involucraba sweeps como señal de excitación. La respuesta del DUT a un
sweep creado por un generador análogo es rectificada y suavizada por un filtro pasabajo. El voltaje resultante es llevado a un amplificador diferencial cuya otra entrada es
el voltaje derivado por un potenciómetro de precisión que es mecánicamente acoplado a
un lápiz de escribir. La salida del amplificador diferencial controla el lápiz que pasa
sobre un papel que contiene una escala apropiada. El potenciómetro puede ser lineal o
logarítmico, para producir lecturas en el papel de dB.
Obviamente este método no necesita circuitos digitales y fue usado como estándar de
medición de respuesta de frecuencia por muchos años.
La señal de excitación usada es un sweep logarítmico, esto quiere decir que la
frecuencia aumenta por un factor fijo por unidad de tiempo. El papel se mueve con
velocidad constante, la escala de frecuencia en el papel es correspondientemente
logarítmica. El espectro de un sweep logarítmico decae 3 dB/oct. Cada octava comparte
la misma energía, pero esta energía debe ser repartida sobre un ancho de banda mayor,
por lo tanto la magnitud de cada componente de frecuencia disminuye. Una de las
ventajas es que la distribución espectral tiene una buena adaptación con el ruido
ambiental, resultando una buena relación señal ruido incluso en bajas frecuencias. A
pesar que el método de grabador de nivel no puede suprimir el ruido o reflexiones, se
puede suavizar la respuesta reduciendo la velocidad del lápiz. El ripple en una respuesta
de frecuencia causado por una reflexión es convertido en un movimiento irregular del
lápiz, que puede ser “alisado” de esta simple manera. Si los detalles espectrales son muy
confusos por la reducción de sensibilidad del lápiz, se puede corregir reduciendo la
razón del sweep para obtener la resolución requerida. De esta manera existe un
compromiso entre el largo y la certeza de la medición, al igual que en los métodos
modernos basados en proceso digital de señales.
La deficiencia del método Grabador de Nivel (level recorder) es que no entrega
información de la fase y el espectro es almacenado en una hoja de papel, en vez de ser
almacenado en un disco duro como otros métodos. Claramente la exactitud horizontal
de las frecuencias no es comparable con las de procesos digitales como los basados en
clock de cuarzo de los conversores AD-DA. En la escala vertical, la resolución de las
lecturas de amplitud en dB están restringidas por la naturaleza discreta de los servopotenciómetros que está compuesto por un número discreto de resistencias de precisión.
1.2
Espectrometría por retardo de tiempo (TDS)
TDS (time delay spectrometry) es otro método para encontrar las funciones de
transferencia con ayuda de sweeps, diseñado por Heyser [3-6] especialmente para la
medición de altavoces, también es aplicable para las mediciones de acústica de salas o
cualquier otro sistema LTI en general. La principal funcionalidad de un analizador TDS
se muestra en la fig.1.
Fig1: Procesamiento de señal TDS
El analizador muestra un generador que produce dos señales sinusoidales
simultáneamente en fase. El seno es llevado al altavoz bajo prueba (LUT, loudspeaker
under test) y la respuesta capturada es multiplicada separadamente por ambas señales
originales, el seno (para obtener la parte real de la función de transferencia) y el coseno
(que tiene un desfase de 90 grados respecto al seno), para obtener la parte imaginaria.
La salida del multiplicador es filtrada por un filtro pasa bajos con frecuencia de corte
fija. El multiplicador actúa similar a los mixers usados en etapas de frecuencia
intermedia de receivers HF (principio superhet), produciendo la suma y diferencia de
las frecuencias de entrada. La suma de los términos de ambas salidas de los
multiplicadores es rechazada por el filtro pasa bajos, mientras que los términos de la
diferencia pueden pasar dependiendo de su frecuencia. Si ambas frecuencias, la
generada y la capturada, son iguales, la frecuencia de salida de la diferencia será mucho
menor y de ésta manera no será atenuado por el filtro pasa bajos.
Como el sonido que viaja desde el LUT al micrófono llega con un retardo, su frecuencia
momentáneamente será menor que la del generador de señales. Esto causa una
diferencia de frecuencia mayor a la salida del mixer que, dependiendo de su frecuencia
de corte, será atenuado por el filtro pasa bajos. Por esta razón la señal generada debe
tener un “retardo de tiempo” por una cantidad equivalente a la distancia entre el alto
parlante y el micrófono antes que sea multiplicada por la respuesta del LUT. De esta
manera, la diferencia de frecuencia será cercana a una señal DC. Como sabemos, las
reflexiones siempre tendrán un camino mayor que el sonido directo, de esta manera
llegaran con una frecuencia instantánea menor, causando mayores componentes de
frecuencia en la salida del multiplicador por lo que serán atenuados por el filtro pasa
bajos.
Con una selección apropiada de la razón del sweep y la frecuencia de corte del filtro
pasa bajos, al utilizar TDS es posible simular mediciones casi en campo abierto. No solo
las reflexiones molestas serán atenuadas, también serán atenuados las distorsiones (que
llegan con una frecuencia instantánea mayor y producen una frecuencia mayor a la
salida del mixer, por lo tanto serán suprimidas por los filtros) y ruidos (gran parte del
rango de frecuencias sobre la frecuencia de corte del filtro pasa bajos).
La cancelación controlada de las reflexiones es la causa por la cual los analizadores
TDS utilizan sweep lineal ( df dt = cte como señal de excitación). La diferencia de
frecuencia entre el sonido directo entrante y las reflexiones quedarán en su totalidad
sobre el rango del sweep, manteniendo la atenuación de cada reflexión independiente de
la frecuencia.
Si se utiliza un sweep logarítmico el filtro pasa bajo podría incrementar su frecuencia de
corte por un factor constante por tiempo para evitar el estrechamiento de la ventana de
tiempo impuesta (el impacto del filtro pasa bajos en realidad es similar a la ventana de
una respuesta impulsiva en los métodos de la FFT). Por otra parte las componentes de
altas frecuencias de la típica respuesta de impulso de un altavoz decaerán mucho más
rápido que las de baja frecuencia. Así un estrechamiento de la ventana en altas
frecuencias (correspondiente a “ventanas adaptativas” propuesto por Rife para los
procesos de respuesta impulsiva) serán deseables para muchos escenarios de medición.
Esto podría incrementar la relación señal ruido en altas frecuencias, sin dañar la
respuesta impulsiva más que en las bajas frecuencias.
Existen un sinnúmero de inconvenientes asociado con la medición de TDS. El más serio
es el hecho de que TDS la utiliza sweep lineales y por lo tanto tiene un espectro de
excitación blanco. En muchas configuraciones de medición, esto dejara una pobre
relación señal ruido en baja frecuencia. Si todo el rango de audición de 20 – 20 kHz es
barrido en 1 segundo, entonces el rango hasta los 100 Hz sólo recibirá energía durante 4
ms. Esto muchas veces es insuficiente en una región de frecuencias donde la salida del
altavoz disminuye mientras el ruido ambiente se incrementa. Para mejorar esta mala
distribución de energía espectral los sweeps son hechos muy largos, o las mediciones
separadas en dos rangos, por ejemplo bajo y sobre los 500 Hz. Ambos métodos
extienden el tiempo de medición mucho más de lo que sería necesario físicamente para
el desarrollo de una medición de una resolución espectral particular.
Otro problema es el ripple que ocurre en baja frecuencia. Como previamente se
mencionó el multiplicador produce los términos de la suma y diferencia de la señal de
excitación “retardada en el tiempo” y la respuesta en camino. En frecuencias altas, la
suma es suficientemente grande para ser atenuada por el filtro pasa bajos de salida. Pero
en el rango bajo del sweep, donde la suma se aproxima o es menor que la frecuencia de
corte del pasa bajos, aparecerá un “golpe” (beating) en la magnitud de la respuesta
obtenida. Para remediar esto los sweep pueden ser hechos muy largos y la frecuencia de
corte del filtro pasa bajos disminuirá por este mismo factor. Sin embargo el mejor
método es repetir la medición con una configuración espejo, que consiste en excitar el
DUT con un coseno en vez de un seno y tratar de capturar la señal como se muestra con
las líneas punteadas en la fig.1b. La parte real del resultado complejo de esta segunda
medición es añadida a la parte real obtenida en la medición anterior, mientras la parte
imaginaria es restada. El efecto de esta operación es que la suma de los términos a la
salida del mixer será cancelada, como se muestra en [7-9]. Como una consecuencia,
gracias a la ausencia de la interferencia de los términos sumados sobre todo el rango del
sweep, las etapas del filtro pasa bajos siguientes del multiplicador pueden ser omitidas.
De hecho ellas tienen que ser omitidas si es recuperada una respuesta al impulso
completa, un caso en que obviamente el impacto de la atenuación de las reflexiones
causado por el filtro pasa bajos no es deseada Ciertamente las mediciones de salas
acústicas, en las que siempre implica obtener largas respuestas impulsivas, son solo
realizables con el método de excitación doble. Si sin embargo el objeto de interés es un
altavoz, se requiere mantener el filtro pasa bajos insertado en orden para rechazar las
reflexiones, ruido y armónicos.
Fig 1b: Completo procesamiento de señal TDS. La ruta de la línea punteada es usada en la
segunda partida de una medición de excitación doble.
Igual que la cancelación de los términos sumados en el método de doble excitación,
algún ripple podría aparecer al comienzo y al final del rango de frecuencias del sweep
debido al abrupto principio del sweep lineal. Por la teoría de sistemas el comienzo de
una señal sinusoidal corresponde a un espectro corrugado cerca de la frecuencia inicial
ver fig.15.
Una manera común de enfrentar este problema es permitir que el comienzo del sweep
de excitación este muy por debajo de la frecuencia de interés, esto podría implicar
comenzar el sweep en frecuencias negativas que en la práctica quiere decir se
comenzará en la correspondiente frecuencia positiva, bajando a 0 Hz y después
incrementando la frecuencia normalmente [8]. Una mejor posibilidad podría ser
formular un sweep de excitación en el dominio espectral para crear una señal que no
sufra pérdida espectral (ver fig.16), como se demostrará en el capitulo 4.2.
Por supuesto, es necesario el uso del método de excitación doble para recobrar un
completa IR que se extienda más allá del tiempo necesario para completar la medición
del TDS. Por otra parte los métodos de FFT o MLS que utilizan estímulos periódicos en
la practica requieren una señal de excitación que se emita dos veces para recobrar la
respuesta impulsiva periódica. Con estos métodos la respuesta periódica del DUT es
capturada sólo en la segunda emisión después de la estabilización. Por el contrario el
método de la doble excitación TDS utiliza ambas, lo que atribuye la ventaja de
aumentar 3 dB de relación señal ruido sobre MLS, con la misma longitud de excitación
(ambos tienen espectro blanco). Con la ausencia del filtro pasa bajos la resolución
espectral de la medición TDS es tan alta como con una excitación periódica de una
misma longitud de periodo. Así una medición de doble excitación TDS requiere el
mismo tiempo que una edición MLS para conseguir la misma resolución espectral, esto
contrasta de algunas comparaciones entre TDS y MLS en la literatura [13] en donde se
asume un cierto filtro pasa bajo y se calcula una correspondiente resolución de
frecuencia, en un intento por demostrar que se necesita un largo sweep para obtener la
resolución de una medición MLS sin ventana. Pero por supuesto el impacto del filtro
pasa bajo TDS es equivalente a aplicar una ventana para recuperar la IR, y cualquier
ventana reduce la resolución espectral. La posibilidad de realizar mediciones simulando
campo libre y el efecto de suavizado de las reflexiones es muy bien recibido en las
mediciones de altavoces con ambos métodos (al menos en las octavas superiores).
Sin embargo, la relación entre la razón del sweep TDS, la frecuencia de corte del filtro
pasa bajos y la atenuación conseguida por las reflexiones tardías no es evidente
inmediatamente, a pesar de que no es muy difícil de calcular [10]. Pero es más intuitivo
analizar la IR completa derivada por mediciones MLS y FFT (o excitación dual TDS) y
posicionar una ventana cuyo lóbulo derecho termina justo antes de la primera reflexión
molesta. De esta manera, todas las reflexiones siguientes son eliminadas. En contraste,
después de varios ajustes de la frecuencia de corte, TDS no es capaz de suprimir las
reflexiones debido a la pendiente limitada de los filtros pasa bajos (permitiendo solo el
uso de una versión digital FIR de alto orden). El efecto de suavizado en las funciones de
transferencia recuperadas no es muy definido, mientras que el uso de ventanas [33]
ofrece un buen y claro compromiso entre el ensanchamiento del lóbulo principal y la
supresión del lóbulo lateral.
Usando solamente sweeps en conjunto con análisis FFT, sin multiplicadores produce
resultados inmediatos, obviamente muchos problemas inherentes a TDS, especialmente
la insuficiencia de energía en bajas frecuencias y los largos ciclos de medición. Sin
embargo no pueden ser ignoradas muchas ventajas de las mediciones TDS sobre MLS.
El mencionado aumento de la relación señal ruido en una medición de doble excitación
TDS puede ser aumentada aun más tomando ventaja del bajo factor de cresta de solo
3 dB inherente al barrido senoidal. En la práctica, MLS tiene un factor de cresta de
cresta de al menos 8 dB como se dará a conocer posteriormente. La medición TDS
también ofrece alta tolerancia contra la varianza del tiempo y mejor rechazo a la
distorsión armónica que puede ser filtrada junto con el ruido y las reflexiones.
1.3
Análisis FFT de dos canales
El principio básico del análisis FFT de dos canales (dual-channel) consiste en dividir el
espectro de salida el DUT con el de la señal de entrada, como en todos los métodos de
medición de la función de transferencia basados en FFT. Sin embargo, la fuente de
ruido tradicional de los analizadores de dos canales es no determinístico y por lo tanto
su espectro no puede ser conocido previamente. Esto influye en capturar y procesar la
entrada y la salida simultáneamente.
Aunque esto parece una desventaja en comparación con otras técnicas que solo
requieren un canal, el principal inconveniente la FFT tradicional de dos canales es la
naturaleza de la señal de entrada comúnmente empleada. Esta usualmente tiene un
espectro blanco (o rosado) cuando es promediada por un largo tiempo, pero una foto
instantánea del ruido de la señal tiene un espectro corrugado que sufre profundas
depresiones de magnitud. Así, un analizador de dos canales debe promediar varias
mediciones antes de presentar un resultado confiable. Como en algunos intervalos del
análisis, la relación señal ruido es deficiente en algunas frecuencias, estas deben ser
eliminadas del proceso de promediado debido a la división de ambos canales, ya que
ésta podría provocar un gran error que impedirá mostrar la respuesta de frecuencia.
La detección de la deficiencia de la relación señal ruido comúnmente es realizada por la
función de coherencia [12], [13]. Debido a la necesidad de promediar muchos bloques
de datos para obtener un resultado consistente, la sensibilidad del análisis de dos canales
es bastante deficiente y la hace poco atractiva para propósitos de ajuste.
Fig 2. Etapas del procesamiento de señales para un análisis de FFT de dos canales usando
un programa musical como señal de excitación.
En mediciones acústicas tiene que ser conocido el retardo preciso del camino de
transmisión acústica, pues la señal directa será retrazada en ésta cantidad de tiempo para
analizar los correspondientes trozos de la señal de excitación (ver fig. 12). Además, con
el fin de evitar los efectos de pérdida, los bloques de señal considerados en el análisis de
FFT deben ser pasados por una ventana. Esta es una importante fuente de error, ya que
las componentes retrasadas son atenuadas más que el sonido directo.
El análisis de dos canales puede ser mejorado considerablemente, generando la IR de
cada medición mediante la IFFT. El uso de ventanas en la IR ofrece una libertad
importante para controlar la cantidad de reflexiones consideradas en el resultado y para
eliminar el ruido fuera del intervalo de la ventana, así mejora el proceso de
convergencia. No todos los analizadores de dos canales ocupan esta útil característica
que no es incluida en la fig.2.
Hay una aplicación bien conocida para el análisis de dos canales que ninguna otra
tecnología de medición ofrece: La posibilidad para medir sistemas de sonidos
discretamente durante un espectáculo, usando el mismo material del programa como
señal de la excitación. Sin embargo, música con distribución espectral impredecible es
usualmente una peor señal de excitación que lo ruidos no correlacionados y requiere
periodos de promediado incluso mayores para obtener resultados confiables. De este
modo, cuando no se necesita ser discreto, es aconsejable usar un generador de ruido
como fuente. Se pueden obtener resultados mejores en un tiempo más corto usando
señales determinísticas hechas a la medida con técnicas FFT.
1.4
Senos paso a paso (Stepped Sine)
Probablemente el método que ocupa la mayor cantidad de tiempo para obtener la
función de transferencia del DUT es la excitación paso a paso (stepped sine) con tonos
puros incrementando su frecuencia. La respuesta del DUT a la estabilidad de la
excitación puede ser analizada filtrando y rectificando la fundamental, o realizando la
FFT y recuperando la fundamental del espectro. El método anterior requiere el uso de
un seno que es exactamente periódico dentro de las fronteras de una longitud del bloque
de la FFT para evitar una pérdida espectral (leakage). En la práctica, esto solo puede ser
realizado generando un seno digital, y emitiéndolo vía el conversor DA que es
sincronizado con el conversor AD. Además el método de la FFT permite la completa
eliminación de todas las otras frecuencias, por lo que este método es preferido sobre el
análisis del dominio del tiempo que involucra filtros pasa banda, con una restringida
selectividad y precisión.
Después de cada medición la frecuencia del sweep de excitación es elevada al valor
acorde a la resolución espectral deseada. En mediciones acústicas la frecuencia será
incrementada por la multiplicación al valor previo por un factor para obtener el
espaciamiento logarítmico. Claramente la resolución espectral en las mediciones de
stepped sine es baja en altas frecuencias comparada con la obtenida usando una señal de
excitación de banda ancha con análisis FFT. Pero no necesariamente es una desventaja
ya que la resolución fina es poco usada en altas frecuencias mientras que la pérdida de
información en bajas frecuencias, proveída por la FFT en el mismo intervalo de tiempo
usado, es más pequeña.
La mayor ventaja del método stepped sine es la enorme relación señal ruido que puede
ser obtenida para una medición. Toda la energía es concentrada en una única frecuencia,
y la onda senoidal de alimentación tiene un factor de cresta de solo 3 dB, permitiendo la
estabilidad en un alto nivel continuo. De esta manera, la certeza y repetibilidad para una
frecuencia puede ser mucho mayor comparado con una excitación de banda ancha,
especialmente cuando usamos la técnica de sincronización de FFT.
Es por esto que a pesar de la considerable cantidad de tiempo para completar la
evaluación de la función de transferencia, este método es aun popular para mediciones
de precisión y calibración de equipamiento electrónico, o transductores acústicos como
micrófonos. Este método también es estable cuando se requiere precisión para medir la
distorsión. Cada armónico puede ser escogido con una alta precisión del espectro de la
FFT.
Sin embargo, cuando solamente la función de transferencia es de interés, el método de
stepped sine no es bueno. Sólo parte de la energía emitida por el DUT puede ser usada
para el análisis, ya que después de cada cambio a una nueva frecuencia, debe ser
esperado un cierto tiempo antes que el DUT quede en estado estable. Especialmente
cuando existen resonancias de alto Q (correspondiente a largas IR), este tiempo debe ser
muy largo para reducir errores a niveles insignificantes. Por otro lado, cuando el sistema
es muy ruidoso y deben ser realizados muchos promedios sincrónicos para obtener una
mejor certeza en la medición, el tiempo juega un rol menor [14].
En mediciones acústicas con tonos puros, solo es posible eliminar las reflexiones
cuando la diferencia de tiempo entre el sonido directo y reflejado es mayor que el
intervalo del análisis. Esta es una clara desventaja comparada con los métodos que
recuperan la respuesta impulsiva.
La precisión alcanzable con la medición de un tono (single tone) también debe ser
puesta en duda. Debe quedar claro que la misma precisión puede ser obtenida con una
medición de banda ancha en un tiempo menor. Mientras las mediciones stepped sine
entregan magnitudes de una única frecuencia con una muy alta relación señal ruido, una
medición de banda ancha entrega muchos valores en un intervalo particular de
frecuencias. Claramente cada uno de ellos tiene menor certeza, pero realizando una
suavización espectral sobre un ancho correspondiente al incremento de frecuencia usado
en la medición de tonos puros, el ruido aleatorio debe disminuir a valores comparables.
Esto, sin embargo, asume que la distorsión armónica producida puede ser totalmente
eliminada de la medición de banda ancha, una condición que sólo puede ser realizada
por mediciones con sweep, como se dará a conocer posteriormente.
1.5
Impulsos
Usar un impulso como señal de excitación es la manera natural de obtener la IR y
también la más sencilla aproximación para el desarrollo de la medición de función de
transferencia basada en la FFT. El impulso puede ser creado por medios análogos o
preferentemente enviándola por un conversor DA y amplificándola. Este alimenta al
DUT cuya respuesta es capturada por el micrófono, amplificada y digitalizada por un
conversor AD (Fig. 3). Como el nombre lo indica, esta respuesta capturada ya es la IR
deseada, siempre que el estilo del pulso Dirac utilizado tenga una respuesta de
frecuencia lineal. Para aumentar la relación Señal-Ruido el pulso puede ser repetido
periódicamente, y las respuestas de cada periodo sumadas. Esto permite que la respuesta
periódica al impulso (PIR) sea prácticamente igual a la no periódica (IR) si es que esta
es más corta que la medición periódica (en la práctica: si la IR se desaparece con el
ruido de fondo antes del fin del período). Como es sabido tales promedios sincronizados
permiten una reducción de ruido de 3 dB cuando el ruido es no correlacionado, relativo
a la IR por cada duplicación del número de promedios.
Fig 3: Procesamiento de señales para la medición de la función de transferencia con
impulsos.
La IR opcionalmente puede ser desplazada a la izquierda (o la PIR desplazada de
manera cíclica) para compensar el retardo producido por el tiempo de llegada entre el
altavoz y el micrófono de la medición acústica. La aplicación de ventanas elimina
reflexiones indeseadas y aumenta la relación S/R.
La IR puede entonces ser transformada en una función de transferencia por la FFT. Para
aumentar considerablemente la precisión de la medición, el resultado debe ser
multiplicado por un espectro de referencia. Este espectro de referencia es obtenido por
la conexión de la entrada y la salida del sistema de medición e invirtiendo la función de
transferencia medida. Aplicando esta técnica (independientemente del tipo de la señal
de excitación) ofrece la libertad de realizar un pre-énfasis de la señal de excitación para
adaptarla a las contribuciones espectrales del ruido de fondo. Este pre-énfasis será
automáticamente eliminado del resultado de la función de transferencia aplicando el
espectro de referencia obtenido en todas las mediciones subsiguientes.
Los impulsos son una simple y no tan mala manera de medición cuando es puramente
eléctrica (cuando no hay un camino acústico en la cadena de medición) y la medición
debe ser lo más rápida posible. Sin embargo, ellos requieren un bajo nivel de ruido de
fondo del DUT para obtener certeza razonable de la medición. Cuando se miden
equipos de audio con bajo nivel de ruido, este requerimiento es fácilmente obtenido. A
pesar de que se encuentra lejos de la opima relación S/R los impulsos igualmente
pueden ser usados en acústica. En una cámara anecoica donde el ruido ambiente es bajo
en altas frecuencias, los tweeters pueden ser medidos con una razonable relación S/R.
Debido a su brusquedad, los pulsos, pueden alimentar con un alto voltaje el cono del
altavoz, sin considerar el posible daño de sobrecalentamiento. Se debe tener
consideración de no causar una excursión en el rango no lineal del altavoz (aunque esto
puede ser provocado con un pulso muy estrecho [15]), esto causará que la amplitud sea
más pequeña que la esperada y por lo tanto conducirá una aparente pérdida de
sensibilidad [16]. Generalmente toda la distorsión en una medición por pulso ocurre
simultáneamente con la IR y por lo tanto no puede ser separada de esta. Para aumentar
la relación S/R de la medición de un tweeter los impulsos pueden ser repetidos y
promediados en intervalos pequeños, cuando la IR recuperada es muy corta y requiere
una resolución de frecuencia lineal bastante baja.
Las pruebas impulsivas no permiten identificar la distorsión pero son bastante inmunes
contra los efectos perjudiciales de la variación del tiempo, no como las mediciones MLS
o basadas en ruidos para ambientes exteriores. Esto es simple, no requieren un
sofisticado procesamiento de señal y trabajan muy bien para ciertos tipos de medición.
Es por esto que han sido un método muy popular [15], [17]. Cuando se disponen de
bastantes amplificadores de potencia, el aumento de la relación S/R usando señales de
excitación extendidas en el tiempo comparadas con la medición de un pulso, no es tan
grande como se esperaba, ya que el altavoz generalmente puede ser alimentado con
pulsos de alto voltaje. La ganancia de relación señal ruido disminuye favoreciendo a las
mediciones con pulsos, cuando se considera la distorsión en la IR obtenida por
mediciones con ruido, como MLS.
1.6
Secuencias de máxima longitud (MLS)
Las señales MLS (maximum length sequences) son secuencias binarias que pueden ser
generadas de una manera muy fácil con un N-staged shift register y una compuerta
XOR (con hasta 4 entradas) conectada con un shift register (alternador de registro) de
tal manera que todos los 2N estados son posibles, menos el caso de “todos 0” [18]. Esto
puede ser logrado con un hardware con pocos y simples TTL-IC o por un software con
menos de 20 líneas de código assembler.
Fig.4a. Generación de MLS con shift register fed back sobre generador de paridad
En los tiempos en que el código MLS fue popular, la posibilidad de crear secuencias por
hardware estaba restringida por la memoria. En los ’80 la memoria máxima en un PC
IBM 8088 era de 640 KB. Claramente el tener que almacenar largos arreglos de datos
para capturar y procesar la respuesta del DUT era un gran inconveniente. Hoy en día
esta desventaja no es tal, ya que con la tecnología existente es mucho más fácil crear
secuencias MLS por software y sacar la señal de salida desde la memoria a través de un
conversor DA del sistema de medición.
Como el caso “todos cero” de la secuencia está excluido, la longitud de la secuencia
MLS es 2N-1. Aunque se pierde un valor para tener un bloque de longitud exacto para
una FFT, MLS tiene propiedades únicas que los hacen convenientes para la medición de
la función de transferencia. Su autocorrelación, es muy cercana de un pulso Dirac,
indicando un espectro blanco. Reiterado periódicamente como un tren de pulsos, todas
las componentes de frecuencia efectivamente tienen la misma amplitud, por lo que su
espectro es perfectamente blanco. Comparado a un pulso de la misma amplitud, mucha
más energía puede alimentar al DUT ya que la señal de excitación es alargada sobre el
periodo entero de medición. De esta manera aumenta la relación S/R.
Normalmente, un MLS no se hace salir como tren de pulso, pues éste significaría la
alimentación de energía muy pequeña al DUT subsiguiente. En vez de esto, la salida del
hardware generador MLS generalmente se mantiene constante entre dos pulsos de clock.
En el caso del hardware generador de MLS, existe una pérdida de apertura sin(x)/x en
fs/2 de al menos 4 dB que debe ser compensada posteriormente. Cuando se emite MLS
por un conversor DA usando oversampling, el cual es el estándar de hoy, el espectro
será plano hasta le frecuencia de corte de filtro digital. En el caso de conversores más
baratos, se puede introducir un notable ripple sobre toda la banda de paso. Estas
ondulaciones de frecuencia lineal están siempre presentes hasta cierto punto en el
oversampling de los conversores de audio. Estás se originan de la fase lineal del filtro
FIR anti-alias. Estos son fabricados por medio del algoritmo Parks-McClellan [19],
viendo el ripple de banda contra la banda de detención. Además ellos son prácticamente
siempre diseñados como filtros de media banda que dividen en dos el cálculo de
potencia requerida, pero exhiben una atenuación de solamente 6,02 dB en fs/2. Es por
esto que siempre existe una pequeña región de aliasing inválida en las cercanías a la
frecuencia de Nyquist cuando la medición esta hecha con conversores de audio. El filtro
anti-alias también induce a un fuerte salida de MLS por lo que no pueden ser usados
con todo el nivel. En el capitulo 2.2 se clarificara este tema.
Señales de excitación con espectro blanco permiten el uso de la correlación cruzada
para recuperar la respuesta impulsiva del sistema. Mientras normalmente, una
correlación de cruce se desarrolla más eficientemente en el dominio espectral por una
multiplicación complejo-conjugado, la conocida transformada de Hadamard (FHT, fast
Hadamard transformation) puede desarrollar esta tarea para señales MLS sin dejar el
dominio del tiempo. Nosotros omitiremos la teoría que existe detrás de esto ya que ha
sido desarrollada y explicada muchas veces, por ejemplo en [18], [20-23]. El algoritmo
Butterfly que ha sido empleado en la FHT solo usa sumas y restas y puede operar con
los datos enteros entregados por el conversor AD. Anteriormente esto significaba que el
desarrollo de estos cálculos era mucho más corto que el de una FFT de similar longitud.
Pero hoy día esta diferencia ha disminuido considerablemente. Los procesadores
modernos como la familia de Pentium II pueden desarrollar adiciones, multiplicaciones
y sustracciones de punto flotante tan rápido como las respectivas operaciones de
números enteros.
En década de los 80 la propiedad time-saving de la trasformada de Hadamard fue muy
bien recibida, a pesar de que los cálculos de la respuesta al impulso en una sala de un
gran ancho de banda aun consumían muchos segundos. La ventaja llegó a ser
especialmente prominente sólo cuando la IR era de interés, y no la función de
transferencia asociada. Esto, por ejemplo, mantiene la evaluación del tiempo de
reverberación por la integración hacia atrás de la respuesta impulsiva [24]. En estos
casos sólo se requiere de una FHT para transformar la respuesta MLS capturada por el
micrófono en la deseada PIR. Esta FHT es más rápida que una FFT. Por el contrario
usando una señal de ruido arbitrario, o un sweep como estimulo, requiere al menos una
FFT y una IFFT para obtener la IR. Sin embargo, el tiempo de procesamiento ya no es
una preocupación debido a los poderosos procesadores de hoy en día, las
transformaciones pueden ser desarrolladas más rápidas que en tiempo real.
Por ejemplo el procesamiento de un MLS de grado 18 (longitud del periodo de 6
segundos a 44,1 kHz de frecuencia de muestreo, una típica longitud para mediciones de
ancho de banda en ambientes reverberantes) se completa en sólo 138 ms en un Pentium
III/500, usando un 32-Bit-integer Radix-4 MMX-FHT particionado en sub chunks
acomodados en los tamaños de 1° y 2° nivel caché. Esto abarca la permutación
necesaria antes y después del algoritmo Butterfly y una búsqueda de peak. Una FFT
calculada con números reales [11] para la misma longitud, también usando sub chunks
anidados, que puede ser procesado enteramente en el caché termina en el doble del
tiempo (280 ms), esto es aún mucho menor que el periodo de la medición.
Independientemente del principio de la medición hoy día es posible transmitir la señal
de excitación continuamente y completar los cálculos y mostrarlos actualizados dentro
de cada periodo, incluso para dos canales de entrada. Para mediciones de cortos
períodos se obtiene buenos resultados de una medición en tiempo real, ya que pueden
ser manipuladas enteramente en el caché. Por supuesto el número de operaciones por
cada muestra de salida también disminuye levemente según la razón del grado (por
ejemplo una FFT de grado 12 solo necesita dos tercios de las operaciones por cada
muestra de salida que en una de grado 18).
En una medición basada en MLS la FHT es el primer paso de procesamiento de la señal,
después de la digitalización por el conversor AD (fig. 4). La respuesta al impulso
obtenida puede ser desplazada de forma cíclica y se puede aplicar una ventana como
con una simple prueba impulsiva. Si la función de transferencia es la que se desea
observar, se debe realizar una FFT adicional. Pero como los MLS tienen una longitud de
2N-1 una muestra tiene que ser insertada a la respuesta al impulso para que la longitud
sea de 2N. Mientras que computacionalmente esto es una acción trivial, hay que tener
cuidado con el lugar donde se pone esta muestra. Esto debe ser una región en donde la Ir
haya decaído cercano a cero para evitar grandes errores.
Cuando usamos una ventana, la muestra puede ser localizada en el área silenciada. La
función de transferencia obtenida nuevamente puede y debe ser corregida por la
multiplicación con un espectro de referencia obtenido previamente por una medición de
respuesta del sistema.
Fig 4: Etapas de procesamiento de señal para la medición de la función de transferencia
con MLS.
La medición MLS es bastante popular en mediciones acústicas, pero tiene bastantes
desventajas. Tiene una alta vulnerabilidad contra la distorsión y la variación del tiempo
(estas serán comparadas directamente a las mediciones con sweep en el capitulo 2), pero
la más lamentable propiedad del MLS es su espectro blanco. Como será demostrado en
el capitulo 3, un espectro no blanco es deseable en casi todas las mediciones acústicas.
Este requerimiento puede ser obtenido por la coloración del MLS con un énfasis
apropiado. Claramente el MLS perderá su característica binaria por el prefiltrado. Así
que esta técnica es viable si el prefiltrado del MLS se hace a la salida por un verdadero
conversor DA, no solo una etapa de conmutación de un bit, como utilizan algunos
antiguos hardware-analizadores basados de MLS. Estos últimos son confinados al postfiltro análogo para enfatizar el MLS, pero estos no ofrecen la versatilidad de los filtros
FIR como una fase lineal, o compensación de la propia respuesta del sistema de
medición [25].
La creación del MLS enfatizado puede ser hecha eficientemente por medio de la
transformada inversa de Hadamard (IFHT) [25], [26]. La IFHT simplemente es la
inversión en el tiempo de la respuesta al impulso del filtro de énfasis deseado (reducido
a 2N-1 muestras), aplicando una FHT normal en la IR invertida y entonces nuevamente
invertimos el resultado anterior. Esto produce una MLS periódica convolucionada con
el filtro de énfasis. Debido a la periodicidad, cada componente discreta de frecuencia de
la anterior MLS puede ser influenciada independientemente tanto en amplitud y fase.
Cuando usamos como estimulo un MLS enfatizado, en vez de MLS puro, obviamente la
respuesta al impulso obtenida por la FHT consistirá en la IR del DUT convolucionada
con la IR del filtro de énfasis. Para mediciones acústicas esto es significativo pues dará
a la señal de excitación un fuerte estimulo en frecuencias bajas probablemente de unos
20 o 30 dB, como será demostrado mas tarde. En este caso la respuesta al impulso
obtenida puede ser más ancha que la medición solamente con el DUT. Este
ensanchamiento frecuentemente restringe la realización de la ventana, especialmente
cuando las reflexiones que serán silenciadas están cerca del peak principal. En estos
casos aplicando una ventana “pre-comp” (pre compensación) a la respuesta impulsiva
no ecualizada atenuará la energía de bajas frecuencias extendida en el tiempo. Así que
es mejor la aplicación de una ventana “post-comp” (post compensación), lo que
significa una posterior transformación de la IR no corregida al dominio espectral,
multiplicándola con la respuesta inversa de un filtro de énfasis, y eventualmente
trasformándola al dominio del tiempo. Esto producirá la respuesta al impulso sólo del
DUT a la cual se le puede aplicar ahora ventanas con menos pérdidas de energía en
bajas frecuencias.
Fig 5: Etapas de procesamiento de señal para la medición de la función de transferencia
con MLS pre-enfatizado.
Si la función de transferencia es el resultado deseado de la medición, otra FFT será
desarrollada después de la aplicación de la ventana de la respuesta al impulso
compensada (fig. 5). Así que el número de las transformaciones es en total una FHT y
tres FFT cuando se realiza la medición de la función de transferencia con MLS preenfatizado y aplicando ventanas post-comp de la respuesta impulsiva.
1.7
Señales periódicas de longitud 2N
Examinando a fondo la configuración de la medición MLS en la fig. 5, revela que
actualmente el uso de MLS y la aplicación de la FHT son bastante innecesarios. Si sólo
la señal de excitación tiene 2N muestras en vez de 2N-1 como las MLS, la respuesta del
DUT puede ser transformada directamente al dominio espectral, omitiendo la FHT, y
esto puede ser implemente multiplicando con el espectro de referencia (la
multiplicación de la inversa del espectro de la señal de excitación por la respuesta de
frecuencia del sistema de medición). Como esta multiplicación es una operación
compleja, no sólo la magnitud, sino también la fase son corregidas para producir la
verdadera función de transferencia compleja del DUT, independientemente de la
naturaleza de la señal de excitación. Al desarrollar una IFFT en este espectro
compensado, se producirá la verdadera respuesta al impulso del DUT (fig. 6).
Cuando comparamos esta técnica (FFT, compensación, IFFT) a la FHT queda claro que
esta es lejos más poderosa y flexible, permitiendo el uso de señales arbitrarias de
longitud 2N. La única restricción es que la señal de excitación debe tener la suficiente
cantidad de energía en todo el rango de frecuencias de interés.
La FHT, siendo un algoritmo de la correlación cruzada, puede modificar simplemente
las fases de una clase especial de señal de excitación, particularmente MLS. Esta
operación es la “compresión de pulso” al MLS por medio de una convolución con el
correspondiente “filtro acoplado” (matched filter). En contraste, la aproximación de la
FFT compensa la fase y la magnitud de cualquier señal de excitación ya sea ruido,
sweeps o cortos fragmentos musicales. Esta operación es algunas veces referida como el
“filtraje mal acoplado” (mismatched filtering). Aunque en contraste con el matched
filter, este no está restringido a señales de excitación con espectro blanco. La única
restricción obvia es que la señal de excitación debe tener la suficiente energía sobre todo
el rango de frecuencias de interés para evitar ruidos en la función de transferencia
obtenida.
Fig 6: Etapas de procesamiento de señal para la medición de la función de transferencia
con cualquier señal determinística.
Claramente el desarrollo de 2 FFT consumen más tiempo de procesamiento que una
única FHT, pero con los poderosos microprocesadores de hoy en día, esta desventaja es
insignificante. Como nosotros hemos visto, usando MLS pre-enfatizados, y la
aplicación de ventanas post-comp (fig. 5) conduce, incluso, a tiempos levemente más
largos de cálculo que usando señales arbitrarias de longitud 2N.
La técnica se asemeja al viejo análisis FFT de dos canales, pero se diferencia de esta en
que la señal de la excitación es conocida por adelantado. Por lo tanto, su espectro
necesita ser calculado solo una vez y se puede utilizar en todas las mediciones
siguientes. Esto evita la necesidad de un segundo canal, o si esta presente de todos
modos, permite analizar dos entradas simultáneamente. Una ventaja adicional es el
hecho de que la precisión obtenida de un analizador de FFT de un canal supera a
cualquier analizador de dos canales. Con lo último, cualquier diferencia de la respuesta
de frecuencia en la entrada de los dos canales, se reflejara en la respuesta de frecuencia
medida del DUT. Por supuesto los fabricantes de analizador de dos canales se esfuerzan
por hacer que estas diferencias sean lo más pequeñas posibles. Sin embargo, creando un
archivo de referencia, por el reemplazo del DUT con un cable, hace que la señal de
excitación pase exactamente por las mismas etapas, lo que garantiza una alta precisión.
Incluso con cualquier equipamiento, puede ser obtenida una certeza de 1/1000 dB o
mejor en una medición eléctrica pura. El voltaje de referencia de la fuente, incluidos los
modernos conversores AD y DA, son lo suficientemente estables para permitir esta
certeza (cuando ocurre una tendencia de calentamiento, la medición de la referencia
puede ser rápidamente repetida). Sin embargo, puede haber errores de la fuente debido a
las impedancias de las etapas análogas de entrada y de salida. La salida de impedancia
del DA debe ser lo suficientemente baja para prevenir una perdida del voltaje generado
cuando lo conectamos al voltaje de salida del DUT. Estas condiciones rara vez se dan
cuando usamos simples tarjetas de sonido sin amplificadores de salida.
Fig 6a. En el caso de señales de excitación blancas (aquí, se utilizó un sweep lineal como
ejemplo) la respuesta impulsiva del DUT puede ser evaluada por el desarrollo de la
correlación cruzada con la inversión en el tiempo de la señal de excitación: Esto puede
tomar bastante tiempo en el dominio del tiempo, pero la FHT lo hace de una manera
rápida para MLS.
Fig. 6b: Para cualquier señal de excitación no blanca, la evaluación de la respuesta
impulsiva en el dominio del tiempo, sólo puede ser hecha por la convolución con el filtro
inverso, el cual debe ser construido en dominio de la frecuencia. La convolución en el
dominio del tiempo corresponde a la multiplicación en el dominio de la frecuencia, que
puede ser desarrollada muy rápido. Es por esto que la deconvolución es desarrollada en el
dominio de la frecuencia.
Aún, la gran característica de un análisis de un canal, es el uso de una señal
determinística en contraste a la fuente de ruido no correlacionada, normalmente usada
en el analizador de FFT de dos canales. Como establecimos antes, el anterior tiene un
espectro estable cuando es promediado a lo largo del tiempo, pero en un único snapshot
la señal de ruido sufre pérdidas en la magnitud. De esta manera el analizador de dos
canales tiene que ser promediado durante muchas mediciones antes de entregar un
correcto resultado. Por el contrario, los estímulos determinísticos usados en los métodos
de la fig. 6 pueden ser creados a la medida definiendo una magnitud arbitraria del
espectro libre de caídas, adaptándola al ruido de fondo predominante, para lograr una
independencia de la frecuencia en la relación S/R. De acuerdo al tipo de señal deseada,
la correspondiente fase del espectro puede ser construida de muchos modos diferentes.
Una señal ruidosa puede ser generada fácilmente por la configuración de sus fases como
valores aleatorios. La señal de excitación es obtenida por la IFFT. Repetida
periódicamente esta tendrá exactamente la magnitud del espectro previamente definido
(por ejemplo plano o rosado). Señales ruidosas tienen propiedades similares a las MLS,
especialmente lo que consiste en su vulnerabilidad contra la distorsión y la variación del
tiempo. Algunas personas se refieren a las señales ruidosas como “señales sinusoidales
múltiples”, pero por supuesto cualquier señal que no sea pura es una señal de múltiples
senos.
Fig. 6c: Tres señales de excitación blanca: impulso, ruido y sweep. Todas tienen la misma
amplitud espectral, pero sus fases son obviamente muy diferentes. Para el impulso la fase
tiene que ser ajustada a 0° la cual corresponde a un mismo tiempo de llegada para todas
las frecuencias. El espectro de la fase para un ruido debe ser ajustado con valores
aleatorios. Para crear el sweep blanco, el retardo de grupo (que es proporcional a la
derivada de la fase) tiene que incrementarse proporcionalmente con la frecuencia. Las tres
señales de excitación mostradas aquí son normalizadas para tener la misma energía. El
sweep tiene el factor de cresta mas bajo de todas, 6 dB menor que el ruido blanco. El
impulso necesita una amplitud de varios cientos de Volt para concentrar la misma energía.
Esto, por supuesto, restringe su utilidad práctica.
Como el espectro predefinido de una señal de ruido es sólo valido para una repetición
periódica, la medición o puede ser comenzada inmediatamente después de encender el
estimulo, al menos tiene que ser esperado un tiempo correspondiente a la longitud de
una respuesta al impulso para que la respuesta del DUT se estabilice. Como la longitud
de la IR no siempre es conocida de antemano, resulta práctico ejecutar simplemente dos
periodos de la señal de excitación. La adquisición de la señal sólo comienza en la
segunda partida, al igual que las mediciones MLS. Similarmente, solo la mitad de la
energía emitida es usada para el análisis en una sola medición (single shot). Por otra
parte, la periodicidad nuevamente permite la manipulación completamente
independiente de cada componente de frecuencia. Por ejemplo, podemos seleccionar
una única frecuencia para realzar o atenuar reduciendo o mejorando la energía de la
señal en la banda particular de frecuencias.
1.8
Sweeps no periódicos
En vez de aleatorizar las fases para obtener una señal de ruido con la forma espectral
deseada, la fase del espectro también puede ser ajustada para producir un incremento en
el retardo de grupo. La IFFT revelará un sweep en vez de una señal ruidosa. Por varias
razones los sweep son una bastante mejor elección para la medición de la función de
transferencia que una secuencia de ruido. Primero que todo, en contraste a lo último, el
espectro de un único sweep no repetido es idéntico comparado a su repetición periódica.
Los sweeps tienen que ser enviados a la salida solo una vez y la respuesta del DUT
puede ser inmediatamente capturada y procesada. Así que la duración de la medición se
reduce a la mitad, manteniendo en la misma resolución espectral y la relación S/R como
un estimulo periódicamente repetido. Las diferencias restantes de menor importancia en
el espectro del sweep repetido y no-repetido no son importantes, pues son reflejadas y
canceladas más adelante por la medición de referencia que también utiliza el barrido norepetido.
La otra enorme ventaja de la medición con sweep es el hecho de que las componentes
de la distorsión armónica, pueden ser completamente eliminadas de la IR obtenida.
Estas aparecen en los tiempos negativos donde ellas pueden ser separadas
completamente de la IR actual. De esta manera la respuesta al impulso queda intacta de
la energía de la distorsión. Por el contrario, mediciones que utilizan ruido como
estímulos inevitablemente tendrán una distribución de la distorsión producida sobre
todo el período.
La razón por la que la distorsión es rechazada puede ser explicada con el siguiente
ejemplo: Consideremos un sweep que recorre desde los 100 Hz después de 100 ms y
llega a 200 Hz en 200 ms. Para comprimir esta señal de excitación en un pulso Dirac, el
espectro de referencia necesita tener un correspondiente retardo de grupo de –100 ms en
100 Hz y –200 ms en 200 Hz. Cuando una frecuencia momentánea es 100 Hz y el DUT
produce armónicos de segundo orden, una componente de 200 Hz con el mismo retardo
de la fundamental de 100 Hz estará presente en la respuesta del DUT, ésta componente
de 200 Hz será tratada con el retardo de grupo de –200 ms del espectro de referencia a
200 Hz y por lo tanto aparece –100 ms después del proceso de deconvolución, así los
armónicos de alto orden aparecerán en “tiempos negativos mayores”.
Para colocar realmente los productos de la distorsión en los tiempos negativos de la
respuesta impulsiva obtenida, sería conveniente realizar una deconvolución lineal para
señales no periódicas. En vez de esto, también es posible mantener la operación de FFT
normal y la multiplicación de referencia como es usada en las mediciones con estímulo
periódico, con la condición de que el sweep de la excitación sea considerablemente más
largo que la respuesta al impulso del DUT o sean insertados ceros para rellenar la
respuesta al sweep del DUT para doblar la longitud (fig. 6b). En ambos casos, la
distorsión producida aparecerá al final de la respuesta impulsiva obtenida, donde ellos
pueden ser interpretados como portador de tiempos negativos. Estos pueden ser
removidos sin afectar la actual respuesta al impulso, como en el primer caso, se
encontrará en la última parte del ruido de fondo, y en el segundo caso, cualquier
información causal no se puede encontrar en está región.
Fig. 6d. Para sweeps no periódicos, la manera más apropiada para obtener la IR es una
deconvolución lineal (por ejemplo no cíclica). Esto verdaderamente pondrá los productos
de la distorsión armónica en los tiempos negativos, donde pueden ser eliminados
fácilmente. La deconvolución lineal puede ser lograda extendiendo con ceros al doble de su
longitud el sweep de excitación y la respuesta grabada del sweep. Ambos son llevados a la
FFT y el espectro de la respuesta del sweep es dividido por el espectro de la señal de
excitación. Una IFFT produce la IR deseada, cuya segunda mitad corresponde los tiempos
de llegadas negativos, que pueden ser eliminados.
Fig. 6e. Alternativamente a la deconvolución lineal puede ser utilizada una deconvolución
circular usando una FFT de igual tamaño de la señal capturada. Sin embargo, en este caso
los productos de la distorsión pueden ensuciar el decaimiento de la IR. Esto significa que
la longitud de la señal de excitación debe ser elegida lo suficientemente más larga que el
tiempo de decaimiento. Los productos de la distorsión aparecen con el ruido de fondo,
donde ellos pueden ser eliminados de manera segura mediante el uso de ventanas sin
afectar el final de la reverberación.
Sin embargo, en ambos casos significa que como primer paso de procesamiento de
señales se requerirá un largo de bloque de FFT mayor para la resolución espectral
empleada. Para lograr capturar la respuesta al impulso de alta calidad en salas, es
recomendable la utilización de sweeps que sean considerablemente mayores que la IR,
está es la mejor manera de aumentar la relación S/R y disminuir la influencia de la
variación de tiempo.
Hay una importante diferencia que concierne al ruido de fonde de la IR obtenida por
una deconvolución lineal y circular. Usando una deconvolución circular resulta un ruido
de donde que es básicamente constante en distribución de amplitud y frecuencia, sobre
el punto donde aparece el primer efecto de distorsión. Sin embargo, la deconvolución
lineal produce un decaimiento del ruido que es progresivamente filtrada en bajas
frecuencias hacia el final. Esto se debe al hecho de que la última parte del resultado de
la deconvolución originada del ruido estable convolucionada con un sweep en orden
inverso (por ejemplo desde altas a bajas frecuencias). El usuario debe tener conciencia
de este efecto y no confundir la disminución del ruido de fondo con la parte final del
tiempo de reverberación de la sala.
El periodo de adquisición de datos en mediciones no periódicas debe ser lo
suficientemente largo para capturar todos los componentes retardados. Esto significa
que el sweep siempre debe ser más corto que el período de captura y el largo de FFT
siguiente. En mediciones acústicas de salas, es muy beneficioso que el tiempo de
reverberación para altas frecuencias sea usualmente mucho mas corto que el de baja
frecuencia. Así el sweep debe ser cortado solo el tiempo correspondiente a la
reverberación de alta frecuencia, permitiendo que longitud del sweep sea suficiente para
que la reverberación de bajas frecuencias quede atrás de las componentes de alta
frecuencia.
Fig 6f. Cuando el sweep es mas corto que el tiempo de reverberación, el mínimo intervalo
de longitud debe ser calculado mediante la siguiente regla: Para cualquier frecuencia, la
longitud del intervalo no debe ser más pequeña que el tiempo anterior a la reverberación
para esta frecuencia de decaimiento en el ruido de fondo, menos el tiempo restante del
sweep en esa frecuencia.
2 UNA COMPARACIÓN ENTRE SWEEPS Y MEDICIONES MLS
2.1
Duración de la medición
En todas las mediciones, el periodo de captura AD debe ser por lo menos del largo de la
respuesta impulsiva (en la practica: el tiempo antes de que la respuesta llegue al ruido
de fondo) para evitar errores. Esto es obvio para una medición con pulsos no periódicos.
Toda su energía es emitida al principio, y el conversor DA simplemente muestrea hasta
que la respuesta impulsiva decae. En el caso que sean usados sweep no periódicos
como señales de excitación, el período de captura debe ser un poco mayor, pero en
general no mucho. Esto gracias a que los sweep comienzan en frecuencias bajas. Con
DUTs normales, como altavoces, el mayor retardo de la señal ocurrirá en baja
frecuencias. Así, mientras se produce el barrido a través de las altas frecuencias, el
tiempo debe ser suficiente para obtener los componentes retrazados de baja frecuencia.
Para mediciones de altavoces el decaimiento en frecuencias altas es usualmente tan
corto que la captación AD puede ser detenida inmediatamente después que la señal de
excitación pasa a través de él (siempre que el sweep sea considerablemente más largo
que el retardo en bajas frecuencias y por supuesto, observando el tiempo de llegada
entre el altavoz y el micrófono). En mediciones de salas acústicas el trozo de silencio
siguiente a la emisión del sweep usualmente debe ser mayor que el tiempo de
reverberación en altas frecuencias.
En el caso de excitaciones periódicas, el largo del período y el tiempo de captura AD
deben ser mayores que el largo de la respuesta impulsiva. Utilizar un largo menor
podría provocar time aliasing, que consiste en el pliegue de la parte final de la IR que
cruza el periodo con el principio del siguiente, sumando ésta al principio de la IR.
Dependiendo de la cantidad de energía plegada hacia atrás, aparecerán errores más o
menos tolerables. Comparado con mediciones de pulsos no periódicos o mediciones con
sweeps, la necesidad de emitir la señal de excitación dos veces significa que se requiere
mayor tiempo para la medición. Por otra parte, solo la mitad de la energía total que
alimenta al DUT es usada para el análisis.
2.2
Factor de Cresta
El factor de cresta es la relación del voltaje Peak-RMS de una señal expresado en dB.
Asumiendo que la medición del sistema o el DUT están limitados por un nivel distinto
de voltaje, el valor peak de cualquier señal de excitación considerada, tiene que ser
normalizado a este valor para extraer la máxima energía posible en una medición. El
nivel RMS entonces será bajo de acuerdo al factor de cresta. Así, el factor de cresta
indica cuanta energía se pierde cuando hay una cierta señal de excitación, comparada
con el caso ideal de estimulo cuyo voltaje RMS es igual al voltaje peak (cresta = 0 dB).
Por esta razón, el diseñar señales con un factor de cresta lo más bajo posible se ha
convertido en una especie de deporte para los desarrolladores teóricos de análisis de
señales.
La suposición que un nivel de voltaje está definiendo el límite superior de una
medición, muchas veces es verdadero en mediciones puramente eléctricas (por ejemplo,
ecualizadores, mezcladores, etc.). En mediciones acústicas esto es válido sólo cuando el
amplificador es el eslabón más débil de la cadena. Aún, muchos amplificadores
equipados de una fuente de alimentación basada en una transformación lineal pueden
reproducir sobretensiones peaks de 2 o 3 dB más altos que la potencia continua.
La primera restricción es el daño por el sobrecalentamiento de la bobina del altavoz,
para este caso la energía total emergente del altavoz es más importante que el factor de
cresta. Sin embargo, factores de cresta muy grandes deben ser evitados siempre, ya que
un único peak de nivel puede causar distorsión.
Como primera observación, un MLS mantiene la salida semejante a la señal de
excitación ideal. En el sentido de máxima extracción de energía. El valor Peak es igual
al valor RMS. Sin embargo, el ideal factor de cresta resultante de 0 dB no puede ser
explotado en la práctica. Tan pronto como el MLS salga al mundo real y pase a través
de un filtro, la forma de onda rectangular puede cambiar considerablemente.
Especialmente los filtros anti-aliasing abruptos usados en la etapa de oversampling de
un conversor DA causan dramáticos overshoot (distorsión). Para evitar esta drástica
distorsión causada por los clip en las etapas del filtro, el MLS debe alimentar el
conversor DA con un nivel de al menos 5 a 8 dB bajo la escala total, dependiendo de las
características del filtro anti-aliasing. Esto quiere decir que el MLS no puede ser
emitido libre de distorsión con la misma energía de una señal senoidal con un factor
cresta de 3.01 dB.
Pero aún si el MLS es producido por un hardware generador, este no retendrá el
favorable factor de cresta por un gran tiempo. Los amplificadores de potencias siempre
equipados con un filtro pasa bajos de entrada que rechaza la interferencia de radio, y
evita trancientes de intermodulación inducida por altas slew rate de la señal de audio –
precisamente que prevalecen en abundancia en un MLS no filtrado. Un típico filtro de
entrada puede ser un Butterworth pasa bajos de 2° orden con un frecuencia de corte de
quizás 40 kHz. El overshoot producido por este filtro es mucho más moderado que el de
un filtro anti-aliasing abrupto (fig. 7) pero aún merece consideración.
Fig 7: MLS pasado a través de un filtro pasa bajo anti-aliasing con sobre-muestreo de 8x
(izquierda) y con filtro pasa bajos de 2do orden con angulación en la frecuencia de 40 kHz
(derecha).
Existen casos en que algunos nodos internos del DUT restringen el driving level y no
los voltajes de la salida del sistema de medición. Por ejemplo, si una resonancia con alta
ganancia se encuentra en una etapa de ecualización de la cadena, la señal de excitación
debería distorsionar a la salida de esa etapa. En esos casos, los sweeps tienen que
alimentar con un nivel más bajo determinado por la ganancia en la frecuencia de
resonancia de ese filtro específico. En contraste a esto, el MLS filtrado tiende a tomar
una amplitud de distribución gausiana, con un 1% de las amplitudes alcanzando un nivel
mayor a 11 dB sobre el valor RMS [13]. En muchas mediciones de altavoces y salas
acústicas, aun con la presencia de resonancias moderadas, un sweep puede alimentar
con un mayor nivel RMS que un MLS. En la práctica la distorsión ocurre gradualmente,
con MLS mucho antes que el nivel de clip del amplificador sea alcanzado. Como será
examinado en la sección 2.5
2.3
Rechazo de Ruido
Cualquier principio de medición usando señales de excitación con igual longitud,
distribución espectral y energía total conducirá exactamente a la misma cantidad de
rechazo de ruido, si es considerado el período entero de la respuesta al impulso sin
ventana. Para cada frecuencia la relación S/R solamente depende de la relación de
energía de la respuesta del DUT a ese extraño ruido capturado en el período de
medición. Las diferencias entre varios métodos de medición simplemente engañan en la
manera de cómo el ruido se distribuye sobre el periodo de la IR recobrada.
Claramente usando la misma distribución espectral en una señal de excitación requiere
la misma coloración invertida en el proceso de deconvolución. Esto explica el porque la
magnitud de la fuente de ruido no varía cuando se cambia el tipo de estimulo. Las fases
sin embargo serán muy diferentes. Aún, algunos tipos de fuentes de ruido aparecerán
similarmente en todas las mediciones, ya que su característica general no es alterada por
la manipulación de la fase. Como por ejemplo un ruido de mono frecuencias (hum).
Igualmente el ruido no correlacionado (por ejemplo aire acondicionado) aún aparecerá
como ruido.
Sin embargo, cualquier otro disturbio será reproducido bastante diferente, dependiendo
del tipo de estímulo. Fuentes de ruido impulsivas, como clicks y pops, serán
nuevamente transformados en ruido cuando usamos un ruido como estímulo. En
contraste en una medición con sweep ellos llegarán a ser audibles como un sweep
invertido en el tiempo. Usualmente ruidos estables son considerados más discretos que
otras señales de error. Generalmente, si cualquier ruido aparece inesperadamente, la
medición simplemente debe ser repetida, o, si se está promediando eliminar el periodo
específico del proceso.
2.4
Variación de Tiempo
Las variaciones de tiempo tienden a aparecer en las mediciones siempre que se realicen
sobre una larga distancia exterior, cuando el promedio sincronizado es realizado sobre
largo periodos de tiempo, o cuando el DUT en si mismo no es invariante en el tiempo.
El primer caso ocurre en mediciones en estadios, o sitios al aire libre bajo condiciones
metereológicas con viento. El segundo se da cuando la relación S/R es muy baja
forzando a utilizar muchos cientos o incluso miles de promedios sincrónicos. En
periodos de medición largos, una leve variación de temperatura o movimiento puede
frustrar el proceso de promediado. Un tipo de DUT que no sea invariante en el tiempo
como cualquier tipo de grabadora análoga.
Es bien sabido que las secuencias de ruido periódicas en general, y en especial los MLS
son extremadamente vulnerables a leves variaciones de tiempo. Una considerable
cantidad de trabajos teóricos explican estos efectos en detalle [27-29]. Aunque las
ecuaciones allí presentadas se ven amenazadoras, en la práctica es fácil comparar los
efectos de variaciones de tiempo, estos tienden a tener una errática e impredecible
naturaleza. Es probable que dos mediciones al aire libre realizadas en serie estén
afectadas por diferentes ráfagas del viento. Sólo una simulación permite evadir esta
“variación del tiempo de la variación del tiempo”. La fig. 8 da un pequeño ejemplo.
Una secuencia de ruido y un sweep, ambos con espectro blanco plano, han sido
sometidos a una suave variación del tiempo sinusoidal de ±0.5 muestras. Para simular
un jitter, las señales han sido sobre muestreadas por un factor de 256 (sin filtrar,
simplemente insertando 255 ceros consecutivos después de cada muestra). Entonces el
tiempo exacto de llegada de las muestras ha sido desplazada en un rango de ±128 de
acuerdo a la curva sinusoidal de jitter. La alteración resultante del espectro de banda
base es insignificante en baja frecuencia, pero este aumenta extremadamente para el
espectro de ruido con jitter. Por el contrario el espectro del sweep con jitter sólo
muestra una mayor corrugación al final de altas frecuencias, y esto puede ser removido
con una suave ventana de suavización.
Fig 8: Variancia de tiempo sinusoidal artificial de ±0.5 impuestas en la señal de ruido
(superior) y sweep (inferior) y el espectro resultante.
Otra prueba expresiva es la respuesta de frecuencia de la medición de un grabador
análogo, un tipo de maquinas que siempre sufre wow and flutter en alguna proporción.
Como el material de cinta magnética tiende a saturarse mucho antes en altas
frecuencias, ha sido aplicado un énfasis de 24 dB en baja frecuencia al MLS y al sweep
usados en este experimento. Adicionalmente la envolvente del sweep ha sido hecha a la
medida para que decrezca 12 dB sobre los 5 kHz, pero manteniendo la coloración
inicial. La sección 4.4 nos revelara como esto es realizado. Ambos estímulos fueron
normalizados para que contengan la misma energía y fueron grabados con el mismo
nivel de entrada. Como los resultados de la fig. 9 muestran, la respuesta de frecuencia
medida usando MLS como excitación es tremendamente ruidosa sobre los 500 Hz. En
la que se utilizó el sweep como estimulo, también se observa la variación de tiempo
inducida por la contaminación pero mucho menos extendida. Además de los efectos de
deterioración de la variación de tiempo, la distorsión también juega un papel importante
en la contaminación de respuesta recobrada de la grabadora análoga. Para minimizar la
ínter-modulación producida, el nivel de grabación ha sido ajustado 20 dB bajo la
saturación límite en este experimento.
Aun cuando el sistema de medición es virtualmente libre de variaciones de tiempo, el
uso de señales de excitación pseudo-ruidosas es desventajoso cuando se realizan ajusten
dentro del período de medición (volumen, EQ, otros). En este caso ocurren grandes
errores en la visualización de la IR. Los sweep y la medición del impulso no muestran
esta molesta reacción a la variación del tiempo y estas son además más agradables de
usar para ajustes en mediciones repetitivas.
Fig 9: Función de transferencia de un grabador de cinta análogo medido con MLS
(izquierda) y con Sweep (derecha). Ambos con idéntica coloración y energía.
2.5
Distorsión
Los ingenieros de Hardware de audio se empeñan en optimizar el rango dinámico de sus
circuitos que idealmente debe corresponder a nuestro sistema auditivo con valores sobre
130 dB. La relación S/R en mediciones acústicas parece haber sido descuidada por los
acústicos en el pasado.
En sitios de relativa calma, es menor el ruido de fondo que limita la calidad de las
respuestas de las IR obtenidas, pero muy frecuentemente la distorsión es producida por
el altavoz empleado. En cualquier medición usando ruido como señal de excitación,
estos productos de excitación serán distribuidos como ruido sobre todo el período de la
IR. La razón de esto, es que la distorsión de un estímulo con fase pseudo- aleatoria
también tiene mayor o menor fase aleatoria, y también el proceso de deconvolución
involucra fases aleatorias que eventualmente producen un espectro erróneo con fases
aleatorias, correspondientes a una señal de ruido aleatoriamente distribuida. Como esta
señal errónea es correlacionada con la señal de excitación, promedios sincrónicos no
mejoran esta situación.
Mientras es verdad que los niveles de ruido dañan relativamente al valor peak de la IR
cuando escogemos una secuencia mayor, esto puede ser reducido difícilmente a un valor
aceptable. Mediciones de acústica de salas involucran secuencias largas. Por ejemplo,
aumentando el largo de un MLS de grado 18 por un factor de 128 podríamos
teóricamente reducir el nivel de ruido de un típico valor de –65 dB a –86 dB. Mientras
esto puede ser factible en procesos MLS de grado 25 (largo 12min, 42s con 44,1 kHz de
frecuencia de muestreo) en un computador equipado con bastante memoria, podría no
funcionar bajar el nivel de ruido a este nivel, porque cuando usamos una secuencia tan
larga, la vulnerabilidad contra la variación de tiempo es predominante.
En vez de reducir la influencia de la distorsión por un incremento del período de
medición, es más beneficioso simplemente excluirla totalmente de la IR recuperada.
Esto puede ser logrado fácilmente por el uso de sweeps como señal de excitación, como
se explico en la sección 1.8. La mayor mejora que puede ser realizada en mediciones de
acústica de salas por el reemplazo de MLS con sweep es demostrada en la fig. 10.
Ha sido medida la IR de una cámara reverberante usando MLS y sweeps de grado 20,
ambos con la misma energía y el mismo pre-énfasis de 20 dB en baja frecuencia. Para la
medición con MLS, el volumen ha sido cuidadosamente ajustado para producir una
mínima contaminación a la IR. De hecho, esta búsqueda del óptimo nivel mediante
prueba y error es crucial en mediciones con MLS [34], ya que mucha energía produce
distorsión excesiva visible por un aumento del ruido de fondo con una estructura
abultada, mientras que en bajo nivel conduce al que el ruido de fondo estropee la
mayoría de las veces la medición.
Fig 10: Medición de la respuesta impulsiva en una cámara reverberante con 1, 10 y 100
promedios sincrónicos. Izquierda: con MLS, derecha: con sweep de idéntica coloración y
energía. Las curvas con comprimidas a 1303 valores, cada una de ellas representa el
máximo de 805 muestras consecutivas.
Después de este ajuste se pueden realizar 1, 10, 100 promedios sincrónicos con ambas
señales de excitación. Es claramente visible en la fig. 10, que cuando no se usan
promedios, la IR decae al ruido de fondo que es 5 dB menor en mediciones con sweeps.
La distorsión acumulada queda al final del período de medición. Como el largo de la
señal de excitación ha sido escogida al menos 8 veces mayor que el tiempo de
reverberación, esta puede ser separada de la actual IR. Realizando 10 promedios
sincrónicos, el ruido de fondo se reduce 10 dB cuando se utilizan sweeps. Por el
contrario, cundo se usa MLS como señal de excitación, sólo se observa una pequeña
disminución del ruido de fondo, demostrando que el producto de intermodulación
correlacionada prevalece en la IR recuperada. Realizando 100 promedios sincrónicos no
sucede ninguna mejora en una medición con MLS, mientras que en la medición con
sweeps se aprecia una disminución, a pesar de que no alcanza los 10 dB esperados. La
variación de tiempo debido a la variación de la temperatura podría explicar esto, ya que
la medición de 100 promedios toma alrededor de 40 minutos.
En este experimento el nivel de salida ha sido optimizado para el uso con MLS. El nivel
del sweep emitido podría haber sido aumentado 15 dB causando una distorsión en el
amplificador, y con esto disminuir el nivel del ruido de fondo esta misma cantidad. Así,
la relación señal ruido podría haber alcanzado un valor de 100 dB con sólo 10
promedios de sweeps. Por el contrario es imposible conseguir esta calidad con
mediciones MLS, independientemente del nivel y del número de promedios.
El altavoz utilizado en el experimento fue una combinación woofer/tweeter para PA de
12 pulgadas optimizado para una mayor eficiencia. Este tipo de parlantes claramente
produce mayor distorsión que un sistema de alta fidelidad con suspensiones más suaves
y mejores bobinas, pero incluso con este último, una relación de señal ruido de 90 dB se
puede lograr, algo que es inalcanzable con mediciones MLS.
Esto es mostrado con un experimento similar usando un altavoz coaxial de 5’’ con
suspensión suave medido en una cámara anecoica con señales de excitación muy
pequeñas (fig. 10b). Nuevamente el nivel fue ajustado para alcanzar la óptima relación
S/R con el MLS rosado. Alimentado con la misma energía, el sweep rosado produce una
mejor relación S/R con sólo una medición. Este nivel ajustado a favor del MLS fue tan
bajo que fue posible aumentar 20 dB sin causar saturación en el amplificador de
potencia empleado. Haciendo esto, los productos de la distorsión al final del período
aumentan considerablemente, pero la relación S/R aumentó aproximadamente a la
ganancia adicional del amplificador. Con sólo 10 promedios (largo total de la medición
de 3,5 segundos), se alcanzan exitosamente 100 dB.
Fig. 10b) Experimento similar al de la figura 10 con un pequeño parlante de 5’’ en una
cámara anecoica. El nivel nuevamente ha sido ajustado para producir la mínima
contaminación de la IR cuando se mide con MLS. El sweep puede ser emitido con 20 dB
más de potencia, lo cual permite obtener relación S/R con sólo 10 promedios (curva verde
en el lado derecho).
Además de mediciones acústicas, existen más situaciones de medición en que se
requiere linealidad que las mediciones con MLS no satisfacen, como por ejemplo
codificadores psico-acústicos. Un ejemplo obvio son los teléfonos celulares que usan
una muy alta compresión para obtener bajos bit rate. Experimentos preliminares
muestran que señales cortas de excitación producen errores impredecibles y erráticos,
independientemente si se usa MLS o sweeps. Aumentando el largo del grado 18 a
44.1 kHz de frecuencia de muestreo entregan resultados más o menos confiables con un
sweep (lineal entre 100 Hz y 7 kHz), mientras que la medición con MLS del mismo
largo y coloración produce una curva muy rugosa que difícilmente permite reconocer la
función de transferencia (fig. 11). Sin embargo, hay que admitir que estos resultados son
cuando la respuesta impulsiva es transformada al dominio espectral sin un proceso
previo. Aplicando una ventana estrecha con un ancho de sólo 80 ms alrededor del peak
mayor alivia la situación bastante (fig.12). Aún así, aparecen sorprendentes diferencias
sobre los 2 kHz entre las mediciones con MLS y sweeps. El codificador parece producir
diferentes resultados para ruido de banda ancha y aparecen señales mono frecuenciales
en un corto periodo de análisis.
Otro ejemplo que es más frecuente en aplicaciones de audio que la codificación de baja
fidelidad telefónica es la popular compresión MPEG 1 / layer 3. La fig.13 muestra la
función de transferencia de codificador para la común razón de 128 Kbit/s, con
medición de MLS y sweep. La ventaja del sweep es arrolladora en esta aplicación. De
hecho, el ruido de banda ancha que el codificador tiene que tratar cuando un MLS se
utiliza como señal de excitación presenta el caso peor para la codificación psicoacústica. Todas las bandas de frecuencia contienen energía, así ninguna cae debajo del
nivel de enmascaramiento que podría permitir omitirla. Consecuentemente, todas las
bandas tienen que ser sometidas a una cuantización para obtener el bit rate requerido,
resultando en distorsión que perturba significantemente la medición con MLS. Por el
contrario, los sweeps se deslizan solo un par de bandas por intervalo de análisis,
permitiendo cuantizar con alta resolución mientras se descartan otras que no contienen
energía.
Fig. 11: Función de transferencia de un celular GSM (alimentado acústicamente por un
audífono), recibido por un teléfono fijo. Izquierda: medición con MLS lineal de grado 18.
Derecha: medición con un sweep lineal de igual longitud.
Fig 12: Misma medición que en la figura 11, pero con una ventana (Hann, 80 ms) aplicada
a la respuesta impulsiva obtenida.
Fig 13: Función de transferencia de un codificador MPEG3 a 128 Kbit/s, medido con un
MLS lineal de grado 14 (izquierda) y un sweep lineal de igual longitud (derecha).
Para resumir, cuando medimos la compresión de datos de los codificadores, los sweeps
tienen la considerable ventaja de reducir la complejidad de la señal comparado con las
secuencias de ruido. Esto convierte la codificación en una tarea sencilla. Mientras que
en mediciones “naturales” usando sweeps, la distorsión puede ser aislada y eliminada
por el uso de ventanas, la ventaja en mediciones que involucren codificadores parece
mentir más en el hecho que la generación de distorsión es simplemente prevenida.
3 PRE-ÉNFASIS
En casi cualquier medición acústica, no es aconsejable usar una señal de excitación con
contenido espectral blanco. En el caso de medición de altavoces en una cámara
anecoica, se pueden presentar dos efectos para una gran pérdida de relación S/R en
bajas frecuencias: La pérdida de sensibilidad (de 12 o 24 dB por octava) debajo de la
resonancia de la caja de bajos (bass cabinet), y el aumento del ruido de fondo en esta
región de frecuencias debido al deficiente aislamiento de las paredes al ruido de fondo.
Así pues, para seguir el roll-off de frecuencia baja de los altavoces (si es posible en
todos, vea [30], [31]) sin los efectos de la degradación de bajo S/R, se requiere de un
fuerte énfasis de más de 20 dB para establecer una certeza razonable en la medición.
Esto también da lugar a una mejor contribución de la energía que alimenta a un altavoz
multivía. El woofer soporta mucha más potencia que un tweeter. Pero cuando usamos
una señal de excitación con espectro blanco, el tweeter tendrá que soportar el golpe de
la energía de la señal de excitación. Un domo de tweeter puede ser sobrecalentado y
dañado con unos pocos Watts, y su límite puede ser fácilmente sobrepasado por
cualquier amplificador de potencia. Desde este punto de vista, un énfasis en bajas
frecuencias es altamente deseable.
Una tercera razón a mencionar, de naturaleza social es la siguiente: cuando se realizan
mediciones “in situ” (salas de concierto, estadios), una señal de excitación con realce en
bajos da calidez al sonido y es más agradable que el ruido blanco, y por lo tanto es más
aceptable por otras personas presentes. Además, un fuerte incremento de potencia en la
banda de bajos no da la impresión de mucha sonoridad debido a la mala sensibilidad del
oído en esta región de frecuencias. Mientras esto puede sonar poco científico, todos los
que hayan participado en sesiones de mediciones en público saben que el volumen
máximo aplicable es estipulado por las personas que se juntan en el lugar, no por los
altavoces ni por los amplificadores (ver [1]). Por ejemplo, los instaladores que suben en
los soportes cerca de un cluster de altavoces aprecian definitivamente señales de
excitación no molestas. En estos casos, usando ruido blanco como estimulo incluso
lleva a un riesgo de salud y un problema potencial de seguridad. Un MLS que alimente
accidentalmente con máximo nivel a un sistema potente puede causar daño auditivo o
incluso conducir a los accidentes asustando al personal. Esto especialmente cerca de 2
los drivers horn-loaded 2''. Usar señales de excitación con énfasis en bajos relaja la
situación a un cierto grado. Con sweeps largos, se puede interrumpir antes de alcanzar
las frecuencias medias.
3.1
Ecualizando altavoces para mediciones acústicas de salas.
Obtener la IR es una de las tareas más recurrentes en acústica de salas y edificios. Todos
los parámetros típicos que describen las propiedades acústicas de una sala (o para ser
más precisos, el camino de transmisión acústica entre dos puntos, usando una fuente y
receptor con distinta directividad) como reverberación, claridad, definición, tiempo
central, STI y muchos otros pueden ser derivados de ella. Una mirada más cercana a la
IR puede ayudar a identificar problemas como las reflexiones indeseadas o una
proporción deficiente entre el sonido directo y la reverberación. Visualmente
examinando la función de transferencia asociada a la sala (obtenida por la FFT) puede
dar a conocer modos molestos de la sala o, por supuesto, desbalance tonal de un sistema
de refuerzo sonoro.
Otra aplicación interesante es la creación de “realidad virtual” por la convolución de la
capturación “seca” (anecoica) de audio con la IR binaural de una sala capturada por un
dummy head. Posteriormente se demostrará que sólo los sweeps son capaces a realizar
tareas con suficiente rango dinámico.
Hasta hoy, la capturación de la RIR para mediciones de tiempo de reverberación es
ocasionalmente hecha usando fuentes impulsivas no electroacústicas. Las maneras más
comunes son disparando una pistola (acción delicada especialmente en iglesias) o
explosiones de globos. Mientras se obtiene altos niveles en algunas bandas de
frecuencia, estos métodos tienen una baja repetibilidad y producen espectros
impredecibles. La energía de baja frecuencia contenida es usualmente baja,
especialmente para pistolas debido a sus pequeñas dimensiones. Incluso la
omnidireccionalidad no está garantizada [1]. La única forma de evitar estos severos
inconvenientes es usar un sistema electroacústico, y por lo tanto el uso de un altavoz.
Obviamente, cuando usamos un altavoz sin ninguna precaución, la función de
transferencia obtenida de la sala será “coloreada” por la respuesta de frecuencia del
altavoz. Este es un problema cuando la RIR será usada para auralización. Para empeorar
las cosas, la respuesta de frecuencia es dependiente de la dirección. Para mediciones de
acústica de salas, la norma ISO 3382 describe el uso de un altavoz “lo más
omnidireccional” posible (condición que en la practica difícilmente puede ser satisfecha
sobre 2 kHz).
Ningún altavoz será capaz de producir una salida independiente de la frecuencia. Este
no es un gran problema en mediciones de tiempo de reverberación en octavas o tercio
de octavas, mientras que la desviación dentro de estas bandas no sea muy alta. La
coloración del RTF por la respuesta de frecuencia del altavoz es muy indeseable con la
intención de auralizar señales. En estos casos, es obligatorio usar un pre-énfasis para
remover la coloración. Por supuesto, esta ecualización podría ser hecha post-procesando
la RTF con la inversa de la respuesta del altavoz, pero esto no podría mejorar la pobre
relación S/R en las regiones de frecuencia donde la salida acústica del altavoz es baja.
Es por esto que es favorable pre-filtrar la señal de excitación independientemente de la
frecuencia y potencia de salida.
Una ecualización del altavoz es el pre-énfasis que debe ser aplicado en mediciones de
acústica de salas. Además, la medición puede ser mejorada para un mejor alcance,
adaptando el espectro de potencia emitido al espectro del ruido ambiente. Y en el mejor
de los casos, el ruido de fondo tiende a ser mucho mayor en la región de bajas
frecuencias. Así, en orden de obtener una relación S/R que sea casi independiente de la
frecuencia, se debe aplicar un pre-énfasis adicional que siga el espectro del ruido de
fondo.
Mientras es deseable tener la relación S/R independiente de la frecuencia para análisis
de acústica de salas (especialmente para la obtención de tiempo de reverberación en
bandas filtradas), podría ser discutible el orden para minimizar el ruido audible, la RIR
adquirida para propósitos de auralización tiene un ruido de fondo que es
aproximadamente lo contrario de nuestra sensibilidad de la audición en niveles bajos. El
uso de noise shaping para reducir el ruido percibido en grabaciones con cuantización
fija (por ejemplo los 16 bits de un CD) busca la misma meta. Una buena introducción a
esta área se da en [32]. Para conseguir el nivel de ruido que sea particularmente bajo en
regiones espectrales de alta sensibilidad del oído, se debe aplicar un énfasis igual a la
curva de sensibilidad (por ejemplo E-curve) a la señal de excitación. Por otro lado,
dando un aumento extra en la región de frecuencias medias de mayor sensibilidad del
oído podría llevar a señales de excitación bastante molestas. De todas formas, la
pregunta de cual énfasis satisface lo mejor posible es un problema multifacético y se
puede contestar diferentemente para cada medición.
Una interrogante es como manejar las mediciones de la ecualización de la potencia
acústica de los altavoces. Usualmente, la respuesta de potencia acústica del altavoz es
obtenida por promedio de la magnitud de muchas funciones de transferencia medidas en
campo difuso en una cámara reverberante. La corrección con la inversa de los tiempos
de reverberación con 10*log{1/T(f)} convierte el espectro de presión del campo difuso
en un espectro proporcional a la potencia acústica.
Fig. 14: Pasos para la construcción de un espectro de potencia acústico de un altavoz.
Después de esto, es indispensable un suavizado de 1/6 o 1/3 de octava para no obtener
una curva corrugada. Pero esta suavización no es suficiente para bajas frecuencias,
como puede ser visto en la fig.14 en la curva superior derecha. En este rango, la función
de transferencia de la cámara consiste en solo en algunos modos con alto Q. Es una
buena idea reemplazar estos nodos por un declive con la disminución teórica de la
sensibilidad del altavoz (12 dB/oct para caja cerrada o 24 dB/oct para sistemas vented).
El problema ahora es como tratar la fase y el retardo de grupo asociado. Evidentemente,
la fase de la función de transferencia de la cámara reverberante no puede ser usada. Un
compromiso factible es combinar la magnitud de la respuesta de potencia acústica
(obtenida en la cámara reverberante) con una respuesta de fase en campo libre (obtenida
de la medición de sensibilidad en el eje del altavoz). Obviamente, combinando la
amplitud de una medición con la fase de la otra entrega un espectro artificial que
también corresponde a una IR artificial. Sin embargo, esto parece ser una vía realizable
para minimizar la distorsión en amplitud y fase de mediciones en acústica de salas.
Es interesante advertir que si se creará un sweep, sólo la magnitud de la respuesta
objetivo influenciará la señal de excitación. No teniendo ninguna influencia en la
creación del barrido, la medición de la fase del altavoz puede ser ecualizada solamente
por el post-proceso (es decir, aplicando lo contrario de esta fase al archivo de la
referencia). Así, en general para las mediciones de acústica de salas, el proceso de la
señal siempre consiste en una combinación de pre y post-procesamiento.
4 SÍNTESIS DE SWEEPS
Los sweeps pueden ser creados directamente en el dominio del tiempo o indirectamente
en el dominio de la frecuencia. En este último caso, su magnitud y retardo de grupo son
sintetizados y el sweeps es obtenido mediante la IFFT de este espectro artificial. Las
formulas dadas aquí no se apegan a los estándar matemáticos típicos, pero son
aceptables para su implementación en software.
Los dos tipos más comúnmente conocidos son los sweeps lineales y logarítmicos. Los
sweep lineales tienen un espectro blanco y aumentan con una razón fija [Hz] por unidad
de tiempo.
f 2 − f1
= const
T2 − T1
(a)
Algunos científicos japoneses [35], [36], se refieren al sweep lineal como “pulso
expandido en el tiempo” (time stretched pulse, TSP), pero por supuesto cualquier señal
de excitación de banda ancha, como un sweep o un ruido, puede ser considerado como
un pulso cuya energía ha sido expandida en el tiempo.
El sweep logarítmico tiene un espectro rosado, lo que significa que la amplitud
desminuye 3 dB/oct. Eso también significa que todas las octavas contienen la misma
energía. La frecuencia aumenta con una fracción fija de una octava por unidad de
tiempo:
log ( f 2 f1 )
= const
T2 − T1
4.1
(b)
Construcción en el dominio del tiempo
Los sweeps pueden ser sintetizados fácilmente en el dominio del tiempo mediante el
incremento del paso de la fase que es sumado al argumento de una expresión sinusoidal
después de cada cálculo de una muestra de salida. Un sweep lineal como los utilizados
en TDS tiene un reajuste del valor sumado al incremento de la fase:
x(t ) = A sin(ϕ )
ϕ = ϕ + ∆ϕ
∆ϕ = ∆ϕ + incϕ
(1)
En contraste un sweep logarítmico es generado por la multiplicación al incremento de la
fase por un factor de reajuste después del cálculo de cada nueva salida. Así que la
última línea en la ecuación (1) simplemente cambia a:
∆ϕ = ∆ϕ ⋅ Mulϕ
(2)
El valor de ϕ para la primera muestra es 0, mientras que el valor de ∆ϕ corresponde a
la frecuencia de comienzo deseada del sweep:
∆ϕ start = 2π ⋅
fstart
fs
(3)
El factor incϕ usado para la generación del sweep lineal depende de la frecuencia de
inicio y de término, la frecuencia de muestreo fs y el número de muestras N a ser
generados:
incϕ = 2π
fstop − fstart
fs ⋅ N
(4)
En contraste, el factor Mulϕ necesario para incrementar un sweep logarítmico es
calculado por:
Mulϕ = 2
log 2 ( fstop ) − log 2 ( fstart )
N
Mientras los sweep generados en el dominio del tiempo tienen una perfecta envolvente
y de esta manera un factor cresta ideal (3.02 dB), su espectro no es exactamente el
esperado. El abrupto comienzo al iniciar del sweep y el abrupto final al terminar el
sweep son responsables del indeseable ripple en los extremos del espectro de
excitación, como se ve en la fig. 15. Ventanas half pueden ser utilizadas para disminuir
el impacto del inicio y término del sweep, pero no los elimina completamente.
Normalmente, no tendrán efecto en la respuesta de frecuencia recuperada cuando se
corrige con un espectro de referencia derivado de la inversión del espectro de la señal de
excitación (la cual es obtenida por una medición de referencia conectando la salida a la
entrada). Sin embargo, si la deconvolución es simplemente hecha con la inversión del
tiempo y la forma de la amplitud del estímulo, como es propuesto en [2], o si la
corrección no es factible, como con TDS, entonces pueden ser esperados errores en las
cercanías del comienzo y término del sweep.
Fig. 15: Sweeps creados en el dominio del tiempo y sus propiedades espectrales.
(5)
4.2
Construcción en el dominio de la frecuencia
La construcción de sweeps en el dominio de la frecuencia evita estos problemas. La
síntesis puede ser hecha definiendo la magnitud y el retardo de grupo de un espectro
FFT, calculando la parte real y la parte imaginaria de ella y finalmente transformando el
espectro del sweep artificial al dominio del tiempo aplicando la IFFT. El retardo de
grupo no es fácilmente interpretable para señales compleja, pero es muy bien definido
para los sweep sinusoidales, describiendo exactamente en que tiempo ocurre cada
frecuencia. Para los sweeps, el retardo de grupo se asemeja a la distribución tiempofrecuencia con los ejes vertical y horizontal intercambiados (a pesar de carecer de la
tercera dimensión, contienen la información de la magnitud).
Si se desea un sweep con una envolvente temporal constante (garantizado naturalmente
por la construcción en el dominio del tiempo), la magnitud y el retardo de grupo tienen
que estar relacionado el uno con el otro. En el caso de un sweep lineal, la magnitud del
espectro tiene que ser blanco y en el caso del sweep logarítmico debe ser rosado, con
una pendiente de –3 dB por octava. El retardo de grupo asociado para el sweep lineal
puede ser entonces simplemente:
donde k es:
τG ( f ) = τG (0) + f ⋅ k
(6)
( )
(7)
τG fs 2 − τG (0)
k=
N
El retardo de grupo de un sweep logarítmico es levemente más complicado:
τG ( f ) = A + B ⋅ Log 2 ( f )
(8)
τG ( fend ) − τG ( fstart )
log 2 ( fend − fstart )
(9)
Donde:
B=
A = τG ( fstart ) − B ⋅ log 2 ( fstart )
Normalmente f START será la primera frecuencia del espectro discreto de la FFT,
mientras que f END será fs / 2 . Por supuesto, τ G ( fstart ) y τ G ( fend ) deben estar
restringidos a valores que se ajusten dentro de intervalo de tiempo obtenido después de
la IFFT. La fase es calculada mediante la integración del retardo de grupo. La fase y la
magnitud pueden ser convertidas a la parte real y imaginaria por las usuales expresiones
sin/cos.
Como se estableció antes, la creación de sweeps en el dominio del tiempo causarán
algunos efectos de suciedad en el dominio espectral. Igualmente, los sweeps
sintetizados en el dominio espectral causarán algunas rarezas en la señal resultante en el
dominio del tiempo. Primero que todo, es importante que la fase resultante de la
integración del retardo de grupo alcance exactamente 0° o 180° en fs. Esta condición
generalmente tiene que ser cumplida por cada espectro de una señal real. Esto puede ser
realizado fácilmente restando los valores del espectro de la fase que disminuyen
linealmente con la frecuencia hasta exactamente la compensación de la fase anterior del
final:
ϕ( f ) = ϕ( f ) −
f
⋅ ϕ END
fs / 2
(10)
Esto es equivalente a añadir un retardo de grupo menor de ± 0,5 muestras sobre todo el
rango de frecuencias.
Aún satisfaciendo esta condición, los sweep no estarán confinados exactamente a los
valores dados por τ G ( fstart ) y τ G ( fend ) , pero estas se dispersan más allá en ambas
direcciones. Esto es una consecuencia directa de la magnitud del espectro deseado, el
cual no presenta las ondulaciones debidas al abrupto comienzo y término de los sweeps
(creados en el dominio del tiempo). La ampliación se debe a que, el retardo de grupo
para bajas frecuencias no debe ser cero, solo un poco mayor. De esta manera, la primera
mitad de la onda del sweep tiene más tiempo para desarrollarse. Sin embargo, este
siempre comenzará con un valor mayor a cero, mientras la parte restante izquierda del
punto de comienzo se plegara hacia atrás, hacia los “tiempos negativos” en el final del
período. Allí, este puede “ensuciar” la parte final de alta frecuencia del sweep si el
retardo de grupo escogido para fs / 2 es demasiado cercano a la longitud del intervalo
de tiempo de la FFT. Una manera segura de evitar la contaminación en la parte final
debido a las componentes de bajas frecuencias es simplemente escogiendo la longitud
del bloque de la FFT por lo menos el doble de la longitud del sweep deseado.
Para forzar el deseado comienzo y final del sweep al punto cero, son indispensables las
operaciones de fade para evitar el ruido switching. Haciendo esto, es claro que ocurre
una desviación de la deseada magnitud del espectro. Pero ésta puede ser insignificante
al escoger partes suficientemente estrechas al comienzo y final del sweep. El espectro y
las señales en el tiempo resultantes para los sweeps lineales y logarítmicos son
presentados en la fig. 16. La plataforma horizontal bajo los 20 Hz para el sweep
logarítmico ha sido introducida deliberadamente para evitar demasiada energía
subsónica. Ambos sweep cubren el rango completo de frecuencias desde el DC
(incluido) a fs / 2 .
Fig.16: Sweeps creados en el domino de la frecuencia mediante la formulación del retardo
de grupo.
El ripple introducido por las operaciones de fading (ventanas half-cosine muy
adecuadas) puede ser mantenido fácilmente bajo 0.1 dB y no debe causar ninguna
preocupación, ya que este impacto en la medición resultante es cancelado al desarrollar
y aplicar la medición de referencia.
Fig. 17: . Ilustración de la construcción de un sweep de ancho de banda con perfecta
respuesta de magnitud.
Sin embargo, en los casos donde una compensación exacta de la amplitud no es posible
o deseado (por ejemplo, en un dispositivo TDS), el método iterativo mostrado en la
figura 17 permite rechazar completamente el ripple, estableciendo la magnitud exacta
del espectro deseado mientras se mantiene la longitud deseada del sweep. La iteración
consiste del desarrollo consecutivo de operaciones fade in/out, transformando la señal
del tiempo al dominio espectral, reemplazando la ligera corrugación de la magnitud
espectral por la magnitud deseada, manteniendo las fases, y eventualmente volver a
transformar la magnitud del espectro manipulada al dominio del tiempo. Antes de
aplicar la ventana fade in/out nuevamente, los residuos fuera del intervalo del sweep son
examinados. Si su valor máximo es menor que el LSB de la cuantización final del
sweep deseado, la ventana es omitida y la iteración finaliza. Usualmente, el proceso
converge rápidamente y aún un sweep con cuantización de 24 bit es disponible solo
después de 15 iteraciones. Sin embargo, la respuesta de magnitud perfecta es cambiada
por una ligera distorsión de la fase del espectro. Por lo tanto, el retardo de grupo
derivado estará ligeramente distorsionado, pero el efecto es casi imperceptible y
restringido bandas muy estrechas alrededor de DC y fs / 2 . La iteración trabaja mejor
con sweep de un ancho de banda que cubre el rango completo entre 0 Hz y fs / 2 Hz.
4.3
Sweep con magnitud espectral arbitraria y envolvente temporal
constante.
Hasta ahora hemos estado restringidos a sweeps lineales y logarítmicos. Si su magnitud
espectral fue alterada de la contribución de energía blanca o rosada a algo diferente, es
claro que su envolvente temporal podría ya no ser constante. Esto puede implicar un
incremento del factor cresta y por lo tanto una pérdida de energía, dando un clavado
valor peak como máxima amplitud. No obstante, podría ser muy atractivo el uso de
sweeps con una arbitraria contribución de energía sin perder la ventaja del bajo factor de
cresta. Esto puede ser realizado de manera sorprendentemente fácil simplemente
haciendo que el retardo de grupo crezca proporcionalmente a la potencia del espectro de
excitación deseado. Generalmente, la energía de un sweep en una región particular de
frecuencia puede ser controlada por la amplitud del sweep o la razón del sweep en esa
frecuencia. Un incremento con pendiente del retardo de grupo significa que la
correspondiente región de frecuencia es emitida en un tiempo considerable, con solo la
frecuencia instantánea emergiendo lentamente. De esta forma, mucha energía esta
almacenada en la respectiva sección espectral.
El retardo de grupo para el sweep de magnitud arbitraria y envolvente constate puede
ser construido comenzando con τ G ( fstart ) para la primera frecuencia y entonces
incrementando:
τ G ( f ) = τ G ( f − df ) + C ⋅ H ( f )
2
(11)
donde C es la longitud del sweep dividido por la por la energía del espectro de
excitación:
C=
τ G ( fend ) − τ G ( fstart )
fs / 2
∑ H( f )
(12)
2
f =0
El proceso es ilustrado por un ejemplo en la figura 18. El sweep bajo construcción
servirá para ecualizar un altavoz y presentar un adicional énfasis de baja frecuencia. El
espectro deseado de la señal de excitación se origina de la inversión de la respuesta del
altavoz. Este es adicionalmente enfatizado con un filtro de primer orden low-shelf con
10 dB de ganancia y un filtro pasa altos en 30 Hz para evitar que un exceso de energía
infrasónica alimente al altavoz por la nueva ecualización de la señal de excitación.
El grupo de retardo construido muestra una relativa inclinación pronunciado hasta 0,5
segundos, y la señal resultante en el tiempo revela que en este rango incrementa solo
gradualmente desde el valor inicial. De esta manera el sweep contendrá una gran
cantidad de energía en esa región de frecuencia. Desde los 80 Hz a los 6 kHz, el retardo
de grupo incrementa solamente en 200 ms, así todo el rango de frecuencias medias pasa
a través de este corto tiempo. Sobre los 6 kHz, el retardo de grupo nuevamente se
inclina debido al incremento de la magnitud deseada y la frecuencia aumenta
moderadamente, extendiendo consecuentemente la parte de HF del sweep.
Se debe observar que la amplitud del sweep no es completamente constante, como
podría ser deseado para lograr el factor de cresta ideal. En el comienzo y en
aproximadamente 650 ms, un leve resalto no se puede negar. Esta es otra imperfección
causada por la formulación del sweep sintético en el dominio de la frecuencia. Para
mantener esta alteración pequeña, una leve suavización de la magnitud del espectro
ayuda. Haciendo esto, el factor de cresta del sweep puede mantenerse normalmente bajo
los 4 dB, llevando a una perdida de energía menor a 1 dB. Por supuesto, el método
iterativo descrito en 4.2 puede ser combinado con este algoritmo para reducir las
desviaciones de la deseada respuesta de magnitud espectral cerca de las bandas límites.
Haciendo esto, el factor cresta decrece levemente.
Fig.18: Generación de sweep con envolvente constante y magnitud espectral arbitraria.
4.4
Sweep
establecida.
con
espectro
de
magnitud
arbitraria
y
envolvente
¿Es el sweep con envolvente constante y magnitud espectral arbitraria la señal de
excitación óptima para mediciones acústicas? Bien, si el amplificador de potencia debe
ser la restricción límite del equipamiento de medición, uno debe decir si. La casi
constante envolvente de la señal de excitación permite obtener la máxima potencia del
amplificador para todo el rango de frecuencias de la medición, por esta razón drenar la
máxima energía posible hacia el RUT (room under test) en los distintos intervalos de
tiempo. Sin embargo, la falta de potencia es raramente un punto de preocupación hoy en
día (quedando solo los equipos portátiles alimentados con batería). Es mucho más
común que tenga que ser considerada cuidadosamente la capacidad de manipulación de
potencia de los altavoces para evitar dañarlos. En el caso de sistemas multivía, por
ejemplo, un dodecaedro compuesto de altavoces coaxiales, posiblemente soportado por
un potente subwoofer, cada vía tiene su propia potencia límite. Un sweep con
envolvente constante debe tener esta potencia ajustada al enlace más débil del
equipamiento, muchas veces los tweeters. Esto podría dejar a las capacidades de
manipulación de potencia del woofer (que exceden a los tweeters frecuentemente por un
factor de 10 o más) la mayoría de las veces sin uso. Por otro parte, un aumento extra es
frecuentemente deseable precisamente en la región de bajas frecuencia
para
sobreponerse al incremento del ruido de fondo ambiental.
Queda claro que en el caso de los altavoces, la potencia instantánea del sweep debe ser
controlable de acuerdo a la frecuencia por la que está pasando el sweep. Esto puede ser
logrado por el control de la amplitud del sweep en un modelo dependencia-frecuencia.
Para hacer esto, solo es necesario hacer una modificación menor al proceso de creación
de sweep revelado en la sección 4.3. Como se muestra en la figura 19, el truco es
primero dividir el espectro “objetivo” por la envolvente espectral deseada. El espectro
resultante es la base para la síntesis del retardo de grupo. Después, creando la parte real
e imaginaria, el espectro del sweep ahora será multiplicado con la envolvente del
espectro deseado, reestableciendo la magnitud de respuesta deseada. La IFFT producirá
ahora un sweep que ya no tiene una envolvente constante, pero finalmente diseñando la
amplitud dependiente de la frecuencia impuesta por el espectro de la envolvente
deseada.
Dos grados de libertad se ofrecen aquí: Una arbitraria distribución espectral junto con
una arbitraria definición de la envolvente dependiente de la frecuencia, la cual es
transformada en un una barrido senoidal desformado convenientemente en amplitud y
tiempo.
Fig. 19: Generación de sweep con magnitud y envolvente arbitraria.
Se debe admitir que ésta aproximación no es la solución completa para el peligro del
sobrecalentamiento de tweeter sensibles. Comparado a un sweep con envolvente
constante de idéntico contenido de energía, un sweep con la envolvente deseada solo
conduce al estiramiento en el tiempo la misma energía que alimenta al tweeter,
resultándole mismo calentamiento si la longitud del tiempo es más pequeña que la
constante de capacidad térmica de la bobina. Mediciones acústicas de salas con largos
sweeps (muchos segundos) son también una ventaja si el tweeter no sólo es amenazado
por sobrecalentamiento, también por daño mecánico causado (por ejemplo, fuerzas
excesivas en la compresión de los drivers). La distorsión reducida debido al nivel
inferior puede también ser una motivación, aunque esta es la gran ventaja de medición
con sweeps donde la distorsión producida puede ser separada de la actual respuesta
impulsiva.
Otra aplicación de los sweeps con decremento controlado de la envolvente en altas
frecuencias es la medición de grabadoras de cinta análoga. La envolvente puede ser
adaptada a la curva de saturación que depende de la frecuencia en la cinta analógica de
la grabadora, permitiendo así el uso óptimo del rango dinámico de la cinta en todas las
frecuencias. De ésta manera, una aparente caída de la respuesta de frecuencia donde el
nivel obtenidos cercanos al límite de saturación son obviados. En grabadores de cintas
de casetes compactos con su estrecho y muy lento avance, el decremento necesario de la
envolvente puede alcanzar 20 dB o más, dependiendo del material de la cinta. La curva
de saturación de ésta misma puede ser determinada por la deliberada alimentación con
un sweep de excesivo nivel que cause saturación en todas las frecuencias. La distorsión
producida es removida de la respuesta impulsiva y el espectro que queda de esta
respuesta impulsiva es una buena estimación de la dependencia de la frecuencia a
máximo nivel de entrada para mediciones y grabaciones.
4.5
Sweep de dos canales con ecualización de altavoz y funcionalidad
de crossover
En muchas mediciones acústicas, son empleados altavoces multivía para cubrir lo más
posible el rango audible. Por ejemplo, un dodecaedro omnidireccional usualmente
exhibirá una pobre respuesta bajo 200 Hz aproximadamente, dependiendo de su tamaño.
De esta manera, es una ventaja apoyarlo con un subwoofer para evitar la necesidad de
excesivo pre-énfasis. Un diseño normal de caja cerrada o vented con un chasis será lo
suficientemente omnidireccional en este rango de frecuencias. Como todas las tarjetas
de sonido y algunos sistemas de medición están equipados con conversores estéreo, vale
la pena hacer uso de dos canales para incluir una activa funcionalidad de crossover en la
señal de excitación. Esto puede ser realizado con algunas extensiones del método de
generación de sweep descrito en la sección 4.3 y 4.4.
Primero que todo, como en cualquier tarea de ecualización, es necesario medir ambos
altavoces en la misma posición para establecer la magnitud, fase y relación de retardo
válida. Teniendo en mente las capacidades de manipulación de la potencia del altavoz y
acorde a su magnitud de respuesta, un punto apropiado de crossover puede ser
seleccionado. En esta frecuencia la diferencia de la fase y del retardo de grupo entre
ambos espectros es leída y almacenada. Ellas serán necesarias más tarde. Ahora,
después de una suavización opcional, ambos espectros son invertidos y tratados con un
filtro pasa banda para confinarlos a ellos al deseado rango de frecuencia a ser barrido
(ver figura 20). En este punto, un énfasis deseado adicional es también aplicado al
espectro estéreo. Debe ser diseñada ahora la envolvente de frecuencia controlada. Tiene
que ser ejecutado ahora una división por la envolvente del espectro deseado. Después de
estos pasos de preparación, la función crossover debe ser traída al juego mediante la
multiplicación del primer canal con un filtro pasa bajos y el segundo con el
correspondiente filtro pasa altos.
Fig. 20: Procesamiento para la generación de sweep de dos canales y funcionalidad de
crossover activo.
Fig. 21: Procesamiento adicional para sweep de dos canales. Aplicación de ventana a la IR,
retardo de grupo sintetizado, ajuste de fase y retardo entre canales, fade in/out al sweep.
Fig. 22: Creación de archivo de referencia mediante la deconvolución del sweep de dos
canales emitido por un parlante de dos vías.
Un opcional efecto de suavización (con ancho constante en escala lineal de frecuencia)
puede ser obtenido por la aplicación de una ventana a la respuesta impulsiva de ambos
espectros. Para este propósito, ambos son transformados al dominio del tiempo después
de suprimir su fase. La ventana deseada es aplicada y la respuesta al impulso confinada
es transformada devuelta al dominio de la frecuencia (ver figura 21). La ventana no
debe ser demasiado estrecha para evitar enturbiar o nublar el detalle de baja frecuencia.
Ahora el sweep de dos canales puede ser creado por la formulación de la ya conocida
relación entre la magnitud ajustada y el incremento del retardo de grupo. Pero en vez de
usar solo un canal, la magnitud ajustada de ambos canales tiene que ser añadida aquí
para permitir el crecimiento del valor del retardo de grupo:
2
τ G ( f ) = τ G ( f − df ) + C ⋅ ∑ H ( f )
2
(13)
Ch =1
Así mismo, C es calculado usando la suma de la energía total de ambos canales:
C=
τ G ( fend ) − τ G ( fstart )
2
fs / 2
∑ ∑ H( f )
Ch =1 f =0
2
(14)
Como la frecuencia instantánea deberá ser la misma para ambos canales, la síntesis del
retardo de grupo tiene que ser desarrollado solo una vez y la fase resultante puede ser
copiada en el segundo canal. Si se diseñara la señal de excitación con una envolvente
controlada por la frecuencia, este espectro de dos canales tiene que ser multiplicado por
la envolvente del espectro después de convertir la magnitud y el sintetizado retardo de
grupo a su normal representación real/imaginaria.
La IFFT arrojara un sweep de dos canales que primero se deslizara a través de las bajas
frecuencias en un canal y entonces las frecuencias restantes en el otro canal, La suma de
ambos canales tendrá la deseada envolvente, mientras la relación de sus amplitudes en
cada frecuencia instantánea corresponde a la relación establecida en el dominio
espectral.
En la región de cruce, que no puede ser hecha indefinidamente estrecha debido a la norepetitiva naturaleza del sweep, ambos canales interfieren. Mientras ellos están en fase
en la síntesis de la señal de excitación de dos canales, ellos usualmente no pueden llegar
en fase al micrófono cuando son emitidos sobre dos altavoces. Así una corrección
retardo/fase es necesaria para evitar perdidas de nivel de presión sonora en la región de
cruce. Este es el por qué la relación de la fase y el retardo de grupo de la respuesta de
los altavoces debe ser almacenada previamente. Esta información puede ahora ser
utilizada para desplazar la señal para el altavoz con el menor retardo de grupo al
derecho por la diferencia en los tiempos de llegada. Esto puede ser logrado mejor aún en
el dominio espectral por la suma del apropiado retardo de grupo. Las fases recibidas en
el punto de cruce pueden ser traídas en acuerdo mediante la suma o resta de pequeños
adicionales retardos de grupo a uno de los canales.
Es discutible que podría ser más ventajoso, si ruidos de dos canales o sweeps con “dos
voces” cubriendo independientemente ambos rangos de frecuencia al mismo tiempo,
como estos permiten drenar la energía a ambos altavoces sobre el período entero de la
medición. Sin embargo, solo un sweep de “una voz” permite descartar adecuadamente
los productos de la distorsión de la IR recuperada. Por otra parte la señal estereo puede
alimentar con mucho mayor nivel, lo que compensa la desventaja del tiempo de emisión
restringido en vías individuales.
Obviamente, el espectro de referencia necesario para deconvoluir la señal de excitación
recibida no puede ser creado realizando la usual referencia eléctrica de medición.
Haciendo esto, la ecualización del altavoz cuidadosamente introducida podría
desaparecer en el resultado final. La única manera viable es construir el espectro de
referencia por una simulación descrita en la fig.22. Primero, la excitación de dos canales
anteriormente generada es transformada al dominio espectral. Allí es multiplicada con la
respuesta del altavoz y la respuesta del sistema de medición. Esta última puede incluir la
respuesta del camino eléctrico de la señal (conversores, amplificador de potencia,
preamplificador de micrófono) y la respuesta del micrófono, que podría no ser
suficientemente plana. Después de estas operaciones, ambos canales son sumados
produciendo una simulación del espectro del nivel de presión en la posición del
micrófono (coloreado por la respuesta del camino de recepción). Este espectro es ahora
invertido para negar el retardo de grupo y neutralizar el pre-énfasis escogido, si es que
fue aplicado. Al invertir el espectro podría producir un énfasis excesivo en frecuencias
fuera del rango seleccionado de transmisión, es indispensable una multiplicación con un
filtro pasa banda de aproximadamente la misma frecuencia usada en las etapas de preprocesamiento (fig.20). Para silenciar el ruido efectivo fuera de las bandas, el orden del
filtro pasa banda debe ser un tanto mayor que el usado en el pre-procesamiento. La
aplicación de este inevitable filtro pasa banda es un paso crítico, lo que significa que son
los resultados acústicos de la medición convoluida con su respuesta del impulso. Los
efectos resultantes pueden ser un poco inquietantes. Por ejemplo, usando un filtro pasa
banda con fase lineal obviamente produciremos un pre-ringing de la IR recuperada de la
sala. Para efectos de auralización esto es indeseado. En este caso, es más aconsejable
usar un filtro IIR de fase mínima. Por otro lado, un filtro pasa banda de fase lineal puede
inducir menos errores en las clásicas evaluaciones de parámetros acústicos de sala. En
cualquier caso, el orden del filtro debe ser lo más moderado posible, para mantener la
IR del filtro lo suficientemente estrecha.
Generalmente, estas consideraciones se aplican a cualquier medición de acústica de
salas de banda ancha. Al menos, la técnica de pre-ecualización activa presentada aquí
permite obtener la IR de la sala libre de coloración por mediciones de altavoces y
presenta una alta relación S/R independiente de la frecuencia.
5 MEDICIÓN DE DISTORSIÓN
Anteriormente se ha mostrado que los productos de la distorsión armónica pueden ser
eliminados completamente de la IR obtenida cuando la medición es hecha usando
sweeps. En mediciones de acústica de salas, usualmente estas son removidas si el
altavoz no es el objeto de medición. Sin embargo, en mediciones de altavoces, es muy
interesante asociarlas con la fundamental para evaluar el porcentaje de distorsión
dependiente de la frecuencia. Esto puede ser hecho separadamente para cada armónico,
como propone Farina [2]. Para describir la técnica, la fig. 23 muestra el retardo de grupo
de un sweep logarítmico y sus primeros cuatro armónicos y la figura 24 muestra la
distribución tiempo-frecuencia de la energía de una señal con similar distorsión.
Fig 23: Retardo de grupo de a) fundamental (línea superior) y los primeros cuatro
armónicos, b) archivo de referencia, c) sweep deconvolucionado con armónicos, d)
posición de los armónicos en la respuesta impulsiva.
Fig.24: Diagramas Tiempo-Frecuencia de un sweep logarítmico y armónicos (izquierda) la
IR (derecha).
Obviamente, para una determinada frecuencia de la fundamental, todos sus
correspondientes armónicos tienen el mismo retardo de grupo. En el ejemplo, la
fundamental del sweep llega a 400 Hz después de 2 segundos. Por lo tanto, el armónico
de 2° orden intersecta la línea de 2 segundos en 800 Hz, el 3° en 1.2 kHz
sucesivamente. Concentrándonos en una frecuencia específica en el diagrama, los
armónicos que intersectan esta línea vertical tienen un retardo de grupo menor que la
fundamental del sweep, como por supuesto ellos pertenecen a fundamentales con
menores frecuencias que han sido “sweepeados” anteriormente. Multiplicando las
curvas con el espectro de referencia (que es, restar el retardo de grupo de la
fundamental) conduce a removerlos a tiempos negativos mientras la fundamental queda
en t = 0 s, como se desea.
Sólo en el caso de sweeps logarítmicos, los armónicos presentarán un retardo de grupo
constante independiente de la frecuencia después de la aplicación del espectro de
referencia. Podrían ser usados otros retardos de grupo, pero requeriría el uso de un
espectro de referencia separado de cada armónico para convertirlas en líneas rectas. Sin
embargo, la distancia entre los componentes de los armónicos individuales podría no ser
independiente de la frecuencia. Así un sweep logarítmico es preferible como señal de
excitación, ecualizando el que ya ha sido usado desde hace mucho tiempo en el antiguo
sistema grabador de nivel (1.1).
Una IFFT del espectro deconvoluido produce la actual IR en el borde izquierdo y un par
de “armónicos de la IR” (harmonic impulse response, HIR) en tiempo negativos cerca
del borde derecho, con la HIR de 2° orden situado en a la derecha y las HIR de mayor
orden siguiendo de derecha a izquierda. Esta distancia entre ellos puede ser calculada
por:
DitsHIR − AB =
ld ( ord A / ord B )
sweep _ rate [oct / s ]
(15)
Para evaluar la fracción de distorsión dependiente de la frecuencia, la señal en el tiempo
es separada en la fundamental de la IR y cada HIR mediante ventanas. Cada uno de la
HIR aislada es enviado a FFT por separado. El largo del bloque de FFT usado puede ser
mucho menor que el usado para la deconvolución inicial de la respuesta del sweep, por
esta razón se aumenta la velocidad de todo el proceso. Para relacionar los contenidos de
frecuencia de un espectro de HIR con la fundamental, se realiza una operación de
cambio acorde al orden del armónico específico. Por ejemplo los componentes
espectrales de la HIR de 5° orden son cambiados horizontalmente a un quinto de su
frecuencia original. Después de esta operación, el espectro cambiado puede ser dividido
en la fundamental produciendo la fracción de distorsión dependiente de la frecuencia
(ver fig. 25).
Podría ser aplicada una corrección de −10log(orden del armónico) para compensar el
énfasis de las frecuencias altas impuesto por el espectro de referencia.
Sorprendentemente, como han expuesto muchos experimentos, esta operación ha de ser
omitida para permitir corregir los resultados.
Fig.25: Etapas de procesamiento de señal para la evaluación de la función de transferencia
y armónico de segundo orden con sweep logarítmico.
Comparado el estándar de excitación de un tono (single tone) y el análisis con
incrementos de frecuencia fija, este método es mucho mas rápido y usualmente
establece una mayor resolución de frecuencia, a menos en el rango de medias y altas
frecuencias. Sin embargo, no se pueden negar algunas desventajas. Primero que todo, la
medición es restringida a ambientes anecoicos, a menos que se usen sweeps muy largos.
Mucha reverberación en el sitio de medición podría conducir a ensuciar los distintos
armónicos de la IR por componentes retrasados, impidiendo así su separación. Esto
ciertamente es un defecto esencial, como el fuerte de las mediciones de IR es
precisamente la habilidad de rechazar reverberación, con tal que el desfase entre sonido
directo y la primera reflexión sea suficientemente largo.
Existen otros problemas relacionados con el uso de ventanas para separar la HIR
individualmente. Por supuesto, todos los problemas usuales asociados con el uso de
ventanas aplicadas [33]. En particular, la elección del tipo de ventana constituye un
compromiso entre el ancho del lóbulo principal, mainlobe width (equivalente a la
resolución espectral) y la supresión del lóbulo lateral, sidelobe suppression. Para evitar
una pérdida de energía y una subsiguiente subestimación de los componentes de
distorsión que no están exactamente situados bajo la parte superior de la ventana, se usa
una ventana Tukey-style [33]. Sin embargo este tipo de ventana presenta una pobre
sidelobe supresión, de ventana rectangular de sólo 21 dB. Esto puede llevar a rellenar
con señal artificial aquellas regiones de frecuencias en cuales la distorsión cae a valores
muy bajos. El suavizado espectral causado por cualquier ventana es constante en una
escala lineal de frecuencia. En la usual visualización logarítmica, esto significa que la
resolución espectral llega a ser extremadamente alta en altas frecuencias, mientras
posiblemente existan detalles deficientes en el final bajo del espectro de distorsión. Si se
desea una mayor resolución, el sweep debe ser hecho mas largo para espaciar la HIR,
así permitiendo el uso de ventanas anchas.
El ancho de ventana disminuye según la ecuación (15) para separar las HIR de alto
orden. Esto conlleva a reducir la resolución del correspondiente espectro de distorsión.
Sin embargo, cuando se comprime a la derecha para relacionar con su fundamental, la
resolución queda mayor que la HIR de menor orden. En la práctica, la resolución
deseada para armónicos de 2° orden al final del rango de transmisión del altavoz
determina la razón del sweep y por lo tanto el largo de la señal de excitación.
Fig.26: Comparación de armónico de 2do orden adquirido con un sweep (izquierda) y
tradicional prueba de tonos puros en incrementos de 1/24 octava (derecha).
Otro problema de la detección rápida de la distorsión es la falta de relación S/R,
especialmente para armónicos de mayor orden que usualmente tienen bajos niveles.
Mientras que el método de tonos puros resulta en bastante energía en la fundamental y
sus armónicos, la técnica de sweeps dispersa la energía continuamente sobre todo el
rango de frecuencias. Este es el porque la distorsión del espectro para armónicos de alto
orden tiende a ser bastante ruidoso, esencialmente en altas frecuencias. Para aliviar este
problema, es bueno extender el sweep a un largo incluso mayor del necesario para
obtener la resolución espectral deseada. Las ventanas pueden ser más angostas de lo
necesario para aislar la HIR, de este modo rechazando el ruido de fondo que queda entre
ellas.
Finalmente, incluso cuando se toman todas las precauciones para garantizar una alta
precisión en la medición, es innegable que a veces, pueden ocurrir diferencias
inexplicables entre el método de steady tone y el sweep en algunas regiones de
frecuencia. La fig 26 muestra un ejemplo de tal diferencia. Entre 1.3 y 1.7 kHz, el
armónico de 2° orden obtenido con ambos métodos es bastante diferente. Las razones
para estas diferencias no son obvias, quizás diferentes temperaturas de la bobina del
altavoz pueden jugar un papel importante. Después de todo, el método de stepped tone
toma mucho más tiempo y por lo tanto produce un aumento de temperatura en la
bobina.
A pesar de estas incertezas, las pruebas de distorsión basadas en sweep son muy
atractivas, ya que estas son mucho más rápidas que las convencionales con tonos puros.
En pruebas de producción esto no solo permite un chequeo rápido, además permite
comprobar el 100% de la producción, incluso si la mercadería es una producción masiva
económica.
6 CONCLUSIONES
Las técnicas de FFT usando sweeps como señal de excitación es la opción más
ventajosa para casi todas las situaciones de medición de función de transferencia.
Permite alimentar el DUT con mayor potencia con un factor de cresta un poco mayor de
3 dB y son bastante tolerantes contra las variaciones de tiempo y distorsión. Escogiendo
un largo de sweep adecuado permite eliminar todos los productos de distorsión.
Además, estos se pueden clasificar en armónicos dependientes de la frecuencia,
permitiendo un análisis completo y bastante rápido para todo el rango de frecuencia
conjuntamente con la evaluación de la función de transferencia.
Cuando el propósito es capturar respuestas impulsivas para auralización, no hay
alternativa a los sweeps: El alto rango de 90 dB requerido para este propósito no puede
ser obtenido con MLS o mediciones de ruido. Pero incluso en las mediciones RT
estándar que no requieren un gran rango dinámico, los sweeps son favorables ya que
ayudan a aumentar el rango dinámico hasta 15 dB comparado con mediciones basadas
en MLS, usando el mismo amplificador, altavoz y largo de medición. Así existen pocos
puntos favorables mediante el uso de MLS. Incluso su característica de ahorrar memoria
y tiempo de procesamiento ha perdido completamente relevancia con la tecnología
computacional actual.
Desde el punto de vista de un programador, no incluir la generación de MLS y la
transformada de Hadamard, es un ahorro de tiempo de desarrollo de un software de
medición.
Aunque obtener funciones de transferencia con MLS puede ser matemáticamente
elegante, los autores piensan que el uso de sweeps es elegante desde un punto de vista
de la teoría del sistema y señales. Además midiendo con sweeps es más natural.
Después de todo, los murciélagos no emiten MLS para hacer su perfil acústico.
7 AGRADECIMIENTOS
El trabajo ha sido apoyado por el Consejo Nacional de Brasil para desarrollo científico y
tecnológico (CNPq). Ha sido patrocinado durante seis meses en el laboratorio de
acústica de INMETRO de uno de los autores. Mientras el estudio inicial no fue
exactamente propuesto para el desarrollo de tecnología de medición, muchas de las
ideas respecto a mediciones con sweep se desarrollaron y han sido probadas en este
período, gracias al intenso intercambio de ideas de los dos autores.
Los autores agradecen muchísimo a Jaime Undurraga Lucero y Mauricio Uribarri, dos
ingenieros que acabaron de formarse en la Universidad Perez Rosales, Santiago de
Chile. Los dos no midieron esfuerzos, no solo por traducir todo esto texto muy largo,
mas también porque pusieron en practica los conceptos presentados, desarrollando los
“Macaquitos das Janelas” (MJ), un programa sofisticado de mediciones de función de
transferencia que genera y utiliza sweeps.
8 REFERENCIAS
[1] David Griesinger, “Beyond MLS – Occupied Hall Measurement with FFT
Techniques”, J.AES, vol. 44 p. 1174 (abstract), 101st AES convention, preprint 4403
[2] Angelo Farina, “Simultaneous Measurement of Impulse Response and Distortion
with a Swept-sine technique”, J.AES, vol. 48, p. 350, 108th AES Convention, Paris
2000, Preprint 5093
[3] Richard C. Heyser, “Acoustical Measurements by Time Delay Spectrometry”,
J.AES, vol. 15, 1967, pp. 370-382
[4] Richard C. Heyser, “Loudspeaker Phase Characteristics and Time Delay
Distortion”, J.AES, vol. 17,1969, pp. 30-41
[5] Richard C. Heyser, “Determination of Loudspeaker Signal Arrival Times, Parts
I,II & III”, J.AES, 1971, pp. 734-743, pp. 829-834, pp. 902, or AES Loudspeakers
Anthology, vol. 1–25, pp. 225
[6] AES / Richard C. Heyser, “Time Delay Spectrometry - An Anthology of the
Works of Richard C. Heyser”, AES, New York 1988
[7] John Vanderkooy, “Another Approach to Time-Delay Spectrometry”,
J.AES, vol. 34, July 1986, pp. 523-538
[8] Richard Greiner, Jamsheed Wania, Gerardo Noejovich, “A Digital Approach to
Time Delay Spectrometry”, J.AES, vol. 37, July 1989, pp. 593-602
[9] Peter d’Antonio, John Konnert, “Complex Time Response Measurements Using
Time-Delay Spectrometry (Dedicated to the late Richard C. Heyser)”, J.AES, vol. Vol.
37, September 1989, pp. 674-690
[10] Henrik Biering, Ole Z. Pederson, “Comments on ‘Another Approach to TimeDelay Spectrometry” and author’s reply, J.AES, vol. 35,March 1987, pp. 145-146
[11] Henrik V.Sorensen, Douglas L. Jones, Michael T. Heideman, Sidney Burrus,
”Real-valued Fast Fourier Transform Algorithms”, IEEE Trans. Acoustics , Speech,
Signal Proc., June 1987, p. 849
[12] Johan Shoukens, Rik Pintelon, “Measurement of Frequency Response Functions
in Noise Environments”, IEEE Trans. Instrumentation and Measurement, December
1990
[13] Douglas D. Rife & John Vanderkooy, “Transfer Function Measurement with
Maximum-Length Sequences”, J.AES, vol. 37,June 1989, pp.419-444
[14] Johan Shoukens, Rik Pintelon, Yves Rolain, “Broadband versus Stepped Sine
FRF Measurements”, IEEE Trans. Instrumentation and Measurement, April 2000, No.2
[15]
J.M.
Berman,
L.R.
Fincham
The Application of Digital Techniques to the Measurement of Loudspeakers
J.AES, vol. 25, 1977, pp. 370-384, or AES Loudspeakers Anthology, vol. 1-25, p. 436
[16] Chris Dunn, Malcom Omar Hawksford, “Distortion Immunity of MLS-Derived
Response Measurements”, J.AES May 1993, pp. 314
[17] L.R. Fincham, “Refinements in the Impulse Testing of Loudspeakers”, J.AES,
vol. 41, March 1985, pp. 133-140
[18] F.J.MacWilliams, N.J.A.Sloane, “Pseudo-Random Sequences and Arrays”,
Proc.IEEE, 1976, vol.84, p. 1715
[19] Thomas W. Parks, James H. McClellan, Lawrence R. Rabiner, “A Computer
Program for Designing Optimum FIR Linear Phase Digital Filters”, IEEE Trans. Audio
Electroacoustics, 1973, p. 506
[20] E.D. Nelson, M.L. Fredman, “Hadamard Spectroscopy”, J.Opt. Soc. Am., 1970,
pp.1664
[21] H.Alrutz & Manfred R. Schroeder, “A Fast Hadamard Transform Method for
the Evaluation of Measurements using Pseudorandom Test Signals”,
Proc. 11th ICA, Paris 1983, pp. 235
[22] Jeffrey Borish & J. Angell, “An Efficient Algorithm for Measuring the Impulse
Response Using Pseudo-Random Noise”, J.AES, vol. 33, 1983, pp. 478-488
[23] Jeffrey Borish, “Self-Contained Crosscorrelation Program for Maximum Length
Sequences”, J.AES, vol. 33, 1985, pp. 888-891
[24] Manfred R. Schroeder, “Integrated –Impulse Method for Measuring Sound
Decay without using Impulses”, J.ASA, 1979, p. 497
[25] Eckard Mommertz, Swen Müller, “Measuring Impulse Responses with
Preemphasized Pseudo Random Noise derived from Maximum Length Sequences.”,
Applied Acoustics, 1995, vol.44, p. 195
[26] Jeffrey Borish, “An Efficient Algorithm for Generating Colored Noise Using a
Pseudorandom Sequence”, J.AES, vol. 33, March 1985, pp. 141-144
[27] Michael Vorländer, Heinrich Bietz, „Der Einfluß von Zeitvarianzen bei
Maximalfolgenmessungen“, DAGA, 1995, p. 675
[28] Michael Vorländer, Malte Kob, “Practical Aspects of MLS Measurements in
Building Acoustics”, Applied Acoustics, vol.52, p. 239
[29] Peter Svensson, Johan L. Nielsen, “Errors in MLS Measurements Caused by
Time Variance in Acoustic Systems”, J.AES, vol. 47, November 1999, pp. 907
[30] C. P. Jane and A. J. M. Kaizer, “Time-Frequency Distributions of
Loudspeakers: The Application of the Wigner Distribution”, J.AES, vol. 31, April 1983,
pp. 198-223
[31] D. B. Keele Jr., „Low-Frequency Loudspeaker Assessment by Nearfield SoundPressure-Measurements”, J.AES, vol. 22, 1974, pp. 154-162, or AES Loudspeakers
Anthology, vol. 1-25, p. 344
[32] John Vanderkooy, Stanley Lipshitz, Robert Wannamaker, “Minimally Audible
Noise Shaping”, J.AES, vol. 39, 1991, pp. 836-852
[33] Fredric J.Harris, “On the Use of Windows for Harmonic Analysis with the
Discrete Fourier Transform”, Proc. IEEE, January 1978, p. 51
[34] John S. Bradly, “Optimizing the Decay Range in Room Acoustics
Measurements using Maximum-Length-Sequence Techniques”, J.AES, vol. 44, pp. 266273, April 1996.
[35] Nobuharo Aoshima, “Computer-generated pulse signal applied for sound
measurement”, J.ASA, May 1981, p. 1484
[36] Yôiti Suzuki, Futoshi Asano, Hack-Yoon Kim, Toshio Sone, “An optimum
computer-generated pulse signal suitable for the measurement of very long impulse
responses”, J.ASA, February 1995, p. 1119
9 BIBLIOGRAFÍA
[37] A.J. Berkhout, D. de Vries, M. M. Boone, “A New Method to Acquire Impulse
Responses in Concert Halls”, J.ASA, 1980, p. 179
[38] A.J. Berkhout, M.M. Boone, C. Kesselman, “Acoustic Impulse Response
Measurement: A New Technique”, J.AES, vol. 32, October 1984, pp. 740-746
[39] John D. Bunton, Richard H. Small, “Cumulative Spectra, Tone Bursts, and
Apodization”, J.AES, vol. 30, June 1982, pp. 386-395, or AES Loudspeakers Anthology,
vol. 26-31, p. 322
[40] Richard C. Cabot, “Audio Measurements”, J.AES, vol. 35, June 1987, pp. 477500
[41] Angelo Farina, “Non-Linear Convolution: A New Approach for the Auralization
of Distorting Systems”, presented at the 110th Convention of the AES, Amsterdam, 2001
May.
[42] Panagiotis D. Hatziantoniou, John N. Mourjopoulos, „Generalized FractionalOctave Smoothing of Audio and Acoustic Responses“, JAES, vol. 48, pp. 259-280
[43] Paul S. Kovitz, “On the Repeatability of TDS Energy-Time Curve and MLS
Impulse Response Measurements”, Sabine Centennial Symposium, 127th ASA
Convention, June 1994, p. 129
[44] Stanley P. Lipshitz, Tony C. Scott, John Vanderkooy, “Increasing the Audio
Measurement Capability of FFT Analyzers by Microcomputer Postprocessing”, J.AES,
vol. 33, 1985, pp. 626-648
[45] Anders Lundeby, Tor Erik Vigran, Heinrich Bietz, Michael Vorländer,
“Uncertainties of Measurements in Room Acoustics”, Acustica, 1995, p. 344
[46] Eckard Mommertz, „Mobiles
Raumimpulsantworten“, DAGA, 1990, p. 843
Meßsystem
zur
Aufnahme
von
[47] Johan L. Nielsen, “Improvement of Signal-to-Noise Ratio in Long-Term
Measurements with High-Level Nonstationary Disturbances”, J.AES, 1997, vol. 45, pp.
1063-1066
[48] E.P. Palmer, R.D. Price, S.J. Burton, “ Impulse-response and transfer-function
measurements in rooms by m-sequence cross correlation”, J.ASA, 1986, Vol. 80, p. 56
[49] M. Poletti – “Linearly swept frequency measurements, time-delay spectrometry,
and the Wigner distribution” – J.AES, vol. 36, 1988 June, pp. 457-468
[50] Douglas Preis, Voula Chris Georgopoulos, “ Wigner Distribution
Representation and Analysis of Audio Signals: An Illustrated Tutorial Review”, J.AES,
December 1999, pp. 1043-1053
[51] Allan Rosenheck, Kurt Heutschi, “Tone Bursts for the Objective and Subjective
Evaluation of Loudspeaker Frequency Response in Ordinary Rooms”, J. AES, vol. 47,
April 1999, pp. 252-255
[52] Johan Schoukens, Rik Pintelon, Edwin van der Ouderna, Jean Renneboog,
“Survey of Excitation Signals for FFT based Signal Analyzers”, IEEE Trans.
Instrumentation and Measurement, September 1988, p. 342
[53] Johan Shoukens, Yves Rolain, Rik Pintelon, “Improved Frequency Response
Measurements for Random Noise Excitations”, IEEE Trans. Instrumentation and
Measurement, February 1998, No.1, p. 332
[54] Manfred R. Schroeder, “Number Theory in Science and Communication
Springer Verlag Berlin Heidelberg New York Tokyo, 1986
[55] Manfred R. Schroeder, “Synthesis of Low-Peak-Factor Signals and Binary
Sequences with Low Autocorrelation”, IEEE Trans. Info. Theory, 1970, p. 85
[56] Christopher J. Struck, Steve F. Temme, “Simulated Free Field Measurements”,
J.AES, vol. 42, 1994, pp. 467-482
[57] Michael Vorländer, “Application of Maximum Length Sequences in Acoustics”,
17° Encontro da Sociedade Brasileira de Acústica (SOBRAC), December 1996, p. 35
[58] Xiang-Gen Xia, “System Identification Using Chirp Signals and Time-Variant
Filters in the Joint Time-Frequency Domain”, IEEE Trans. Signal Proc., August 1997,
p. 2072
[59] Edgar Villchur, “A Method for Testing Loudspeakers with Random Noise
Input”, AES Loudspeakers Anthology, vol. 1-25, p. 96
[60] John Vanderkooy, “Aspects of MLS measuring systems”, JAES, vol. 42, April
1994, p. 219
[61] Douglas D. Rife, “Comments on “Distortion Immunity of MLS D. Rifed
Impulse Response Measurements” and author’s reply, J.AES, June 1994, p. 490
[62] Won-Jin Kim and Youn-Sik Park, “Non-Linearity Identification and
Quantification Using an Inverse Fourier Transform”, Mechanical Systems and Signal
Processing 1993 7(3) pp. 239-255
[63] G.R. Tomlinson, “Developments in the Use of the Hilbert Transform for
Detecting and Quantifying Non-Linearity Associated with Frequency Response
Functions,, Mechanical Systems and Signal Processing 1987 1(2), pp. 151-171
[64] Guy-Bart Stan, Jean Jaques Embrechts and Dominique Archambeau,
“Comparison of Different Impulse Response Measurement Techniques”,
J.AES, April 2002, pp. 249-262
Descargar