Efectos de sonido: Delay

Empiezo con esta entrada una serie en la que, poco a poco, iremos hablando de los principales efectos de sonido utilizados en música.

Para empezar vamos a hablar del más sencillo de todos: el delay. Como su propio nombre indica, el delay consiste sencillamente en reproducir la señal de entrada junto con una versión retrasada y atenuada de sí misma, simulando así un eco real. Si lo representamos con un diagrama de bloques de esos que tanto nos gustan a los ingenieros, sería así:

La entrada pasa a través de un bloque que la retarda, después se le aplica una ganancia (se multiplica por un número), y se suma el resultado a la señal original de entrada. Existen dos parámetros de control en este efecto: el retardo introducido a la señal de entrada, y la ganancia aplicada a la señal retardada que posteriormente se sumará a la señal original. Jugando con ellos podemos obtener efectos muy distintos.

Por ejemplo, si la señal de audio original es la siguiente:

[audio http://enriquealexandre.es/wp-content/uploads/2010/04/original.mp3]

Si la procesamos por un delay con un retardo de 250ms y una ganancia de 1, el resultado será:

[audio http://enriquealexandre.es/wp-content/uploads/2010/04/delay1.mp3]

Sin embargo, si reducimos el valor del retardo a tan solo 40ms, el efecto es muy diferente:

[audio http://enriquealexandre.es/wp-content/uploads/2010/04/delay4.mp3]

En el primer caso se escucha el eco claramente diferenciado de la señal original, mientras que en el segundo ambas señales se mezclan, y no somos capaces de distinguirlas.

La razón de esto es la integración temporal del oído humano. Si dos sonidos nos llegan lo suficientemente juntos, los oiremos como uno solo. Por otra parte, si la distancia entre los dos sonidos es mayor de unos 80ms, entonces los escucharemos como dos sonidos independientes, obteniendo el clásico efecto de eco.

El problema de un esquema tan sencillo es que introducir un solo eco en la señal resulta demasiado simple, y no aporta demasiadas posibilidades. Es por ello que resulta muy común ver unidades de delay que incorporan un lazo de realimentación, como el mostrado en la siguiente figura:

Fijando la ganancia F a un valor menor de 1 (ya que en caso contrario el sistema se volvería inestable), es posible obtener una sucesión de ecos con amplitudes cada vez menores. Algo así como ECO ECo Eco eco….

Utilizando el mismo fichero de audio que antes, si ahora configuramos el delay para tener una realimentación con una ganancia de 0.8, lo que obtendremos será esto:

[audio http://enriquealexandre.es/wp-content/uploads/2010/04/delay2.mp3]

Si utilizásemos un valor mucho menor del retardo (30 ms, en el ejemplo siguiente), el resultado no tiene nada que ver:

[audio http://enriquealexandre.es/wp-content/uploads/2010/04/delay3.mp3]

Lo que obtenemos es un sonido con un timbre claramente metálico, y al efecto se le conoce normalmente como flutter echo.

Para terminar, y a modo de curiosidad, existen algunas configuraciones de delays que reciben nombres concretos en el mercado. Las más conocidas son:

  • Slapback: Un slapback no es más que un delay sin realimentación con un tiempo de retardo muy pequeño (entre 40 y 120 ms).
  • Eco: Un eco es un delay sin realimentación con un tiempo de retardo algo superior al del slapback (mayor de 120ms).
  • Ping-pong: Se trata de dos unidades de delay operando conjuntamente, que producen el resultado de un delay que se mueve entre el canal izquierdo y derecho.

Para los más frikis del lugar, que seguro que alguno hay, os dejo aquí un programa de Matlab para que podáis jugar con cada uno de los parámetros y ver los resultados.

¡Pregúntame!: ¿Por qué suenan tan alto los anuncios?

¿Por qué cuando estamos viendo la tele varía tanto el volumen de los anuncios al que había durante el programa?

Seguro que a todos nos ha pasado. Estás viendo la televisión, y cuando empieza un bloque de anuncios tenemos que bajar el volumen del televisor porque de repente está demasiado alto.

¿A que se debe esto? En realidad el sonido de los anuncios no está más alto, ya que el nivel maximo de las señales que se pueden transmitir está limitado por ley. La diferencia se debe a que cualquier señal de audio tiene una mezcla de niveles: hay partes fuertes y partes suaves. La combinación de ambas es lo que hace posible la aparición de muchos matices cuando escuchamos un sonido.

Pero los anunciantes no están interesados en estos matices, sino en captar tu atención. Por ello la señal de audio se procesa para hacer que las partes fuertes lo sigan siendo, y las partes más suaves suenen más alto. El resultado es que todo queda con un nivel alto, sin matices ni diferencias importantes entre las partes de la señal.

Lo que se consigue con esto es que, aunque el nivel máximo de las señales sea el mismo para el programa de TV que para los anuncios, el nivel medio (para ser estricto debería decir el nivel cuadrático medio) de los anuncios es muy superior al de los programas, y es éste el que nosotros percibimos con nuestros oídos. La diferencia es algo parecido a si alguien dispara un flash fotográfico frente a nosotros de vez en cuando, o si mantiene esa luz continuamente frente a nuestros ojos. Aunque el nivel máximo de brillo sea el mismo, nuestra experiencia es totalmente distinta en un caso y en el otro.

El equipo responsable de este procesado se llama compresor, y no debe confundirse con los mp3 (cuyo nombre adecuado sería codificadores de audio). Los compresores tienen multitud de aplicaciones en el procesado de sonido, en campos tan diversos como la producción musical, la radiodifusión, o incluso los audífonos digitales. Pero esto es otro cantar.

Como lo mejor para entender todo esto es escucharlo, vamos a ver un par de ejemplos. En primer lugar escucharemos una señal original, sin ningún tipo de procesado previo:

[audio http://enriquealexandre.es/wp-content/uploads/2010/05/SinComprimir.mp3]

Ahora vamos a escuchar esta misma señal tras haber sido procesada. He exagerado al máximo el efecto, aunque siempre manteniendo el valor máximo de la señal sin cambios:

[audio http://enriquealexandre.es/wp-content/uploads/2010/05/Comprimido.mp3]

Aquí se pueden ver las dos señales de audio, donde se puede ver lo que comentábamos antes: la señal original tiene partes con un nivel más alto y otras partes cuyo nivel es mucho más bajo, mientras que en la señal procesada todo tiene un nivel alto. Hemos perdido muchos de los matices debidos a estos cambios de nivel, pero si lo que nos interesa es sencillamente captar la atención, ésta segunda señal suena mucho más alto que la original.

¿Tienes más preguntas? ¡Pregúntame!

(Foto: www.fugitivesounds.net)