Blog autor

Blog Javier Castellanos

Tribuna de Salamanca

El sonido digital (I)

Empiezo esta serie de post que durarán unas cuantas semanas sobre cómo es y cómo entender el sonido digital.Me encanta la música. Recuerdo en mi casa multipistas, cartuchos, vinilos, cassettes, todos los formatos de almacenamiento de sonido que he conocido desde los años 70 y que ahora suenan a museo.

La música cambió con la llegada del mundo digital. Durante años el rey de lo digital fue el CD, con su calidad y detalle de sonido. Era sonido digital, perfecto decían algunos. Otros decían que como un vinilo no había nada.

El caso es que quiero dedicar este post a entender un poco cómo es el sonido digital, porque muchas veces hablamos de MP3 y demás formatos y conceptos sin entender bien lo que hay por detrás de todo eso.

El sonido es una señal analógica, una onda. Esto quiere decir que cualquier sonido, sea cual sea, debe transformarse para poder almacenarse o transportarse en un medio digital. La diferencia entre algo analógico y algo digital es que lo analógico tiene infinitos valores y lo digital los tiene bien definidos y finitos. El mejor ejemplo es el tiempo:

El tiempo en un reloj de manillas (analógico) tiene infinitos valores, podríamos ir al detalle y hacer un zoom ficticio y saber las €œmil-millonésimas€ de segundo en cada momento en función de la posición de una manilla. Sin embargo en un reloj digital despreciamos las partes del tiempo que no nos aportan nada ni nos son útiles (unidades por debajo del segundo) y hacemos una medición del tiempo concreta y finita: horas, minutos y segundos.

Esto mismo sucede con el sonido. El sonido se mide en Hercios (hz). A más hercios, más frecuencia tiene el sonido (las partes altas de una onda de sonido).

El ser humano es capaz de oír sonidos entre los 20Hz y los 20.000Hz (o lo que es lo mismo, 20Khz). Por debajo de los 20Hz están los infrasonidos (falete, psicofonías y cosas así ) y por encima de los 20.000Hz los ultrasonidos (y no me refiero a los cánticos del fondo sur del Bernabeu precisamente jejeje€Śqué jocoso he empezado el 2012).

Recapitulando: Ya tenemos ondas de sonido analógicas, con distinta frecuencia según la fuente que causa el sonido y que ahora habría que convertir a digital.

La voz humana, por ejemplo, está generada por un instrumento musical, nuestra faringe, y en concreto se mueve entre los 75hz y los 1050hz en función del tipo de voz. Lo cual nos deja mucho margen hasta los 20.000hz que somos capaces de reconocer.

Para convertir una onda sonora a digital se usa un teorema matemático que se llama €œTeorema de muestreo de Nyquist-Shannon€. Básicamente consiste en que para convertir una onda sonora analógica (y por tanto de infinitos valores) a una onda digital (y por tanto de valores finitos y conocidos) debemos tomar muestras de la onda cada X tiempo a fin de tener el sonido acotado.

Sería lo mismo que esos dibujos de los niños de unir puntos. Simplemente hay 40 puntos y luego cuando los unes con un lápiz aparece un dibujo completo a partir de unos pocos puntos. Lo mismo, pero aplicado al sonido.

Ahora la pregunta es clara:

ÂżCuántas veces hay que tomar la muestra por segundo en una onda de sonido para convertirla a digital y no perder calidad ni información de esa onda?

!Esta es la madre del cordero!

El teorema de Nyquist-Shannon nos dice que hay que tomar el doble de muestras de la frecuencia máxima del sonido que se quiere muestrear.

Esto quiere decir que para convertir en digital una onda sonora con la última canción de un grupo musical deberíamos cubrir toda la frecuencia que el oído humano es capaz de oír, para así no perder detalle o calidad de ningún instrumento. Como la frecuencia máxima que podemos oír es 20.000Hz, la frecuencia de muestreo debería ser, por lo menos, de 40.000 muestras por segundo. El standard del CD fue irse a 44.100 muestras por segundo, para cubrir márgenes de seguridad y meter alguna información adicional en la onda. Por tanto con 44.100 muestras por segundo podemos convertir en digital una onda sonora que tenga instrumentos que cubran todas las frecuencias del oído humano.

Obviamente si el sonido es más básico, como la voz humana o un tambor, la frecuencia del muestreo sería MUCHO más baja porque muestrear todo a 44.100 muestras por segundo sería un desperdicio de espacio en nuestros discos duros y no nos aporta calidad adicional.

Es importante saber que la conversión a digital mediante la toma de muestras en un sonido y en una imagen no tienen nada que ver. La diferencia fundamental y matemática, demostrada por el teorema que os he nombrado antes, es que:

- Una señal sonora, por su naturaleza senoidal y armónica (http://upload.wikimedia.org/wikipedia/commons/thumb/3/3d/OndaSenoidal.svg/340px-OndaSenoidal.svg.png), si tiene la cantidad mínima de muestras necesarias (ya vimos que son el doble de la mayor frecuencia de sonido que recoja la onda) recoge la onda de manera IDÉNTICA a la analógica, no perdemos nada. No es como en una imagen donde siempre se pierde información al muestrear (ejemplo del dibujo de puntos de los niños). Por tanto mayor frecuencia de muestreo no nos aportará mejor calidad.

Hasta aquí la primera parte de cómo hemos convertido un sonido analógico en uno digital. La semana que viene, como siempre, seguiremos informando.

Javier Castellanos
Twitter: @judicatario

Comentarios

Deja tu comentario

Si lo deseas puedes dejar un comentario: