¿Qué es un archivo MP3?

No puede haber hablado de audio y computadoras en ningún momento en los últimos 15 años y no haber oído hablar de un archivo MP3. Los archivos de audio MP3 y los sitios web, como el Napster original, iniciaron un cambio en cuanto a dónde, cómo y cuándo la gente adquiría música. Si está en el extremo más antiguo del espectro, como muchos de nosotros en la industria de la electrónica móvil, entonces compró sus CD, casetes y tal vez incluso su vinilo en una tienda de discos. Las computadoras e Internet cambiaron eso. Podrías conectarte a Internet después de cenar y descargar una copia ilegal de una canción en unos minutos. Estuvo mal, pero la gente adquirió decenas de millones de canciones de esta manera.

En la década de 1990 y principios de la de 2000, el acceso a Internet era lento. Empezamos a conectarnos a Internet mediante líneas telefónicas y módems. Cada byte de información tardó en transferirse a su computadora, por lo que cualquier cosa que acelere el proceso fue un placer. Descargar (robar) música a través de Internet es donde la popularidad del archivo de audio MP3 encontró su vocación.

Introducción al audio digital

Podríamos escribir 10 artículos sobre audio digital, y quizás lo hagamos. Por ahora, vamos a ver los conceptos básicos y usaremos el disco compacto (CD) como referencia. Los CD almacenan audio digital muestreado a 44,1 kHz con una resolución de 16 bits. Estos números significan que cada muestra puede tener una amplitud que es un valor único dentro de un rango de 65,536 niveles diferentes (2 a la potencia de 16). La información se muestrea 44.100 veces por segundo. El muestreo en lo que se conoce como 44.1/16 permite capturar el rango audible de audio (considerado de 20 Hz a 20 kHz) con buen detalle y precisión.

Para almacenar 1 segundo de audio a esta resolución, necesitamos almacenar 1 411 200 bits de información. Cualquiera que haya jugado con software de transcodificación de audio puede reconocer 1.411 kbps como una velocidad de datos estándar. Este número se calcula multiplicando el número de bits por muestra (16) por el número de muestras por segundo (44,100) por 2. El factor multiplicado por 2 se debe a que grabamos en estéreo, que son dos canales. Entonces, una canción de 3 minutos de duración tiene 254 016 000 bits o 31 752 000 bytes.

Vamos a redondearlo a 31 megabytes de información. ¿Te imaginas cuánto se tarda en descargar eso con un módem de acceso telefónico funcionando a 14.400 baudios? La respuesta es al menos 3,5 minutos, sin comprobación de errores, ruido de línea y otros factores que ralentizan el tiempo real de descarga a unos 5,5 minutos.

Compresión de datos

¿Qué pasaría si alguien encontrara una forma de reducir el tamaño del archivo de audio para acelerar el tiempo de descarga y reducir el uso del ancho de banda? La advertencia es que el audio todavía suena esencialmente igual en la mayoría de los sistemas de audio básicos, como un televisor, parlantes de computadora o una radio de automóvil de fábrica de la década de 1990. En 1991, un grupo de empresas, incluido el Instituto Fraunhofer, France Telecom, Philips, TDF e IRT, comenzó a trabajar en una forma de reducir el tamaño de los archivos manteniendo la información relevante. Esa es la clave de cómo se reduce el tamaño del archivo usando la compresión MP3.

El formato de archivo MP3 es un algoritmo de "compresión con pérdida". La compresión con pérdida significa que la información se desecha para reducir el tamaño del archivo. El equipo de desarrollo trabajó en un método de compresión llamado codificación perceptiva para decidir qué información eliminar. La codificación perceptiva se basa en cómo escuchamos los sonidos en relación con otra información y los límites de nuestra audición.

Qué archivos MP3 desechan

Vamos a analizar la información que eliminan los archivos MP3 para reducir el tamaño del archivo. Una de las formas más fáciles de reducir el almacenamiento de información es reducir la frecuencia más alta que se reproducirá. Si analizamos un archivo MP3 de 128 kbps, vemos que la frecuencia más alta reproducida está justo por debajo de los 16 kHz. Si esa fuera la única información que se eliminó, nuestra nueva tasa de bits con muestras de 16 bits en estéreo sería de aproximadamente 1 004 800 kbps en lugar de 1 411 200 kbps para 20,05 kHz.

La siguiente parte del proceso de compresión analiza el contenido que es común a ambos canales. Es común que algunas partes de una grabación estén virtualmente en mono. El proceso de codificación elimina la información duplicada del archivo y agrega código para copiar el canal opuesto. Si la pista de audio fuera puramente mono, el tamaño del archivo se dividiría en dos. Pocas pistas son completamente mono, pero podemos ver un mayor ahorro de espacio gracias a este proceso.

El procesamiento posterior analiza la información de bajo nivel durante los pasajes de gran amplitud. Usemos el ejemplo de una canción con mucho bajo y algo de información armónica de rango medio muy tranquila. Los procesos de codificación perceptiva como MP3 eliminarán esta información de bajo nivel de la pista de audio. Este proceso se denomina enmascaramiento de audio. Hay suficiente información de audio en otras frecuencias para distraerlo de escuchar lo que se eliminó.

¿Puedes oír la diferencia?

Docenas, no, cientos, de pruebas han comparado archivos MP3 con pistas de audio con calidad de CD. ¿Hay diferencias? Seguro que los hay. Una cosa se hizo evidente durante nuestra investigación:la forma en que se crea un archivo MP3 es crucial para su calidad de sonido subjetiva. Diferentes codificadores funcionan de diferentes maneras con diferentes resultados.

Quizás la mejor manera de describir la diferencia entre una grabación con calidad de CD y un archivo MP3 es ver la diferencia entre los dos. Ojalá pudiéramos compartir algunas muestras aquí para que las escuches, pero eso violaría las leyes de derechos de autor. Lo que podemos hacer es mostrarle visualmente la diferencia.

Tomamos una muestra de 3 segundos de "Give Life Back to Music" de Daft Punk. Elegimos esta pista debido al esfuerzo claro y consciente de Daft Punk de hacer que una versión de alta resolución del álbum esté disponible comercialmente. ¡Queremos agradecerles por eso! La muestra es de 31,5 segundos a 34,5 segundos en la canción.

Este espectrograma muestra el contenido de frecuencia de la muestra. La escala horizontal es el tiempo. La escala vertical es la frecuencia. Finalmente, la intensidad del color muestra la amplitud.

Puede ver que hay contenido de frecuencia de hasta 30 kHz, lo que demuestra claramente la naturaleza de alta resolución de esta pista. Cada banda de color vertical representa el ritmo de una caja de ritmos, más o menos.

Análisis de archivos MP3 de 128 kbs

Está claro que se ha eliminado la información de audio por encima de 16 kHz. El contenido de frecuencia infrasónica también es claramente diferente. Hay más información en el archivo MP3 por debajo de 30 Hz en comparación con el original. Sin embargo, este aumento en la información se presentará como un rango menos dinámico.

MP3 versus archivo original

Invertimos el archivo MP3 y lo agregamos a la muestra original para hacer la imagen que ves aquí. El resultado neto es la diferencia entre las dos pistas. Puede ver el contenido de alta frecuencia que se eliminó por encima de 16 kHz. De hecho, la información se eliminó en todas las frecuencias y esa información sigue el patrón de intensidad del archivo de audio.

El archivo original tiene una amplitud máxima de -0,1 dB para ambos canales y una amplitud promedio de alrededor de -14,2 dB. La información eliminada tiene un nivel máximo de -10,9 dB y una amplitud media de -37,01. La información eliminada está enterrada muy por debajo de la información de amplitud máxima.

¿Cómo suena el audio eliminado? Describiríamos el clip como el sonido de una banda de música distante. El audio es principalmente información de alta frecuencia. La pista también tiene una textura claramente distorsionada:los ritmos de la caja de ritmos son claros y presentes, pero suenan como golpes de platillos distorsionados.

Incluso con un preamplificador de auriculares de gama alta y auriculares de estudio, la diferencia es difícil de percibir cuando se cambia entre la pista original y el archivo MP3. En un entorno de escucha con un escenario de sonido más grande, puede ser más evidente.

Conclusiones sobre archivos MP3

Los puristas le dirán que debe tener las grabaciones de la más alta calidad disponibles. No hay culpa en esta lógica. ¿Por qué escatimar cuando puedes tenerlo todo? Los archivos MP3 de alta tasa de bits, como los de 320 kbps, por ejemplo, tienen una calidad excelente. Pruebas repetidas han demostrado que cuando se crea con algoritmos de compresión de calidad, la diferencia de sonido entre una grabación con calidad de CD y un archivo MP3 de 320 kbps es casi imposible de detectar. Los archivos MP3 con una tasa de bits más baja comienzan a disponer de más información y las diferencias aumentan.

Las últimas unidades fuente del mercado son capaces de reproducir archivos de audio WAV y FLAC de gran resolución y profundidad de bits. En breve, veremos unidades que reproducirán archivos MQA a través de conexiones digitales. Casi todas las fuentes manejarán archivos MP3 y WMA.

Visite hoy mismo su distribuidor local especializado en dispositivos electrónicos móviles y traiga algo de música para disfrutar. Creemos que quedará impresionado, independientemente del formato que elija.