¿Cómo reduce el formato de audio MP3 el tamaño de los datos?

MP3 logra su tamaño de archivo más pequeño en comparación con los formatos de audio sin comprimir como WAV o AIFF a través de un proceso llamado La compresión con pérdida . Esto significa que descarta algunos datos de audio que se consideran menos importantes para el oído humano. Aquí hay un desglose de las técnicas clave:

1. Modelo psicoacústico: Este es el núcleo de la compresión mp3. Se basa en cómo el oído humano percibe el sonido. El codificador analiza la señal de audio e identifica frecuencias y sonidos que probablemente sean enmascarados por sonidos más fuertes o que son menos perceptibles para nuestra audición. Estas frecuencias enmascaradas se comprimen o se descartan en gran medida. Por ejemplo, un sonido tranquilo de alta frecuencia reproducido simultáneamente con un fuerte sonido de baja frecuencia podría ser completamente inaudible, por lo que se elimina.

2. Transformación de frecuencia: La señal de audio se transforma desde el dominio del tiempo (amplitud con el tiempo) al dominio de frecuencia (amplitud de diferentes frecuencias). Esto generalmente se realiza utilizando una transformación de coseno discreta modificada (MDCT). Esta representación permite una identificación y manipulación más fácil de frecuencias individuales.

3. Cuantización: Después del análisis de frecuencia, se cuantifican los valores de amplitud de cada componente de frecuencia. Esto significa que están redondeados a un número limitado de valores. Esto introduce cierta pérdida de información, pero dado que las frecuencias menos importantes han sido identificadas y potencialmente eliminadas o muy comprimidas, el impacto audible se minimiza.

4. Codificación de Huffman: Finalmente, los datos cuantificados se codifican utilizando un código de longitud variable llamado Huffman Coding. Esto asigna códigos más cortos a datos más frecuentes y códigos más largos a datos menos frecuentes, lo que lleva a una mayor reducción de datos.

En esencia, MP3 aprovecha las imperfecciones y limitaciones de la audición humana para reducir significativamente la cantidad de datos necesarios para representar el audio mientras tiene como objetivo mantener la calidad de audio aceptable. El nivel de compresión (y, por lo tanto, la reducción del tamaño) se puede ajustar, lo que resulta en diferentes tamaños de archivo y niveles variables de calidad de audio. Las relaciones de compresión más altas conducen a archivos más pequeños, pero artefactos potencialmente más notables o pérdida de fidelidad.