viernes, 23 de octubre de 2009

codecs

Free Lossless Audio Codec (FLAC)
(Códec libre de compresión de audio sin pérdida, en español) es un formato del proyecto Ogg para codificar audio sin pérdida de calidad, es decir, el archivo inicial puede ser recompuesto totalmente con la desventaja de que el archivo ocupe mucho más espacio del que se obtendría al aplicar compresión con pérdida o Lossy.
Otros formatos como MPEG-1 Layer 3 (MP3), Windows Media Audio (WMA) (excepto WMA Lossless), Advanced Audio Coding (AAC), Ogg Vorbis (OGG), Adaptive Transform Acoustic Coding ATRAC, ADPCM, etc., al comprimir el archivo pierden, de forma irreversible, parte de la información del original, a cambio de un gran ahorro de tamaño en el archivo. FLAC no ahorra tanto tamaño de archivo, rara vez baja de dejar el archivo en un tercio del tamaño original, ya que no elimina nada de la información contenida en el original. Como norma se reduce entre la mitad hasta tres cuartos según el tipo de sonido procesado.

Comparaciones
FLAC está diseñado para comprimir audio. Debido a ello, los archivos resultantes son reproducibles y útiles, además de ser más pequeños que si se hubiera aplicado directamente al archivo PCM un algoritmo de compresión estadística (como ZIP). Los algoritmos con pérdida pueden comprimir a más de 1/10 del tamaño inicial, a costa de descartar información; FLAC, en su lugar, usa la predicción lineal para convertir las muestras en series de pequeños números no correlativos (conocido como "residuos"), que se almacenan eficientemente usando la codificación Golomb-Rice (ver: "Reglas Golombinas", o "Golombianas"). Además de esto, para aprovechar los silencios (donde los valores numéricos presentan mucha repetición) usa codificación por "longitud de pista" (RLE"Run-Length Encoding") para muestras idénticas.
Nota: RLE y RAE son conceptos provenientes de la lectura mecánica de los registros, y se corresponden a las lecturas con "Velocidad Lineal Constante" (típicas de las cintas magnetofónicas), y con "Velocidad Angular Constante" (característica de los discos y gramófonos. En los lectores de CD, se puede seleccionar un método u otro de reproducción, según los parámetros de grabación. El más común es CAV, pero el CLV permite una mayor linealidad en el registro; aunque requiere el concurso de servos para controlar la velocidad angular del rotor, según se acorta el radio de la pista.
FLAC se ha convertido en uno de los formatos preferidos para la venta de música por Internet, al igual que Monkey's Audio que funciona idénticamente bien. Además es usado en el intercambio de canciones por la red, como alternativa al MP3, cuando se desea obtener una mayor reducción del tamaño que en un archivo WAV-PCM, y no perder calidad de sonido. También es el formato ideal para realizar copias de seguridad de CDs, ya que permite reproducir exactamente la información del original, y recuperarla en caso de problemas con este material.
FLAC no soporta muestras en coma flotante, sólo en coma fija. Admite cualquier resolución PCM de 4 a 32 bits, y cualquier frecuencia de muestreo (sample rate) desde 1 a 65535KHz, en incrementos de 1Hz.
Para una mayor compresión consiguiendo un mayor tiempo de codificación se puede usar el siguiente comando
flac --lax -mep -b 8192 -l 32 -r 0,16 input.wav -o output.flac
El fichero resultante puede no funcionar en reproductores normales, pero funcionara en los decodificadores software. Para evitar esto debe usar el siguiente comando:
flac --lax -mep -b 8192 -l 32 -r 0,8 input.wav -o output.flac
Tabla comparativa de funcionalidades
Habitualmente uno de los factores que más se tienen en cuenta a la hora de escoger este códec de audio es la compresión que aporta; sin embargo, dependiendo de cuál sea nuestra aplicación final y de si se consideran los medios de los que dispose el usuario, no siempre nos conviene ni el códec más rápido ni el que más comprima. En esta tabla queda demostrado que el FLAC es una buena opción en muchos de los distintos casos en los que un usuario se puede encontrar; aquí se comparan las funcionalidades más destacadas de éste con las de otros códecs de audio sin pérdidas. Los códecs analizados son los siguientes:
WavPack
Apple Lossless (ALAC)
FLAC
Monkey's
OptimFROG
Shorten
Características de los archivos
Los archivos FLAC suelen tener esta misma extensión (*.FLAC); son perfectamente reproducibles con algunos reproductores, incluso en computadoras antiguas, ya que una de las características del proyecto, es que los archivos decodifiquen en modo sencillo. Además permiten usar la función búsqueda. Estos archivos son de velocidad de bits variable, ya que no todas las partes de una misma canción son igualmente comprimibles.
Otra característica es que, como todos los formatos sin pérdida, el ratio final depende mucho del estilo musical, y de su complejidad y variedad sonora, aparte de la propia canción. Para música clásica obtiene ratios de aproximadamente 1/2; en otros estilos, como el dance o el rock, los archivos se quedan desde 2/3 hasta 4/5 del tamaño original en formato PCM. Otro factor de mucha importancia es la existencia de los silencios, ya que algunas canciones tienen varios segundos al principio o al final.
MP3
.
MPEG-1 Audio Layer 3 (MP3)
Información general
Extensión de archivo
.mp3
Tipo de MIME
audio/mpeg
Tipo de formato
Audio
Estándar(es)
ISO/IEC 11172-3, ISO/IEC 13818-3
MPEG-1 Audio Layer 3, más conocido como MP3, es un formato de audio digital comprimido con pérdida desarrollado por el Moving Picture Experts Group (MPEG) para formar parte de la versión 1 (y posteriormente ampliado en la versión 2) del formato de vídeo MPEG. El mp3 estándar es de 44 kHz y un bitrate de 128 kbps por la relación de calidad/tamaño. Su nombre es el acrónimo de MPEG-1 Audio Layer 3 y el término no se debe confundir con el de reproductor MP3. Codificación y cuantificación
La solución que propone este estándar en cuanto a la repartición de bits o ruido, se hace en un ciclo de iteración que consiste de un ciclo interno y uno externo. Examina tanto las muestras de salida del banco de filtros como el SMR (signal-to-mask ratio) proporcionado por el modelo psicoacústico, y ajusta la asignación de bits o ruido, según el esquema utilizado, para satisfacer simultáneamente los requisitos de tasa de bits y de enmascaramiento. Dichos ciclos consisten en:
Ciclo interno
El ciclo interno realiza la cuantización no-uniforme de acuerdo con el sistema de punto flotante (cada valor espectral MDCT se eleva a la potencia 3/4). El ciclo escoge un determinado intervalo de cuantización y, a los datos cuantizados, se les aplica codificación de Huffman en el siguiente bloque. El ciclo termina cuando los valores cuantizados que han sido codificados con Huffman usan menor o igual número de bits que la máxima cantidad de bits permitida.
Ciclo externo
Ahora el ciclo externo se encarga de verificar si el factor de escala para cada subbanda tiene más distorsión de la permitida (ruido en la señal codificada), comparando cada banda del factor de escala con los datos previamente calculados en el análisis psicoacústico. El ciclo externo termina cuando una de las siguientes condiciones se cumple:
Ninguna de las bandas del factor de escala tiene mucho ruido.
Si la siguiente iteración amplifica una de las bandas más de lo permitido.

Estructura de un fichero MP3
Un fichero Mp3 se constituye de diferentes frames MP3 que a su vez se componen de una cabecera Mp3 y los datos MP3. Esta secuencia de datos es la denominada "stream elemental". Cada uno de los Frames son independientes, es decir, una persona puede cortar los frames de un fichero MP3 y después reproducirlos en cualquier reproductor MP3 del Mercado. La cabecera consta de una palabra de sincronismo que es utilizada para indicar el principio de un frame válido. A continuación siguen una serie de bits que indican que el fichero analizado es un fichero Standard MPEG y si usa o no la capa 3. Después de todo esto, los valores difieren dependiendo del tipo de archivo MP3. Los rangos de valores quedan definidos en la ISO/IEC 11172-3

Monkey's Audio APE
Monkey’s Audio (Audio del Mono) es un formato de fichero para comprimir información de audio. Siendo un formato de compresión sin pérdida, Monkey’s Audio no elimina información del flujo de audio, como hacen los formatos de compresión con pérdida, por ejemplo: MP3, AAC y Vorbis.
De forma parecida a otros métodos de compresión, la principal ventaja de usar Monkey’s Audio está en la reducción de los requerimientos de ancho de banda y almacenamiento, pero en el caso de Monkey’s Audio, no hay que sacrificar la integridad de la fuente de sonido (como ocurre con el MP3). Por ejemplo, una grabación digital (como un CD) codificada a Monkey’s Audio puede ser descomprimida en una señal idéntica de la información del sonido (bit a bit, no solo desde un punto de vista subjetivo). Las fuentes de audio comprimidas con Monkey’s Audio pueden ser comprimidas a aproximadamente (variando según tipo de sonidos, género musical, presencia de silencios...) la mitad de su tamaño original.
Monkey’s Audio es adecuado para propósitos de distribución, reproducción y archivo. Además, es software propietario, pero de código abierto. Suele ser muy lento para descomprimir en dispositivos de audio portátiles, y tiene una compatibilidad limitada en plataformas que no sean Windows. Hay otras alternativas que ofrecen al usuario más libertad y soporte oficial para más plataformas como el formato FLAC.
Los archivos de Monkey’s Audio usan la extensión *.ape para el audio, y *.apl para los metadatos de la pista.
Plataformas compatibles
Oficialmente, Monkey’s Audio solo está disponible para la plataforma Microsoft Windows. Hay alguna discusión en el sitio web de Monkey’s Audio acerca del soporte oficial para los usuarios de Linux. En Mac OS X puede usarse el freeware XLD. Un desarrollador con el nombre de SuperMMX ha lanzado una versión no oficial a primeros de 2005, que además incluye complementos para permitir la reproducción usando los populares reproductores XMMS y Beep Media Player. Esta versión está desarrollada originalmente para Linux, pero ha incluido compatibilidad para Mac OS X, y para Linux en arquitecturas PowerPC y SPARC.
De todas formas, aunque la licencia permite explícitamente incluir Monkey's Audio en aplicaciones con licencia GPL, algunos mantenedores no están seguros de si la licencia está cláramente escrita, y la distribución Gentoo no incluirá programas para Monkey's Audio puesto que sus desarrolladores consideraron que no era software libre.
Hay disponible también un reproductor/descodificador/codificador multiplataforma basado en Java. Es compatible con Monkey’s Audio hasta la versión 3.99.
En plataformas de hardware, el proyecto Rockbox de firmware reproductor de código abierto es compatible con la reproducción de Monkey's Audio en la mayoría de los dispositivos con los que es compatible, pero la mayoría de dispositivos no tienen suficiente potencia de proceso (CPU) para reproducir el códec en tiempo real cuando se aplica una alta compresión en los ficheros

No hay comentarios:

Publicar un comentario