Informática
Audio digital

	Audacity: Audio digital. Formatos. Editores y reproductores
	Duración aproximada: 1 sesión.

Objetivos

Conocer los conceptos básicos utilizados en el tratamiento del sonido.
El sonido. Propiedades.
El audio digital. Propiedades del audio digital.
Formatos y códecs de audio digital.
Conocer los reproductores y editores más utilizados.

Fuentes de información

http://es.wikipedia.org/wiki/Sonido
http://es.wikipedia.org/wiki/Audio_digital
http://es.wikipedia.org/wiki/Mp3
https://es.wikipedia.org/wiki/Waveform_Audio_Format
http://es.wikipedia.org/wiki/Ogg
http://es.wikipedia.org/wiki/Wma
http://es.wikipedia.org/wiki/RealAudio
https://es.wikipedia.org/wiki/Compresión_multi-tasa_adaptativa
Imagen de tarjeta de sonido de Berkut. http://en.wikipedia.org/wiki/Image:VIA_Envy.jpg, CC BY-SA 3.0, https://commons.wikimedia.org/w/index.php?curid=1983567
Windows Media Player. https://www.microsoft.com/es-es/download/windows-media-player-details.aspx
Icono Windows Media Player. http://www.iconarchive.com/show/simply-styled-icons-by-dakirby309/Windows-Media-Player-icon.html
Website planet. Generador de favicón. https://www.websiteplanet.com/es/webtools/favicon-generator/
VLC. http://www.videolan.org/vlc/
Winamp. http://www.winamp.com/index.html
QuickTime. https://support.apple.com/kb/DL837?locale=es_ES
Programa de edición de sonido Audacity. http://www.audacityteam.org

Contenidos

1. El sonido

El sonido es un fenómeno vibratorio transmitido en forma de ondas. Esto significa que se produce cuando cualquier objeto vibra, ya sean nuestras cuerdas vocales, las cuerdas de una guitarra, un altavoz, etc.

Para que se genere un sonido es necesario que vibre alguna fuente. Las vibraciones pueden ser transmitidas a través de diversos medios, ya sean sólidos, líquidos o gaseosos.

1.1. Diferencia entre sonido y ruido

La diferencia entre sonido y ruido es muy sutil. El ruido es un sonido no deseado. Según Wikipedia "en el ámbito de la comunicación sonora, se define como ruido a todo sonido no deseado que interfiere en la comunicación entre las personas o en sus actividades". Muchas veces el ruido acompaña al sonido que queremos oír, siendo necesario realizar un tratamiento digital para eliminarlo.

1.2. Propiedades del sonido

Las cuatro cualidades básicas del sonido son:

Tono. Viene dado por la frecuencia de la onda y diferencia los sonidos agudos de los graves. La frecuencia se mide en ciclos por segundo o hercios (Hz). Si tenemos una baja frecuencia (vibración lenta) entonces estamos ante un sonido grave. Si, en cambio, tenemos una alta frecuencia (vibración rápida) estamos ante un sonido agudo.
Intensidad. Viene determinada por la amplitud de onda y nos permite distinguir si el sonido es fuerte o débil. Los sonidos que percibimos deben superar el umbral auditivo (0 dB) y no llegar al umbral de dolor (140 dB). Esta cualidad la medimos con el sonómetro y los resultados se expresan en decibelios (dB) en honor al científico e inventor Alexander Graham Bell.
Timbre. Una misma nota suena distinta si la toca una flauta, un violín, una trompeta, etc. Cada instrumento tiene un timbre que lo identifica o lo diferencia de los demás. Con la voz sucede lo mismo. El sonido emitido por un hombre, una mujer, un/a niño/a tienen distinto timbre. El timbre nos permitirá distinguir si la voz es áspera, dulce, ronca o aterciopelada.
Duración. Es el tiempo durante el cual se mantiene un sonido.

2. Tratamiento digital del sonido

Como hemos dicho anteriormente, el sonido se transmite en forma de ondas y estas ondas son analógicas. Los ordenadores trabajan con información digital, por lo que no pueden interactuar directamente con el sonido analógico; de ahí que el sonido tenga que ser digitalizado antes de poder usarlo en el ordenador.

El proceso de digitalización del sonido consiste en tomar muestras de una señal sonora (muestreo) a intervalos constantes de tiempo (frecuencia de muestreo) para saber el valor de la misma. Otro dato importante a tener en cuenta en la digitalización, es la cantidad de bits utilizados para guardar el valor de cada punto muestreado: a más bits, mayor calidad. Lo mismo sucede con la frecuencia, si tomamos más veces la muestra, nuestro sonido digital se parecerá más al original y será de mayor calidad.

En la imagen siguiente se puede ver una onda de sonido analógica y el proceso de muestreo de la misma:

Sonido analógico Sonido digital

2.1. Calidad del sonido digital

Para que nos hagamos una idea de la calidad del sonido, en la siguiente tabla resumimos los principales valores:

Frecuencias	Calidad producida
Hasta 11000 Hz	Sonido de calidad baja
Hasta 20000 Hz	Sonido de calidad media
A partir de 44000 Hz	Sonido de calidad alta
A partir de 96000 Hz	Sonido de calidad excelente

2.2. La tarjeta de sonido

Es la encargada de realizar el proceso de transformación (conversión) de sonido analógico a digital y viceversa.

Analógico → Digital. Por ejemplo, para grabar nuestra voz en el ordenador.
Digital → Analógico. Por ejemplo, para que a través de los altavoces podamos escuchar la música guardada en nuestro equipo.

Hoy en día casi todas las placas base de los ordenadores incluyen un tarjeta de sonido integrada. No obstante, si somos profesionales o amantes de la música, necesitaremos comprar una específica, de mucha mayor calidad que la que viene por defecto.

Imagen de una tarjeta basada en el chipset “VIA Envy”.

3. Audio digital. Formatos de archivos de audio

El formato de ficheros de audio digital corresponde a la forma en que se almacenan los datos de un archivo de sonido para que puedan ser interpretados por un ordenador o dispositivo similar.

Los archivos de audio digital los podemos dividir en tres grupos:

3.1. Formatos PCM

Los formatos PCM (Pulse Code Modulation) contienen toda la información que salió del convertidor analógico a digital, sin ninguna omisión y por eso, tienen la mejor calidad. Su principal inconveniente radica en el tamaño de archivo generado, que es bastante grande. Dentro de esta categoría se encuentran los formatos WAV, AIFF, SU, AU y RAW.

3.2. Formatos comprimidos. Códecs

Los archivos PCM ocupan mucho espacio de almacenamiento y memoria, por lo que se emplean algoritmos matemáticos de compresión para reducir el tamaño (códecs). Un códec de audio, acrónimo de codificador/descodificador, incluye un conjunto de algoritmos que permiten codificar y descodificar los datos auditivos, lo que permite reducir la cantidad de bits que ocupa el fichero de audio. Dichos algoritmos descartan información que no es perceptible por el oído humano para lograr que el mismo fragmento de audio pueda ocupar en la memoria incluso una décima parte -o menos- de lo que ocuparía sin compresión (formato PCM).

Los códecs comprimen señales o ficheros de audio, consiguiendo una buena calidad final, y descomprimiéndolos para reproducirlos o manipularlos en un formato más apropiado.

La reducción en tamaño implica una pérdida de información y por esto a los formatos de este tipo se les llama formatos comprimidos con pérdida. Entre los formatos con pérdida tenemos el MP3, AAC y Ogg.

Existen también formatos de archivo comprimido sin pérdida, como el FLAC y el Apple Lossless Encoder, cuyo tamaño suele ser de aproximadamente la mitad de su equivalente PCM.

3.3. Formato MIDI

Existe otro tipo de archivos de audio: los archivos MIDI. Este formato de archivos no es precisamente de audio digital, pero sí pertenece a las tecnologías de la informática musical. El archivo MIDI no almacena "sonido grabado", sino las indicaciones para que un sintetizador o cualquier otro dispositivo MIDI "interprete" una serie de notas u otras acciones (control de un mezclador, etc.). Podemos imaginarlos como algo similar a una partitura, con los nombres de los instrumentos que hay que utilizar, las notas, tiempos y algunas indicaciones acerca de la interpretación.

4. Formatos más utilizados

Existen multitud de formatos de audio y cada uno se corresponde con una extensión específica del archivo que lo contiene. En este apartado trataremos sólo los más utilizados.

Formato

WAV

MP3

OGG

WMA

RealAudio

AMR

4.1. WAV

WAV (WAVE form audio file format) fue desarrollado y es propiedad © de Microsoft y de IBM. Es un formato de audio digital -normalmente sin compresión de datos- que se utiliza para almacenar sonidos en el PC. Admite archivos mono y estéreo a diversas resoluciones y velocidades de muestreo. Se trata de un formato adecuado para uso profesional, puesto que no tiene pérdida de calidad.

Para tener calidad CD de audio se necesita que el sonido se grabe a 44100 Hz y a 16 bits. Por cada minuto de grabación de sonido se consumen unos 10 megabytes de espacio en disco.

Son archivos de extensión *.WAV.

4.2. MP3

MP3 (MPEG Audio Layer 3) es un formato de compresión de archivos de audio patentado y desarrollado por el ® Moving Picture Experts Group (MPEG) para formar parte del estándar MPEG-1 y del posterior y más extendido MPEG-2. Usa un algoritmo con pérdida para conseguir un menor tamaño de archivo.

Es un formato de audio común usado para música tanto en ordenadores como en reproductores de audio portátil. Los ficheros tienen extensión *.MP3.

MP3 se ha hecho muy popular gracias a su posibilidad de ser intercambiado a través de internet. Actualmente se ha convertido en el estándar utilizado para "streaming" de audio y compresión de audio de alta calidad debido a la posibilidad de ajustar la calidad de la compresión.

4.3. OGG

Fomato de audio comprimido de alta calidad. El formato es libre de patentes y abierto, diseñado para dar un alto grado de eficiencia en el "streaming" y la compresión de archivos. Tiene una calidad de sonido mejor que MP3, aunque los ficheros generados ocupan un poco más. Son archivos de extensión *.OGG.

El proyecto Ogg Vorbis fue iniciado en 1993 por el programador Chris Montgomery, fundador y director técnico de la Fundación Xiph.Org.

4.4. WMA

Windows Media Audio (WMA) es una tecnología de compresión de audio desarrollada por © Microsoft. El nombre puede usarse tanto para referirse al formato de archivo de audio como al códec de audio. Se trata de software propietario que forma parte de la suite Windows Media.

Tiene una calidad similar al formato MP3. Su extensión es *.WMA.

4.5. RealAudio

Se trata de un formato de audio creado por RealNetworks en 1995. Es predominantemente utilizado en transmisiones por Internet en tiempo real. Esto quiere decir que una estación de radio puede transmitir su señal en vivo, directamente al usuario final, sin necesidad de descargar primero el archivo completo de audio. O bien, el usuario puede escuchar, bajo petición (on demand), un archivo almacenado en un servidor externo. En ambos casos, el archivo de audio no se descarga en el ordenador del usuario final (streaming).

La tecnología RealAudio permite adaptarse automáticamente a la capacidad de recepción del usuario final, dependiendo de su velocidad de conexión, procesador y memoria. Los archivos tienen extensión *.RA.

4.6. Formato AMR

Multi-tasa adaptativo (en inglés Adaptive Multi-Rate, AMR) es un formato de compresión de audio optimizado para la codificación de voz. AMR ha sido adoptado como el estándar de codificación de audio por 3gpp en octubre de 1998 y actualmente se utiliza ampliamente en GSM, es decir, es el formato en el que los móviles graban la voz.

No todos los reproductores de sonido pueden reproducir un archivo codificado como AMR. Los archivos tienen extensión *.AMR.

5. Reproductores de sonido

Para poder escuchar un archivo de música (por ejemplo en formato MP3) desde nuestro ordenador, además de una tarjeta de sonido y unos altavoces, necesitamos una aplicación que se encargue de ello.

Hay gran cantidad de aplicaciones de este tipo y muchas de ellas no sólo reproducen sonido sino que permiten reproducir vídeo. A la hora de elegir nuestra aplicación debemos tener en cuenta el sistema operativo que tengamos instalado aunque muchas de ellas son multiplataforma y tienen versiones para los principales sistemas.

Algunos de los reproductores de sonido/multimedia más utilizados y que prácticamente reproducen cualquier formato son:

5.1. Windows Media Player

Características e información detallada en Windows Media.

Reproduce: Formatos de Windows Media (.asf, .wma, .wmv, .wm), Metarchivos de Windows Media (.asx, .wax, .wvx, .wmx), Metarchivos de Windows Media (.wpl), Microsoft Digital Video Recording (.dvr-ms), Paquete de descarga de Windows Media (.wmd), Audio Visual Interleave (.avi), Moving Pictures Experts Group (.mpg, .mpeg, .m1v, .mp2, .mp3, .mpa, .mpe, .m3u), Interfaz digital de instrumentos musicales (.mid, .midi, .rmi), Audio Interchange File Format ( .aif, .aifc, .aiff), Sun Microsystems y NeXT (.au, .snd), Audio para Windows (.wav), Pista de audio de CD (.cda), Tecnología Indeo Video (.ivf), Máscaras del Reproductor de Windows Media (.wmz, .wms), Archivo de película de QuickTime (.mov), Archivo de audio MP4 (.m4a), Archivo de vídeo MP4 (.mp4, .m4v, .mp4v, .3g2, .3gp2, .3gp, .3gpp), Archivo de audio de Windows (.aac, .adt, .adts), Archivo de vídeo MPEG-2 TS (.m2ts)

5.2. VLC

Características e información detallada en VLC media player.

Reproduce los siguientes formatos: MPEG Layer 1/2, MP3 - MPEG Layer 3, AAC - MPEG-4 part3, Vorbis, AC3 - A/52 (Dolby Digital), E-AC-3 (Dolby Digital Plus), MLP / TrueHD, DTS, WMA 1/2, WMA 3 1, FLAC, ALAC, Speex, Musepack / MPC, ATRAC 3, Wavpack, Mod (.s3m, .it, .mod), TrueAudio (TTA), APE (Monkey Audio), Alaw/µlaw, AMR (3GPP), MIDI 3, LPCM, ADPCM, QCELP, DV Audio, QDM2/QDMC (QuickTime), MACE.

5.3. Winamp

Características e información detallada en Winamp.

Reproduce entre otros: MID, MIDI, MP1, MP2, MP3, MP4, AAC, Ogg Vorbis, WAV, WMA, FLAC, CD audio, KAR (Karaoke), RAW, M3U, PLS, ASX, etc.

5.4. QuickTime

Características e información detallada en QuickTime.

Rreproduce: iTunes Audio (.m4a, .m4b, .m4p), MP3, Core Audio (.caf), AIFF, AU, SD2, WAV, SND, AMR, Película QuickTime (.mov), MPEG-4 (.mp4, .m4v), MPEG-2 (OS X Lion o posterior), MPEG-1, 3GPP, 3GPP2, AVCHD (OS X Mountain Lion o posterior), AVI (solo Motion JPEG), DV.

6. Editores de sonido: Audacity

Existen numerosos programas para la edición de audio digital, pero uno de los más utilizados es Audacity. Audacity es un editor de audio libre, fácil de usar y multilingüe para Windows, Mac OS X, GNU/Linux y otros sistemas operativos. Podemos usar Audacity para:

Grabar audio en vivo.
Convertir cintas y grabaciones a sonido digital o CD.
Editar archivos en múltiples formatos: Ogg Vorbis, MP3, WAV, AIFF, etc.
Cortar, copiar, unir y mezclar sonidos.
Cambiar la velocidad o el tono de una grabación.

A continuación veremos más detalladamente sus funciones, antes de empezar a usarlo.

6.1. Grabación

Audacity puede grabar audio en vivo mediante un micrófono, un mezclador o digitalizando grabaciones de cintas, discos o minidisc.
Graba desde micrófono, entrada de línea, dispositivos USB/Firewire y otros.
La barra de herramientas de dispositivos gestiona múltiples dispositivos de entrada y salida.
Grabación programada y grabación activada por sonido.
Remezcla sobre otras pistas para crear grabaciones multipista.
Grabación de altas muestras en excesos de 192,000 Hz (dependiendo del hardware).
Graba múltiples canales simultáneamente (dependiendo del hardware).
Los medidores de niveles pueden monitorizar niveles de volumen, antes, durante y tras la grabación. La distorsión puede visualizarse en la forma de onda o en una pista de etiquetas.

6.2. Importación y exportación

Permite importar archivos de sonido, editarlos y combinarlos con otros archivos como nuevas grabaciones. Permite exportar las grabaciones en muchos formatos diferentes, incluso múltiples archivos de una vez.
Importa y exporta archivos WAV, AIFF, AU, FLAC y Ogg Vorbis.
Importación rápida bajo demanda de archivos WAV/AIFF si se leen directamente de su fuente. La importación bajo demanda de otros formatos de archivo está disponible con la librería opcional FFmpeg.
Importa y exporta todo tipo de archivos compatibles con libsndfile como GSM 6.10, 32-bit y 64-bit WAV de coma flotante y U/A-Law.
Importa audio MPEG (incluyendo archivos MP2 y MP3) usando libmad.
Importa archivos de audio raw (datos en bruto) mediante el comando "Importar Raw".
Genera archivos WAV o AIFF listos para grabar en un CD de audio.
Exporta archivos MP3 con la biblioteca opcional LAME encoder .
Importa y exporta AC3, M4A/M4R (AAC) y WMA con la biblioteca FFmpeg opcional (también permite importar audio de un archivo de vídeo).

6.3. Calidad de sonido

Graba y edita muestras de 16 bits, 24 bits y 32 bits (de coma flotante).
Las frecuencias de muestreo y formatos son convertidos mediante un proceso de alta calidad.
Mezcla pistas con diferentes frecuencias de muestreo o formatos y los convierte automáticamente en tiempo real.

6.4. Edición

Edición sencilla con Cortar, Copiar, Pegar y Borrar.
Incorpora la funcionalidad de "Deshacer" y "Rehacer" acciones.
Permite editar y mezclar un número amplio de pistas.
Se permiten múltiples clips por pista.
Herramienta de dibujo para alterar puntos individuales de la muestra.
La herramienta Envolvente permite desvanecer el volumen o hacerlo aparecer con suavidad.
Recuperación automática en el caso de que se produzca una terminación anormal del programa.

6.5. Accesibilidad

Las pistas y selecciones se pueden manipular completamente mediante el teclado.
Gran cantidad de atajos de teclado.
Una compatibilidad excelente con JAWS, NVDA y otros lectores de pantalla de Windows, y para VoiceOver en Mac.

6.6. Efectos

Cambiar el tono sin alterar el tempo y viceversa.
Eliminar ruidos estáticos, silbidos, tarareos u otros ruidos de fondo constantes.
Alterar las frecuencias con la ecualización, filtros FFT y amplificar los bajos.
Ajustar los volúmenes con Compresor, Amplificar, Normalizar y Aparecer/Desvanecer.
Eliminar voces para determinadas pistas estéreo.
Crear voces para podcast o DJ utilizando el efecto Auto Duck.
Otros efectos incluidos:
- Eco
- Fase
- Wahwah
- Paulstretch (estiramiento extremo)
- Inversión
- Truncado de silencio
- Ejecutar "cadenas" de efectos en un proyecto con varios archivos en el modo Proceso de secuencia.

6.7. Plug-ins

Añade nuevos efectos LADSPA, Nyquist, VST y plug-ins de efectos Audio Unit .
Los efectos desarrollados con el lenguaje de programación Nyquist se pueden modificar fácilmente con un editor de texto, e incluso se puede crear plug-ins propios.

6.8. Análisis

Modos de vista de espectrograma para visualizar frecuencias.
Comando "Dibujar espectro" para obtener un análisis detallado de frecuencia.
Análisis de contraste para analizar las diferencias medias de volumen entre una locución en primer plano y una música de fondo.
Compatibilidad para añadir plug-ins de análisis VAMP.

6.9. Libre y multiplataforma

Con una Licencia Pública General de GNU (GPL).
Funciona en Mac OS X, Windows y GNU/Linux.

Ejercicio

Responde las preguntas del cuestionario.

Créditos

Este documento es de dominio público bajo licencia de Creative Commons Reconocimiento-NoComercial-CompartirIgual 3.0 España.
TuInstitutoOnline.com M.Donoso, G.García, P.Gargallo, A.Martínez. v. 2.0.2.1.0

No se permite un uso comercial de la obra original ni de las posibles obras derivadas, la distribuciÃ³n de las cuales se debe hacer con una licencia igual a la que regula la obra original.

Los reconocimientos se realizan en el apartado Fuentes de información.

Los iconos empleados están protegidos por la licencia LGPL y se han obtenido de:
https://commons.wikimedia.org/wiki/Crystal_Clear
https://www.openclipart.org

Todas las capturas de pantalla tienen copyright y pertenecen a TuInsitutoOnline.com.

TuInstitutoOnline.com permite su uso siempre y cuando se muestren desde el dominio www.tuinstituoonline.com y NO PERMITE enlazar a ellas desde otros lugares.

Además, la estructura diseñada para mostrar el contenido de las unidades es propiedad de TuInstitutoOnline.com.

TuInstitutoOnline.com M.Donoso, G.García, P.Gargallo, A.Martínez. Versión 2021.