Форматы звуковых файлов
🕛 25.04.2007, 17:57
Звук - это физическое природное явление, распространяющееся посредством колебаний воздуха. Задачей преобразования звука в электронный вид является повторение всех его этих самых волновых характеристик. Но электронный сигнал не является аналоговым, и может записываться посредством коротких дискретных значений. Пусть они имеют малый интервал между собой и практически неощутимы, на первый взгляд для человеческого уха, но мы должны всегда иметь в виду, что имеем дело только с эмуляцией природного явления именуемого звуком. Такая запись именуется импульсно-кодовой модуляцией и являет собой последовательную запись дискретных значений. Разрядность устройства, исчисляемая в битах, говорит о том сколькими значениями одновременно в одном записанном дискрете, берется звук. Чем больше разрядность, тем больше звук соответствует оригиналу.
РСМ
РСМ расшифровывается как pulse code modulation, что и является в переводе как импульсно-кодовая. Файлы именно с таким расширением встречаются довольно редко (я встречал только в программе 3d audio). Но РСМ является основополагающей для всех звуковых файлов. Я бы не сказал, что это очень экономный метод для хранения данных на диске, но думаю, что от этого уже никогда точно не уйдешь, причем объемы современных винчестеров уже позволяют не обращать внимания на пару десятков мегабайт.
dpcm
Изыскания по поводу экономного хранения звуковых данных на диске. Если Вы встречаете данную аббревиатуру, то знайте, что имеете дело с разностным РСМ. В основе данного метода лежит та вполне оправданная идея, что вычисления гораздо более громоздки по сравнению с тем, что можно просто указать значения разности.
Аdpcm
Адаптивный dpcm. Согласитесь, что при указании просто значений разности может возникнуть проблема с тем, что есть очень маленькие и очень большие значения. В результате, какие бы супер-точные измерения не были все равно имеет место искажение действительности. Поэтому в адаптивном методе добавлен коэффициент масштабируемости. Формат adpcm занимает в 4 раза меньше места (при том же качестве) по сравнению с pcm и имеет несколько степеней качественного сжатия.
wav
Самое простое хранилище дискретных данных. Один из типов файлов семейства riff. Помимо обычных дискретных значений, битности, количества каналов и значений уровней громкости в wav может быть указано еще множество параметров: метки позиций для синхронизации, общее количество дискретных значений, порядок воспроизведения различных частей звукового файла, а также есть место текстовой информации.
riff
resource interchange file format. Уникальная система хранения любых структурированных данных.
iff
Эта технология хранения данных проистекает от amiga-систем. interchange file format. Почти то же, что и riff, только имеются некоторые нюансы. Начнем с того, что система amiga - одна из первых, в которой стали задумываться о программно-сэмплерной эмуляции музыкальных инструментов. В результате, в данном файле звук делится на две части: то, что должно звучать вначале и элемент того, что идет за началом. В результате, звучит начало один раз, за тем повторяется второй кусок столько раз, сколько Вам нужно и нота может звучать бесконечно долго.
mod
Файл хранит в себе короткий образец звука (или несколько образцов звуков), который потом можно использовать в качестве шаблона для инструмента. Проще говоря прошитый в синтезатор сэмпл. Иногда может получиться довольно качественная музыка.
aif, aiff
audio interchange file format. Данный формат распространен в системах apple macintosh и silicon graphics. Заключает в себе сочетание mod и wav.
aifС, aiff-С
Тот же aiff, только с заданными параметрами сжатия (компрессии).
au
Это звуковой формат предназначен для работы со звуком в рабочих системах sun, linux и freebcd. Структура файла намного проще, чем в wav, но там указан метод кодирования данных. Файлы очень мало "весят", за счет чего получили довольно широкое распространение в Интернете. Чаще всего Вы можете встретить параметры m-law 8 кГц - моно или 16-битные стерео-файлы с частотами 22050 и 44100 Гц.
НСОМ
То же самое, что и voc (восемь бит, моно), но только для apple macintosh.
mid
Файл, хранящий в себе сообщения midi-системе, установленной на Вашем компьютере или в устройстве. Попросту говоря ноты и инструмент. При использовании качественных синтезаторов, например, от yamaha sxg позволяет получить из простого файла mid довольно качественную аранжировку.
МР3
Многие для объяснения параметров сжатия mp3, которые в нем применяют, сравнивают его с jpeg для изображений. Там очень много наворотов в вычислениях, чего и не перечислишь, но коэффициент сжатия в 10-12 раз сказали о себе сами. Если говорят, что там есть качество, то могу сказать, что там его немного. Специалисты говорят о контурности звука как о самом большом недостатке данного формата. Действительно, если сравнивать музыку с изображением, то смысл остался, а мелкие нюансы ушли. Качество МР3 до сих пор вызывает много споров, хотя в последнее время появилось продолжение mp3pro. При подборе соотв. vbr (переменная частота кодирования) можно получить довольно неплохие результаты в т.ч. и для профессионального использования.
ra
real audio или потоковая передача аудиоданных. Довольно распространенная система передачи звука в реальном времени через Интернет. Скорость передачи порядка 1 Кб в секунду. Полученный звук обладает следующими параметрами: 8 или 16 бит и 8 или 11 кГц.
snd
Бывает двух видов. Один - это тот же au для sun и next. Другой - это 8-мибитный моно-файл для РС и Маков с различной частотой дискретизации.
vqf
Хорошая альтернатива МР3, разве что менее распространенная. Есть и свои недостатки. Закодировать файл в vqf - процесс гораздо более долгий. К тому же, очень мало бесплатных программ, позволяющих работать с данным форматом файлов, что, собственно, и сказалось на его распространении. vqf можно проиграть в winamp с помощью plugin’a.
voc
8-битный моно-формат от семейства soundblaster. Можно встретить в большом количестве старых программ, использующих звук (не музыкальных).
ul
Стандартный формат u-law. 8 кГц, 8 бит, моно.