Современные методы используют более сложные алгоритмы преобразования. Помимо представления звуковых колебаний в цифровом виде, применяется также создание специальных команд для автоматического воспроизведения на различных электронных музыкальных инструментах. Ярчайшим примером такой технологии является MIDI.
Преимущества битового кода используются при передаче кодированного сигнала на расстояние, шифровании сигнала, цифровой подписи сигнала, восстановлении потерь, вызванных помехами при передаче, а также в прочих приложениях.
Цифровая звукозапись — технология преобразования аналогового звука в цифровой с целью сохранения его на физическом носителе для возможности последующего воспроизведения записанного сигнала.
Представление аудиоданных в цифровом виде позволяет очень эффективно изменять исходный материал при помощи специальных устройств или компьютерных программ — звуковых редакторов, что нашло широкое применение в промышленности, медиа-индустрии и быту.
В 1928Гарри Найквист в работе «Определённые проблемы теории телеграфной передачи» определил требуемую полосу линии связи для передачи импульсного сигнала — основа цифрового звука[1]
В 1933 годуВ. А. Котельниковым в работе «О пропускной способности эфира и проволоки в электросвязи» предложена и доказана Теорема Котельникова, согласно которой аналоговый сигнал с ограниченным спектром может быть восстановлен однозначно и без потерь по своим дискретным отсчётам, взятым с частотой строго большей удвоенной максимальной частоты спектра[2]
В 1948 годуКлод Шеннон опубликовал «Математическую теорию связи»[4], а в 1949 — «Передача данных при наличии шума», где независимо от Котельникова доказал теорему с аналогичными результатами теореме Котельникова, поэтому в западной литературе эту теорему часто называют теоремой Шеннона.[5]
В 1960 сотрудниками лаборатории Линкольна Массачусетского технологического института Ирвином Ридом и Густавом Соломоном изобретён Код Рида — Соломона[6]
В 1967 техническим институтом исследований NHK представлен первый цифровой катушечный стереорекордер на 1-дюймовой видеоленте. В устройстве использовалась ИКМ-запись с разрядностью 12-бит и частотой дискретизации 30 кГц с применением компандера для расширения динамического диапазона[6]
В 1969Sony представила 13-битный цифровой стереорекордер с частотой дискретизации 47,25 кГц, с записью на 2-х дюймовую видеоленту[6]
В 1972 был выпущен первый альбом записанный с цифровой мастер-ленты фирмой Nippon Columbia[7]
В 1977 на токийской аудио выставке Mitsubishi, Sony и Hitachi продемонстрировали прототипы цифровых грампластинок или аудиодисков[6]
В 1979 в Европе Philips демонстрирует прототип компакт-диска диаметром 115 мм, намереваясь его сделать мировым стандартом. 14-битная запись с частотой дискретизации 44,050 кГц не устроила Sony, которые предложили 16-разрядную запись с частотой 50 кГц, но в итоге из-за ограничений формата было решено выбрать частоту дискретизации 44,1 кГц и размер диска увеличить до 120 мм. Диск способен вмещать 74 минуты записи.
В 1980 стандарт компакт-диск был официально предложен, но на все согласования и доработки ушло два года[6]
для того чтобы прослушать сделанную запись, необходимо воспроизведение сделанной записи с носителя и обратное преобразование из цифрового сигнала в аналоговый, с помощью цифро-аналогового преобразователя (ЦАП).
Принцип действия АЦП тоже достаточно прост: аналоговый сигнал, полученный от микрофонов и электро-музыкальных инструментов, преобразовывается в цифровой. Это преобразование включает в себя следующие операции:
Ограничение полосы частот производится при помощи фильтра нижних частот для подавления спектральных компонент, частота которых превышает половину частоты дискретизации.
Дискретизацию во времени, то есть замену непрерывного аналогового сигнала последовательностью его значений в дискретные моменты времени — отсчётов. Эта задача решается путём использования специальной схемы на входе АЦП — устройства выборки-хранения.
Квантование по уровню представляет собой замену величины отсчёта сигнала ближайшим значением из набора фиксированных величин — уровней квантования.
Кодирование или оцифровку, в результате которого значение каждого квантованного отсчёта представляется в виде числа, соответствующего порядковому номеру уровня квантования.
Делается это следующим образом: непрерывный аналоговый сигнал «режется» на участки, с частотой дискретизации, получается цифровой дискретный сигнал, который проходит процесс квантования с определённой разрядностью, а затем кодируется, то есть заменяется последовательностью кодовых символов. Для качественной записи звука в полосе частот 20-20 000 Гц применяется минимальная стандартная частота дискретизации от 44,1 кГц и выше (в настоящее время появились АЦП и ЦАП c частотой дискретизации 192,3 и даже 384,6 кГц). Для получения довольно качественной записи достаточно разрядности 16 бит, однако для расширения динамического диапазона и повышения качества звукозаписи используется разрядность 24 (реже 32) бита.
Помехоустойчивое кодирование позволяет при воспроизведении сигнала выявить и устранить (или снизить частоту их появления) ошибки чтения с носителя. Для этого в процессе записи к отсчётам, полученным на выходе АЦП, добавляется искусственная избыточность (контрольные биты), которая впоследствии помогает восстановить повреждённый отсчёт. В устройствах записи звука обычно используется комбинация из двух или трёх помехоустойчивых кодов. Если же выбранный уровень избыточности кодирования не позволяет восстановить правильное значение отсчёта, то производится его замена с помощью интерполяции, чтобы исключить появление скачкообразного изменения уровня сигнала (щелчка).
Для лучшей защиты от пакетных ошибок, вызванных повреждениями носителя информации (царапины на компакт-диске, загибы магнитной ленты) также применяется перемежение.
К полезному сигналу также добавляются вспомогательные данные, которые облегчают последующее декодирование. Это могут быть сигналы временного кода, служебные сигналы, сигналы синхронизации.
Канальное кодирование служит для согласования цифровых сигналов с параметрами канала передачи (записи/воспроизведения). Например, при записи цифровых сигналов на магнитный носитель необходимо исключить появление в токе записи постоянной составляющей и низкочастотных составляющих спектра (возникающих при появлении длинных последовательностей нулей или единиц). Для этого используются таблицы преобразования, по которым производится замена слов из m бит данных на слова из n канальных бит, причём всегда n > m. В устройствах воспроизведения цифровых сигналов канальный декодер выделяет из общего потока данных тактовые сигналы и выполняет обратное преобразование канальных n-битных слов в m-битные слова данных. После коррекции ошибок сигнал поступает в ЦАП.
Магнитная звукозапись — запись цифровых сигналов производится на магнитную ленту. Выделяют два типа записи:
продольно-строчная система записи — в которой лента движется вдоль блока неподвижных магнитных головок записи/воспроизведения (DASH,DCC)
наклонно-строчная система записи — в которой лента движется вдоль барабана вращающихся магнитных головок и запись осуществляется наклонно отдельными дорожками, что обеспечивает бо́льшую плотность, по сравнению с продольно-строчной системой записи. (R-DAT, ADAT, а также ранние системы, состоящие из ИКМ-приставки и видеомагнитофона)
Магнитооптическая запись — запись ведётся с помощью магнитной головки на специальный магнитооптический слой и в момент намагничивания кратковременно разогревается лазером до температуры точки Кюри. (Минидиск,Hi-MD)
На цифровых носителях и в персональных компьютерах для хранения звука (музыки, голоса и т. п.) применяются различные форматы, позволяющие выбрать приемлемое соотношение сжатия, качества звука и объёма данных.
Популярные форматы файлов для персональных компьютеров и соответствующих устройств:
Звуки можно записывать с помощью микрофона, который преобразует звуковые колебания воздуха в электрический сигнал. Затем этот сигнал может быть определён количественно, но оцифровка должна включать размер количественного определения (объём) и время[источник?].
Немного подробнее о разных форматах звуковых файлов:
WAV (произносится как английское слово «wave») — формат, который каждый раз сохраняет оцифрованное значение. Это приводит к большому количеству данных для среднесрочных записей. Другие форматы, в свою очередь, используют некоторые методы сжатия данных. Формат WAV очень популярен и широко используется в профессиональных приложениях, обрабатывающих оцифрованные аудиосигналы. Среди преимуществ — хорошее качество звука; поддерживается в браузерах без плагина. Однако к недостаткам формата можно отнести тот факт, что аудиоданные, как правило, хранятся в необработанном, несжатом формате, поэтому файлы обычно большие.
MP3 — ещё один популярный формат оцифровки аудио, который удаляет части аудиосигнала, которые человеческое ухо не может легко услышать. Результирующий звук по-прежнему звучит почти так же, как оригинал, но со значительно меньшим количеством битов. Это делает этот формат популярным для использования, особенно в Интернете, поскольку многие пользователи хотят музыку высокого качества, но с относительно коротким временем загрузки. Среди недостатков формата пользователи отмечают вероятность того, что может потребоваться автономный плагин для плеера или браузера, чтобы воспроизвести аудиофайл.
Формат AAC (Advanced Audio Coding) очень похож на вышеупомянутый поддерживаемый MP3, но он был разработан как преемник и предлагает лучшее качество и меньшие размеры файлов. Среди недостатков — файлы могут быть защищены от копирования, поэтому пользователь ограничен одобренными устройствами. Формат используется для музыки iTunes.
Ogg Vorbis — формат файла, предназначенный для эффективного распространения аудиофайлов по соединениям с умеренной пропускной способностью. Кодирование Vorbis может использоваться при более высоких скоростях передачи данных для большей точности. Плюсы в том, что программа бесплатная, открытый стандарт; поддерживается некоторыми браузерами (Firefox 3.5, Chrome 4 и Opera 10.5). Популярность к данному формату приходила постепенно.
FLAC (Free Lossless Audio Compression) — это формат файла, в котором музыка или звук хранятся в качестве без потерь. Если файл сжат, сжатие никоим образом не влияет на качество музыки, поскольку данные и обработка выполняются по другому принципу, нежели чем в других форматах (например, MP3).
WMA (Windows Media Audio) — лицензионный формат файлов, разработанный Microsoft для хранения и трансляции аудиоматериалов. Первоначально WMA был анонсирован как альтернатива MP3, но теперь преемником MP3 считается формат AAC (используется популярным интернет-магазином iTunes, как упоминалось выше). Достоинства WMA — очень хорошее качество звука; широко используется в интернете. Недостатки — файлы можно защитить от копирования; для некоторых устройств требуется скачивать проигрыватель отдельно.
Следует отметить, что для воспроизведения цифрового аудиофайла необходимо использовать какое-либо дополнительное обеспечение, такое как аудиоплееры, аудиоплагины и аудиопрограммное обеспечение.
Параметры, влияющие на качество цифровой звукозаписи[править | править код]
Основными параметрами, влияющими на качество цифровой звукозаписи, являются:
Запись цифрового звука в настоящее время осуществляется на студиях звукозаписи, под управлением персональных компьютеров и другой дорогостоящей и качественной аппаратуры. Также довольно широко развито понятие «домашней студии», в которой применяется профессиональное и полупрофессиональное звукозаписывающее оборудование, позволяющее создавать качественные записи в домашних условиях.
Применяются звуковые карты в составе компьютеров, которые производят обработку в своих АЦП и ЦАП — чаще всего в 24 битах и 96 кГц, дальнейшее повышение битности и частоты дискретизации, практически не увеличивает качества записи.