Перцептуальное кодирование

Запись или передача 16-разрядного цифрового кода с частотой дискретизации 44,1 кГц требует очень большой емкости носителя, используемого для записи информации, или широкой полосы частот для передачи сигнала. Это приводит к повышению цены цифровой аппаратуры. Некоторым цифровым устройствам присущи ограничения по объему информации, которую они могут хранить и передавать. Одним из примеров является система мини-диск, в которой обеспечивается запись цифровой аудиоинформации на 6-сантиметровых носителях. Другой пример — формат DVD-видео, в котором большая часть полосы частот расходуется на цифровой видеосигнал и остается очень мало места для 5.1-канальной фонограммы типа "Dolby Digital".

Это затруднение разрешается путем уменьшения количества битов, необходимых для кодирования звукового сигнала. Метод, называемый перцептуальным кодированием, позволяет существенно уменьшить скорость цифрового потока с минимальной потерей качества звука.

Формат звукозаписи "Dolby Digital" служит удачным примером использования перцептуального кодирования. При записи на компакт-диск 16-разрядного цифрового сигнала с частотой дискретизации 44,1 кГц скорость исходного цифрового потока составляет 705600 бит/с на канал (16x44100). Если бы при записи фонограммы фильма с шестью дискретными звуковыми каналами применяли аналогичную систему кодирования, то скорость цифрового потока достигла бы огромного значения 4233600 бит/с (4,23 Мбит/с). Это составляет более половины от максимальной скорости передачи информации в формате DVD, так что почти не осталось бы возможности для записи видеоинформации, требующей еще большей скорости цифрового потока. Перцептуальный кодер "Dolby Digital" формирует поток цифровой аудиоинформации всех шести каналов со скоростью всего 384000 бит/с. Это составляет менее одной десятой от объема данных, которые пришлось бы записать без применения перцептуального кодирования.

Давайте рассмотрим, как оно осуществляется. Перцептуальное кодирование использует свойства человеческого слуха для такого распределения имеющихся бит, чтобы они использовались для хранения звуков, которые мы можем слышать, и не расходовались на кодирование звуковых частот, выходящих за границы воспринимаемого нашим слухом. Например, психоакустический эффект маскирования (описан в Приложении А) не позволяет нам слышать тихие звуки в присутствии более громких, близких по частоте. Поскольку музыка кодируется столь малым количеством бит, перцептуальное кодирование вносит сильные шумы и погрешности в звуковой сигнал. Но с этими шумами и искажениями проводятся искусные манипуляции, благодаря которым они оказываются ниже порога маскирования, — при этом их не слышно. Например, если большая часть энергии музыкального сигнала сосредоточена в данный момент между частотами 1 кГц и 3 кГц, шум также будет сконцентрирован в этой полосе частот. Спектр шума постоянно смещается таким образом, чтобы шум оказывался "спрятанным" за звуковым сигналом. Частотные полосы с большим количеством информации занимают большое число бит, полосы с малым количеством информации — меньшее число бит. Это лишь очень приблизительное описание метода перцептуального кодирования. На практике все гораздо сложнее.

Мне пришлось присутствовать при замечательной демонстрации перцептуального кодирования. Вначале я слушал музыкальный отрывок, который имел отношение сигнал/шум равное 13 дБ — это смехотворно низкая величина. Для сравнения, большинство звуковой аппаратуры имеет отношение сигнал/шум порядка 80 дБ и выше. При 13 дБ звук был настолько зашумлен и искажен, что музыку можно было различить с трудом. Затем я прослушал ту же музыку, в которой опять-таки отношение сигнала к шуму составляло 13 дБ, но в этом случае она звучала прекрасно. С объективной точки зрения оба представления музыки имели в точности одинаковое количество шума. Отличие заключалось в том, что во втором варианте спектр шума формировался таким образом, что его эффективно маскировал звуковой сигнал, закодированный с использованием большого количества разрядов.

Отдавая должное большим возможностям и полезности этой технологии, надо, к сожалению, признать, что некоторые исследователи данного метода начали им злоупотреблять. Они провозгласили первые перцептуальные кодеры "прозрачными", то есть дающими сигнал, не отличимый от исходного, — даже несмотря на то, что кодеры давали ужасное звучание. Более того, в своем рвении и далее.снижать скорость передачи информации сторонники перцептуального кодирования принесли в жертву качество музыки. Эти исследователи говорят о "психоакустической и информационной избыточности", мало обращая внимание на качество звучания. Вместе с этой мощной технологией появилась определенная высокомерность; перцептуальное кодирование было объявлено подходящим для создания архивных фонограмм, что представляется воистину пугающей идеей. Наше музыкальное наследие должно сохраняться с использованием наилучшей технологии, а не более экономичной.

Перцептуальное кодирование имеет свою нишу: оно дает возможность получить приемлемое качество звучания в формате DVD-видео, обеспечивает длительность звучания 6-сантиметрового мини-диска 74 минуты и может улучшить качество музыки, передаваемой через "Интернет". Но имейте в виду, что перцептуальное кодирование родилось из экономических соображений, а не из желания усовершенствовать современную технологию звукозаписи и воспроизведения музыки.

Читателям, желающим больше узнать о цифровой аудиотехнике, рекомендую прекрасную книгу Кена Полмана "Принципы цифровой аудиотехники". (Ken Pohlmann, Principles of Digital Audio)