Квантование по уровню

Мы узнали, как при помощи дискретизации по времени сохраняется временная информация о звуковом сигнале; давайте теперь рассмотрим другой вопрос: как при помощи квантования по уровню кодируется информация об амплитуде сигнала.

При квантовании по уровню вырабатываются двоичные числа, которые представляют значения отсчетов аналогового сигнала. Двоичные числа являются цифровым представлением напряжения аналогового звукового сигнала в моменты дискретизации по времени.

Количество битов, используемых для кодирования отсчетов звукового сигнала, называется разрядностью квантования по уровню. Аналогично тому, как частота дискретизации определяет ширину полосы частот цифровой аудиосистемы,

разрядность квантования по уровню определяет ее динамический диапазон, разрешающую способность и уровень нелинейных искажений. Большинство цифровых аудиосистем используют сегодня как минимум 16-разрядные слова, при этом разрядность наиболее современных систем доходит до 20. Чем больше длина слова, тем точнее выходной сигнал будет соответствовать исходному.

Длина слова при квантовании определяет количество уровней квантования, используемых для кодирования отсчетов звукового сигнала. Оно равно 2х , где х— это разрядность слова. Например, 16-разрядное квантование обеспечивает 216, то есть 65536 уровней квантования отсчетов аналогового сигнала. Система с числом разрядов 18 увеличивает число уровней квантования в четыре раза, до значения 262144, а 20-разрядное квантование обеспечивает 1048576 уровней. Чем больше разрядность слова, тем шире динамический диапазон, меньше нелинейные искажения и шум, выше разрешающая способность по уровню.

В отличие от процесса дискретизации по времени, квантование по уровню вносит в кодируемый сигнал погрешности. Преобразование бесконечного множества значений аналоговой величины в конечное количество двоичных чисел по самой своей природе является аппроксимационным процессом. Погрешности появляются потому, что результат квантования фактически никогда не является точным представлением напряжения аналогового сигнала. Разность между фактическим значением аналогового сигнала и представляющим его двоичным числом называется погрешностью квантования по уровню, или шумом квантования.

Что такое High-end и Hi-fi?

На рис. В-4 показано, как появляются погрешности квантования. Значения аналогового сигнала не совпадают со значениями, представляемыми при помощи двоичных чисел. Например, первая выборка (крайняя левая вертикальная штриховая линия) попадает между уровнями квантования 100111 и 101000. Поскольку не существует значения 100111,25, квантующее устройство просто округляет его до ближайшего дискретного уровня квантования (100111), хотя это число и не является абсолютно точным. Разность между напряжением, представляемым числом 100111 (1,3 В), и фактическим напряжением звукового сигнала (1,325 В) дает погрешность квантования. При восстановлении аудиосигнала по округленному двоичному числу 100111 будет выработан не вполне точный аналоговый сигнал. В результате появится искажение исходной формы звуковой волны.

Наихудший случай — это когда аналоговый сигнал имеет значение, попадающее точно между двумя уровнями квантования. Именно такая ситуация имеет место для второго слева отсчета на рис. В-4. Разность между отсчетом аналогового сигнала и уровнем квантования, представляющим этот отсчет, будет наибольшей.

Погрешность квантования выражают в процентах от младшего разряда (MP). Для первой слева выборки погрешность квантования составляет одну четверть MP, для второй — половину MP. Обратите внимание, что погрешность квантования никогда не превосходит половины значения MP. Следовательно, чем меньше

величина шага квантования по уровню, тем меньше погрешность. Добавление одного разряда удваивает число шагов и вдвое уменьшает погрешность квантования. Поскольку уменьшение вдвое дает разницу в 6 дБ, отношение сигнала к шуму в цифровой системе увеличивается на 6 дБ при добавлении каждого дополнительного разряда в слове квантования. Цифровая система с 18-разрядным квантованием по уровню будет иметь шум на 12 дБ ниже, чем система с 16-разрядным квантованием.

Отношение сигнал/шум цифровой системы в децибелах можно приблизительно определить, умножив разрядность слова квантования на 6. В системе с 16-разрядным квантованием обеспечивается отношение сигнал/шум около 96 дБ, а в 20-разрядной цифровой аудиосистеме оно составит примерно 120 дБ, то есть на 24 дБ выше, чем в первом случае.

Погрешность квантования воспринимается на слух как грубая зернистость звука низкого уровня, например, реверберационного процесса. Вместо того чтобы слышать постепенное затухание звука до полного его исчезновения, мы замечаем увеличение шероховатости и зернистости по мере затухания сигнала. Это происходит потому, что по мере снижения уровня сигнала погрешность квантования начинает составлять все больший процент от его величины.

Увеличение нелинейных искажений по мере снижения уровня сигнала характерно для цифровой аудиотехники; во всех типах аналоговой записи повышенные искажения проявляются при высоком уровне сигнала. Рост искажений при снижении уровня сигнала делает их намного более заметными. Увеличение разрядности слова квантования с 16 до 20 значительно уменьшает остроту этой проблемы.

Учтите, что отношение сигнал/шум и значение полного коэффициента нелинейных искажений, указанные в паспорте цифровой аудиосистемы, относятся к сигналу максимального уровня. Большую часть времени уровень музыкального сигнала существенно ниже и таким образом ближе к уровню шума. Искажения определяются не полным количеством разрядов цифровой системы, а числом разрядов, используемых для квантования сигнала в данный момент. Именно вследствие этого искажения и шум в цифровых аудиосистемах обратно пропорциональны амплитуде сигнала, из-за чего возникают сложности с сигналами низкого уровня.

Установка уровня записи при использовании цифровых систем принципиально отличается от подобной операции для аналоговых систем. В идеальном случае наивысший пик во всей аудиопрограмме должен в точности соответствовать полному цифровому уровню, т.е. использовать все разряды цифрового кода. Если уровень записи установлен так, что наивысший пик на 6 дБ ниже уровня полной шкалы, то это равнозначно отбрасыванию одного бита из слова квантования и снижению отношения сигнал/шум на 6 дБ. Если амплитуда аналогового сигнала выше, чем напряжение, представляемое наибольшим числом, устройство квантования просто выходит за пределы своих возможностей по числу разрядов и формирует наибольшее доступное значение, ограничивая таким образом музыкальные пики. Возникает искаженная форма сигнала, которая создает на пиках неприятный "скрипучий" звук. Если у вас есть устройство цифровой записи на магнитную ленту в формате DAT, вы можете просмотреть уровень записи на компакт-диске, подключив цифровой выход проигрывателя компакт-дисков к цифровому входу магнитофона. Его индикатор покажет точный уровень записи на компакт-диске. Если наивысший пик никогда не достигает полной шкалы, это значит, что часть разрешающей способности потеряна вследствие неоптимальной записи.

Учтите, что уровень звуковой программы с очень широким динамическим диапазоном будет большую часть времени находится близко к уровню шума квантования, в отличие от сигнала с ограниченным динамическим диапазоном.

Пики сигнала, имеющего широкий динамический диапазон, будут примерно соответствовать уровню полной шкалы, следовательно, сигнал с существенно меньшим уровнем будет кодироваться меньшим числом разрядов. Эта проблема особенно остра в классической музыке, имеющей очень широкий динамический диапазон. Инженеры звукозаписи вынуждены сжимать динамический диапазон при записи классической музыки. К этой мере прибегают и продюсеры поп-музыки, которые хотят, чтобы их записи звучали по радио громче, чем другие песни. Жесткое ограничение динамического диапазона делает поп-музыку громкой в течение всего времени, но это достигается за счет снижения ее динамичности, естественности и мощности ритма.

Уровни цифрового сигнала рассчитываются относительно сигнала полной шкалы, соответствующего единичным значениям цифр всех разрядов. При данном количестве разрядов большего числа быть не может. Этот эталонный уровень называется 0дБР8, где обозначение FS (Full Scale) означает "полной шкалы". Например сигнал с уровнем — 20 дБР8 на 20 дБ ниже сигнала полной шкалы.