Технические
науки/6. Электротехника и радиоэлектроника
К.т.н.
Оболонин И.А.
Сибирский государственный
университет телекоммуникаций и информатики, Россия
Оценка влияния
аналого-цифрового преобразования на искажения при компрессии цифровых
аудиоданных
В настоящее время в
радиовещании, профессиональной и бытовой аудиотехнике широко используется
компрессия цифровых аудиоданных, которая неизбежно сопровождается искажениями
качества стереофонического звучания. При этом качество аналого-цифрового
преобразования (АЦП) подразумевается
идеальным. В работе рассматриваются аспекты аналого-цифрового
преобразования, оказывающие существенное влияние на качество цифрового звука с
компрессией аудиоданных.
Компрессия цифровых аудиоданных
в психоакустических моделях стандартов МРЕG неизбежно сопровождается искажениями качества стереофонического
звучания (фиксируемыми экспертами), такими как пространственное впечатление,
прозрачность звучания, естественность и богатство тембров инструментов и
голосов, восприятие акустической атмосферы первичного помещения. Это связано с
недостатками самой модели.
В психоакустических моделях стандартов МРЕG не учтены:
¾ механизмы
временной маскировки сигналов;
¾ пространственной
демаскировки источников звука, составляющих стереопанораму как по фронту, так и
по глубине;
¾ особенности восприятия реверберационных составляющих стереофонических сигналов.
Однако на качество звучания существенное
влияние оказывает и собственно аналого-цифровое преобразование исходного
аудиосигнала.
Многие специалисты в области
аудиотехники отмечают, что цифровые записи, сделанные с аналоговых магнитных
лент, часто звучат хуже оригинала. По их мнению, звучание цифровых записей
недостаточно эмоционально, порой безжизненно. Нередко слышны неприятные
«цифровые» призвуки, особенно в области высоких частот, возникает ощущение
«шероховатого», «грязного» звука.
Предполагают, что
эти искажения связаны недостаточным числом
разрядов, низкой частотой
дискретизации, невысоким качеством изготовления многоразрядных АЦП и ЦАП, а также погрешностями
многократного округления при цифровой обработке звука.
В предлагаемой работе
рассматривается три аспекта аналого-цифрового преобразования, по мнению автора,
оказывающие наиболее существенное влияние на указанные выше искажения. Это
специфический характер спектра ошибок квантования, фильтрация сигналов при
аналого-цифровых и цифроаналоговых преобразованиях и защита АЦП от перегрузок,
вызывающая нелинейные искажения аудиосигнала.
Влияние ошибок квантования
В технической литературе [1]
вопрос о спектре ошибок квантования рассмотрен для одного частного случая
широкополосного звукового сигнала, который имеет равномерное распределение по
частоте и уровню. Для такого сигнала ошибки квантования носят случайный
характер и поэтому их называют шумом квантования. Спектральная плотность
мощности этого шума имеет равномерное распределение от 0 Гц до частоты
Найквиста. Фактически этот шум является белым и, в отличие от искажений
цифрового звука, он воспринимается на слух без неприятных ощущений.
Очевидно, что музыкальный
сигнал нельзя отождествлять с шумовым хотя бы потому, что он несет звуковую
информацию. От шума он отличается тем, что в нем ошибки квантования в той или
иной мере коррелированны с самим сигналом и поэтому на слух наиболее часто они
воспринимаются как призвуки. В технической литературе звуки ошибок квантования
на музыкальных сигналах называют гранулярным шумом, хотя на слух эти искажения
шумом не являются, а являются именно ошибками, или погрешностями.
Квантованию подвергается
АИМ-сигнал с очень широким дискретным спектром. Ошибки
квантования, которые возникают при этой операции, - это ошибки квантования АИМ-сигнала Таким образом, цифровой звук
отличается от аналогового тем, что он принципиально является продуктом
амплитудно-импульсной модуляции.
В [1] показано, что спектр ошибок
квантования и их звучание зависит от коэффициента кратности k, частоты дискретизации fs и частоты сигнала F, а также показано, что спектр ошибок
квантования существенно разный при четных и нечетных значениях k, как на кратных, так и на субкратных частотах.
Также в работе [1]
исследовано звучание ошибок, квантования в зависимости от вида звуковых
тестовых сигналов и коэффициента кратности k. Было установлено, что
главное отличие отклонений звукового сигнала от субкратных частот от
аналогичного отклонения от кратных частот заключается в том, что у этих
сигналов исходно принципиально разные спектры ошибок квантования, и это
оказывает влияние на звучание ошибок квантования.
Влияние
фильтрации
На входе АЦП и на выходе ЦАП
расположены фильтры нижних частот (ФНЧ), ограничивающие спектр входных частот и
устраняющие высокочастотные составляющие выходного сигнала соответственно.
Подавление сигнала ФНЧ на
частоте, равной половине частоты дискретизации, должно быть не менее 60 дБ.
Крутизна ската ФНЧ получается при этом очень высокой (120дБ/октаву). Для
достижения таких значений крутизны должны быть созданы ФНЧ высокого порядка.
Расчеты для получивших наибольшее распространение в аудиотехнике фильтров
Баттерворта и Чебышева показали их нереализуемость в рамках аналоговых технологий. Кроме того, такие фильтры имеют значительные
недостатки, главным из которых является существенно нелинейная фазовая
характеристика, а это приводит к заметным на слух искажениям аудиосигналов,
проявляющихся в потере «прозрачности» звучания.
Известным методом решения
данной проблемы является использование ИКМ кодеров (декодеров), в которых АЦП
(ЦАП) работают на повышенной частоте, что позволяет значительно снизить
требования к крутизне ската (соответственно и к порядку) аналогового ФНЧ,
осуществляющего предварительную фильтрацию первичного сигнала. При таком методе
основное затухание на граничной частоте полосы непропускания обеспечивается
цифровым фильтром.
При выборе структуры
цифрового фильтра предпочтения в данном случае имеют нерекурсивные фильтры.
Решающим преимуществом таких
фильтров является возможность получения линейной фазочастотной характеристики.
В этом случае при определении требований (следовательно, и порядка) аналогового
ФНЧ наряду с предварительной фильтрацией необходимо ориентироваться на
обеспечение требуемой неравномерности группового времени запаздывания в полосе
пропускания фильтра.
Влияние
защиты АЦП от перегрузок
При компрессии аудиоданных в
психоакустических моделях стандартов MPEG и АС шаг
квантования изменяется в соответствии с уровнем кодируемого сигнала в
субполосе. Т.е. шумы квантования возрастают пропорционально росту кодируемого
сигнала. Однако кодирование ведется так, что уровень шумов не превышает
относительный порог слышимости (шумы маскируются полезным сигналом). При этом
не учитывается тот факт, что при первичном ИКМ преобразовании уровень
аудиосигнала может превышать квазимаксимальный по которому выбирается порог
перегрузки аналого-цифрового преобразования (АЦП). За счет ограничения уровня
входного сигнала АЦП возникают нелинейные искажения. В психоакустической модели
осуществляется перераспределение количества бит, отводимые на субполосу в
фиксированный интервал времени. При росте уровня сигнала количество бит
уменьшается, т.е. растет шаг квантования. Но вместе с первичным сигналом с
таким шагом квантуются и высшие гармоники, возникшие при превышении квазимаксимального
уровня.
Перегрузки АЦП на входе цифровых
аудиотрактов недопустимы, поскольку АЦП порождают собственные побочные эффекты
(артефакты) и возникающие искажения в корне отличаются от нелинейных искажений
в аналоговых трактах (с точки зрения слухового восприятия). В аналоговых
трактах перегрузки (превышение номинального уровня), длящаяся несколько
миллисекунд слухом не воспринимаются (свойство слуха).
Вероятность превышения квазимаксимального уровня
для сигнала с гауссовским законом распределения составляет примерно две сотых,
что соответствует появлению при воспроизведении шести щелчков в течение 5 минут
(только за счет перегрузки АЦП) [3].
Считается, что при воспроизведении сигнала допускается не более
одного заметного на слух щелчка в час. Поэтому необходимы меры, не допускающие
перегрузку АЦП.
Тривиальным решением является применение на
входе АЦП жесткого (безынерционного) ограничения на уровне, не превышающем
порог перегрузки. Такое решение приводит к появлению нелинейных искажений и
потере высокочастотных составляющих в области превышения порога ограничения.
Другое решение рассматриваемой проблемы -
это компрессия сигнала в верхней части его динамического диапазона. В этом
случае сохраняются высокочастотные составляющие исходного сигнала, но нелинейные
искажения неизбежны.
От выбора закона компрессии будет зависеть
уровень нелинейных искажений при воспроизведении аудиосигналов.
Кроме того следует учитывать вероятность
появления того или иного уровня сигнала [4].
Оценка нелинейных искажений
Для одночастотного периодического сигнала
методом коэффициентов гармоник была получена [5] сравнительная оценка
нелинейных искажений, возникающих при безынерционном ограничении и компрессии
верхней части динамического диапазона звукового сигнала (по логарифмическому
закону), для которых известна статистика их распределения во времени (функция
распределения уровней во времени). На рисунке 6 представлены полученные
зависимости коэффициента гармоник для ограничителя KГ(N) (1) и компрессора верхней частоты динамического диапазона KГK(N) (2).
Рис.1. Зависимости КГ (1) КГК(2) от уровня
сигнала
Вероятность того, что коэффициент гармоник
превысит то или иное значение зависит от появления того или иного уровня
сигнала.
Вероятность проявления сигнала уровня N
где в соответствии с экспериментальными
данными [6] Nmin= -60 дБ, a=-24 дБ, s=10 дБ. На рисунке 7 приведена рассчитанная зависимость P1(N).
Вероятность того, что
коэффициент гармоник превысит то или иное значение, равна произведению коэффициента
гармоник для заданного уровня сигнала
КГК на вероятность его превышения.
Для ограничителя
Рис.2. Вероятность превышения уровня N
Для компрессора
Для рассматриваемого примера (музыкальные
и речевые отрывки сигналов звукового вещания) рассчитанные вероятности
приведены на рисунке 8.
Рис.3. Зависимости вероятности превышения коэффициентом гармоник некоторого
уровня от значения уровня сигнала N (1-для
ограничителя, 2-для компрессора)
Анализ полученных
зависимостей позволяет сделать вывод о несущественном влиянии нелинейных
искажений на качество звучания при защите АЦП от перегрузок с помощью
компрессии верхней части динамического диапазона сигнала, для статистики
аудиосигналов приведенных в [3].
Однако нельзя гарантировать большую
вероятность того, что статистики разнообразных аудиосигналов с большой
вероятностью будут близки к приведенным в [3].
Известно [4], что отношение
сигнал/шум квантования для квазимаксимального аудиосигнала:
[дБ],
где m – число
бит на отсчет.
Отношение сигнал/шум для
продуктов нелинейности второго и третьего порядка можно получить из выражения:
[дБ],
где РНИ -
мощность сигналов продуктов нелинейности второго и третьего порядков; U2 и U3
–
напряжения второй и третьей гармоник соответственно; КГ –
коэффициент гармоник.
Для примера можно предположить, что сигнал превышает
квазиоптимальный на 4 дБ, в этом случае в стандарте MPEG квантование в
психоакустической модели ведется с разрешением 6 бит на отсчет.
Тогда отношение сигнал/шум квантования составит
[дБ].
Если для приведенного примера КГ = 0,1 то
отношение
[дБ].
Для приведенного примера
уровень шумов квантования равен уровню сигнала продуктов нелинейности.
Как известно, аудиосигнал
является нестационарным случайным процессом. Причем статистики аудиосигналов
значительно отличаются для разного вида звучаний. Следовательно, нельзя исключать
существенного превышения порога перегрузки АЦП (пусть и кратковременного). В
этом случае уровень сигналов продуктов нелинейности становится больше уровня
шумов квантования, и они в наибольшей степени влияют на качество
воспроизведенного сигнала.
Заключение
Проведенный анализ позволяет сделать вывод о
том, что наибольшее влияние на качество воспроизводимого звука при его цифровой
передачи или звукозаписи кроме собственно компрессора цифровых аудиоданных,
оказывают ошибки квантования, проявляющиеся в виде звучаний, похожих на звон
колокольчиков и рокот.
При грамотном построении АЦП применение
компрессии входного сигнала в верхней части его динамического диапазона
позволяет устранить потери высокочастотных составляющих сигнала и уменьшают
нелинейные искажения по сравнению с ограничением.
Нелинейные искажения зависят от выбора вида компрессий,
но ввиду малой вероятности появления больших уровней сигнала решающим здесь
является отсутствие перегрузок АЦП, которое приводит к катастрофическим
последствиям.
При использовании для цифровой передачи
сигналов звукового вещания и цифровой звукозаписи ИКМ кодеров (и декодеров) с
передискретизацией наименьшие искажения (заметные на слух) получаются при
наилучшей линейности фазовых характеристик селективных устройств кодеров и
декодеров.
Для получения линейной фазочастотной
характеристики в АЦП и ЦАП с передискретизацией необходимо использовать
нерекурсивные цифровые фильтры.
Литература
1. Вологдин,
Э. Как возникают и звучат ошибки квантования // Журнал “Звукорежисер”. - 2007.-
№6, №7. с. 28-41, 32-40.
2. Оболонин И.А. Анализ искажений аудиосигналов при цифровых методах передачи и
звукозаписи. // Материалы Российской НТК «Информатика и проблемы
телекоммуникаций». - Новосибирск, 24, 25 апреля 2008. – с. 233-234.
3. Ковалгин Ю.А. Радиовещание и электроакустика
// М.: Радио и связь, 1999. - 792с.
4 Выходец А
В., Гитлиц М.В. Радиовещание и электроакустика // М.: Радио и связь, 1989. -
542с.
5 Оболонин
И.А., Портфиненко А.Н. Оценка искажений при компрессии аудиосигнала на входе
цифровых трактов. // Материалы 11-й. международной НТК «Перспективы развития
современных средств и систем телекоммуникаций. - Екатеринбург 23-25 апреля
2005. - c. 117-120.
6 Дворецкий И.М, Дриацкий И.Н. Цифровая передача сигналов звукового
вещания. // М.: Р. - С. 117-120. Радиосвязь. 1987.-191с