Поддубный
Е.А.
Донецкий
национальный технический университет, Украина
Исследование
программного кодека IP-телефонии для низкоскоростных каналов
ІP-телефония – это современный вид связи,
основанный на технологии VoIP, – технологии передачи голосовой
информации через цифровые каналы передачи данных, которые используют протокол
ІP. Перед отправлением в каналал сети передачи данных голосовая информация
оцифровывается, сжимается и разбивается на пакеты. Пакеты, которые передаются в
сети, чаще всего разными маршрутами, снова собираются в единое целое на приеме.
Этот принцип реализации ІР-телефонии и обуславливает две главных проблемы –
возможное снижение качества голоса при компрессии и искажение голоса при
передачи голосовых пакетов через сеть передачи данных [1].
Основными параметрами качества передачи голоса
принято считать: разборчивость и качество голоса, идентификацию голоса
абонента, отсутствие специфических искажений. Таким образом, одной из основных
причин снижения показателей качества голосовых сигналов на выходе реальных
систем VoIP в сравнении с исходными сигналами на входе является ограниченная
пропускная способность цифровых каналов связи[2]. Исходя из этого, в ходе
разработки программного кодека, необходимо выбирать между качеством связи и
пропускной способностью канала. Поэтому задача проектирования качественных кодеков
для низкосокростных каналов с высоким уровнем помех является актуальной[3].
Таким
образом, целью работы является исследование разработанного программного низкоскоростного
кодека ІР-телефонии, который обеспечитвает хорошее качество голоса при
небольшой пропускной способности канала, при этом характеризуется низкой
алгоритмической задержкой обработки сигнала, высоким уровнем устойчивости к
потерям пакетов и задержек передачи в ІР-сети.
Для
реализации программного кодека ІР-телефонии было принято решение использовать
открытый кодек на базе LPC-модели открытого кодека iLBC. Для повышения эффективности кодирования в модифицированном кодеке использовалось
векторное квантования вместо скалярного. Векторное квантование снижает итоговую
скорость цифрового потока вокодера до 12,35 кбит/с (ниже чем для режима с 30 мс
кадром прототипа) и снижает время обработки сигнала за счет использования
параллельных вычислений.
Исследование разработанного программного кодека (iLBC-M) проводилось
для записи
нормального (без искажений) мужского голоса с записью сообщения на русском языке. Прототипом
для сравнения разработанного кодека будут базовые кодеки iLBC_20 и iLBC_30.
Во временном пространстве сигналы на входе кодера
и выходе декодера iLBC-M имеют вид (рисунок 1).
Рисунок 1 – Сигналы на входе кодера и выходе
декодера iLBC-M для мужского голоса с записью сообщения на русском языке
Анализ сигнала во временном
пространстве показал, что форма сигнала, амплитуда после оброботки кодеком не
изменяется, дополнительных составляющих (помех, шумов) не обнаружено. При масштабировании
сигнала можно увидеть незначительную разность составляющих сигнала по уровню, но они незначительны
и не влияют на качество звучании (было проверено аудио прослушиванием).
Количество фреймов на выходе
кодера для 20 мс фреймов составляет 1201, для 30 мс – 800.
Также было установлено, что время обработки сигнала кодеком iLBC-M меньше ,
чем у прототипов и составляет 17 мс (по сравнению с iLBC_20-22 мс и iLBC_30-24
мс). Это достигается параллельной обработкой информации при векторном
квантовании (по сравнению со скалярным у прототипов).
Скорость потока данных на выходе
кодера iLBC-M составляет 12,35 кбит/с, что меньше чем у прототипов.
Также было проведено исследование
прохождения кодированного сигнала через канал сети. Результаты исследования
влияния потерь пакетов на качество сигнала по методу оценки качества голоса
PESQ представлены на рисунке 2.
Рисунок 2 – Исследование влияния потерь пакетов
на качество сигнала по методу PESQ
Видим, что для разработанного
кодека iLBC-M значение качества сигнала с нулевым уровнем потерь по методу PESQ
составляет 4,26 баллов, для iLBC_20-4,1 балла, для iLBC_30-3,25 баллов. Таким
образом, качество сигнала при обработке разработанным программным кодеком выше
чем у прототипов.
Кроме того, графики показывают,
что наиболее устойчивым к потерям является разработанный кодек. В области от 1
до 5% потерь снижения качества голоса незначительное (до 4,23-4,21) при
использовании iLBC-M. Значительный спад качества голоса можно увидеть при
уровне потерь от 15 до 18% пакетов.Результаты исследования влияния задержек
передачи пакетов на качество сигнала по методу PESQ приведено на рисунке 3.
Рисунок 3 – Исследование влияния задержек
передачи пакетов на качество сигнала по методу PESQ
Видим, что для разработанного
кодека оценка PESQ при росте уровня задержек передачи пакетов лучше чем для
прототипа. Значительный спад качества сигнала наблюдается при передаче VoIP трафика
в каналах сети с задержкой больше 150 мс. При задержке в 150 мс PESQ для iLBC-M
составляет 4,05 балла (по сравнению с iLBс_20-3,65 балла, iLBс_30-2,98 балла).
Результаты исследования влияния попускной
способности канала на качество сигнала по методу PESQ приведены на рисунке 4.
Рисунок 4 – Исследование влияния попускної
способности канала на качество сигнала по методу PESQ
Анализ показал, что в критической
для передаче сигнала без значительных снижений качества области от 2 до 28 кбит/с
наиболее стойким к снижению пропускной способности является кодек iLBC-M. До
значения 2 кбит/с голос вообще не слышно, после значения 28 кбит/с графики
направляются к значению PESQ в 4,5 баллов, качество голоса высокое. Допустимое
качество звучания голоса будет обеспечено кодеком iLBC-M при пропускной
способности канала от 12 кбит/с.
Результаты исследования разработанного кодека
показали, что он
является эффективным для использования в конечных устройствах ІР-телефонии.
Полученные средние значения ключевых параметров обработки сигнала лучше чем у
прототипа:
-
средняя
оценка PESQ для кодека iLBC-M согласно проведенным исследованием – 4,1 балла (соответствует
MOS=4,3, у в прототипа MOS=4,14);
-
средняя
задержка кодирования/декодирование и пакетизации (время обработки
сигнала) – 16 мс
(прототип iLBC – 22 мс);
-
скорость
на выходе кодера – 12,35 кбит/с
(прототип iLBC - 13,33/15,2 кбит/с);
-
стойкость
к потерям пакетов в среднем на 5% выше прототипа;
-
стойкость
к задержкам передачи в сети в среднем на 7% выше прототипа;
-
стойкость
к уменьшению пропускной способности на 5% выше прототипа;
Литература:
1. Шелухин О.И., Лукьянцев
Н.Ф. «Цифровая обработка и передача речи». М., «Радио и связь», 2000.
2.
Рабинер
Л.Р Цифровая обработка речевых сигналов/ Л.Р. Рабинер, Р.В. Шафер.- М.: Радио и
Связь. 1981.-495 с.
3.
Росляков А.В. IP-Телефония/ А.В. Росляков, М.Ю. Самсонов,
И.В. Шибаева. – 2е
изд. – М.: Эко-Трендз, 2001. – 252с.