Орленко А.Н.
Донецкий
Национальный Технический Университет
Некоторые концепции использования частотно-временного анализа в
телекоммуникационных системах
Введение
Наиболее распространенным классом сигналов
в телекоммуникационных системах является класс нестационарных сигналов. Более
того, фактически все информационные сигналы (то есть те сигналы, ради которых
существуют телекоммуникации) являются нестационарными. Использование
преобразования Фурье для анализа нестационарных сигналов не может дать
удовлетворительных результатов, поскольку оно проецирует сигнал на волны
бесконечной длительности, то есть оно может дать ответ какие частоты
присутствуют в сигнале и какие им соответствуют амплитуды и начальные фазы, но
абсолютно не говорит, когда появляются эти частоты. Таким образом
преобразование Фурье просто не учитывает явление нестационарности.
Самый простой путь, чтобы описать сигнал
одновременно в частотной и временной области состоит во введении понятия
мгновенной частоты.[1] Мгновенную частоту сигнала можно получить из
аналитического сигнала, который определяется по формуле
, (1)
где – преобразование
Гильберта сигнала .
Мгновенная частота характеризует локальное
поведение частоты как функцию времени и определяется как
. (2)
Однако понятие мгновенной частоты основано
на предположении, что в каждый момент времени существует только один частотный
компонент. То есть оно также не адаптировано к анализу большого количества
сложных нестационарных сигналов. Для анализа таких сигналов необходимым
является использование более сложных частотно-временных методов анализа.
Частотно-временные
распределения
Частотно-временной анализ (ЧВА)
производится с использованием совместных частотно-временных распределений
Любое частотно-временное распределение
может быть получено из выражения
(3)
где - некоторая произвольная,
функция, называемая ядром. [2]
Если в качестве ядра использовать , то получим спектрограмму
(4)
Спектрограмма является самым
распространенным методом частотно-временного анализа, но она имеет существенный
недостаток: ядро зависит от взвешивающего окна. Всегда имеет место компромисс:
чем короче окно, тем лучше разрешение по частоте, но тем хуже разрешение по
времени и наоборот. [1] Такого
недостатка лишено распределение Вигнера-Виля, для которого :
(5)
Это распределение удовлетворяет очень
многим математическим свойствам: сохранение энергии, выполнение маргинальных
отношений, унитарность и др. Кроме того, оно является действительно
определенным. Но, как и для любого другого билинейного распределения имеет
место принцип квадратичной суперпозиции [1]:
(6)
где - кросспреобразование Вигнера-Виля между x
и y. То есть
при анализе многокомпонентных сигналов (к примеру, полезный сигнал+шум)
преобразование Вигнера-Виля дает интерференционный составляющие, что
значительно усложняет интерпретацию результатов.
Чои и Вильямс предложили использовать
экспоненциальное ядро , которое позволило в наибольшей степени уменьшить
интерференционные составляющие распределения, характерные для распределения
Вигнера-Виля. [3] Распределение Чои-Вильямса рассчитывается как:
(7)
Концепция
речевого кодека, который использует ЧВА
Появление такого распределения как
распределение Чои-Вильямса, в котором энергия распределяется в соответствии с нашими
интуитивными представлениями, а также обеспечивается значительно более высокая
разрешающая способность по сравнению со спектрограммой, может быть очень
полезным при анализе в частности речевых сигналов, которые представляют собой
едва ли не самый сложный пример нестационарности. Более высокая разрешающая
способность поможет выявить более тонкие особенности поведения сигнала и в последующем
реализовать их при синтезе. Отсутствие или максимально сниженный уровень ложных
значений позволит обойтись более простыми схемами и алгоритмами анализа и
синтеза таких сигналов.
Можно предложить речевой кодек, составляющей
частью которого является частотно-временной анализ. Блок-схема такого кодека
представлена на рисунке 1.
Рисунок 1 – Блок-схема речевого кодека, использующего
ЧВА
В целом работа кодека разделяется на две
части: анализ и синтез. Анализ выполняется на передающей стороне и включает три
процедуры: расчет частотно-временного распределения (ЧВР), трешхолдинг,
векторизация. Расчет ЧВР позволяет получить на выходе матрицу с данными,
описывающими поведение сигнала в частотно-временной области. Трешхолдинг позволяет
удалить из распределения малозначащие компоненты и уменьшить тем самым
избыточность. После этого данные нужно перевести в векторную форму, что должно
позволить значительно сократить их объем. Именно векторные данные и передаются
по каналу связи.
На приемной стороне осуществляется синтез
сигнала. Сначала необходимо извлечь из полученных векторных данных информацию о
поведении компонент сигнала и пересчитать по этим данным параметры
синтезирующей схемы, которая осуществляет непосредственно синтез. В ее качестве
можно использовать схему, представленную в [4] В этом случае необходимыми
параметрами являются: частота основного тона голосового источника,
интенсивность сигнала голосового источника, резонансные частоты формантных
фильтров и их полосы пропускания, полоса запирания шумового фильтра.
Демодуляция
сигналов с использованием ЧВА
В [5] был предложен подход по использованию
частотно-временного анализа для демодуляции дискретно модулированных сигналов с
частотной манипуляцией несущей. Этот подход базируется на идее использования
корреляционного приемника. Структура такого приемника изображена на рисунке 2.
Рис. 2 Структурная схема демодулятора, использующего
ЧВА
В отличие от обычного корреляционного
приемника, в данном случае используется не сигнал и опорные сигналы, а их
частотно-временные распределения. Именно это обстоятельство и обуславливает
наличие в схеме звена вычисления частотно-временного распределения поступающего
сигнала. Поскольку распределение Чои-Вильямса не имеет проблем с разрешающей
способностью как, например, спектрограмма и позволяет максимально подавить
интерференционные составляющие, которые ухудшают характеристики распределения
Вигнера-Виля, то предлагается использовать именно его.
Далее необходимо вычислить связь между
матрицей, содержащей данные о частотно-временном распределении поступающего
сигнала и матрицами, содержащими частотно-временные распределения опорных
сигналов. В случае, соответствующем схеме, изображенной на рисунке 2, эта связь
вычисляется по формуле:
(8)
Далее, на основе вычисленных коэффициентов
принимается решение о передаваемом сообщении.
Маски частотно-временных распределений
должны быть вычислены заранее. Они вычисляются на основе сигнала, соответствующего
передаче конкретного сообщения.
Литература
1.
F. Auger, P. Flandrin, P. Gonsalvesh, O. Lemoine Time-frequency toolbox.
For use with Matlab. – CNRS France,
1995-1996. – pp. 48-72.
2.
L. Cohen Time-frequency distributions-A review. – Proc. IEEE, vol 77,
no. 7, 1989. – pp. 941-980.
3. H. Choi, W. J.
Williams Improved time-frequency representation of multicomponent signals using
exponential kernels. – IEEE. Trans. Acoustics, Speech, Signal Processing, vol.
37, no. 6, 1989. – pp. 862-871.
4. Чистович Л.А., Венцов А.В., Гранстрем А.П. и др. Физиология речи. Восприятие речи человеком – Л.: Наука, 1976. – с.26.
5.
Орленко А.Н.
Использование методов частотно-временного анализа при дискретной демодуляции
сигналов с частотной манипуляцией – Интернет-конференция «Новости научной мысли
- 2008» / Электронный ресурс. Способ доступа URL: http://www.rusnauka.com/Page_ru.htm