Скороход В.А.

ГВУЗ «Национальный горный университет», Украина, Днепропетровск

 

ИССЛЕДОВАНИЕ АЛГОРИТМОВ

ФРАКТАЛЬНОГО СЖАТИЯ АУДИОДАННЫХ

 

Рассмотрена возможность фрактального сжатия аудиоданных и получены аналитические соотношения для определения оптимальных коэффициентов преобразования отсчетов сигнала при  сжатии, предложен алгоритм фрактального сжатия аудиоданных и разработано программное обеспечение.

Развитие современных телекоммуникационных сетей характеризуется увеличением доли мультимедийного трафика. Важной составляющей мультимедийного трафика является аудиоинформация, и в частности речевая информация. Проблема, связанная с большим объемом для их передачи и хранения, появилась при работе и на рабочих станциях, и на персональных компьютерах. Известно множество различных алгоритмов архивации аудиоданных, но они  либо обеспечивают недостаточные коэффициенты сжатия, либо ведут к существенной потере данных, что в свою очередь связано с ухудшением потребительского качества информации. Таким образом, разработка новых подходов к сжатию аудиоданных представляется актуальной.

Метод фрактального сжатия звуковых сигналов был запрограммирован на языке С++ с применением объектно-ориентированного подхода. Программа работает с 8-ми битными одноканальными аудиоданными формата wav  (Microsoft Waveform Audio).

Для оценки отклонения закодированного 8-битного одноканального звукового сигнала от исходного использовалось соотношение:

 

      

Алгоритм оперирует с последовательностями одинакового размера. Размер последовательностей фиксирован от начала работы алгоритма до конца. Также, в целях сокращения числа сохраняемых в файл коэффициентов для ранговой последовательности, был зафиксирован масштабный коэффициент s со значением 0,75.

Преимуществом данного алгоритма состоит в том, что при соответствующем выборе размеров обрабатываемых последовательностей обеспечивается равномерное качество кодирования всего сигнала. Недостатком алгоритма является малый коэффициент сжатия и большое время компрессии.

В качестве исследуемых сигналов, на разных стадиях, был взят  следующий аудио сигнал:

 Сигнал: 8 бит, моно, с частотой дискретизации 22 222 Гц, 14 027 отсчетов. Характеризуется относительно малой разницей значений между двумя последовательно идущими отсчетами. Состав сигнала: стандартная мелодия  из Windows.

Рис 1.Восстановленный сигнал при размере ранговой последовательности p=4.Коэффициент сжатия: 1.33.Среднеквадратичное отклонение (СКО): 0.188.

 

Рис 2.Восстановленный сигнал при размере ранговой последовательности p=6. Коэффициент сжатия: 2. CКО: 0.238.

Таким образом, из рисунков 1 и 2 следует, что с увеличением размера доменного (рангового) блока увеличивается коэффициент сжатия, снижается качество восстановленного сигнала и уменьшается время его сжатия. Кроме того, визуальный анализ осциллограмм и соответствующих им показателей искажения сигнала в цикле сжатие – декомпрессия (СКО), свидетельствуют об удовлетворительном качестве восстановленных сигналов при выбранных параметрах сжатия.

Литература:

1.     Fisher Y. «Fractal Image Compression: Theory and Applications», Springer-Verlag, New York, 1994.

2.     G.E. Qien, Z. Baharav, S. Lepsqy, E. Karnin. A new improved collage theorem with appplications to multiresolution fractal image coding. In Proc. ICASSP, 1994.

3.     Д.Ватолин, А.Ратушняк «Методы сжатия данных»: http://compression.graphicon.ru.