Скороход
В.А.
ГВУЗ
«Национальный горный университет», Украина, Днепропетровск
ИССЛЕДОВАНИЕ
АЛГОРИТМОВ
ФРАКТАЛЬНОГО
СЖАТИЯ АУДИОДАННЫХ
Рассмотрена
возможность фрактального сжатия аудиоданных и получены аналитические
соотношения для определения оптимальных коэффициентов преобразования отсчетов
сигнала при сжатии, предложен алгоритм
фрактального сжатия аудиоданных и разработано программное обеспечение.
Развитие современных телекоммуникационных
сетей характеризуется увеличением доли мультимедийного трафика. Важной
составляющей мультимедийного трафика является аудиоинформация, и в частности
речевая информация. Проблема, связанная с большим объемом для их передачи и
хранения, появилась при работе и на рабочих станциях, и на персональных
компьютерах. Известно множество различных алгоритмов
архивации аудиоданных, но они либо
обеспечивают недостаточные коэффициенты сжатия, либо ведут к существенной
потере данных, что в свою очередь связано с ухудшением потребительского
качества информации. Таким образом, разработка новых подходов к сжатию
аудиоданных представляется актуальной.
Метод фрактального сжатия звуковых
сигналов был запрограммирован на языке С++
с применением объектно-ориентированного подхода. Программа работает с 8-ми
битными одноканальными аудиоданными формата wav (Microsoft Waveform Audio).
Для оценки отклонения закодированного
8-битного одноканального звукового сигнала от исходного использовалось
соотношение:
Алгоритм оперирует с последовательностями
одинакового размера. Размер последовательностей фиксирован от начала работы
алгоритма до конца. Также, в целях сокращения числа сохраняемых в файл
коэффициентов для ранговой последовательности, был зафиксирован масштабный
коэффициент s со значением 0,75.
Преимуществом данного алгоритма состоит в
том, что при соответствующем выборе размеров обрабатываемых последовательностей
обеспечивается равномерное качество кодирования всего сигнала. Недостатком
алгоритма является малый коэффициент сжатия и большое время компрессии.
В качестве исследуемых сигналов, на разных стадиях, был взят следующий аудио сигнал:
Сигнал: 8 бит, моно,
с частотой дискретизации 22 222 Гц, 14 027 отсчетов. Характеризуется
относительно малой разницей значений между двумя последовательно идущими
отсчетами. Состав сигнала: стандартная мелодия
из Windows.
Рис 1.Восстановленный
сигнал при размере ранговой последовательности p=4.Коэффициент сжатия: 1.33.Среднеквадратичное отклонение (СКО): 0.188.
Рис 2.Восстановленный сигнал при размере ранговой
последовательности p=6. Коэффициент сжатия: 2. CКО: 0.238.
Таким образом, из рисунков 1 и 2 следует, что с увеличением размера
доменного (рангового) блока увеличивается коэффициент сжатия, снижается
качество восстановленного сигнала и уменьшается время его сжатия. Кроме того,
визуальный анализ осциллограмм и соответствующих им показателей искажения
сигнала в цикле сжатие – декомпрессия (СКО), свидетельствуют об
удовлетворительном качестве восстановленных сигналов при выбранных параметрах
сжатия.
Литература:
1.
Fisher Y. «Fractal Image Compression: Theory and
Applications», Springer-Verlag, New York, 1994.
2.
G.E. Qien, Z. Baharav, S. Lepsqy, E. Karnin. A new
improved collage theorem with appplications to multiresolution fractal image
coding. In Proc. ICASSP, 1994.
3. Д.Ватолин, А.Ратушняк «Методы сжатия данных»:
http://compression.graphicon.ru.