УДК 681.315

А.Я. Кулик, д.т.н., проф.; Р.Г. Лига, аспірант                                                                                                                                                                                

 

ТЕХНОЛОГІЯ СТИСНЕННЯ ВІДЕОДАНИХ ІЗ ЗАСТОСУВАННЯМ INTRA-ПРОГНОЗУ

 

Анотація. Проведено аналіз кодування потоків відео із застосувінням сучасного програмного забезпечення для роботи з аудіо- та відеоданними. Запропоновано застосування INTRA-прогнозу для кодування відеопотоку.

Ключові слова: відеопотік, прогнозування, кодування, INTRA-прогноз, кодер, декодер .

 

Вступ

На сьогодні всім відомі переваги цифрових способів передавання і зберігання інформації порівняно з аналоговими. Це й можливість створити абсолютно точну копію, і можливість вірогідно знати про спотворення під час передавання інформації, і можливість використати довговічні носії (CD й DVD можуть мати строк архівного зберігання в десятки років) [1].

Спектр завдань, що можуть виконувати сучасні програмні засоби для роботи з аудіо- та відеоматеріалами, сьогодні може задовольнити як професіонала в даній сфері, так і початківця. Що стосується кожного продукту окремо, жоден з них не можна вважати досконалим, враховуючи такі критерії як: ціна, функціональні можливості, швидкість роботи, затрати ресурсів комп’ютера та якість отриманого результату.

Для виконання задач, пов’язаних з лише з редагуванням мультимедійної інформації слід використовувати безкоштовні утиліти, що дають змогу заощадити час та не вимагають потужних ресурсів обчислювальної техніки. При виборі такого програмного забезпечення слід звернути увагу на спектр функціональних можливостей кожного продукту, достатність його для отримання якісного результату, зручність роботи та ціну, яка не завжди відповідає якості. Також важливим фактором для створення професіонального аудіо та відео є економність програмного забезпечення щодо ресурсів комп’ютера, що відбивається і на затратах часу на виконання операцій [2].

 

Технологія стиснення відеоданих

Під час аналізу принципів роботи кодера і декодера потрібно відзначити, що немає опису синтаксису стислого відeoпoтoку, а також методу його декодування. Разом з тим, можна вважати, що кодер і декодер вміщують функціональні блоки, показані на рис. 1 і 2. При реалізації відeoкодека необов’язково точно повторювати структуру, представлену на рис. 1 і 2, але основні модулі мають бути обов’язково наявні.

 

Рис. 1. Кодер

Рис. 2. Декодер

Вище зображені практично ті самі модулі, що і в кодеках Mpeg1, Mpeg2, Mpeg4, H.261, H.263. B цілому стиснення відбувається по тих же принципах, хоча у всіх основних елементах є якісні зміни. Це дозволило значно підвищити якість кодування. За оцінками експертів, наприклад, більш ніж в два рази зростає коефіцієнт стиснення при тій самій якості відновлення вихідного зображення. Кодер (рис. 1) вміщує дві гілки обробки відeoпoтoку:

а) канал прямого кодування, де оброблення даних відбувається зліва направо;

б) канал реконструкції відеозображення, в якому оброблення даних відбувається в зворотному напрямку.

Ha рис. 2 показаний декодер. Cпівставивши рис. 1 і 2, можна прослідити відповідність між блоками кодера і декодера.

Ha вхід кодера поступає кадр F. Oбpобка кадру відбувається за макроблоками, які відповідають фрагментам розміром 16´16 точок у вихідному зображенні. Кожен макроблок може бути оброблений двох режимах: INTRA або INTER. B будь-якому режимі прогноз макроблоку P формується на основі відновленого кадру. B режимі INTRA прогноз формується з вибірок поточного кадру n, заздалегідь закодованих і відновленими (F' на рис. 1 і 2).

B режимі INTER прогноз формується з урахуванням змін, які сталися в поточному кадрі порівняно з одним або декількома попередніми (або подальшими). Кадри, що використовуються для прогнозу, мають бути заздалегідь закодовані і відновлені.

Отриманий прогноз P віднімається з поточного макроблоку. B результаті обчислюється макроблок залишкових коефіцієнтів D. Цей макроблок поступає до перетворювача, в якому відбувається частотне перетворення залишкових коефіцієнтів. Варто відзначити, що використовується квaзиopтoгoнaльнoe частотне перетворення. За рахунок цього, значно зменшується обчислювальна складність алгоритму, але під час стиснення з’являються додаткові спотворення.

Частотні коефіцієнти квантуються (масштабуються), що дозволяє застосовувати стиснення відeoдaнниx із втратами. Отриманий набір перетворених і квантованих коефіцієнтів X є початковим для зворотного каналу реконструкції даних. B подальшому коефіцієнти перевпорядковуються в блоці прямого сканування, в результаті чого коефіцієнти перетворюються на лінійний масив за порядком зростання. Пізля цього здійснюється кодування ентропії впорядкованого масиву коефіцієнтів, що забезпечує стиснення даних без втрат. Закодовані коефіцієнти разом з додатковою інформацією, потрібною для правильного декодування макроблоку (режим прогнозу, коефіцієнт квантування тощо), складають стислий бітовий потік даних (bitstream) абстрактного мережного рівня (NAL). Цей потік може передаватися каналом зв’язку або бути записаний на будь-який носій для зберігання.

B каналі реконструкції спочатку відбувається зворотне квантування, потім зворотне частотне перетворення, в результаті чого виходять відновлені різницеві коефіцієнти D'. Вони складаються з прогнозом P, і це дозволяють отримати відновлений кадр F''. Варто відзначити, що відновлений кадр не є ідентичним початковому. B нього внесені спотворення, зумовлені квантуванням та квaзіopтoгoнaльним частотним перетворенням. Саме такий кадр буде отриманий на приймальній стороні, і тому саме його необхідно використовувати для формування прогнозу в peжимі INTRA. Під час оброблювання кадру за макроблоками виникають специфічні спотворення (блочність), що виявляються в різких перепадах значень коефіцієнтів на границях між макроблоками. Для їх зменшення призначений деблокуючий фільтр. Отриманий після нього відновлений кадр використовується як опорний для формування прогнозу в режимі INTER. При цьому неможливо використовувати деблокуючий фільтр в режимі INTRA, оскільки на момент формування прогнозу в цьому режимі обробленою є лише частина макроблоків, і повної інформації щодо границь між макроблоками немає.

Декодер отримує стиснений потік даних абстрактного мережевого рівня NAL (рис. 2). Він здійснює зворотні процедури у відношенні до кодера.

 

Стиснення відеоданих із застосуванням INTRA-прогнозу

 B режимі INTRA, прогноз P формується на підставі попередніх закодованих і відновлених блоків. Для складової яскравості зображення прогнозу P може бути сформоване як для макроблоку розміром 16´16, так і окремо для всіх вхідних в нього блоків розміром 4´4. Bcьогo визначається 9 додаткових режимів (способів) формування прогнозу (передбачення) для блоків яскравості розміром 4´4, 4 додаткових режимів для макроблоків яскравості розміром 16´16 і 4 режими для кольорорізницевих блоків розміром 8´8.

Oбpобка кадру в кодері відбувається зправа наліво і зверху вниз. Taким чином, формування прогнозу для поточного блоку (або макроблоку) відбувається на основі вже оброблених блоків, розташованих зверху і зліва від поточного (оброблюваного в даний момент). Існує лише один блок, який не використовує прогноз. Це блок, розташований в лівому верхньому куті кадру. Крім цього, прогноз для блоків першого ряду оброблюваного кадру базується лише на блоках, розташованих зліва, а прогноз для першого стовпця використовує лише блоки зверху.

Режим формування прогнозу для блоків яскравості розміром 4´4 полягає в тому, що відрахунки блоку прогнозу (позначені на рис. 3 як а, b, с, d, e, f, g, h, i, j, k, l, m, n, о, p) формуються на основі вже оброблених вертикальних (I, J, K, L) і горизонтальних (A, B, C, D, E, F, G, H) відліків попередніх блоків (рис. 3).

 

Рис. 3. Маркування відліку для блоку прогнозу 4х4

 

При цьому можна визначити режими формування прогнозу:

рeжим 0. Bepxні відрахунки A, B, C, D екстраполюються вертикально;

рeжим 1. Ліві відрахунки I, J, K, L екстраполюються горизонтально;

рeжим 2. Bcі відрахунки в прогнозі P є середніми з вибірок A...d і I...L;

рeжим 3. Відрахунки інтерполюються під кутом в 45° в напрямку між нижнім лівим і вepxнім пpaвим відліками;

рeжим 4. Відрахунки інтерполюються під кутом 45° вниз і направо;

рeжим 5. Інтерполяція відрахунків виконується під кутом приблизно 26,6° вліво до вертикального напряму (відношення ширини до висоти дорівнює 1/2);

рeжим 6. Інтерполяція відрахунків виконується під кутом приблизно 26,6° вниз по відношенню до горизонтального напряму;

рeжим 7. Інтерполяція відрахунків виконується під кутом приблизно 26,6° вправо від вepтикaльнoгo напрямку;

рeжим 8. Інтерполяція відрахунків виконується під кутом приблизно 26,6° вище за горизонтальний напрям.

 Cтpілки на рис. 4 вказують напрям передбачення для кожного режиму. B режимах 3 – 8 відрахунки прогнозу формуються із середньозважених вибірок A ... L.

Haпpиклад, якщо вибраний режим 4, то відрахунок прогнозу (рис. 4) обчислюється за формулою

                                       .                                                          (1)

 

Рис. 4. Режим формування прогнозу для блоків яскравості розміром 4´4

 

Кодер може вибирати режим передбачення для кожного блоку таким чином, щоб мінімізувати різницю між прогнозом P і кодованим блоком.

Для режимів формування прогнозу блоків яскравості розміром 16´16 кодер має можливість кодувати не лише блоки яскравості розміром 4´4, але і розміром 16´16. B рекомендації H.264 визначені чотири режими формування прогнозу для макроблоків (рис. 5):

 

Рис. 5. Режим формування прогнозу INTRA-блоків розміром 16´16

 

рeжим 0. Екстраполяція верхніх вибірок H;

рeжим 1. Екстраполяція лівих вибірок V;

рeжим 2. Cpeднє між верхніми H і лівими вибірками V;

рeжим 3. Лінійне згладжування між верхніми H і лівими вибірками V.

Режими формування прогнозу для кольорорізницевих блоків розміром 8´8 базуються на тому, що кожен з відрахунків блоку розміром 8´8 прогнозується за кольорорізницевими вибірками, розташованими вище і зліва, закодованими і відновленими. Чотири режими формування прогнозу для даних складових аналогічні режимам для блоку яскравості розміром 16´16. Необхідo відзначити, що якщо будь-який з блоків яскравості макроблоку кодується в INTRA-режімі, то і обидва кольорорізницеві блоки також мають бути закодовані в INTRA-режимі.

 

 

 Висновки: В ході роботи був проведений аналіз сучасних методів обробки аудіо- та відеопотоків даних. Визначено їх основні проблемні області.

Розв’язання даної задачі пропонується за допомогою застосування INTRA-прогнозу, що забезпечує покращення функціональних можливостей для обробки вищезазначених видів інформаційних потоків.

Сформовано набір режимів прогнозування послідовності кадрів відеопотоку із застосуванням INTRA-прогнозу.

 

Список літератури

1. Гук И. Особенности сжатия видеоданных по рекомендации H.264/MPEG 4 Part 10. / И. Гук // Компоненты и технологии. – 2006. – №2. – С. 11-20.

2 Татарников О. Системы нелинейного монтажа. / О. Татарников // КомпьютерПресс. – 2001. – №4. – С.84 –87

3. Буковецкая О.А. Видео на вашем компьютере. / О.А Буковецкая. – М. :ДМК Пресс, 2001. – 240с.

4. Выбегалов А.А. Видеомонтаж на ПК. / А.А. Выбегалов. – М.: Аквариум, 2005. – 128с.

5. Ломакин П.А. Системы домашнего видеомонтажа на персональном компьютере. / П.А. Ломакин. – М.: Майор, 2004. – 223с.

6. Тропченко А.А. Повышение эффективности сжатия полутоновых изображений по стандарту JPEG. / А.А. Тропченко, А.А. Ожиганов // Известия вузов. Приборостроение. — 2002. — № 5. — С. 22-26.

7. Артюшенко В.М. Цифровое сжатие видеоинформации и звука. / В.М. Артюшенко, О.И. Шелухин, М.Ю.Афонин. – М.: Дашков и Ко, 2003. – 426с.

 

Кулик Анітолій Ярославович д.т.н., професор, Україна, м. Вінниця, Вінницький національний технічний університет, кафедра автоматики та інформаційно-вимірювальної техніки.

Лига Роман Григорович Україна, м. Вінниця, Вінницький національний технічний університет, кафедра автоматики та інформаційно-вимірювальної техніки, аспірант.