Информационные технологииStfw.Ru 🔍

MPEG-4

Одно из самых важных изменений в мире видео за последние несколько лет это появление DV-видеокамер. Что же такое DV и почему этот формат считается такой важной вехой индустрии?
🕛 27.10.2006, 11:33
Колеса международной стандартизации крутятся медленно и, чтобы убедиться что стандарт в конечном итоге соблюдается, есть строгие правила, которые запрещают внесение дополнений и изменений после определенной точки в процессе внедрения стандарта. После того момента, когда стандарт принят официально, часто существует некоторый запас желаемых улучшений и расширений - так это было и с MPEG-2. Но, как уже было описано ранее, MPEG-3 уже был начат а затем работы над ним были прекращены, поэтому следующим проектом стал MPEG-4. Сейчас завершены уже две версии MPEG-4, и работа продолжается для дальнейшего расширения и улучшения.

Первоначально, главным фокус MPEG-4 было кодирование видео и аудио на очень низких битрейтах. Практически, стандарт был явно оптимизирован для трех диапазонов битрейтов:
- до 64кб/с
- 64кб/с до 384 кб/с
- 384кб/с до 4Мб/с

Производительность при низких битрейтах осталась важной здачей и несколько творческих идей было внедрено в этой области. Большое внимание также уделялось устойчивости к ошибкам, делая MPEG-4 подходящим для использования в таких подверженным ошибкам окружениям как передача видео и аудио персональным мобильным устройствам. Другие профили и уровни, однако, используют битрейты вплоть до 38.4Мб/с и работа все еще продолжается над профилями студийного качества и уровнями с потоками данных вплоть до 1.2Гб/с.

Что более важно, MPEG-4 перерос в новую концепцию мультимедийного кодирования с мощными нструментами для интерактивности и широчайшими областями применения. Эта статья предлагает лишь краткое введение в эту систему, ведь только полный оффициальный "обзор" этого станарта занимает целых 67 страниц!
Кодирование объектов

Наиболее значительно отличие MPEG-4 от трпдиционных систем - это концепция объектов. Различные части финальной сцены могут кодироваться и передаваться раздельно как видео и аудио объекты, а затем собираться вместе декодером. Оъекты различных видов могут быть кодированы различными инструментами, наиболее подходящими для такой задачи. Объекты могут быть сгенерированы независимо друг от друга, либо сцена может быть анализирована для разбиения на части - например, фоновое изображение и объекты на переднем плане.

В одной интересной демонстрации, видеотрансляция игры в футбол была обработана для выделения мяча из сцены. Фоновое видео (поле с игроками но без мяча) передавалось как тизер для привлечения зрителей к оплате просмотра. Все видели игроков, но только те, кто заплатл за просмотр передачи могли видеть мяч.

Объектно-ориентированный подход определяет три основные характеристика потока MPEG-4:
Различные объекты могут быть закодированы с использованием различных технологий и потом собираться вместе декодером.
Объекты могут быть естественного происхождения, такими как изображение с камеры, или быть полностью синтезированными, например текст.
Инструкции в потоке данных и/или выбор пользователя позволяют получить несколько различных представлений из одного и того же цифрового потока.

Упрощенная система кодирования объектов в MPEG-4 показана на рисунке. Эта схема также показывает возможность взаимодействия пользователя с системой MPEG-4 - мощная возможность, особенно для разработчиков видеоигр.

Все эти возможности не обязательны к применению. MPEG-4 предоставляет также обычное кодирование видео и аудио, превосходя MPEG-2 по эффективности сжатия и устойчивости к ошибкам. Однако реальная выгода от MPEG-4 появляется при реализации описанной выше архитектуры. Раздельное кодироване объектов дает много выгод. Различные объекты могут кодироваться по-разному, с различными степенями пространственного и временного масштабирования.
Кодирование видео

Кодирование видео в MPEG-4 очень похоже на кодирование его в MPEG-2, но есть значительные улучшения в предиктивном кодировании и более эффективной энтропии кодирования. Однако, применение инструментария может значительно отличаться от стандартов предыдущих версий.

MPEG-4 кодирует видео-объекты. В самой простейшей модели, видео кодируется практически так же как и в MPEG-2, но оно описывается как один объект прямоугольной формы. Представление этого видео-объекта известно как текстурное кодирование. Когда в потоке имеется более чем один видео- объект, некоторые из которых могут иметь произвольную форму, и обычно, все они будут иметь меньший размер чем полноэкранный фоновый объект. Это означает, что только активная часть объекта подвергается кодированию, но его форма и положение также должны быть представлены. Стандарт предоставляет средства для кодирования формы объектов как в двоичном виде, так и в оттенках серого (что-то типа {SEARCH}{альфа-канала}{альфа-канал}).
Масштабируемость

В контексте сжатия мультимедийных данных, масштабируемость означает возможность распространения материала в более чем одном уровне качества внутри одного и того же сжатого потока данных. Оба MPEG-2 и MPEG-4 предоставляют масштабируемые {SEARCH}{профили} используя обычную модель: кодер генерирует базовый слой и один или несколько дополнительных улучшающих слоев. При передаче или декодировании улучающий слой(и) могут игнорироваться если для них недостаточно ресурсов. Этот механизм работает, но решение относительно уровней качества должны приниматься еще во время кодирования. На практике, количество улучшающих слоев обычно ограничено (чаще всего одним).

Поздние версии MPEG-4 содержат специальный профиль FGS (fine gain scalability). При такой технологии поток данных представляет собой высший уровень качества, но он позволяет извлечение более низкокачественных версий материала. FGS использует кодирование по битовым плоскостям. Квантованные коэффициенты разрезаются по одному биту, начиная с самого старшего. Это позволяет получить грубое представлние основываясь на больших (и соответственно самых старших) коэффициентах. Следующие куски данных предоставляют более точное представление следующих по старшинству коэффициентов, и так далее.

Пространственное масштабирование, включая FGS, может быть комбинировано с временным масштабированием которое позволяет передачу и/или декодирование на с меньшим числом кадров если ресурсы системы ограничены. Как упоминалось выше, объекты могут масштабироваться незавсимо. Например, может быть полезно сохранить степерь пространственного маштабирования фонового объекта, но обновлять его с меньшей частотой.
Другие аспекты MPEG-4

Стандарт MPEG-4 очеь обширен, и приведенные выше комментарии касаются только некоторых аспектов этого стандарта. Есть студиные профили для высококачественного кодирования, которые, совместно с объектным кодированием, могут обеспечить структурирование хранение всех отдельных компопентов видеокомпозиции. Профили анимации лица и тела позволят сохраненному лицу "читать" текст на любом языке. Дальнейшие расширения формата MPEG-4 могут даже предоставлять решения для цифровой киноиндустрии. Иллюстрация 3 показывает профили MPEG-4, которые определены на сегодняшний момент.

Многие описывают MPEG-4 как стандарт для видеоигр, и, действительно, большинство его конструкций и технологий идеально подходит для этой индустрии. Однако, даже беглое ознакомление открывает богатешие возможности и глубину проработки, так что потенциальные применения этого стандарта безграничны.

Автор: Питер Саймз (Peter Symes), World Broadcast Engineering, May 2001
Перевод, комментарии и иллюстрации: Вениамин Золотухин

Разное в ИТ   Теги:

Читать IT-новости в Telegram

Читайте также:

Стандарты MPEG

Информационные технологии
Мы в соцсетях ✉