Перевод

H.264 - стандарт сжатия видео. И он вездесущ, его используют для сжатия видео в интернете, на Blu-ray, телефонах, камерах наблюдения, дронах, везде. Все сейчас используют H.264.

Нельзя не отметить технологичность H.264. Он появился в результате 30-ти с лишним лет работы с одной единственной целью: уменьшение необходимой пропускной способности канала для передачи качественного видео.

С технической точки зрения это очень интересно. В статье будут поверхностно описаны подробности работы некоторых механизмов сжатия, я постараюсь не наскучить с деталями. К тому же, стоит отметить, что большинство изложенных ниже технологий справедливы для сжатия видео в целом, а не только для H.264.

Зачем вообще сжимать что-либо?

Видео в несжатом виде это последовательность двумерных массивов, содержащих информацию о пикселях каждого кадра. Таким образом это трёхмерный (2 пространственных измерения и 1 временной) массив байтов. Каждый пиксель кодируется тремя байтами - один для каждого из трёх основных цветов (красный, зелёный и синий).

1080p @ 60 Hz = 1920x1080x60x3 => ~370 Мб/с данных.

Этим практически невозможно было бы пользоваться. Blu-ray диск на 50Гб мог бы вмещать всего около 2 мин. видео. С копированием так же будет не легко. Даже у SSD возникнут проблемы с записью из памяти на диск.

Поэтому да, сжатие необходимо.

Обязательно отвечу на этот вопрос. Но сперва я покажу кое-что. Взгляните на главную страницу Apple:

Я сохранил изображение и приведу в пример 2 файла:

Это впечатляет, какие еще приёмы существуют?

Цветовая обработка

Человеческий глаз не особо хорошо различает близкие оттенки цвета. Можно легко распознавать наименьшие различия в яркости, но не цвета. Поэтому должен существовать способ избавления от лишней информации о цвете и сэкономить ещё больше места.

В телевизорах, цвета RGB преобразуются в YCbCr, где Y это компонента яркости (по сути яркость черно-белого изображения), а Cb и Cr компоненты цвета. RGB и YCbCr эквиваленты в плане информационной энтропии.

Зачем же тогда усложнять? RGB разве не достаточно?

Во времена чёрно-белых телевизоров, была только компонента Y. А с началом появления цветных телевизоров у инженеров встала задача о передаче цветного RGB изображения вместе с чёрно-белым. Поэтому вместо двух каналов для передачи, было решено кодировать цвет в компоненты Cb и Cr и передавать их вместе с Y, а цветные телевизоры уже сами будут преобразовывать компоненты цвета и яркости в привычный им RGB.

Но вот в чём хитрость: компонента яркости кодируется в полном разрешении, а компоненты цвета лишь в четверть. И этим можно пренебречь, т.к. глаз/мозг плохо различает оттенки. Таким образом можно уменьшить размер изображения в половину и с минимальными отличиями. В 2 раза! Машина будет весить 10 кг!

Данная технология кодирования изображения со снижением цветового разрешения называется цветовой субдискретизацией . Она используется повсеместно уже давно и относится не только к H.264.

Это самые значительные технологии в уменьшении размера при сжатии с потерями. Нам удалось избавиться от большинства детализации и сократить информацию о цвете в 2 раза.

А можно ещё больше?

Да. Обрезание картинки это лишь первый шаг. До этого момента мы разбирали отдельно взятый кадр. Пришло время взглянуть на сжатии во времени, где нам предстоит работать с группой кадров.

Компенсация движения

H.264 стандарт, который позволяет компенсировать движения.

Компенсация движения? Что это?

Представьте, что вы смотрите теннисный матч. Камера зафиксирована и снимает с определенного угла и единственное что движется это мячик. Как бы вы закодировали это? Вы бы сделали что и обычно, да? Трёхмерный массив пикселей, две координаты в пространстве и один кадр за раз, так?

Но зачем? Большая часть изображения одинакова. Поле, сетка, зрители не меняются, единственное что движется это мячик. Что если определить единственное изображение фона и одно изображение мячика, движущегося по нему. Не сэкономило бы это значительно места? Вы видите к чему я клоню, не так ли? Компенсация движения?

И это именно то, что H.264 делает. H.264 разбивает изображение на макроблоки, обычно 16х16, которые используются для расчёта движения. Один кадр остаётся статичным, обычно его называют I-кадр , и содержит всё. Последующие кадры могут быть либо P-кадры , либо B-кадры . В P-кадрах вектор движения кодируется для каждого макроблока на основе предыдущих кадров, таким образом декодер должен использовать предыдущие кадры, взяв последний из I-кадров видео и постепенно добавляя изменения последующих кадров пока не дойдёт до текущего.

Ещё интереснее обстоят дела с B-кадрами, в которых расчёт производится в обоих направлениях, на основании кадров идущих до и после них. Теперь вы понимаете почему видео в начале статьи весит так мало, это всего лишь 3 I-кадра, в которых мечутся макроблоки.

При такой технологии кодируется только различия векторов движения, тем самым обеспечивая высокую степень сжатия любого видео с перемещениями.

Мы рассмотрели статическое и временное сжатия. С помощью квантования мы во много раз уменьшили размер данных, затем с помощью цветовой субдискретизации ещё вдвое сократили полученное, а теперь еще компенсацией движения добились хранения лишь 3х кадров из 300, которые были первоначально в рассматриваемом видео.

Выглядит впечатляюще. Теперь что?

Теперь мы подведём черту, используя традиционное энтропийное кодирование без потерь. Почему нет?

Энтропийное кодирование

После этапов сжатия с потерями, I-кадры содержат избыточные данные. В векторах движения каждого из макроблоков в P-кадрах и B-кадрах много одинаковой информации, так как зачастую они двигаются идентично, как это можно наблюдать в начальном видео.

От такой избыточности можно избавиться энтропийным кодированием. И можно не переживать за сами данные, так как это стандартная технология сжатия без потерь, а значит всё можно восстановить.

Вот теперь всё! В основе H.264 лежат вышеупомянутые технологии. В этом и заключаются приёмы стандарта.

Отлично! Но меня разбирает любопытство узнать, сколько же весит теперь наша машина.

Исходное видео было снято в нестандартном разрешении 1232x1154. Если посчитать, то получится:

5 сек. @ 60 fps = 1232x1154x60x3x5 => 1.2 Гб
Сжатое видео => 175 Кб

Если соотнести результат с оговорённой массой машины в одну тонну, то получится вес равный 0.14 кг. 140 граммов!

Да, это магия!

Конечно же я в очень упрощённом виде изложил результат десятилетних исследований в этой сфере. Если захотите узнать больше, то

Технология сжатия видео была камнем преткновения в проектировании систем видеонаблюдения со времён появления интернет-протокола (IP) в 1990-е годы. С тех пор стандарты для кодирования видео прошли много этапов исследований. Сегодня внимание отрасли привлёк к себе стандарт сжатия H.265 или HEVC (High Efficiency Video Coding - высокоэффективное кодирование видеоизображений). Это следующая версия после H.264, которая в настоящее время является доминирующей технологией кодирования IP-видео. Мы попытаемся разобраться каковы её перспективы на сегодняшний день и в будущем.

Интеграция технологии H.265 может быть затруднена доступностью оптимизированного H.264, лучшего кодирования для систем видеонаблюдения

H.265: разбираемся что и зачем

Стандарт H.265 стал значительным шагом вперед в области кодирования видео. Одно из его преимуществ в том, что он удваивает эффективность сжатия H.264. Так что при передаче изображений аналогичного качества H.265 использует только половину битрейта предыдущего кодека. Благодаря этому требования к пропускной способности и хранению резко сокращаются, что позволяет более выгодно использовать и аппаратные, и программные средства. Пользователи, по сути, получают больше возможностей с меньшими затратами. Из-за этого большинство производителей аппаратного обеспечения поддерживают внедрение стандарта сжатия H.265 для видеонаблюдения. Так что скоро мы сможем увидеть H.265 в роли следующего стандарта.

Но несмотря на все плюсы, H.265 всё ещё далёк от массового внедрения. Возникает вопрос: могут ли пользователи каким-то образом оптимизировать передачу изображения, прежде чем в сфере видеонаблюдения произойдёт переворот? Ведь популярность видео с большим разрешением растёт, а спрос рождает предложение.

Последние достижения для текущего кодека H.264 оптимизируют битрейт тремя способами: предиктивным кодированием, подавлением шума, и "долгосрочным" управлением битрейтом (predictive encoding, noise suppression, and “long-term” bitrate control). Результатом этого стало сокращение требуемого объёма памяти до 75% для H.264. Из-за этих инноваций и некоторых других факторов высока вероятность того, что в ближайшие 5-10 лет оба стандарта будут мирно сосуществовать на рынке.

Препятствия для принятия H.265

Интеграция технологии H.265, скорее всего, будет тормозиться наличием оптимизированного кодирования H.264, а ещё стоимостью модернизации существующих систем под H.265. Дополнительные сложности возникнут также с изменением производственных процессов для выпуска оборудования, поддерживающего H.265 и с патентами, о которых мы поговорим позже. В принципе, H.264 остается жизнеспособным и работоспособным стандартом для подавляющего большинства систем видеонаблюдения. На сегодняшний день он полностью выполняет свои функции - и, нужно признать, довольно хорошо.

При более высокой стоимости, пользователи должны быть уверены, что обновление до H.265 действительно стоит того

Ограничения лабораторных испытаний

По результатам испытаний проведенных Объединенной командой по видеокодированию Joint Collaborative Team on Video Coding (JCT-VC), коэффициент сжатия H.265 удвоился по сравнению с предыдущим H.264. Но, как и следовало ожидать, эти тесты были проведены в лабораторных условиях и далеки от многих сложностей, возникающих в процессе фактического использования стандарта.

Кодирование в реальном времени с соблюдением баланса между сложностью алгоритма и возможностью сжатия - вот то, что хочется видеть в развитии H.265. На практике возможность сжатия кодека H.265 может не дать 100% улучшения в сравнении с H.264, несмотря на то, что это было заявлено.

Стандарт H.264 более 10 лет внедряли в отрасль, в которой происходило его развитие, при поддержке со стороны всех производителей чипсетов, и с доступом к самым разным кодерам и декодерам. Это проверено и доказано на практике. В этом смысле технологии H.265 придётся многое наверстать.

Цена патента

Ещё одной проблемой, которая может помешать массовому распространению стандарта H.265 - необходимость покупки патента. У многих владельцев предприятий уже есть патент на H.264, в то время как H.265 на ранней стадии своего существования не особо распространён в отрасли, а предприятия, которые владеют им, не связаны между собой. Результатом низкого спроса на новый стандарт становится гораздо более высокая стоимость патента - основной вопрос, который предприятия из отрасли безопасности должны серьезно рассмотреть - как это повлияет на производство и, как следствие, на ценник для конечного потребителя. При введении нового стандарта цена действительно имеет решающее значение, особенно если пользователи должны заменить и внешнюю, и внутреннюю части (фронтенд и бекенд) системы, чтобы пользоваться улучшенной видеокомпрессией. Платя в несколько раз больше, потребитель должен быть уверен в том, что обновление на самом деле стоит того.

Оптимизированные технологии кодирования H.264

Несмотря на приведённые выше аргументы, основной причиной, по которой мы считаем, что H.265 не станет доминирующим решением кодирования в ближайшее время, является простое отсутствие спроса - ряд инновационных производителей внедрил оптимизированные технологии кодирования H.264, а необходимости в Н.265 пока попросту нет. Этот факт можно назвать "решением ещё не возникшей проблемы".

Оптимизированные технологии H.264 используют прогнозирующее кодирование, чтобы уменьшить битрейт, затраченный на неизменное фоновое изображение

С момента запуска технологии H.264 в 2003 году, индустрия безопасности разрабатывает высокопроизводительные видеокодеры, стремясь улучшать качество картинки для систем видеонаблюдения. Добавьте к этому повышающуюся популярность видео высокого качества, растущие требования к битрейту и разрешению, и становится очевидным, что стоимость компонентов системы в целом возросла. Огромное количество видеоданных, получаемых с камер видеонаблюдения, означает, что пользователи должны вкладывать средства в постоянно растущие требования для хранения данных.

Предиктивное кодирование

Как происходит усовершенствование кодека H.264? Во-первых, базовые исследования сжатия видео ведутся в различных отраслях промышленности. Например, в любом видео с камер пользователи сначала обращают внимание на подвижные объекты, а после на статичную часть картинки. Если фон не меняется, он может быть закодирован в качестве опорного кадра. Оптимизированные технологии H.264 используют прогнозирующее кодирование, чтобы уменьшить битрейт потраченный на статичное фоновое изображение. Применяя это прогнозирующее кодирование по всей системе, пользователи значительно экономят на пропускной способности и хранении.

Подавление шума

Ещё одним важным элементом оптимизации H.264 является подавление шума.

Шум или нежелательный электрический сигнал, отображающийся в видеопотоке, является серьёзной помехой цифрового видеосигнала. Это приводит к тому, что на фоне изображения появляется множество посторонних пикселей, вызванных колебаниями света, температуры, или другими сигналами в воздухе. Но оптимизированные технологии H.264 с использованием алгоритмов интеллектуального анализа подавляют большую часть шума путём кодирования объекта переднего плана изображения с более высокой скоростью передачи данных относительно фонового изображения. Результат: чёткие изображения с точной цветопередачей.

Долгосрочный контроль битрейта

И, наконец, требования к битрейту по каждой конкретной сцене могут колебаться в течение дня. Например, в типичной уличной сцене в ночное время есть небольшое движение на первом плане, так что требования к битрейту невысокие. Днём требования значительно повышаются из-за транспортных средств и пешеходов, движущихся на переднем и заднем планах. Современные технологии кодирования H.264 управляют этим распределением по времени путём вычисления общего среднего битрейта, а затем автоматически выделяют необходимый битрейт в то время суток, когда это требуется. Это происходит на уровне заданных значений декодера. Здесь основным преимуществом долгосрочного контроля битрейта является то, что у пользователей есть возможность точно прогнозировать свои требования к системе хранения видео, благодаря чему можно измерять необходимый размер хранилища.

***

На сегодняшний день эти плюсы Н.264 превышают то, что предлагает стандарт Н.265. Помимо прочего, Н.264 имеет ряд других преимуществ: совместимость с существующими системами, меньшую стоимость продукции, более широкий спектр продуктов, на которых кодек может применяться, и меньший патентный риск.

Разработки видеосжатия, как правило, имеют тенденцию придерживаться примерно 10-летнего цикла. В 1994 году был введен формат MPEG2. H.264 запущен в 2003 году, а H.265 - в 2013. В данном случае исторический контекст имеет важное значение, потому что стандарты кодирования видео реагируют не только на технологические изменения, но и на тенденции в рамках всей видео-индустрии. Когда стандартом был формат MPEG2, промышленность была сосредоточена главным образом на DVD-плеерах и телевизионном разрешении, где использовался этот формат. Появление H.264 совпало с введением технологии HD, передовыми IT-технологиями и мобильным интернетом.

Использование H.264 включало HD-цифровое телевидение, интернет-видео, мобильное видео, видеонаблюдение, Blu-Ray и др. Так как H.265 только выходит на сцену, мы считаем, что он будет наиболее широко использоваться в разработке ультра-HD технологий и приложений облачных систем хранения данных.

Перспективы развития технологий сжатия видео

После запуска H.265, члены Объединенной совместной группы по видеокодированию (JCT-VC) начали составлять прогнозы на будущее для данного сегмента. В 2015 году они создали группу совместного исследования видео (Joint Video Exploring Team - JVET), сосредоточив внимание на дальнейшем улучшении возможностей сжатия. Их последние данные тестирования показывают, что улучшения по производительности сжатия H.265 достигнуты на 20%. В то же время, другая организация - AOM (Alliance for Open Media) - объединила целый ряд интернет-ориентированных компаний, в том числе Microsoft, Google, Intel, и Amazon, стремясь прийти к свободному стандарту для интернет-видео. План состоит в том, что этот (свободный) стандарт ускорит обновление технологий в онлайн-мире с сумасшедшей скоростью.

Конкурс на разработку этих стандартов, вероятно, будет жестким - и это также может означать, что 10-летний цикл сжатия канет в Лету, а новые стандарты появятся в гораздо более короткие сроки.

Всё более популярным становится формат компрессии видеосигнала H.264. Подробную информацию о преимуществах, которые даёт его использование, вы сможете найти в статье, приведенной ниже. Напомним, что формат сжатия видео H.264 явился совместной разработкой двух международных организаций по стандартизации и ISO/IEC; этот формат также известен под названием MPEG-4 Part 10 AVC (Advanced Video Coding, продвинутая кодировка видеосигнала).

Сжимать еще сильнее

Аппетиты видеонаблюдения в отношении объемов хранения данных и пропускной способности сетей растут: никто не хочет упустить возможность воспользоваться большой частотой кадров и высоким разрешением. Отсюда и ожидания большей эффективности от методов сжатия видеосигнала. Кодер формата H.264 способен уменьшить размер файла, содержащего цифровое видео, более чем на 80% по сравнению с сигналом, сжатым по алгоритму формата Motion JPEG, при аналогичных показателях визуального качества. В сравнении с наиболее "ходовой" разновидностью формата MPEG-4 -- MPEG-4 Part 2 Simple Profile (SP) -- кодек H.264 обычно выигрывает 40-50 процентов от объема видеофайлов.

Сектор мегапиксельных камер растет, и до недавнего времени основным сдерживающим его рост фактором считались повышенные требования к объемам хранения данных, генерируемых камерами высокого разрешения. Использование кодека H.264 способно значительно ускорить процесс внедрения мегапиксельных камер.

По моему личному мнению (то есть мнению Джона Блема - прим. ред.) , формат H.264 почти окончательно вытеснит MPEG-4 (Part 2) в течение буквально нескольких лет. А поставщики решений управления видеонаблюдением примутся встраивать поддержку нового формата уже в ближайшем будущем, равно как и все ведущие производители видеокамер.

Ложка дегтя

Есть, однако, и факторы, сдерживающие восторг от новинки -- ведь, по сути, разработка находится еще в самом начале пути. Да, кодек позволяет снизить нагрузку на сети передачи данных и сэкономить на приобретении средств хранения видеоинформации. Но его использование возможно только в условиях применения высокопроизводительных камер. Новый алгоритм сжатия использует значительно более сложную математику, чем предыдущие стандарты -- скажем, процедура декодирования примерно вдвое превосходит аналогичную процедуру у MPEG-4 Part 2 SP по объемам вычислений -- соответственно этому растет и запрос к вычислительной мощности систем. При этом собственно стандартом H.264 стал относительно давно -- около пяти лет назад, и в некоторых отраслях -- исключая нашу с вами -- уже взят на вооружение. Скажем, он используется в новом поколении потребительских DVD-дисков высокого разрешения (формат Blu-ray).

Как это работает

H.264 является гибридным стандартом блочного кодирования видеоданных с использованием компенсации движения. Собственно компенсация основана на использовании векторов перемещения областей кадра для предсказания изменений в изображении. Поскольку для видеоизображений характерна высокая степень корреляции между двумя последовательными кадрами, возможно использовать это для кодирования не картинки целиком, а лишь векторов перемещения различных частей изображения; кодируется при этом предсказанная разница между текущим кадром и его областями, присутствующими на других кадрах (так называемых ссылочных) в смещенном относительно оригинального положения виде. Эта техника называется "промежуточное предсказание".

Существует два основных метода промежуточного предсказания -- основанное на одном ссылочном кадре (макроблоки типа P) и двунаправленное (макроблоки типа В), где используется комбинация двух ссылочных кадров. Чтобы обеспечить доступ к произвольным участкам видеоизображения и повысить степень защищенности от ошибок, стандартом также предусмотрено так называемое инфракодирование, при котором кодированные данные не зависят от характера и содержания каких-либо сторонних изображений, как это происходит в случае применения промежуточного предсказания.

Стандартом H.264 предусматривается разбиение изображения на макроблоки размером до 16х16 пикселов каждый. Макроблоки объединяются в группы -- одну или несколько -- обычно в порядке сканирования. Таким образом, отдельное изображение может быть закодировано как одна или несколько групп. Использование группирования макроблоков позволяет применять различные методы коррекции ошибок, различные типы кодирования макроблоков, а также такие инструменты, как раздельное кодирование полукадров (на правах групп) при чересстрочной развертке.

В цветных видеоизображениях кодирование яркостной составляющей происходит отдельно от цветовой; учитывая особенности человеческого зрения, при этом, как правило, используется поддискретизация цветового сигнала относительно яркостного. По большому счету, фундаментальных отличий нового формата от предыдущих стандартов кодирования видеосигнала (включая MPEG-4 Part 2) нет: все они так или иначе основаны на разбиении на блоки и являются гибридными.

Новые средства

Помимо улучшений, которым подверглись уже существующие средства кодирования, формат H.264 предусматривает и ряд новых инструментов. Наиболее важными из них являются встроенный адаптивный деблокирующий фильтр, позволяющий существенно снизить блокинг-искажения изображения, запись более чем двух ссылочных кадров для более точного предсказания, деление макроблоков на блоки меньшего размера (вплоть до 4х4 пиксела), предсказание в инфракодировании, а также применение целочисленного преобразования взамен применявшегося в более ранних стандартах дискретного косинусного преобразования (DCT).

В формат H.264 входит принципиальное решение сетевого интерфейса передачи видеоданных (network abstraction layer, NAL), который, будучи установлен поверх программного механизма кодирования видеосигнала (video coding layer, VCL), берет на себя функцию эффективного представления цифрового видео в формате, обеспечивающем легкую интеграцию с целым набором различных протоколов и механизмов передачи данных -- это весьма привлекательно для сетей, работающих на основе Интернет-протокола (IP).

Что в итоге?

Главный результат всех усовершенствований технологии кодирования, воплощенных в стандарте H.264, состоит в том, что новый формат действительно превосходит по своим характеристикам все предыдущие алгоритмы сжатия цифрового видеосигнала -- и потому на сегодняшний день может считаться высшим достижением в области кодирования цифрового видео.

Итак, стОит ли Н.264 всей медиа-шумихи, развернутой вокруг него? Стандарты видеокомпрессии с приходом нового формата стали стремительно меняться -- и сегодня они уже способны сохранить либо даже снизить нагрузку на пропускную способность сетей передачи данных при переходе на видео высокого разрешения. И это является весьма ценным.

Однако же, будем помнить, что все прелести новой технологии кодирования и хлынувших на рынок все более мощных мегапиксельных камер могут быть реализованы лишь при использовании крепкой управляющей платформы, на базе которой формируются решения видеонаблюдения. Применение стопроцентно открытых платформ по управлению IP-видеонаблюдением позволит вам интегрировать новые технологические решения в уже существующую у вас серверную инфраструктуру -- без необходимости полной замены аппаратной части системы.

Джон Блем, директор компании Milestone по информационным технологиям.

H.264, MPEG-4 Part 10 или AVC (Advanced Video Coding) - лицензируемый стандарт сжатия видео, предназначенный для достижения высокой степени сжатия видеопотока при сохранении высокого качества. Применяется для более рационального использования устройств хранения и передачи данных. Кодер H.264 без ущерба для качества изображения может снижать размер файла цифрового видео более чем на 80% по сравнению с форматом Motion JPEG и на 50% - по сравнению со стандартом MPEG-4 Part 2. Что означает гораздо меньшие требования к полосе пропускания для передачи и объему памяти для хранения видеофайла. Или же, с другой стороны, возможность получения гораздо лучшего качества видеоизображения при той же скорости передачи данных. На сегодняшний день формат H.264 является одним из самых прогрессивных и отвечающих современным требованиям алгоритмов компрессии.

Стандарт H.264 предназначен для технических решений в следующих областях:

Трансляции по сети, через спутник, через DSL соединения и т.д.
Интерактивный или постоянные хранения данных на оптических и магнитных носителях (DVD, HDD)
Потоковое мультимедиа по сети и т.д.

Благодаря своим преимуществам перед MPEG-4 и M-JPEG, H.264 может стать форматом номер один в системах видеонаблюдения. Сжатие видеоизображения заключается в удалении избыточных видеоданных или сокращении их объема, благодаря чему файлы с оцифрованным видео удается эффективно передавать по сети и хранить. При сжатии к исходному видеоизображению применяется определенный алгоритм. Применение обратного алгоритма позволяет практически без потерь восстановить оригинальное видеоизображение. В стандарте H.264 технология сжатия видеоизображения вышла на новый уровень: появилась более совершенная схема внутреннего предсказания, используемая для кодирования I-кадров. Благодаря этой схеме количество битов, необходимых для хранения I-кадра, значительно снижается, а качество изображения остается неизменным. Получить такой результат удается за счет использования моноблоков меньшего размера. Поиск совпадающих пикселов теперь осуществляется среди ранее закодированных пикселов, расположенных по краям нового макроблока. Значения этих пикселов используются повторно. В результате объем, который занимает изображение, значительно уменьшается.

В H.264, кроме того, усовершенствован механизм поблочной компенсации движения, который используется для кодирования P- и B-кадров. Кодировщик H.264 может по своему выбору осуществлять поиск совпадающих блоков (с точностью до субпиксела) в произвольном количестве областей одного или нескольких опорных кадров. Размер и форма блока также могут меняться, если при этом совпадение получается более точным. Для построения областей кадра, в которых нет совпадающих блоков, используются моноблоки с внутренним кодированием. Столь гибкий подход к компенсации движения оправдывает себя, например, при наблюдении за людными местами, когда требуется обеспечить также и качество изображения. Для компенсации движения выделяется большая часть ресурсов, отведенных видеокодеру. Поэтому от того, каким образом и насколько полно реализован этот алгоритм, зависит эффективность сжатия видеоизображения кодировщиком H.264.

При использовании H.264 удается также уменьшить количество артефактов блочности, характерных для Motion JPEG и других стандартов MPEG. Для этой цели в цикле кодирования используется внутренний фильтр деблокинга. В результате применения адаптивных алгоритмов удается сгладить края блоков и получить на выходе видеоизображение почти идеального качества.

В системах видеонаблюдения H.264, скорее всего, будет использоваться, в первую очередь, для решения задач, требующих больших скоростей передачи данных и высокого разрешения, например, в системах наблюдения за автомагистралями, в аэропортах и казино, где 30 к/с является нормой. В таких системах применение новой технологии позволит снизить требования к ширине каналов и объемам дискового пространства и приведет к значительной экономии.

Добавлено: 2017-08-31 12:11:30

На сегодняшний день все современные системы видеонаблюдения так или иначе являются цифровыми, то есть в конечном виде информация всегда имеет цифровое представление. В связи с этим для более эффективного хранения и передачи по сети обязательно используется сжатие видео по определённым алгоритмам.

Основные понятия

Практически все знают, что видео представляет из себя последовательность статичных изображений, меняющихся во времени. А эти изображения состоят из массива пикселей.

Пиксель - это наименьший логический элемент изображения, который меняет свой цвет в зависимости от его содержания.

Кадр - это массив всех пикселей, которые генерируются видеокамерой в определённый момент времени. На данный момент в системах видеонаблюдения самые распространённые размеры кадров: 960x576 (WD1), 1280x720 (HD), 1920x1080 (FullHD), 2688x1520 (4Mpix) и 2560x1920 (5 Mpix).

Частота кадров – это скорость, с которой чередуются кадры на мониторе. В большинстве случаев частота 25 кадров в секунду является максимальной. На профессиональном жаргоне оборудование, способное записывать и генерировать видеопоток с частотой 25 к/с, имеет приставку RealTime (с англ. «реальное время»). При такой частоте человеческий глаз воспринимает динамическое изображение плавным и без дёрганий как в реальности.

Битрейт - это количество бит информации, используемое для хранения или передачи видео или аудио контента в единицу времени (бит/с). Битрейт также отображает степень сжатия потока данных. В системах видеонаблюдения битрейт может постоянным (СBR – Constant Bitrate) или переменным (Variable Bitrate). Постоянный битрейт соответствует заданным параметрам и остаётся неизменным на протяжении всего файла. Его главное достоинство в том, что можно предсказать размер конечного файла. При переменном битрейте кодек выбирает его значение, исходя из параметров желаемого качества. В течение всего кодируемого видеофрагмента битрейт может изменяться.

Опорные кадры (i - кадры) – кадры, которые содержат полную информацию о текущем снимке.

Предсказанные кадры (p - кадры) – кадры, содержащие информацию только о разнице между текущим и предыдущим снимком.

Все применяемые в системах видеонаблюдения алгоритмы сжатия основываются на технологиях с потерями. То есть в процессе сжатия отсекается часть избыточной информации.

Почему видео необходимо сжимать?

Для наглядности рассчитаем видеопоток без компрессии с FullHD камеры со скоростью 25 кадров в секунду. Итак, имеем кадр с разрешением 1920x1080 и суммарным количеством пикселей 2073600. Представим один пиксель в самой простой форме кодирования цвета - RGB24, где под составляющие Red, Green и Blue выделяется по 8 бит. То есть 1 пиксель будет занимать 24 бита информационного пространства. Следовательно, одному кадру c разрешением 1080p потребуется 49766400 бит или 47,5 Мбит. Таких кадров в секунду хотелось бы иметь 25. Отсюда «вытекает» битрейт без сжатия 47,5 x 25 = 1187.5 Мбит/с = 1,16 Гбит/с, то есть для хранения часового фрагмента видео с 2 Mpix IP видеокамеры потребуется 500 Гб дискового пространства, а для передачи потока пропускной способности гигабитной сети будет недостаточно.

Следует отметить, что обычно максимальный битрейт видеопотока c идентичными параметрами при сжатии кодеком H.264 обычно составляет 8 Мбит/с, что почти в 150 раз меньше, чем у несжатого видео. Из этого очевидно, что без алгоритмов сжатия системы видеонаблюдения стоили бы в десятки, а то и в сотни раз дороже того, что мы имеем сейчас.

Современные алгоритмы сжатия

Время не стоит на месте, требования к качеству картинки постоянно растут. При этом пропускная способность каналов связи и ёмкость накопителей совсем бы не поспевали за этим ростом, если бы не постоянное совершенствование алгоритмов сжатия.

Стандарт H.264

На данный момент в системах видеонаблюдения уже достаточно длительное время доминирует алгоритм сжатия H.264.

Компрессия H.264 заключается в исключении избыточных данных и сокращении их объема по многочисленным алгоритмам, подробно которые рассматривать в данной статье мы не будем.

При настройке кодирования в системах видеонаблюдения встречаются три основных профиля кодека H.264:

Baseline профиль подразумевает минимальную нагрузку на процессор декодирующего устройства при несильном сжатии. Предназначен для просмотра видеокамеры в локальной сети на компьютере.

Main профиль создаёт среднюю нагрузку на процессор при сильном сжатии. Этот профиль универсальный и подходит для производительных ПК и для большинства видеорегистраторов.

High профиль обеспечивает максимальное сжатие с сильной нагрузкой на устройство декодирования. Битрейт при работе с таким профилем будет в 2-3 раза ниже, чем при использовании baseline профиля. При использовании видеосервера на базе процессоров Intel или AMD, в отличие от видеорегистратора, нагрузка будет распределяться на работу всей системы.

Перспективный стандарт H.265

Формат сжатия H.265 High Efficiency Video Coding (HEVC) стал значительным шагом вперед в области кодирования цифрового видеосигнала, главным преимуществом которого является почти в 2 раза увеличенная эффективность по сравнению с предшествующим стандартом H.264. То есть благодаря новому алгоритму для передачи сигнала требуется вдвое меньшая пропускная способность сети, а для хранения вдвое меньшая ёмкость накопителей. Это позволяет использовать программные и аппаратные средства c гораздо меньшими затратами.

Кстати, новый стандарт поддерживает разрешения вплоть до 35 Mpix (8192 х 4320 (8K)), так как максимальный размер блока увеличен до 4096 пикселей (у H.264 – блок 256 пикселей).

Параллельное кодирование, предусмотренное стандартом H.265, даёт возможность одновременной обработки разных частей кадра, что существенно ускоряет воспроизведение и даёт возможность в полной мере использовать современные многоядерные процессоры.

Кроме этого, новый стандарт получил технологию произвольного доступа к изображению (Clean Random Access), которая позволяет произвести декодирование случайно выбранного кадра без необходимости обработки предыдущих в потоке изображений. Это особенно желательно, когда при мониторинге требуется оперативно переключиться на определённый канал.

Несмотря на все преимущества, H.265 ещё далёк от повсеместного использования. Во-первых, из-за того, что для его использования необходима обновлённая аппаратная часть, во-вторых, чтобы использовать кодек необходима покупка патента, а в-третьих, имеются некоторые расхождения между эффективностями, полученными в лабораторных и реальных условиях.

Вероятнее всего в долгосрочной перспективе H.265 всё-таки заменит H.264 в качестве главного решения для компрессии видео.

Оптимизированный формат H.264+

Алгоритм сжатия H.264+ - инновационный формат, разработанный специально для использования в системах видеонаблюдения. По сути H.264+ это модифицированный кодек H.264 (AVC), который оптимизирован под задачи видеонаблюдения с учётом всех особенностей.

На видео, полученном с охранных видеокамер, сцена всегда постоянна и практически не изменяется, представляющие интерес подвижные объекты могут отсутствовать на протяжении длительного времени, а шумы, возникающие в плохих условиях освещения, ощутимо влияют на качество изображения. В обновлённом формате все эти особенности были учтены и обрабатываются следующими технологиями, повышающими степень сжатия:

кодирование с предсказанием на основе модели фона;
шумоподавление;
долгосрочное управление видеопотоком.

Кодирование с предсказанием. Все современные алгоритмы сжатия сочетают внутрикадровое и межкадровое сжатие. При внутрикадровом сжатии опорные i-кадры кодируются независимо от других кадров, а предсказанные p-кадры используют i-кадры и другие p-кадры (межкадровое сжатие). При межкадровом сжатии эффективность сильно зависит от выбора опорного кадра. Так как фон в видеонаблюдении стабилен, то его лучше всего использовать в качестве опорного i-кадра, тем самым повысить эффективность сжатия неподвижных объектов и снизить поток данных, приходящийся на опорные кадры. Интеллектуальный алгоритм предсказания выбирает опорные кадры среди тех, в которых меньше всего движущихся объектов.

Шумоподавление. Обычно подвижные объекты кодируются вместе со статичным фоном для сохранения качества. Вместе с фоном кодируются и фоновые шумы. В формате H.264+ c помощью специальных алгоритмов фон отделяется от движущегося объекта и кодируется с более высокой степенью сжатия. Такая технология позволяет частично подавлять шумы и уменьшать битрейт.

Долгосрочное управление видеопотоком. При фоновом подавлении шума битрейт видео зависит от размера части фона изображения. Например, при съёмке на улице в дневное время на фон приходится очень малая часть изображения, так как в это время в кадре находится большое количество подвижных людей и автомобилей. При этом битрейт ощутимо возрастает. И наоборот, ночью битрейт уменьшается, так как движущихся объектов становится гораздо меньше. Формат H.264+ имеет алгоритмы отслеживания интенсивности видеопотоков и в зависимости от времени суток автоматически изменяет степень сжатия. Такая технология управления видеопотоком позволяет не только уменьшить объём видеоархива, но и сохранить качество изображения движущихся объектов.

Недостатки сжатия видео

При использовании алгоритмов сжатия иногда на изображении можно отчётливо наблюдать так называемые артефакты. Например, разбиение изображения на блоки 8x8 пикселей или потерю мелких деталей изображения (размытие).

Заключение

Алгоритм сжатия H.264 по-прежнему остается самым популярным стандартом для подавляющего большинства систем видеонаблюдения. На сегодняшний день он полностью выполняет свои функции. Инновационный формат H.265 пока широкого распространения не получил в силу некоторых особенностей, но имеет все шансы заменить своего предшественника. Оптимизированный алгоритм H.264+ также глобального применения не имеет, так как используется только несколькими производителями.