Контакты
Подписка
МЕНЮ
Контакты
Подписка

Сжатие телевизионного сигнала, повышающее качество изображения

В рубрику "Наука" | К списку рубрик  |  К списку авторов  |  К списку публикаций

Сжатие телевизионного сигнала, повышающее качество изображения

Наилучшие алгоритмы по теории сигналов (случайные частотно-временные позиции – СЧВП), по помехоустойчивости (коды с малой плотностью проверок на четность – МППЧ) и по криптографии (абсолютно криптостойкие шифраторы – АКШ), реализующие часть рекомендаций К. Шеннона1, описаны мною в 2013 г. в статье "Алгоритмы безопасности радиоканалов". Требования1 к кодированию непрерывных источников, которые для ТВИ задает зрительное восприятие контуров, давно успешно использованы в исследованиях2, 3 и показаны траекториями в публикации Михаила Руцкого "Неврологический прорыв"4. Цель этой работы – показать непригодность рекламируемых алгоритмов сжатия телевизионного изображения (ТВИ), игнорирующих зрительное восприятие, и помочь разработкам на микросхемах конкурентной на мировом уровне аппаратуры сжатия, улучшающей качество ТВИ
Юрий Брауде-Золотарев
Независимый эксперт

Гельмгольц давно доказал, что у глаз оптическая нерезкость близка к 5 мин угла зрения и что ее зрительное восприятие компенсирует поочередной оценкой яркости двух сторон прослеживаемых контуров3. Поэтому время прослеживания, оценка четкости и качества ТВИ зависят от контраста контуров.

Зрительное восприятие изображения

Чувствительность зрительного восприятия к плавным изменениям яркости крупных деталей мала. Двумерный анализ-синтез изображений (ДАСИ)2, 3 основан на этих особенностях зрительного восприятия. В ДАСИ телевизионное изображение анализируют несколько апертур разной величины, создающих сигналы о деталях изображения различной величины. Эти "расфокусированные апертуры" формируют нерезкие изображения и являются низкочастотными двумерными фильтрами (НДФ) пространственных частот. Увеличение эффективного диаметра апертуры (ЭДА) убирает детали изображения, меньшие ЭДА, повышает нерезкость контрастных границ и сокращает полосу пропускания НДФ пропорционально квадрату ЭДА. Все НДФ для ДАСИ были реализованы на камерах с нерезкой перезаписью изображения. Малая задержка перезаписи была незаметна вследствие инерционности зрительного восприятия даже при быстрых сменах сюжета. Разность сигналов двух НДФ при нулевом общем весе соответствует апертуре с участками "положительной и отрицательной прозрачности" – полосовому двумерному фильтру (ПДФ), выделяющему только контуры переходов яркости.

Наибольшее повышение качества телевизионного изображения обеспечивает ДАСИ с несколькими компонентами сигналов НДФ и ПДФ. Увеличение уровня контурных сигналов при синтезе ДАСИ облегчает их зрительное восприятие и повышает качество и оценку четкости изображения. У первого ПДФ при весе центрального элемента +1 отрицательные веса смежных четырех элементов (слева, справа, сверху и снизу) были 0,25. Чересстрочная развертка отодвигала верхний и нижний элементы, но из-за нерезкости зрительного восприятия (5 мин) это было незаметно. Головной телевизионный НИИ (ВНИИТ) не верил, что ДАСИ при чересстрочной развертке телевизионного изображения2, 3 изотропно разделит информацию о деталях разной величины, и отрицал возможность повышения качества сжатого изображения. Испытания ДАСИ были проведены на Московском телецентре при поддержке главного инженера Александра Михайловича Варбанского с выходом в эфир. После этого ВНИИТ признал свои ошибки, но много лет не мог развивать ДАСИ.

Сжатие объема сигнала при двумерном анализе-синтезе

Для исследований ДАСИ на Московском телецентре был создан тест-фильм (350 м), содержащий более 25 типичных сюжетов телевизионного изображения3. Два кинопроектора с одинаковыми фильмами подстраивали по таблице "0249" для совмещения растров по размерам, линейности и центровке. Их сигналы – позитив и негатив – суммировали, чтобы облегчить настройку совмещения. После прогрева в центральной части таблицы несовпадение растров было меньше 2 элементов, а на краях кадра – меньше 5. У второго проектора можно было вводить нерезкость от 2 до 30 элементов с уровнями от +0,6 (позитив) до - 1,0 (негатив), а также опережение и отставание. Для цифрового кодирования обычного кадра изображения нужны 128 ступеней квантования (7 бит), так как при шкале квантования 6 бит на крупных деталях с плавным изменением яркости возникают "ложные контуры". Объем такого цифрового сигнала кадра с 400 тыс. элементами был 2,8 млн бит (скорость 70 Мбит/с). Эксперименты на тест-фильме позволили выбрать оптимальные шкалы квантования и сжать сигналы ДАСИ.

При ДАСИ с пятью апертурами с эффективным диаметром 1, 2, 4, 8, 25 элементов были получены четыре ПДФ с границами (1–2), (2–4), (4–8), (8–25) элементов и НДФ с ЭДА 25 элементов. Для сигнала ПДФ (1–2) достаточны два дискретных уровня (1 бит), а для ПДФ (2–4), (4–8) и (8– 25) достаточны соответственно 4, 8, 16 уровней (2, 3, 4 бит). Для сигнала НДФ достаточны 16 уровней и 4 бита, так как ложные контуры квантования отфильтровывает синтез. Количество отсчетов на кадре с 400 тыс. элементов у этих ПДФ – 400, 100, 25; 6,25 тыс., а у НДФ – 0,7 тыс. отсчетов. Объем их сигналов на кадре – 400, 200, 75, 25 и 2,8 тыс. бит и общий объем – 703 тыс. бит. Кадр сжат в 4 раза при улучшенном качестве.

Инерционное и сверточное сжатие сигналов

Инерционное (трехмерное) сжатие использует медленное прослеживание контуров и подобие смежных кадров. На тест-фильмах отставание или опережение на 6 кадров (0,24 с) компонент НДФ, расфокусированных на 8 элементов, были заметны только при сменах сюжета и при очень быстром движении, но это не ухудшало качества изображения. При сдвигах на 4 кадра компонент НДФ с нерезкостью 2, 4, 8, 25 элементов искажения были незаметны. Это доказало возможность предсказания компонент следующих кадров по предыдущим и прореживания сигналов ПДФ (1–2), (2–4), (4–8), (8–25) элементов и их повторения в нескольких кадрах. Компоненту (1–2) повторяли только 2 раза из-за опасений осложнить восприятие четкости, а другие – 4 раза и получили 200, 50, 18, 6 и 0,7 тыс. бит соответственно, а всего – 275 тыс. бит, что соответствует сжатию кадра в 10 раз при высоком качестве изображения.

Сокращение статистической избыточности сигнала телевизионного изображения "сверточным сжатием" описано мною в начале 1960-х и 1980-х гг.5–7. "Характеристические сдвиги" сверточного сжатия задавали отводы двоичных анализаторов (АС) синдрома в точках, заданных генераторными полиномами малоизбыточных сверточных кодеков помехозащиты МППЧ. Для сигнала ПДФ (1–2) сверточное сжатие было исследовано во ВНИИ Радио на МППЧ с кодовой скоростью R=4/56. Двоичный контурный сигнал эти генераторные полиномы преобразовывали в 4 последовательности, которые поступали на 4 входа АС, где их в четырех генераторных полиномах обрабатывали подобно обработке четырех ветвей информационного сигнала при формировании проверочной последовательности МППЧ и при синтезе из них восстанавливали исходный контурный сигнал. Возникающие на хаотических позициях темные точки ошибок "интерференции" были совершенно незаметны. Это сверточное сжатие снизило объем прореженного сигнала ПДФ (1–2) объемом 200 тыс. бит на кадре в 4 раза – до 50 тыс. бит и общий объем сигнала кадра изображения – до 125 тыс. бит, что соответствует сжатию сигнала изображения в 22 раза – до скорости около 3,2 Мбит/с при высоком качестве изображения. Испытать более высокое сверточное сжатие компонент ПДФ (1–2) и (2–4) не удалось из-за математических трудностей поиска нужных генераторных полиномов, которые были созданы для кодеков МППЧ значительно позже на базе совершенных разностных множеств. Сигналы смежных ПДФ сильно коррелированы, что дает возможность увеличить сверточное сжатие, улучшив подавление интерференционных помех нестационарными генераторными полиномами c изменяемыми характеристическими сдвигами от кадра к кадру. Исследования сжатия телевизионного изображения более чем в 30 раз остановил ГКРТ, потребовавший разработок для Московского телецентра аппаратуры ДАСИ, повышающей качество изображения8–11.

Повышение качества изображения "коррекцией ореола"

Исследования8 были проведены на упомянутом тест-фильме. В обычных мониторах Московского телецентра "ореол рассеяния" добавлял к яркости исходного изображения около 25– 30% расфокусированного до 20–30 элементов изображения, что ослабляло контрастные переходы и полезный диапазон яркостей. Добавление расфокусированного до 20–30 элементов негатива сигнала НДФ компенсировало ореол, усиливало контрастные переходы и повышало оценки четкости и качества изображения. Оптимальное качество сюжетных изображений было при уровне негатива 70%. При уровне негатива 80% уже была заметна перекоррекция на крупных черных фрагментах на белом фоне.

Повышение качества изображения апертурными корректорами

Двумерный апертурный корректор на базе ПДФ (1–4) описан в публикациях начала 1960-х г г.9, 10. Каждую ультразвуковую задержку на строку дополняли элементы подстройки, управляемые строчной синхронизацией. Они учитывали изменения длительности строк в диапазоне 63,75–64,25 мкс, соответствующем норме нестабильности частоты сети 50±0,2 Гц. Сигнал центральной строки имел два участка с отрицательным весом длиной 3 элемента вокруг центрального длиной 1 элемент с положительным весом. Сигналы верхней и нижней строки имели сглаженную форму длиной 5 элементов. Общий "вес" апертуры этого ПДФ был равен нулю. Его сигнал обрабатывал нелинейный усилитель с ограничением максимального и минимального уровней, который убирал шумы и исключал перекоррекции. Сигнал коррекции выключали гасящие и синхронизирующие импульсы и сигналы темных участков изображения. Контрастность мелких деталей и контуров возрастала независимо от их направления и создавала эффект повышения четкости и качества изображения, подобный двукратному увеличению строк кадра. Чересстрочная развертка кадра не создавала неприятных эффектов. Однако при частотах сети меньше нормы возникали неприятности.

Аппаратура двумерной коррекции изображения

После испытаний апертурного корректора10 ГКРТ заказал для Московского телецентра корректор ореола и второй апертурный корректор с двумя ПДФ (1–4) и (4–8), выполненными на ультразвуковых линиях задержки с расширенным диапазоном регулировок 64,65–63,6 мкс, учитывающим, что реальные уходы частоты сети (диапазон 49,5– 50,3 Гц) выше нормы11. В отличие от апертурного корректора сигналы ДПФ имели переменные пороги ограничения по минимуму, управляемые оценками уровня шумов и возможности увеличения уровня коррекции до 80% в зависимости от источника изображения и сюжета. Уровень коррекции сигнала первого ПДФ обычно был в 2–3 раза выше, чем у второго. Наибольшей коррекции требовали нерезкие и малоконтрастные изображения. Аппаратура, выполненная на лампах, занимала типовую стойку, где места для корректора ореола не было. Он был внешним. Эту аппаратуру на Московском телецентре берегли и включали только на сюжетах с очень плохим качеством. При передаче телевизионного сигнала из космоса с 10 кадр/с, 400 строками, 400 элементами в строке и полосой частот видеосигнала 800 к Гц качество откорректированного изображения не уступало качеству обычного изображения.

Недостатки современных способов сжатия

В Интернете можно найти множество алгоритмов сжатия телевизионного изображения (JPEG, DivX, DivX 3.11 Alpha, AVC, H.264, MPEG, MPEG-4, HEVC). Все они очень сложны, ухудшают качество изображения и не всегда пригодны для видеоконтроля в системах охраны.

Наиболее интересен алгоритм HEVC – High Efficiency Video Coding, работающий при чересстрочной и прогрессивной развертке изображения. В кодере HEVC первый кадр изображения кодируют предсказанием отсчета кадра по соседним отсчетам, подобным двумерному кодированию. В следующих кадрах используют межкадровое предсказание. Движение компенсируют с помощью векторов движения, передаваемых как дополнительная информация. 29 февраля 2012 г. компания Qualcomm показала HEVC-декодер на двухъядерном процессоре Qualcomm Snapdragon S4 с частотой 1,5 ГГц, реализованом на микросхемах с технологией 45 и 28 нм типа SoC (система на кристалле) с огромной собственной памятью 32 ГГбит, которая более, чем в 1000 раз превышает память самого сложного кодера ДАСИ с инерционным и сверточным сжатием.

Перспективы реализации двумерного анализа-синтеза на микросхемах

Постановление Правительства РФ № 809 от 26.11.07 "Развитие электронной компонентной базы и радиоэлектроники на 2008–2015 гг." требует разработок на микросхемах аппаратуры, конкурентной на мировом уровне. Оно предусматривает реализацию технологии 45 нм в 2015 г. Современные технологии позволяют реализовать ДАСИ со сверточным сжатием простыми средствами на базе отечественных микросхем. Двумерный анализ-синтез изображений (ДАСИ) является единственным алгоритмом, использующим простейшие аппаратные средства, подобные ранее успешно испытанным микросхемам помехоустойчивого и криптографического кодирования. В НПК "Технологический центр МИЭТ" уже освоен выпуск БМК серий 5529 и 5521 с КМОП-технологиями 0,25 и 0,18 мкм. Есть опыт совместных работ с МИЭТ. Максимальный объем этих БМК – 1500 тыс. УВ в 5 раз превышает объем, нужный для реализации ДАСИ со сверточным сжатием. Необходимые МБИС с КМОП-технологиями с ПН до 0,13 мкм уже изготовляют компании "Ангстрем" и "Микрон" (Зеленоград). ОАО "НИИ полупроводниковых приборов" (Томск) для диапазона 3,1–5,1 ГГц разработал комплект интегральных микросхем для ВРС и технических средств охраны с частотами выше 30 ГГц по арсенид-галлиевой технологии 0,5 мкм.

Выводы

Многие новейшие способы сжатия объема телевизионного сигнала очень сложны и не улучшают качество изображения. Современные мегапиксельные камеры незначительно повышают качество восприятия изображения. Известный более 30 лет двумерный анализ-синтез изображений (ДАСИ) обеспечивает сжатие сигнала изображения более чем в 20 раз – до скорости 3,2 Мбит/с – и улучшает качество изображения.

Возможно дальнейшее увеличение сжатия изображения инерционным и сверточным сжатием в 30 и более раз. У восстановленного после сжатия изображения качество более высокое, чем у исходного, что невозможно для других способов. Аппаратная реализация ДАСИ, инерционного и сверточного сжатия в несколько раз проще при реализации на микросхемах, чем у других способов. Структуру аппаратуры, реализующей ДАСИ на микросхемах, полезно детально рассмотреть в отдельной статье.

___________________________________________
1 Шеннон К. "Работы по теории информации и кибернетике", М., ИЛ, 1963.
2 Брауде-Золотарев Ю.М. Способ анализа и синтеза телевизионного изображения. АС № 120534, БИ № 10, 1959 г. по заявке от 22.11.1957.
3 Брауде-Золотарев Ю.М. Исследование возможностей сокращения объема телевизионного сигнала за счет использования свойств зрения. Диссертация к.т.н., МЭИС, 1960.
4 Руцкой М.В. Неврологический прорыв //Системы безопасности № 5, 2013.
5 Брауде-Золотарев Ю, М. Способ сокращения объема телевизионного сигнала. АС № 145620, БИ № 6, 1962 г., Кл.21а, 34. Заявка от 6.04.1961, № 72521426.
6 Брауде-Золотарев Ю.М., Золотарев В.В. Оптимизированный пороговый алгоритм и сжатие источника. // Труды НИИР, 1979, № 2, с. 10–13.
7 Кривошеев М.И. и др. Цифровое телевидение // Ред. Кривошеев М.И. М., Связь, 1980, с. 241.
8 Брауде-Золотарев Ю.М. Диапазон контрастности телевизионного изображения и коррекция ореола. Техника кино и телевидения № 5, 1960 г.
9 Брауде-Золотарев Ю, М. Способ улучшения качества телевизионного изображения. АС № 134289, БИ № 24, 1960 г.,Кл. H04N5/14, Заявка от 1.12.1958 г., № 61315826 Опубликовано 01.01.1959.
10 Брауде-Золотарев Ю.М., Митбрейт Л.М., Шейфис И.И. Полный апертурный корректор // Техника кино и телевидения № 8, 1962 г.
11 Брауде-Золотарев Ю.М., Митбрейт Л.М., Кулагин В.А., Игнаткин В.С. Аппаратура двумерной коррекции ТВИ // Техника кино и телевидения № 11, 1969 г.

Опубликовано: Журнал "Системы безопасности" #5, 2014
Посещений: 10153

  Автор

Юрий Брауде-Золотарев

Юрий Брауде-Золотарев

Независимый эксперт

Всего статей:  2

В рубрику "Наука" | К списку рубрик  |  К списку авторов  |  К списку публикаций