Подписка
МЕНЮ
Подписка

Цифровой интеллект в видеокамере. Риски его отсутствия на борту

Михаил Сушков, 12/09/22

Отсутствие качественной аппаратной аналитики на борту камер видеонаблюдения несет определенные ограничения и риски. Давайте разберемся, в чем же состоят преимущества камер с встроенной аналитикой на базе глубокого обучения, в каких областях их применение наиболее эффективно. Поговорим также о том, что ждет индустрию интеллектуальной видеоаналитики на устройствах в ближайшем будущем.

Создавайте главное отраслевое издание вместе с нами!

Область глубокого обучения получила свое развитие из понятия "искусственные нейронные сети" 1980-х гг. В первые годы существования этой ветви искусственного интеллекта (ИИ) нейронные сети моделировались по образцу человеческого мозга, который, как известно, состоит более чем из 100 млрд нейронов.

Развитие технологий глубокого обучения

Ключевым ограничением ранних систем была сложность обучения сети. Аппаратные технологии были слишком медленными, чтобы правильно обучить нейронную сеть, которая могла бы решать значимые задачи из реального мира.

С 2000 г. исследовательское сообщество нейронных сетей начало привлекать внимание отраслевых лабораторий к работе сетей глубокого обучения. За последние несколько лет реальные применения данной технологии охватили многие сферы, включая распознавание рукописного текста, языковый перевод, автоматические игры (шахматы, го), классификацию объектов, распознавание лиц, анализ медицинских снимков, создание автомобилей с полностью автономным управлением и многие другие.

Согласно данным лидера рынка исследований – компании Omdia, в 2020 г. в мире было продано 117 млн профессиональных видеокамер. 42% из них имели разрешение более 4 Мпк. И уже к 2025 г. доля таких камер на рынке прогнозируется на уровне 74%. В то же время к концу этого года Omdia прогнозирует, что количество установленных видеокамер превысит 1 млрд. Эти камеры будут генерировать огромный объем информации. Возникает вопрос: что делать с этим впечатляющим массивом данных? Ведь эта информация будет полезна только в том случае, если она сможет быть своевременно обработана и проанализирована.

Именно эту проблему помогают решить алгоритмы глубокого обучения, которые значительно расширяют возможности аппаратной аналитики на видеокамерах. С их помощью можно научить устройства лучше фильтровать ненужные данные, что в мире больших данных может сэкономить время, деньги и человеческие ресурсы.

Программные модули и системы видеоаналитики. Выбрать >>

Ограничения и риски для камер без аппаратной аналитики на базе глубокого обучения на борту

Из 117 млн отгруженных в мире в 2020 г. камер лишь 16% имели функционал аналитики на базе глубокого обучения. Оставшиеся 84% проданных камер накладывают следующие ограничения и риски на владельцев.

Безопасность данных

Для последующего анализа и хранения камера передает видеопоток на сервер. Это, в свою очередь, увеличивает число узлов и объем данных, подверженных риску уязвимости.

Повышенная нагрузка на сеть

Анализ, выполняемый на сервере, требует, чтобы все данные с камеры передавались в центр обработки данных для анализа, в связи с чем возникает гораздо большая потребность в дорогостоящей сети с соответствующей пропускной способностью.

Увеличенные расходы на электроэнергию и обработку данных

В некоторых случаях передача данных по сети для централизованной обработки может быть полностью исключена, в то время как в других случаях объем данных, задействованных во всей системе, делает централизованную обработку непрактичной, тем более с использованием улучшенных кодеков сжатия, увеличенным количеством камер и увеличенным разрешением.

Кроме того, потоковая передача больших объемов видео, а затем их анализ с помощью графических процессоров на сервере потребует значительных финансовых вложений. В случае когда анализ данных происходит на самой камере, нет необходимости в постоянной трансляции видеопотока и дорогостоящей инфраструктуре.

Задержка передачи и обработки данных

В сценариях, которые подразумевают контроль в режиме реального времени, например при распознавании лиц для предоставления доступа или отправке оповещений в реальном времени, и особенно в критических ситуациях, попросту нет альтернативы аналитике изображения непосредственно на самой камере.

Для задач отслеживания объектов и отдельных лиц на обширных площадях с помощью нескольких камер также достигаются существенные преимущества, поскольку системы выигрывают от развития вычислительной мощности для анализа на базе глубокого обучения на борту камеры. И, как следствие, это ведет к сокращению задержки и времени, необходимого для обработки данных с видеоизображения.

Кроме того, есть объекты, на которых процессы не являются критически важными. Но эти процессы подразумевают комфортный пользовательский опыт, который может быть нарушен из-за медленно реагирующей системы. Например, розничные POS-системы или автоматическая касса, у которой есть задержки в несколько секунд для ответа на каждый ввод, могут стать попросту непригодными для использования, когда скорость интернет-соединения падает или вовсе отсутствует.

рис1 (3)-4Поставки оборудования для видеонаблюдения со встроенной видеоаналитикой

Узнайте о возможностях лидогенерации и продвижении через контент

Преимущества камер со встроенной аналитикой на базе глубокого обучения

Omdia прогнозирует, что к 2025 г. число камер со встроенной функцией анализа на базе глубокого обучения достигнет 64% от общего числа продаваемых в мире камер. Согласно закону Мура, вычислительные возможности в сочетании с большей энергоэффективностью у таких устройств будут расти. Это даст следующие преимущества.

Низкая задержка и более высокая частота кадров

Вы можете выполнять задачи анализа с помощью искусственного интеллекта в режиме реального времени. Вам не нужно будет устанавливать на 10, 15 или 20 кадров в секунду, если ваше приложение требует больших значений. Это востребовано для критически важных приложений, для обнаружения и отслеживания быстро движущихся объектов, а также для адаптивных автоматизированных систем и интерфейсов.

Более высокая точность и надежность

Чем выше разрешение видео, тем бóльшая требуется вычислительная мощность, поэтому камеры с высоким разрешением (FHD, UHD), которые используются для точного обнаружения мелких деталей, требуют больше TOPS (триллион операций в секунду).

Большая вычислительная мощность позволяет приложениям использовать большие, высокоточные современные модели нейросетей. Модели становятся все больше и сложнее, в том числе для повышения точности результатов.

Первое поколение периферийных процессоров и ускорителей ИИ (не говоря уже о периферийных продуктах на основе GPU) было более ограниченным в своей способности использовать такие модели. По крайней мере, не обошлось без заметного снижения точности.

Как камеры с высоким разрешением, так и ИИ c высокой степенью точности предоставляют возможность повысить качество обнаружения и классификации. В свою очередь, это позволяет осуществлять более надежные оповещения пользователей и операторов.

Более надежные возможности, более богатые приложения

Большая вычислительная мощность позволяет обнаруживать большее количество объектов и лучше идентифицировать их, а также использовать несколько нейросетевых моделей одновременно. Возможности пользователей не исчерпываются детекцией пересечения линии, обнаружением движения, которое захватывает объекты, движущиеся со скоростью в пределах 50 км/ч, или элементарной детекцией объектов, способной идентифицировать до 10 их типов.

Мощности позволяют одновременно выполнять все эти операции. Сегодня большинство полезных приложений видеоаналитики не просто используют одну модель. Они содержат в себе несколько, чтобы получить более значимые данные.

Экономия средств на уровне системы

Более мощная аналитика на камере позволяет охватывать области интереса больших размеров. Благодаря возросшей возможности обработки потокового видео пользователи могут установить камеру с более высоким разрешением или мультисенсорную камеру вместо нескольких фиксированных камер с низким разрешением для покрытия той же области интереса.

Повышенная точность аналитики позволит сократить объем хранимого видео и нагрузку на пропускную способность сети за счет метаданных, создаваемых непосредственно на устройстве.

Более того, пользователи могут достичь лучшего сочетания вышеперечисленного. Всегда существует компромисс между разрешением, частотой кадров, размером модели (или сложностью аналитического приложения) и стоимостью решения.

Получение значительно большего объема ресурсов уменьшает компромисс, на который приходится идти пользователям. Например, клиенты могут осуществлять анализ значимых данных для нескольких видеопотоков одновременно с высоким разрешением и с частотой кадров в режиме реального времени.

рис1 (4)-Sep-12-2022-08-57-01-10-AMВыручка от продаж чипсетов для видеокамер с поддержкой ИИ

ALL-OVER-IP 2022 17 ноября – 9 декабря | онлайн-программа

Применение видеоанализа на базе глубокого обучения

Сферы применения видеоанализа на базе глубокого обучения можно условно разделить на следующие типы.

Охрана и безопасность

Включает все функции видеоанализа, используемые для охраны и безопасности. Сюда относят детекцию объектов, нарушения периметра, оставленных предметов, приватных зон (размытие лица), детекцию несанкционированного прохода через пропускной пункт нескольких лиц по одному предъявленному идентификатору (так называемый проход "паровозиком"), а также распознавание номеров для контроля доступа.

Бизнес-аналитика

Включает всю аналитику для бизнес-целей и целей повышения операционной эффективности, такие приложения, как тепловые карты, подсчет посетителей, мониторинг длины очередей, время остановки в зоне, поток людей, распознавание возраста и пола.

Наблюдение за транспортным потоком

Включает приложения, разработанные для детекции нарушения правил дорожного движения, аварий и инцидентов на дорогах, равно как управления плавностью дорожного потока. Сейчас большинство аналитических функций на камерах решают задачи охраны и безопасности. Однако к 2025 г. баланс будет меняться по мере того, как бизнес-аналитика будет наращивать свою долю в функционале таких камер. Проекты с использованием бизнес-аналитики станут драйвером роста этого сегмента рынка по мере того, как конечные клиенты осознают эффективность возврата инвестиций, которую обеспечивают такие решения.

Глубинное обучение для улучшения качества видео

Необходимо отдельно сказать об использовании глубинного обучения для улучшения качества видео. Интеллектуальная технология обработки изображения использует мощные алгоритмы глубинного обучения для оценки конкретных сцен (дождь и туман, фоновая засветка, адаптация сцены против мерцания и т.д.) и автоматически настраивает параметры экспозиции для обеспечения высокого качества изображения.

Для наружного применения данная технология автоматически компенсирует изменение погодных условий и условий освещения, экономя время и трудозатраты пользователей.

Открытые платформы

Ряд производителей видеокамер давно развивают открытые платформы для сторонних разработчиков приложений. По мере роста производительности видеокамер разработчики приложений для таких платформ получают возможность адаптировать новые решения под нужды конкретных отраслей или заказчиков. В свою очередь, при использовании камер с глубинным обучением на открытой платформе пользователи получают широкий выбор различных приложений.

Подобно тому как мы используем по мере необходимости различные приложения для решения наших прикладных задач, которые также могут меняться с течением времени, пользователи получают возможность использовать разные модули одновременно или последовательно на разных этапах проекта.

Что ждет индустрию дальше

В текущий момент в большинстве случаев аналитика на камере ограничена возможностью детекции объекта и его движения. Это приводит к необходимости определения объекта и его действий человеком с помощью программного обеспечения, установленного на центральном сервере.

С появлением все более совершенных алгоритмов глубинного обучения камеры могут самостоятельно определять тип объекта, а также характер его действий и тип реакции, которую необходимо предпринять в соответствии с полученными данными.

Ожидается, что к 2025 г. появится новое поколение чипов, которое позволит сделать стоимость встроенной аналитики на камере более демократичной. Возможно, она проникнет в бюджетный сегмент рынка, где сейчас нет камер с глубинным обучением.

Таким образом, внедрение видеоаналитики станет менее затратным с точки зрения финансов и ресурсов. Стоимость серверов, которые было необходимо использовать, и требования к пропускной способности сети будут значительно снижены. И интеллектуальная видеоаналитика на камере на базе глубинного обучения станет такой же массовой, как мегапиксельные камеры в настоящий момент.

Опубликовано в журнале "Системы безопасности" № 4/2022

Все статьи журнала "Системы безопасности"
доступны для скачивания в iMag >>

Мнения экспертов по другим темам >>

Темы:ВидеонаблюдениеИскусственный интеллектВидеоаналитикаЖурнал "Системы безопасности" №4/2022
Статьи по той же темеСтатьи по той же теме

Хотите участвовать?

Выберите вариант!

 

КАЛЕНДАРЬ МЕРОПРИЯТИЙ
ПОСЕТИТЬ МЕРОПРИЯТИЯ
ВЫСТУПИТЬ НА КОНФЕРЕНЦИЯХ
СТАТЬ РЕКЛАМОДАТЕЛЕМ
Комментарии

More...