Смарт-камеры с искусственным интеллектом: удобство или головная боль?
Василий Долгов, 23/08/24
В России растет интерес к видеокамерам с искусственным интеллектом (ИИ) как альтернативе полноценным серверным решениям в области видеоаналитики. Этот технологический тренд, поддерживаемый крупными отечественными компаниями, побуждает нас глубже разобраться в скрытых рисках и выяснить, насколько оправданно доверять умным камерам вопросы безопасности на предприятии, а также в каких случаях все же уместно использовать камеры с ИИ.
Защита данных
Использование умных камер с аналитикой на борту сопряжено с рядом опасностей. Злоумышленник, перехвативший информацию с такого устройства, может получить доступ не только к видеозаписям, но и к другим чувствительным данным, таким как:
- нарушения, фиксируемые системой;
- статистика активности людей в наблюдаемой зоне;
- другая конфиденциальная информация.
Если бы хакеры получили доступ только к видеопотоку, последствия взлома были бы менее серьезными. Поэтому каждая умная камера требует защиты от киберпреступников.
Пример первый
В 2021 г. компания Verkada подверглась хакерской атаке, в результате которой злоумышленники получили доступ к тысячам камер, включая те, что находились в больницах, тюрьмах и полицейских участках. К счастью, это были обычные камеры и скомпрометированы были только данные для доступа к ним. Если бы это были умные камеры, преступники смогли бы получить и чувствительную аналитическую информацию.
Пример второй
В 2022 г. атака на сеть умных камер в торговом центре привела к утечке данных о посещаемости и времени присутствия охранников.
Серверное решение
Серверные решения являются более экономичными и безопасными. Все данные хранятся на сервере, что исключает необходимость защищать каждую камеру. Достаточно обезопасить только само хранилище данных.
Пример
Компания может использовать защищенный сервер с современными методами шифрования для хранения и обработки данных, что значительно упрощает управление безопасностью системы.
Сейчас во всем мире активно внедряется стандарт 5G, а вскоре начнется распространение 6G. Эти протоколы позволяют стримить видеопотоки из любой точки, где есть доступ к сетям 5 и 6G. В этом случае обработка данных в камере становится излишней и непрактичной.
Ограниченные сценарии использования
Умные камеры не подходят для сложных сценариев использования. Они не могут объединить данные с нескольких источников для принятия сложных бизнес-решений.
Пример
В супермаркете система умных камер может не справиться с задачами отслеживания поведения покупателей, анализа тепловых карт передвижения и выявления краж одновременно. Серверное решение позволяет объединить данные с различных источников и обеспечить комплексный анализ.
Сами нейросетевые модели, используемые в камерах, – это сильно облегченные версии популярных опенсорсных моделей, причем не самых последних версий. Заменить на более актуальную не получится, так как вычислительная мощность встроенных в умные камеры чипов существенно ниже, чем требуется под актуальные модели. Таким образом, через два-три года умные камеры превращаются в обычные, так как на них невозможно применить современные технологии.
Кроме того, любая сложная аналитика, получающая данные с нескольких устройств или информацию из дополнительных источников, например автоматизированной системы управления технологическими процессами (АСУ ТП), подразумевает обработку данных на сервере.
Скорость обработки данных
Для критичных сервисов обработки видеопотока важна скорость работы системы. Использование видеокамер с ИИ на борту может быть нелогичным, так как существуют более современные нейросетевые модели, которые работают быстрее и точнее.
Пример
В случае аварийной ситуации на производственном предприятии необходимо мгновенно остановить оборудование, чтобы минимизировать ущерб. Серверное решение с использованием современных моделей ИИ обеспечивает более быстрое и точное распознавание критических событий.
При необходимости аварийного отключения оборудования мы советуем использовать EDGE-устройства в системах видеоаналитики. К ним можно подключать камеры не по IP-протоколу, а напрямую. Слабые модели, встроенные в смарт-камеры, дают большое количество ложных срабатываний, приводя к остановке оборудования, когда оно не требуется. Использование EDGE-устройств позволит, с одной стороны, избежать задержек, связанных с передачей видеопотока, с другой стороны, это возможность применять самые современные модели видеоаналитики. При этом к одному EDGE-устройству можно подключить несколько видеокамер (количество зависит от модели устройства). Есть решения, например, которые в пределах одной локальной сети, когда в цехе установлено 100 камер, позволяют обеспечить очень быструю реакцию на инцидент – 0,2 секунды. И это без потери точности детекции, которая достигает 99%.
Низкая эффективность и дополнительные траты
Оборудование внутри видеокамер стремительно устаревает. Новые модели видеоанализа могут не работать на таких устройствах.
Пример
В 2019 г. многие компании столкнулись с проблемой устаревания видеокамер, что потребовало значительных инвестиций в модернизацию инфраструктуры. Серверные решения позволили бы просто обновить программное обеспечение (ПО) на центральном сервере.
Нередко на умных камерах нельзя устанавливать обновления. Но даже если такая возможность предусмотрена, намного проще обновить модель на сервере, чем менять ее на всех камерах. Стоит учитывать, что современные нейросети работают на архитектуре, которую гаджеты со встроенным ИИ поддерживают не всегда.
Чем больше технологичных устройств управляется заказчиком, тем сложнее и дороже их обслуживание. Использование недорогих, но надежных IP-камер и одного сервера видеоаналитики практичнее, чем сотни дорогостоящих умных камер. Замена устройств умными камерами несет в себе ничем не обоснованные затраты.
Мультимодальные LLM в централизованных системах видеоаналитики
Мультимодальные большие языковые модели (MLLM, от англ. Multimodal Large Language Model) предлагают новые возможности для систем видеоаналитики, особенно в централизованных решениях. Они могут обрабатывать не только видео, но и другие виды данных, такие как текстовые описания и аудиозаписи, что значительно расширяет функционал и применимость таких систем.
Пример
В системе видеонаблюдения для аэропорта можно использовать LLM для анализа видеоизображений, распознавания речи и обработки текстовой информации, такой как данные с билетов и паспорта. Это позволяет создать комплексную систему безопасности, способную выявлять потенциальные угрозы более эффективно.
Мультимодальные LLM могут:
- Обрабатывать данные с различных типов сенсоров (камер, микрофонов, датчиков движения).
- Объединять информацию из разных источников для более точного анализа.
- Использовать текстовые данные для улучшения контекстуального понимания видеоизображений.
Умному дому – умную камеру
При использовании видеоаналитики в быту, как правило, нет необходимости устанавливать в доме сервер для видеоаналитики. В таких случаях логичнее проводить анализ полученных данных прямо в камере.
Технология позволяет идентифицировать лица людей и номера машин, обеспечивая беспрепятственный доступ жильцов, одновременно защищая дом от проникновения преступников. Умные камеры можно интегрировать в противопожарную систему.
Коттедж меньше нуждается в эффективной защите от киберпреступников, чем промышленный объект. В частном доме скорость обработки информации также перестает быть принципиальным моментом, как и стоимость обслуживания: когда сервис требуется одному-двум устройствам, вопрос цены становится менее важным.
Как мы уже разобрались, камеру со встроенной нейросетью едва ли можно назвать подходящим решением для промышленных объектов, больших торговых точек или стройплощадок. Однако в тех случаях, когда можно ограничиться всего одним или двумя источниками видеосигнала, такие устройства могут быть полезны.
Надежность и эффективность – ключевые аспекты видеоаналитики
Развитие технологий видеоаналитики с использованием серверных решений и современных методов защиты данных – это шаг вперед в обеспечении безопасности и эффективности бизнес-процессов. Умные камеры, несмотря на свои возможности, имеют ряд существенных недостатков, таких как повышенная уязвимость к кибератакам, ограниченность в сценариях использования и необходимость постоянного обновления.
Выводы
- Умные камеры с ИИ на борту несут значительные риски в том, что касается защиты данных.
- Серверные решения более эффективны в плане безопасности и управления.
- Умные камеры ограничены в применении сложных сценариев анализа данных.
- Серверные решения обеспечивают более высокую скорость и точность обработки данных.
- Оборудование внутри умных камер быстро устаревает, что приводит к дополнительным затратам.
- Мультимодальные LLM в централизованных системах видеоаналитики предоставляют новые возможности для комплексного анализа данных.
Использование умных камер с ИИ может показаться удобным, но серверные решения остаются более предпочтительными. Внедрение мультимодальных LLM может еще больше усилить возможности централизованных систем видеоаналитики, делая их более мощными и универсальными.
Изображение обработано нейросетью Kandinsky