Уже не роскошь… умный поиск как необходимый элемент современной системы видеонаблюдения

Уже не роскошь… умный поиск как необходимый элемент современной системы видеонаблюдения
М. Алтуев, президент ITV | AxxonSoft

 

 

 

Сиди и смотри

Сегодня уже никого не удивляет то, с какой скоростью мы получаем, отдаем информацию или обмениваемся ею. Мы прочно и органично встроены в онлайн-реаль-ность, в новые медиа и уже привыкли за считанные секунды находить в этой среде все, что нас интересует. Причем находить в любое время, в любом месте, в движении, в статике, разве что не во сне. Более того, мы, как правило, получаем информацию в уже отфильтрованном, кастомизированном виде - чтобы убедиться в этом, достаточно заглянуть на собственную страницу в Facebook. И если человека в одночасье лишить этой возможности, он будет потрясен и дезориентирован. Все дело в том, что поиск перестал быть тем, на что принято и уместно тратить время - логичнее и результативнее сосредоточиться на анализе, осмыслении или непосредственном использовании найденного.

Тем удивительнее, что в области видеоаналитики, напрямую связанной с высокими технологиями и инновационными разработками, наблюдается своего рода консерватизм. Несмотря на то, что ведущие игроки рынка безопасности прямо заявляют, что за интеллектуальным поиском в архиве - будущее отрасли, а конечные пользователи активно запрашивают этот инструмент у рынка, темпы его развития следует назвать, мягко говоря, осторожными.

Почти у всех нас еще живы в памяти времена, когда для того, чтобы добыть информацию о чем-то или о ком-то, приходилось часами исследовать толстые тома в библиотеке - без стопроцентной уверенности в успехе. Этот процесс напоминает о сегодняшних системах видеонаблюдения. Масштабные проекты, такие как «Безопасный город», - это десятки тысяч камер, сотни серверов, миллионы часов видеозаписи. И чем сложнее система, чем больше камер в ней, тем выше ее энтропия, и тем труднее операторам найти нужную видеозапись.

А значит - поиск в архиве становится ключевой функцией системы, от которой зависит ее финальная эффективность. И здесь операторов поджидает нешуточное испытание - непрерывный просмотр «километров» видео в поисках того или иного события, свидетельствующего, например, о преступлении или происшествии. Но зачастую, даже точно зная, что нужная информация есть в архиве, ее невозможно найти, потому что на это потребовались бы месяцы.

Это такой «Интернет без Гугла», в котором мы всякий раз вынуждены вводить в адресную строку ссылку на сайт целиком, держа ее в памяти. Вряд ли на свете существуют сверхлюди, способные на это...

Видеодетектор не панацея

У читателя может возникнуть вопрос: а как же видеодетекторы, разве они не облегчают поиск?

Да, видеодетекторы помогают оператору выбирать из потока информации значимые данные.

Однако фиксируют они только те события, на которые предварительно настроены. Такая аналитика в реальном времени приносит пользу, только если у вас есть возможность задать искомое событие заранее. Видеодетектор - очень нужный инструмент, когда речь идет о решении таких «регулярных» задач, как например, охрана периметра, распознавание номерных знаков на транспорте и т.д.

Но что делать, если произошло нечто непредвиденное, «не настроенное» в видеодетекторе? Ведь часто мы узнаем, что именно может произойти, лишь после того, как «это» происходит. Получается, что какими бы идеальными ни были видеодетекторы, они не могут зафиксировать все потенциально важные события - просто потому, что мы не можем «идеально» предвидеть все возможные ситуации.

Как же ускорить и автоматизировать поиск нужного события в видеоархиве, если точно известно, что оно записано, и есть некоторые сведения о нем? Очевидно, что здесь не обойтись решениями-полумерами и промежуточными усовершенствованиями. Например, можно было бы «заставить» видеодетектор, настроенный на нужное событие «постфактум», проанализировать видеоархив - ему ведь не важно, откуда приходит видеопоток - от камеры или из архива. Однако, если ваш архив большой, такой анализ займет массу времени. А что если поиск не даст результатов и его нужно будет повторить, настроив детектор заново?

Нужна реальная инновация в сфере поиска - прорывная технология, кардинально решающая проблему. И такая технология существует.

Все дело в метаданных

Представьте себе некий «Гугл для видеонаблюдения», инструмент, который постоянно индексирует информацию в вашем видеоархиве и создает базу данных индексов (или метаданных) для быстрого поиска. Метаданные - это формальное логическое описание всего, что находится в кадре. Какой объект, в каком месте, какого размера, куда движется, с какой скоростью, какого цвета и т.д. Такая информация занимает очень мало места по сравнению с видео и сохраняется одновременно с записью. Чтобы найти нужную видеозапись, достаточно ввести в этот «поисковик» запрос - и через несколько секунд вы получите результаты.

Вот почему, когда речь заходит о предотвращении и предсказывании угроз с помощью интеллектуальных детекторов, неизбежно возникает вопрос об использовании метаданных, и о том, в каких взаимоотношениях находятся метаданные с интеллектуальными детекторами и их сработками.

Итак, под метаданными мы понимаем некое описание того, что происходит в поле зрения камеры.

Алгоритмы машинного зрения обрабатывают поступающий от камеры видеопоток и формируют некоторое «простое» описание того, что происходит в наблюдаемой «сцене». Какая именно информация извлекается из видеопотока и в итоге становится основой для метаданных, зависит от сложности и возможностей самого алгоритма. Каждый алгоритм может работать по-своему, но информация, которую он генерирует, может передаваться в стандартизированном виде - например, в формате ONVIF.

Метаданные всегда формируются на уровне обработки видеопотока, а исполняться алгоритм их создания может как на самой камере, так и на компьютере - за счет возможностей программного обеспечения.

Итак, описание происходящего в поле зрения камеры есть, и мы можем в реальном времени зафиксировать момент, когда «что-то пошло не так» в поле зрения камеры. То есть мы можем построить некие логические правила принятия решения: вот сейчас все в порядке, а сейчас - уже нет. Соответственно, если в поле зрения камеры произошло событие, которое мы расцениваем как тревожное, можно привлечь к этому факту внимание пользователя - с помощью интеллектуальных ситуационных детекторов, которые встроены в систему видеонаблюдения «поверх» метаданных. Таким образом, метаданные - это базовое и необходимое описание сцены, а детекторы - уже некоторые критерии того, все ли хорошо в поле зрения камеры с точки зрения охранной специфики - причем для каждого конкретного объекта она своя. Система получает метаданные в реальном времени и смотрит, свидетельствуют ли они о каком-либо тревожном событии или нет. В зависимости от этого, формируется или не формируется тревога. Это стандартная схема работы с метаданными, но можно поступить и по-другому.

Постанализ метаданных - эффективный способ предотвращения угроз

Сегодня мы все чаще слышим о том, что постанализ метаданных -это оптимальный способ предсказывания и купирования угроз и рисков. Более того, многие сегменты рынка, например, торговые сети, постепенно, но уверенно переходят к системам безопасности, в основе которых лежит не оперативный мониторинг, а анализ событий, произошедших за определенный период времени и отобранных с помощью специальных инструментов видеоаналитики.

Это означает, что метаданные не только анализируются в реальном времени, но сохраняются в некую базу данных. Уже потом оператор проверяет, были ли в прошлом какие-то тревожные ситуации, причем критерии тревожности задаются именно в том момент, когда эта информация нужна. При мониторинге в реальном времени тревожные ситуации мы задаем заранее. Таким образом, возможность формировать запрос относительно тревог после того, как все события за определенный период времени уже произошли, -это чрезвычайно важная функция, реализовать которую помогает использование метаданных.

Итак, метаданные сохраняются в базу данных, а пользователь, имея на руках средства формирования запросов, обозначает «сценарий» в прошлом, который он считает тревожным, то есть ситуации, которые надо найти. В любой момент оператор может найти то, что его интересует в прошедшем событии в данный момент, а не то, что интересовало тогда, когда событие непосредственно происходило!

Но тут разработчики и пользователи сталкиваются с весомым препятствием. Дело в том, что метаданные, как мы уже отмечали, описывают сцену в поле зрения камеры, а значит - геометрию объектов в ней - их скорость, местоположение, размеры. Сохранить такую информацию в стандартной базе данных труда не представляет, но сформировать запрос по ним и выполнить его -крайне сложно и очень затратно по времени. Например, очень трудно будет выполнить простой запрос «Найти все объекты красного цвета, вошедшие в указанную полигональную область кадра».

Поэтому именно здесь становятся актуальными уникальные технологии разработчика относительно поиска и хранения метаданных. Мы в ITV | AxxonSoft разработали собственную СУБД, предназначенную специально для хранения метаданных и поиска по ним. В результате поиск в архиве нужного фрагмента записи составляет всего несколько секунд.
Эффект репки

Всякий раз, когда компания разрабатывает прорывную технологию, как правило, ею дело не ограничивается. Как в известной и поучительной сказке, она «тянет» за собой следующие востребованные инновации. В свое время была придумана технологию архивного поиска, основанная на использовании метаданных, но мы столкнулись с проблемой. При поиске нужно было формировать множество запросов к базе данных: вошел ли объект в такую-то зону, провел ли в ней больше заданного времени, куда переместился затем и т.д. Обычная реляционная база, которой мы ранее пользовались, не справлялась с обработкой запросов - они выполнялись часами. Разумеется, применять такую систему в реальности было невозможно. Поэтому мы изобрели собственную систему хранения метаданных, которая позволяет осуществлять поиск именно по геометрическим запросам - по координатам, скорости, размеру, цвету. И теперь результат поиска, даже в крупных архивах, вы получаете в течение нескольких секунд. Более того, уже сейчас инструмент поиска значительно усовершенствовался - появились новые функции, такие как поиск по критерию «человек/машина». В дальнейшем критериев будет больше, и поиск станет еще более гибким и точным. Уже скоро технология позволит распознавать образы - то есть различать объекты по типам.

А в таких проектах, как, например, «Безопасный город», чаще всего просмотр видеоархива связан с расследованием происшествий, поэтому и поиск логично вести по лицам людей - участников этих происшествий. Так вот, представьте, что все камеры города постоянно захватывают лица прохожих, индексируют и создают базу данных. И потом достаточно будет ввести в систему фотографию или фоторобот - и вы получите отсортированные по степени сходства результаты, а кликнув по любому из них, получите статистику появления лица в поле зрения различных камер. Конечно, распознавание не будет стопроцентным, но выбирать из нескольких похожих лиц гораздо проще, чем просматривать сто часов записи.

Кстати, подобная технология недавно реализована на базе интегрированной платформы «Интеллект» в Санкт-Петербургском метрополитене в рамках пилотного проекта на станции «Ладожская». Система захватывает лицо каждого человека, вошедшего на станцию, распознает его, а затем сравнивает с существующими базами данных. На данный момент система распознает 98% лиц, и если распознанное фото имеется в базе, 92% вероятности, что оно будет идентифицировано. Это отличные результаты, вселяющие оптимизм. В планах руководства города -оснастить подобной системой видеонаблюдения еще 19 станций Санкт-Петербургского метрополитена.

Итак, система интеллектуального поиска в архиве существует. Дело лишь за широким ее распространением, которое не заставит себя ждать. И здесь компаниям-разработчикам главное не останавливаться. Ведь адекватно отреагировать на запрос рынка и успокоиться невозможно - к моменту, когда один запрос выполнен, уже существует другой. Таковы условия рынка безопасности, и вряд ли они кардинально изменятся в обозримом будущем. Меняться, скорее всего, придется всем нам!