Видеоаналитика - мифы и реальные возможности
|
||
Видеоаналитика - мифы и реальные возможности руководитель направления цифрового видеонаблюдения ООО «Роберт Бош» Сегодня тематика интеллектуальных систем и решений очень популярна. Одним из ключевых направлений цифрового видеонаблюдения является видеоаналитика. Быстрое развитие рынка цифрового видеонаблюдения способствует распространению систем интеллектуального видеоанализа. В настоящий момент все, что касается реальных возможностей видеоаналитики, покрыто мраком, а вопросов значительно больше, чем ответов. Во многом, благодаря маркетинговой информации, ожидания заказчиков превышают реальные возможности систем интеллектуального анализа видеоинформации. В этой статье я постараюсь несколько прояснить ситуацию. Внастоящий момент большинству специалистов стало понятно, что видеоаналитика -это очень перспективное направление, за ней будущее. Оснований для развития таких систем предостаточно. Существуют исследования, результаты которых говорят, что после 12 минут непрерывного наблюдения оператор начинает пропускать до 45% событий. И до 95% потенциально тревожных событий будет пропущено уже после 22 минут непрерывного наблюдения. Ничего удивительного в таких результатах нет, ведь изображения с охранных видеокамер являются чрезвычайно скучными для человека. Таким образом, сомнений в обоснованности использования видеоаналитики практически нет. С другой стороны, встает вопрос: каков реальный функционал таких систем? На что они действительно способны, а на что нет? Существует перечень классических задач, с которыми видеоаналитика успешно справляется, что подтверждено практическими результатами. Перечислю наиболее популярные их них: ■ распознавание автомобильных номеров; ■ распознавание лиц; ■ детектирование событий (пересечение линий, вход в поле, выход из поля, оставленный или унесенный предмет и т.д.). Также хотелось бы привести несколько задач, которые видеоаналитике сегодня не под силу: ■ детектирование тревог при крайне плохой видимости; ■ обнаружение спрятанного оружия; ■ обнаружение «подозрительного поведения»; ■ и т.д. Эффективность решения каждой из перечисленных выше задач существенно зависит от многих факторов. Что касается распознавания автомобильных номеров - в этой области проведено довольно много работы, информации также предостаточно. Подробно останавливаться на этом вопросе в данной статье я не буду, скажу лишь, что существуют подробные рекомендации к установке камеры, выбору объектива, известно минимальное количество пикселей, которое должен занимать автомобильный номер в кадре и т.д. Такие системы довольно широко распространены на практике, многие российские и зарубежные разработчики успешно предлагают свои решения по распознаванию автомобильных номеров. Распознавание лиц - это, разумеется, тема отдельного разговора. На мой взгляд, из всех упомянутых эти системы наиболее капризны. Требования к освещенности, размеру и положению лица в кадре, качеству базы данных лиц очень критичны, таким образом, реально применить такие системы очень сложно. Однако это не означает, что они бесполезны и бесперспективны. Системы видеоаналитики развиваются очень быстро, а востребованность систем распознавания лиц переоценить сложно. Рис. 1. Мифы о возможности видеоаналитики: (слева-направо, сверху-вниз) - Видеоаналитика в условиях плохой видимости - Обнаружение оружия и т.п. - Обнаружение террористических угроз - Обнаружение противоправных действий в толпе Рис. 2. Типовые задачи видеоаналитики: Верхний ряд слева - Следование по маршруту справа - Пересечение линии в определенном направлении Нижний ряд слева - отслеживание направления движения в толпе справа - промежуточный результат обработки изображения слева Сегодня довольно широко ведутся дискуссии относительно того, должна ли видеоаналитика быть централизованной или же работать непосредственно в самой видеокамере. Преимущества и недостатки каждого из вариантов лежат на поверхности. С одной стороны, процессоры серверов значительно превосходят по производительности процессоры,установленные внутри IP-видеокамер. Разработка программного обеспечения видеоанализа, работающего централизованно на сервере, проще, а возможности значительно шире. Реализация аналитики на уровне камеры несет ряд преимуществ: ■ Возможность работать с «живым», несжатым, только что считанным с матрицы изображением. ■ Отсутствие централизованной точки отказа (если выходит из строя одна камера - остальные продолжают работать, если же останавливается сервер, обрабатывающий видео с группы камер, процесс видеоанализа прекращается по всей группе). ■ Возможность снизить сетевой трафик и строить распределенные системы. Зачастую компании-разработчики программного обеспечения для серверов ратуют за централизованную видеоаналитику, однако преимущества видеоанализа, работающего на уровне камеры, неоспоримы. С технологическим развитием IP-видеокамер их аналитические возможности постоянно расширяются. Сегодня уже возможно построить интеллектуальную систему видеонаблюдения, в которой компьютер отсутствует вовсе, а всю аналитическую работу проделывают «умные» камеры. В дальнейшем, говоря о видеоаналитике, будем иметь в виду видеоанализ, работающий непосредственно в камере. Одним из примером такой реализации системы видеоанализа является IVA (Intelligent Video Analytics), разработанная компанией Bosch Security Systems. Теперь остановимся несколько подробнее на детектировании событий. Хотелось бы подчеркнуть, что речь идет именно об интеллектуальном видеоанализе, а не о банальном детекторе движения. Спектр событий - задач интеллектуального детектора - постоянно расширяется. Если сравнительно недавно возможности ограничивались детекцией движения в определенных участках изображения, фильтрация была возможна по размеру объекта, то сейчас список задач, которые могут быть решены средствами видеоанализа, существенно шире. Это далеко не полный список событий, которые могут быть детектированы при помощи систем видеоаналитики. Что касается спектра практических применений, он невероятно широк. Это и охрана периметра, контроль дорожной обстановки, безопасность на транспорте, системы безопасного города и т.д. Благодаря возможности создавать сложные тревожные события на основе комбинаций простых, возможности проектировщиков и инсталляторов становятся практически безграничными. Необходимо отметить, что существенно расширились и возможности фильтрации событий. Помимо привычных возможностей фильтрации по геометрическим признакам (размеры, площадь, соотношение сторон), возможно фильтровать по направлению, скорости движения, наличию головы, а также цвету детектируемого объекта. К примеру, система интеллектуального видеоанализа IVA способна детектировать объект по цвету, который может быть представлен комбинацией до 5 различных цветов! Рис. 3. Конфигурация цвета детектируемого объекта Рис. 4. IVA Lens Calculator Необходимо понимать, что как вероятность адекватного детектирования тревожных событий, так и процент ложных тревог существенно зависит от ряда факторов, таких как: выбор оптимального места расположения камеры, правильный подбор оптики, качество видеосигнала (если визуально рассмотреть ничего невозможно, детекция также невозможна), относительный размер объекта в кадре и т.д. Таким образом, правильный подбор оборудования (видеокамера, объектив), выбор оптимального места установки камеры, применение подсветки (ИК или видимый свет), если наблюдение ведется в сложных условиях с точки зрения освещенности, позволяют достичь максимальной вероятности корректного детектирования тревожных событий и минимизировать частоту ложных тревог. Хотелось бы подчеркнуть, что 100% вероятности детектирования и 0% ложных тревог достичь невозможно. Как упоминалось ранее, вероятность детектирования зависит от ряда факторов. Компания Bosch Security Systems разработала так называемый IVA Lens Calculator - инструмент, позволяющий проектировщикам и инсталляторам подобрать оптимальное место установки камеры, подобрать объектив и оценить так называемую вероятность детектирования (POD Probability Of Detection). Итоговое значение POD зависит от параметров DCRI - Detection, Classification, Recognition and Identification (детектирование, классификация, распознавание и идентификация) - классификация в терминологии Армии США (US Army Night Vision lab, John Johnson). В свою очередь, значение DCRI зависит от значения VSH (Vertical Screen Height) - значение в процентах, показывающее относительную высоту объекта (по отношению к высоте кадра). То есть, в зависимости от того, какой высоты в кадре будет объект детектирования, возможно классифицировать его в терминологии DCRI. Определить, будет ли он детектирован, классифицирован, распознан или идентифицирован. В зависимости от этого уже оценивается POD - вероятность детектирования. Значение также имеет уровень фонового шума. Желательно при выборе места установки камеры по возможности минимизировать область пространства, попадающую в кадр позади объекта детектирования. Одним из важнейших условий корректной работы видеоаналитики является точная калибровка IP-камеры. Системе видеоаналитики необходимо максимально точно сообщить, на какой высоте установлена камера, с каким фокусным расстоянием установлен объектив, угол наклона камеры и т.д. Поскольку видеоаналитика оперирует лишь пикселями, система должна четко понимать, 100 пикселей по горизонтали - это один метр или пять. Использование такого инструмента, как IVA Lens Calculator, позволяет не только оптимально подобрать оборудование и определить место установки видеокамеры, но и оценить вероятность детектирования в заданной части пространства. Еще одной важной функцией видеоаналитики является возможность интеллектуального поиска в архиве. При работе системы видеоаналитики вместе с видеопотоком в хранилище непрерывно передаются метаданные (специальные служебные данные, непрерывно описывающие потенциально тревожные события в поле зрения камеры, контуры движения, траектории и т.д.). Метаданные синхронизированы с видеоархивом и позволяют существенно экономить время при поиске в архиве. Поиск может быть осуществлен по событию, критерии которого задаются аналогично настройке работы детектора в реальном времени. Рассмотрим пример: Пусть видеокамера контролирует дорожную обстановку и в реальном времени настроена на детектирование тревог. Тревожными событиями являются все пересечения автомобилями мнимой линии, проведенной поверх реальной линии разметки, разделяющей потоки встречных направлений. Поступила информация, что по этому участку дороги проследовал угнанный автомобиль. Известно примерное время следования и, скажем, цвет автомобиля. Так как он не нарушал ПДД и не пересекал сплошную линию разметки, его появление в кадре не было тревожным событием. Однако, поскольку функция видеоанализа активирована, в архив были записаны метаданные, возможно будет быстро найти все появления автомобилей заданного цвета на данном участке дороги, несмотря на то, что априорно цвет задан не был. Просмотр архивного видео является не менее скучным занятием, чем мониторинг охранных видеоизображений в реальном времени. Вероятность того, что оператор при просмотре пропустит то или иное событие, достаточно велика. В России на сегодняшний день не существует такой профессии, как квалифицированный оператор видеонаблюдения. Этому нигде не учат. В большинстве случаев этот функционал возложен на охранников. Разумеется, способность у различных людей к эффективному слежению за обстановкой на экранах мониторов существенно разнится. На мой взгляд, построение систем с применением видеоаналитики существенно повышает эффективность всей системы видеонаблюдения в целом. В качестве заключительного слова хотелось бы сказать, что, по моему мнению, видеоаналитика - это мощнейший инструмент в руках оператора системы видеонаблюдения. Несмотря на то, что уровень автоматизации в системах безопасности может быть очень высоким, видеоаналитика на сегодняшний день не способна и не призвана полностью заменить оператора. Человеку сложно непрерывно наблюдать за сотней камер, однако он способен оперативно принять единственное верное решение! Источник: "Алгоритм Безопасности" № 5, 2010 год. |