Уменьшение ложных тревог с помощью глубокого обучения

Феномен глубокого обучения (Deep Learning) продолжает волновать мир ИТ. Находясь на передовой применения технологий в индустрии наблюдения и за ее пределами, компания Hikvision уже выпустила свой первый набор продуктов с использованием силы искусственного интеллекта (AI).

В основе концепции Deep Learning лежит работа человеческого мозга. Именно его можно рассматривать как очень сложную модель глубокого обучения. Мозговые нейронные сети состоят из миллиардов взаимосвязанных нейронов; глубокое обучение имитирует эту структуру. Эти многоуровневые сети могут собирать информацию и проанализировав ее, выполнять определенные действия.

За последние два года технология усовершенствовалась в распознавании речи, компьютерном видении, голосовом переводе и многом другом. Она даже превзошла человеческие возможности в области проверки лиц и классификации изображений. Именно поэтому так высока ее ценность в индустрии видеонаблюдения.

Возможность распознавать людей, отличая их, например, от животных, делает технологию глубокого обучения незаменимой в сфере безопасности. Это особенно актуально в мире, где ложные тревоги составляют 94 - 99% всех аварийных сигналов, согласно статистическим данным полиции и пожарной службы!

 

Как работает глубокое обучение

Глубокое обучение в корне отличается от других алгоритмов. Способ устранения недостатков традиционных алгоритмов охватывает следующие аспекты.

Алгоритмическая модель глубокого обучения имеет гораздо более основательную структуру, чем традиционные алгоритмы. Иногда количество слоев (повторяемых циклов обработки данных) может достигать более ста, что позволяет обрабатывать большие объемы данных в сложных классификациях. Глубокое обучение очень похоже на процесс обучения человека и имеет поэтапный процесс абстракции. У каждого слоя будет разное «взвешивание», отражающее то, что было известно о компонентах изображений. Чем выше уровень слоя, тем конкретнее компоненты. Подобно человеческому мозгу, исходный сигнал в глубоком обучении проходит через слои обработки; далее, он принимает частичное понимание (неглубокое) к общей абстракции (глубокой), где он может воспринимать объект.

Глубокое обучение не требует участия человека, но полагается на компьютер для извлечения нужных характеристик. Таким образом, компьютер способен извлекать как можно больше черт из цели (черты, характеристики, функции - в глубоком обучении один из признаков в определенной классификации. Например, круглый, квадратный, треугольный для форм и красный, синий, зеленый для цвета), включая абстрактные черты, которые трудно или невозможно описать. Чем больше черт, тем точнее будет опознание и классификация. Некоторые явные преимущества, которые могут принести алгоритмы глубокого обучения, включают в себя достижение сопоставимой с человеческой или даже лучшей точности  распознавания образов, сильные антиинтерференционные возможности и способность классифицировать и распознавать тысячи функций.

 

Проблемы существующих систем

Обычные системы наблюдения в основном обнаруживают движущиеся цели без последующего анализа. Даже интеллектуальные IP-камеры могут отображать одну за другой отдельные точки на фигуре, а это затрудняет калибровку некоторых функций (например, лба или щеки) и снижает точность распознавания.

Например, для наблюдения за периметром используются и другие технологии, обеспечивающие более полную безопасность. Но у каждой из них есть свои недостатки. Инфракрасные детекторы излучения можно “перепрыгнуть”, они подвержены ложным тревогам, вызванным животными. Электронные ограждения не всегда безопасны сами по себе, да и ограничены в определенных областях. К тому же некоторые из этих решений дорогие и сложные в установке.

Животные, листья и даже свет могут вызывать ложные тревоги, поэтому возможность идентифицировать присутствие человека без сомнений повышает точность функций VCA периметра. Частые ложные тревоги - проблема для конечных пользователей, ведь нужно тратить время на проверку каждой из них, а это задерживает необходимую реакцию на тревогу и влияет на эффективность наблюдения и охраны в целом.

 

Представьте себе относительно тихое место, где мало машин и людей. Даже на таком участке может быть 50 ложных тревог за ночь. Для проверки одной ложной тревоги требуется в среднем 2-3 минуты, и только 3 из 50 случаев займут больше времени - скажем, по 15 минут каждый. Охранник должен либо проверить систему, либо среагировать на предупреждение, либо отправить кого-то на место, откуда поступил сигнал, для проверки возможности проникновения на территорию охраняемого объекта.

В большинстве компаний охранники должны отметиться, уходя на обход, и добавить общее время, затрачиваемое ложную тревогу, в журнал. В итоге, эти 50 ложных тревог в одну ночь могут стоить более двух часов времени, потраченных впустую.

Однако глубокое обучение имеет большое значение. Благодаря большому количеству качественных данных, полученных с камер и других источников, таких как Научно-исследовательский институт Hikvision, и более чем сотне членов команды по очистке данных для маркировки видеоизображений, уже накоплены данные по образцам с миллионами категорий для отрасли безопасности. Именно благодаря такому количеству качественных данных, модели распознавания образов человека, транспортных средств и объектов становятся все более точными для использования в системах видеонаблюдения.

Основываясь на серии экспериментов, распознавание с использованием алгоритма Deep Learning повысило точность на 38%. Применяя эти цифры к предыдущему примеру, можно убедиться, что конечные пользователи могут сэкономить почти один час каждую ночь. Это делает технологию Deep Learning отличным преимуществом в решениях для защиты периметра, с гораздо более точным пересечением линии, вторжением, обнаружением входа и выхода.

 
 

Другие использования

Значение технологии Deep Learning простирается за пределы традиционной безопасности. Например, отслеживание моделей движения отдельных лиц способно показать, являются ли они потенциальной угрозой. Порог распознавания устанавливают в радиусе действия 5 метров, или 10 секунд пребывания человека в одном месте. Если человек проходит порог, может сработать сигнал тревоги. Система отслеживает человека и сравнивает его поведение с базой данных, чтобы узнать, попадает ли он под шаблон.

Еще одно применение глубокого обучения будет полезно в ситуациях, где угрозу может представлять падение, например, для системы наблюдения в доме престарелых. Если порог высоты установлен на уровне 0,5 метров и длительностью 10 секунд, решение может увидеть, как человек падает (опускается ниже установленного порога) и может быть в беде (остается в установленном пороге высоты более 10 секунд). Решение использует параметры, заданные для сравнения с его базой данных и повышающие уровень тревоги.

Благодаря таким функциям и преимуществам легко понять, сколько интеллектуальных приложений может удовлетворить технология глубокого обучения. У искусственного интеллекта есть огромный потенциал, и Hikvision непрерывно изучает новые способы применения этой захватывающей технологии во всей индустрии безопасности и за ее пределами.

По материалам hikvision.com

 

Читать также:

Что такое искусственный интеллект и глубинное обучение?

Круглый стол: тенденции видеонаблюдения в 2018 году

Интеллектуальное решение для управления парковкой Hikvision

Выставка Intersec Дубай 2018: искусственный интеллект и "умная" аналитика для "умных" городов