Зменшення фіктивних тривог
за допомогою …

 Зменшення фіктивних тривог  за допомогою глибокого навчання

Феномен глибокого навчання (Deep Learning) продовжує хвилювати світ ІТ. Перебуваючи на передовій застосування технологій в індустрії спостереження і за її межами, компанія Hikvision вже випустила свій перший набір продуктів з використанням сили штучного інтелекту (AI).

В основі концепції Deep Learning лежить робота людського мозку. Саме його можна розглядати як дуже складну модель глибокого навчання. Мозкові нейронні мережі складаються з мільярдів взаємопов’язаних нейронів; глибоке навчання імітує цю структуру. Ці багаторівневі мережі можуть збирати інформацію і проаналізувавши її, виконувати певні дії.

За останні два роки технологія удосконалилася в розпізнаванні мови, комп’ютерному баченні, голосовому перекладі та у багато чому іншому. Вона навіть перевершила людські можливості в області перевірки облич і класифікації зображень. Саме тому настільки висока її цінність в індустрії відеоспостереження.

Можливість розпізнавати людей, відрізняючи їх, наприклад, від тварин, робить технологію глибокого навчання незамінною в сфері безпеки. Це особливо актуально в світі, де помилкові тривоги складають 94 – 99% усіх аварійних сигналів, згідно зі статистичними даними поліції та пожежної служби!

Як працює глибоке навчання

Глибоке навчання в корені відрізняється від інших алгоритмів. Спосіб усунення недоліків традиційних алгоритмів охоплює наступні аспекти.

Алгоритмічна модель глибокого навчання має набагато більш ґрунтовну структуру, ніж традиційні алгоритми. Іноді кількість шарів (повторюваних циклів обробки даних) може досягати більш як сто, що дозволяє обробляти великі обсяги даних у складних класифікаціях. Глибоке навчання дуже схоже на процес навчання людини й має поетапний процес абстракції. У кожного шару буде різне «зважування», яке показуватиме те, що було відомо про компоненти зображень. Чим вище рівень шару, тим конкретніші компоненти. Подібно до людського мозку, вихідний сигнал у глибокому навчанні проходить через шари обробки; далі він приймає часткове розуміння (неглибоке) до загальної абстракції (глибокої), де він може сприймати об’єкт.

Глибоке навчання не вимагає участі людини, але покладається на комп’ютер для отримання потрібних характеристик. Таким чином, комп’ютер здатний витягувати якомога більше рис з мети (риси, характеристики, функції – в глибокому навчанні одна з ознак у певній класифікації. Наприклад, круглий, квадратний, трикутний для форм і червоний, синій, зелений – для кольору), включаючи абстрактні риси, які важко або неможливо описати. Чим більше рис, тим точніше буде впізнання і класифікація. Деякі явні переваги, що можуть принести алгоритми глибокого навчання, містять досягнення порівнянної з людською або навіть кращої точності розпізнавання образів, сильні антиінтерференційні можливості та здатність класифікувати й розпізнавати тисячі функцій.

Проблеми систем, що вже існують

Звичайні системи спостереження в основному виявляють рухомі цілі без подальшого аналізу. Навіть інтелектуальні IP-камери можуть показувати одну за одною окремі точки на фігурі, а це ускладнює калібрування деяких функцій (наприклад, лоба або щоки) і знижує точність розпізнавання.

Наприклад, для спостереження за периметром використовуються й інші технології, що забезпечують більшу безпеку. Але у кожної з них є свої недоліки. Інфрачервоні детектори випромінювання можна “перестрибнути”, вони схильні до хибних тривог, викликаних тваринами. Електронні огорожі не завжди безпечні самі по собі, та й обмежені в певних областях. До того ж деякі з цих рішень дорогі та складні в установці.

Тварини, листя і навіть світло можуть викликати помилкові тривоги, тому можливість ідентифікувати присутність людини без сумнівів підвищує точність функцій VCA периметра. Часті помилкові тривоги – проблема для кінцевих користувачів, адже потрібно витрачати час на перевірку кожної з них, а це затримує необхідну реакцію на сполох і впливає на ефективність спостереження та охорони в цілому.

 

Уявіть собі досить тихе місце, де мало машин і людей. Навіть на такій ділянці може бути 50 фіктивних тривог за ніч. Для перевірки однієї помилкової тривоги потрібно в середньому 2-3 хвилини, і тільки 3 з 50 випадків займуть більше часу – скажімо, по 15 хвилин кожен. Охоронець повинен або перевірити систему, або зреагувати на попередження, або відправити когось на місце надходження сигналу, для перевірки можливості проникнення на територію, що охороняється.

У більшості компаній охоронці повинні відзначитися, йдучи на обхід, і додати загальний час, що витрачається на помилкову тривогу, в журнал. У підсумку, ці 50 фіктивних тривог за одну ніч можуть коштувати понад дві години часу, витрачені даремно.

Однак глибоке навчання має велике значення. Завдяки великій кількості якісних даних, отриманих з камер та інших джерел, таких як Науково-дослідний інститут Hikvision, і більш ніж сотні членів команди з очищення даних для маркування відеозображень, вже накопичені дані за зразками з мільйонами категорій для галузі безпеки. Саме завдяки такій кількості якісних даних, моделі розпізнавання образів людини, транспортних засобів і об’єктів стають усе більш точними для використання в системах відеоспостереження.

Ґрунтуючись на серії експериментів, розпізнавання з використанням алгоритму Deep Learning підвищило точність на 38%. Застосовуючи ці цифри до попереднього прикладу, можна переконатися, що кінцеві користувачі можуть заощадити майже один годину щоночі. Це робить технологію Deep Learning відмінною перевагою в рішеннях для захисту периметра, з набагато більш точним перетином лінії, вторгненням, виявленням входу і виходу.

 
 

Інші використання

Значення технології Deep Learning простягається за межі традиційної безпеки. Наприклад, відстеження моделей руху окремих осіб здатне показати, чи є вони потенційною загрозою. Поріг розпізнавання встановлюють у радіусі дії 5 метрів, або 10 секунд перебування людини в одному місці. Якщо людина проходить поріг, може спрацювати сигнал тривоги. Система відстежує людини й порівнює її поведінку з базою даних, щоб дізнатися, чи потрапляє він під шаблон.

Ще одне застосування глибокого навчання буде корисно в ситуаціях, де загрозу може представляти падіння, наприклад, для системи спостереження в будинку для літніх людей. Якщо поріг висоти встановлений на рівні 0,5 метрів і тривалість його 10 секунд, рішення може побачити, як людина падає (опускається нижче встановленого порогу) і може бути в біді (залишається в установленому порозі висоти понад 10 секунд). Рішення використовує параметри, задані для порівняння з його базою даних і підвищують рівень тривоги.

Завдяки таким функціям і перевагам легко зрозуміти, скільки інтелектуальних додатків може задовольнити технологія глибокого навчання. У штучного інтелекту є величезний потенціал, і Hikvision безперервно вивчає нові способи застосування цієї захопливої технології у всій індустрії безпеки та за її межами.

Посилання на офіційне джерело