Що таке штучний інтелект
і глибинне навчання?


Останнім часом в офіційних звітах і прес-релізах Hikvision усе частіше згадується словосполучення “Штучний інтелект”. Здавалося б, з термінологією все зрозуміло. Але штучний інтелект (далі – ШІ) – штука непроста через те, що визначення цього поняття бувають різними. Сьогодні розбираємося, що ж таке штучний інтелект і хто у підсумку переможе.

Для початку розберемося з чого складається будь-який ШІ.

З механізму поповнення цієї бази. Для примітивних ШІ, типу перших шахових суперкомп’ютерів, поповнення відбувалося вручну, а зараз програми навчаються самі.

Одним з критеріїв визнання програми ШІ може бути проходження тесту Т’юринга. Мета тесту – визначити, чи може машина, комп’ютер, програма мислити.

Алан Т’юринг запропонував ідею цього тесту ще у далекому 1950 році. Передумовою став досвід роботи Т’юринга над проблемами машинного інтелекту з 1941 року. Близько 1947 Алан згадує вже про “комп’ютерний інтелект”. А близько 1950 публікує статтю, в якій замінює абстрактне питання “Чи можуть машини думати?” питанням “Чи можуть машини робити те, що можемо робити ми, як мислячі створіння?”. А це набагато простіше перевірити.



Було використано кілька варіантів тесту. Один з них – гра в шахи: людина А грає з комп’ютером Б, людина А грає з людиною С, яка передає свої ходи через комп’ютер. Другий варіант – розмова у текстовому форматі за тим самим принципом: людина розмовляє з людиною і з комп’ютером, намагається зрозуміти хто з них хто. Застосовувалося навіть оцінювання комп’ютера журі з декількох чоловік на базі розмови.

Такий тест можуть пройти навіть чат-боти, які пропрацювали досить довго з великою кількістю людей (яскраві приклади – pBot, Аліса). Проблемою стає лише те, що вони часто і швидко переймають основні вади інтернет-спілкування (грубість, сексизм, расизм та ін.)

Інший критерій – можливість програми або механізму з програмою виконувати дії й приймати рішення за людину. Але для достатньо прописаної бази з великим розгалуженням варіантів зовнішніх подій і реакцій на них це нескладно. Контрастний приклад: можна зробити машину, яка буде їхати без водія прямо. А можна зробити машину, яка їхатиме тільки по своїй стороні дороги, дотримуватиметься правил дорожнього руху (в тому числі фіксуватиме знаки та сигнали світлофора, розпізнаватиме рухи регулювальника). У дощ вона увімкне перед камерою двірники, в мінусову температуру – грубку, а в разі землетрусу буде гудіти, блимати та всіляко сповіщати людей. Ці машини будуть робити одне і те ж саме – їхати. Але їхати по-різному, а для прописування всіх можливих ситуацій тільки у форматі “якщо трапилося А, зроби Б” можуть знадобитися роки.

Тому останнім часом під штучним інтелектом розуміють той, що сам себе навчає.

Ось кілька яскравих ілюстрацій з кіно і літератури. Робот NDR з повісті Айзека Азімова “Двохсотрічна людина”, був створений звичайним побутовим роботом і став особистістю завдяки розмовам зі своїм господарем, читанням і подіями довгого життя. Джарвіс і Віжн з фільмів про Залізну людину. Джарвіс був створений системою запитань-відповідей, але згодом набув досвіду й став незамінним. Віжн же був створений за допомогою Джарвіса і готового ШІ. Ще один приклад, який напевно пам’ятають любителі фільмів про Термінатора – Скайнет.

У чому комп’ютер точно кращий за людину? Мабуть, у швидкості мислення. Якщо в обсягах інформації ми ще змагаємося, то наприклад, навіть мій комп’ютер, оснащений процесором з тактовою частотою 3 ГГц, за секунду робить до 3 мільярдів базових операцій. Навіть з урахуванням того, що більш-менш складні дії (типу відтворення картинки на моніторі) можуть складатися з сотень і тисяч базових дій, людина все одно сильно відстає. І ми не беремо до уваги суперкомп’ютери, які зазвичай займаються складною діяльністю.

Ще одна “перемога” комп’ютера над нами – повторюваність досвіду. Якщо дуже складний комп’ютер виробляє на особистому “досвіді” програму поведінки у певній ситуації, то її можна в готовому вигляді завантажити у простіші комп’ютери Це використовується, також у відеоспостереженні.

Й ось ми підходимо до теми навченості ШІ, а разом з нею до глибинного навчання.

Сучасні люди звикли до того, що вводячи перше слово запиту в Google, рядок пошуку доповнюється автоматично і виправляє неправильно написані слова. З кожним роком це працює все краще і краще. Річ у тім, що програма в авторежимі запам’ятовує запити, веде статистику і намагається приносити нам максимум користі. Оскільки пошуковик Google зроблений “під людей”, його самонавчання на цьому закінчується.

Та що як програма працює у чітко заданих умовах, як шахові програми або система відеоспостереження?

Тоді починається самонавчання у набагато більш прискорених темпах, по суті, “розмова з самим собою”. Шахові програми, в які введені тільки правила гри, із запаморочливою швидкістю проганяють безліч партій і запам’ятовують найвдаліші ходи майже за будь-яких комбінацій.

Довгий час вважалося, що у близьку до шахів гру го, програми навчаться грати нескоро. Дошка для го більша (19х19), відповідно кількість комбінацій зростає. Але в 2015 році компанія Google DeepMind розробила програму AlphaGo, яка навчалася за допомогою глибинного навчання, використовуючи багаторівневі нейронні мережі.

Глибинне або глибоке навчання, (англ. Deep Learning) – сукупність методів машинного навчання (з можливим залученням “вчителя”, коли до будь-якої дії є підкріплення), які зводяться до показування машині різних прикладів і можливих варіантів. Такий тип навчання найбільш нагадує людський. Пам’ятаєте зубріння у перших класах? 2х2 = 4, 2х2 = 4, 2х2 = 4. Після глибинного навчання штучні нейронні зв’язки формуються подібно людським.

Тому, коли мова йде про використання ШІ у відеоспостереженні, він більш ніж виправданий та цілком надійний. Програми навчаються на тисячах прикладів “як потрібно” і “як не потрібно”, на прикладах реальної та помилкової тривоги, за допомогою зображень з особами та без них, з правильним водінням і порушенням правил дорожнього руху. І повірте, ШІ запам’ятовує всі ці дані набагато краще, ніж найдосвідченіший оператор.