Что такое искусственный интеллект
и …
Что такое искусственный интеллект и глубинное обучение?
В последнее время в официальных отчетах и пресс-релизах Hikvision все чаще упоминается словосочетание “Искусственный интеллект”. Казалось бы, с терминологией все понятно. Но искусственный интеллект (дальше – ИИ) – штука непростая, потому что определения этого понятия бывают разными.
Для начала разберемся из чего состоит любой ИИ.
Из механизма пополнения этой базы. Для примитивных ИИ, типа первых шахматных суперкомпьютеров, пополнение происходило вручную, а сейчас программы обучаются сами.
Одним из критериев признания программы ИИ может быть прохождение теста Тьюринга. Цель теста – определить, может ли машина, компьютер, программа мыслить.
Алан Тьюринг предложил идею этого теста ещё в далёком 1950 году. Предпосылкой стал опыт работы Тьюринга над проблемами машинного интеллекта с 1941 года. К 1947 Алан упоминает уже о “компьютерном интеллекте”. К 1950 публикует статью, в которой заменяет абстрактный вопрос “Могут ли машины думать?” вопросом “Могут ли машины делать то, что можем делать мы, как мыслящие создания?”. А это гораздо проще проверить.
Были использованы несколько вариантов теста. Один из них – игра в шахматы: человек А играет с компьютером Б, человек А играет с человеком С, который передаёт свои ходы через компьютер. Второй вариант – разговор в текстовом формате по тому же принципу: человек разговаривает с человеком и с компьютером, пытается понять кто из них кто. Применялось даже оценивание компьютера жюри из нескольких человек на базе разговора.
Такой тест могут пройти даже чат-боты, проработавшие достаточно долго с большим количеством людей (яркие примеры – pBot, Алиса). Проблемой становится лишь то, что они часто и быстро перенимают основные пороки интернет-общения (грубость, сексизм, расизм и пр.)
Другой критерий – возможность программы или механизма с программой выполнять действия, и принимать решения за человека. Но для достаточно прописанной базы с большим разветвлением вариантов внешних событий и реакций на них это не составит труда. Контрастный пример: можно сделать машину, которая будет ехать без водителя прямо. А можно сделать машину, едущую только по своей стороне дороги, соблюдающую ПДД (в том числе и фиксировать знаки и сигналы светофора, распознавать движения регулировщика). В дождь она включит перед камерой дворники, а в минусовую температуру включит печку, в случае же землетрясения будет гудеть, мигать и всячески оповещать людей. Эти машины будут делать одно и то же – ехать. Но ехать по-разному, а для прописывания всех возможных ситуаций только в формате “если случилось А, сделай Б” могут уйти годы.
Поэтому в последнее время под искусственным интеллектом понимают самообучающийся.
Вот несколько ярких иллюстраций из кино и литературы. Робот NDR из повести Айзека Азимова “Двухсотлетний человек”, созданный обычным бытовым роботом и ставший личностью благодаря разговорам со своим хозяином, чтению и событиям долгой жизни. Джарвис и Вижн из фильмов о Железном человеке. Джарвис был создан вопросно-ответной системой, но со временем приобрел больше опыта и стал незаменимым. Вижн же был создан с помощью Джарвиса и готового ИИ. Еще один пример, который наверняка помнят любители фильмов о Терминаторе – Скайнет.
В чем компьютер точно лучше человека? Пожалуй, в скорости мышления. Если в объемах информации мы ещё соревнуемся, то к примеру, даже мой компьютер, оснащенный процессором с тактовой частотой 3 ГГц, в секунду совершает до 3 миллиардов базовых операций. Даже с учетом того, что более или менее сложные действия (типа отрисовки картинки на мониторе) могут состоять из сотен и тысяч базовых действий, человек всё равно сильно отстаёт. И мы не берём во внимание суперкомпьютеры, которые обычно занимаются сложной деятельностью.
Ещё одна “победа” компьютера над нами – повторяемость опыта. Если очень сложный компьютер вырабатывает на личном “опыте” программу поведения в той или иной ситуации, то ее можно в готовом виде загрузить в компьютеры попроще. Это используется, в том числе, в видеонаблюдении.
И вот мы подходим к теме обучаемости ИИ, а вместе с ней к глубинному обучению.
Современные люди привыкли к тому, что вводя первое слово запроса в Google, строка поиска дополняется автоматически и исправляет неправильно написанные слова. С каждым годом это работает все лучше и лучше. Все дело в том, что программа в авторежиме запоминает запросы, ведет статистику и старается приносить нам максимум пользы. Так как поисковик Google сделан “под людей”, его самообучаемость на этом заканчивается.
Но что, если программа работает в четко заданных условиях, как шахматные программы или система видеонаблюдения?
Тогда начинается самообучение в гораздо более ускоренных темпах, по сути, “разговор с самим собой”. Шахматные программы, в которые введены только правила игры, с умопомрачительной скоростью прогоняют множество партий и запоминают самые удачные ходы почти при любой комбинации.
Долгое время считалось, что в родственную шахматам игру го, программы научатся играть нескоро. Доска го больше (19х19), соответственно возможно больше комбинаций. Но в 2015 году компания Google DeepMind разработала программу AlphaGo, которая обучалась с помощью глубинного обучения, используя многоуровневые нейронные сети.
Глубинное или глубокое обучение, (англ. Deep Learning) – совокупность методов машинного обучения (с возможным привлечением “учителя”, когда к любому действию есть подкрепление), которые сводятся к показыванию машине различных примеров и возможных вариантов. Такой тип обучения наиболее напоминает человеческий. Помните зубрёжку в первых классах? 2х2=4, 2х2=4, 2х2=4? После глубинного обучения искусственные нейронные связи формируются подобно человеческим.
Поэтому, когда речь заходит об использовании ИИ в видеонаблюдении, он более чем оправдано и вполне надежно. Программы обучаются на тысячах примеров “как нужно” и “как не нужно”, на примерах реальной и ложной тревоги, изображениями с лицами и без них, с правильным вождением и нарушением правил ПДД. И поверьте, ИИ запоминает все эти данные намного лучше, чем самый опытный оператор.