XRUST.ru » Технологии » DeepMind. Искусственный интеллект от Google, который умеет играть в игры
Технологии / Игры / Xrust

DeepMind. Искусственный интеллект от Google, который умеет играть в игры

9 января 2023, 08:11 42 441 1 62

Программа, разработанная «гугловским» подразделением DeepMind, умеет с нуля проходить видеоигры и во многих случаях превосходит лучших геймеров. Как пишет Xrust, разработанный искусственный интеллект следует отличать от программы Deep Blue. Если в ИИ «шахматиста» правила игры были заложены изначально, то детище подразделения Google обучается побеждать самостоятельно.

Система компьютерного самообучения получила название Deep-Q-Network (DQN). В ней были объединены два типа машинного обучения. Первый из них использует архитектуру мозга, в которой связи между слоями искусственных нейронов укрепляются по мере приобретения опыта. Этот тип, называемый глубинным обучением (deep-learning systems), — система восприятия, принцип работы которой напоминает зрение животных: программа проводит глубокий анализ пикселей на экране после совершенных ею действий. Нечто похожее сейчас используется в Google Translator и в алгоритме поиска по картинкам. Второй тип машинного обучения называется обучением с закреплением (reinforcement learning). Это математический аналог обучения с подкреплением (или поощрением), вдохновленный биологической системой дофаминового вознаграждения, благодаря которой люди и животные осваивают новые навыки: каждое новое эффективное действие получает поощрение. В случае DQN наградой являются очки в игре: пробуя различные действия, система запоминает те комбинации, которые приносят максимум очков.

На понимание особенностей новой игры у искусственного интеллекта уходит порядка 600 попыток или около двух недель. По результатам эксперимента ИИ успешно освоил набор из 49 игр, состоящий из шутеров, гонок и сайд-скроллеров. Во многих случаях программа придумала такие стратегии прохождения, которые исследователи даже не могли себе представить! Если раньше искусственный интеллект всегда проигрывал человеку в играх наподобие Breakout или Space Invaders, где для получения рекордного счета необходимо искать сложные стратегии, то DQN сумела обыграть живых экспертов в 60% игр: она набрала на треть больше очков в Space Invaders и Pong, а в Breakout и Video Pinball — больше вo впечатляющие 200 раз!

Процесс обучения лучше всего продемонстрирован на примере вышеупомянутой Breakout. Поначалу ИИ часто пропускает мяч, но по мере накопления опыта понимает, что наиболее выгодная стратегия — это пробивание структуры по бокам и запуск мяча в нишу за ней, чтобы он там постоянно отбивался и крушил блоки, набирая максимум очков.

Однако игры 80-х — это всего лишь «полигон». Разработчики не собираются останавливаться на достигнутом и намерены обучить DQN играть в более сложные игры, например, WarСraft и StarCraft. В отдаленной же перспективе исследователи планируют создать искусственный интеллект, который бы совершал действия в новой игре, исходя из опыта уже пройденных игр. Так поступают дети: научившись играть в Pong, легче освоить Breakout. Xrust: DeepMind. Искусственный интеллект от Google, который умеет играть в игры

умеет, игры, который, интеллект, DeepMind, играть, Искусственный, Google

Поделится
62 1

Комментарии


  1. siul
    siul9 января 2023 23:41
    Ответить
    1 1
    after seeing the capabilities of chatgpt nothing surprises me anymore
Как выбрать часы Garmin
Краткое введение Вы выбираете спортивные часы для тренировок, здоровья и повседневности. Чтобы быстро сузить круг, откройте подборку «часы Garmin», отметьте нужные функции и сравните модели по автономности, точности и удобству. Ниже — понятные шаги и критерии без лишних слов. Ключевые критерии выбора Цели и виды активности Набор функций растет вместе с задачами. Сперва определите главные занятия и сценарии ношения. Бег и триатлон: точный GNSS, интервальные тренировки, планы, метрики эффективности, навигация по курсам. Горы и трейлы: карты, барометр, компас, треки, многодиапазонный GNSS, крепкий корпус, 10 ATM. Зал и фитнес: силовые тренировки, счетчик повторов, пульс, пульсоксиметр, музыка, уведомления. Велосипед: поддержка датчиков мощности, каденса, внешних акселерометров, навигация по маршруту. Плавание: профили для бассейна и открытой воды, подсчет гребков, герметичность от 5 ATM. Походы и автономные выезды: экономичные режимы, солнечная зарядка (Solar), карты, точная навигация.
9 261 21