Google DeepMind научила своих ботов играть в Quake 3 Arena лучше человека

Google DeepMind научила своих ботов играть в Quake 3 Arena лучше человека


Судя по всему, в список игр, первенство в которых за последнее время машины отобрали у людей, уже можно занести еще одну. Речь о культовом шутере Quake 3 Arena. Компания Google DeepMind объявила о создании искусственного интеллекта, способного играть в эту игру не просто как человек, а даже лучше человека. Сразу оговорим, что речь о режиме Capture The Flag (CTF) — захват флага, в котором для победы нужно захватить вражеский флаг и принести на свою «базу».
Как и в случае с другими схожими проектами создания ИИ для той или иной 3D-игры, главная сложность здесь заключается в том, чтобы обучить бота ориентироваться в огромном трехмерном пространстве, не имея точных топографических данных. Иными словами, уметь сориентироваться на местности без карты.
Специалисты DeepMind использовали метод обучения с подкреплением (reinforcement learning), который уже стал стандартом в отрасли. Аналогичным образом обучалась система AlphaGo и прочие алгоритмы, сумевшие обыграть человека в нескольких видеоиграх Atari. Основное этого метода от классического машинного обучения заключается в том, что ИИ обучается в процессе взаимодействия с окружающей средой методом проб и ошибок, а не на исторических данных.
В самом начале обучения бот не имеет ни малейшего представления о самой игре и что в ней нужно делать. Разобраться во всем ему предстоит в одиночку. Обычно одному боту в противники ставят другого, и они начинают учиться. Но DeepMind решила пойти более сложным путем и организовать групповые занятия для 30 ботов с целью достижения более высокого разнообразия стилей игры.
Сколько потребовалось сыграть игр, чтобы выйти на приемлемый уровень? Около 0,5 млн продолжительностью по 5 минут каждая. Путем несложных подсчетов можно понять, что обучение заняло 1736 дней чистого времени.
Stfw.Ru
Читайте также


Оставить комментарий
Имя:  

Комментарий:

Примечание: При комментировании материала просим соблюдать законы Российской Федерации. Пожалуйста, воздержитесь от оскорблений и токсичного поведения.

Сводка событий

01:12 «Сільпо» внедрило бесконтактную оплату покупок через фирменное мобильное приложение


01:12 «Киевcтар» подключил к сети 4G ещё 196 населенных пунктов в 8 областях


01:12 Prometheus открыл регистрацию на радикально обновленный онлайн-курс Гарвардского университета «CS50 Основы программирования»


01:12 Microsoft готовит сразу две игровые консоли следующего поколения и стриминговый сервис для доступа к Xbox-играм с других платформ


01:12 HTC готовит новые смартфоны, нацеливаясь на конкуренцию с… Apple iPhone


01:12 Farout — самый далекий из известных на сегодня объектов Солнечной системы. На один оборот вокруг Солнца у него уходит более тысячи земных лет


01:12 Экс-главу львовского "Правого сектора"* нашли с перерезанным горлом


01:12 США признали беззащитность перед российским гиперзвуковым оружием


01:12 Глазьев о фатальном для экономики США моменте: "Виден конец игры доллара"


01:12 Выйдет в $13 млрд. Трамп издал указ о создании нового космического командования


15:12 Интернет-магазин возобновляет работу после 3-недельного перерыва, вызванного изъятием товара налоговиками


15:12 Внедрение функции приватности Clear History в Facebook задерживается как минимум до весны 2019


15:12 Полковника МВД Веру Рабинович задержали в Самаре после получения 10-миллионной взятки


События из мира ИТ