Ученые объяснили превосходство искусственного интеллекта в аркадных играх

Стартап Google Deep Mind продемонстрировал новые возможности искусственного интеллекта. Его система Deep-Q-Network смогла превзойти человека в 49 классических аркадных играх 1980-х, не имея доступа к исходному коду игр и без изучения практики игроков-людей. Об алгоритме работы системы рассказывается в журнале Nature, а коротко о новой технологии сообщил Science News.

Лондонскую фирму DeepMind, специализирующуюся в области искусственного интеллекта, в 2014 году приобрел Google. По данным СМИ сумма сделки составила около 400 миллионов фунтов стерлингов. После вхождения в состав американской корпорации один из основателей стартапа Демис Хассабис (Demis Hassabis) заставил компьютер самостоятельно обучаться опыту игры — и даже открывать эффективные ходы и стратегии, о которых не знали даже люди.

Система компьютерного самообучения получила название Deep-Q-Network (DQN). В ней используются две различные стратегии обучения. Во-первых, это глубинная нейронная сеть — система восприятия, принцип работы которой напоминает зрение животных: она делает ходы и замечает, как меняются пиксели на экране. «Q» в названии означает Q-learning: математический аналог обучения с подкреплением (или поощрением), благодаря которому люди и животные осваивают новые навыки: каждое новое эффективное действие вознаграждается. В случае DQN наградой являются очки в игре: пробуя различные действия, система запоминает те комбинации, которые приносят максимум очков.

Исследователи дали DQN порезвиться с 49 классическими аркадными играми на платформе Atari 2600. Эти игры, по мнению Хассабиса, представляют собой золотую середину с точки зрения сложности игрового процесса. DQN были предоставлены крайне ограниченные ресурсы: две недели на каждую игру и вычислительные мощности одного-единственного персонального компьютера.

Эффективность системы была далеко не очевидна: искусственный интеллект раньше всегда проигрывал человеку в играх наподобие Breakout или Space Invaders, где для получения рекордного счета необходимо искать сложные стратегии. Однако в итоге DQN обыграла живых экспертов в 60 процентах игр: она набрала на 20-30 процентов больше очков в Space Invaders и Pong, а в Breakout и Video Pinball — в 200 раз больше. Следующим этапом, по словам Хассабиса, станет трансфер знаний: перенос навыков из одной игры в другую (например, во вторую игру с летающими шариками система сможет играть быстрее, чем в первую).

По мнению экспертов, система DQN имеет все шансы найти применение в рекламной стратегии Google. Пиксели аркадных игр являются аналогом многочисленных данных, которые поисковик собирает об отдельных пользователях, а очки — аналогом прибыли от рекламы. Обучение с подкреплением пригодится для улучшения качества объявлений: чем чаще на них кликают, тем больше очков получает система. Тот факт, что DQN обучается, наблюдая за происходящим на экране, а не обрабатывая исходный код, говорит о том, что Google она нужна для анализа изображений и видео.

httpv://www.youtube.com/watch?v=xN1d3qHMIEQ

http://lenta.ru/

Похожие статьи
Еще Забавные новости

Недолгая «королевская регата» «Сибири»

Проспект Октябрьский – одну из главных магистралей Новокузнецка – начали застраивать тольк…

03.08.2022 09:06
1 min read
Новокузнечанка попросила откликнуться хозяев потерявшегося далматинца

Жительница Новокузнецка разыскивает хозяев породистой собаки, спасенной от голодной смерти…

28.12.2021 10:30
2 second read
Жителя Кузбасса, 19 лет скрывавшегося от полиции, судят в Новокузнецке

В Кемеровском областном суде (постоянное судебное присутствие в Новокузнецке) начались слу…

14.10.2019 10:29
2 min read
Новокузнецкие гаишники «срежиссировали» нарушение на дороге

Так считают представители следственных органов, которые инкриминируют двум сотрудникам дор…

15.09.2019 10:05
1 min read
Археология для чайников: клады в Новокузнецке и Кузбассе

Может, помните мультфильм времён СССР про Тигрёнка и его друзей, которые искали клад, а Дю…

30.11.2018 08:48
2 min read
Имя новое, суть старая

На рынке жилищных услуг стали появляться УК с новыми названиями. В этот раз процесс переим…

26.11.2018 07:57
1 min read
13 лет колонии за клубную разборку

Рассмотрено уголовное дело о групповой драке у новокузнецкого бара-ресторана «Vittoria» на…

10.10.2018 10:45
1 min read
«Искренне Ваш Альберт Ленский»

На сайте городского Совета народных депутатов закончилось голосование по поводу присвоения…

18.09.2018 09:42
1 min read
Сорокин отбил буллит в исполнении Кросби и выиграл заключительный матч регулярки НХЛ

Илья Сорокин отразил 40 из 44 бросков «Питтсбурга», включая буллит Кросби. «Айлендерс» обы…

18.04.2024 21:31
2 second read
Чиновники все равно делают по-своему

Желание жителей домов близрасположенных со зданием бывшего детского дома на пр.Пионерский,…

18.04.2024 13:40
8 second read
Воспитанники и бывшие игроки «Металлурга» стали чемпионами Белоруссии и Казахстана

Накануне завершился плей-офф в чемпионате Казахстана по хоккею. В финальной серии «Ар…

18.04.2024 12:54
7 second read

Еще

Составлен рейтинг стран с худшими дорогами

Эксперты назвали страны с худшими и лучшими дорогами в мире. Список составлен по версии Ин…

04.06.2018 12:19
4 second read
Ученые выяснили, что популярные витаминные добавки бесполезны

Большинство популярных витаминных добавок не оказывают влияния на здоровье, говорится в ис…

29.05.2018 12:23
8 second read
Сибирские ученые спрогнозировали новый ледниковый период

Сибирские ученые подтвердили гипотезу о том, что следующий ледниковый период начнется на З…

16.05.2018 14:17
6 second read