Искусственный интеллект DeepMind учится предсказывать будущее, основываясь на прошлом

13.12.19
0
11128
фон:

Многие системы искусственного интеллекта достигают целей, опираясь на представления о мире, основанные на прошлом опыте. Они обобщают их и перекладывают на новые ситуации, что позволяет им выполнять задачи даже в условиях, с которыми они раньше не сталкивались. И если в итоге этих действий «миссия оказывается выполнена», ИИ получает некую «награду». Этот метод обучения называется обучение с подкреплением. Однако данный способ обучения искусственного интеллекта подойдет и для того, чтобы не только получать новые знания, но и предсказывать будущее.

Как ИИ может предсказать будущее?

Исследователи из лаборатории DeepMind и Университета Торонто в ходе изучения динамики модели вознаграждения настроили ИИ таким образом, чтобы он, основываясь на прошлом опыте, не предпринимал какое-либо действие, а предсказывал его, исходя из известных подобных случаев. В данном контексте о полноценном предсказании событий речи пока не идет. Сейчас модель лишь изучает неочевидные возможности расположения объектов в будущем, учитывая их нелинейную скорость и извилистый путь.

Модель поведения ИИ получила название Dreamer и состоит она из пяти основных элементов. Первый — это репрезентативный компонент, который производит наблюдения за объектом и определяет его дальнейшие действия. Второй — переходный модуль, который предвидит возможные состояния объекта, не зная их изначальных свойств. Модуль наблюдения текущего состояния обеспечивает сигналы обратной связи, который работает в паре с модулем наблюдений итогового состояния, что позволяет сопоставить предсказание с результатом. Ну а венчает всю эту сложную систему компонент поощрения.

В ряде экспериментов ученые протестировали Dreamer на 20 задачах в программе DeepMind Control Suite. Сначала они обучили его с помощью одного графического чипа Nvidia V100 и десяти процессорных ядер. На каждый цикл обучения ушло по 9 часов. Для сравнения, PlaNet, предшественник Dreamer, добился аналогичных результатов за 17 часов. В результате Dreamer смог использовать изученные модели, чтобы делать выводы о возможных исходах и делал это достаточно точно.

Уже давно существуют ИИ, которые используют большие данные для анализа ситуации и прогнозирования исходов, но они заточены именно на работу с, что логично, большим объемом информации, которую нужно заранее изучить. Dreamer же выработал алгоритм, который может предсказывать исход не хуже специализированных систем. Да, на данный момент ИИ лишь предсказывает положение хаотично движущихся объектов, но есть у него и возможная сфера применения.

Например, модели, подобные Dreamer, можно использовать для краткосрочного планирования. То есть, в теории, он сможет, основываясь на данных работы отдела компании, предсказать то, чего при данных показателях работы и расписании они добьются в будущем. Затем можно будет оптимизировать деятельность людей так, чтобы «будущее изменилось» и их показатели улучшились.

Источник