Дом развитие Что такое обучение с подкреплением? - определение из техопедии

Что такое обучение с подкреплением? - определение из техопедии

Оглавление:

Anonim

Определение - Что означает обучение подкреплению?

Усиленное обучение в контексте искусственного интеллекта - это тип динамического программирования, в котором обучаются алгоритмы с использованием системы вознаграждения и наказания.

Алгоритм обучения подкрепления, или агент, учится, взаимодействуя с окружающей средой. Агент получает вознаграждение за правильное выполнение и штрафы за неправильное выполнение. Агент учится без вмешательства человека, максимизируя его вознаграждение и минимизируя его штраф.

Techopedia объясняет обучение усилению

Обучающее обучение - это подход к машинному обучению, основанный на поведенческой психологии. Это похоже на то, как ребенок учится выполнять новое задание. Усиленное обучение контрастирует с другими подходами машинного обучения тем, что в алгоритме не указано явно, как выполнить задачу, но он самостоятельно решает проблему.

Поскольку агент, которым может быть автомобиль с автоматическим управлением или программа, играющая в шахматы, взаимодействует со своей средой, получает состояние вознаграждения в зависимости от того, как он выполняет, например, безопасное вождение до места назначения или выигрыш в игре. И наоборот, агент получает штраф за неправильную работу, например, с дороги или мат.

Агент с течением времени принимает решения, чтобы максимизировать свое вознаграждение и минимизировать его штраф с помощью динамического программирования. Преимущество этого подхода к искусственному интеллекту состоит в том, что он позволяет программе ИИ учиться без того, чтобы программист не объяснил, как агент должен выполнить задачу.

Что такое обучение с подкреплением? - определение из техопедии