Оглавление:
- Определение - Что означает частично наблюдаемый марковский процесс принятия решений (POMDP)?
- Techopedia объясняет частично наблюдаемый марковский процесс принятия решений (POMDP)
Определение - Что означает частично наблюдаемый марковский процесс принятия решений (POMDP)?
Частично наблюдаемый марковский процесс принятия решения (POMPD) - это марковский процесс принятия решения, в котором агент не может непосредственно наблюдать основные состояния в модели. Марковский процесс принятия решений (MDP) - это математическая основа для моделирования решений, показывающая систему с рядом состояний и обеспечивающая действия для лица, принимающего решения, на основе этих состояний.
POMPD основывается на этой концепции, чтобы показать, как система может справляться с проблемами ограниченного наблюдения.
Techopedia объясняет частично наблюдаемый марковский процесс принятия решений (POMDP)
В частично наблюдаемом процессе принятия решений по Маркову, поскольку базовые состояния не прозрачны для агента, полезна концепция, называемая «состоянием веры». Состояние убеждения дает возможность справиться с неопределенностью, присущей модели.
POMPD полезен в обучении с подкреплением, когда система может пройти модель MPD или POMPD, используя то, что известно, чтобы построить более четкую картину вероятных результатов.
