마르코프 결정 프로세스: Difference between revisions
From CS Wiki
(새 문서: 분류:인공지능 ;MDP; Markov Decision Process == 특징 == * Stochastic: 다음 결과는 확률적으로 결정됨 * Partially Observable: 전체 결정 과정을 조망할...) |
No edit summary |
||
Line 21: | Line 21: | ||
| T || 전이확률, T(s', a, s) | | T || 전이확률, T(s', a, s) | ||
|} | |} | ||
== 같이 보기 == | |||
* [[머신러닝]] | |||
* [[강화 학습]] | |||
* [[은닉 마르코프 모델]] |
Revision as of 07:53, 28 October 2019
- MDP; Markov Decision Process
특징
- Stochastic: 다음 결과는 확률적으로 결정됨
- Partially Observable: 전체 결정 과정을 조망할 수 없음
구성
구성 | 설명 |
---|---|
S | 상태의 유한 집합 |
A | 행동의 유한 집합 |
R | 보상 기대값, R(s, a) |
r | 차감 요인, 0~1 |
T | 전이확률, T(s', a, s) |