Anonymous
Not logged in
Talk
Contributions
Create account
Log in
CS Wiki
Search
마르코프 결정 프로세스
From CS Wiki
Namespaces
Page
Discussion
More
More
Page actions
Read
Edit
Edit source
History
Revision as of 07:53, 28 October 2019 by
Aimaster
(
talk
|
contribs
)
(
diff
)
← Older revision
|
Latest revision
(
diff
) |
Newer revision →
(
diff
)
MDP; Markov Decision Process
특징
Stochastic: 다음 결과는 확률적으로 결정됨
Partially Observable: 전체 결정 과정을 조망할 수 없음
구성
구성
설명
S
상태의 유한 집합
A
행동의 유한 집합
R
보상 기대값, R(s, a)
r
차감 요인, 0~1
T
전이확률, T(s', a, s)
같이 보기
머신러닝
강화 학습
은닉 마르코프 모델
Category
:
인공지능
Navigation
Navigation
Main page
Recent changes
Advertisements
Wiki tools
Wiki tools
Special pages
Cite this page
Page tools
Page tools
User page tools
More
What links here
Related changes
Printable version
Permanent link
Page information
Page logs
Categories
Categories
인공지능