Q-러닝

From CS Wiki

Revision as of 20:19, 27 January 2020 by PE120 (talk | contribs)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Jump to:navigation, search

Q-learning; Q Learning;
특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기반 강화 학습 기법

Retrieved from "https://cswiki.net/index.php?title=Q-러닝&oldid=6870"

인공지능