Q 러닝: Difference between revisions
From CS Wiki
(새 문서: 분류:인공지능 ;Q Learning; Q-learning ;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기반...) |
(Q-러닝 문서로 넘겨주기) |
||
(One intermediate revision by the same user not shown) | |||
Line 1: | Line 1: | ||
[[ | #넘겨주기 [[Q-러닝]] | ||
Latest revision as of 20:18, 27 January 2020
- 넘겨주기 Q-러닝