Q 러닝: Difference between revisions

Latest revision as of 20:18, 27 January 2020

@@ Line 1: / Line 1: @@
-[[분류:인공지능]]
+#넘겨주기 [[Q-러닝]]
-;Q Learning; Q-learning
-;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 [[마르코프 결정 프로세스]] 기반 [[강화 학습]] 기법