Q-러닝: Difference between revisions

From CS Wiki
(새 문서: 분류:인공지능 ;Q-learning ;Q Learning; ;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기...)
 
No edit summary
 
Line 1: Line 1:
[[분류:인공지능]]
[[분류:인공지능]]
;Q-learning ;Q Learning;  
;Q-learning; Q Learning;  
;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 [[마르코프 결정 프로세스]] 기반 [[강화 학습]] 기법
;특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 [[마르코프 결정 프로세스]] 기반 [[강화 학습]] 기법

Latest revision as of 20:19, 27 January 2020

Q-learning; Q Learning;
특정 상태에서 행동에 대한 미래값(Q)을 계산하여, 최적 정책을 찾는 마르코프 결정 프로세스 기반 강화 학습 기법