리워드엔지니어링
-
커리큘럼 학습과 리워드 엔지니어링 – 게임 AI 성능 끌어올리기
들어가며 지금까지 강화학습으로 게임 AI를 만드는 여정을 함께 해왔습니다. OpenAI Gym 환경 설정부터 DQN, PPO, 멀티 에이전트까지 다뤘지만, 실전에서는 알고리즘만으로는 부족한 경우가 많습니다. 복잡한 게임 환경에서 에이전트가 학습에 실패하거나, 수렴 속도가 너무 느리거나, 지역 최적해에 빠지는 문제를 자주 마주치게 됩니다. 이번 시리즈의 마지막 편에서는 커리큘럼…