[태그:] 머신러닝
-
Multi-Agent Reinforcement Learning(MARL) 실전 가이드: QMIX, MAPPO, MADDPG 구현 비교와 협력·경쟁 환경 학습 전략
Multi-Agent Reinforcement Learning이란? Multi-Agent Reinforcement Learning(MARL)은 여러 에이전트가 동시에 환경과 상호작용하며 학습하는 강화학습 기법입니다. 단일 에이전트 강화학습과 달리, MARL은 에이전트 간 협력, 경쟁, 또는 혼합 시나리오를 다룹니다. 핵심: 각 에이전트는 독립적으로 행동하지만, 다른 에이전트의 행동이 환경을 변화시키므로 비정상성(non-stationarity) 문제가 발생합니다. MARL이 필요한 실무 사례 자율주행:…
-
Feature Engineering 자동화: Featuretools와 AutoFeat으로 파생변수 생성 효율 10배 높이기
들어가며 데이터 과학 프로젝트에서 Feature Engineering(피처 엔지니어링)은 모델 성능을 좌우하는 핵심 과정입니다. 하지만 수십 개의 파생변수를 수작업으로 만드는 것은 시간이 오래 걸리고 반복적인 작업입니다. 이 글에서는 Featuretools와 AutoFeat 라이브러리를 활용해 파생변수 생성을 자동화하고, 작업 효율을 획기적으로 높이는 방법을 소개합니다. 핵심 포인트: Feature Engineering 자동화로 데이터…
-
Offline RL 완전 정복: 기존 데이터셋만으로 강화학습 에이전트 학습하기 (CQL, IQL, Decision Transformer 비교)
Offline RL이란? Offline Reinforcement Learning(오프라인 강화학습)은 환경과의 실시간 상호작용 없이, 이미 수집된 데이터셋만으로 강화학습 에이전트를 학습하는 패러다임입니다. 기존 Online RL이 환경을 직접 탐험하며 데이터를 수집하는 것과 달리, Offline RL은 과거 로그 데이터, 인간 시연, 또는 다른 정책으로부터 수집된 데이터를 활용합니다. 핵심 아이디어: 비용이 많이 들거나…