총체적 난국;;


총체적 난국;;

최근 RL 논문 스터디에 참여하여 딥마인드의 아타리 DQN논문(많은 분들이 다루었던 바로 그 논문!)을 발표하게 되었다.(최근이라고 이야기 하고는있지만 벌써 몇달 전 이야기..) 나름대로 발표 준비를 하면서 예~전에 만들었던 Pong 환경을 가져다가 DQN을 적용할 수 있게 개조하고있는데.. 여러모로 총체적 난국이다.. 일단 환경 자체가 머신러닝 용 환경이 아니라 게임 구현 자체에 초점이 맞춰져있어 Train용으로 재설계했어야하는 부분이 많았고, 무슨 생각인지 좌표를 소숫점까지 써서 연산하게 해놓아서 좌표계까지 드러내서 정수 좌표계로 바꿨다. 어떻게든 기존 코드 덩어리들을 DQN을 적용할 수 있는 환경 함수로 만드는 때까지 성공했.......


원문링크 : 총체적 난국;;