Rainbow: Combination of DQN Extensions (Part 1)
이 글은 DeepMind의 Rainbow: Combining Improvements in Deep Reinforcement Learning 에 사용된 6가지 DQN extension들을 다룹니다. 또한 각 extension을 구현한 코드 일부에 변형/주석을 달았습니다.
이 글은 DeepMind의 Rainbow: Combining Improvements in Deep Reinforcement Learning 에 사용된 6가지 DQN extension들을 다룹니다. 또한 각 extension을 구현한 코드 일부에 변형/주석을 달았습니다.
임성빈님의 Wasserstein GAN 수학 이해하기 를 참고하여 정리하였습니다.
Google colab에서 로컬 런타임으로 외부 서버에 연결하려고 하는 경우, 공식 documentation대로 하면 “Unable to connect to the runtime” 에러가 뜨는 경우가 있다(많다). 아래의 방법으로 하니 안정적으로 연결이 되었다.
Wu et al. (ICLR 2019) Dynamic convolution은 position-based attention이다. Depthwise convolution 기반으로, 일부 채널의 weight를 공유하고 (lightweight), 타임스텝마다 서로 다른 컨...