lu의 머신러닝 개발자로 살아남기

rl(2)

[Paper] OpenAI의 Emergent Tool Use From Multi-Agent Autocurricula 논문 리뷰
Emergent Tool Use From Multi-Agent Autocurricula 논문 리뷰 Emergent tool use from multi-agent autocurricula (https://arxiv.org/abs/1909.07528) Multi Agent에 확 끌리게 해 준 OpenAI 논문. Hider와 Seeker가 숨바꼭질을 학습하는 내용이다. 유튜브에 영상이 있다. https://www.youtube.com/watch?v=kopoLzvh5jY 이 hide-and-seek에는 총 6가지의 emergent phase가 있다. Multi-agent는 environment 복잡성이 올라감에 있어서 사람과 같은 도구 사용 등의 능력을 학습한다. Introduction 'Human-releva..
2021.09.05
[Paper] Multi Agent 강화학습 Survey 논문 리뷰
MultiAgent 강화학습 Survey 논문을 탐구해 보자 Deep Reinforcement Learning for Multiagent Systems: A Review of Challenges, Solutions, and Applications (https://arxiv.org/abs/1812.11794) 이번에 탐구할 논문은 Multi Agent에 관한 알고리즘들을 설명해주는 논문이다. multiagent deep RL (MADRL)에서 관건이 되는 것은 더욱 robust 하고 real-world에 적용할 수 있어야 할 것이다. 본 논문에서는 1장과 2장에 걸쳐서 현존하는 강화학습 알고리즘, 이를테면 Q-learning이나 actor-critic, DQN 같은-을 소개한다. 앞부분은 다 읽었다고, 혹..
2021.09.05

1

티스토리툴바