이번 lab에서는 OpenAI Gym이 제공하는 샘플을 이용해 RL의 기본에 대해 배워볼 것이다.
RL을 간단히 설명하자면 다음과 같다.
어떠한 environment가 있고 그러한 environment 속에서 일어날 수 있는 어떠한 state가 주어졌을 때, reward를 최대로 만들기 위한 agent가 취해야 할 최적의 action을 학습하는 ML의 일종이다.
RL 기법 중 구현하기 쉽고 강력한 최신의 방법으로 Deep Q-Network(DQN)과 Deep Deterministic Policy Gradient(DDPG)가 있다.
DQN같은 경우 Q-Learning에 Deep neural network를 결합시킨 기법이다.
(대충 deep learning을 이용하여 현재의 state에서 특정 action이 목적, 최대 reward를 가지기 위해 얼마나 도움이 되는지를 추정하는 것 같다.)
(그리고 흐름상 DQN을 cloud로 돌려보는 듯 하다.)
(AI Platform에서 만들어라고 하는데 기능이 이전된 것 같아) Vertex AI에서 notebook을 하나 만든다.
repository를 하나 clone하고 그 중 early_rl.ipynb 노트북을 켜서 적힌대로 진행하면 된다.
이번 lab이 작성된지 조금 오래되서 그런지 버전이 옛날 것이다.
OpenAI에서 제공하는 gym이라는 library를 받아와 import하는데 무슨 이유인진 모르겠지만 import가 안된다.
'Cloud > Google Cloud Study Jam' 카테고리의 다른 글
Ingesting Data Into The Cloud (0) | 2022.06.20 |
---|---|
Introduction to SQL for BigQuery and Cloud SQL (0) | 2022.06.20 |
Dataproc: Qwik Start - Command Line (0) | 2022.06.17 |
Dataflow: Qwik Start - Python (0) | 2022.06.16 |
Dataprep: Qwik Start (0) | 2022.06.03 |
댓글