본문 바로가기
Cloud/Google Cloud Study Jam

Reinforcement Learning: Qwik Start

by 사향낭 2022. 6. 20.
 

강화 학습: Qwik Start | Google Cloud Skills Boost

이 실습에서는 강화 학습의 기본 개념을 학습하고 실습해 봅니다.

www.cloudskillsboost.google

 

이번 lab에서는 OpenAI Gym이 제공하는 샘플을 이용해 RL의 기본에 대해 배워볼 것이다.

 

 

본 lab에 제공되는 이미지

 

RL을 간단히 설명하자면 다음과 같다.

 

어떠한 environment가 있고 그러한 environment 속에서 일어날 수 있는 어떠한 state가 주어졌을 때, reward를 최대로 만들기 위한 agent가 취해야 할 최적의 action을 학습하는 ML의 일종이다.

 

 

RL 기법 중 구현하기 쉽고 강력한 최신의 방법으로 Deep Q-Network(DQN)과 Deep Deterministic Policy Gradient(DDPG)가 있다.

 

DQN같은 경우 Q-Learning에 Deep neural network를 결합시킨 기법이다.

(대충 deep learning을 이용하여 현재의 state에서 특정 action이 목적, 최대 reward를 가지기 위해 얼마나 도움이 되는지를 추정하는 것 같다.)

(그리고 흐름상 DQN을 cloud로 돌려보는 듯 하다.)

 

 

(AI Platform에서 만들어라고 하는데 기능이 이전된 것 같아) Vertex AI에서 notebook을 하나 만든다.

 

repository를 하나 clone하고 그 중 early_rl.ipynb 노트북을 켜서 적힌대로 진행하면 된다.

 

이번 lab이 작성된지 조금 오래되서 그런지 버전이 옛날 것이다.

 

OpenAI에서 제공하는 gym이라는 library를 받아와 import하는데 무슨 이유인진 모르겠지만 import가 안된다.

'Cloud > Google Cloud Study Jam' 카테고리의 다른 글

Ingesting Data Into The Cloud  (0) 2022.06.20
Introduction to SQL for BigQuery and Cloud SQL  (0) 2022.06.20
Dataproc: Qwik Start - Command Line  (0) 2022.06.17
Dataflow: Qwik Start - Python  (0) 2022.06.16
Dataprep: Qwik Start  (0) 2022.06.03

댓글