Reinforcement Learning: Qwik Start

강화 학습: Qwik Start | Google Cloud Skills Boost

이 실습에서는 강화 학습의 기본 개념을 학습하고 실습해 봅니다.

www.cloudskillsboost.google

이번 lab에서는 OpenAI Gym이 제공하는 샘플을 이용해 RL의 기본에 대해 배워볼 것이다.

RL을 간단히 설명하자면 다음과 같다.

어떠한 environment가 있고 그러한 environment 속에서 일어날 수 있는 어떠한 state가 주어졌을 때, reward를 최대로 만들기 위한 agent가 취해야 할 최적의 action을 학습하는 ML의 일종이다.

RL 기법 중 구현하기 쉽고 강력한 최신의 방법으로 Deep Q-Network(DQN)과 Deep Deterministic Policy Gradient(DDPG)가 있다.

DQN같은 경우 Q-Learning에 Deep neural network를 결합시킨 기법이다.

(대충 deep learning을 이용하여 현재의 state에서 특정 action이 목적, 최대 reward를 가지기 위해 얼마나 도움이 되는지를 추정하는 것 같다.)

(그리고 흐름상 DQN을 cloud로 돌려보는 듯 하다.)

(AI Platform에서 만들어라고 하는데 기능이 이전된 것 같아) Vertex AI에서 notebook을 하나 만든다.

repository를 하나 clone하고 그 중 early_rl.ipynb 노트북을 켜서 적힌대로 진행하면 된다.

이번 lab이 작성된지 조금 오래되서 그런지 버전이 옛날 것이다.

OpenAI에서 제공하는 gym이라는 library를 받아와 import하는데 무슨 이유인진 모르겠지만 import가 안된다.

Ingesting Data Into The Cloud (0)	2022.06.20
Introduction to SQL for BigQuery and Cloud SQL (0)	2022.06.20
Dataproc: Qwik Start - Command Line (0)	2022.06.17
Dataflow: Qwik Start - Python (0)	2022.06.16
Dataprep: Qwik Start (0)	2022.06.03

Life Story