Soft Actor-Critic for Discrete Action Settings

2019-10-16Code Available0· sign in to hype

Petros Christodoulou

Code Available — Be the first to reproduce this paper.

Code

github.com/p-christ/Deep-Reinforcement-Learning-Algorithms-with-PyTorch
OfficialIn paperpytorch★ 0
github.com/ku2482/rljax
jax★ 105
github.com/lingweizhu/Pytorch-MunchausenActorCritic
pytorch★ 4
github.com/Epsilon10/MARL
pytorch★ 4
github.com/keraJLi/rejax
jax★ 0
github.com/ku2482/rltorch
pytorch★ 0
github.com/ac-93/soft-actor-critic
tf★ 0
github.com/ku2482/sac-discrete.pytorch
pytorch★ 0
github.com/Bigpig4396/PyTorch-Soft-Actor-Critic-SAC
pytorch★ 0
github.com/BY571/SAC_discrete
pytorch★ 0

Abstract

Soft Actor-Critic is a state-of-the-art reinforcement learning algorithm for continuous action settings that is not applicable to discrete action settings. Many important settings involve discrete actions, however, and so here we derive an alternative version of the Soft Actor-Critic algorithm that is applicable to discrete action settings. We then show that, even without any hyperparameter tuning, it is competitive with the tuned model-free state-of-the-art on a selection of games from the Atari suite.

Tasks

Atari Games reinforcement-learning Reinforcement Learning Reinforcement Learning (RL)

Benchmark Results

Dataset	Model	Metric	Claimed	Verified	Status
Atari 2600 Alien	SAC	Score	216.9	—	Unverified
Atari 2600 Amidar	SAC	Score	7.9	—	Unverified
Atari 2600 Assault	SAC	Score	350	—	Unverified
Atari 2600 Asterix	SAC	Score	272	—	Unverified
Atari 2600 Battle Zone	SAC	Score	4,386.7	—	Unverified
Atari 2600 Beam Rider	SAC	Score	432.1	—	Unverified
Atari 2600 Breakout	SAC	Score	0.7	—	Unverified
Atari 2600 Crazy Climber	SAC	Score	3,668.7	—	Unverified
Atari 2600 Enduro	SAC	Score	0.8	—	Unverified
Atari 2600 Freeway	SAC	Score	4.4	—	Unverified
Atari 2600 Frostbite	SAC	Score	59.4	—	Unverified
Atari 2600 James Bond	SAC	Score	68.3	—	Unverified
Atari 2600 Kangaroo	SAC	Score	29.3	—	Unverified
Atari 2600 Ms. Pacman	SAC	Score	690.9	—	Unverified
Atari 2600 Pong	SAC	Score	-20.98	—	Unverified
Atari 2600 Q*Bert	SAC	Score	280.5	—	Unverified
Atari 2600 Road Runner	SAC	Score	305.3	—	Unverified
Atari 2600 Seaquest	SAC	Score	211.6	—	Unverified
Atari 2600 Space Invaders	SAC	Score	160.8	—	Unverified
Atari 2600 Up and Down	SAC	Score	250.7	—	Unverified

Soft Actor-Critic for Discrete Action Settings

Code

Abstract

Tasks

Benchmark Results

Reproductions