Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1281–1290 of 15113 papers

Title	Date	Tasks	Status	Hype
DrM: Mastering Visual Reinforcement Learning through Dormant Ratio Minimization	Oct 30, 2023	continuous-controlContinuous Control	CodeCode Available	1
DROPO: Sim-to-Real Transfer with Offline Domain Randomization	Jan 20, 2022	Reinforcement Learning (RL)	CodeCode Available	1
Active Exploration for Inverse Reinforcement Learning	Jul 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
DTR-Bench: An in silico Environment and Benchmark Platform for Reinforcement Learning Based Dynamic Treatment Regime	May 28, 2024	BenchmarkingReinforcement Learning (RL)	CodeCode Available	1
Compositional Reinforcement Learning from Logical Specifications	Jun 25, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
DxFormer: A Decoupled Automatic Diagnostic System Based on Decoder-Encoder Transformer with Dense Symptom Representations	May 8, 2022	DecoderDiagnostic	CodeCode Available	1
Constrained Update Projection Approach to Safe Policy Optimization	Sep 15, 2022	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1
EAGER: Asking and Answering Questions for Automatic Reward Shaping in Language-guided RL	Jun 20, 2022	Question AnsweringQuestion Generation	CodeCode Available	1
Control-Informed Reinforcement Learning for Chemical Processes	Aug 24, 2024	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Reinforcement Learning for Combining Search Methods in the Calibration of Economic ABMs	Feb 23, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 129 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified