Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3471–3480 of 15113 papers

Title	Date	Tasks	Status	Hype
Sample-efficient Model-based Reinforcement Learning for Quantum Control	Apr 19, 2023	Inductive BiasModel-based Reinforcement Learning	CodeCode Available	1
Using Offline Data to Speed Up Reinforcement Learning in Procedurally Generated Environments	Apr 18, 2023	Imitation LearningOffline RL	CodeCode Available	0
Feasible Policy Iteration for Safe Reinforcement Learning	Apr 18, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Cooperative Multi-Agent Reinforcement Learning for Inventory Management	Apr 18, 2023	GPUManagement	—Unverified	0
Benchmarking Actor-Critic Deep Reinforcement Learning Algorithms for Robotics Control with Action Constraints	Apr 18, 2023	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
Provably Feedback-Efficient Reinforcement Learning via Active Reward Learning	Apr 18, 2023	Active Learningreinforcement-learning	—Unverified	0
An adaptive safety layer with hard constraints for safe reinforcement learning in multi-energy management systems	Apr 18, 2023	energy managementManagement	—Unverified	0
MDDL: A Framework for Reinforcement Learning-based Position Allocation in Multi-Channel Feed	Apr 17, 2023	Imitation LearningPosition	—Unverified	0
TreeC: a method to generate interpretable energy management systems using a metaheuristic algorithm	Apr 17, 2023	energy managementManagement	CodeCode Available	0
Bandit-Based Policy Invariant Explicit Shaping for Incorporating External Advice in Reinforcement Learning	Apr 14, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 348 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified