Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3626–3650 of 15113 papers

Title	Date	Tasks	Status	Hype
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified	0
Domain Randomization for Robust, Affordable and Effective Closed-loop Control of Soft Robots	Mar 7, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Decoupling Skill Learning from Robotic Control for Generalizable Object Manipulation	Mar 7, 2023	Imitation LearningReinforcement Learning (RL)	—Unverified	0
adaPARL: Adaptive Privacy-Aware Reinforcement Learning for Sequential-Decision Making Human-in-the-Loop Systems	Mar 7, 2023	Decision MakingReinforcement Learning (RL)	—Unverified	0
Graph Decision Transformer	Mar 7, 2023	Offline RLOpenAI Gym	—Unverified	0
Evolutionary Reinforcement Learning: A Survey	Mar 7, 2023	Board GamesHyperparameter Optimization	—Unverified	0
Learning Bipedal Walking for Humanoids with Current Feedback	Mar 7, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	3
On the Sample Complexity of Vanilla Model-Based Offline Reinforcement Learning with Dependent Samples	Mar 7, 2023	Offline RLOff-policy evaluation	—Unverified	0
Dexterous In-hand Manipulation by Guiding Exploration with Simple Sub-skill Controllers	Mar 6, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Efficient Skill Acquisition for Complex Manipulation Tasks in Obstructed Environments	Mar 6, 2023	Deep Reinforcement LearningMotion Planning	—Unverified	0
Reinforcement Learning Based Self-play and State Stacking Techniques for Noisy Air Combat Environment	Mar 6, 2023	Reinforcement Learning (RL)	—Unverified	0
Perspectives on the Social Impacts of Reinforcement Learning with Human Feedback	Mar 6, 2023	Misinformationreinforcement-learning	—Unverified	0
Safe Reinforcement Learning via Probabilistic Logic Shields	Mar 6, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning	Mar 6, 2023	continuous-controlContinuous Control	—Unverified	0
Improved Sample Complexity Bounds for Distributionally Robust Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Sparsity-Aware Intelligent Massive Random Access Control in Open RAN: A Reinforcement Learning Based Approach	Mar 5, 2023	ManagementReinforcement Learning (RL)	—Unverified	0
Swim: A General-Purpose, High-Performing, and Efficient Activation Function for Locomotion Control Tasks	Mar 5, 2023	continuous-controlContinuous Control	CodeCode Available	0
Ensemble Reinforcement Learning: A Survey	Mar 5, 2023	Ensemble LearningModel Selection	—Unverified	0
Bounding the Optimal Value Function in Compositional Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Local Environment Poisoning Attacks on Federated Reinforcement Learning	Mar 5, 2023	Federated LearningOpenAI Gym	—Unverified	0
CFlowNets: Continuous Control with Generative Flow Networks	Mar 4, 2023	Active Learningcontinuous-control	CodeCode Available	0
Look-Ahead AC Optimal Power Flow: A Model-Informed Reinforcement Learning Approach	Mar 4, 2023	Decision Makingreinforcement-learning	—Unverified	0
Double A3C: Deep Reinforcement Learning on OpenAI Gym Games	Mar 4, 2023	Atari GamesDeep Reinforcement Learning	—Unverified	0
Wasserstein Actor-Critic: Directed Exploration via Optimism for Continuous-Actions Control	Mar 4, 2023	MuJoCoQ-Learning	—Unverified	0
Neural Airport Ground Handling	Mar 4, 2023	Combinatorial OptimizationReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 146 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified