Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5051–5075 of 15113 papers

Title	Date	Tasks	Status
How to Use Reinforcement Learning to Facilitate Future Electricity Market Design? Part 1: A Paradigmatic Theory	May 4, 2023	PhilosophyReinforcement Learning (RL)	—Unverified
Simple Noisy Environment Augmentation for Reinforcement Learning	May 4, 2023	Data AugmentationDiversity	CodeCode Available
Rethinking Population-assisted Off-policy Reinforcement Learning	May 4, 2023	OpenAI Gymreinforcement-learning	—Unverified
Sim2Rec: A Simulator-based Decision-making Approach to Optimize Real-World Long-term User Engagement in Sequential Recommender Systems	May 3, 2023	Decision MakingRecommendation Systems	CodeCode Available
Gym-preCICE: Reinforcement Learning Environments for Active Flow Control	May 3, 2023	OpenAI Gymreinforcement-learning	—Unverified
An Autonomous Non-monolithic Agent with Multi-mode Exploration based on Options Framework	May 2, 2023	Reinforcement Learning (RL)	CodeCode Available
Validation of massively-parallel adaptive testing using dynamic control matching	May 2, 2023	MarketingReinforcement Learning (RL)	—Unverified
Sample Efficient Model-free Reinforcement Learning from LTL Specifications with Optimality Guarantees	May 2, 2023	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
A Transfer Learning Approach to Minimize Reinforcement Learning Risks in Energy Optimization for Smart Buildings	Apr 30, 2023	reinforcement-learningReinforcement Learning	—Unverified
Joint Learning of Policy with Unknown Temporal Constraints for Safe Reinforcement Learning	Apr 30, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Federated Reinforcement Learning Framework for Link Activation in Multi-link Wi-Fi Networks	Apr 28, 2023	Fairnessreinforcement-learning	—Unverified
One-Step Distributional Reinforcement Learning	Apr 27, 2023	Distributional Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning with Partial Parametric Model Knowledge	Apr 26, 2023	continuous-controlContinuous Control	—Unverified
Multi-criteria Hardware Trojan Detection: A Reinforcement Learning Approach	Apr 26, 2023	reinforcement-learningReinforcement Learning	—Unverified
CROP: Towards Distributional-Shift Robust Reinforcement Learning using Compact Reshaped Observation Processing	Apr 26, 2023	Data AugmentationDiversity	CodeCode Available
Distance Weighted Supervised Learning for Offline Interaction Data	Apr 26, 2023	Decision MakingImitation Learning	CodeCode Available
Can Agents Run Relay Race with Strangers? Generalization of RL to Out-of-Distribution Trajectories	Apr 26, 2023	Reinforcement Learning (RL)	CodeCode Available
A Closer Look at Reward Decomposition for High-Level Robotic Explanations	Apr 25, 2023	Reinforcement Learning (RL)Vocal Bursts Intensity Prediction	—Unverified
Loss- and Reward-Weighting for Efficient Distributed Reinforcement Learning	Apr 25, 2023	reinforcement-learningReinforcement Learning	—Unverified
Proximal Curriculum for Reinforcement Learning Agents	Apr 25, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Model Extraction Attacks Against Reinforcement Learning Based Controllers	Apr 25, 2023	modelModel extraction	—Unverified
What can online reinforcement learning with function approximation benefit from general coverage conditions?	Apr 25, 2023	Offline RLReinforcement Learning (RL)	—Unverified
On Dynamic Programming Decompositions of Static Risk Measures in Markov Decision Processes	Apr 24, 2023	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning with Knowledge Representation and Reasoning: A Brief Survey	Apr 24, 2023	reinforcement-learningReinforcement Learning	—Unverified
Policy Resilience to Environment Poisoning Attacks on Reinforcement Learning	Apr 24, 2023	Meta-Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 203 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified