Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3601–3650 of 15113 papers

Title	Date	Tasks	Status	Hype
User Retention-oriented Recommendation with Decision Transformer	Mar 11, 2023	Contrastive Learningcounterfactual	CodeCode Available	1
Provably Efficient Model-Free Algorithms for Non-stationary CMDPs	Mar 10, 2023	Reinforcement Learning (RL)	—Unverified	0
Understanding the Synergies between Quality-Diversity and Deep Reinforcement Learning	Mar 10, 2023	Deep Reinforcement LearningDiversity	—Unverified	0
Optimal foraging strategies can be learned	Mar 10, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning	Mar 9, 2023	Offline RLQ-Learning	CodeCode Available	1
Evolving Populations of Diverse RL Agents with MAP-Elites	Mar 9, 2023	Reinforcement Learning (RL)	—Unverified	0
GOATS: Goal Sampling Adaptation for Scooping with Curriculum Reinforcement Learning	Mar 9, 2023	Positionreinforcement-learning	—Unverified	0
Real-time scheduling of renewable power systems through planning-based reinforcement learning	Mar 9, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
A Framework for History-Aware Hyperparameter Optimisation in Reinforcement Learning	Mar 9, 2023	Decision Makingreinforcement-learning	—Unverified	0
Conceptual Reinforcement Learning for Language-Conditioned Tasks	Mar 9, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Computably Continuous Reinforcement-Learning Objectives are PAC-learnable	Mar 9, 2023	General Reinforcement Learningreinforcement-learning	—Unverified	0
Recent Advances of Deep Robotic Affordance Learning: A Reinforcement Learning Perspective	Mar 9, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Variance-aware robust reinforcement learning with linear function approximation under heavy-tailed rewards	Mar 9, 2023	Decision Makingregression	—Unverified	0
Exploiting Contextual Structure to Generate Useful Auxiliary Tasks	Mar 9, 2023	counterfactualCounterfactual Reasoning	—Unverified	0
Beware of Instantaneous Dependence in Reinforcement Learning	Mar 9, 2023	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Power and Interference Control for VLC-Based UDN: A Reinforcement Learning Approach	Mar 9, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Task Aware Dreamer for Task Generalization in Reinforcement Learning	Mar 9, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Using Memory-Based Learning to Solve Tasks with State-Action Constraints	Mar 8, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
RACCER: Towards Reachable and Certain Counterfactual Explanations for Reinforcement Learning	Mar 8, 2023	counterfactualreinforcement-learning	CodeCode Available	0
MCTS-GEB: Monte Carlo Tree Search is a Good E-graph Builder	Mar 8, 2023	graph constructionReinforcement Learning (RL)	CodeCode Available	0
Deep Occupancy-Predictive Representations for Autonomous Driving	Mar 7, 2023	Autonomous DrivingAutonomous Vehicles	—Unverified	0
A Multiplicative Value Function for Safe and Efficient Reinforcement Learning	Mar 7, 2023	Navigatereinforcement-learning	CodeCode Available	1
Diminishing Return of Value Expansion Methods in Model-Based Reinforcement Learning	Mar 7, 2023	continuous-controlContinuous Control	CodeCode Available	1
Learning When to Treat Business Processes: Prescriptive Process Monitoring with Causal Inference and Reinforcement Learning	Mar 7, 2023	Causal InferenceConformal Prediction	CodeCode Available	0
Zeroth-Order Optimization Meets Human Feedback: Provable Learning via Ranking Oracles	Mar 7, 2023	Image Generationreinforcement-learning	CodeCode Available	1
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified	0
Domain Randomization for Robust, Affordable and Effective Closed-loop Control of Soft Robots	Mar 7, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Decoupling Skill Learning from Robotic Control for Generalizable Object Manipulation	Mar 7, 2023	Imitation LearningReinforcement Learning (RL)	—Unverified	0
adaPARL: Adaptive Privacy-Aware Reinforcement Learning for Sequential-Decision Making Human-in-the-Loop Systems	Mar 7, 2023	Decision MakingReinforcement Learning (RL)	—Unverified	0
Graph Decision Transformer	Mar 7, 2023	Offline RLOpenAI Gym	—Unverified	0
Evolutionary Reinforcement Learning: A Survey	Mar 7, 2023	Board GamesHyperparameter Optimization	—Unverified	0
Learning Bipedal Walking for Humanoids with Current Feedback	Mar 7, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	3
On the Sample Complexity of Vanilla Model-Based Offline Reinforcement Learning with Dependent Samples	Mar 7, 2023	Offline RLOff-policy evaluation	—Unverified	0
Dexterous In-hand Manipulation by Guiding Exploration with Simple Sub-skill Controllers	Mar 6, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Efficient Skill Acquisition for Complex Manipulation Tasks in Obstructed Environments	Mar 6, 2023	Deep Reinforcement LearningMotion Planning	—Unverified	0
Reinforcement Learning Based Self-play and State Stacking Techniques for Noisy Air Combat Environment	Mar 6, 2023	Reinforcement Learning (RL)	—Unverified	0
Perspectives on the Social Impacts of Reinforcement Learning with Human Feedback	Mar 6, 2023	Misinformationreinforcement-learning	—Unverified	0
Safe Reinforcement Learning via Probabilistic Logic Shields	Mar 6, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning	Mar 6, 2023	continuous-controlContinuous Control	—Unverified	0
Improved Sample Complexity Bounds for Distributionally Robust Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Sparsity-Aware Intelligent Massive Random Access Control in Open RAN: A Reinforcement Learning Based Approach	Mar 5, 2023	ManagementReinforcement Learning (RL)	—Unverified	0
Swim: A General-Purpose, High-Performing, and Efficient Activation Function for Locomotion Control Tasks	Mar 5, 2023	continuous-controlContinuous Control	CodeCode Available	0
Ensemble Reinforcement Learning: A Survey	Mar 5, 2023	Ensemble LearningModel Selection	—Unverified	0
Bounding the Optimal Value Function in Compositional Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Local Environment Poisoning Attacks on Federated Reinforcement Learning	Mar 5, 2023	Federated LearningOpenAI Gym	—Unverified	0
CFlowNets: Continuous Control with Generative Flow Networks	Mar 4, 2023	Active Learningcontinuous-control	CodeCode Available	0
Look-Ahead AC Optimal Power Flow: A Model-Informed Reinforcement Learning Approach	Mar 4, 2023	Decision Makingreinforcement-learning	—Unverified	0
Double A3C: Deep Reinforcement Learning on OpenAI Gym Games	Mar 4, 2023	Atari GamesDeep Reinforcement Learning	—Unverified	0
Wasserstein Actor-Critic: Directed Exploration via Optimism for Continuous-Actions Control	Mar 4, 2023	MuJoCoQ-Learning	—Unverified	0
Neural Airport Ground Handling	Mar 4, 2023	Combinatorial OptimizationReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 73 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified