Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 3601–3625 of 15113 papers

Title	Date	Tasks	Status	Hype
User Retention-oriented Recommendation with Decision Transformer	Mar 11, 2023	Contrastive Learningcounterfactual	CodeCode Available	1
Provably Efficient Model-Free Algorithms for Non-stationary CMDPs	Mar 10, 2023	Reinforcement Learning (RL)	—Unverified	0
Understanding the Synergies between Quality-Diversity and Deep Reinforcement Learning	Mar 10, 2023	Deep Reinforcement LearningDiversity	—Unverified	0
Optimal foraging strategies can be learned	Mar 10, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	0
Cal-QL: Calibrated Offline RL Pre-Training for Efficient Online Fine-Tuning	Mar 9, 2023	Offline RLQ-Learning	CodeCode Available	1
Evolving Populations of Diverse RL Agents with MAP-Elites	Mar 9, 2023	Reinforcement Learning (RL)	—Unverified	0
Exploiting Contextual Structure to Generate Useful Auxiliary Tasks	Mar 9, 2023	counterfactualCounterfactual Reasoning	—Unverified	0
Task Aware Dreamer for Task Generalization in Reinforcement Learning	Mar 9, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Power and Interference Control for VLC-Based UDN: A Reinforcement Learning Approach	Mar 9, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Framework for History-Aware Hyperparameter Optimisation in Reinforcement Learning	Mar 9, 2023	Decision Makingreinforcement-learning	—Unverified	0
Variance-aware robust reinforcement learning with linear function approximation under heavy-tailed rewards	Mar 9, 2023	Decision Makingregression	—Unverified	0
Conceptual Reinforcement Learning for Language-Conditioned Tasks	Mar 9, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Computably Continuous Reinforcement-Learning Objectives are PAC-learnable	Mar 9, 2023	General Reinforcement Learningreinforcement-learning	—Unverified	0
GOATS: Goal Sampling Adaptation for Scooping with Curriculum Reinforcement Learning	Mar 9, 2023	Positionreinforcement-learning	—Unverified	0
Real-time scheduling of renewable power systems through planning-based reinforcement learning	Mar 9, 2023	reinforcement-learningReinforcement Learning	—Unverified	0
Beware of Instantaneous Dependence in Reinforcement Learning	Mar 9, 2023	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Recent Advances of Deep Robotic Affordance Learning: A Reinforcement Learning Perspective	Mar 9, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
MCTS-GEB: Monte Carlo Tree Search is a Good E-graph Builder	Mar 8, 2023	graph constructionReinforcement Learning (RL)	CodeCode Available	0
Using Memory-Based Learning to Solve Tasks with State-Action Constraints	Mar 8, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
RACCER: Towards Reachable and Certain Counterfactual Explanations for Reinforcement Learning	Mar 8, 2023	counterfactualreinforcement-learning	CodeCode Available	0
Deep Occupancy-Predictive Representations for Autonomous Driving	Mar 7, 2023	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Learning Bipedal Walking for Humanoids with Current Feedback	Mar 7, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	3
A Multiplicative Value Function for Safe and Efficient Reinforcement Learning	Mar 7, 2023	Navigatereinforcement-learning	CodeCode Available	1
Evolutionary Reinforcement Learning: A Survey	Mar 7, 2023	Board GamesHyperparameter Optimization	—Unverified	0
Learning When to Treat Business Processes: Prescriptive Process Monitoring with Causal Inference and Reinforcement Learning	Mar 7, 2023	Causal InferenceConformal Prediction	CodeCode Available	0

Show:10 25 50

← PrevPage 145 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified