Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6426–6450 of 15113 papers

Title	Date	Tasks	Status
A Bayesian Approach to Learning Bandit Structure in Markov Decision Processes	Jul 30, 2022	Decision Makingreinforcement-learning	—Unverified
Deep Reinforcement Learning for System-on-Chip: Myths and Realities	Jul 29, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Cyclic Policy Distillation: Sample-Efficient Sim-to-Real Reinforcement Learning with Domain Randomization	Jul 29, 2022	Deep Reinforcement LearningMuJoCo	CodeCode Available
Combining Evolutionary Search with Behaviour Cloning for Procedurally Generated Content	Jul 29, 2022	Reinforcement Learning (RL)valid	—Unverified
Meta Reinforcement Learning with Successor Feature Based Context	Jul 29, 2022	continuous-controlContinuous Control	—Unverified
Sample-efficient Safe Learning for Online Nonlinear Control with Control Barrier Functions	Jul 29, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
Sampling Attacks on Meta Reinforcement Learning: A Minimax Formulation and Complexity Analysis	Jul 29, 2022	Meta-LearningMeta Reinforcement Learning	CodeCode Available
Raising Student Completion Rates with Adaptive Curriculum and Contextual Bandits	Jul 28, 2022	Model-based Reinforcement LearningMulti-Armed Bandits	—Unverified
Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning	Jul 28, 2022	Q-Learningreinforcement-learning	—Unverified
RangL: A Reinforcement Learning Competition Platform	Jul 28, 2022	OpenAI Gymreinforcement-learning	—Unverified
Latent Properties of Lifelong Learning Systems	Jul 28, 2022	Lifelong learningreinforcement-learning	—Unverified
Graph Inverse Reinforcement Learning from Diverse Videos	Jul 28, 2022	Diversityreinforcement-learning	—Unverified
Dynamic Shielding for Reinforcement Learning in Black-Box Environments	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified
Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous Control	Jul 27, 2022	continuous-controlContinuous Control	—Unverified
A Contact-Safe Reinforcement Learning Framework for Contact-Rich Robot Manipulation	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified
POSET-RL: Phase ordering for Optimizing Size and Execution Time using Reinforcement Learning	Jul 27, 2022	CPUreinforcement-learning	—Unverified
Structural Similarity for Improved Transfer in Reinforcement Learning	Jul 27, 2022	Q-Learningreinforcement-learning	—Unverified
Multi-Objective Provisioning of Network Slices using Deep Reinforcement Learning	Jul 27, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Safe and Robust Experience Sharing for Deterministic Policy Gradient Algorithms	Jul 27, 2022	continuous-controlContinuous Control	CodeCode Available
Unsupervised Training for Neural TSP Solver	Jul 27, 2022	Graph Neural Networkreinforcement-learning	—Unverified
Semi-analytical Industrial Cooling System Model for Reinforcement Learning	Jul 26, 2022	reinforcement-learningReinforcement Learning	—Unverified
Offline Reinforcement Learning at Multiple Frequencies	Jul 26, 2022	Offline RLreinforcement-learning	—Unverified
Planning and Learning: Path-Planning for Autonomous Vehicles, a Review of the Literature	Jul 26, 2022	Autonomous Vehiclesreinforcement-learning	—Unverified
Branch Ranking for Efficient Mixed-Integer Programming via Offline Ranking-based Policy Learning	Jul 26, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
Live in the Moment: Learning Dynamics Model Adapted to Evolving Policy	Jul 25, 2022	continuous-controlContinuous Control	CodeCode Available

Show:10 25 50

← PrevPage 258 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified