Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5101–5125 of 15113 papers

Title	Date	Tasks	Status	Hype
A Bayesian Approach to Learning Bandit Structure in Markov Decision Processes	Jul 30, 2022	Decision Makingreinforcement-learning	—Unverified	0
Unified Automatic Control of Vehicular Systems with Reinforcement Learning	Jul 30, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Solving the vehicle routing problem with deep reinforcement learning	Jul 30, 2022	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0
Reinforcement learning with experience replay and adaptation of action dispersion	Jul 30, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Sampling Attacks on Meta Reinforcement Learning: A Minimax Formulation and Complexity Analysis	Jul 29, 2022	Meta-LearningMeta Reinforcement Learning	CodeCode Available	0
Sample-efficient Safe Learning for Online Nonlinear Control with Control Barrier Functions	Jul 29, 2022	Decision MakingReinforcement Learning (RL)	—Unverified	0
Meta Reinforcement Learning with Successor Feature Based Context	Jul 29, 2022	continuous-controlContinuous Control	—Unverified	0
Combining Evolutionary Search with Behaviour Cloning for Procedurally Generated Content	Jul 29, 2022	Reinforcement Learning (RL)valid	—Unverified	0
Cyclic Policy Distillation: Sample-Efficient Sim-to-Real Reinforcement Learning with Domain Randomization	Jul 29, 2022	Deep Reinforcement LearningMuJoCo	CodeCode Available	0
Deep Reinforcement Learning for System-on-Chip: Myths and Realities	Jul 29, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Contrastive UCB: Provably Efficient Contrastive Self-Supervised Learning in Online Reinforcement Learning	Jul 29, 2022	Contrastive LearningDeep Reinforcement Learning	CodeCode Available	1
Graph Inverse Reinforcement Learning from Diverse Videos	Jul 28, 2022	Diversityreinforcement-learning	—Unverified	0
Latent Properties of Lifelong Learning Systems	Jul 28, 2022	Lifelong learningreinforcement-learning	—Unverified	0
RangL: A Reinforcement Learning Competition Platform	Jul 28, 2022	OpenAI Gymreinforcement-learning	—Unverified	0
Playing a 2D Game Indefinitely using NEAT and Reinforcement Learning	Jul 28, 2022	Q-Learningreinforcement-learning	—Unverified	0
Raising Student Completion Rates with Adaptive Curriculum and Contextual Bandits	Jul 28, 2022	Model-based Reinforcement LearningMulti-Armed Bandits	—Unverified	0
POSET-RL: Phase ordering for Optimizing Size and Execution Time using Reinforcement Learning	Jul 27, 2022	CPUreinforcement-learning	—Unverified	0
Multi-Objective Provisioning of Network Slices using Deep Reinforcement Learning	Jul 27, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Structural Similarity for Improved Transfer in Reinforcement Learning	Jul 27, 2022	Q-Learningreinforcement-learning	—Unverified	0
Distributional Actor-Critic Ensemble for Uncertainty-Aware Continuous Control	Jul 27, 2022	continuous-controlContinuous Control	—Unverified	0
Dynamic Shielding for Reinforcement Learning in Black-Box Environments	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
A Contact-Safe Reinforcement Learning Framework for Contact-Rich Robot Manipulation	Jul 27, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Safe and Robust Experience Sharing for Deterministic Policy Gradient Algorithms	Jul 27, 2022	continuous-controlContinuous Control	CodeCode Available	0
Unsupervised Training for Neural TSP Solver	Jul 27, 2022	Graph Neural Networkreinforcement-learning	—Unverified	0
Branch Ranking for Efficient Mixed-Integer Programming via Offline Ranking-based Policy Learning	Jul 26, 2022	Decision MakingReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 205 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified