Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11351–11375 of 15113 papers

Title	Date	Tasks	Status
Fast Reinforcement Learning for Anti-jamming Communications	Feb 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
MODRL/D-AM: Multiobjective Deep Reinforcement Learning Algorithm Using Decomposition and Attention Model for Multiobjective Optimization	Feb 13, 2020	Deep Reinforcement LearningMultiobjective Optimization	—Unverified
Multi-Vehicle Routing Problems with Soft Time Windows: A Multi-Agent Reinforcement Learning Approach	Feb 13, 2020	Computational EfficiencyDecoder	—Unverified
Regret Bounds for Discounted MDPs	Feb 12, 2020	Q-LearningReinforcement Learning	—Unverified
On the Convergence Theory of Debiased Model-Agnostic Meta-Reinforcement Learning	Feb 12, 2020	Meta-LearningMeta Reinforcement Learning	CodeCode Available
A Tensor Network Approach to Finite Markov Decision Processes	Feb 12, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Data Efficient Training for Reinforcement Learning with Adaptive Behavior Policy Sharing	Feb 12, 2020	Atari GamesDecision Making	—Unverified
HMRL: Hyper-Meta Learning for Sparse Reward Reinforcement Learning Problem	Feb 11, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning	Feb 11, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Learning Structured Communication for Multi-agent Reinforcement Learning	Feb 11, 2020	Graph Neural NetworkMulti-agent Reinforcement Learning	—Unverified
Learning to Switch Among Agents in a Team via 2-Layer Markov Decision Processes	Feb 11, 2020	Autonomous Drivingreinforcement-learning	—Unverified
Machine Learning Approaches For Motor Learning: A Short Review	Feb 11, 2020	BIG-bench Machine LearningMeta-Learning	—Unverified
Towards Intelligent Pick and Place Assembly of Individualized Products Using Reinforcement Learning	Feb 11, 2020	Meta-Learningreinforcement-learning	—Unverified
Provable Self-Play Algorithms for Competitive Reinforcement Learning	Feb 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
On the Convergence of the Monte Carlo Exploring Starts Algorithm for Reinforcement Learning	Feb 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
On Reward Shaping for Mobile Robot Navigation: A Reinforcement Learning and SLAM Based Approach	Feb 10, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified
Proficiency Constrained Multi-Agent Reinforcement Learning for Environment-Adaptive Multi UAV-UGV Teaming	Feb 10, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Discrete Action On-Policy Learning with Action-Value Critic	Feb 10, 2020	OpenAI GymReinforcement Learning	CodeCode Available
Interpretable Off-Policy Evaluation in Reinforcement Learning by Highlighting Influential Transitions	Feb 10, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Reward Tweaking: Maximizing the Total Reward While Planning for Short Horizons	Feb 9, 2020	continuous-controlContinuous Control	—Unverified
RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement Learning	Feb 8, 2020	Deep Reinforcement LearningMusic Generation	—Unverified
Multi-task Reinforcement Learning with a Planning Quasi-Metric	Feb 8, 2020	MuJoCoreinforcement-learning	—Unverified
BRPO: Batch Residual Policy Optimization	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Inferential Induction: A Novel Framework for Bayesian Reinforcement Learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Conservative Exploration in Reinforcement Learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 455 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified