Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11351–11400 of 15113 papers

Title	Date	Tasks	Status
Fast Reinforcement Learning for Anti-jamming Communications	Feb 13, 2020	reinforcement-learningReinforcement Learning	—Unverified
MODRL/D-AM: Multiobjective Deep Reinforcement Learning Algorithm Using Decomposition and Attention Model for Multiobjective Optimization	Feb 13, 2020	Deep Reinforcement LearningMultiobjective Optimization	—Unverified
Multi-Vehicle Routing Problems with Soft Time Windows: A Multi-Agent Reinforcement Learning Approach	Feb 13, 2020	Computational EfficiencyDecoder	—Unverified
Regret Bounds for Discounted MDPs	Feb 12, 2020	Q-LearningReinforcement Learning	—Unverified
On the Convergence Theory of Debiased Model-Agnostic Meta-Reinforcement Learning	Feb 12, 2020	Meta-LearningMeta Reinforcement Learning	CodeCode Available
A Tensor Network Approach to Finite Markov Decision Processes	Feb 12, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Data Efficient Training for Reinforcement Learning with Adaptive Behavior Policy Sharing	Feb 12, 2020	Atari GamesDecision Making	—Unverified
HMRL: Hyper-Meta Learning for Sparse Reward Reinforcement Learning Problem	Feb 11, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning	Feb 11, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Learning Structured Communication for Multi-agent Reinforcement Learning	Feb 11, 2020	Graph Neural NetworkMulti-agent Reinforcement Learning	—Unverified
Learning to Switch Among Agents in a Team via 2-Layer Markov Decision Processes	Feb 11, 2020	Autonomous Drivingreinforcement-learning	—Unverified
Machine Learning Approaches For Motor Learning: A Short Review	Feb 11, 2020	BIG-bench Machine LearningMeta-Learning	—Unverified
Towards Intelligent Pick and Place Assembly of Individualized Products Using Reinforcement Learning	Feb 11, 2020	Meta-Learningreinforcement-learning	—Unverified
Provable Self-Play Algorithms for Competitive Reinforcement Learning	Feb 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
On the Convergence of the Monte Carlo Exploring Starts Algorithm for Reinforcement Learning	Feb 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
On Reward Shaping for Mobile Robot Navigation: A Reinforcement Learning and SLAM Based Approach	Feb 10, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified
Proficiency Constrained Multi-Agent Reinforcement Learning for Environment-Adaptive Multi UAV-UGV Teaming	Feb 10, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Discrete Action On-Policy Learning with Action-Value Critic	Feb 10, 2020	OpenAI GymReinforcement Learning	CodeCode Available
Interpretable Off-Policy Evaluation in Reinforcement Learning by Highlighting Influential Transitions	Feb 10, 2020	Off-policy evaluationreinforcement-learning	—Unverified
Reward Tweaking: Maximizing the Total Reward While Planning for Short Horizons	Feb 9, 2020	continuous-controlContinuous Control	—Unverified
RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement Learning	Feb 8, 2020	Deep Reinforcement LearningMusic Generation	—Unverified
Multi-task Reinforcement Learning with a Planning Quasi-Metric	Feb 8, 2020	MuJoCoreinforcement-learning	—Unverified
BRPO: Batch Residual Policy Optimization	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Inferential Induction: A Novel Framework for Bayesian Reinforcement Learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Conservative Exploration in Reinforcement Learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning State Abstractions for Transfer in Continuous Control	Feb 8, 2020	continuous-controlContinuous Control	CodeCode Available
A data-driven choice of misfit function for FWI using reinforcement learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Analyzing Policy Distillation on Multi-Task Learning and Meta-Reinforcement Learning in Meta-World	Feb 8, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Description Based Text Classification with Reinforcement Learning	Feb 8, 2020	ClassificationGeneral Classification	—Unverified
Causally Correct Partial Models for Reinforcement Learning	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic Approximation	Feb 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Accelerating Reinforcement Learning for Reaching using Continuous Curriculum Learning	Feb 7, 2020	Decision Makingreinforcement-learning	—Unverified
Automated Lane Change Strategy using Proximal Policy Optimization-based Deep Reinforcement Learning	Feb 7, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts	Feb 7, 2020	Decision MakingPolicy Gradient Methods	—Unverified
Representation of Reinforcement Learning Policies in Reproducing Kernel Hilbert Spaces	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Manipulating Reinforcement Learning: Poisoning Attacks on Cost Signals	Feb 7, 2020	Q-Learningreinforcement-learning	—Unverified
Reward-Free Exploration for Reinforcement Learning	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Student/Teacher Advising through Reward Augmentation	Feb 7, 2020	General Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning in Factored MDPs: Oracle-Efficient Algorithms and Tighter Regret Bounds for the Non-Episodic Setting	Feb 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Temporal-adaptive Hierarchical Reinforcement Learning	Feb 6, 2020	Atari GamesHierarchical Reinforcement Learning	—Unverified
Social diversity and social preferences in mixed-motive reinforcement learning	Feb 6, 2020	Diversityreinforcement-learning	—Unverified
Mutual Information-based State-Control for Intrinsically Motivated Reinforcement Learning	Feb 5, 2020	reinforcement-learningReinforcement Learning	—Unverified
Deep Radial-Basis Value Functions for Continuous Control	Feb 5, 2020	continuous-controlContinuous Control	—Unverified
Learning Task-Driven Control Policies via Information Bottlenecks	Feb 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Finite Time Analysis of Linear Two-timescale Stochastic Approximation with Markovian Noise	Feb 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Bootstrapping a DQN Replay Memory with Synthetic Experiences	Feb 4, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified
Policy Gradient based Quantum Approximate Optimization Algorithm	Feb 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Finite-Sample Analysis of Stochastic Approximation Using Smooth Convex Envelopes	Feb 3, 2020	Q-LearningReinforcement Learning	—Unverified
Evolutionary algorithms for constructing an ensemble of decision trees	Feb 3, 2020	Evolutionary Algorithmsreinforcement-learning	—Unverified
Deep Reinforcement Learning for Autonomous Driving: A Survey	Feb 2, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 228 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified