Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11101–11150 of 15113 papers

Title	Date	Tasks	Status	Hype
Extended Markov Games to Learn Multiple Tasks in Multi-Agent Reinforcement Learning	Feb 14, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
An Inductive Bias for Distances: Neural Nets that Respect the Triangle Inequality	Feb 14, 2020	Inductive BiasMetric Learning	CodeCode Available	1
Resource Management in Wireless Networks via Multi-Agent Deep Reinforcement Learning	Feb 14, 2020	Deep Reinforcement LearningManagement	—Unverified	0
Robust Reinforcement Learning via Adversarial training with Langevin Dynamics	Feb 14, 2020	MuJoCoreinforcement-learning	CodeCode Available	0
Hoplite: Efficient and Fault-Tolerant Collective Communication for Task-Based Distributed Systems	Feb 13, 2020	Distributed Computingreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning-Based Beam Tracking for Low-Latency Services in Vehicular Networks	Feb 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Fast Reinforcement Learning for Anti-jamming Communications	Feb 13, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Improving Generalization of Reinforcement Learning with Minimax Distributional Soft Actor-Critic	Feb 13, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Effective Reinforcement Learning through Evolutionary Surrogate-Assisted Prescription	Feb 13, 2020	Decision Makingreinforcement-learning	CodeCode Available	1
MODRL/D-AM: Multiobjective Deep Reinforcement Learning Algorithm Using Decomposition and Attention Model for Multiobjective Optimization	Feb 13, 2020	Deep Reinforcement LearningMultiobjective Optimization	—Unverified	0
Multi-Vehicle Routing Problems with Soft Time Windows: A Multi-Agent Reinforcement Learning Approach	Feb 13, 2020	Computational EfficiencyDecoder	—Unverified	0
A Tensor Network Approach to Finite Markov Decision Processes	Feb 12, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Data Efficient Training for Reinforcement Learning with Adaptive Behavior Policy Sharing	Feb 12, 2020	Atari GamesDecision Making	—Unverified	0
Regret Bounds for Discounted MDPs	Feb 12, 2020	Q-LearningReinforcement Learning	—Unverified	0
On the Convergence Theory of Debiased Model-Agnostic Meta-Reinforcement Learning	Feb 12, 2020	Meta-LearningMeta Reinforcement Learning	CodeCode Available	0
Towards Intelligent Pick and Place Assembly of Individualized Products Using Reinforcement Learning	Feb 11, 2020	Meta-Learningreinforcement-learning	—Unverified	0
Objective Mismatch in Model-based Reinforcement Learning	Feb 11, 2020	modelModel-based Reinforcement Learning	CodeCode Available	1
Machine Learning Approaches For Motor Learning: A Short Review	Feb 11, 2020	BIG-bench Machine LearningMeta-Learning	—Unverified	0
Reinforcement Learning Enhanced Quantum-inspired Algorithm for Combinatorial Optimization	Feb 11, 2020	Combinatorial OptimizationHyperparameter Optimization	CodeCode Available	1
Learning to Switch Among Agents in a Team via 2-Layer Markov Decision Processes	Feb 11, 2020	Autonomous Drivingreinforcement-learning	—Unverified	0
HMRL: Hyper-Meta Learning for Sparse Reward Reinforcement Learning Problem	Feb 11, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Learning Structured Communication for Multi-agent Reinforcement Learning	Feb 11, 2020	Graph Neural NetworkMulti-agent Reinforcement Learning	—Unverified	0
Confounding-Robust Policy Evaluation in Infinite-Horizon Reinforcement Learning	Feb 11, 2020	Off-policy evaluationreinforcement-learning	—Unverified	0
On Reward Shaping for Mobile Robot Navigation: A Reinforcement Learning and SLAM Based Approach	Feb 10, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Proficiency Constrained Multi-Agent Reinforcement Learning for Environment-Adaptive Multi UAV-UGV Teaming	Feb 10, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Provable Self-Play Algorithms for Competitive Reinforcement Learning	Feb 10, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
On the Convergence of the Monte Carlo Exploring Starts Algorithm for Reinforcement Learning	Feb 10, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
SparseIDS: Learning Packet Sampling with Reinforcement Learning	Feb 10, 2020	Computational EfficiencyEdge-computing	CodeCode Available	1
Interpretable Off-Policy Evaluation in Reinforcement Learning by Highlighting Influential Transitions	Feb 10, 2020	Off-policy evaluationreinforcement-learning	—Unverified	0
Discrete Action On-Policy Learning with Action-Value Critic	Feb 10, 2020	OpenAI GymReinforcement Learning	CodeCode Available	0
Reinforcement-Learning based Portfolio Management with Augmented Asset Movement Prediction States	Feb 9, 2020	ArticlesManagement	CodeCode Available	1
Reward Tweaking: Maximizing the Total Reward While Planning for Short Horizons	Feb 9, 2020	continuous-controlContinuous Control	—Unverified	0
A Deep Reinforcement Learning Algorithm Using Dynamic Attention Model for Vehicle Routing Problems	Feb 9, 2020	Combinatorial OptimizationDecoder	CodeCode Available	1
Analyzing Policy Distillation on Multi-Task Learning and Meta-Reinforcement Learning in Meta-World	Feb 8, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Learning State Abstractions for Transfer in Continuous Control	Feb 8, 2020	continuous-controlContinuous Control	CodeCode Available	0
BRPO: Batch Residual Policy Optimization	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Conservative Exploration in Reinforcement Learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A data-driven choice of misfit function for FWI using reinforcement learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Inferential Induction: A Novel Framework for Bayesian Reinforcement Learning	Feb 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Description Based Text Classification with Reinforcement Learning	Feb 8, 2020	ClassificationGeneral Classification	—Unverified	0
RL-Duet: Online Music Accompaniment Generation Using Deep Reinforcement Learning	Feb 8, 2020	Deep Reinforcement LearningMusic Generation	—Unverified	0
Multi-task Reinforcement Learning with a Planning Quasi-Metric	Feb 8, 2020	MuJoCoreinforcement-learning	—Unverified	0
Manipulating Reinforcement Learning: Poisoning Attacks on Cost Signals	Feb 7, 2020	Q-Learningreinforcement-learning	—Unverified	0
Bayesian Residual Policy Optimization: Scalable Bayesian Reinforcement Learning with Clairvoyant Experts	Feb 7, 2020	Decision MakingPolicy Gradient Methods	—Unverified	0
Explicit Mean-Square Error Bounds for Monte-Carlo and Linear Stochastic Approximation	Feb 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Causally Correct Partial Models for Reinforcement Learning	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Accelerating Reinforcement Learning for Reaching using Continuous Curriculum Learning	Feb 7, 2020	Decision Makingreinforcement-learning	—Unverified	0
Automated Lane Change Strategy using Proximal Policy Optimization-based Deep Reinforcement Learning	Feb 7, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Reward-Free Exploration for Reinforcement Learning	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Student/Teacher Advising through Reward Augmentation	Feb 7, 2020	General Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 223 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified