Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10451–10500 of 15113 papers

Title	Date	Tasks	Status	Hype
SAMBA: Safe Model-Based & Active Reinforcement Learning	Jun 12, 2020	modelReinforcement Learning	CodeCode Available	1
Safety-guaranteed Reinforcement Learning based on Multi-class Support Vector Machine	Jun 12, 2020	Q-Learningreinforcement-learning	—Unverified	0
Continuous Control for Searching and Planning with a Learned Model	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning for Neural Control	Jun 12, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
A Brief Look at Generalization in Visual Meta-Reinforcement Learning	Jun 12, 2020	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified	0
Human and Multi-Agent collaboration in a human-MARL teaming framework	Jun 12, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Decorrelated Double Q-learning	Jun 12, 2020	continuous-controlContinuous Control	—Unverified	0
Shared Experience Actor-Critic for Multi-Agent Reinforcement Learning	Jun 12, 2020	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available	1
Potential Field Guided Actor-Critic Reinforcement Learning	Jun 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Mutual Information Based Knowledge Transfer Under State-Action Dimension Mismatch	Jun 12, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
TorsionNet: A Reinforcement Learning Approach to Sequential Conformer Search	Jun 12, 2020	Computational chemistryreinforcement-learning	CodeCode Available	1
Meta-Reinforcement Learning Robust to Distributional Shift via Model Identification and Experience Relabeling	Jun 12, 2020	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Recurrent Sum-Product-Max Networks for Decision Making in Perfectly-Observed Environments	Jun 12, 2020	Decision Makingreinforcement-learning	CodeCode Available	0
Using Reinforcement Learning to Allocate and Manage Service Function Chains in Cellular Networks	Jun 12, 2020	Managementreinforcement-learning	—Unverified	0
Modelling Hierarchical Structure between Dialogue Policy and Natural Language Generator with Option Framework for Task-oriented Dialogue System	Jun 11, 2020	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1
Surveys without Questions: A Reinforcement Learning Approach	Jun 11, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Sample Efficient Reinforcement Learning via Low-Rank Matrix Estimation	Jun 11, 2020	Learning Theoryreinforcement-learning	—Unverified	0
Multi-Agent Informational Learning Processes	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Exploration by Maximizing Rényi Entropy for Reward-Free RL Framework	Jun 11, 2020	Q-LearningReinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning for Electric Transmission Voltage Control	Jun 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Closed Loop Neural-Symbolic Learning via Integrating Neural Perception, Grammar Parsing, and Symbolic Reasoning	Jun 11, 2020	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
Multi-Agent Reinforcement Learning in Stochastic Networked Systems	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Scalable Multi-Agent Reinforcement Learning for Networked Systems with Average Reward	Jun 11, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Zeroth-Order Supervised Policy Improvement	Jun 11, 2020	continuous-controlContinuous Control	—Unverified	0
Multi-Agent Reinforcement Learning in a Realistic Limit Order Book Market Simulation	Jun 10, 2020	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Off-Policy Risk-Sensitive Reinforcement Learning Based Constrained Robust Optimal Control	Jun 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Q-greedyUCB: a New Exploration Policy for Adaptive and Resource-efficient Scheduling	Jun 10, 2020	Decision MakingQ-Learning	—Unverified	0
Privacy-Cost Management in Smart Meters with Mutual Information-Based Reinforcement Learning	Jun 10, 2020	Deep Reinforcement LearningManagement	—Unverified	0
Deep reinforcement learning for optical systems: A case study of mode-locked lasers	Jun 10, 2020	Deep Reinforcement LearningNavigate	—Unverified	0
Learning to Incentivize Other Learning Agents	Jun 10, 2020	General Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Robust Spammer Detection by Nash Reinforcement Learning	Jun 10, 2020	Fraud Detectionreinforcement-learning	CodeCode Available	1
Self-Supervised Reinforcement Learning for Recommender Systems	Jun 10, 2020	Q-LearningRecommendation Systems	—Unverified	0
Searching Learning Strategy with Reinforcement Learning for 3D Medical Image Segmentation	Jun 10, 2020	Data AugmentationImage Segmentation	—Unverified	0
Continuous Action Reinforcement Learning from a Mixture of Interpretable Experts	Jun 10, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study	Jun 10, 2020	Attributecontinuous-control	CodeCode Available	1
Machine learning and control engineering: The model-free case	Jun 10, 2020	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Transient Non-Stationarity and Generalisation in Deep Reinforcement Learning	Jun 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Play Table Tennis From Scratch using Muscular Robots	Jun 10, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Development of A Stochastic Traffic Environment with Generative Time-Series Models for Improving Generalization Capabilities of Autonomous Driving Agents	Jun 10, 2020	Autonomous DrivingReinforcement Learning (RL)	—Unverified	0
An overall view of key problems in algorithmic trading and recent progress	Jun 9, 2020	Algorithmic TradingBIG-bench Machine Learning	—Unverified	0
Online Learning in Iterated Prisoner's Dilemma to Mimic Human Behavior	Jun 9, 2020	Multi-Armed Banditsreinforcement-learning	CodeCode Available	0
Stealing Deep Reinforcement Learning Models for Fun and Profit	Jun 9, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Policy-focused Agent-based Modeling using RL Behavioral Models	Jun 9, 2020	Decision MakingReinforcement Learning (RL)	—Unverified	0
Variational Model-based Policy Optimization	Jun 9, 2020	continuous-controlContinuous Control	—Unverified	0
Distributed Learning on Heterogeneous Resource-Constrained Devices	Jun 9, 2020	Federated LearningReinforcement Learning (RL)	—Unverified	0
Constrained episodic reinforcement learning in concave-convex and knapsack settings	Jun 9, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Causal Discovery from Incomplete Data using An Encoder and Reinforcement Learning	Jun 9, 2020	Causal DiscoveryImputation	—Unverified	0
Constrained Upper Confidence Reinforcement Learning with Known Dynamics	Jun 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning the model-free linear quadratic regulator via random search	Jun 8, 2020	Reinforcement Learning (RL)	—Unverified	0
Learning to Plan via Deep Optimistic Value Exploration	Jun 8, 2020	BenchmarkingModel-based Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 210 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified