Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12751–12800 of 15113 papers

Title	Date	Tasks	Status	Hype
Neural Program Planner for Structured Predictions	Mar 23, 2019	Machine TranslationProgram Synthesis	—Unverified	0
Temporal Logic Guided Safe Reinforcement Learning Using Control Barrier Functions	Mar 23, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Symbolic Regression Methods for Reinforcement Learning	Mar 22, 2019	Decision MakingFriction	—Unverified	0
Explaining Reinforcement Learning to Mere Mortals: An Empirical Study	Mar 22, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Hierarchical Reinforcement Learning Based Recommendations via Multi-goals Abstraction	Mar 22, 2019	Hierarchical Reinforcement LearningRecommendation Systems	—Unverified	0
DQN with model-based exploration: efficient learning on environments with sparse rewards	Mar 22, 2019	Atari GamesOpenAI Gym	—Unverified	0
Optimization Methods for Interpretable Differentiable Decision Trees in Reinforcement Learning	Mar 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Improving Safety in Reinforcement Learning Using Model-Based Architectures and Human Intervention	Mar 22, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Jet grooming through reinforcement learning	Mar 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Macro Action Reinforcement Learning with Sequence Disentanglement using Variational Autoencoder	Mar 22, 2019	DisentanglementGeneral Reinforcement Learning	—Unverified	0
Distributed off-Policy Actor-Critic Reinforcement Learning with Policy Consensus	Mar 21, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
End-to-End Safe Reinforcement Learning through Barrier Functions for Safety-Critical Continuous Control Tasks	Mar 21, 2019	continuous-controlContinuous Control	CodeCode Available	0
Augmented Memory Networks for Streaming-Based Active One-Shot Learning	Mar 20, 2019	Active LearningOne-Shot Learning	—Unverified	0
Single-step Options for Adversary Driving	Mar 20, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Optimizing thermodynamic trajectories using evolutionary and gradient-based reinforcement learning	Mar 20, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Diversity-Promoting Deep Reinforcement Learning for Interactive Recommendation	Mar 19, 2019	Deep Reinforcement LearningDiversity	—Unverified	0
Efficient Off-Policy Meta-Reinforcement Learning via Probabilistic Context Variables	Mar 19, 2019	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	0
Hindsight Generative Adversarial Imitation Learning	Mar 19, 2019	Imitation LearningReinforcement Learning	—Unverified	0
Exploiting Hierarchy for Learning and Transfer in KL-regularized RL	Mar 18, 2019	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning with Decorrelation	Mar 18, 2019	Atari GamesDeep Reinforcement Learning	—Unverified	0
A Comparison of Prediction Algorithms and Nexting for Short Term Weather Forecasts	Mar 18, 2019	regressionReinforcement Learning	—Unverified	0
Adaptive Genomic Evolution of Neural Network Topologies (AGENT) for State-to-Action Mapping in Autonomous Agents	Mar 17, 2019	Collision AvoidanceDiversity	—Unverified	0
Learning proposals for sequential importance samplers using reinforced variational inference	Mar 16, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Robust Reinforcement Learning for Autonomous Driving	Mar 16, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Multi-agent query reformulation: Challenges and the role of diversity	Mar 16, 2019	DiversityQuestion Answering	—Unverified	0
Online Antenna Tuning in Heterogeneous Cellular Networks with Deep Reinforcement Learning	Mar 15, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
Policy Distillation and Value Matching in Multiagent Reinforcement Learning	Mar 15, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Multi-Agent Off-Policy Actor-Critic Algorithm for Distributed Reinforcement Learning	Mar 15, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Can User-Centered Reinforcement Learning Allow a Robot to Attract Passersby without Causing Discomfort?	Mar 14, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
gym-gazebo2, a toolkit for reinforcement learning using ROS 2 and Gazebo	Mar 14, 2019	BenchmarkingOpenAI Gym	CodeCode Available	0
No-regret Exploration in Contextual Reinforcement Learning	Mar 14, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning with Feedback-based Exploration	Mar 14, 2019	continuous-controlContinuous Control	CodeCode Available	0
On Applications of Bootstrap in Continuous Space Reinforcement Learning	Mar 14, 2019	Decision Makingreinforcement-learning	—Unverified	0
Reinforcement Learning with Dynamic Boltzmann Softmax Updates	Mar 14, 2019	Atari GamesQ-Learning	CodeCode Available	0
ROS2Learn: a reinforcement learning framework for ROS 2	Mar 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
CoaCor: Code Annotation for Code Retrieval with Reinforcement Learning	Mar 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Effective reinforcement learning based local search for the maximum k-plex problem	Mar 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Task-oriented Design through Deep Reinforcement Learning	Mar 13, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
Resource Abstraction for Reinforcement Learning in Multiagent Congestion Problems	Mar 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Trajectory Optimization for Unknown Constrained Systems using Reinforcement Learning	Mar 13, 2019	Motion Planningreinforcement-learning	—Unverified	0
VRKitchen: an Interactive 3D Virtual Environment for Task-oriented Learning	Mar 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Review of Reinforcement Learning for Autonomous Building Energy Management	Mar 12, 2019	BIG-bench Machine Learningenergy management	—Unverified	0
Deep Multi-Agent Reinforcement Learning with Discrete-Continuous Hybrid Action Spaces	Mar 12, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Hybrid Reinforcement Learning with Expert State Sequences	Mar 11, 2019	Atari GamesImitation Learning	CodeCode Available	0
Accelerating Minibatch Stochastic Gradient Descent using Typicality Sampling	Mar 11, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Sample-Efficient Model-Free Reinforcement Learning with Off-Policy Critics	Mar 11, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Multi-Agent Deep Reinforcement Learning for Large-scale Traffic Signal Control	Mar 11, 2019	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Learning to Paint With Model-based Deep Reinforcement Learning	Mar 11, 2019	Deep Reinforcement LearningPosition	CodeCode Available	1
Deep learning for molecular design - a review of the state of the art	Mar 11, 2019	Benchmarkingreinforcement-learning	—Unverified	0
DeepPool: Distributed Model-free Algorithm for Ride-sharing using Deep Reinforcement Learning	Mar 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 256 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified