Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10651–10700 of 15113 papers

Title	Date	Tasks	Status	Hype
Optimal PID and Antiwindup Control Design as a Reinforcement Learning Problem	May 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning based Design of Linear Fixed Structure Controllers	May 10, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
An FPGA-Based On-Device Reinforcement Learning Approach using Online Sequential Learning	May 10, 2020	L2 RegularizationOpenAI Gym	—Unverified	0
Accelerating Deep Neuroevolution on Distributed FPGAs for Reinforcement Learning Problems	May 10, 2020	Atari GamesComputational Efficiency	—Unverified	0
ALLSTEPS: Curriculum-driven Learning of Stepping Stone Skills	May 9, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning for Thermostatically Controlled Loads Control using Modelica and Python	May 9, 2020	Q-Learningreinforcement-learning	—Unverified	0
Synthesizing Safe Policies under Probabilistic Constraints with Reinforcement Learning and Bayesian Model Checking	May 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Is Deep Reinforcement Learning Ready for Practical Applications in Healthcare? A Sensitivity Analysis of Duel-DDQN for Hemodynamic Management in Sepsis Patients	May 8, 2020	Deep Reinforcement LearningManagement	—Unverified	0
Learning hierarchical behavior and motion planning for autonomous driving	May 8, 2020	Autonomous DrivingDecision Making	CodeCode Available	1
Reinforcement Learning with Feedback Graphs	May 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
SUPERT: Towards New Frontiers in Unsupervised Evaluation Metrics for Multi-Document Summarization	May 7, 2020	Document SummarizationMulti-Document Summarization	CodeCode Available	1
Plan2Vec: Unsupervised Representation Learning by Latent Plans	May 7, 2020	Motion Planningreinforcement-learning	CodeCode Available	1
Curious Hierarchical Actor-Critic Reinforcement Learning	May 7, 2020	BenchmarkingHierarchical Reinforcement Learning	CodeCode Available	1
CARL: Controllable Agent with Reinforcement Learning for Quadruped Locomotion	May 7, 2020	Deep Reinforcement LearningMotion Synthesis	CodeCode Available	1
Adaptive Dialog Policy Learning with Hindsight and User Modeling	May 7, 2020	Reinforcement Learning (RL)	—Unverified	0
Safe Reinforcement Learning through Meta-learned Instincts	May 6, 2020	Deep Reinforcement LearningMeta-Learning	—Unverified	0
Robotic Arm Control and Task Training through Deep Reinforcement Learning	May 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Gifting in multi-agent reinforcement learning	May 5, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Reinforcement Learning for UAV Autonomous Navigation, Mapping and Target Detection	May 5, 2020	Autonomous Navigationreinforcement-learning	—Unverified	0
A Survey on Dialog Management: Recent Advances and Challenges	May 5, 2020	ManagementReinforcement Learning (RL)	—Unverified	0
Discrete-to-Deep Supervised Policy Learning	May 5, 2020	Reinforcement Learning (RL)	CodeCode Available	0
Generalized Planning With Deep Reinforcement Learning	May 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Formal Policy Synthesis for Continuous-Space Systems via Reinforcement Learning	May 4, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Generalized Reinforcement Meta Learning for Few-Shot Optimization	May 4, 2020	DecoderFew-Shot Learning	—Unverified	0
Hierarchical Decomposition of Nonlinear Dynamics and Control for System Identification and Policy Distillation	May 4, 2020	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Setting up experimental Bell test with reinforcement learning	May 4, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Noise Pollution in Hospital Readmission Prediction: Long Document Classification with Reinforcement Learning	May 4, 2020	Document ClassificationGeneral Classification	—Unverified	0
Reward Constrained Interactive Recommendation with Natural Language Feedback	May 4, 2020	Interactive RecommendationRecommendation Systems	—Unverified	0
Offline Reinforcement Learning: Tutorial, Review, and Perspectives on Open Problems	May 4, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Multiagent Value Iteration Algorithms in Dynamic Programming and Reinforcement Learning	May 4, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Off-Policy Adversarial Inverse Reinforcement Learning	May 3, 2020	continuous-controlContinuous Control	CodeCode Available	1
Multi-agent Reinforcement Learning for Decentralized Stable Matching	May 3, 2020	FairnessMulti-agent Reinforcement Learning	—Unverified	0
Optimal Beam Association for High Mobility mmWave Vehicular Networks: Lightweight Parallel Reinforcement Learning Approach	May 2, 2020	Deep Reinforcement LearningQ-Learning	—Unverified	0
Enhancing Text-based Reinforcement Learning Agents with Commonsense Knowledge	May 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Intelligent Transportation Systems: A Survey	May 2, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Exploration in Reinforcement Learning with Deep Covering Options	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Efficient Parameter Server Synchronization Policies for Distributed SGD	May 1, 2020	Q-LearningReinforcement Learning (RL)	—Unverified	0
Learning the Arrow of Time for Problems in Reinforcement Learning	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Heuristics for Quantified Boolean Formulas through Reinforcement Learning	May 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Implementation Matters in Deep RL: A Case Study on PPO and TRPO	May 1, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Explain Your Move: Understanding Agent Actions Using Focused Feature Saliency	May 1, 2020	Atari GamesBoard Games	CodeCode Available	0
Deep Symbolic Superoptimization Without Human Knowledge	May 1, 2020	Decoderreinforcement-learning	CodeCode Available	1
Option Discovery using Deep Skill Chaining	May 1, 2020	continuous-controlContinuous Control	CodeCode Available	1
Model Based Reinforcement Learning for Atari	May 1, 2020	Atari Gamesmodel	—Unverified	0
RaCT: Toward Amortized Ranking-Critical Training For Collaborative Filtering	May 1, 2020	Collaborative FilteringLearning-To-Rank	CodeCode Available	1
The Ingredients of Real World Robotic Reinforcement Learning	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Posterior sampling for multi-agent reinforcement learning: solving extensive games with imperfect information	May 1, 2020	counterfactualMulti-agent Reinforcement Learning	—Unverified	0
Logic and the 2-Simplicial Transformer	May 1, 2020	Deep Reinforcement LearningInductive Bias	CodeCode Available	1
Toward Evaluating Robustness of Deep Reinforcement Learning with Continuous Control	May 1, 2020	continuous-controlContinuous Control	—Unverified	0
Model-based reinforcement learning for biological sequence design	May 1, 2020	modelModel-based Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 214 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified