Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11001–11025 of 15113 papers

Title	Date	Tasks	Status
Adaptive Dialog Policy Learning with Hindsight and User Modeling	May 7, 2020	Reinforcement Learning (RL)	—Unverified
Reinforcement Learning with Feedback Graphs	May 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Safe Reinforcement Learning through Meta-learned Instincts	May 6, 2020	Deep Reinforcement LearningMeta-Learning	—Unverified
Robotic Arm Control and Task Training through Deep Reinforcement Learning	May 6, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for UAV Autonomous Navigation, Mapping and Target Detection	May 5, 2020	Autonomous Navigationreinforcement-learning	—Unverified
Gifting in multi-agent reinforcement learning	May 5, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
A Survey on Dialog Management: Recent Advances and Challenges	May 5, 2020	ManagementReinforcement Learning (RL)	—Unverified
Generalized Planning With Deep Reinforcement Learning	May 5, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Discrete-to-Deep Supervised Policy Learning	May 5, 2020	Reinforcement Learning (RL)	CodeCode Available
Formal Policy Synthesis for Continuous-Space Systems via Reinforcement Learning	May 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Generalized Reinforcement Meta Learning for Few-Shot Optimization	May 4, 2020	DecoderFew-Shot Learning	—Unverified
Hierarchical Decomposition of Nonlinear Dynamics and Control for System Identification and Policy Distillation	May 4, 2020	Imitation LearningReinforcement Learning (RL)	—Unverified
Reward Constrained Interactive Recommendation with Natural Language Feedback	May 4, 2020	Interactive RecommendationRecommendation Systems	—Unverified
Multiagent Value Iteration Algorithms in Dynamic Programming and Reinforcement Learning	May 4, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Setting up experimental Bell test with reinforcement learning	May 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Noise Pollution in Hospital Readmission Prediction: Long Document Classification with Reinforcement Learning	May 4, 2020	Document ClassificationGeneral Classification	—Unverified
Multi-agent Reinforcement Learning for Decentralized Stable Matching	May 3, 2020	FairnessMulti-agent Reinforcement Learning	—Unverified
Optimal Beam Association for High Mobility mmWave Vehicular Networks: Lightweight Parallel Reinforcement Learning Approach	May 2, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Reinforcement Learning for Intelligent Transportation Systems: A Survey	May 2, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Enhancing Text-based Reinforcement Learning Agents with Commonsense Knowledge	May 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Learning the Arrow of Time for Problems in Reinforcement Learning	May 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
AMRL: Aggregated Memory For Reinforcement Learning	May 1, 2020	Minecraftreinforcement-learning	—Unverified
Learning Heuristics for Quantified Boolean Formulas through Reinforcement Learning	May 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Keep Doing What Worked: Behavior Modelling Priors for Offline Reinforcement Learning	May 1, 2020	continuous-controlContinuous Control	—Unverified
Explain Your Move: Understanding Agent Actions Using Focused Feature Saliency	May 1, 2020	Atari GamesBoard Games	CodeCode Available

Show:10 25 50

← PrevPage 441 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified