Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12751–12800 of 15113 papers

Title	Date	Tasks	Status
Learning to Decompose Compound Questions with Reinforcement Learning	May 1, 2019	Question Answeringreinforcement-learning	—Unverified
Backplay: 'Man muss immer umkehren'	May 1, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Automata Guided Skill Composition	May 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning to Control Visual Abstractions for Structured Exploration in Deep Reinforcement Learning	May 1, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
Deep reinforcement learning with relational inductive biases	May 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Few-Shot Intent Inference via Meta-Inverse Reinforcement Learning	May 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Guider Network for Multi-Dual Learning	May 1, 2019	Machine TranslationNMT	—Unverified
Efficient Model-free Reinforcement Learning in Metric Spaces	May 1, 2019	Q-Learningreinforcement-learning	CodeCode Available
Learning Heuristics for Automated Reasoning through Reinforcement Learning	May 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Goal-Conditioned Value Functions with one-step Path rewards rather than Goal-Rewards	May 1, 2019	Multi-Goal Reinforcement Learningreinforcement-learning	—Unverified
A new dog learns old tricks: RL finds classic optimization algorithms	May 1, 2019	Combinatorial Optimizationreinforcement-learning	—Unverified
Learning to Progressively Plan	May 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning to Reinforcement Learn by Imitation	May 1, 2019	Meta-LearningMeta Reinforcement Learning	—Unverified
Information-Theoretic Considerations in Batch Reinforcement Learning	May 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Inducing Cooperation via Learning to reshape rewards in semi-cooperative multi-agent reinforcement learning	May 1, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Learning To Solve Circuit-SAT: An Unsupervised Differentiable Approach	May 1, 2019	Combinatorial Optimizationreinforcement-learning	—Unverified
Learning agents with prioritization and parameter noise in continuous state and action space	May 1, 2019	Autonomous VehiclesQ-Learning	—Unverified
Driving with Style: Inverse Reinforcement Learning in General-Purpose Planning for Automated Driving	May 1, 2019	Motion Planningreinforcement-learning	—Unverified
Learning Actionable Representations with Goal Conditioned Policies	May 1, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified
DHER: Hindsight Experience Replay for Dynamic Goals	May 1, 2019	Object TrackingReinforcement Learning	CodeCode Available
ACTRCE: Augmenting Experience via Teacher’s Advice	May 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Explicit Recall for Efficient Exploration	May 1, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
SIMILE: Introducing Sequential Information towards More Effective Imitation Learning	May 1, 2019	Imitation LearningOpenAI Gym	—Unverified
Soft Q-Learning with Mutual-Information Regularization	May 1, 2019	Decision MakingQ-Learning	—Unverified
M^3RL: Mind-aware Multi-agent Management Reinforcement Learning	May 1, 2019	ManagementMulti-agent Reinforcement Learning	—Unverified
Sample-efficient policy learning in multi-agent Reinforcement Learning via meta-learning	May 1, 2019	Meta-LearningMulti-agent Reinforcement Learning	—Unverified
Uncovering Surprising Behaviors in Reinforcement Learning via Worst-case Analysis	May 1, 2019	Navigatereinforcement-learning	—Unverified
SUPERVISED POLICY UPDATE	May 1, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available
Predicted Variables in Programming	May 1, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
NEURAL MALWARE CONTROL WITH DEEP REINFORCEMENT LEARNING	May 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Understanding & Generalizing AlphaGo Zero	May 1, 2019	Decision Makingreinforcement-learning	—Unverified
Visceral Machines: Reinforcement Learning with Intrinsic Physiological Rewards	May 1, 2019	Navigatereinforcement-learning	—Unverified
Recurrent Experience Replay in Distributed Reinforcement Learning	May 1, 2019	Atari Gamesreinforcement-learning	CodeCode Available
Towards Consistent Performance on Atari using Expert Demonstrations	May 1, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
Rating Continuous Actions in Spatial Multi-Agent Problems	May 1, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Modeling the Long Term Future in Model-Based Reinforcement Learning	May 1, 2019	Imitation LearningModel-based Reinforcement Learning	—Unverified
Generative Adversarial Imagination for Sample Efficient Deep Reinforcement Learning	Apr 30, 2019	Deep Reinforcement LearningGame of Go	—Unverified
Argus: Smartphone-enabled Human Cooperation via Multi-Agent Reinforcement Learning for Disaster Situational Awareness	Apr 29, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning Scheduler for Vehicle-to-Vehicle Communications Outside Coverage	Apr 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
RL-GAN-Net: A Reinforcement Learning Agent Controlled GAN Network for Real-Time Point Cloud Shape Completion	Apr 28, 2019	Generative Adversarial NetworkReinforcement Learning	CodeCode Available
Deep Neuroevolution of Recurrent and Discrete World Models	Apr 28, 2019	Car RacingDecision Making	CodeCode Available
Arbitrage of Energy Storage in Electricity Markets with Deep Reinforcement Learning	Apr 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Self Training Autonomous Driving Agent	Apr 26, 2019	Autonomous Drivingreinforcement-learning	—Unverified
Ray Interference: a Source of Plateaus in Deep Reinforcement Learning	Apr 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Safe Reinforcement Learning with Scene Decomposition for Navigating Complex Urban Environments	Apr 25, 2019	Decision MakingNavigate	CodeCode Available
Deep Reinforcement Learning for Optimal Critical Care Pain Management with Morphine using Dueling Double-Deep Q Networks	Apr 25, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Continuous-Time Mean-Variance Portfolio Selection: A Reinforcement Learning Framework	Apr 25, 2019	Continuous ControlPortfolio Optimization	CodeCode Available
Cognitive Radar Using Reinforcement Learning in Automotive Applications	Apr 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Grounding Natural Language Commands to StarCraft II Game States for Narration-Guided Reinforcement Learning	Apr 24, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
How You Act Tells a Lot: Privacy-Leakage Attack on Deep Reinforcement Learning	Apr 24, 2019	Autonomous Drivingcontinuous-control	—Unverified

Show:10 25 50

← PrevPage 256 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified