Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12851–12900 of 15113 papers

Title	Date	Tasks	Status	Hype
Introspection Learning	Feb 27, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Distributed Edge Caching via Reinforcement Learning in Fog Radio Access Networks	Feb 27, 2019	Q-Learningreinforcement-learning	—Unverified	0
Diagnosing Bottlenecks in Deep Q-learning Algorithms	Feb 26, 2019	continuous-controlContinuous Control	CodeCode Available	0
Planning in Hierarchical Reinforcement Learning: Guarantees for Using Local Policies	Feb 26, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Learning When Not to Answer: A Ternary Reward Structure for Reinforcement Learning based Question Answering	Feb 26, 2019	Knowledge GraphsQuestion Answering	—Unverified	0
Understanding Agent Incentives using Causal Influence Diagrams. Part I: Single Action Settings	Feb 26, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Can Meta-Interpretive Learning outperform Deep Reinforcement Learning of Evaluable Game strategies?	Feb 26, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Flappy Hummingbird: An Open Source Dynamic Simulation of Flapping Wing Robots and Animals	Feb 25, 2019	Deep Reinforcement LearningOpenAI Gym	CodeCode Available	0
Adversarial Reinforcement Learning under Partial Observability in Autonomous Computer Network Defence	Feb 25, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Extreme Hummingbird Maneuvers on Flapping Wing Robots	Feb 25, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
S-TRIGGER: Continual State Representation Learning via Self-Triggered Generative Replay	Feb 25, 2019	Change DetectionContinual Learning	—Unverified	0
Long-Range Indoor Navigation with PRM-RL	Feb 25, 2019	Navigatereinforcement-learning	—Unverified	0
Aggregating E-commerce Search Results from Heterogeneous Sources via Hierarchical Reinforcement Learning	Feb 24, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Distributionally Robust Reinforcement Learning	Feb 23, 2019	continuous-controlContinuous Control	—Unverified	0
A General Framework for Structured Learning of Mechanical Systems	Feb 22, 2019	Model-based Reinforcement LearningReinforcement Learning	CodeCode Available	0
Generative Memory for Lifelong Reinforcement Learning	Feb 22, 2019	Lifelong learningreinforcement-learning	—Unverified	0
Learning Deterministic Policy with Target for Power Control in Wireless Networks	Feb 21, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Statistics and Samples in Distributional Reinforcement Learning	Feb 21, 2019	Distributional Reinforcement Learningreinforcement-learning	—Unverified	0
From Language to Goals: Inverse Reinforcement Learning for Vision-Based Instruction Following	Feb 20, 2019	Instruction Followingreinforcement-learning	—Unverified	0
Curiosity-Driven Experience Prioritization via Density Estimation	Feb 20, 2019	Density EstimationOpenAI Gym	—Unverified	0
Beyond Confidence Regions: Tight Bayesian Ambiguity Sets for Robust MDPs	Feb 20, 2019	Bayesian InferencePosition	CodeCode Available	0
Deep Reinforcement Learning using Genetic Algorithm for Parameter Optimization	Feb 19, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
DOM-Q-NET: Grounded RL on Structured Language	Feb 19, 2019	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	0
A novel repetition normalized adversarial reward for headline generation	Feb 19, 2019	Headline Generationreinforcement-learning	—Unverified	0
Emergent Coordination Through Competition	Feb 19, 2019	continuous-controlContinuous Control	—Unverified	0
Hyperbolic Discounting and Learning over Multiple Horizons	Feb 19, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Investigating Generalisation in Continuous Deep Reinforcement Learning	Feb 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Parenting: Safe Reinforcement Learning from Human Input	Feb 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Message-Dropout: An Efficient Training Method for Multi-Agent Deep Reinforcement Learning	Feb 18, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
A new Potential-Based Reward Shaping for Reinforcement Learning Agent	Feb 17, 2019	Atari Gamesreinforcement-learning	—Unverified	0
Heuristics, Answer Set Programming and Markov Decision Process for Solving a Set of Spatial Puzzles	Feb 16, 2019	Q-LearningReinforcement Learning	CodeCode Available	0
Leveraging Communication Topologies Between Learning Agents in Deep Reinforcement Learning	Feb 16, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
Asynchronous Coagent Networks	Feb 15, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning Based High-level Driving Behavior Decision-making Model in Heterogeneous Traffic	Feb 15, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
Robust Reinforcement Learning in POMDPs with Incomplete and Noisy Observations	Feb 15, 2019	continuous-controlContinuous Control	—Unverified	0
Neural-encoding Human Experts' Domain Knowledge to Warm Start Reinforcement Learning	Feb 15, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available	0
Unsupervised Visuomotor Control through Distributional Planning Networks	Feb 14, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Verifiably Safe Off-Model Reinforcement Learning	Feb 14, 2019	modelreinforcement-learning	CodeCode Available	1
CrossQ: Batch Normalization in Deep Reinforcement Learning for Greater Sample Efficiency and Simplicity	Feb 14, 2019	continuous-controlContinuous Control	CodeCode Available	1
Active Perception in Adversarial Scenarios using Maximum Entropy Deep Reinforcement Learning	Feb 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for UA V Attitude Control	Feb 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning to Optimize Long-term User Engagement in Recommender Systems	Feb 13, 2019	Recommendation Systemsreinforcement-learning	—Unverified	0
Preferences Implicit in the State of the World	Feb 12, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
ACTRCE: Augmenting Experience via Teacher's Advice For Multi-Goal Reinforcement Learning	Feb 12, 2019	Multi-Goal Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning from Policy-Dependent Human Feedback	Feb 12, 2019	Deep Reinforcement LearningMinecraft	—Unverified	0
Generalization through Simulation: Integrating Simulated and Real Data into Deep Reinforcement Learning for Vision-Based Autonomous Flight	Feb 11, 2019	Collision AvoidanceDeep Reinforcement Learning	CodeCode Available	0
Latent Space Reinforcement Learning for Steering Angle Prediction	Feb 11, 2019	Deep Reinforcement LearningPrediction	—Unverified	0
Performance Dynamics and Termination Errors in Reinforcement Learning: A Unifying Perspective	Feb 11, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
WiseMove: A Framework for Safe Deep Reinforcement Learning for Autonomous Driving	Feb 11, 2019	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Stochastic Reinforcement Learning	Feb 11, 2019	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 258 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified