Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14051–14100 of 15113 papers

Title	Date	Tasks	Status	Hype
Avoiding Catastrophic States with Intrinsic Fear	Jan 1, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for List-wise Recommendations	Dec 30, 2017	Deep Reinforcement LearningRecommendation Systems	CodeCode Available	1
Learning Structural Weight Uncertainty for Sequential Decision-Making	Dec 30, 2017	Decision MakingMulti-Armed Bandits	CodeCode Available	0
Deep Reinforcement Learning for Unsupervised Video Summarization with Diversity-Representativeness Reward	Dec 29, 2017	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
SBEED: Convergent Reinforcement Learning with Nonlinear Function Approximation	Dec 29, 2017	Q-Learningreinforcement-learning	—Unverified	0
Reinforcement Learning with Analogical Similarity to Guide Schema Induction and Attention	Dec 28, 2017	Analogical Similarityreinforcement-learning	—Unverified	0
Multi-timescale memory dynamics in a reinforcement learning network with attention-gated memory	Dec 28, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Consensus-based Sequence Training for Video Captioning	Dec 27, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
RLlib: Abstractions for Distributed Reinforcement Learning	Dec 26, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	4
Whatever Does Not Kill Deep Reinforcement Learning, Makes It Stronger	Dec 23, 2017	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
A short variational proof of equivalence between policy gradients and soft Q learning	Dec 22, 2017	Q-Learningreinforcement-learning	—Unverified	0
Federated Control with Hierarchical Multi-Agent Deep Reinforcement Learning	Dec 22, 2017	Deep Reinforcement LearningEfficient Exploration	CodeCode Available	0
Least-Squares Temporal Difference Learning for the Linear Quadratic Regulator	Dec 22, 2017	continuous-controlContinuous Control	—Unverified	0
Multiagent-based Participatory Urban Simulation through Inverse Reinforcement Learning	Dec 21, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Revisiting the Master-Slave Architecture in Multi-Agent Deep Reinforcement Learning	Dec 20, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Recurrent Attentional Reinforcement Learning for Multi-label Image Recognition	Dec 20, 2017	Multi-Label Image Recognitionreinforcement-learning	—Unverified	0
Hierarchical and Interpretable Skill Acquisition in Multi-task Reinforcement Learning	Dec 20, 2017	Minecraftreinforcement-learning	—Unverified	0
Pseudorehearsal in actor-critic agents with neural network function approximation	Dec 20, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
Two-dimensional Anti-jamming Mobile Communication Based on Reinforcement Learning	Dec 19, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
On Wasserstein Reinforcement Learning and the Fokker-Planck equation	Dec 19, 2017	reinforcement-learningReinforcement Learning	—Unverified	0
On the Relationship Between the OpenAI Evolution Strategy and Stochastic Gradient Descent	Dec 18, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Deep Neuroevolution: Genetic Algorithms Are a Competitive Alternative for Training Deep Neural Networks for Reinforcement Learning	Dec 18, 2017	Deep Reinforcement LearningEvolutionary Algorithms	CodeCode Available	0
ES Is More Than Just a Traditional Finite-Difference Approximator	Dec 18, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Improving Exploration in Evolution Strategies for Deep Reinforcement Learning via a Population of Novelty-Seeking Agents	Dec 18, 2017	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0
Integral Equations and Machine Learning	Dec 17, 2017	BIG-bench Machine LearningImage Generation	—Unverified	0
Towards a Deep Reinforcement Learning Approach for Tower Line Wars	Dec 17, 2017	Deep Reinforcement LearningQ-Learning	—Unverified	0
Ray: A Distributed Framework for Emerging AI Applications	Dec 16, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	4
Occam's razor is insufficient to infer the preferences of irrational agents	Dec 15, 2017	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Hierarchical Text Generation and Planning for Strategic Dialogue	Dec 15, 2017	Decision Makingreinforcement-learning	CodeCode Available	0
AI2-THOR: An Interactive 3D Environment for Visual AI	Dec 14, 2017	Deep Reinforcement LearningImitation Learning	CodeCode Available	1
Differentiable lower bound for expected BLEU score	Dec 13, 2017	reinforcement-learningReinforcement Learning	CodeCode Available	0
Inverse Reinforcement Learning for Marketing	Dec 13, 2017	Marketingreinforcement-learning	—Unverified	0
Multi-focus Attention Network for Efficient Deep Reinforcement Learning	Dec 13, 2017	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
QLBS: Q-Learner in the Black-Scholes(-Merton) Worlds	Dec 13, 2017	BenchmarkingModel-based Reinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning Boosted by External Knowledge	Dec 12, 2017	Atari GamesDeep Reinforcement Learning	—Unverified	0
A Low-Cost Ethics Shaping Approach for Designing Reinforcement Learning Agents	Dec 12, 2017	Ethicsreinforcement-learning	CodeCode Available	0
Interpretable Policies for Reinforcement Learning by Genetic Programming	Dec 12, 2017	regressionreinforcement-learning	—Unverified	0
Simulated Autonomous Driving on Realistic Road Networks using Deep Reinforcement Learning	Dec 12, 2017	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Robust Deep Reinforcement Learning with Adversarial Attacks	Dec 11, 2017	Deep Reinforcement LearningQ-Learning	—Unverified	0
MINOS: Multimodal Indoor Simulator for Navigation in Complex Environments	Dec 11, 2017	Deep Reinforcement LearningNavigate	CodeCode Available	0
The Eigenoption-Critic Framework	Dec 11, 2017	Efficient ExplorationHierarchical Reinforcement Learning	—Unverified	0
Reinforced dynamics for enhanced sampling in large atomic and molecular systems	Dec 10, 2017	Deep Reinforcement LearningEfficient Exploration	—Unverified	0
Stochastic Answer Networks for Machine Reading Comprehension	Dec 10, 2017	Machine Reading ComprehensionQuestion Answering	CodeCode Available	0
Deep Primal-Dual Reinforcement Learning: Accelerating Actor-Critic using Bellman Duality	Dec 7, 2017	Q-Learningreinforcement-learning	—Unverified	0
End-to-End Offline Goal-Oriented Dialog Policy Learning via Policy Gradient	Dec 7, 2017	DecoderGoal-Oriented Dialog	—Unverified	0
Noisy Natural Gradient as Variational Inference	Dec 6, 2017	Active LearningEfficient Exploration	CodeCode Available	0
Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm	Dec 5, 2017	Game of ChessGame of Go	CodeCode Available	1
A Deeper Look at Experience Replay	Dec 4, 2017	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Interactive Reinforcement Learning for Object Grounding via Self-Talking	Dec 2, 2017	Objectreinforcement-learning	—Unverified	0
Representation and Reinforcement Learning for Personalized Glycemic Control in Septic Patients	Dec 2, 2017	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 282 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified