Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12601–12650 of 15113 papers

Title	Date	Tasks	Status
Don't Forget Your Teacher: A Corrective Reinforcement Learning Framework	May 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
Effective Medical Test Suggestions Using Deep Reinforcement Learning	May 30, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Combating the Compounding-Error Problem with a Multi-step Model	May 30, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Advantage Amplification in Slowly Evolving Latent-State Environments	May 29, 2019	Recommendation Systemsreinforcement-learning	—Unverified
An Improved Convergence Analysis of Stochastic Variance-Reduced Policy Gradient	May 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Linear interpolation gives better gradients than Gaussian smoothing in derivative-free optimization	May 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Policy Mixture Model for Temporal Point Processes Clustering	May 29, 2019	ClusteringPoint Processes	—Unverified
CopyCAT: Taking Control of Neural Policies with Constant Attacks	May 29, 2019	Atari GamesDeep Reinforcement Learning	—Unverified
On the Generalization Gap in Reparameterizable Reinforcement Learning	May 29, 2019	Learning Theoryreinforcement-learning	—Unverified
Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology	May 29, 2019	Q-LearningRecommendation Systems	—Unverified
Switching Linear Dynamics for Variational Bayes Filtering	May 29, 2019	Bayesian InferenceModel-based Reinforcement Learning	—Unverified
Variance Reduction for Evolution Strategies via Structured Control Variates	May 29, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
A General Markov Decision Process Framework for Directly Learning Optimal Control Policies	May 28, 2019	Q-LearningReinforcement Learning	—Unverified
Conditions on Features for Temporal Difference-Like Methods to Converge	May 28, 2019	reinforcement-learningReinforcement Learning	—Unverified
Beyond Exponentially Discounted Sum: Automatic Learning of Return Function	May 28, 2019	Atari GamesForm	—Unverified
Generation of Policy-Level Explanations for Reinforcement Learning	May 28, 2019	reinforcement-learningReinforcement Learning	—Unverified
Interactive Teaching Algorithms for Inverse Reinforcement Learning	May 28, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning robust control for LQR systems with multiplicative noise via policy gradient	May 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Hypothesis-Driven Skill Discovery for Hierarchical Deep Reinforcement Learning	May 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Finite-Sample Analysis of Nonlinear Stochastic Approximation with Applications in Reinforcement Learning	May 27, 2019	Q-Learningreinforcement-learning	CodeCode Available
Explainable Reinforcement Learning Through a Causal Lens	May 27, 2019	counterfactualreinforcement-learning	CodeCode Available
Disentangling Dynamics and Returns: Value Function Decomposition with Future Prediction	May 27, 2019	continuous-controlContinuous Control	—Unverified
AgentGraph: Towards Universal Dialogue Management with Structured Deep Reinforcement Learning	May 27, 2019	Deep Reinforcement LearningDialogue Management	—Unverified
Learning to Discretize: Solving 1D Scalar Conservation Laws via Deep Reinforcement Learning	May 27, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Policy Search by Target Distribution Learning for Continuous Control	May 27, 2019	continuous-controlContinuous Control	—Unverified
Tight Regret Bounds for Model-Based Reinforcement Learning with Greedy Policies	May 27, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available
Near-optimal Optimistic Reinforcement Learning using Empirical Bernstein Inequalities	May 27, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Selective Transfer with Reinforced Transfer Network for Partial Domain Adaptation	May 26, 2019	Domain AdaptationPartial Domain Adaptation	—Unverified
Variational Bayes: A report on approaches and applications	May 26, 2019	Bayesian InferenceContinual Learning	—Unverified
Safe Reinforcement Learning with Nonlinear Dynamics via Model Predictive Shielding	May 25, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Composing Task-Agnostic Policies with Deep Reinforcement Learning	May 25, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Prioritized Sequence Experience Replay	May 25, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Learning to Reason in Large Theories without Imitation	May 25, 2019	Automated Theorem ProvingDeep Reinforcement Learning	—Unverified
Transferable Cost-Aware Security Policy Implementation for Malware Detection Using Deep Reinforcement Learning	May 25, 2019	Deep Reinforcement LearningMalware Detection	—Unverified
A Kernel Loss for Solving the Bellman Equation	May 25, 2019	Q-LearningReinforcement Learning	CodeCode Available
Exploration via Flow-Based Intrinsic Rewards	May 24, 2019	Atari GamesOptical Flow Estimation	CodeCode Available
A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer	May 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Adaptive Symmetric Reward Noising for Reinforcement Learning	May 24, 2019	Autonomous DrivingQ-Learning	CodeCode Available
RL4health: Crowdsourcing Reinforcement Learning for Knee Replacement Pathway Optimization	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Automatic Machine Learning by Pipeline Synthesis using Model-Based Reinforcement Learning and a Grammar	May 24, 2019	AutoMLBayesian Optimization	—Unverified
MQLV: Optimal Policy of Money Management in Retail Banking with Q-Learning	May 24, 2019	Decision MakingManagement	—Unverified
InfoRL: Interpretable Reinforcement Learning using Information Maximization	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Continual Reinforcement Learning in 3D Non-stationary Environments	May 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
A Micro-Objective Perspective of Reinforcement Learning	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Feature Space: Matrix Bandit, Kernels, and Regret Bound	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified
PAC Guarantees for Cooperative Multi-Agent Reinforcement Learning with Restricted Communication	May 23, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Population-based Global Optimisation Methods for Learning Long-term Dependencies with RNNs	May 23, 2019	reinforcement-learningReinforcement Learning	—Unverified
Multi-hop Reading Comprehension via Deep Reinforcement Learning based Document Traversal	May 23, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Recurrent Value Functions	May 23, 2019	continuous-controlContinuous Control	—Unverified
Hierarchical Reinforcement Learning for Concurrent Discovery of Compound and Composable Policies	May 23, 2019	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 253 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified