Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12451–12500 of 15113 papers

Title	Date	Tasks	Status	Hype
Finite-time Analysis of Approximate Policy Iteration for the Linear Quadratic Regulator	May 30, 2019	continuous-controlContinuous Control	—Unverified	0
Effective Medical Test Suggestions Using Deep Reinforcement Learning	May 30, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Defining Admissible Rewards for High Confidence Policy Evaluation	May 30, 2019	Off-policy evaluationReinforcement Learning	—Unverified	0
Towards Finding Longer Proofs	May 30, 2019	Automated Theorem Provingreinforcement-learning	CodeCode Available	0
Reinforcement Learning and Adaptive Sampling for Optimized DNN Compilation	May 30, 2019	ClusteringDiversity	CodeCode Available	0
Variance Reduction for Evolution Strategies via Structured Control Variates	May 29, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Advantage Amplification in Slowly Evolving Latent-State Environments	May 29, 2019	Recommendation Systemsreinforcement-learning	—Unverified	0
Linear interpolation gives better gradients than Gaussian smoothing in derivative-free optimization	May 29, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
An Improved Convergence Analysis of Stochastic Variance-Reduced Policy Gradient	May 29, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning with Policy Mixture Model for Temporal Point Processes Clustering	May 29, 2019	ClusteringPoint Processes	—Unverified	0
Reinforcement Learning for Slate-based Recommender Systems: A Tractable Decomposition and Practical Methodology	May 29, 2019	Q-LearningRecommendation Systems	—Unverified	0
CopyCAT: Taking Control of Neural Policies with Constant Attacks	May 29, 2019	Atari GamesDeep Reinforcement Learning	—Unverified	0
Switching Linear Dynamics for Variational Bayes Filtering	May 29, 2019	Bayesian InferenceModel-based Reinforcement Learning	—Unverified	0
On the Generalization Gap in Reparameterizable Reinforcement Learning	May 29, 2019	Learning Theoryreinforcement-learning	—Unverified	0
Learning robust control for LQR systems with multiplicative noise via policy gradient	May 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Conditions on Features for Temporal Difference-Like Methods to Converge	May 28, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Coordinated Exploration via Intrinsic Rewards for Multi-Agent Reinforcement Learning	May 28, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Beyond Exponentially Discounted Sum: Automatic Learning of Return Function	May 28, 2019	Atari GamesForm	—Unverified	0
A General Markov Decision Process Framework for Directly Learning Optimal Control Policies	May 28, 2019	Q-LearningReinforcement Learning	—Unverified	0
Generation of Policy-Level Explanations for Reinforcement Learning	May 28, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Interactive Teaching Algorithms for Inverse Reinforcement Learning	May 28, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Snooping Attacks on Deep Reinforcement Learning	May 28, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Hypothesis-Driven Skill Discovery for Hierarchical Deep Reinforcement Learning	May 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Finite-Sample Analysis of Nonlinear Stochastic Approximation with Applications in Reinforcement Learning	May 27, 2019	Q-Learningreinforcement-learning	CodeCode Available	0
Tight Regret Bounds for Model-Based Reinforcement Learning with Greedy Policies	May 27, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
Near-optimal Optimistic Reinforcement Learning using Empirical Bernstein Inequalities	May 27, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Policy Search by Target Distribution Learning for Continuous Control	May 27, 2019	continuous-controlContinuous Control	—Unverified	0
SQIL: Imitation Learning via Reinforcement Learning with Sparse Rewards	May 27, 2019	Imitation LearningMuJoCo	CodeCode Available	1
Explainable Reinforcement Learning Through a Causal Lens	May 27, 2019	counterfactualreinforcement-learning	CodeCode Available	0
Learning to Discretize: Solving 1D Scalar Conservation Laws via Deep Reinforcement Learning	May 27, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Disentangling Dynamics and Returns: Value Function Decomposition with Future Prediction	May 27, 2019	continuous-controlContinuous Control	—Unverified	0
AgentGraph: Towards Universal Dialogue Management with Structured Deep Reinforcement Learning	May 27, 2019	Deep Reinforcement LearningDialogue Management	—Unverified	0
Interactive Differentiable Simulation	May 26, 2019	Model Predictive Controlparameter estimation	CodeCode Available	2
Selective Transfer with Reinforced Transfer Network for Partial Domain Adaptation	May 26, 2019	Domain AdaptationPartial Domain Adaptation	—Unverified	0
Variational Bayes: A report on approaches and applications	May 26, 2019	Bayesian InferenceContinual Learning	—Unverified	0
Prioritized Sequence Experience Replay	May 25, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
A Kernel Loss for Solving the Bellman Equation	May 25, 2019	Q-LearningReinforcement Learning	CodeCode Available	0
Transferable Cost-Aware Security Policy Implementation for Malware Detection Using Deep Reinforcement Learning	May 25, 2019	Deep Reinforcement LearningMalware Detection	—Unverified	0
Learning to Reason in Large Theories without Imitation	May 25, 2019	Automated Theorem ProvingDeep Reinforcement Learning	—Unverified	0
Adversarial Policies: Attacking Deep Reinforcement Learning	May 25, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Composing Task-Agnostic Policies with Deep Reinforcement Learning	May 25, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
Safe Reinforcement Learning with Nonlinear Dynamics via Model Predictive Shielding	May 25, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
RL4health: Crowdsourcing Reinforcement Learning for Knee Replacement Pathway Optimization	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
MQLV: Optimal Policy of Money Management in Retail Banking with Q-Learning	May 24, 2019	Decision MakingManagement	—Unverified	0
Exploration via Flow-Based Intrinsic Rewards	May 24, 2019	Atari GamesOptical Flow Estimation	CodeCode Available	0
InfoRL: Interpretable Reinforcement Learning using Information Maximization	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Dual Reinforcement Learning Framework for Unsupervised Text Style Transfer	May 24, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
A Micro-Objective Perspective of Reinforcement Learning	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning in Feature Space: Matrix Bandit, Kernels, and Regret Bound	May 24, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Symmetric Reward Noising for Reinforcement Learning	May 24, 2019	Autonomous DrivingQ-Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 250 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified