Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11851–11900 of 15113 papers

Title	Date	Tasks	Status
Sparse Skill Coding: Learning Behavioral Hierarchies with Sparse Codes	Sep 25, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Pre-training as Batch Meta Reinforcement Learning with tiMe	Sep 25, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified
Sequence-level Intrinsic Exploration Model for Partially Observable Domains	Sep 25, 2019	Predictionreinforcement-learning	—Unverified
Model-free Learning Control of Nonlinear Stochastic Systems with Stability Guarantee	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Counterfactual Regularization for Model-Based Reinforcement Learning	Sep 25, 2019	counterfactualmodel	—Unverified
Deep RL for Blood Glucose Control: Lessons, Challenges, and Opportunities	Sep 25, 2019	Reinforcement Learning (RL)	—Unverified
BANANAS: Bayesian Optimization with Neural Networks for Neural Architecture Search	Sep 25, 2019	Bayesian OptimizationNeural Architecture Search	—Unverified
Efficient meta reinforcement learning via meta goal generation	Sep 25, 2019	Meta-LearningMeta Reinforcement Learning	—Unverified
Learning to Reason: Distilling Hierarchy via Self-Supervision and Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Advantage Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
HIPPOCAMPAL NEURONAL REPRESENTATIONS IN CONTINUAL LEARNING	Sep 25, 2019	Continual LearningDeep Reinforcement Learning	—Unverified
Collaborative Inter-agent Knowledge Distillation for Reinforcement Learning	Sep 25, 2019	Decision MakingKnowledge Distillation	—Unverified
DeepAGREL: Biologically plausible deep learning via direct reinforcement	Sep 25, 2019	Deep Learningimage-classification	—Unverified
Improving SAT Solver Heuristics with Graph Networks and Reinforcement Learning	Sep 25, 2019	Feature Engineeringreinforcement-learning	—Unverified
Assessing Generalization in TD methods for Deep Reinforcement Learning	Sep 25, 2019	Deep Reinforcement LearningMemorization	—Unverified
Behavior-Guided Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning Key Steps to Attack Deep Reinforcement Learning Agents	Sep 25, 2019	Adversarial AttackAtari Games	—Unverified
Learning by shaking: Computing policy gradients by physical forward-propagation	Sep 25, 2019	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Contextual Inverse Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adapt-to-Learn: Policy Transfer in Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning Algorithmic Solutions to Symbolic Planning Tasks with a Neural Computer	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Attention Privileged Reinforcement Learning for Domain Transfer	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
CAPACITY-LIMITED REINFORCEMENT LEARNING: APPLICATIONS IN DEEP ACTOR-CRITIC METHODS FOR CONTINUOUS CONTROL	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
Consistent Meta-Reinforcement Learning via Model Identification and Experience Relabeling	Sep 25, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified
How many weights are enough : can tensor factorization learn efficient policies ?	Sep 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improving Exploration of Deep Reinforcement Learning using Planning for Policy Search	Sep 25, 2019	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Do recent advancements in model-based deep reinforcement learning really improve data efficiency?	Sep 25, 2019	Atari Games 100kDeep Reinforcement Learning	—Unverified
CrossNorm: On Normalization for Off-Policy Reinforcement Learning	Sep 25, 2019	MuJoCoreinforcement-learning	—Unverified
Learning Good Policies By Learning Good Perceptual Models	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Generalizing Reinforcement Learning to Unseen Actions	Sep 25, 2019	Decision Makingreinforcement-learning	—Unverified
Learning Functionally Decomposed Hierarchies for Continuous Navigation Tasks	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Evo-NAS: Evolutionary-Neural Hybrid Agent for Architecture Search	Sep 25, 2019	Deep Reinforcement LearningEvolutionary Algorithms	—Unverified
Learning Temporal Abstraction with Information-theoretic Constraints for Hierarchical Reinforcement Learning	Sep 25, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
City Metro Network Expansion with Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning to Reach Goals Without Reinforcement Learning	Sep 25, 2019	Imitation Learningreinforcement-learning	—Unverified
Hope For The Best But Prepare For The Worst: Cautious Adaptation In RL Agents	Sep 25, 2019	Domain AdaptationMeta Reinforcement Learning	—Unverified
Learning World Graph Decompositions To Accelerate Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning with Social Influence through Interior Policy Differentiation	Sep 25, 2019	Reinforcement Learning (RL)	—Unverified
Event Discovery for History Representation in Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Avoiding Negative Side-Effects and Promoting Safe Exploration with Imaginative Planning	Sep 25, 2019	Reinforcement Learning (RL)Safe Exploration	—Unverified
Towards Simplicity in Deep Reinforcement Learning: Streamlined Off-Policy Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Robust Domain Randomization for Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Multi-step Greedy Policies in Model-Free Deep Reinforcement Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Trajectory representation learning for Multi-Task NMRDPs planning	Sep 25, 2019	Reinforcement Learning (RL)Representation Learning	—Unverified
Policy Tree Network	Sep 25, 2019	Model-based Reinforcement LearningMuJoCo	—Unverified
Training a Constrained Natural Media Painting Agent using Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
S2VG: Soft Stochastic Value Gradient method	Sep 25, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Subjective Reinforcement Learning for Open Complex Environments	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Mint: Matrix-Interleaving for Multi-Task Learning	Sep 25, 2019	Multi-Task Learningreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 238 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified