Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12001–12050 of 15113 papers

Title	Date	Tasks	Status
LIMIS: Locally Interpretable Modeling using Instance-wise Subsampling	Sep 26, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Harnessing Structures for Value-Based Planning and Reinforcement Learning	Sep 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Scaling data-driven robotics with reward sketching and batch reinforcement learning	Sep 26, 2019	reinforcement-learningReinforcement Learning	—Unverified
Visual Exploration and Energy-aware Path Planning via Reinforcement Learning	Sep 26, 2019	Autonomous Vehiclesobject-detection	CodeCode Available
CAQL: Continuous Action Q-Learning	Sep 26, 2019	continuous-controlContinuous Control	—Unverified
MERL: Multi-Head Reinforcement Learning	Sep 26, 2019	continuous-controlContinuous Control	—Unverified
Learning to Reach Goals Without Reinforcement Learning	Sep 25, 2019	Imitation Learningreinforcement-learning	—Unverified
City Metro Network Expansion with Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Generalizing Reinforcement Learning to Unseen Actions	Sep 25, 2019	Decision Makingreinforcement-learning	—Unverified
Assessing Generalization in TD methods for Deep Reinforcement Learning	Sep 25, 2019	Deep Reinforcement LearningMemorization	—Unverified
Adapt-to-Learn: Policy Transfer in Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
AUGMENTED POLICY GRADIENT METHODS FOR EFFICIENT REINFORCEMENT LEARNING	Sep 25, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
Learning by shaking: Computing policy gradients by physical forward-propagation	Sep 25, 2019	Model-based Reinforcement LearningReinforcement Learning (RL)	—Unverified
Collaborative Inter-agent Knowledge Distillation for Reinforcement Learning	Sep 25, 2019	Decision MakingKnowledge Distillation	—Unverified
Improving SAT Solver Heuristics with Graph Networks and Reinforcement Learning	Sep 25, 2019	Feature Engineeringreinforcement-learning	—Unverified
Counterfactual Regularization for Model-Based Reinforcement Learning	Sep 25, 2019	counterfactualmodel	—Unverified
Learning World Graph Decompositions To Accelerate Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
C-3PO: Cyclic-Three-Phase Optimization for Human-Robot Motion Retargeting based on Reinforcement Learning	Sep 25, 2019	Deep Reinforcement Learningmotion retargeting	CodeCode Available
Learning Key Steps to Attack Deep Reinforcement Learning Agents	Sep 25, 2019	Adversarial AttackAtari Games	—Unverified
CAPACITY-LIMITED REINFORCEMENT LEARNING: APPLICATIONS IN DEEP ACTOR-CRITIC METHODS FOR CONTINUOUS CONTROL	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Improving Exploration of Deep Reinforcement Learning using Planning for Policy Search	Sep 25, 2019	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Learning with Social Influence through Interior Policy Differentiation	Sep 25, 2019	Reinforcement Learning (RL)	—Unverified
Learning to Reason: Distilling Hierarchy via Self-Supervision and Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Consistent Meta-Reinforcement Learning via Model Identification and Experience Relabeling	Sep 25, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified
Learning Algorithmic Solutions to Symbolic Planning Tasks with a Neural Computer	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Data Valuation using Reinforcement Learning	Sep 25, 2019	Data ValuationDomain Adaptation	CodeCode Available
How many weights are enough : can tensor factorization learn efficient policies ?	Sep 25, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Efficient meta reinforcement learning via meta goal generation	Sep 25, 2019	Meta-LearningMeta Reinforcement Learning	—Unverified
Learning Temporal Abstraction with Information-theoretic Constraints for Hierarchical Reinforcement Learning	Sep 25, 2019	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Do recent advancements in model-based deep reinforcement learning really improve data efficiency?	Sep 25, 2019	Atari Games 100kDeep Reinforcement Learning	—Unverified
Learning Good Policies By Learning Good Perceptual Models	Sep 25, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Long-term planning, short-term adjustments	Sep 25, 2019	Deep Reinforcement LearningPrediction	—Unverified
Attention Privileged Reinforcement Learning for Domain Transfer	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
BANANAS: Bayesian Optimization with Neural Networks for Neural Architecture Search	Sep 25, 2019	Bayesian OptimizationNeural Architecture Search	—Unverified
Behavior-Guided Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep RL for Blood Glucose Control: Lessons, Challenges, and Opportunities	Sep 25, 2019	Reinforcement Learning (RL)	—Unverified
Advantage Weighted Regression: Simple and Scalable Off-Policy Reinforcement Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Hope For The Best But Prepare For The Worst: Cautious Adaptation In RL Agents	Sep 25, 2019	Domain AdaptationMeta Reinforcement Learning	—Unverified
Learning Functionally Decomposed Hierarchies for Continuous Navigation Tasks	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Event Discovery for History Representation in Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Avoiding Negative Side-Effects and Promoting Safe Exploration with Imaginative Planning	Sep 25, 2019	Reinforcement Learning (RL)Safe Exploration	—Unverified
DeepAGREL: Biologically plausible deep learning via direct reinforcement	Sep 25, 2019	Deep Learningimage-classification	—Unverified
Contextual Inverse Reinforcement Learning	Sep 25, 2019	reinforcement-learningReinforcement Learning	—Unverified
Evo-NAS: Evolutionary-Neural Hybrid Agent for Architecture Search	Sep 25, 2019	Deep Reinforcement LearningEvolutionary Algorithms	—Unverified
HIPPOCAMPAL NEURONAL REPRESENTATIONS IN CONTINUAL LEARNING	Sep 25, 2019	Continual LearningDeep Reinforcement Learning	—Unverified
CrossNorm: On Normalization for Off-Policy Reinforcement Learning	Sep 25, 2019	MuJoCoreinforcement-learning	—Unverified
Towards Simplicity in Deep Reinforcement Learning: Streamlined Off-Policy Learning	Sep 25, 2019	continuous-controlContinuous Control	—Unverified
Trajectory representation learning for Multi-Task NMRDPs planning	Sep 25, 2019	Reinforcement Learning (RL)Representation Learning	—Unverified
Risk Averse Value Expansion for Sample Efficient and Robust Policy Learning	Sep 25, 2019	Model-based Reinforcement LearningMuJoCo	—Unverified
Multi-task Batch Reinforcement Learning with Metric Learning	Sep 25, 2019	Meta Reinforcement LearningMetric Learning	—Unverified

Show:10 25 50

← PrevPage 241 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified