Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1901–1950 of 15113 papers

Title	Date	Tasks	Status	Hype
Robot Perception enables Complex Navigation Behavior via Self-Supervised Learning	Jun 16, 2020	Reinforcement Learning (RL)Self-Supervised Learning	CodeCode Available	1
Agent Modelling under Partial Observability for Deep Reinforcement Learning	Jun 16, 2020	DecoderDeep Reinforcement Learning	CodeCode Available	1
Model-based Adversarial Meta-Reinforcement Learning	Jun 16, 2020	continuous-controlContinuous Control	CodeCode Available	1
AWAC: Accelerating Online Reinforcement Learning with Offline Datasets	Jun 16, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Analytic Manifold Learning: Unifying and Evaluating Representations for Continuous Control	Jun 15, 2020	continuous-controlContinuous Control	CodeCode Available	1
Pipeline PSRO: A Scalable Approach for Finding Approximate Nash Equilibria in Large Games	Jun 15, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
MetaCURE: Meta Reinforcement Learning with Empowerment-Driven Exploration	Jun 15, 2020	Efficient ExplorationMeta Reinforcement Learning	CodeCode Available	1
Efficient Model-Based Reinforcement Learning through Optimistic Policy Search and Planning	Jun 15, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Benchmarking Multi-Agent Deep Reinforcement Learning Algorithms in Cooperative Tasks	Jun 14, 2020	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
Shared Experience Actor-Critic for Multi-Agent Reinforcement Learning	Jun 12, 2020	Efficient ExplorationMulti-agent Reinforcement Learning	CodeCode Available	1
SAMBA: Safe Model-Based & Active Reinforcement Learning	Jun 12, 2020	modelReinforcement Learning	CodeCode Available	1
TorsionNet: A Reinforcement Learning Approach to Sequential Conformer Search	Jun 12, 2020	Computational chemistryreinforcement-learning	CodeCode Available	1
Closed Loop Neural-Symbolic Learning via Integrating Neural Perception, Grammar Parsing, and Symbolic Reasoning	Jun 11, 2020	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
Modelling Hierarchical Structure between Dialogue Policy and Natural Language Generator with Option Framework for Task-oriented Dialogue System	Jun 11, 2020	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning to Incentivize Other Learning Agents	Jun 10, 2020	General Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Robust Spammer Detection by Nash Reinforcement Learning	Jun 10, 2020	Fraud Detectionreinforcement-learning	CodeCode Available	1
What Matters In On-Policy Reinforcement Learning? A Large-Scale Empirical Study	Jun 10, 2020	Attributecontinuous-control	CodeCode Available	1
Constrained episodic reinforcement learning in concave-convex and knapsack settings	Jun 9, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reinforcement Learning Under Moral Uncertainty	Jun 8, 2020	Autonomous VehiclesBIG-bench Machine Learning	CodeCode Available	1
Learning to Play No-Press Diplomacy with Best Response Policy Iteration	Jun 8, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Conservative Q-Learning for Offline Reinforcement Learning	Jun 8, 2020	continuous-controlContinuous Control	CodeCode Available	1
Randomized Entity-wise Factorization for Multi-Agent Reinforcement Learning	Jun 7, 2020	counterfactualMulti-agent Reinforcement Learning	CodeCode Available	1
Reinforcement Learning for Multi-Product Multi-Node Inventory Management in Supply Chains	Jun 7, 2020	Decision MakingHierarchical Reinforcement Learning	CodeCode Available	1
Proximal Gradient Temporal Difference Learning: Stable Reinforcement Learning with Polynomial Sample Complexity	Jun 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Deployment-Efficient Reinforcement Learning via Model-Based Offline Optimization	Jun 5, 2020	Offline RLreinforcement-learning	CodeCode Available	1
Solving Hard AI Planning Instances Using Curriculum-Driven Deep Reinforcement Learning	Jun 4, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Single-step deep reinforcement learning for open-loop control of laminar and turbulent flows	Jun 4, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Interferobot: aligning an optical interferometer by a reinforcement learning agent	Jun 3, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Combining Reinforcement Learning and Constraint Programming for Combinatorial Optimization	Jun 2, 2020	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Encoding formulas as deep networks: Reinforcement learning for zero-shot execution of LTL formulas	Jun 1, 2020	MinecraftMulti-Task Learning	CodeCode Available	1
Acme: A Research Framework for Distributed Reinforcement Learning	Jun 1, 2020	Deep Reinforcement LearningDQN Replay Dataset	CodeCode Available	1
Invariant Policy Optimization: Towards Stronger Generalization in Reinforcement Learning	Jun 1, 2020	Policy Gradient Methodsreinforcement-learning	CodeCode Available	1
PlanGAN: Model-based Planning With Sparse Rewards and Multiple Goals	Jun 1, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Sim2Real for Peg-Hole Insertion with Eye-in-Hand Camera	May 29, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Reinforcement learning for real autonomous mobile robot navigation in indoor environments	May 28, 2020	continuous-controlContinuous Control	CodeCode Available	1
Predicting Goal-directed Human Attention Using Inverse Reinforcement Learning	May 28, 2020	Objectreinforcement-learning	CodeCode Available	1
MOPO: Model-based Offline Policy Optimization	May 27, 2020	continuous-controlContinuous Control	CodeCode Available	1
Modeling Penetration Testing with Reinforcement Learning Using Capture-the-Flag Challenges: Trade-offs between Model-free Learning and A Priori Knowledge	May 26, 2020	Q-Learningreinforcement-learning	CodeCode Available	1
Implementation Matters in Deep Policy Gradients: A Case Study on PPO and TRPO	May 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Decentralized Deep Reinforcement Learning for a Distributed and Adaptive Locomotion Controller of a Hexapod Robot	May 21, 2020	continuous-controlContinuous Control	CodeCode Available	1
Mirror Descent Policy Optimization	May 20, 2020	continuous-controlContinuous Control	CodeCode Available	1
Ultrasound Video Summarization using Deep Reinforcement Learning	May 19, 2020	Deep Reinforcement LearningDiagnostic	CodeCode Available	1
Lifelong Control of Off-grid Microgrid with Model Based Reinforcement Learning	May 16, 2020	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Context-aware Dynamics Model for Generalization in Model-Based Reinforcement Learning	May 14, 2020	modelModel-based Reinforcement Learning	CodeCode Available	1
Training spiking neural networks using reinforcement learning	May 12, 2020	Decision Makingreinforcement-learning	CodeCode Available	1
Planning to Explore via Self-Supervised World Models	May 12, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
MOReL : Model-Based Offline Reinforcement Learning	May 12, 2020	modelOffline RL	CodeCode Available	1
Delay-Aware Model-Based Reinforcement Learning for Continuous Control	May 11, 2020	continuous-controlContinuous Control	CodeCode Available	1
Delay-Aware Multi-Agent Reinforcement Learning for Cooperative and Competitive Environments	May 11, 2020	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	1
Mobile Robot Path Planning in Dynamic Environments through Globally Guided Reinforcement Learning	May 11, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 39 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified