Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8351–8400 of 15113 papers

Title	Date	Tasks	Status	Hype
Network Defense is Not a Game	Apr 20, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Prospective Artificial Intelligence Approaches for Active Cyber Defence	Apr 20, 2021	Causal InferencePosition	—Unverified	0
Visual Navigation with Spatial Attention	Apr 20, 2021	NavigateObject	CodeCode Available	1
GLiDE: Generalizable Quadrupedal Locomotion in Diverse Environments with a Centroidal Model	Apr 20, 2021	Model Predictive ControlReinforcement Learning (RL)	—Unverified	0
Adaptive learning for financial markets mixing model-based and model-free RL for volatility targeting	Apr 19, 2021	Deep Reinforcement Learningmodel	—Unverified	0
Deep Reinforcement Learning in a Monetary Model	Apr 19, 2021	Deep Reinforcement Learningmodel	—Unverified	0
Singular Perturbation-based Reinforcement Learning of Two-Point Boundary Optimal Control Systems	Apr 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Training Value-Aligned Reinforcement Learning Agents Using a Normative Prior	Apr 19, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement learning for linear-convex models with jumps via stability analysis of feedback controls	Apr 19, 2021	Reinforcement Learning (RL)	—Unverified	0
Probabilistic Mixture-of-Experts for Efficient Deep Reinforcement Learning	Apr 19, 2021	Deep Reinforcement LearningMixture-of-Experts	CodeCode Available	0
Agent-Centric Representations for Multi-Agent Reinforcement Learning	Apr 19, 2021	Inductive BiasMulti-agent Reinforcement Learning	—Unverified	0
Constraints Satisfiability Driven Reinforcement Learning for Autonomous Cyber Defense	Apr 19, 2021	Decision Makingreinforcement-learning	—Unverified	0
Approximated Multi-Agent Fitted Q Iteration	Apr 19, 2021	Decision Makingreinforcement-learning	—Unverified	0
Keyphrase Generation with Fine-Grained Evaluation-Guided Reinforcement Learning	Apr 18, 2021	Keyphrase Generationreinforcement-learning	CodeCode Available	1
Quick Learner Automated Vehicle Adapting its Roadmanship to Varying Traffic Cultures with Meta Reinforcement Learning	Apr 18, 2021	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified	0
Reinforcement learning based process optimization and strategy development in conventional tunneling	Apr 17, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Action Advising with Advice Imitation in Deep Reinforcement Learning	Apr 17, 2021	Atari GamesBehavioural cloning	CodeCode Available	0
Learning on a Budget via Teacher Imitation	Apr 17, 2021	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Language Models are Few-Shot Butlers	Apr 16, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Safe Exploration in Model-based Reinforcement Learning using Control Barrier Functions	Apr 16, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Towards Standardising Reinforcement Learning Approaches for Production Scheduling Problems	Apr 16, 2021	Benchmarkingreinforcement-learning	CodeCode Available	1
MT-Opt: Continuous Multi-Task Robotic Reinforcement Learning at Scale	Apr 16, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Predictor-Corrector(PC) Temporal Difference(TD) Learning (PCTD)	Apr 15, 2021	Reinforcement Learning (RL)	—Unverified	0
Actionable Models: Unsupervised Offline Reinforcement Learning of Robotic Skills	Apr 15, 2021	Q-Learningreinforcement-learning	—Unverified	0
An L^2 Analysis of Reinforcement Learning in High Dimensions with Kernel and Neural Network Approximation	Apr 15, 2021	Reinforcement Learning (RL)	—Unverified	0
Generalising Discrete Action Spaces with Conditional Action Trees	Apr 15, 2021	Decision Makingreinforcement-learning	CodeCode Available	1
Discover the Hidden Attack Path in Multi-domain Cyberspace Based on Reinforcement Learning	Apr 15, 2021	Reinforcement Learning (RL)	—Unverified	0
Joint Attention for Multi-Agent Coordination and Social Learning	Apr 15, 2021	Deep Reinforcement LearningInductive Bias	—Unverified	0
Multi-Agent Reinforcement Learning Based Coded Computation for Mobile Ad Hoc Computing	Apr 15, 2021	Distributed ComputingMulti-agent Reinforcement Learning	—Unverified	0
Rule-Based Reinforcement Learning for Efficient Robot Navigation with Space Reduction	Apr 15, 2021	Navigatereinforcement-learning	—Unverified	0
Quantum Architecture Search via Deep Reinforcement Learning	Apr 15, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
GridToPix: Training Embodied Agents with Minimal Supervision	Apr 14, 2021	Deep Reinforcement LearningPointGoal Navigation	—Unverified	0
A Novel Approach to Curiosity and Explainable Reinforcement Learning via Interpretable Sub-Goals	Apr 14, 2021	Generative Adversarial Networkreinforcement-learning	CodeCode Available	0
Decomposed Soft Actor-Critic Method for Cooperative Multi-Agent Reinforcement Learning	Apr 14, 2021	counterfactualDeep Reinforcement Learning	CodeCode Available	1
GAN-Based Interactive Reinforcement Learning from Demonstration and Human Evaluative Feedback	Apr 14, 2021	Deep Reinforcement LearningImitation Learning	—Unverified	0
Safe Continuous Control with Constrained Model-Based Policy Optimization	Apr 14, 2021	continuous-controlContinuous Control	CodeCode Available	0
Visual Comfort Aware-Reinforcement Learning for Depth Adjustment of Stereoscopic 3D Images	Apr 14, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Reinforcement learning for Admission Control in 5G Wireless Networks	Apr 13, 2021	Blockingreinforcement-learning	—Unverified	0
Optimizing the Long-Term Average Reward for Continuing MDPs: A Technical Report	Apr 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Podracer architectures for scalable Reinforcement Learning	Apr 13, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reward Shaping with Subgoals for Social Navigation	Apr 13, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Subgoal-based Reward Shaping to Improve Efficiency in Reinforcement Learning	Apr 13, 2021	AI Agentreinforcement-learning	—Unverified	0
Online and Offline Reinforcement Learning by Planning with a Learned Model	Apr 13, 2021	Atari GamesContinuous Control	CodeCode Available	1
Data-Driven Reinforcement Learning for Virtual Character Animation Control	Apr 13, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Bi-level Off-policy Reinforcement Learning for Volt/VAR Control Involving Continuous and Discrete Devices	Apr 13, 2021	Reinforcement Learning (RL)	—Unverified	0
Reward Shaping with Dynamic Trajectory Aggregation	Apr 13, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Two-stage training algorithm for AI robot soccer	Apr 13, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Survey on reinforcement learning for language processing	Apr 12, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Dynamic Matching Markets in Power Grid: Concepts and Solution using Deep Reinforcement Learning	Apr 12, 2021	Deep Reinforcement LearningDiversity	—Unverified	0
A coevolutionary approach to deep multi-agent reinforcement learning	Apr 12, 2021	Atari GamesDecision Making	CodeCode Available	1

Show:10 25 50

← PrevPage 168 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified