Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6801–6850 of 15113 papers

Title	Date	Tasks	Status	Hype
CLARA: A Constrained Reinforcement Learning Based Resource Allocation Framework for Network Slicing	Nov 16, 2021	Managementreinforcement-learning	—Unverified	0
Causal policy ranking	Nov 16, 2021	counterfactualCounterfactual Reasoning	—Unverified	0
CleanRL: High-quality Single-file Implementations of Deep Reinforcement Learning Algorithms	Nov 16, 2021	BenchmarkingDeep Reinforcement Learning	CodeCode Available	3
Reinforcement Learning with Feedback from Multiple Humans with Diverse Skills	Nov 16, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Route Optimization via Environment-Aware Deep Network and Reinforcement Learning	Nov 16, 2021	Decision Makingreinforcement-learning	—Unverified	0
On Effective Scheduling of Model-based Reinforcement Learning	Nov 16, 2021	continuous-controlContinuous Control	CodeCode Available	1
The Partially Observable History Process	Nov 15, 2021	Formreinforcement-learning	—Unverified	0
VisualEnv: visual Gym environments with Blender	Nov 15, 2021	OpenAI Gymreinforcement-learning	—Unverified	0
Modular Networks Prevent Catastrophic Interference in Model-Based Multi-Task Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
ModelLight: Model-Based Meta-Reinforcement Learning for Traffic Signal Control	Nov 15, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Common Language for Goal-Oriented Semantic Communications: A Curriculum Learning Framework	Nov 15, 2021	Reinforcement Learning (RL)	—Unverified	0
AutoGMap: Learning to Map Large-scale Sparse Graphs on Memristive Crossbars	Nov 15, 2021	CPUDecision Making	CodeCode Available	0
Learning to Execute: Efficient Learning of Universal Plan-Conditioned Policies in Robotics	Nov 15, 2021	Learning to ExecuteReinforcement Learning (RL)	CodeCode Available	0
Optimism and Delays in Episodic Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Adversarial Skill Chaining for Long-Horizon Robot Manipulation via Terminal State Regularization	Nov 15, 2021	Reinforcement Learning (RL)Robot Manipulation	—Unverified	0
Joint Synthesis of Safety Certificate and Safe Control Policy using Constrained Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning of Self Enhancing Camera Image and Signal Processing	Nov 15, 2021	BlockingData Augmentation	CodeCode Available	0
Versatile Inverse Reinforcement Learning via Cumulative Rewards	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Intelligent Trading Systems: A Sentiment-Aware Reinforcement Learning Approach	Nov 14, 2021	Algorithmic TradingGeneral Reinforcement Learning	CodeCode Available	1
Free Will Belief as a consequence of Model-based Reinforcement Learning	Nov 14, 2021	Common Sense ReasoningDecision Making	—Unverified	0
Explicit Explore, Exploit, or Escape (E^4): near-optimal safety-constrained reinforcement learning in polynomial time	Nov 14, 2021	Reinforcement Learning (RL)	—Unverified	0
Relative Distributed Formation and Obstacle Avoidance with Multi-agent Reinforcement Learning	Nov 14, 2021	Model Predictive ControlMulti-agent Reinforcement Learning	—Unverified	0
Obstacle Avoidance for UAS in Continuous Action Space Using Deep Reinforcement Learning	Nov 13, 2021	continuous-controlContinuous Control	—Unverified	0
Where to Look: A Unified Attention Model for Visual Recognition with Reinforcement Learning	Nov 13, 2021	Q-LearningReinforcement Learning (RL)	—Unverified	0
Robust Deep Reinforcement Learning for Extractive Legal Summarization	Nov 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning with Shallow Controllers: An Experimental Application to PID Tuning	Nov 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Improving Experience Replay through Modeling of Similar Transitions' Sets	Nov 12, 2021	Atari Gamesreinforcement-learning	CodeCode Available	0
AWD3: Dynamic Reduction of the Estimation Bias	Nov 12, 2021	continuous-controlContinuous Control	—Unverified	0
Cooperative multi-agent reinforcement learning for high-dimensional nonequilibrium control	Nov 12, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
DriverGym: Democratising Reinforcement Learning for Autonomous Driving	Nov 12, 2021	Autonomous DrivingOpenAI Gym	—Unverified	0
Causal Multi-Agent Reinforcement Learning: Review and Open Problems	Nov 12, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
RLOps: Development Life-cycle of Reinforcement Learning Aided Open RAN	Nov 12, 2021	Managementreinforcement-learning	—Unverified	0
Two steps to risk sensitivity	Nov 12, 2021	Decision MakingDistributional Reinforcement Learning	CodeCode Available	0
Collaboration Promotes Group Resilience in Multi-Agent AI	Nov 12, 2021	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Resilient Consensus-based Multi-agent Reinforcement Learning with Function Approximation	Nov 12, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
User Allocation in Mobile Edge Computing: A Deep Reinforcement Learning Approach	Nov 11, 2021	CPUDeep Reinforcement Learning	CodeCode Available	1
Multi-agent Reinforcement Learning for Cooperative Lane Changing of Connected and Autonomous Vehicles in Mixed Traffic	Nov 11, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Model-Based Reinforcement Learning via Stochastic Hybrid Models	Nov 11, 2021	Imitation Learningmodel	—Unverified	0
Adapting Surprise Minimizing Reinforcement Learning Techniques for Transactive Control	Nov 11, 2021	Navigatereinforcement-learning	—Unverified	0
CubeTR: Learning to Solve The Rubiks Cube Using Transformers	Nov 11, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Agent Spaces	Nov 11, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Distilling Motion Planner Augmented Policies into Visual Control Policies for Robot Manipulation	Nov 11, 2021	Imitation LearningMotion Planning	CodeCode Available	1
Towards Robust Knowledge Graph Embedding via Multi-task Reinforcement Learning	Nov 11, 2021	Graph EmbeddingKnowledge Graph Embedding	—Unverified	0
On the Use and Misuse of Absorbing States in Multi-agent Reinforcement Learning	Nov 10, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	3
Spatially and Seamlessly Hierarchical Reinforcement Learning for State Space and Policy space in Autonomous Driving	Nov 10, 2021	Autonomous DrivingHierarchical Reinforcement Learning	—Unverified	0
PowerGridworld: A Framework for Multi-Agent Reinforcement Learning in Power Systems	Nov 10, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Look Before You Leap: Safe Model-Based Reinforcement Learning with Human Intervention	Nov 10, 2021	BlockingDecision Making	—Unverified	0
DeCOM: Decomposed Policy for Constrained Cooperative Multi-Agent Reinforcement Learning	Nov 10, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Dealing with the Unknown: Pessimistic Offline Reinforcement Learning	Nov 9, 2021	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 137 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified