Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7851–7875 of 15113 papers

Title	Date	Tasks	Status
CLARA: A Constrained Reinforcement Learning Based Resource Allocation Framework for Network Slicing	Nov 16, 2021	Managementreinforcement-learning	—Unverified
Deep Reinforcement Learning for Entity Alignment	Nov 16, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
AutoGMap: Learning to Map Large-scale Sparse Graphs on Memristive Crossbars	Nov 15, 2021	CPUDecision Making	CodeCode Available
Learning to Execute: Efficient Learning of Universal Plan-Conditioned Policies in Robotics	Nov 15, 2021	Learning to ExecuteReinforcement Learning (RL)	CodeCode Available
Joint Synthesis of Safety Certificate and Safe Control Policy using Constrained Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Adversarial Skill Chaining for Long-Horizon Robot Manipulation via Terminal State Regularization	Nov 15, 2021	Reinforcement Learning (RL)Robot Manipulation	—Unverified
Exploiting Action Impact Regularity and Exogenous State Variables for Offline Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Optimism and Delays in Episodic Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Common Language for Goal-Oriented Semantic Communications: A Curriculum Learning Framework	Nov 15, 2021	Reinforcement Learning (RL)	—Unverified
ModelLight: Model-Based Meta-Reinforcement Learning for Traffic Signal Control	Nov 15, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Reinforcement Learning of Self Enhancing Camera Image and Signal Processing	Nov 15, 2021	BlockingData Augmentation	CodeCode Available
Modular Networks Prevent Catastrophic Interference in Model-Based Multi-Task Reinforcement Learning	Nov 15, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
VisualEnv: visual Gym environments with Blender	Nov 15, 2021	OpenAI Gymreinforcement-learning	—Unverified
The Partially Observable History Process	Nov 15, 2021	Formreinforcement-learning	—Unverified
Versatile Inverse Reinforcement Learning via Cumulative Rewards	Nov 15, 2021	reinforcement-learningReinforcement Learning	—Unverified
Relative Distributed Formation and Obstacle Avoidance with Multi-agent Reinforcement Learning	Nov 14, 2021	Model Predictive ControlMulti-agent Reinforcement Learning	—Unverified
Explicit Explore, Exploit, or Escape (E^4): near-optimal safety-constrained reinforcement learning in polynomial time	Nov 14, 2021	Reinforcement Learning (RL)	—Unverified
Free Will Belief as a consequence of Model-based Reinforcement Learning	Nov 14, 2021	Common Sense ReasoningDecision Making	—Unverified
Deep Reinforcement Learning with Shallow Controllers: An Experimental Application to PID Tuning	Nov 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Where to Look: A Unified Attention Model for Visual Recognition with Reinforcement Learning	Nov 13, 2021	Q-LearningReinforcement Learning (RL)	—Unverified
Robust Deep Reinforcement Learning for Extractive Legal Summarization	Nov 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Obstacle Avoidance for UAS in Continuous Action Space Using Deep Reinforcement Learning	Nov 13, 2021	continuous-controlContinuous Control	—Unverified
RLOps: Development Life-cycle of Reinforcement Learning Aided Open RAN	Nov 12, 2021	Managementreinforcement-learning	—Unverified
Collaboration Promotes Group Resilience in Multi-Agent AI	Nov 12, 2021	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Two steps to risk sensitivity	Nov 12, 2021	Decision MakingDistributional Reinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 315 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified