Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5801–5825 of 15113 papers

Title	Date	Tasks	Status
GitFL: Adaptive Asynchronous Federated Learning using Version Control	Nov 22, 2022	Federated LearningReinforcement Learning (RL)	—Unverified
Examining Policy Entropy of Reinforcement Learning Agents for Personalization Tasks	Nov 21, 2022	Q-Learningreinforcement-learning	CodeCode Available
Data-Driven Offline Decision-Making via Invariant Representation Learning	Nov 21, 2022	Decision MakingDomain Adaptation	—Unverified
Taming Reachability Analysis of DNN-Controlled Systems via Abstraction-Based Training	Nov 21, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
HARL: Hierarchical Adaptive Reinforcement Learning Based Auto Scheduler for Neural Networks	Nov 21, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Improving TD3-BC: Relaxed Policy Constraint for Offline Learning and Stable Online Fine-Tuning	Nov 21, 2022	Behavioural cloningReinforcement Learning (RL)	—Unverified
A Low Latency Adaptive Coding Spiking Framework for Deep Reinforcement Learning	Nov 21, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available
Learning Cooperative Oversubscription for Cloud by Chance-Constrained Multi-Agent Reinforcement Learning	Nov 21, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Improving Multimodal Interactive Agents with Reinforcement Learning from Human Feedback	Nov 21, 2022	Imitation Learningreinforcement-learning	—Unverified
PhysQ: A Physics Informed Reinforcement Learning Framework for Building Control	Nov 21, 2022	reinforcement-learningReinforcement Learning	—Unverified
Simultaneously Updating All Persistence Values in Reinforcement Learning	Nov 21, 2022	AllAtari Games	—Unverified
TinyQMIX: Distributed Access Control for mMTC via Multi-agent Reinforcement Learning	Nov 21, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
Model-based Trajectory Stitching for Improved Offline Reinforcement Learning	Nov 21, 2022	Behavioural cloningData Augmentation	—Unverified
SafeLight: A Reinforcement Learning Method toward Collision-free Traffic Signal Control	Nov 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Structure-Enhanced Deep Reinforcement Learning for Optimal Transmission Scheduling	Nov 20, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Safe Reinforcement Learning using Data-Driven Predictive Control	Nov 20, 2022	continuous-controlContinuous Control	—Unverified
Real-time Local Feature with Global Visual Information Enhancement	Nov 20, 2022	Computational EfficiencyDeep Reinforcement Learning	—Unverified
Efficient Representations of Object Geometry for Reinforcement Learning of Interactive Grasping Policies	Nov 20, 2022	Objectreinforcement-learning	—Unverified
Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep Inverse Reinforcement Learning	Nov 19, 2022	reinforcement-learningReinforcement Learning	—Unverified
Non-stationary Risk-sensitive Reinforcement Learning: Near-optimal Dynamic Regret, Adaptive Detection, and Separation Design	Nov 19, 2022	Reinforcement Learning (RL)	—Unverified
ReInform: Selecting paths with reinforcement learning for contextualized link prediction	Nov 19, 2022	Link PredictionPrediction	CodeCode Available
Provable Defense against Backdoor Policies in Reinforcement Learning	Nov 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Analysis of Reinforcement Learning Schemes for Trajectory Optimization of an Aerial Radio Unit	Nov 18, 2022	Q-Learningreinforcement-learning	—Unverified
GoSum: Extractive Summarization of Long Documents by Reinforcement Learning and Graph Organized discourse state	Nov 18, 2022	ArticlesDocument Summarization	CodeCode Available
Credit-cognisant reinforcement learning for multi-agent cooperation	Nov 18, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 233 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified