Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5801–5850 of 15113 papers

Title	Date	Tasks	Status
GitFL: Adaptive Asynchronous Federated Learning using Version Control	Nov 22, 2022	Federated LearningReinforcement Learning (RL)	—Unverified
Examining Policy Entropy of Reinforcement Learning Agents for Personalization Tasks	Nov 21, 2022	Q-Learningreinforcement-learning	CodeCode Available
Data-Driven Offline Decision-Making via Invariant Representation Learning	Nov 21, 2022	Decision MakingDomain Adaptation	—Unverified
Taming Reachability Analysis of DNN-Controlled Systems via Abstraction-Based Training	Nov 21, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
HARL: Hierarchical Adaptive Reinforcement Learning Based Auto Scheduler for Neural Networks	Nov 21, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Improving TD3-BC: Relaxed Policy Constraint for Offline Learning and Stable Online Fine-Tuning	Nov 21, 2022	Behavioural cloningReinforcement Learning (RL)	—Unverified
A Low Latency Adaptive Coding Spiking Framework for Deep Reinforcement Learning	Nov 21, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available
Learning Cooperative Oversubscription for Cloud by Chance-Constrained Multi-Agent Reinforcement Learning	Nov 21, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Improving Multimodal Interactive Agents with Reinforcement Learning from Human Feedback	Nov 21, 2022	Imitation Learningreinforcement-learning	—Unverified
PhysQ: A Physics Informed Reinforcement Learning Framework for Building Control	Nov 21, 2022	reinforcement-learningReinforcement Learning	—Unverified
Simultaneously Updating All Persistence Values in Reinforcement Learning	Nov 21, 2022	AllAtari Games	—Unverified
TinyQMIX: Distributed Access Control for mMTC via Multi-agent Reinforcement Learning	Nov 21, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
Model-based Trajectory Stitching for Improved Offline Reinforcement Learning	Nov 21, 2022	Behavioural cloningData Augmentation	—Unverified
SafeLight: A Reinforcement Learning Method toward Collision-free Traffic Signal Control	Nov 20, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Structure-Enhanced Deep Reinforcement Learning for Optimal Transmission Scheduling	Nov 20, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Safe Reinforcement Learning using Data-Driven Predictive Control	Nov 20, 2022	continuous-controlContinuous Control	—Unverified
Real-time Local Feature with Global Visual Information Enhancement	Nov 20, 2022	Computational EfficiencyDeep Reinforcement Learning	—Unverified
Efficient Representations of Object Geometry for Reinforcement Learning of Interactive Grasping Policies	Nov 20, 2022	Objectreinforcement-learning	—Unverified
Evaluating the Perceived Safety of Urban City via Maximum Entropy Deep Inverse Reinforcement Learning	Nov 19, 2022	reinforcement-learningReinforcement Learning	—Unverified
Non-stationary Risk-sensitive Reinforcement Learning: Near-optimal Dynamic Regret, Adaptive Detection, and Separation Design	Nov 19, 2022	Reinforcement Learning (RL)	—Unverified
ReInform: Selecting paths with reinforcement learning for contextualized link prediction	Nov 19, 2022	Link PredictionPrediction	CodeCode Available
Provable Defense against Backdoor Policies in Reinforcement Learning	Nov 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available
Analysis of Reinforcement Learning Schemes for Trajectory Optimization of an Aerial Radio Unit	Nov 18, 2022	Q-Learningreinforcement-learning	—Unverified
GoSum: Extractive Summarization of Long Documents by Reinforcement Learning and Graph Organized discourse state	Nov 18, 2022	ArticlesDocument Summarization	CodeCode Available
Credit-cognisant reinforcement learning for multi-agent cooperation	Nov 18, 2022	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Learning to Communicate with Intent: An Introduction	Nov 17, 2022	Reinforcement Learning (RL)	—Unverified
A Reinforcement Learning Approach for Process Parameter Optimization in Additive Manufacturing	Nov 17, 2022	Q-Learningreinforcement-learning	—Unverified
DexPoint: Generalizable Point Cloud Reinforcement Learning for Sim-to-Real Dexterous Manipulation	Nov 17, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
AlphaSnake: Policy Iteration on a Nondeterministic NP-hard Markov Decision Process	Nov 17, 2022	reinforcement-learningReinforcement Learning	—Unverified
Planning Irregular Object Packing via Hierarchical Reinforcement Learning	Nov 17, 2022	Hierarchical Reinforcement LearningObject	—Unverified
Solar Power driven EV Charging Optimization with Deep Reinforcement Learning	Nov 17, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reward Gaming in Conditional Text Generation	Nov 16, 2022	Conditional Text GenerationReinforcement Learning (RL)	—Unverified
Model Based Residual Policy Learning with Applications to Antenna Control	Nov 16, 2022	Reinforcement Learning (RL)	—Unverified
Minimum information divergence of Q-functions for dynamic treatment resumes	Nov 16, 2022	reinforcement-learningReinforcement Learning	—Unverified
Addressing the issue of stochastic environments and local decision-making in multi-objective reinforcement learning	Nov 16, 2022	Decision MakingMulti-Objective Reinforcement Learning	—Unverified
Data-pooling Reinforcement Learning for Personalized Healthcare Intervention	Nov 16, 2022	Decision MakingManagement	—Unverified
General Intelligence Requires Rethinking Exploration	Nov 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Explainable Action Advising for Multi-Agent Reinforcement Learning	Nov 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Agent-State Construction with Auxiliary Inputs	Nov 15, 2022	Decision Makingreinforcement-learning	CodeCode Available
Contextual Transformer for Offline Meta Reinforcement Learning	Nov 15, 2022	D4RLMeta Reinforcement Learning	—Unverified
APT: Adaptive Perceptual quality based camera Tuning using reinforcement learning	Nov 15, 2022	object-detectionObject Detection	—Unverified
Universal Distributional Decision-based Black-box Adversarial Attack with Reinforcement Learning	Nov 15, 2022	Adversarial Attackreinforcement-learning	—Unverified
Reinforcement Learning Methods for Wordle: A POMDP/Adaptive Control Approach	Nov 15, 2022	reinforcement-learningReinforcement Learning	—Unverified
Offline Reinforcement Learning with Adaptive Behavior Regularization	Nov 15, 2022	D4RLOffline RL	—Unverified
Reinforcement Learning Based Resource Allocation for Network Slices in O-RAN Midhaul	Nov 14, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
(When) Are Contrastive Explanations of Reinforcement Learning Helpful?	Nov 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Parallel Automatic History Matching Algorithm Using Reinforcement Learning	Nov 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
NeurIPS 2022 Competition: Driving SMARTS	Nov 14, 2022	Autonomous DrivingReinforcement Learning (RL)	—Unverified
Linear Reinforcement Learning with Ball Structure Action Space	Nov 14, 2022	reinforcement-learningReinforcement Learning	—Unverified
Hierarchically Structured Task-Agnostic Continual Learning	Nov 14, 2022	Continual Learningreinforcement-learning	CodeCode Available

Show:10 25 50

← PrevPage 117 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified