Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4851–4900 of 15113 papers

Title	Date	Tasks	Status	Hype
An information-theoretic perspective on intrinsic motivation in reinforcement learning: a survey	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Evolutionary Deep Reinforcement Learning Using Elite Buffer: A Novel Approach Towards DRL Combined with EA in Continuous Control Tasks	Sep 18, 2022	continuous-controlContinuous Control	—Unverified	0
Multi-level Explanation of Deep Reinforcement Learning-based Scheduling	Sep 18, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Offline Reinforcement Learning with Instrumental Variables in Confounded Markov Decision Processes	Sep 18, 2022	Offline RLreinforcement-learning	—Unverified	0
Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One Objective	Sep 18, 2022	Reinforcement Learning (RL)Value prediction	—Unverified	0
Honor of Kings Arena: an Environment for Generalization in Competitive Reinforcement Learning	Sep 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	2
Intrinsically Motivated Reinforcement Learning based Recommendation with Counterfactual Data Augmentation	Sep 17, 2022	counterfactualData Augmentation	—Unverified	0
A Robust and Constrained Multi-Agent Reinforcement Learning Electric Vehicle Rebalancing Method in AMoD Systems	Sep 17, 2022	FairnessMulti-agent Reinforcement Learning	—Unverified	0
MA2QL: A Minimalist Approach to Fully Decentralized Multi-Agent Reinforcement Learning	Sep 17, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Selective Token Generation for Few-shot Natural Language Generation	Sep 17, 2022	Data-to-Text GenerationLanguage Modeling	CodeCode Available	0
Sample-Efficient Multi-Agent Reinforcement Learning with Demonstrations for Flocking Control	Sep 17, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Sub-optimal Policy Aided Multi-Agent Reinforcement Learning for Flocking Control	Sep 17, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Toward Safe and Accelerated Deep Reinforcement Learning for Next-Generation Wireless Networks	Sep 16, 2022	Deep Reinforcement LearningManagement	CodeCode Available	1
Value Summation: A Novel Scoring Function for MPC-based Model-based Reinforcement Learning	Sep 16, 2022	Model-based Reinforcement LearningMuJoCo	—Unverified	0
Optimizing Industrial HVAC Systems with Hierarchical Reinforcement Learning	Sep 16, 2022	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Trustworthy Reinforcement Learning Against Intrinsic Vulnerabilities: Robustness, Safety, and Generalizability	Sep 16, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Model Inversion Attacks against Graph Neural Networks	Sep 16, 2022	modelReinforcement Learning (RL)	—Unverified	0
Model-based gym environments for limit order book trading	Sep 16, 2022	Algorithmic TradingReinforcement Learning (RL)	CodeCode Available	1
Look where you look! Saliency-guided Q-networks for generalization in visual Reinforcement Learning	Sep 16, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Stability Constrained Reinforcement Learning for Decentralized Real-Time Voltage Control	Sep 16, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Reinforcement Learning-Based Cooperative P2P Power Trading between DC Nanogrid Clusters with Wind and PV Energy Resources	Sep 16, 2022	energy tradingManagement	—Unverified	0
Neuromuscular Reinforcement Learning to Actuate Human Limbs through FES	Sep 16, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
M^2DQN: A Robust Method for Accelerating Deep Q-learning Network	Sep 16, 2022	Q-Learningreinforcement-learning	CodeCode Available	0
Conservative Dual Policy Optimization for Efficient Model-Based Reinforcement Learning	Sep 16, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Adaptive Natural Language Generation for Task-oriented Dialogue via Reinforcement Learning	Sep 16, 2022	Natural Language Understandingreinforcement-learning	CodeCode Available	0
Can Offline Reinforcement Learning Help Natural Language Understanding?	Sep 15, 2022	Language ModelingLanguage Modelling	—Unverified	0
IoT-Aerial Base Station Task Offloading with Risk-Sensitive Reinforcement Learning for Smart Agriculture	Sep 15, 2022	Q-LearningReinforcement Learning (RL)	—Unverified	0
Constrained Update Projection Approach to Safe Policy Optimization	Sep 15, 2022	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1
Continuous MDP Homomorphisms and Homomorphic Policy Gradient	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	1
COOL-MC: A Comprehensive Tool for Reinforcement Learning and Model Checking	Sep 15, 2022	OpenAI Gymreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning for Task Offloading in UAV-Aided Smart Farm Networks	Sep 15, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Mean-Field Approximation of Cooperative Constrained Multi-Agent Reinforcement Learning (CMARL)	Sep 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
On the Reuse Bias in Off-Policy Reinforcement Learning	Sep 15, 2022	continuous-controlContinuous Control	CodeCode Available	0
ProAPT: Projection of APT Threats with Deep Reinforcement Learning	Sep 15, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Understanding Deep Neural Function Approximation in Reinforcement Learning via ε-Greedy Exploration	Sep 15, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
MIXRTs: Toward Interpretable Multi-Agent Reinforcement Learning via Mixing Recurrent Soft Decision Trees	Sep 15, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Scalable Task-Driven Robotic Swarm Control via Collision Avoidance and Learning Mean-Field Control	Sep 15, 2022	Collision AvoidanceMulti-agent Reinforcement Learning	—Unverified	0
Analysis of Reinforcement Learning for determining task replication in workflows	Sep 14, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Feature-Rich Long-term Bitcoin Trading Assistant	Sep 14, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Knowledge Transfer in Deep Reinforcement Learning via an RL-Specific GAN-Based Correspondence Function	Sep 14, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Distributionally Robust Offline Reinforcement Learning with Linear Function Approximation	Sep 14, 2022	Offline RLreinforcement-learning	—Unverified	0
Robust Constrained Reinforcement Learning	Sep 14, 2022	Adversarial Attackreinforcement-learning	—Unverified	0
Unifying Causal Inference and Reinforcement Learning using Higher-Order Category Theory	Sep 13, 2022	Causal Inferencereinforcement-learning	—Unverified	0
Designing Biological Sequences via Meta-Reinforcement Learning and Bayesian Optimization	Sep 13, 2022	Bayesian Optimizationglobal-optimization	—Unverified	0
Active Perception Applied To Unmanned Aerial Vehicles Through Deep Reinforcement Learning	Sep 13, 2022	Contrastive LearningDeep Reinforcement Learning	—Unverified	0
A new Reinforcement Learning framework to discover natural flavor molecules	Sep 13, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Data efficient reinforcement learning and adaptive optimal perimeter control of network traffic dynamics	Sep 13, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Skip Training for Multi-Agent Reinforcement Learning Controller for Industrial Wave Energy Converters	Sep 13, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Model-based Reinforcement Learning with Multi-step Plan Value Estimation	Sep 12, 2022	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Self-supervised Sequential Information Bottleneck for Robust Exploration in Deep Reinforcement Learning	Sep 12, 2022	Deep Reinforcement LearningEfficient Exploration	—Unverified	0

Show:10 25 50

← PrevPage 98 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified