Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4851–4875 of 15113 papers

Title	Date	Tasks	Status	Hype
An information-theoretic perspective on intrinsic motivation in reinforcement learning: a survey	Sep 19, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Evolutionary Deep Reinforcement Learning Using Elite Buffer: A Novel Approach Towards DRL Combined with EA in Continuous Control Tasks	Sep 18, 2022	continuous-controlContinuous Control	—Unverified	0
Multi-level Explanation of Deep Reinforcement Learning-based Scheduling	Sep 18, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Offline Reinforcement Learning with Instrumental Variables in Confounded Markov Decision Processes	Sep 18, 2022	Offline RLreinforcement-learning	—Unverified	0
Simplifying Model-based RL: Learning Representations, Latent-space Models, and Policies with One Objective	Sep 18, 2022	Reinforcement Learning (RL)Value prediction	—Unverified	0
Honor of Kings Arena: an Environment for Generalization in Competitive Reinforcement Learning	Sep 18, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	2
Intrinsically Motivated Reinforcement Learning based Recommendation with Counterfactual Data Augmentation	Sep 17, 2022	counterfactualData Augmentation	—Unverified	0
A Robust and Constrained Multi-Agent Reinforcement Learning Electric Vehicle Rebalancing Method in AMoD Systems	Sep 17, 2022	FairnessMulti-agent Reinforcement Learning	—Unverified	0
MA2QL: A Minimalist Approach to Fully Decentralized Multi-Agent Reinforcement Learning	Sep 17, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Selective Token Generation for Few-shot Natural Language Generation	Sep 17, 2022	Data-to-Text GenerationLanguage Modeling	CodeCode Available	0
Sample-Efficient Multi-Agent Reinforcement Learning with Demonstrations for Flocking Control	Sep 17, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Sub-optimal Policy Aided Multi-Agent Reinforcement Learning for Flocking Control	Sep 17, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Toward Safe and Accelerated Deep Reinforcement Learning for Next-Generation Wireless Networks	Sep 16, 2022	Deep Reinforcement LearningManagement	CodeCode Available	1
Value Summation: A Novel Scoring Function for MPC-based Model-based Reinforcement Learning	Sep 16, 2022	Model-based Reinforcement LearningMuJoCo	—Unverified	0
Optimizing Industrial HVAC Systems with Hierarchical Reinforcement Learning	Sep 16, 2022	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Trustworthy Reinforcement Learning Against Intrinsic Vulnerabilities: Robustness, Safety, and Generalizability	Sep 16, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Model Inversion Attacks against Graph Neural Networks	Sep 16, 2022	modelReinforcement Learning (RL)	—Unverified	0
Model-based gym environments for limit order book trading	Sep 16, 2022	Algorithmic TradingReinforcement Learning (RL)	CodeCode Available	1
Look where you look! Saliency-guided Q-networks for generalization in visual Reinforcement Learning	Sep 16, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Stability Constrained Reinforcement Learning for Decentralized Real-Time Voltage Control	Sep 16, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Reinforcement Learning-Based Cooperative P2P Power Trading between DC Nanogrid Clusters with Wind and PV Energy Resources	Sep 16, 2022	energy tradingManagement	—Unverified	0
Neuromuscular Reinforcement Learning to Actuate Human Limbs through FES	Sep 16, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
M^2DQN: A Robust Method for Accelerating Deep Q-learning Network	Sep 16, 2022	Q-Learningreinforcement-learning	CodeCode Available	0
Conservative Dual Policy Optimization for Efficient Model-Based Reinforcement Learning	Sep 16, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Adaptive Natural Language Generation for Task-oriented Dialogue via Reinforcement Learning	Sep 16, 2022	Natural Language Understandingreinforcement-learning	CodeCode Available	0

Show:10 25 50

← PrevPage 195 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified