Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8901–8925 of 15113 papers

Title	Date	Tasks	Status	Hype
Universal Trading for Order Execution with Oracle Policy Distillation	Jan 28, 2021	Algorithmic Tradingreinforcement-learning	—Unverified	0
CoordiQ : Coordinated Q-learning for Electric Vehicle Charging Recommendation	Jan 28, 2021	Decision MakingQ-Learning	—Unverified	0
Exploring the Impact of Tunable Agents in Sequential Social Dilemmas	Jan 28, 2021	Multi-Objective Reinforcement Learningreinforcement-learning	CodeCode Available	0
Reinforcement Learning based Per-antenna Discrete Power Control for Massive MIMO Systems	Jan 28, 2021	Q-Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Assisted Beamforming for Inter-cell Interference Mitigation in 5G Massive MIMO Networks	Jan 27, 2021	Q-Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Selective Key Applications in Power Systems: Recent Advances and Future Challenges	Jan 27, 2021	Decision Makingenergy management	—Unverified	0
Safe Multi-Agent Reinforcement Learning via Shielding	Jan 27, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Robust Android Malware Detection System against Adversarial Attacks using Q-Learning	Jan 27, 2021	Adversarial DefenseAndroid Malware Detection	—Unverified	0
The MineRL 2020 Competition on Sample Efficient Reinforcement Learning using Human Priors	Jan 26, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Data sharing games	Jan 26, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Channel Estimation via Successive Denoising in MIMO OFDM Systems: A Reinforcement Learning Approach	Jan 25, 2021	DenoisingQ-Learning	—Unverified	0
ECOL-R: Encouraging Copying in Novel Object Captioning with Reinforcement Learning	Jan 25, 2021	Image CaptioningObject	—Unverified	0
Episodic memory governs choices: An RNN-based reinforcement learning model for decision-making task	Jan 24, 2021	Decision MakingHippocampus	—Unverified	0
Fast Sequence Generation with Multi-Agent Reinforcement Learning	Jan 24, 2021	Image CaptioningMachine Translation	—Unverified	0
A Methodology for the Development of RL-Based Adaptive Traffic Signal Controllers	Jan 24, 2021	Experimental Designreinforcement-learning	—Unverified	0
GST: Group-Sparse Training for Accelerating Deep Reinforcement Learning	Jan 24, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Learning Synthetic Environments for Reinforcement Learning with Evolution Strategies	Jan 24, 2021	Acrobotreinforcement-learning	CodeCode Available	1
Solving optimal stopping problems with Deep Q-Learning	Jan 24, 2021	Q-LearningReinforcement Learning (RL)	—Unverified	0
Safe Learning and Optimization Techniques: Towards a Survey of the State of the Art	Jan 23, 2021	Active LearningEvolutionary Algorithms	—Unverified	0
Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning	Jan 23, 2021	continuous-controlContinuous Control	—Unverified	0
BF++: a language for general-purpose program synthesis	Jan 23, 2021	Decision MakingOpenAI Gym	CodeCode Available	0
Feature Selection Using Reinforcement Learning	Jan 23, 2021	Dimensionality Reductionfeature selection	—Unverified	0
Theory of Mind for Deep Reinforcement Learning in Hanabi	Jan 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Prior Preference Learning from Experts:Designing a Reward with Active Inference	Jan 22, 2021	Reinforcement Learning (RL)	—Unverified	0
Differentiable Trust Region Layers for Deep Reinforcement Learning	Jan 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 357 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified