Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8901–8950 of 15113 papers

Title	Date	Tasks	Status	Hype
Universal Trading for Order Execution with Oracle Policy Distillation	Jan 28, 2021	Algorithmic Tradingreinforcement-learning	—Unverified	0
CoordiQ : Coordinated Q-learning for Electric Vehicle Charging Recommendation	Jan 28, 2021	Decision MakingQ-Learning	—Unverified	0
Exploring the Impact of Tunable Agents in Sequential Social Dilemmas	Jan 28, 2021	Multi-Objective Reinforcement Learningreinforcement-learning	CodeCode Available	0
Reinforcement Learning based Per-antenna Discrete Power Control for Massive MIMO Systems	Jan 28, 2021	Q-Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Assisted Beamforming for Inter-cell Interference Mitigation in 5G Massive MIMO Networks	Jan 27, 2021	Q-Learningreinforcement-learning	—Unverified	0
Reinforcement Learning for Selective Key Applications in Power Systems: Recent Advances and Future Challenges	Jan 27, 2021	Decision Makingenergy management	—Unverified	0
Safe Multi-Agent Reinforcement Learning via Shielding	Jan 27, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Robust Android Malware Detection System against Adversarial Attacks using Q-Learning	Jan 27, 2021	Adversarial DefenseAndroid Malware Detection	—Unverified	0
The MineRL 2020 Competition on Sample Efficient Reinforcement Learning using Human Priors	Jan 26, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Data sharing games	Jan 26, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Channel Estimation via Successive Denoising in MIMO OFDM Systems: A Reinforcement Learning Approach	Jan 25, 2021	DenoisingQ-Learning	—Unverified	0
ECOL-R: Encouraging Copying in Novel Object Captioning with Reinforcement Learning	Jan 25, 2021	Image CaptioningObject	—Unverified	0
Episodic memory governs choices: An RNN-based reinforcement learning model for decision-making task	Jan 24, 2021	Decision MakingHippocampus	—Unverified	0
Fast Sequence Generation with Multi-Agent Reinforcement Learning	Jan 24, 2021	Image CaptioningMachine Translation	—Unverified	0
A Methodology for the Development of RL-Based Adaptive Traffic Signal Controllers	Jan 24, 2021	Experimental Designreinforcement-learning	—Unverified	0
GST: Group-Sparse Training for Accelerating Deep Reinforcement Learning	Jan 24, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Learning Synthetic Environments for Reinforcement Learning with Evolution Strategies	Jan 24, 2021	Acrobotreinforcement-learning	CodeCode Available	1
Solving optimal stopping problems with Deep Q-Learning	Jan 24, 2021	Q-LearningReinforcement Learning (RL)	—Unverified	0
Safe Learning and Optimization Techniques: Towards a Survey of the State of the Art	Jan 23, 2021	Active LearningEvolutionary Algorithms	—Unverified	0
Decoupled Exploration and Exploitation Policies for Sample-Efficient Reinforcement Learning	Jan 23, 2021	continuous-controlContinuous Control	—Unverified	0
BF++: a language for general-purpose program synthesis	Jan 23, 2021	Decision MakingOpenAI Gym	CodeCode Available	0
Feature Selection Using Reinforcement Learning	Jan 23, 2021	Dimensionality Reductionfeature selection	—Unverified	0
Theory of Mind for Deep Reinforcement Learning in Hanabi	Jan 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Prior Preference Learning from Experts:Designing a Reward with Active Inference	Jan 22, 2021	Reinforcement Learning (RL)	—Unverified	0
Differentiable Trust Region Layers for Deep Reinforcement Learning	Jan 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Adversarial Machine Learning for Flooding Attacks on 5G Radio Access Network Slicing	Jan 21, 2021	BIG-bench Machine LearningReinforcement Learning (RL)	—Unverified	0
Robust Reinforcement Learning on State Observations with Learned Optimal Adversary	Jan 21, 2021	Adversarial Attackcontinuous-control	CodeCode Available	1
Unifying Cardiovascular Modelling with Deep Reinforcement Learning for Uncertainty Aware Control of Sepsis Treatment	Jan 21, 2021	Clinical KnowledgeDecision Making Under Uncertainty	CodeCode Available	1
Model-based Policy Search for Partially Measurable Systems	Jan 21, 2021	Gaussian Processesmodel	—Unverified	0
mt5se: An Open Source Framework for Building Autonomous Trading Robots	Jan 20, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
UPDeT: Universal Multi-agent Reinforcement Learning via Policy Decoupling with Transformers	Jan 20, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Flocking and Collision Avoidance for a Dynamic Squad of Fixed-Wing UAVs Using Deep Reinforcement Learning	Jan 20, 2021	Collision AvoidanceDecision Making	—Unverified	0
Deep Reinforcement Learning Optimizes Graphene Nanopores for Efficient Desalination	Jan 19, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Producing Furniture Layout in Indoor Scenes	Jan 19, 2021	Deep Reinforcement LearningPosition	CodeCode Available	1
Grounding Language to Entities and Dynamics for Generalization in Reinforcement Learning	Jan 19, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Dynamic Bicycle Dispatching of Dockless Public Bicycle-sharing Systems using Multi-objective Reinforcement Learning	Jan 19, 2021	Multi-Objective Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Spatial Assembly: Generative Architecture With Reinforcement Learning, Self Play and Tree Search	Jan 19, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Meta-Reinforcement Learning for Adaptive Motor Control in Changing Robot Dynamics and Environments	Jan 19, 2021	FrictionMeta-Learning	—Unverified	0
Towards Facilitating Empathic Conversations in Online Mental Health Support: A Reinforcement Learning Approach	Jan 19, 2021	Deep Reinforcement LearningDialogue Generation	CodeCode Available	1
HAMMER: Multi-Level Coordination of Reinforcement Learning Agents via Learned Messaging	Jan 18, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning with Embedded LQR Controllers	Jan 18, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action Recognition	Jan 18, 2021	Action RecognitionClustering	—Unverified	0
Deep Reinforcement Learning for Active High Frequency Trading	Jan 18, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Cooperative and Competitive Biases for Multi-Agent Reinforcement Learning	Jan 18, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Natural Language Specification of Reinforcement Learning Policies through Differentiable Decision Trees	Jan 18, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Stable deep reinforcement learning method by predicting uncertainty in rewards as a subtask	Jan 18, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Model-Based Reinforcement Learning for Approximate Optimal Control with Temporal Logic Specifications	Jan 18, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Regularized Policies are Reward Robust	Jan 18, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A Safe Hierarchical Planning Framework for Complex Driving Scenarios based on Reinforcement Learning	Jan 17, 2021	Autonomous Vehiclesreinforcement-learning	—Unverified	0
Hierarchical Reinforcement Learning By Discovering Intrinsic Options	Jan 16, 2021	Hierarchical Reinforcement Learningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 179 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified