Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9351–9375 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning for Robust Missile Autopilot Design	Nov 26, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
An End-to-end Deep Reinforcement Learning Approach for the Long-term Short-term Planning on the Frenet Space	Nov 26, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Exploring grid topology reconfiguration using a simple deep reinforcement learning approach	Nov 26, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learning from Simulation, Racing in Reality	Nov 26, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Interactive Machine Learning of Musical Gesture	Nov 26, 2020	BIG-bench Machine LearningReinforcement Learning (RL)	CodeCode Available	1
Generalization in Reinforcement Learning by Soft Data Augmentation	Nov 26, 2020	Data Augmentationreinforcement-learning	CodeCode Available	1
MetaSensing: Intelligent Metasurface Assisted RF 3D Sensing by Deep Reinforcement Learning	Nov 25, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Diluted Near-Optimal Expert Demonstrations for Guiding Dialogue Stochastic Policy Optimisation	Nov 25, 2020	Imitation LearningQ-Learning	—Unverified	0
Accommodating Picky Customers: Regret Bound and Exploration Complexity for Multi-Objective Reinforcement Learning	Nov 25, 2020	Multi-Objective Reinforcement Learningreinforcement-learning	CodeCode Available	0
Auto Graph Encoder-Decoder for Neural Network Pruning	Nov 25, 2020	DecoderModel Compression	—Unverified	0
Combining Semantic Guidance and Deep Reinforcement Learning For Generating Human Level Paintings	Nov 25, 2020	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
RLlib Flow: Distributed Reinforcement Learning is a Dataflow Problem	Nov 25, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	4
TLeague: A Framework for Competitive Self-Play based Distributed Multi-Agent Reinforcement Learning	Nov 25, 2020	Dota 2Multi-agent Reinforcement Learning	CodeCode Available	1
Symmetry-Aware Actor-Critic for 3D Molecular Design	Nov 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Towards Playing Full MOBA Games with Deep Reinforcement Learning	Nov 25, 2020	AI AgentDeep Reinforcement Learning	—Unverified	0
World Model as a Graph: Learning Latent Landmarks for Planning	Nov 25, 2020	continuous-controlContinuous Control	CodeCode Available	1
PowerNet: Multi-agent Deep Reinforcement Learning for Scalable Powergrid Control	Nov 24, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
REPAINT: Knowledge Transfer in Deep Reinforcement Learning	Nov 24, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Solving The Lunar Lander Problem under Uncertainty using Reinforcement Learning	Nov 24, 2020	NavigateQ-Learning	CodeCode Available	0
Learning Principle of Least Action with Reinforcement Learning	Nov 24, 2020	Q-Learningreinforcement-learning	CodeCode Available	0
A Reusable Framework Based on Reinforcement Learning to Design Antennas for Curved Surfaces	Nov 24, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Uncertainty Estimation and Calibration with Finite-State Probabilistic RNNs	Nov 24, 2020	Out-of-Distribution Detectionreinforcement-learning	—Unverified	0
Path Design and Resource Management for NOMA enhanced Indoor Intelligent Robots	Nov 23, 2020	Managementreinforcement-learning	—Unverified	0
Logarithmic Regret for Reinforcement Learning with Linear Function Approximation	Nov 23, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Consolidation via Policy Information Regularization in Deep RL for Multi-Agent Games	Nov 23, 2020	Continual Learningcontinuous-control	—Unverified	0

Show:10 25 50

← PrevPage 375 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified