Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8351–8375 of 15113 papers

Title	Date	Tasks	Status
Exploratory State Representation Learning	Sep 28, 2021	DiversityEfficient Exploration	CodeCode Available
Identifying Reasoning Flaws in Planning-Based RL Using Tree Explanations	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
An Offline Deep Reinforcement Learning for Maintenance Decision-Making	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Exploring More When It Needs in Deep Reinforcement Learning	Sep 28, 2021	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning with Adjustments	Sep 28, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Efficiently Training On-Policy Actor-Critic Networks in Robotic Deep Reinforcement Learning with Demonstration-like Sampled Exploration	Sep 27, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
DRL-based Slice Placement under Realistic Network Load Conditions	Sep 27, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
From internal models toward metacognitive AI	Sep 27, 2021	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Towards Reinforcement Learning for Pivot-based Neural Machine Translation with Non-autoregressive Transformer	Sep 27, 2021	Machine TranslationNMT	—Unverified
Model-Free Reinforcement Learning for Optimal Control of MarkovDecision Processes Under Signal Temporal Logic Specifications	Sep 27, 2021	Motion Planningreinforcement-learning	—Unverified
MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning Research	Sep 27, 2021	Deep Reinforcement LearningNetHack	—Unverified
On the Feasibility of Learning Finger-gaiting In-hand Manipulation with Intrinsic Sensing	Sep 26, 2021	Reinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Wireless Scheduling in Distributed Networked Control	Sep 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
L^2NAS: Learning to Optimize Neural Architectures via Continuous-Action Reinforcement Learning	Sep 25, 2021	Hyperparameter OptimizationNeural Architecture Search	—Unverified
Adaptive Sampling Quasi-Newton Methods for Zeroth-Order Stochastic Optimization	Sep 24, 2021	Reinforcement Learning (RL)Stochastic Optimization	—Unverified
A Graph Policy Network Approach for Volt-Var Control in Power Distribution Systems	Sep 24, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Go-Blend behavior and affect	Sep 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learnable Triangulation for Deep Learning-based 3D Reconstruction of Objects of Arbitrary Topology from Single RGB Images	Sep 24, 2021	3D Object Reconstruction3D Reconstruction	—Unverified
Combining Contention-Based Spectrum Access and Adaptive Modulation using Deep Reinforcement Learning	Sep 24, 2021	Deep Reinforcement LearningFairness	—Unverified
The f-Divergence Reinforcement Learning Framework	Sep 24, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Parameter-free Reduction of the Estimation Bias in Deep Reinforcement Learning for Deterministic Policy Gradients	Sep 24, 2021	continuous-controlContinuous Control	CodeCode Available
Regularization Guarantees Generalization in Bayesian Reinforcement Learning through Algorithmic Stability	Sep 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
Neuroprospecting with DeepRL agents	Sep 24, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
PredictionNet: Real-Time Joint Probabilistic Traffic Prediction for Planning, Control, and Simulation	Sep 23, 2021	Autonomous DrivingGPU	—Unverified
Reinforcement Learning Under Algorithmic Triage	Sep 23, 2021	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 335 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified