Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8351–8400 of 15113 papers

Title	Date	Tasks	Status
Exploratory State Representation Learning	Sep 28, 2021	DiversityEfficient Exploration	CodeCode Available
Identifying Reasoning Flaws in Planning-Based RL Using Tree Explanations	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
An Offline Deep Reinforcement Learning for Maintenance Decision-Making	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Exploring More When It Needs in Deep Reinforcement Learning	Sep 28, 2021	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning with Adjustments	Sep 28, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Efficiently Training On-Policy Actor-Critic Networks in Robotic Deep Reinforcement Learning with Demonstration-like Sampled Exploration	Sep 27, 2021	Deep Reinforcement LearningMuJoCo	—Unverified
DRL-based Slice Placement under Realistic Network Load Conditions	Sep 27, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
From internal models toward metacognitive AI	Sep 27, 2021	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Towards Reinforcement Learning for Pivot-based Neural Machine Translation with Non-autoregressive Transformer	Sep 27, 2021	Machine TranslationNMT	—Unverified
Model-Free Reinforcement Learning for Optimal Control of MarkovDecision Processes Under Signal Temporal Logic Specifications	Sep 27, 2021	Motion Planningreinforcement-learning	—Unverified
MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning Research	Sep 27, 2021	Deep Reinforcement LearningNetHack	—Unverified
On the Feasibility of Learning Finger-gaiting In-hand Manipulation with Intrinsic Sensing	Sep 26, 2021	Reinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning for Wireless Scheduling in Distributed Networked Control	Sep 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
L^2NAS: Learning to Optimize Neural Architectures via Continuous-Action Reinforcement Learning	Sep 25, 2021	Hyperparameter OptimizationNeural Architecture Search	—Unverified
Adaptive Sampling Quasi-Newton Methods for Zeroth-Order Stochastic Optimization	Sep 24, 2021	Reinforcement Learning (RL)Stochastic Optimization	—Unverified
A Graph Policy Network Approach for Volt-Var Control in Power Distribution Systems	Sep 24, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Go-Blend behavior and affect	Sep 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learnable Triangulation for Deep Learning-based 3D Reconstruction of Objects of Arbitrary Topology from Single RGB Images	Sep 24, 2021	3D Object Reconstruction3D Reconstruction	—Unverified
Combining Contention-Based Spectrum Access and Adaptive Modulation using Deep Reinforcement Learning	Sep 24, 2021	Deep Reinforcement LearningFairness	—Unverified
The f-Divergence Reinforcement Learning Framework	Sep 24, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Parameter-free Reduction of the Estimation Bias in Deep Reinforcement Learning for Deterministic Policy Gradients	Sep 24, 2021	continuous-controlContinuous Control	CodeCode Available
Regularization Guarantees Generalization in Bayesian Reinforcement Learning through Algorithmic Stability	Sep 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
Neuroprospecting with DeepRL agents	Sep 24, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
PredictionNet: Real-Time Joint Probabilistic Traffic Prediction for Planning, Control, and Simulation	Sep 23, 2021	Autonomous DrivingGPU	—Unverified
Reinforcement Learning Under Algorithmic Triage	Sep 23, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Multi-Agent Deep Reinforcement Learning Coordination Framework for Connected and Automated Vehicles at Merging Roadways	Sep 23, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Dimension-Free Rates for Natural Policy Gradient in Multi-Agent Reinforcement Learning	Sep 23, 2021	Decision MakingMulti-agent Reinforcement Learning	—Unverified
Deep Reinforcement Learning-Based Long-Range Autonomous Valet Parking for Smart Cities	Sep 23, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Hierarchies of Planning and Reinforcement Learning for Robot Navigation	Sep 23, 2021	reinforcement-learningReinforcement Learning	—Unverified
Introducing Symmetries to Black Box Meta Reinforcement Learning	Sep 22, 2021	Meta-LearningMeta Reinforcement Learning	—Unverified
Benchmarking Lane-changing Decision-making for Deep Reinforcement Learning	Sep 22, 2021	Autonomous DrivingBenchmarking	—Unverified
Adversarial Training Blocks Generalization in Neural Policies	Sep 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Estimation Error Correction in Deep Reinforcement Learning for Deterministic Actor-Critic Methods	Sep 22, 2021	continuous-controlContinuous Control	CodeCode Available
Locality Matters: A Scalable Value Decomposition Approach for Cooperative Multi-Agent Reinforcement Learning	Sep 22, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A Survey on Reinforcement Learning for Recommender Systems	Sep 22, 2021	Explainable RecommendationInteractive Recommendation	—Unverified
Towards Multi-Agent Reinforcement Learning using Quantum Boltzmann Machines	Sep 22, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Return Dispersion as an Estimator of Learning Potential for Prioritized Level Replay	Sep 22, 2021	reinforcement-learningReinforcement Learning	—Unverified
MEPG: A Minimalist Ensemble Policy Gradient Framework for Deep Reinforcement Learning	Sep 22, 2021	Deep Reinforcement LearningGaussian Processes	—Unverified
Example-Driven Model-Based Reinforcement Learning for Solving Long-Horizon Visuomotor Tasks	Sep 21, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified
A Distance-based Anomaly Detection Framework for Deep Reinforcement Learning	Sep 21, 2021	Anomaly DetectionAtari Games	—Unverified
Long-Term Exploration in Persistent MDPs	Sep 21, 2021	Reinforcement Learning (RL)	CodeCode Available
Learning offline: memory replay in biological and artificial reinforcement learning	Sep 21, 2021	Continual LearningDecision Making	—Unverified
Generalization in Text-based Games via Hierarchical Reinforcement Learning	Sep 21, 2021	Deep Reinforcement LearningHierarchical Reinforcement Learning	CodeCode Available
ACReL: Adversarial Conditional value-at-risk Reinforcement Learning	Sep 20, 2021	Autonomous Drivingreinforcement-learning	—Unverified
A Reinforcement Learning Approach to the Stochastic Cutting Stock Problem	Sep 20, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Survey of Text Games for Reinforcement Learning informed by Natural Language	Sep 20, 2021	reinforcement-learningReinforcement Learning	—Unverified
Learning Natural Language Generation from Scratch	Sep 20, 2021	Language ModelingLanguage Modelling	—Unverified
Reinforcement Learning for Finite-Horizon Restless Multi-Armed Multi-Action Bandits	Sep 20, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Two Approaches to Building Collaborative, Task-Oriented Dialog Agents through Self-Play	Sep 20, 2021	reinforcement-learningReinforcement Learning	—Unverified
Regularize! Don't Mix: Multi-Agent Reinforcement Learning without Explicit Centralized Structures	Sep 19, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified

Show:10 25 50

← PrevPage 168 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified