Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4501–4550 of 15113 papers

Title	Date	Tasks	Status	Hype
One-shot, Offline and Production-Scalable PID Optimisation with Deep Reinforcement Learning	Oct 25, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Symbolic Distillation for Learned TCP Congestion Control	Oct 24, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
MEET: A Monte Carlo Exploration-Exploitation Trade-off for Buffer Sampling	Oct 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	0
OSS Mentor A framework for improving developers contributions via deep reinforcement learning	Oct 24, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Opportunistic Episodic Reinforcement Learning	Oct 24, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Understanding the Evolution of Linear Regions in Deep Reinforcement Learning	Oct 24, 2022	continuous-controlContinuous Control	CodeCode Available	0
Reinforcement Learning and Bandits for Speech and Language Processing: Tutorial, Review and Outlook	Oct 24, 2022	Recommendation Systemsreinforcement-learning	—Unverified	0
Energy Pricing in P2P Energy Systems Using Reinforcement Learning	Oct 24, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Graph Reinforcement Learning-based CNN Inference Offloading in Dynamic Edge Computing	Oct 24, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Causal Explanation for Reinforcement Learning: Quantifying State and Temporal Importance	Oct 24, 2022	Collision Avoidancereinforcement-learning	—Unverified	0
Hardness in Markov Decision Processes: Theory and Practice	Oct 24, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
ADLight: A Universal Approach of Traffic Signal Control with Augmented Data Using Reinforcement Learning	Oct 24, 2022	Data Augmentationreinforcement-learning	CodeCode Available	1
Classifying Ambiguous Identities in Hidden-Role Stochastic Games with Multi-Agent Reinforcement Learning	Oct 24, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
AACHER: Assorted Actor-Critic Deep Reinforcement Learning with Hindsight Experience Replay	Oct 24, 2022	Deep Reinforcement LearningFetchPush-v1	CodeCode Available	0
Avalon: A Benchmark for RL Generalization Using Procedurally Generated Worlds	Oct 24, 2022	Deep Reinforcement LearningNavigate	CodeCode Available	1
Dichotomy of Control: Separating What You Can Control from What You Cannot	Oct 24, 2022	Reinforcement Learning (RL)	—Unverified	0
Evaluating Long-Term Memory in 3D Mazes	Oct 24, 2022	Navigatereinforcement-learning	CodeCode Available	1
Multi-Agent Path Finding via Tree LSTM	Oct 24, 2022	Multi-Agent Path Findingreinforcement-learning	CodeCode Available	1
Reachability-Aware Laplacian Representation in Reinforcement Learning	Oct 24, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Climate Change Policy Exploration using Reinforcement Learning	Oct 23, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Active Predictive Coding: A Unified Neural Framework for Learning Hierarchical World Models for Perception and Planning	Oct 23, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
LEAGUE: Guided Skill Learning and Abstraction for Long-Horizon Manipulation	Oct 23, 2022	Deep Reinforcement LearningMotion Planning	—Unverified	0
A Cooperative Reinforcement Learning Environment for Detecting and Penalizing Betrayal	Oct 23, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Learning General World Models in a Handful of Reward-Free Deployments	Oct 23, 2022	Active LearningDeep Reinforcement Learning	—Unverified	0
MetaEMS: A Meta Reinforcement Learning-based Control Framework for Building Energy Management System	Oct 23, 2022	energy managementManagement	—Unverified	0
Attitude Control of Highly Maneuverable Aircraft Using an Improved Q-learning	Oct 22, 2022	continuous-controlContinuous Control	—Unverified	0
Faster and more diverse de novo molecular optimization with double-loop reinforcement learning using augmented SMILES	Oct 22, 2022	DiversityDrug Discovery	—Unverified	0
Probing Transfer in Deep Reinforcement Learning without Task Engineering	Oct 22, 2022	Deep Reinforcement LearningGame Design	—Unverified	0
Towards Quantum-Enabled 6G Slicing	Oct 21, 2022	Deep Reinforcement LearningFederated Learning	—Unverified	0
Rate-Splitting for Intelligent Reflecting Surface-Aided Multiuser VR Streaming	Oct 21, 2022	Continuous ControlDeep Reinforcement Learning	CodeCode Available	0
Epistemic Monte Carlo Tree Search	Oct 21, 2022	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
On the connection between Bregman divergence and value in regularized Markov decision processes	Oct 21, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Implicit Offline Reinforcement Learning via Supervised Learning	Oct 21, 2022	Offline RLreinforcement-learning	—Unverified	0
Continual Vision-based Reinforcement Learning with Group Symmetries	Oct 21, 2022	Autonomous Drivingreinforcement-learning	—Unverified	0
Biologically Plausible Variational Policy Gradient with Spiking Recurrent Winner-Take-All Networks	Oct 21, 2022	AllReinforcement Learning (RL)	CodeCode Available	0
Group Distributionally Robust Reinforcement Learning with Hierarchical Latent Variables	Oct 21, 2022	MuJoCoreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Stabilization of Large-scale Probabilistic Boolean Networks	Oct 21, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Redefining Counterfactual Explanations for Reinforcement Learning: Overview, Challenges and Opportunities	Oct 21, 2022	counterfactualreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Inverse Inorganic Materials Design	Oct 21, 2022	Deep Reinforcement LearningDiversity	—Unverified	0
Integrating Policy Summaries with Reward Decomposition for Explaining Reinforcement Learning Agents	Oct 21, 2022	Decision Makingreinforcement-learning	—Unverified	0
PaCo: Parameter-Compositional Multi-Task Reinforcement Learning	Oct 21, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Fine-Grained Session Recommendations in E-commerce using Deep Reinforcement Learning	Oct 20, 2022	Decision MakingDeep Reinforcement Learning	—Unverified	0
Horizon-Free and Variance-Dependent Reinforcement Learning for Latent Markov Decision Processes	Oct 20, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Robust Imitation via Mirror Descent Inverse Reinforcement Learning	Oct 20, 2022	Density EstimationImitation Learning	—Unverified	0
Model-based Lifelong Reinforcement Learning with Bayesian Exploration	Oct 20, 2022	modelreinforcement-learning	CodeCode Available	0
MoCoDA: Model-based Counterfactual Data Augmentation	Oct 20, 2022	counterfactualData Augmentation	CodeCode Available	1
The Pump Scheduling Problem: A Real-World Scenario for Reinforcement Learning	Oct 20, 2022	Deep Reinforcement LearningOffline RL	CodeCode Available	0
Safe Policy Improvement in Constrained Markov Decision Processes	Oct 20, 2022	Reinforcement Learning (RL)	—Unverified	0
Task Phasing: Automated Curriculum Learning from Demonstrations	Oct 20, 2022	Reinforcement Learning (RL)	CodeCode Available	0
RMBench: Benchmarking Deep Reinforcement Learning for Robotic Manipulator Control	Oct 20, 2022	BenchmarkingData Augmentation	CodeCode Available	1

Show:10 25 50

← PrevPage 91 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified