Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2151–2200 of 15113 papers

Title	Date	Tasks	Status	Hype
Learning to Communicate Functional States with Nonverbal Expressions for Improved Human-Robot Collaboration	Apr 30, 2024	Reinforcement Learning (RL)	CodeCode Available	0
Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learning	Apr 30, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Reinforcement Learning Problem Solving with Large Language Models	Apr 29, 2024	Q-Learningreinforcement-learning	—Unverified	0
Towards Generalizable Agents in Text-Based Educational Environments: A Study of Integrating RL with LLMs	Apr 29, 2024	DiagnosticGeneral Knowledge	—Unverified	0
Sample-Efficient Robust Multi-Agent Reinforcement Learning in the Face of Environmental Uncertainty	Apr 29, 2024	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Control Policy Correction Framework for Reinforcement Learning-based Energy Arbitrage Strategies	Apr 29, 2024	Knowledge Distillationreinforcement-learning	—Unverified	0
EEG_RL-Net: Enhancing EEG MI Classification through Reinforcement Learning-Optimised Graph Neural Networks	Apr 26, 2024	ClassificationEEG	—Unverified	0
Generalize by Touching: Tactile Ensemble Skill Transfer for Robotic Furniture Assembly	Apr 26, 2024	Contact-rich ManipulationOffline RL	—Unverified	0
Knowledge Transfer for Cross-Domain Reinforcement Learning: A Systematic Review	Apr 26, 2024	Decision Makingreinforcement-learning	—Unverified	0
Enhancing Privacy and Security of Autonomous UAV Navigation	Apr 26, 2024	Autonomous NavigationDisaster Response	—Unverified	0
Structured Reinforcement Learning for Delay-Optimal Data Transmission in Dense mmWave Networks	Apr 25, 2024	FairnessMulti-Armed Bandits	—Unverified	0
REBEL: Reinforcement Learning via Regressing Relative Rewards	Apr 25, 2024	continuous-controlContinuous Control	CodeCode Available	2
Offline Reinforcement Learning with Behavioral Supervisor Tuning	Apr 25, 2024	Offline RLreinforcement-learning	—Unverified	0
A fast balance optimization approach for charging enhancement of lithium-ion battery packs through deep reinforcement learning	Apr 24, 2024	Deep Reinforcement Learningenergy management	CodeCode Available	1
ActiveRIR: Active Audio-Visual Exploration for Acoustic Environment Modeling	Apr 24, 2024	Reinforcement Learning (RL)	—Unverified	0
GRSN: Gated Recurrent Spiking Neurons for POMDPs and MARL	Apr 24, 2024	reinforcement-learningReinforcement Learning	—Unverified	0
DPO: A Differential and Pointwise Control Approach to Reinforcement Learning	Apr 24, 2024	Benchmarkingreinforcement-learning	—Unverified	0
Planning the path with Reinforcement Learning: Optimal Robot Motion Planning in RoboCup Small Size League Environments	Apr 23, 2024	Motion PlanningReinforcement Learning (RL)	CodeCode Available	0
An MRP Formulation for Supervised Learning: Generalized Temporal Difference Learning Models	Apr 23, 2024	image-classificationImage Classification	—Unverified	0
Reinforcement Learning with Adaptive Regularization for Safe Control of Critical Systems	Apr 23, 2024	Reinforcement Learning (RL)	CodeCode Available	0
Using deep reinforcement learning to promote sustainable human behaviour on a common pool resource problem	Apr 23, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot	Apr 23, 2024	Reinforcement Learning (RL)	—Unverified	0
Fairness Incentives in Response to Unfair Dynamic Pricing	Apr 22, 2024	FairnessReinforcement Learning (RL)	—Unverified	0
Explicit Lipschitz Value Estimation Enhances Policy Robustness Against Perturbation	Apr 22, 2024	continuous-controlContinuous Control	—Unverified	0
Preference Fine-Tuning of LLMs Should Leverage Suboptimal, On-Policy Data	Apr 22, 2024	Contrastive LearningReinforcement Learning (RL)	CodeCode Available	1
Multi-view Disentanglement for Reinforcement Learning with Multiple Cameras	Apr 22, 2024	Disentanglementreinforcement-learning	CodeCode Available	0
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories	Apr 22, 2024	Edge-computingReinforcement Learning (RL)	—Unverified	0
An Offline Reinforcement Learning Algorithm Customized for Multi-Task Fusion in Large-Scale Recommender Systems	Apr 19, 2024	Efficient ExplorationMulti-Task Learning	—Unverified	0
Data-Incremental Continual Offline Reinforcement Learning	Apr 19, 2024	Continual LearningOffline RL	—Unverified	0
Reinforcement Learning Approach for Integrating Compressed Contexts into Knowledge Graphs	Apr 19, 2024	Knowledge Graphsreinforcement-learning	—Unverified	0
FlagVNE: A Flexible and Generalizable Reinforcement Learning Framework for Network Resource Allocation	Apr 19, 2024	DecoderNetwork Embedding	CodeCode Available	2
Continuous-time Risk-sensitive Reinforcement Learning via Quadratic Variation Penalty	Apr 19, 2024	Q-Learningreinforcement-learning	—Unverified	0
TrajDeleter: Enabling Trajectory Forgetting in Offline Reinforcement Learning Agents	Apr 18, 2024	energy managementOffline RL	CodeCode Available	0
Actor-Critic Reinforcement Learning with Phased Actor	Apr 18, 2024	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Physics-informed Actor-Critic for Coordination of Virtual Inertia from Power Distribution Systems	Apr 17, 2024	Reinforcement Learning (RL)	—Unverified	0
Prompt Optimizer of Text-to-Image Diffusion Models for Abstract Concept Understanding	Apr 17, 2024	Language ModelingLanguage Modelling	—Unverified	0
Learn to Tour: Operator Design For Solution Feasibility Mapping in Pickup-and-delivery Traveling Salesman Problem	Apr 17, 2024	Reinforcement Learning (RL)Traveling Salesman Problem	—Unverified	0
LTL-Constrained Policy Optimization with Cycle Experience Replay	Apr 17, 2024	continuous-controlContinuous Control	—Unverified	0
Sustainability of Data Center Digital Twins with Reinforcement Learning	Apr 16, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	2
Course Recommender Systems Need to Consider the Job Market	Apr 16, 2024	Recommendation SystemsReinforcement Learning (RL)	CodeCode Available	0
Automated Discovery of Functional Actual Causes in Complex Environments	Apr 16, 2024	AttributeReinforcement Learning (RL)	—Unverified	0
What Hides behind Unfairness? Exploring Dynamics Fairness in Reinforcement Learning	Apr 16, 2024	Attributecounterfactual	CodeCode Available	0
Achieving Constant Regret in Linear Markov Decision Processes	Apr 16, 2024	Reinforcement Learning (RL)	—Unverified	0
Offline Trajectory Generalization for Offline Reinforcement Learning	Apr 16, 2024	D4RLData Augmentation	—Unverified	0
Simplex Decomposition for Portfolio Allocation Constraints in Reinforcement Learning	Apr 16, 2024	Portfolio Optimizationreinforcement-learning	—Unverified	0
The Feasibility of Constrained Reinforcement Learning Algorithms: A Tutorial Study	Apr 15, 2024	Model Predictive Controlreinforcement-learning	—Unverified	0
Autonomous Path Planning for Intercostal Robotic Ultrasound Imaging Using Reinforcement Learning	Apr 15, 2024	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Effective Reinforcement Learning Based on Structural Information Principles	Apr 15, 2024	Decision Makingreinforcement-learning	—Unverified	0
Inferring Behavior-Specific Context Improves Zero-Shot Generalization in Reinforcement Learning	Apr 15, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	0
Higher Replay Ratio Empowers Sample-Efficient Multi-Agent Reinforcement Learning	Apr 15, 2024	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 44 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified