Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4026–4050 of 15113 papers

Title	Date	Tasks	Status
Structured Reinforcement Learning for Delay-Optimal Data Transmission in Dense mmWave Networks	Apr 25, 2024	FairnessMulti-Armed Bandits	—Unverified
GRSN: Gated Recurrent Spiking Neurons for POMDPs and MARL	Apr 24, 2024	reinforcement-learningReinforcement Learning	—Unverified
ActiveRIR: Active Audio-Visual Exploration for Acoustic Environment Modeling	Apr 24, 2024	Reinforcement Learning (RL)	—Unverified
DPO: A Differential and Pointwise Control Approach to Reinforcement Learning	Apr 24, 2024	Benchmarkingreinforcement-learning	—Unverified
An MRP Formulation for Supervised Learning: Generalized Temporal Difference Learning Models	Apr 23, 2024	image-classificationImage Classification	—Unverified
Impedance Matching: Enabling an RL-Based Running Jump in a Quadruped Robot	Apr 23, 2024	Reinforcement Learning (RL)	—Unverified
Using deep reinforcement learning to promote sustainable human behaviour on a common pool resource problem	Apr 23, 2024	Deep Reinforcement Learningreinforcement-learning	—Unverified
Planning the path with Reinforcement Learning: Optimal Robot Motion Planning in RoboCup Small Size League Environments	Apr 23, 2024	Motion PlanningReinforcement Learning (RL)	CodeCode Available
Reinforcement Learning with Adaptive Regularization for Safe Control of Critical Systems	Apr 23, 2024	Reinforcement Learning (RL)	CodeCode Available
Multi-view Disentanglement for Reinforcement Learning with Multiple Cameras	Apr 22, 2024	Disentanglementreinforcement-learning	CodeCode Available
Explicit Lipschitz Value Estimation Enhances Policy Robustness Against Perturbation	Apr 22, 2024	continuous-controlContinuous Control	—Unverified
Fairness Incentives in Response to Unfair Dynamic Pricing	Apr 22, 2024	FairnessReinforcement Learning (RL)	—Unverified
Beyond the Edge: An Advanced Exploration of Reinforcement Learning for Mobile Edge Computing, its Applications, and Future Research Trajectories	Apr 22, 2024	Edge-computingReinforcement Learning (RL)	—Unverified
An Offline Reinforcement Learning Algorithm Customized for Multi-Task Fusion in Large-Scale Recommender Systems	Apr 19, 2024	Efficient ExplorationMulti-Task Learning	—Unverified
Continuous-time Risk-sensitive Reinforcement Learning via Quadratic Variation Penalty	Apr 19, 2024	Q-Learningreinforcement-learning	—Unverified
Data-Incremental Continual Offline Reinforcement Learning	Apr 19, 2024	Continual LearningOffline RL	—Unverified
Reinforcement Learning Approach for Integrating Compressed Contexts into Knowledge Graphs	Apr 19, 2024	Knowledge Graphsreinforcement-learning	—Unverified
TrajDeleter: Enabling Trajectory Forgetting in Offline Reinforcement Learning Agents	Apr 18, 2024	energy managementOffline RL	CodeCode Available
Actor-Critic Reinforcement Learning with Phased Actor	Apr 18, 2024	Policy Gradient Methodsreinforcement-learning	—Unverified
LTL-Constrained Policy Optimization with Cycle Experience Replay	Apr 17, 2024	continuous-controlContinuous Control	—Unverified
Learn to Tour: Operator Design For Solution Feasibility Mapping in Pickup-and-delivery Traveling Salesman Problem	Apr 17, 2024	Reinforcement Learning (RL)Traveling Salesman Problem	—Unverified
Prompt Optimizer of Text-to-Image Diffusion Models for Abstract Concept Understanding	Apr 17, 2024	Language ModelingLanguage Modelling	—Unverified
Physics-informed Actor-Critic for Coordination of Virtual Inertia from Power Distribution Systems	Apr 17, 2024	Reinforcement Learning (RL)	—Unverified
Achieving Constant Regret in Linear Markov Decision Processes	Apr 16, 2024	Reinforcement Learning (RL)	—Unverified
Simplex Decomposition for Portfolio Allocation Constraints in Reinforcement Learning	Apr 16, 2024	Portfolio Optimizationreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 162 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified