Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2051–2075 of 15113 papers

Title	Date	Tasks	Status	Hype
Diffusion Actor-Critic with Entropy Regulator	May 24, 2024	Decision MakingMuJoCo	CodeCode Available	2
Efficient Recurrent Off-Policy RL Requires a Context-Encoder-Specific Learning Rate	May 24, 2024	Decision MakingReinforcement Learning (RL)	CodeCode Available	1
Cross-Domain Policy Adaptation by Capturing Representation Mismatch	May 24, 2024	Reinforcement Learning (RL)Representation Learning	CodeCode Available	1
Generating Code World Models with Large Language Models Guided by Monte Carlo Tree Search	May 24, 2024	Code GenerationLanguage Modelling	CodeCode Available	1
Blood Glucose Control Via Pre-trained Counterfactual Invertible Neural Networks	May 23, 2024	counterfactualCounterfactual Inference	—Unverified	0
Efficiently Training Deep-Learning Parametric Policies using Lagrangian Duality	May 23, 2024	Decision MakingDecision Making Under Uncertainty	—Unverified	0
PEAC: Unsupervised Pre-training for Cross-Embodiment Reinforcement Learning	May 23, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	1
Exclusively Penalized Q-learning for Offline Reinforcement Learning	May 23, 2024	Offline RLQ-Learning	—Unverified	0
Offline Reinforcement Learning from Datasets with Structured Non-Stationarity	May 23, 2024	continuous-controlContinuous Control	CodeCode Available	0
AGILE: A Novel Reinforcement Learning Framework of LLM Agents	May 23, 2024	Question Answeringreinforcement-learning	CodeCode Available	2
Which Experiences Are Influential for RL Agents? Efficiently Estimating The Influence of Experiences	May 23, 2024	Reinforcement Learning (RL)	CodeCode Available	0
A finite time analysis of distributed Q-learning	May 23, 2024	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Multi-turn Reinforcement Learning from Preference Human Feedback	May 23, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	1
Policy Gradient Methods for Risk-Sensitive Distributional Reinforcement Learning with Provable Convergence	May 23, 2024	Distributional Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Variational Delayed Policy Optimization	May 23, 2024	MuJoCoReinforcement Learning (RL)	CodeCode Available	0
Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow	May 22, 2024	IngenuityMuJoCo	CodeCode Available	1
Autonomous Algorithm for Training Autonomous Vehicles with Minimal Human Intervention	May 22, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Learning to sample fibers for goodness-of-fit testing	May 22, 2024	Reinforcement Learning (RL)	—Unverified	0
Leader Reward for POMO-Based Neural Combinatorial Optimization	May 22, 2024	Combinatorial OptimizationReinforcement Learning (RL)	—Unverified	0
Lusifer: LLM-based User SImulated Feedback Environment for online Recommender systems	May 22, 2024	Collaborative FilteringRecommendation Systems	CodeCode Available	0
Large Language Models (LLMs) Assisted Wireless Network Deployment in Urban Settings	May 22, 2024	NavigateReinforcement Learning (RL)	—Unverified	0
Knowledge Graph Reasoning with Self-supervised Reinforcement Learning	May 22, 2024	Knowledge Graphsreinforcement-learning	CodeCode Available	1
HighwayLLM: Decision-Making and Navigation in Highway Driving with RL-Informed Language Model	May 22, 2024	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Multi-Agent Reinforcement Learning with Hierarchical Coordination for Emergency Responder Stationing	May 21, 2024	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
CausalPlayground: Addressing Data-Generation Requirements in Cutting-Edge Causality Research	May 21, 2024	Reinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 83 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified