Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4951–4975 of 15113 papers

Title	Date	Tasks	Status
PEARL: Zero-shot Cross-task Preference Alignment and Robust Reward Learning for Robotic Manipulation	Jun 6, 2023	Offline RLReinforcement Learning (RL)	—Unverified
Model-Based Reinforcement Learning with Multi-Task Offline Pretraining	Jun 6, 2023	Knowledge DistillationModel-based Reinforcement Learning	CodeCode Available
Mildly Constrained Evaluation Policy for Offline Reinforcement Learning	Jun 6, 2023	D4RLMuJoCo	CodeCode Available
Boosting Offline Reinforcement Learning with Action Preference Query	Jun 6, 2023	Autonomous DrivingD4RL	—Unverified
CAVEN: An Embodied Conversational Agent for Efficient Audio-Visual Navigation in Noisy Environments	Jun 6, 2023	Hierarchical Reinforcement LearningNavigate	—Unverified
A Novel Multi-Agent Deep RL Approach for Traffic Signal Control	Jun 5, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
A General Perspective on Objectives of Reinforcement Learning	Jun 5, 2023	reinforcement-learningReinforcement Learning	—Unverified
Action-Evolution Petri Nets: a Framework for Modeling and Solving Dynamic Task Assignment Problems	Jun 5, 2023	Reinforcement Learning (RL)	—Unverified
Risk-Aware Reward Shaping of Reinforcement Learning Agents for Autonomous Driving	Jun 5, 2023	Autonomous DrivingMotion Planning	CodeCode Available
Survival Instinct in Offline Reinforcement Learning	Jun 5, 2023	Offline RLreinforcement-learning	—Unverified
Cycle Consistency Driven Object Discovery	Jun 3, 2023	ObjectObject Discovery	—Unverified
Improving the generalizability and robustness of large-scale traffic signal control	Jun 2, 2023	Deep Reinforcement LearningDistributional Reinforcement Learning	—Unverified
Interpretable and Explainable Logical Policies via Neurally Guided Symbolic Abstraction	Jun 2, 2023	Reinforcement Learning (RL)	—Unverified
Efficient Reinforcement Learning with Impaired Observability: Learning to Act with Delayed and Missing State Observations	Jun 2, 2023	Reinforcement Learning (RL)	—Unverified
An Architecture for Deploying Reinforcement Learning in Industrial Environments	Jun 2, 2023	reinforcement-learningReinforcement Learning	—Unverified
Deep Q-Learning versus Proximal Policy Optimization: Performance Comparison in a Material Sorting Task	Jun 2, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
A Modular Test Bed for Reinforcement Learning Incorporation into Industrial Applications	Jun 2, 2023	reinforcement-learningReinforcement Learning	—Unverified
Hyperparameters in Reinforcement Learning and How To Tune Them	Jun 2, 2023	AutoMLDeep Reinforcement Learning	—Unverified
Learning to Stabilize Online Reinforcement Learning in Unbounded State Spaces	Jun 2, 2023	Attributereinforcement-learning	CodeCode Available
Reinforcement Learning with General Utilities: Simpler Variance Reduction and Large State-Action Space	Jun 2, 2023	Reinforcement Learning (RL)	—Unverified
Non-stationary Reinforcement Learning under General Function Approximation	Jun 1, 2023	reinforcement-learningReinforcement Learning	—Unverified
Normalization Enhances Generalization in Visual Reinforcement Learning	Jun 1, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Heterogeneous Knowledge for Augmented Modular Reinforcement Learning	Jun 1, 2023	Decision Makingreinforcement-learning	—Unverified
Delphic Offline Reinforcement Learning under Nonidentifiable Hidden Confounding	Jun 1, 2023	ManagementOffline RL	—Unverified
Identifiability and Generalizability in Constrained Inverse Reinforcement Learning	Jun 1, 2023	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 199 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified