Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 5201–5250 of 15113 papers

Title	Date	Tasks	Status
A Framework for History-Aware Hyperparameter Optimisation in Reinforcement Learning	Mar 9, 2023	Decision Makingreinforcement-learning	—Unverified
Exploiting Contextual Structure to Generate Useful Auxiliary Tasks	Mar 9, 2023	counterfactualCounterfactual Reasoning	—Unverified
Computably Continuous Reinforcement-Learning Objectives are PAC-learnable	Mar 9, 2023	General Reinforcement Learningreinforcement-learning	—Unverified
Evolving Populations of Diverse RL Agents with MAP-Elites	Mar 9, 2023	Reinforcement Learning (RL)	—Unverified
Conceptual Reinforcement Learning for Language-Conditioned Tasks	Mar 9, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
RACCER: Towards Reachable and Certain Counterfactual Explanations for Reinforcement Learning	Mar 8, 2023	counterfactualreinforcement-learning	CodeCode Available
Using Memory-Based Learning to Solve Tasks with State-Action Constraints	Mar 8, 2023	Deep Reinforcement Learningreinforcement-learning	—Unverified
MCTS-GEB: Monte Carlo Tree Search is a Good E-graph Builder	Mar 8, 2023	graph constructionReinforcement Learning (RL)	CodeCode Available
On the Sample Complexity of Vanilla Model-Based Offline Reinforcement Learning with Dependent Samples	Mar 7, 2023	Offline RLOff-policy evaluation	—Unverified
Graph Decision Transformer	Mar 7, 2023	Offline RLOpenAI Gym	—Unverified
Learning When to Treat Business Processes: Prescriptive Process Monitoring with Causal Inference and Reinforcement Learning	Mar 7, 2023	Causal InferenceConformal Prediction	CodeCode Available
adaPARL: Adaptive Privacy-Aware Reinforcement Learning for Sequential-Decision Making Human-in-the-Loop Systems	Mar 7, 2023	Decision MakingReinforcement Learning (RL)	—Unverified
Environment Transformer and Policy Optimization for Model-Based Offline Reinforcement Learning	Mar 7, 2023	Continuous ControlOffline RL	—Unverified
Deep Occupancy-Predictive Representations for Autonomous Driving	Mar 7, 2023	Autonomous DrivingAutonomous Vehicles	—Unverified
Domain Randomization for Robust, Affordable and Effective Closed-loop Control of Soft Robots	Mar 7, 2023	reinforcement-learningReinforcement Learning	—Unverified
Evolutionary Reinforcement Learning: A Survey	Mar 7, 2023	Board GamesHyperparameter Optimization	—Unverified
Decoupling Skill Learning from Robotic Control for Generalizable Object Manipulation	Mar 7, 2023	Imitation LearningReinforcement Learning (RL)	—Unverified
Efficient Skill Acquisition for Complex Manipulation Tasks in Obstructed Environments	Mar 6, 2023	Deep Reinforcement LearningMotion Planning	—Unverified
Safe Reinforcement Learning via Probabilistic Logic Shields	Mar 6, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
MAESTRO: Open-Ended Environment Design for Multi-Agent Reinforcement Learning	Mar 6, 2023	continuous-controlContinuous Control	—Unverified
Perspectives on the Social Impacts of Reinforcement Learning with Human Feedback	Mar 6, 2023	Misinformationreinforcement-learning	—Unverified
Dexterous In-hand Manipulation by Guiding Exploration with Simple Sub-skill Controllers	Mar 6, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning Based Self-play and State Stacking Techniques for Noisy Air Combat Environment	Mar 6, 2023	Reinforcement Learning (RL)	—Unverified
Swim: A General-Purpose, High-Performing, and Efficient Activation Function for Locomotion Control Tasks	Mar 5, 2023	continuous-controlContinuous Control	CodeCode Available
Sparsity-Aware Intelligent Massive Random Access Control in Open RAN: A Reinforcement Learning Based Approach	Mar 5, 2023	ManagementReinforcement Learning (RL)	—Unverified
Improved Sample Complexity Bounds for Distributionally Robust Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Ensemble Reinforcement Learning: A Survey	Mar 5, 2023	Ensemble LearningModel Selection	—Unverified
Local Environment Poisoning Attacks on Federated Reinforcement Learning	Mar 5, 2023	Federated LearningOpenAI Gym	—Unverified
Bounding the Optimal Value Function in Compositional Reinforcement Learning	Mar 5, 2023	reinforcement-learningReinforcement Learning	CodeCode Available
Look-Ahead AC Optimal Power Flow: A Model-Informed Reinforcement Learning Approach	Mar 4, 2023	Decision Makingreinforcement-learning	—Unverified
CFlowNets: Continuous Control with Generative Flow Networks	Mar 4, 2023	Active Learningcontinuous-control	CodeCode Available
Double A3C: Deep Reinforcement Learning on OpenAI Gym Games	Mar 4, 2023	Atari GamesDeep Reinforcement Learning	—Unverified
Wasserstein Actor-Critic: Directed Exploration via Optimism for Continuous-Actions Control	Mar 4, 2023	MuJoCoQ-Learning	—Unverified
Toward Risk-based Optimistic Exploration for Cooperative Multi-Agent Reinforcement Learning	Mar 3, 2023	Distributional Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Tile Networks: Learning Optimal Geometric Layout for Whole-page Recommendation	Mar 3, 2023	Learning-To-Rankreinforcement-learning	—Unverified
RePreM: Representation Pre-training with Masked Model for Reinforcement Learning	Mar 3, 2023	Data AugmentationLanguage Modeling	—Unverified
Guarded Policy Optimization with Imperfect Online Demonstrations	Mar 3, 2023	continuous-controlContinuous Control	—Unverified
Intelligent O-RAN Traffic Steering for URLLC Through Deep Reinforcement Learning	Mar 3, 2023	Deep Reinforcement LearningQ-Learning	—Unverified
Hindsight States: Blending Sim and Real Task Elements for Efficient Reinforcement Learning	Mar 3, 2023	reinforcement-learningReinforcement Learning (RL)	—Unverified
Approximating Energy Market Clearing and Bidding With Model-Based Reinforcement Learning	Mar 3, 2023	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Learning to Influence Human Behavior with Offline Reinforcement Learning	Mar 3, 2023	Autonomous DrivingOffline RL	—Unverified
Co-learning Planning and Control Policies Constrained by Differentiable Logic Specifications	Mar 2, 2023	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Domain Adaptation of Reinforcement Learning Agents based on Network Service Proximity	Mar 2, 2023	Domain AdaptationManagement	—Unverified
Data-efficient, Explainable and Safe Box Manipulation: Illustrating the Advantages of Physical Priors in Model-Predictive Control	Mar 2, 2023	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Expert-Free Online Transfer Learning in Multi-Agent Reinforcement Learning	Mar 2, 2023	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
GHQ: Grouped Hybrid Q Learning for Heterogeneous Cooperative Multi-agent Reinforcement Learning	Mar 2, 2023	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available
Compensating for Sensing Failures via Delegation in Human-AI Hybrid Systems	Mar 2, 2023	AttributeDecision Making	—Unverified
Parameter Sharing with Network Pruning for Scalable Multi-Agent Deep Reinforcement Learning	Mar 2, 2023	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Self-Improving Robots: End-to-End Autonomous Visuomotor Reinforcement Learning	Mar 2, 2023	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Guided Multi-Objective Exam Paper Generation	Mar 2, 2023	Knowledge TracingPaper generation	CodeCode Available

Show:10 25 50

← PrevPage 105 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified