Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7551–7600 of 15113 papers

Title	Date	Tasks	Status
Automated Reinforcement Learning: An Overview	Jan 13, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Dyna-T: Dyna-Q and Upper Confidence Bounds Applied to Trees	Jan 12, 2022	Reinforcement Learning (RL)	—Unverified
The Recurrent Reinforcement Learning Crypto Agent	Jan 12, 2022	reinforcement-learningReinforcement Learning	—Unverified
Toddler-Guidance Learning: Impacts of Critical Period on Multimodal AI Agents	Jan 12, 2022	Reinforcement Learning (RL)Transfer Learning	—Unverified
Multi-echelon Supply Chains with Uncertain Seasonal Demands and Lead Times Using Deep Reinforcement Learning	Jan 12, 2022	Decision MakingDeep Reinforcement Learning	—Unverified
Task Independent Capsule-Based Agents for Deep Q-Learning	Jan 11, 2022	Deep Reinforcement LearningObject Recognition	—Unverified
Pavlovian Signalling with General Value Functions in Agent-Agent Temporal Decision Making	Jan 11, 2022	Decision Makingreinforcement-learning	—Unverified
STIR^2: Reward Relabelling for combined Reinforcement and Imitation Learning on sparse-reward tasks	Jan 11, 2022	Autonomous DrivingDecision Making	—Unverified
Active Reinforcement Learning -- A Roadmap Towards Curious Classifier Systems for Self-Adaptation	Jan 11, 2022	Active LearningAnomaly Detection	—Unverified
Benchmarking Deep Reinforcement Learning Algorithms for Vision-based Robotics	Jan 11, 2022	BenchmarkingDeep Reinforcement Learning	—Unverified
Automated Reinforcement Learning (AutoRL): A Survey and Open Problems	Jan 11, 2022	AutoMLMeta-Learning	—Unverified
Distributed Cooperative Multi-Agent Reinforcement Learning with Directed Coordination Graph	Jan 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Opportunities of Hybrid Model-based Reinforcement Learning for Cell Therapy Manufacturing Process Control	Jan 10, 2022	Decision MakingModel-based Reinforcement Learning	—Unverified
State of the Art of User Simulation approaches for conversational information retrieval	Jan 10, 2022	Decision MakingInformation Retrieval	—Unverified
When is Offline Two-Player Zero-Sum Markov Game Solvable?	Jan 10, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A Multi-agent Reinforcement Learning Approach for Efficient Client Selection in Federated Learning	Jan 9, 2022	Federated LearningMulti-agent Reinforcement Learning	—Unverified
Assessing Policy, Loss and Planning Combinations in Reinforcement Learning using a New Modular Architecture	Jan 8, 2022	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Neural Network Optimization for Reinforcement Learning Tasks Using Sparse Computations	Jan 7, 2022	Network Pruningreinforcement-learning	—Unverified
Offline Reinforcement Learning for Road Traffic Control	Jan 7, 2022	Offline RLreinforcement-learning	—Unverified
Combining Reinforcement Learning and Inverse Reinforcement Learning for Asset Allocation Recommendations	Jan 6, 2022	reinforcement-learningReinforcement Learning	—Unverified
Offsetting Unequal Competition through RL-assisted Incentive Schemes	Jan 5, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Deep Learning-based Predictive Control of Battery Management for Frequency Regulation	Jan 4, 2022	ManagementModel Predictive Control	CodeCode Available
Learning Complex Spatial Behaviours in ABM: An Experimental Observational Study	Jan 4, 2022	Decision MakingReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning, a textbook	Jan 4, 2022	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Analyzing Micro-Founded General Equilibrium Models with Many Agents using Deep Reinforcement Learning	Jan 3, 2022	Deep Reinforcement LearningGPU	—Unverified
Execute Order 66: Targeted Data Poisoning for Reinforcement Learning	Jan 3, 2022	Atari GamesData Poisoning	—Unverified
A Deeper Understanding of State-Based Critics in Multi-Agent Reinforcement Learning	Jan 3, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Actor-Critic Network for Q&A in an Adversarial Environment	Jan 3, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Toward Causal-Aware RL: State-Wise Action-Refined Temporal Difference	Jan 2, 2022	continuous-controlContinuous Control	CodeCode Available
Robust Algorithmic Collusion	Jan 2, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning for Task Specifications with Action-Constraints	Jan 2, 2022	Q-Learningreinforcement-learning	—Unverified
Temporal Complementarity-Guided Reinforcement Learning for Image-to-Video Person Re-Identification	Jan 1, 2022	Deep Reinforcement LearningImage-To-Video Person Re-Identification	—Unverified
Transfer RL across Observation Feature Spaces via Model-Based Regularization	Jan 1, 2022	Reinforcement Learning (RL)	—Unverified
Operator Deep Q-Learning: Zero-Shot Reward Transferring in Reinforcement Learning	Jan 1, 2022	Q-Learningreinforcement-learning	—Unverified
Toward Pareto Efficient Fairness-Utility Trade-off inRecommendation through Reinforcement Learning	Jan 1, 2022	FairnessMulti-Objective Reinforcement Learning	—Unverified
Symmetry-Aware Neural Architecture for Embodied Visual Exploration	Jan 1, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Joint Learning-Based Stabilization of Multiple Unknown Linear Systems	Jan 1, 2022	Reinforcement Learning (RL)	—Unverified
A Surrogate-Assisted Controller for Expensive Evolutionary Reinforcement Learning	Jan 1, 2022	continuous-controlContinuous Control	—Unverified
Importance of Empirical Sample Complexity Analysis for Offline Reinforcement Learning	Dec 31, 2021	Offline RLreinforcement-learning	—Unverified
Stochastic convex optimization for provably efficient apprenticeship learning	Dec 31, 2021	Imitation Learningreinforcement-learning	—Unverified
A Theoretical Understanding of Gradient Bias in Meta-Reinforcement Learning	Dec 31, 2021	Atari GamesMeta Reinforcement Learning	CodeCode Available
Using Graph-Aware Reinforcement Learning to Identify Winning Strategies in Diplomacy Games (Student Abstract)	Dec 31, 2021	reinforcement-learningReinforcement Learning	—Unverified
Single-Shot Pruning for Offline Reinforcement Learning	Dec 31, 2021	continuous-controlContinuous Control	—Unverified
Robust Entropy-regularized Markov Decision Processes	Dec 31, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified
Stability-Preserving Automatic Tuning of PID Control with Reinforcement Learning	Dec 30, 2021	reinforcement-learningReinforcement Learning	—Unverified
Multi-Agent Reinforcement Learning via Adaptive Kalman Temporal Difference and Successor Representation	Dec 30, 2021	Multi-agent Reinforcement LearningOpenAI Gym	—Unverified
Reversible Upper Confidence Bound Algorithm to Generate Diverse Optimized Candidates	Dec 30, 2021	Drug Discoveryreinforcement-learning	—Unverified
MORAL: Aligning AI with Human Norms through Multi-Objective Reinforced Active Learning	Dec 30, 2021	Active LearningEthics	CodeCode Available
Constructing a Good Behavior Basis for Transfer using Generalized Policy Updates	Dec 30, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Constraint Sampling Reinforcement Learning: Incorporating Expertise For Faster Learning	Dec 30, 2021	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 152 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified