Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 4676–4700 of 15113 papers

Title	Date	Tasks	Status	Hype
Reinforcement Learning Approach for Multi-Agent Flexible Scheduling Problems	Oct 7, 2022	Combinatorial OptimizationDecision Making	—Unverified	0
Multi-agent Deep Covering Skill Discovery	Oct 7, 2022	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
BAFFLE: Hiding Backdoors in Offline Reinforcement Learning Datasets	Oct 7, 2022	Autonomous DrivingBackdoor Attack	CodeCode Available	1
How to Enable Uncertainty Estimation in Proximal Policy Optimization	Oct 7, 2022	Deep Reinforcement LearningOut of Distribution (OOD) Detection	—Unverified	0
Advice Conformance Verification by Reinforcement Learning agents for Human-in-the-Loop	Oct 7, 2022	Decision Makingreinforcement-learning	—Unverified	0
Algorithmic Trading Using Continuous Action Space Deep Reinforcement Learning	Oct 7, 2022	Algorithmic TradingDeep Reinforcement Learning	—Unverified	0
Low-Thrust Orbital Transfer using Dynamics-Agnostic Reinforcement Learning	Oct 6, 2022	reinforcement-learningReinforcement Learning	—Unverified	0
Digital Human Interactive Recommendation Decision-Making Based on Reinforcement Learning	Oct 6, 2022	Decision MakingGraph Embedding	—Unverified	0
Deep Inventory Management	Oct 6, 2022	Deep Reinforcement LearningManagement	—Unverified	0
Exploration via Planning for Information about the Optimal Trajectory	Oct 6, 2022	Reinforcement Learning (RL)	CodeCode Available	1
Neuroevolution is a Competitive Alternative to Reinforcement Learning for Skill Discovery	Oct 6, 2022	Deep Reinforcement LearningDiversity	CodeCode Available	1
Lyapunov Function Consistent Adaptive Network Signal Control with Back Pressure and Reinforcement Learning	Oct 6, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Rainier: Reinforced Knowledge Introspector for Commonsense Question Answering	Oct 6, 2022	Question AnsweringReinforcement Learning (RL)	CodeCode Available	1
Meta Reinforcement Learning for Optimal Design of Legged Robots	Oct 6, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning with Large Action Spaces for Neural Machine Translation	Oct 6, 2022	Machine TranslationNMT	—Unverified	0
Learning Algorithms for Intelligent Agents and Mechanisms	Oct 6, 2022	Decision Makingreinforcement-learning	—Unverified	0
Deep Reinforcement Learning based Evasion Generative Adversarial Network for Botnet Detection	Oct 6, 2022	Deep Reinforcement LearningGenerative Adversarial Network	CodeCode Available	1
Distributionally Adaptive Meta Reinforcement Learning	Oct 6, 2022	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Discovering faster matrix multiplication algorithms with reinforcement learning	Oct 5, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	4
A Novel Entropy-Maximizing TD3-based Reinforcement Learning for Automatic PID Tuning	Oct 5, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Option-Aware Adversarial Inverse Reinforcement Learning for Robotic Control	Oct 5, 2022	Imitation LearningMulti-Task Learning	CodeCode Available	1
DreamShard: Generalizable Embedding Table Placement for Recommender Systems	Oct 5, 2022	GPURecommendation Systems	CodeCode Available	1
Query The Agent: Improving sample efficiency through epistemic uncertainty estimation	Oct 5, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Towards Safe Mechanical Ventilation Treatment Using Deep Offline Reinforcement Learning	Oct 5, 2022	Deep Reinforcement LearningQ-Learning	CodeCode Available	0
Real-Time Reinforcement Learning for Vision-Based Robotics Utilizing Local and Remote Computers	Oct 5, 2022	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1

Show:10 25 50

← PrevPage 188 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified