Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8401–8450 of 15113 papers

Title	Date	Tasks	Status	Hype
Deep Reinforcement Learning Based Controller for Active Heave Compensation	Apr 12, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Learn Goal-Conditioned Policy with Intrinsic Motivation for Deep Reinforcement Learning	Apr 11, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
The Atari Data Scraper	Apr 11, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Imperfect also Deserves Reward: Multi-Level and Sequential Reward Modeling for Better Dialog Management	Apr 10, 2021	Managementreinforcement-learning	CodeCode Available	0
Symmetry reduction for deep reinforcement learning active control of chaotic spatiotemporal dynamics	Apr 9, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
CropGym: a Reinforcement Learning Environment for Crop Management	Apr 9, 2021	ManagementOpenAI Gym	CodeCode Available	1
Learning Sampling Policy for Faster Derivative Free Optimization	Apr 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Reinforcement-Learning-Based Energy-Efficient Framework for Multi-Task Video Analytics Pipeline	Apr 9, 2021	Deep Reinforcement LearningInstance Segmentation	—Unverified	0
Inverse Reinforcement Learning: A Control Lyapunov Approach	Apr 9, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Jamming-Resilient Path Planning for Multiple UAVs via Deep Reinforcement Learning	Apr 9, 2021	Collision AvoidanceDecision Making	—Unverified	0
Learning to Reweight Imaginary Transitions for Model-Based Reinforcement Learning	Apr 9, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Connecting Deep-Reinforcement-Learning-based Obstacle Avoidance with Conventional Global Planners using Waypoint Generators	Apr 8, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Graph Partitioning and Sparse Matrix Ordering using Reinforcement Learning and Graph Neural Networks	Apr 8, 2021	graph partitioningreinforcement-learning	CodeCode Available	1
Efficient time stepping for numerical integration using reinforcement learning	Apr 8, 2021	Meta-LearningNumerical Integration	CodeCode Available	0
ACERAC: Efficient reinforcement learning in fine time discretization	Apr 8, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A Bayesian Approach to Reinforcement Learning of Vision-Based Vehicular Control	Apr 8, 2021	Autonomous Drivingreinforcement-learning	CodeCode Available	0
A Reinforcement Learning Environment For Job-Shop Scheduling	Apr 8, 2021	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Arena-Rosnav: Towards Deployment of Deep-Reinforcement-Learning-Based Obstacle Avoidance into Conventional Autonomous Navigation Systems	Apr 8, 2021	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	1
Optimal Market Making by Reinforcement Learning	Apr 8, 2021	Q-Learningreinforcement-learning	CodeCode Available	1
The Value of Planning for Infinite-Horizon Model Predictive Control	Apr 7, 2021	Model Predictive ControlReinforcement Learning (RL)	CodeCode Available	0
Unsupervised Visual Attention and Invariance for Reinforcement Learning	Apr 7, 2021	Domain GeneralizationKeypoint Detection	—Unverified	0
Reinforcement Learning with a Disentangled Universal Value Function for Item Recommendation	Apr 7, 2021	Model-based Reinforcement LearningRecommendation Systems	—Unverified	0
Generating Multi-type Temporal Sequences to Mitigate Class-imbalanced Problem	Apr 7, 2021	BIG-bench Machine LearningClick-Through Rate Prediction	CodeCode Available	0
Non-Asymptotic Analysis for Two Time-scale TDC with General Smooth Function Approximation	Apr 7, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Improving Robustness of Deep Reinforcement Learning Agents: Environment Attack based on the Critic Network	Apr 7, 2021	Adversarial AttackDeep Reinforcement Learning	CodeCode Available	0
Risk-Conditioned Distributional Soft Actor-Critic for Risk-Sensitive Navigation	Apr 7, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable Physics	Apr 7, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Zeus: Efficiently Localizing Actions in Videos using Reinforcement Learning	Apr 6, 2021	Action ClassificationAction Detection	—Unverified	0
Progressive extension of reinforcement learning action dimension for asymmetric assembly tasks	Apr 6, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Design and implementation of an environment for Learning to Run a Power Network (L2RPN)	Apr 6, 2021	Mathreinforcement-learning	CodeCode Available	1
Approximate Robust NMPC using Reinforcement Learning	Apr 6, 2021	Model Predictive Controlreinforcement-learning	—Unverified	0
Distributed Deep Reinforcement Learning for Collaborative Spectrum Sharing	Apr 6, 2021	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0
Data-Driven Simulation of Ride-Hailing Services using Imitation and Reinforcement Learning	Apr 6, 2021	Imitation Learningreinforcement-learning	—Unverified	0
MPC-based Reinforcement Learning for Economic Problems with Application to Battery Storage	Apr 6, 2021	Model Predictive Controlreinforcement-learning	—Unverified	0
Temporal-Logic-Based Intermittent, Optimal, and Safe Continuous-Time Learning for Trajectory Tracking	Apr 6, 2021	Reinforcement Learning (RL)Safe Reinforcement Learning	—Unverified	0
C-COMA: A CONTINUAL REINFORCEMENT LEARNING MODEL FOR DYNAMIC MULTIAGENT ENVIRONMENTS	Apr 5, 2021	Continual LearningMulti-agent Reinforcement Learning	CodeCode Available	1
AMP: Adversarial Motion Priors for Stylized Physics-Based Character Control	Apr 5, 2021	Imitation LearningReinforcement Learning (RL)	CodeCode Available	2
A Dual-Critic Reinforcement Learning Framework for Frame-level Bit Allocation in HEVC/H.265	Apr 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Machine Learning Applications in the Routing in Computer Networks	Apr 5, 2021	BIG-bench Machine LearningReinforcement Learning (RL)	—Unverified	0
NQMIX: Non-monotonic Value Function Factorization for Deep Multi-Agent Reinforcement Learning	Apr 5, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Distributed Reinforcement Learning for Age of Information Minimization in Real-Time IoT Systems	Apr 4, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
SOLO: Search Online, Learn Offline for Combinatorial Optimization Problems	Apr 4, 2021	Combinatorial OptimizationDecision Making	—Unverified	0
Efficient Transformers in Reinforcement Learning using Actor-Learner Distillation	Apr 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Influencing Reinforcement Learning through Natural Language Guidance	Apr 4, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning Powered IRS-Assisted Downlink NOMA	Apr 3, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Dynamics Perspective of Pursuit-Evasion Games of Intelligent Agents with the Ability to Learn	Apr 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Emotional Text-to-Speech Synthesis with Improved Emotion Discriminability	Apr 3, 2021	Emotion Recognitionreinforcement-learning	—Unverified	0
Federated Double Deep Q-learning for Joint Delay and Energy Minimization in IoT networks	Apr 2, 2021	Deep Reinforcement LearningFederated Learning	—Unverified	0
How Are Learned Perception-Based Controllers Impacted by the Limits of Robust Control?	Apr 2, 2021	Reinforcement Learning (RL)	CodeCode Available	0
Low Dose Helical CBCT denoising by using domain filtering with deep reinforcement learning	Apr 2, 2021	Deep Reinforcement LearningDenoising	—Unverified	0

Show:10 25 50

← PrevPage 169 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified