Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8451–8500 of 15113 papers

Title	Date	Tasks	Status	Hype
Multiple Tasks Integration: Tagging, Syntactic and Semantic Parsing as a Single Task	Apr 1, 2021	Dependency ParsingPart-Of-Speech Tagging	—Unverified	0
Optimization Algorithm for Feedback and Feedforward Policies towards Robot Control Robust to Sensing Failures	Apr 1, 2021	Reinforcement Learning (RL)	—Unverified	0
Trajectory Tracking of Underactuated Sea Vessels With Uncertain Dynamics: An Integral Reinforcement Learning Approach	Apr 1, 2021	Reinforcement Learning (RL)	—Unverified	0
AdaPool: A Diurnal-Adaptive Fleet Management Framework using Model-Free Deep Reinforcement Learning and Change Point Detection	Apr 1, 2021	Change Point DetectionDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Constrained Field Development Optimization in Subsurface Two-phase Flow	Mar 31, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Generalized Reinforcement Learning for Building Control using Behavioral Cloning	Mar 31, 2021	Cloud ComputingModel Predictive Control	—Unverified	0
RLAD: Time Series Anomaly Detection through Reinforcement Learning and Active Learning	Mar 31, 2021	Active LearningAnomaly Detection	—Unverified	0
Solving Heterogeneous General Equilibrium Economic Models with Deep Reinforcement Learning	Mar 31, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Simultaneous Navigation and Construction Benchmarking Environments	Mar 31, 2021	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
DEALIO: Data-Efficient Adversarial Learning for Imitation from Observation	Mar 31, 2021	Imitation LearningModel-based Reinforcement Learning	—Unverified	0
Energy Efficient Edge Computing: When Lyapunov Meets Distributed Reinforcement Learning	Mar 31, 2021	CPUEdge-computing	—Unverified	0
Co-Adaptation of Algorithmic and Implementational Innovations in Inference-based Deep Reinforcement Learning	Mar 31, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
FaiR-IoT: Fairness-aware Human-in-the-Loop Reinforcement Learning for Harnessing Human Variability in Personalized IoT	Mar 30, 2021	FairnessGeneral Reinforcement Learning	—Unverified	0
Towards Real-World Deployment of Reinforcement Learning for Traffic Signal Control	Mar 30, 2021	CPUOpenAI Gym	CodeCode Available	1
Greedy-GQ with Variance Reduction: Finite-time Analysis and Improved Complexity	Mar 30, 2021	Reinforcement Learning (RL)	—Unverified	0
Online Policies for Real-Time Control Using MRAC-RL	Mar 30, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement learning for optimization of variational quantum circuit architectures	Mar 30, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Resource Allocation in Business Processes	Mar 29, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Deep Hedging of Derivatives Using Reinforcement Learning	Mar 29, 2021	Positionreinforcement-learning	—Unverified	0
Reinforcement Learning Beyond Expectation	Mar 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
pH-RL: A personalization architecture to bring reinforcement learning to health practice	Mar 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Shaping Advice in Deep Multi-Agent Reinforcement Learning	Mar 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Augmenting Automated Game Testing with Deep Reinforcement Learning	Mar 29, 2021	Deep Reinforcement LearningFPS Games	—Unverified	0
Joint Resource Management for MC-NOMA: A Deep Reinforcement Learning Approach	Mar 29, 2021	Deep Reinforcement LearningManagement	—Unverified	0
Deep reinforcement learning of event-triggered communication and control for multi-agent cooperative transport	Mar 29, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
LASER: Learning a Latent Action Space for Efficient Reinforcement Learning	Mar 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Measuring Sample Efficiency and Generalization in Reinforcement Learning Benchmarks: NeurIPS 2020 Procgen Benchmark	Mar 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Robust Reinforcement Learning under model misspecification	Mar 29, 2021	Adversarial Attackmodel	CodeCode Available	0
ReAgent: Point Cloud Registration using Imitation and Reinforcement Learning	Mar 28, 2021	Imitation LearningPoint Cloud Registration	CodeCode Available	1
Self-adaptive Torque Vectoring Controller Using Reinforcement Learning	Mar 27, 2021	Frictionreinforcement-learning	CodeCode Available	0
KnowRU: Knowledge Reusing via Knowledge Distillation in Multi-agent Reinforcement Learning	Mar 27, 2021	Deep Reinforcement LearningKnowledge Distillation	—Unverified	0
Autonomous Overtaking in Gran Turismo Sport Using Curriculum Reinforcement Learning	Mar 26, 2021	Car Racingreinforcement-learning	—Unverified	0
Increasing the Efficiency of Policy Learning for Autonomous Vehicles by Multi-Task Representation Learning	Mar 26, 2021	Autonomous VehiclesDecision Making	—Unverified	0
A Convex Programming Approach to Data-Driven Risk-Averse Reinforcement Learning	Mar 26, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Agent with Warm Start and Adaptive Dynamic Termination for Plane Localization in 3D Ultrasound	Mar 26, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Bellman: A Toolbox for Model-Based Reinforcement Learning in TensorFlow	Mar 26, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1
Barrier Function-based Safe Reinforcement Learning for Emergency Control of Power Systems	Mar 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Character Controllers Using Motion VAEs	Mar 26, 2021	Continuous ControlDeep Reinforcement Learning	CodeCode Available	1
Model-Free Learning of Safe yet Effective Controllers	Mar 26, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Robust Parameterized Locomotion Control of Bipedal Robots	Mar 26, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
MedSelect: Selective Labeling for Medical Image Classification Combining Meta-Learning with Deep Reinforcement Learning	Mar 26, 2021	Deep Reinforcement LearningGeneral Classification	CodeCode Available	1
Nearly Horizon-Free Offline Reinforcement Learning	Mar 25, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Deceiving Reactive Jammers in Wireless Networks	Mar 25, 2021	channel selectionreinforcement-learning	—Unverified	0
AoA-Based Pilot Assignment in Massive MIMO Systems Using Deep Reinforcement Learning	Mar 25, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
A Meta-Reinforcement Learning Approach to Process Control	Mar 25, 2021	Deep Reinforcement LearningMeta-Learning	—Unverified	0
Improving Playtesting Coverage via Curiosity Driven Reinforcement Learning Agents	Mar 25, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Program-Triggered Reinforcement Learning Agents For Automated Driving	Mar 25, 2021	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Self-Imitation Learning by Planning	Mar 25, 2021	Imitation LearningMotion Planning	—Unverified	0
Model Predictive Actor-Critic: Accelerating Robot Skill Acquisition with Deep Reinforcement Learning	Mar 25, 2021	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1
Risk Bounds and Rademacher Complexity in Batch Reinforcement Learning	Mar 25, 2021	Learning Theoryreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 170 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified