Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9401–9450 of 15113 papers

Title	Date	Tasks	Status	Hype
LAVA: Latent Action Spaces via Variational Auto-encoding for Dialogue Policy Optimization	Nov 18, 2020	Decision MakingReinforcement Learning (RL)	—Unverified	0
Indoor Point-to-Point Navigation with Deep Reinforcement Learning and Ultra-wideband	Nov 18, 2020	Autonomous NavigationDeep Reinforcement Learning	—Unverified	0
Weighted Entropy Modification for Soft Actor-Critic	Nov 18, 2020	MuJoCoreinforcement-learning	—Unverified	0
Adaptive Contention Window Design using Deep Q-learning	Nov 18, 2020	Q-LearningReinforcement Learning (RL)	CodeCode Available	1
Counterfactual Credit Assignment in Model-Free Reinforcement Learning	Nov 18, 2020	counterfactualmodel	—Unverified	0
C-Learning: Learning to Achieve Goals via Recursive Classification	Nov 17, 2020	ClassificationDensity Estimation	—Unverified	0
Explaining Conditions for Reinforcement Learning Behaviors from Real and Imagined Data	Nov 17, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Multi-agent Reinforcement Learning Accelerated MCMC on Multiscale Inversion Problem	Nov 17, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
PassGoodPool: Joint Passengers and Goods Fleet Management with Reinforcement Learning aided Pricing, Matching, and Route Planning	Nov 17, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Modality-Buffet for Real-Time Object Detection	Nov 17, 2020	Decision MakingObject	—Unverified	0
SeekNet: Improved Human Instance Segmentation and Tracking via Reinforcement Learning Based Optimized Robot Relocation	Nov 17, 2020	Human DetectionHuman Instance Segmentation	—Unverified	0
REALab: An Embedded Perspective on Tampering	Nov 17, 2020	Reinforcement Learning (RL)	—Unverified	0
Reinforcement Learning of Graph Neural Networks for Service Function Chaining	Nov 17, 2020	Managementreinforcement-learning	—Unverified	0
Fault-Aware Robust Control via Adversarial Reinforcement Learning	Nov 17, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Stochastic Computation Offloading in Digital Twin Networks	Nov 17, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Exploration of Reward Functions in Inverse Reinforcement Learning via Bayesian Optimization	Nov 17, 2020	Bayesian OptimizationEfficient Exploration	—Unverified	0
Combining Reinforcement Learning with Model Predictive Control for On-Ramp Merging	Nov 17, 2020	Autonomous DrivingModel Predictive Control	CodeCode Available	1
Deep Reinforcement Learning and Permissioned Blockchain for Content Caching in Vehicular Edge Computing and Networks	Nov 17, 2020	Deep Reinforcement LearningEdge-computing	—Unverified	0
Curiosity Based Reinforcement Learning on Robot Manufacturing Cell	Nov 17, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Leveraging the Variance of Return Sequences for Exploration Policy	Nov 17, 2020	Atari Gamesreinforcement-learning	—Unverified	0
Towards Learning Controllable Representations of Physical Systems	Nov 16, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Towards a General Framework for ML-based Self-tuning Databases	Nov 16, 2020	Bayesian OptimizationReinforcement Learning (RL)	—Unverified	0
Scalable Reinforcement Learning Policies for Multi-Agent Control	Nov 16, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
NLPGym -- A toolkit for evaluating RL agents on Natural Language Processing Tasks	Nov 16, 2020	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	CodeCode Available	1
Value Function Approximations via Kernel Embeddings for No-Regret Reinforcement Learning	Nov 16, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reward Biased Maximum Likelihood Estimation for Reinforcement Learning	Nov 16, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified	0
Blind Decision Making: Reinforcement Learning with Delayed Observations	Nov 16, 2020	Decision Makingreinforcement-learning	—Unverified	0
Constrained Model-Free Reinforcement Learning for Process Optimization	Nov 16, 2020	modelModel Predictive Control	—Unverified	0
Learning Associative Inference Using Fast Weight Memory	Nov 16, 2020	Language ModellingMeta Reinforcement Learning	CodeCode Available	1
Analog Circuit Design with Dyna-Style Reinforcement Learning	Nov 16, 2020	Layout DesignModel-based Reinforcement Learning	—Unverified	0
Distilling a Hierarchical Policy for Planning and Control via Representation and Reinforcement Learning	Nov 16, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
ACDER: Augmented Curiosity-Driven Experience Replay	Nov 16, 2020	FetchPush-v1Reinforcement Learning (RL)	—Unverified	0
Hierarchical clustering in particle physics through reinforcement learning	Nov 16, 2020	Clusteringreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning for Cybersecurity Assessment of Wind Integrated Power Systems	Nov 15, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
CDT: Cascading Decision Trees for Explainable Reinforcement Learning	Nov 15, 2020	Deep Reinforcement LearningExplainable Models	CodeCode Available	1
Tonic: A Deep Reinforcement Learning Library for Fast Prototyping and Benchmarking	Nov 15, 2020	Benchmarkingcontinuous-control	CodeCode Available	1
Placement in Integrated Circuits using Cyclic Reinforcement Learning and Simulated Annealing	Nov 15, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
PLAS: Latent Action Space for Offline Reinforcement Learning	Nov 14, 2020	continuous-controlContinuous Control	CodeCode Available	1
Data-Efficient Learning for Complex and Real-Time Physical Problem Solving using Augmented Simulation	Nov 14, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified	0
A Geometric Perspective on Self-Supervised Policy Adaptation	Nov 14, 2020	Reinforcement Learning (RL)	—Unverified	0
SoftGym: Benchmarking Deep Reinforcement Learning for Deformable Object Manipulation	Nov 14, 2020	BenchmarkingDeep Reinforcement Learning	CodeCode Available	1
RL-QN: A Reinforcement Learning Framework for Optimal Control of Queueing Systems	Nov 14, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Control of a Biomechanical Model of the Upper Extremity	Nov 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Robust Quadruped Jumping via Deep Reinforcement Learning	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Query-based Targeted Action-Space Adversarial Policies on Deep Reinforcement Learning Agents	Nov 13, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Phoebe: Reuse-Aware Online Caching with Reinforcement Learning for Emerging Storage Models	Nov 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Scaffolding Reflection in Reinforcement Learning Framework for Confinement Escape Problem	Nov 13, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning Control of Constrained Dynamic Systems with Uniformly Ultimate Boundedness Stability Guarantee	Nov 13, 2020	continuous-controlContinuous Control	—Unverified	0
Robotic self-representation improves manipulation skills and transfer learning	Nov 13, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
ROLL: Visual Self-Supervised Reinforcement Learning with Object Reasoning	Nov 13, 2020	Multi-Goal Reinforcement LearningObject	CodeCode Available	1

Show:10 25 50

← PrevPage 189 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified