Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10026–10050 of 15113 papers

Title	Date	Tasks	Status
Curiosity Based Reinforcement Learning on Robot Manufacturing Cell	Nov 17, 2020	reinforcement-learningReinforcement Learning	—Unverified
Explaining Conditions for Reinforcement Learning Behaviors from Real and Imagined Data	Nov 17, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Fault-Aware Robust Control via Adversarial Reinforcement Learning	Nov 17, 2020	reinforcement-learningReinforcement Learning	—Unverified
Modality-Buffet for Real-Time Object Detection	Nov 17, 2020	Decision MakingObject	—Unverified
Reinforcement Learning of Graph Neural Networks for Service Function Chaining	Nov 17, 2020	Managementreinforcement-learning	—Unverified
Multi-agent Reinforcement Learning Accelerated MCMC on Multiscale Inversion Problem	Nov 17, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
SeekNet: Improved Human Instance Segmentation and Tracking via Reinforcement Learning Based Optimized Robot Relocation	Nov 17, 2020	Human DetectionHuman Instance Segmentation	—Unverified
REALab: An Embedded Perspective on Tampering	Nov 17, 2020	Reinforcement Learning (RL)	—Unverified
PassGoodPool: Joint Passengers and Goods Fleet Management with Reinforcement Learning aided Pricing, Matching, and Route Planning	Nov 17, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Towards a General Framework for ML-based Self-tuning Databases	Nov 16, 2020	Bayesian OptimizationReinforcement Learning (RL)	—Unverified
Value Function Approximations via Kernel Embeddings for No-Regret Reinforcement Learning	Nov 16, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards Learning Controllable Representations of Physical Systems	Nov 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reward Biased Maximum Likelihood Estimation for Reinforcement Learning	Nov 16, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Blind Decision Making: Reinforcement Learning with Delayed Observations	Nov 16, 2020	Decision Makingreinforcement-learning	—Unverified
Distilling a Hierarchical Policy for Planning and Control via Representation and Reinforcement Learning	Nov 16, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Constrained Model-Free Reinforcement Learning for Process Optimization	Nov 16, 2020	modelModel Predictive Control	—Unverified
ACDER: Augmented Curiosity-Driven Experience Replay	Nov 16, 2020	FetchPush-v1Reinforcement Learning (RL)	—Unverified
Analog Circuit Design with Dyna-Style Reinforcement Learning	Nov 16, 2020	Layout DesignModel-based Reinforcement Learning	—Unverified
Deep Reinforcement Learning for Cybersecurity Assessment of Wind Integrated Power Systems	Nov 15, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Placement in Integrated Circuits using Cyclic Reinforcement Learning and Simulated Annealing	Nov 15, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Data-Efficient Learning for Complex and Real-Time Physical Problem Solving using Augmented Simulation	Nov 14, 2020	Deep Reinforcement LearningModel Predictive Control	—Unverified
RL-QN: A Reinforcement Learning Framework for Optimal Control of Queueing Systems	Nov 14, 2020	Model-based Reinforcement Learningreinforcement-learning	—Unverified
A Geometric Perspective on Self-Supervised Policy Adaptation	Nov 14, 2020	Reinforcement Learning (RL)	—Unverified
Active Reinforcement Learning: Observing Rewards at a Cost	Nov 13, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Critic PI2: Master Continuous Planning via Policy Improvement with Path Integrals and Deep Actor-Critic Reinforcement Learning	Nov 13, 2020	continuous-controlContinuous Control	—Unverified

Show:10 25 50

← PrevPage 402 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified