Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9401–9425 of 15113 papers

Title	Date	Tasks	Status	Hype
LAVA: Latent Action Spaces via Variational Auto-encoding for Dialogue Policy Optimization	Nov 18, 2020	Decision MakingReinforcement Learning (RL)	—Unverified	0
Indoor Point-to-Point Navigation with Deep Reinforcement Learning and Ultra-wideband	Nov 18, 2020	Autonomous NavigationDeep Reinforcement Learning	—Unverified	0
Weighted Entropy Modification for Soft Actor-Critic	Nov 18, 2020	MuJoCoreinforcement-learning	—Unverified	0
Adaptive Contention Window Design using Deep Q-learning	Nov 18, 2020	Q-LearningReinforcement Learning (RL)	CodeCode Available	1
Counterfactual Credit Assignment in Model-Free Reinforcement Learning	Nov 18, 2020	counterfactualmodel	—Unverified	0
C-Learning: Learning to Achieve Goals via Recursive Classification	Nov 17, 2020	ClassificationDensity Estimation	—Unverified	0
Explaining Conditions for Reinforcement Learning Behaviors from Real and Imagined Data	Nov 17, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Multi-agent Reinforcement Learning Accelerated MCMC on Multiscale Inversion Problem	Nov 17, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
PassGoodPool: Joint Passengers and Goods Fleet Management with Reinforcement Learning aided Pricing, Matching, and Route Planning	Nov 17, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Modality-Buffet for Real-Time Object Detection	Nov 17, 2020	Decision MakingObject	—Unverified	0
SeekNet: Improved Human Instance Segmentation and Tracking via Reinforcement Learning Based Optimized Robot Relocation	Nov 17, 2020	Human DetectionHuman Instance Segmentation	—Unverified	0
REALab: An Embedded Perspective on Tampering	Nov 17, 2020	Reinforcement Learning (RL)	—Unverified	0
Reinforcement Learning of Graph Neural Networks for Service Function Chaining	Nov 17, 2020	Managementreinforcement-learning	—Unverified	0
Fault-Aware Robust Control via Adversarial Reinforcement Learning	Nov 17, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Stochastic Computation Offloading in Digital Twin Networks	Nov 17, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Efficient Exploration of Reward Functions in Inverse Reinforcement Learning via Bayesian Optimization	Nov 17, 2020	Bayesian OptimizationEfficient Exploration	—Unverified	0
Combining Reinforcement Learning with Model Predictive Control for On-Ramp Merging	Nov 17, 2020	Autonomous DrivingModel Predictive Control	CodeCode Available	1
Deep Reinforcement Learning and Permissioned Blockchain for Content Caching in Vehicular Edge Computing and Networks	Nov 17, 2020	Deep Reinforcement LearningEdge-computing	—Unverified	0
Curiosity Based Reinforcement Learning on Robot Manufacturing Cell	Nov 17, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Leveraging the Variance of Return Sequences for Exploration Policy	Nov 17, 2020	Atari Gamesreinforcement-learning	—Unverified	0
Towards Learning Controllable Representations of Physical Systems	Nov 16, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Towards a General Framework for ML-based Self-tuning Databases	Nov 16, 2020	Bayesian OptimizationReinforcement Learning (RL)	—Unverified	0
Scalable Reinforcement Learning Policies for Multi-Agent Control	Nov 16, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
NLPGym -- A toolkit for evaluating RL agents on Natural Language Processing Tasks	Nov 16, 2020	Multi-Label ClassificationMUlTI-LABEL-ClASSIFICATION	CodeCode Available	1
Value Function Approximations via Kernel Embeddings for No-Regret Reinforcement Learning	Nov 16, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0

Show:10 25 50

← PrevPage 377 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified