Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10926–10950 of 15113 papers

Title	Date	Tasks	Status
Domain Knowledge Integration By Gradient Matching For Sample-Efficient Reinforcement Learning	May 28, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Intelligent Residential Energy Management System using Deep Reinforcement Learning	May 28, 2020	Deep Reinforcement Learningenergy management	—Unverified
Revisiting Parameter Sharing in Multi-Agent Deep Reinforcement Learning	May 27, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available
Time-Variant Variational Transfer for Value Functions	May 26, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Towards intervention-centric causal reasoning in learning agents	May 26, 2020	Deep Reinforcement LearningMeta-Learning	—Unverified
Anomaly Detection Under Controlled Sensing Using Actor-Critic Reinforcement Learning	May 26, 2020	Anomaly DetectionDecision Making	—Unverified
A reinforcement learning approach to rare trajectory sampling	May 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
ALBA : Reinforcement Learning for Video Object Segmentation	May 26, 2020	ObjectOne-shot visual object segmentation	CodeCode Available
Integrating LEO Satellite and UAV Relaying via Reinforcement Learning for Non-Terrestrial Networks	May 26, 2020	Deep Reinforcement LearningDimensionality Reduction	—Unverified
Active Measure Reinforcement Learning for Observation Cost Minimization	May 26, 2020	Decision MakingQ-Learning	—Unverified
Breaking the Sample Size Barrier in Model-Based Reinforcement Learning with a Generative Model	May 26, 2020	modelModel-based Reinforcement Learning	—Unverified
Efficient Use of heuristics for accelerating XCS-based Policy Learning in Markov Games	May 26, 2020	Reinforcement Learning (RL)	—Unverified
Gradient Monitored Reinforcement Learning	May 25, 2020	Atari Gamescontinuous-control	—Unverified
Generator and Critic: A Deep Reinforcement Learning Approach for Slate Re-ranking in E-commerce	May 25, 2020	Deep Reinforcement LearningDiversity	—Unverified
Dynamic Value Estimation for Single-Task Multi-Scene Reinforcement Learning	May 25, 2020	ClusteringDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning Based Power Allocation for D2D Network	May 25, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Deep Learning Models for Automatic Summarization	May 25, 2020	Deep Learningreinforcement-learning	—Unverified
Policy Entropy for Out-of-Distribution Classification	May 25, 2020	BenchmarkingClassification	—Unverified
Optimization-driven Deep Reinforcement Learning for Robust Beamforming in IRS-assisted Wireless Communications	May 25, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Meta-Reinforcement Learning for Trajectory Design in Wireless UAV Networks	May 25, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Reinforcement Learning with Iterative Reasoning for Merging in Dense Traffic	May 25, 2020	Autonomous Vehiclesreinforcement-learning	—Unverified
Model-free Reinforcement Learning for Stochastic Stackelberg Security Games	May 24, 2020	reinforcement-learningReinforcement Learning	—Unverified
GoChat: Goal-oriented Chatbots with Hierarchical Reinforcement Learning	May 24, 2020	ChatbotHierarchical Reinforcement Learning	—Unverified
Automatic Discovery of Interpretable Planning Strategies	May 24, 2020	ClusteringDecision Making	CodeCode Available
Evaluating Generalisation in General Video Game Playing	May 22, 2020	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 438 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified