Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11151–11200 of 15113 papers

Title	Date	Tasks	Status	Hype
Representation of Reinforcement Learning Policies in Reproducing Kernel Hilbert Spaces	Feb 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning in Factored MDPs: Oracle-Efficient Algorithms and Tighter Regret Bounds for the Non-Episodic Setting	Feb 6, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Multi Type Mean Field Reinforcement Learning	Feb 6, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Temporal-adaptive Hierarchical Reinforcement Learning	Feb 6, 2020	Atari GamesHierarchical Reinforcement Learning	—Unverified	0
Soft Hindsight Experience Replay	Feb 6, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Provably Efficient Online Hyperparameter Optimization with Population-Based Bandits	Feb 6, 2020	Hyperparameter OptimizationReinforcement Learning	CodeCode Available	1
Social diversity and social preferences in mixed-motive reinforcement learning	Feb 6, 2020	Diversityreinforcement-learning	—Unverified	0
Attractive or Faithful? Popularity-Reinforced Learning for Inspired Headline Generation	Feb 6, 2020	ArticlesHeadline Generation	CodeCode Available	1
Mutual Information-based State-Control for Intrinsically Motivated Reinforcement Learning	Feb 5, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Radial-Basis Value Functions for Continuous Control	Feb 5, 2020	continuous-controlContinuous Control	—Unverified	0
Does the Markov Decision Process Fit the Data: Testing for the Markov Property in Sequential Decision Making	Feb 5, 2020	Decision Makingreinforcement-learning	CodeCode Available	1
Dynamic Causal Effects Evaluation in A/B Testing with a Reinforcement Learning Framework	Feb 5, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Learning Task-Driven Control Policies via Information Bottlenecks	Feb 4, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Bootstrapping a DQN Replay Memory with Synthetic Experiences	Feb 4, 2020	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Finite Time Analysis of Linear Two-timescale Stochastic Approximation with Markovian Noise	Feb 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Policy Gradient based Quantum Approximate Optimization Algorithm	Feb 4, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Finite-Sample Analysis of Stochastic Approximation Using Smooth Convex Envelopes	Feb 3, 2020	Q-LearningReinforcement Learning	—Unverified	0
Effective Diversity in Population Based Reinforcement Learning	Feb 3, 2020	DiversityPoint Processes	CodeCode Available	1
Evolutionary algorithms for constructing an ensemble of decision trees	Feb 3, 2020	Evolutionary Algorithmsreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Autonomous Driving: A Survey	Feb 2, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
Integrating Deep Reinforcement Learning with Model-based Path Planners for Automated Driving	Feb 2, 2020	Deep Reinforcement LearningNavigate	CodeCode Available	1
PolicyGNN: Aggregation Optimization for Graph Neural Networks	Feb 1, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Periodic Intra-Ensemble Knowledge Distillation for Reinforcement Learning	Feb 1, 2020	Knowledge DistillationMuJoCo	CodeCode Available	0
Towards the Systematic Reporting of the Energy and Carbon Footprints of Machine Learning	Jan 31, 2020	BIG-bench Machine Learningreinforcement-learning	CodeCode Available	1
Preventing Imitation Learning with Adversarial Policy Ensembles	Jan 31, 2020	Imitation Learningreinforcement-learning	—Unverified	0
Locally Private Distributed Reinforcement Learning	Jan 31, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A Deep Reinforcement Learning Approach to Concurrent Bilateral Negotiation	Jan 31, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Predicting Goal-directed Attention Control Using Inverse-Reinforcement Learning	Jan 31, 2020	BIG-bench Machine Learningreinforcement-learning	—Unverified	0
Survey of Deep Reinforcement Learning for Motion Planning of Autonomous Vehicles	Jan 30, 2020	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Goal-directed graph construction using reinforcement learning	Jan 30, 2020	Decision Makinggraph construction	CodeCode Available	1
Robust Multimodal Image Registration Using Deep Recurrent Reinforcement Learning	Jan 29, 2020	Image RegistrationMedical Image Registration	—Unverified	0
Asymptotically Efficient Off-Policy Evaluation for Tabular Reinforcement Learning	Jan 29, 2020	Off-policy evaluationreinforcement-learning	—Unverified	0
Distal Explanations for Model-free Explainable Reinforcement Learning	Jan 28, 2020	modelreinforcement-learning	—Unverified	0
Data-driven control of micro-climate in buildings: an event-triggered reinforcement learning approach	Jan 28, 2020	Decision MakingReinforcement Learning	—Unverified	0
Real-time calibration of coherent-state receivers: learning by trial and error	Jan 28, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Some Insights into Lifelong Reinforcement Learning Systems	Jan 27, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Rotation, Translation, and Cropping for Zero-Shot Generalization	Jan 27, 2020	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
Unsupervised Program Synthesis for Images By Sampling Without Replacement	Jan 27, 2020	Program SynthesisReinforcement Learning (RL)	—Unverified	0
Computing the Feedback Capacity of Finite State Channels using Reinforcement Learning	Jan 27, 2020	Computational EfficiencyDecision Making	CodeCode Available	0
Challenges and Countermeasures for Adversarial Attacks on Deep Reinforcement Learning	Jan 27, 2020	Autonomous VehiclesDeep Reinforcement Learning	CodeCode Available	0
Developing Multi-Task Recommendations with Long-Term Rewards via Policy Distilled Reinforcement Learning	Jan 27, 2020	Deep Reinforcement LearningKnowledge Distillation	—Unverified	0
Reinforcement Learning-based Application Autoscaling in the Cloud: A Survey	Jan 27, 2020	Cloud ComputingDecision Making	—Unverified	0
Tractable Reinforcement Learning of Signal Temporal Logic Objectives	Jan 26, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Sentiment and Knowledge Based Algorithmic Trading with Deep Reinforcement Learning	Jan 26, 2020	Algorithmic TradingDeep Reinforcement Learning	—Unverified	0
Constrained Upper Confidence Reinforcement Learning	Jan 26, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Multitask radiological modality invariant landmark localization using deep reinforcement learning	Jan 25, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Deep Reinforcement Learning based Blind mmWave MIMO Beam Alignment	Jan 25, 2020	Deep Reinforcement LearningPolicy Gradient Methods	—Unverified	0
Following Instructions by Imagining and Reaching Visual Goals	Jan 25, 2020	Instruction FollowingReinforcement Learning	—Unverified	0
Pricing commodity swing options	Jan 24, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
EgoMap: Projective mapping and structured egocentric memory for Deep RL	Jan 24, 2020	Deep Reinforcement LearningMemorization	—Unverified	0

Show:10 25 50

← PrevPage 224 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified