Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12351–12400 of 15113 papers

Title	Date	Tasks	Status	Hype
Injecting Prior Knowledge for Transfer Learning into Reinforcement Learning Algorithms using Logic Tensor Networks	Jun 15, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Self-Tuning Sectorization: Deep Reinforcement Learning Meets Broadcast Beam Optimization	Jun 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking Oracle	Jun 14, 2019	Q-Learningreinforcement-learning	—Unverified	0
Epistemic Risk-Sensitive Reinforcement Learning	Jun 14, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Cross-View Policy Learning for Street Navigation	Jun 13, 2019	Deep Reinforcement LearningNavigate	CodeCode Available	0
Sub-policy Adaptation for Hierarchical Reinforcement Learning	Jun 13, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified	0
Modeling and Interpreting Real-world Human Risk Decision Making with Inverse Reinforcement Learning	Jun 13, 2019	Decision Makingreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Cyber Security	Jun 13, 2019	Deep Reinforcement LearningIntrusion Detection	—Unverified	0
Deep Reinforcement Learning for Industrial Insertion Tasks with Visual Inputs and Natural Rewards	Jun 13, 2019	Deep Reinforcement LearningFriction	CodeCode Available	0
Conditioning of Reinforcement Learning Agents and its Policy Regularization Application	Jun 13, 2019	continuous-controlContinuous Control	—Unverified	0
Goal-conditioned Imitation Learning	Jun 13, 2019	Imitation LearningReinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning for Unmanned Aerial Vehicle-Assisted Vehicular Networks	Jun 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Knowledge Graph Reasoning for Explainable Recommendation	Jun 12, 2019	Causal InferenceDecision Making	CodeCode Available	0
When to use parametric models in reinforcement learning?	Jun 12, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Regret Minimization for Reinforcement Learning by Evaluating the Optimal Bias Function	Jun 12, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Optimal Control for Reference Tracking Independent of Exo-System Dynamics	Jun 12, 2019	Autonomous Drivingreinforcement-learning	—Unverified	0
Search on the Replay Buffer: Bridging Planning and Reinforcement Learning	Jun 12, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Sub-Goal Trees -- a Framework for Goal-Directed Trajectory Prediction and Optimization	Jun 12, 2019	Motion Planningreinforcement-learning	—Unverified	0
Reinforcement Learning of Minimalist Numeral Grammars	Jun 11, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Channel Coding: Learned Bit-Flipping Decoding	Jun 11, 2019	Decision Makingreinforcement-learning	CodeCode Available	0
Reinforcement Learning for Integer Programming: Learning to Cut	Jun 11, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Towards Inverse Reinforcement Learning for Limit Order Book Dynamics	Jun 11, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Learning to Score Behaviors for Guided Policy Optimization	Jun 11, 2019	Efficient ExplorationImitation Learning	CodeCode Available	0
Dealing with Non-Stationarity in Multi-Agent Deep Reinforcement Learning	Jun 11, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
Continual Reinforcement Learning deployed in Real-life using Policy Distillation and Sim2Real Transfer	Jun 11, 2019	Continual Learningreinforcement-learning	—Unverified	0
A Hybrid Approach Between Adversarial Generative Networks and Actor-Critic Policy Gradient for Low Rate High-Resolution Image Compression	Jun 11, 2019	DecoderImage Compression	—Unverified	0
Causal Discovery with Reinforcement Learning	Jun 11, 2019	Causal DiscoveryCombinatorial Optimization	—Unverified	0
Exploration via Hindsight Goal Generation	Jun 10, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Deep Reinforcement Learning with Discrete Normalized Advantage Functions for Resource Management in Network Slicing	Jun 10, 2019	Deep Reinforcement LearningManagement	—Unverified	0
Boosting Soft Actor-Critic: Emphasizing Recent Experience without Forgetting the Past	Jun 10, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
A Survey of Reinforcement Learning Informed by Natural Language	Jun 10, 2019	Decision MakingInstruction Following	—Unverified	0
Neural Keyphrase Generation via Reinforcement Learning with Adaptive Rewards	Jun 10, 2019	Keyphrase Generationreinforcement-learning	CodeCode Available	0
Model-Based Reinforcement Learning with a Generative Model is Minimax Optimal	Jun 10, 2019	modelModel-based Reinforcement Learning	—Unverified	0
Gossip-based Actor-Learner Architectures for Deep Reinforcement Learning	Jun 9, 2019	Deep Reinforcement LearningGPU	CodeCode Available	0
Curiosity-Driven Multi-Criteria Hindsight Experience Replay	Jun 9, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Intrinsically Efficient, Stable, and Bounded Off-Policy Evaluation for Reinforcement Learning	Jun 9, 2019	Multi-Armed BanditsOff-policy evaluation	CodeCode Available	0
Neural Heterogeneous Scheduler	Jun 9, 2019	Decision MakingDeep Reinforcement Learning	—Unverified	0
Transfer Learning by Modeling a Distribution over Policies	Jun 9, 2019	Deep Reinforcement LearningDiversity	—Unverified	0
SVRG for Policy Evaluation with Fewer Gradient Evaluations	Jun 9, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Towards Optimal Off-Policy Evaluation for Reinforcement Learning with Marginalized Importance Sampling	Jun 8, 2019	Off-policy evaluationreinforcement-learning	—Unverified	0
Multi-modal Active Learning From Human Data: A Deep Reinforcement Learning Approach	Jun 7, 2019	Active LearningDeep Reinforcement Learning	—Unverified	0
Preference-based Interactive Multi-Document Summarisation	Jun 7, 2019	Active Learningreinforcement-learning	CodeCode Available	0
Worst-Case Regret Bounds for Exploration via Randomized Value Functions	Jun 7, 2019	Efficient Explorationreinforcement-learning	—Unverified	0
Non-Stationary Reinforcement Learning: The Blessing of (More) Optimism	Jun 7, 2019	Decision Makingreinforcement-learning	—Unverified	0
Ego-Pose Estimation and Forecasting as Real-Time PD Control	Jun 7, 2019	Egocentric Pose EstimationHuman Pose Forecasting	CodeCode Available	0
Improving Exploration in Soft-Actor-Critic with Normalizing Flows Policies	Jun 6, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available	0
Playing the lottery with rewards and multiple languages: lottery tickets in RL and NLP	Jun 6, 2019	image-classificationImage Classification	—Unverified	0
Towards Interpretable Reinforcement Learning Using Attention Augmented Agents	Jun 6, 2019	Image CaptioningQuestion Answering	CodeCode Available	0
Clustered Reinforcement Learning	Jun 6, 2019	Atari GamesClustering	—Unverified	0
An Extensible Interactive Interface for Agent Design	Jun 6, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 248 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified