Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12501–12550 of 15113 papers

Title	Date	Tasks	Status
Injecting Prior Knowledge for Transfer Learning into Reinforcement Learning Algorithms using Logic Tensor Networks	Jun 15, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Epistemic Risk-Sensitive Reinforcement Learning	Jun 14, 2019	reinforcement-learningReinforcement Learning	—Unverified
Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking Oracle	Jun 14, 2019	Q-Learningreinforcement-learning	—Unverified
Self-Tuning Sectorization: Deep Reinforcement Learning Meets Broadcast Beam Optimization	Jun 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sub-policy Adaptation for Hierarchical Reinforcement Learning	Jun 13, 2019	Decision MakingHierarchical Reinforcement Learning	—Unverified
Modeling and Interpreting Real-world Human Risk Decision Making with Inverse Reinforcement Learning	Jun 13, 2019	Decision Makingreinforcement-learning	—Unverified
Goal-conditioned Imitation Learning	Jun 13, 2019	Imitation LearningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Industrial Insertion Tasks with Visual Inputs and Natural Rewards	Jun 13, 2019	Deep Reinforcement LearningFriction	CodeCode Available
Cross-View Policy Learning for Street Navigation	Jun 13, 2019	Deep Reinforcement LearningNavigate	CodeCode Available
Deep Reinforcement Learning for Cyber Security	Jun 13, 2019	Deep Reinforcement LearningIntrusion Detection	—Unverified
Conditioning of Reinforcement Learning Agents and its Policy Regularization Application	Jun 13, 2019	continuous-controlContinuous Control	—Unverified
Deep Reinforcement Learning for Unmanned Aerial Vehicle-Assisted Vehicular Networks	Jun 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sub-Goal Trees -- a Framework for Goal-Directed Trajectory Prediction and Optimization	Jun 12, 2019	Motion Planningreinforcement-learning	—Unverified
Regret Minimization for Reinforcement Learning by Evaluating the Optimal Bias Function	Jun 12, 2019	reinforcement-learningReinforcement Learning	—Unverified
Adaptive Optimal Control for Reference Tracking Independent of Exo-System Dynamics	Jun 12, 2019	Autonomous Drivingreinforcement-learning	—Unverified
Search on the Replay Buffer: Bridging Planning and Reinforcement Learning	Jun 12, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Knowledge Graph Reasoning for Explainable Recommendation	Jun 12, 2019	Causal InferenceDecision Making	CodeCode Available
Reinforcement Learning for Channel Coding: Learned Bit-Flipping Decoding	Jun 11, 2019	Decision Makingreinforcement-learning	CodeCode Available
Reinforcement Learning of Minimalist Numeral Grammars	Jun 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Integer Programming: Learning to Cut	Jun 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning to Score Behaviors for Guided Policy Optimization	Jun 11, 2019	Efficient ExplorationImitation Learning	CodeCode Available
Towards Inverse Reinforcement Learning for Limit Order Book Dynamics	Jun 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Hybrid Approach Between Adversarial Generative Networks and Actor-Critic Policy Gradient for Low Rate High-Resolution Image Compression	Jun 11, 2019	DecoderImage Compression	—Unverified
Causal Discovery with Reinforcement Learning	Jun 11, 2019	Causal DiscoveryCombinatorial Optimization	—Unverified
Continual Reinforcement Learning deployed in Real-life using Policy Distillation and Sim2Real Transfer	Jun 11, 2019	Continual Learningreinforcement-learning	—Unverified
Dealing with Non-Stationarity in Multi-Agent Deep Reinforcement Learning	Jun 11, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning with Discrete Normalized Advantage Functions for Resource Management in Network Slicing	Jun 10, 2019	Deep Reinforcement LearningManagement	—Unverified
Exploration via Hindsight Goal Generation	Jun 10, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
A Survey of Reinforcement Learning Informed by Natural Language	Jun 10, 2019	Decision MakingInstruction Following	—Unverified
Model-Based Reinforcement Learning with a Generative Model is Minimax Optimal	Jun 10, 2019	modelModel-based Reinforcement Learning	—Unverified
Neural Keyphrase Generation via Reinforcement Learning with Adaptive Rewards	Jun 10, 2019	Keyphrase Generationreinforcement-learning	CodeCode Available
SVRG for Policy Evaluation with Fewer Gradient Evaluations	Jun 9, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Transfer Learning by Modeling a Distribution over Policies	Jun 9, 2019	Deep Reinforcement LearningDiversity	—Unverified
Neural Heterogeneous Scheduler	Jun 9, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Intrinsically Efficient, Stable, and Bounded Off-Policy Evaluation for Reinforcement Learning	Jun 9, 2019	Multi-Armed BanditsOff-policy evaluation	CodeCode Available
Gossip-based Actor-Learner Architectures for Deep Reinforcement Learning	Jun 9, 2019	Deep Reinforcement LearningGPU	CodeCode Available
Curiosity-Driven Multi-Criteria Hindsight Experience Replay	Jun 9, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Towards Optimal Off-Policy Evaluation for Reinforcement Learning with Marginalized Importance Sampling	Jun 8, 2019	Off-policy evaluationreinforcement-learning	—Unverified
Preference-based Interactive Multi-Document Summarisation	Jun 7, 2019	Active Learningreinforcement-learning	CodeCode Available
Multi-modal Active Learning From Human Data: A Deep Reinforcement Learning Approach	Jun 7, 2019	Active LearningDeep Reinforcement Learning	—Unverified
Worst-Case Regret Bounds for Exploration via Randomized Value Functions	Jun 7, 2019	Efficient Explorationreinforcement-learning	—Unverified
Non-Stationary Reinforcement Learning: The Blessing of (More) Optimism	Jun 7, 2019	Decision Makingreinforcement-learning	—Unverified
Ego-Pose Estimation and Forecasting as Real-Time PD Control	Jun 7, 2019	Egocentric Pose EstimationHuman Pose Forecasting	CodeCode Available
Deep Reinforcement Learning for Multi-objective Optimization	Jun 6, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
DeepMDP: Learning Continuous Latent Space Models for Representation Learning	Jun 6, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Combining Reinforcement Learning and Configuration Checking for Maximum k-plex Problem	Jun 6, 2019	Combinatorial Optimizationreinforcement-learning	—Unverified
An Extensible Interactive Interface for Agent Design	Jun 6, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified
Improving Exploration in Soft-Actor-Critic with Normalizing Flows Policies	Jun 6, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Clustered Reinforcement Learning	Jun 6, 2019	Atari GamesClustering	—Unverified
Towards Interpretable Reinforcement Learning Using Attention Augmented Agents	Jun 6, 2019	Image CaptioningQuestion Answering	CodeCode Available

Show:10 25 50

← PrevPage 251 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified