Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11451–11500 of 15113 papers

Title	Date	Tasks	Status	Hype
Identifying Cognitive Radars -- Inverse Reinforcement Learning using Revealed Preferences	Dec 1, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Adversary A3C for Robust Reinforcement Learning	Dec 1, 2019	Atari Gamesreinforcement-learning	—Unverified	0
Optimization for Reinforcement Learning: From Single Agent to Cooperative Agents	Dec 1, 2019	Distributed OptimizationMulti-agent Reinforcement Learning	—Unverified	0
Regret Bounds for Learning State Representations in Reinforcement Learning	Dec 1, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Propagating Uncertainty in Reinforcement Learning via Wasserstein Barycenters	Dec 1, 2019	Atari GamesQ-Learning	CodeCode Available	0
Privacy-Preserving Q-Learning with Functional Noise in Continuous Spaces	Dec 1, 2019	Privacy PreservingQ-Learning	CodeCode Available	0
No-Press Diplomacy: Modeling Multi-Agent Gameplay	Dec 1, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Provably Efficient Q-learning with Function Approximation via Distribution Shift Error Checking Oracle	Dec 1, 2019	Q-Learningreinforcement-learning	—Unverified	0
SMILe: Scalable Meta Inverse Reinforcement Learning through Context-Conditional Policies	Dec 1, 2019	continuous-controlContinuous Control	CodeCode Available	0
Non-Stationary Markov Decision Processes, a Worst-Case Approach using Model-Based Reinforcement Learning	Dec 1, 2019	Model-based Reinforcement LearningReinforcement Learning	CodeCode Available	0
Near-Optimal Reinforcement Learning in Dynamic Treatment Regimes	Dec 1, 2019	Decision Makingreinforcement-learning	—Unverified	0
Text-Based Interactive Recommendation via Constraint-Augmented Reinforcement Learning	Dec 1, 2019	Interactive RecommendationRecommendation Systems	—Unverified	0
Neural Trust Region/Proximal Policy Optimization Attains Globally Optimal Policy	Dec 1, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Loaded DiCE: Trading off Bias and Variance in Any-Order Score Function Gradient Estimators for Reinforcement Learning	Dec 1, 2019	continuous-controlContinuous Control	CodeCode Available	0
Neural Temporal-Difference Learning Converges to Global Optima	Dec 1, 2019	Deep Reinforcement LearningQ-Learning	—Unverified	0
Learning Generalizable Device Placement Algorithms for Distributed Machine Learning	Dec 1, 2019	BIG-bench Machine LearningReinforcement Learning	CodeCode Available	0
A Model-Based Reinforcement Learning with Adversarial Training for Online Recommendation	Dec 1, 2019	Generative Adversarial NetworkModel-based Reinforcement Learning	CodeCode Available	0
A Family of Robust Stochastic Operators for Reinforcement Learning	Dec 1, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Local Search Heuristics for Boolean Satisfiability	Dec 1, 2019	Deep Reinforcement LearningGraph Neural Network	CodeCode Available	0
Explicit Planning for Efficient Exploration in Reinforcement Learning	Dec 1, 2019	Efficient Explorationreinforcement-learning	—Unverified	0
LIIR: Learning Individual Intrinsic Reward in Multi-Agent Reinforcement Learning	Dec 1, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Learning Reward Machines for Partially Observable Reinforcement Learning	Dec 1, 2019	Partially Observable Reinforcement LearningProblem Decomposition	CodeCode Available	0
Adaptive Auxiliary Task Weighting for Reinforcement Learning	Dec 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Park: An Open Platform for Learning-Augmented Computer Systems	Dec 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Regret Minimization for Reinforcement Learning with Vectorial Feedback and Complex Objectives	Dec 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Staying up to Date with Online Content Changes Using Reinforcement Learning for Scheduling	Dec 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Mix and Match: Markov Chains & Mixing Times for Matching in Rideshare	Nov 30, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
IMPACT: Importance Weighted Asynchronous Architectures with Clipped Target Networks	Nov 30, 2019	continuous-controlContinuous Control	—Unverified	0
Quadratic Q-network for Learning Continuous Control for Autonomous Vehicles	Nov 29, 2019	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Simulation-based reinforcement learning for real-world autonomous driving	Nov 29, 2019	Autonomous Drivingreinforcement-learning	CodeCode Available	0
Induction of Subgoal Automata for Reinforcement Learning	Nov 29, 2019	Inductive logic programmingreinforcement-learning	—Unverified	0
Distributed Soft Actor-Critic with Multivariate Reward Representation and Knowledge Distillation	Nov 29, 2019	Knowledge Distillationreinforcement-learning	CodeCode Available	0
Multi-Agent Deep Reinforcement Learning with Adaptive Policies	Nov 28, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Playing Games in the Dark: An approach for cross-modality transfer in reinforcement learning	Nov 28, 2019	OpenAI Gymreinforcement-learning	CodeCode Available	0
Stigmergic Independent Reinforcement Learning for Multi-Agent Collaboration	Nov 28, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Augmented Random Search for Quadcopter Control: An alternative to Reinforcement Learning	Nov 28, 2019	continuous-controlContinuous Control	—Unverified	0
Improving Neural Relation Extraction with Positive and Unlabeled Learning	Nov 28, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Algorithmic Improvements for Deep Reinforcement Learning applied to Interactive Fiction	Nov 28, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Model-Based Reinforcement Learning via Estimated Uncertainty and Conservative Policy Optimization	Nov 28, 2019	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	0
Restoring Chaos Using Deep Reinforcement Learning	Nov 27, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Towards Similarity Graphs Constructed by Deep Reinforcement Learning	Nov 27, 2019	Deep Reinforcement Learninggraph construction	CodeCode Available	0
Improving Fictitious Play Reinforcement Learning with Expanding Models	Nov 27, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
GRIm-RePR: Prioritising Generating Important Features for Pseudo-Rehearsal	Nov 27, 2019	Atari GamesContinual Learning	—Unverified	0
Adversarial Deep Reinforcement Learning based Adaptive Moving Target Defense	Nov 27, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Behavior Regularized Offline Reinforcement Learning	Nov 26, 2019	continuous-controlContinuous Control	—Unverified	0
A General Framework on Enhancing Portfolio Management with Reinforcement Learning	Nov 26, 2019	Asset ManagementDeep Reinforcement Learning	—Unverified	0
Join Query Optimization with Deep Reinforcement Learning Algorithms	Nov 26, 2019	AttributeDeep Reinforcement Learning	CodeCode Available	0
Control-Tutored Reinforcement Learning: an application to the Herding Problem	Nov 26, 2019	Q-Learningreinforcement-learning	—Unverified	0
Natural Language Generation Using Reinforcement Learning with External Rewards	Nov 26, 2019	Decoderreinforcement-learning	CodeCode Available	0
Multi-Vehicle Mixed-Reality Reinforcement Learning for Autonomous Multi-Lane Driving	Nov 26, 2019	Autonomous DrivingAutonomous Vehicles	—Unverified	0

Show:10 25 50

← PrevPage 230 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified