Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11801–11850 of 15113 papers

Title	Date	Tasks	Status
Learning from Trajectories via Subgoal Discovery	Nov 3, 2019	Imitation LearningReinforcement Learning	CodeCode Available
Thompson Sampling for Contextual Bandit Problems with Auxiliary Safety Constraints	Nov 2, 2019	Bayesian OptimizationDecision Making	—Unverified
On Solving the 2-Dimensional Greedy Shooter Problem for UAVs	Nov 2, 2019	Q-Learningreinforcement-learning	CodeCode Available
Neural Topic Model with Reinforcement Learning	Nov 1, 2019	modelreinforcement-learning	—Unverified
Situated GAIL: Multitask imitation using task-conditioned adversarial inverse reinforcement learning	Nov 1, 2019	Imitation Learningreinforcement-learning	—Unverified
Positive-Unlabeled Reward Learning	Nov 1, 2019	Imitation LearningReinforcement Learning	—Unverified
Incorporating Graph Attention Mechanism into Knowledge Graph Reasoning Based on Deep Reinforcement Learning	Nov 1, 2019	Deep Reinforcement LearningGraph Attention	—Unverified
DIVINE: A Generative Adversarial Imitation Learning Framework for Knowledge Graph Reasoning	Nov 1, 2019	Imitation LearningKnowledge Graphs	—Unverified
Generalized Speedy Q-learning	Nov 1, 2019	Q-LearningReinforcement Learning	CodeCode Available
Generating Formality-Tuned Summaries Using Input-Dependent Rewards	Nov 1, 2019	Abstractive Text Summarizationreinforcement-learning	—Unverified
Exploring Diverse Expressions for Paraphrase Generation	Nov 1, 2019	DiversityInformation Retrieval	—Unverified
Frequentist Regret Bounds for Randomized Least-Squares Value Iteration	Nov 1, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
A2: Extracting Cyclic Switchings from DOB-nets for Rejecting Excessive Disturbances	Nov 1, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning the Extraction Order of Multiple Relational Facts in a Sentence with Reinforcement Learning	Nov 1, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning-based Text Anonymization against Private-Attribute Inference	Nov 1, 2019	AttributeDeep Reinforcement Learning	—Unverified
Explicit Explore-Exploit Algorithms in Continuous State Spaces	Nov 1, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Answer-Supervised Question Reformulation for Enhancing Conversational Machine Comprehension	Nov 1, 2019	Reading Comprehensionreinforcement-learning	—Unverified
Cascaded LSTMs based Deep Reinforcement Learning for Goal-driven Dialogue	Oct 31, 2019	Deep Reinforcement LearningDialogue Management	CodeCode Available
DeepLine: AutoML Tool for Pipelines Generation using Deep Reinforcement Learning and Hierarchical Actions Filtering	Oct 31, 2019	AutoMLBIG-bench Machine Learning	—Unverified
Hierarchical Expert Networks for Meta-Learning	Oct 31, 2019	image-classificationImage Classification	—Unverified
VASE: Variational Assorted Surprise Exploration for Reinforcement Learning	Oct 31, 2019	continuous-controlContinuous Control	—Unverified
RLINK: Deep Reinforcement Learning for User Identity Linkage	Oct 31, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
RBED: Reward Based Epsilon Decay	Oct 30, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Policy Continuation with Hindsight Inverse Dynamics	Oct 30, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Learning Algorithmic Solutions to Symbolic Planning Tasks with a Neural Computer Architecture	Oct 30, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Distributed Model-Free Algorithm for Multi-hop Ride-sharing using Deep Reinforcement Learning	Oct 30, 2019	Autonomous VehiclesDeep Reinforcement Learning	—Unverified
DADI: Dynamic Discovery of Fair Information with Adversarial Reinforcement Learning	Oct 30, 2019	Fairnessreinforcement-learning	—Unverified
Deep Reinforcement Learning for Distributed Uncoordinated Cognitive Radios Resource Allocation	Oct 29, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Sampling Quasi-Newton Methods for Derivative-Free Stochastic Optimization	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep reinforcement learning for market making in corporate bonds: beating the curse of dimensionality	Oct 29, 2019	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Decentralized Reinforcement Learning for Cooperative Control	Oct 29, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Overcoming Catastrophic Interference in Online Reinforcement Learning with Dynamic Self-Organizing Maps	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Navigation Agents for the Visually Impaired: A Sidewalk Simulator and Experiments	Oct 29, 2019	NavigateReinforcement Learning	CodeCode Available
Feedback Linearization for Unknown Systems via Reinforcement Learning	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Constrained Reinforcement Learning Has Zero Duality Gap	Oct 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Robust Model-free Reinforcement Learning with Multi-objective Bayesian Optimization	Oct 29, 2019	Bayesian Optimizationreinforcement-learning	—Unverified
Biomimetic Ultra-Broadband Perfect Absorbers Optimised with Reinforcement Learning	Oct 28, 2019	Q-Learningreinforcement-learning	—Unverified
Asynchronous Methods for Model-Based Reinforcement Learning	Oct 28, 2019	modelModel-based Reinforcement Learning	CodeCode Available
Certified Adversarial Robustness for Deep Reinforcement Learning	Oct 28, 2019	Adversarial RobustnessCollision Avoidance	—Unverified
Generalization in Reinforcement Learning with Selective Noise Injection and Information Bottleneck	Oct 28, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Quantum enhancements for deep reinforcement learning in large spaces	Oct 28, 2019	BIG-bench Machine LearningDecision Making	CodeCode Available
Entity Abstraction in Visual Model-Based Reinforcement Learning	Oct 28, 2019	modelModel-based Reinforcement Learning	CodeCode Available
Model-Free Mean-Field Reinforcement Learning: Mean-Field MDP and Mean-Field Q-Learning	Oct 28, 2019	General Reinforcement LearningQ-Learning	—Unverified
Neural Architecture Evolution in Deep Reinforcement Learning for Continuous Control	Oct 28, 2019	continuous-controlContinuous Control	—Unverified
Minimax Weight and Q-Function Learning for Off-Policy Evaluation	Oct 28, 2019	Off-policy evaluationReinforcement Learning	—Unverified
Task-Oriented Language Grounding for Language Input with Multiple Sub-Goals of Non-Linear Order	Oct 27, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
BAIL: Best-Action Imitation Learning for Batch Deep Reinforcement Learning	Oct 27, 2019	Deep Reinforcement LearningImitation Learning	CodeCode Available
Convergent Policy Optimization for Safe Reinforcement Learning	Oct 26, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Reinforcement Learning-Enabled Reliable Wireless Sensor Networks in Dynamic Underground Environments	Oct 26, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
ZPD Teaching Strategies for Deep Reinforcement Learning from Demonstrations	Oct 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 237 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified