Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9926–9950 of 15113 papers

Title	Date	Tasks	Status
Driving-Policy Adaptive Safeguard for Autonomous Vehicles Using Reinforcement Learning	Dec 2, 2020	Autonomous VehiclesCollision Avoidance	—Unverified
Are Gradient-based Saliency Maps Useful in Deep Reinforcement Learning?	Dec 2, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
BSODA: A Bipartite Scalable Framework for Online Disease Diagnosis	Dec 2, 2020	Disease PredictionReinforcement Learning (RL)	—Unverified
Combining Cognitive Modeling and Reinforcement Learning for Clarification in Dialogue	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Is Long Horizon RL More Difficult Than Short Horizon RL?	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
ExpanRL: Hierarchical Reinforcement Learning for Course Concept Expansion in MOOCs	Dec 1, 2020	DiversityHierarchical Reinforcement Learning	—Unverified
EcoLight: Intersection Control in Developing Regions Under Extreme Budget and Network Constraints	Dec 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improving Neural Machine Translation for Sanskrit-English	Dec 1, 2020	Machine Translationreinforcement-learning	—Unverified
Improving the Naturalness and Diversity of Referring Expression Generation models using Minimum Risk Training	Dec 1, 2020	DiversityReferring Expression	—Unverified
Almost Optimal Model-Free Reinforcement Learningvia Reference-Advantage Decomposition	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
Assessing and Accelerating Coverage in Deep Reinforcement Learning	Dec 1, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Instance-based Generalization in Reinforcement Learning	Dec 1, 2020	Deep Reinforcement LearningGeneralization Bounds	—Unverified
Leverage the Average: an Analysis of KL Regularization in Reinforcement Learning	Dec 1, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Answer-driven Deep Question Generation based on Reinforcement Learning	Dec 1, 2020	DecoderQuestion Generation	—Unverified
A Local Temporal Difference Code for Distributional Reinforcement Learning	Dec 1, 2020	Distributional Reinforcement LearningImputation	—Unverified
A Learning-Exploring Method to Generate Diverse Paraphrases with Multi-Objective Deep Reinforcement Learning	Dec 1, 2020	Deep Reinforcement LearningDiversity	—Unverified
A new convergent variant of Q-learning with linear function approximation	Dec 1, 2020	Q-LearningReinforcement Learning (RL)	—Unverified
Can Temporal-Diﬀerence and Q-Learning Learn Representation? A Mean-Field Theory	Dec 1, 2020	Deep Reinforcement LearningQ-Learning	—Unverified
Robust Multi-Agent Reinforcement Learning with Model Uncertainty	Dec 1, 2020	modelMulti-agent Reinforcement Learning	—Unverified
Promoting Stochasticity for Expressive Policies via a Simple and Efficient Regularization Method	Dec 1, 2020	continuous-controlContinuous Control	—Unverified
Security Analysis of Safe and Seldonian Reinforcement Learning Algorithms	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
R-learning in actor-critic model offers a biologically relevant mechanism for sequential decision-making	Dec 1, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
RL Unplugged: A Collection of Benchmarks for Offline Reinforcement Learning	Dec 1, 2020	Offline RLreinforcement-learning	CodeCode Available
Text Simplification with Reinforcement Learning Using Supervised Rewards on Grammaticality, Meaning Preservation, and Simplicity	Dec 1, 2020	reinforcement-learningReinforcement Learning	—Unverified
On Efficiency in Hierarchical Reinforcement Learning	Dec 1, 2020	Computational EfficiencyDecision Making	—Unverified

Show:10 25 50

← PrevPage 398 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified