Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10376–10400 of 15113 papers

Title	Date	Tasks	Status
Contextual Bandits for adapting to changing User preferences over time	Sep 21, 2020	Incremental LearningMulti-Armed Bandits	—Unverified
Learning a Contact-Adaptive Controller for Robust, Efficient Legged Locomotion	Sep 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
DISPATCH: Design Space Exploration of Cyber-Physical Systems	Sep 21, 2020	Active LearningBayesian Optimization	—Unverified
Learn to Exceed: Stereo Inverse Reinforcement Learning with Concurrent Policy Optimization	Sep 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Regret Bounds and Reinforcement Learning Exploration of EXP-based Algorithms	Sep 20, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Lyapunov-Based Reinforcement Learning for Decentralized Multi-Agent Control	Sep 20, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Multiplayer Support for the Arcade Learning Environment	Sep 20, 2020	Atari Gamesreinforcement-learning	—Unverified
Construction of Polar Codes with Reinforcement Learning	Sep 19, 2020	Decoderreinforcement-learning	—Unverified
A Contraction Approach to Model-based Reinforcement Learning	Sep 18, 2020	Imitation Learningmodel	—Unverified
GRAC: Self-Guided and Self-Regularized Actor-Critic	Sep 18, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available
HTMRL: Biologically Plausible Reinforcement Learning with Hierarchical Temporal Memory	Sep 18, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Closed-Loop Blood Glucose Control	Sep 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Private Reinforcement Learning with PAC and Regret Guarantees	Sep 18, 2020	Decision MakingPrivacy Preserving	—Unverified
Efficient Reinforcement Learning Development with RLzoo	Sep 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Weakly Supervised Temporal Grounding of Natural Language in Untrimmed Videos	Sep 18, 2020	cross-modal alignmentreinforcement-learning	—Unverified
Reconstructing Actions To Explain Deep Reinforcement Learning	Sep 17, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
Reward Maximisation through Discrete Active Inference	Sep 17, 2020	Decision MakingModel-based Reinforcement Learning	—Unverified
Knowledge-Assisted Deep Reinforcement Learning in 5G Scheduler Design: From Theoretical Framework to Implementation	Sep 17, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
GeneraLight: Improving Environment Generalization of Traffic Signal Control via Meta Reinforcement Learning	Sep 17, 2020	ClusteringGenerative Adversarial Network	—Unverified
DRL-FAS: A Novel Framework Based on Deep Reinforcement Learning for Face Anti-Spoofing	Sep 16, 2020	Deep Reinforcement LearningFace Anti-Spoofing	—Unverified
Theory of Mind with Guilt Aversion Facilitates Cooperative Reinforcement Learning	Sep 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Time your hedge with Deep Reinforcement Learning	Sep 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Transfer Learning in Deep Reinforcement Learning: A Survey	Sep 16, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Reinforcement Learning for Strategic Recommendations	Sep 15, 2020	reinforcement-learningReinforcement Learning	—Unverified
Soft policy optimization using dual-track advantage estimator	Sep 15, 2020	MuJoCoReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 416 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified