Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9851–9875 of 15113 papers

Title	Date	Tasks	Status	Hype
Robust Reinforcement Learning-based Autonomous Driving Agent for Simulation and Real World	Sep 23, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified	0
SUMBT+LaRL: Effective Multi-domain End-to-end Neural Task-oriented Dialog System	Sep 22, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Centralised Soft Actor Critic Deep Reinforcement Learning Approach to District Demand Side Management through CityLearn	Sep 22, 2020	Deep Reinforcement LearningManagement	CodeCode Available	0
Distributed Structured Actor-Critic Reinforcement Learning for Universal Dialogue Management	Sep 22, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for On-line Dialogue State Tracking	Sep 22, 2020	Deep Reinforcement LearningDialogue Management	—Unverified	0
Is Q-Learning Provably Efficient? An Extended Analysis	Sep 22, 2020	Q-Learningreinforcement-learning	—Unverified	0
Contextual Bandits for adapting to changing User preferences over time	Sep 21, 2020	Incremental LearningMulti-Armed Bandits	—Unverified	0
DISPATCH: Design Space Exploration of Cyber-Physical Systems	Sep 21, 2020	Active LearningBayesian Optimization	—Unverified	0
Learning a Contact-Adaptive Controller for Robust, Efficient Legged Locomotion	Sep 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learn to Exceed: Stereo Inverse Reinforcement Learning with Concurrent Policy Optimization	Sep 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Dynamic Horizon Value Estimation for Model-based Reinforcement Learning	Sep 21, 2020	Model-based Reinforcement LearningNovelty Detection	—Unverified	0
Human Engagement Providing Evaluative and Informative Advice for Interactive Reinforcement Learning	Sep 21, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Rethinking Supervised Learning and Reinforcement Learning in Task-Oriented Dialogue Systems	Sep 21, 2020	DecoderMulti-Label Classification	CodeCode Available	0
Mobile Cellular-Connected UAVs: Reinforcement Learning for Sky Limits	Sep 21, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Deep Reinforcement Learning Methods for Structure-Guided Processing Path Optimization	Sep 21, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
RL STaR Platform: Reinforcement Learning for Simulation based Training of Robots	Sep 21, 2020	Decision Makingreinforcement-learning	CodeCode Available	1
Reinforcement Learning Approaches in Social Robotics	Sep 21, 2020	Decision Makingreinforcement-learning	—Unverified	0
Lyapunov-Based Reinforcement Learning for Decentralized Multi-Agent Control	Sep 20, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Multiplayer Support for the Arcade Learning Environment	Sep 20, 2020	Atari Gamesreinforcement-learning	—Unverified	0
Regret Bounds and Reinforcement Learning Exploration of EXP-based Algorithms	Sep 20, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified	0
Construction of Polar Codes with Reinforcement Learning	Sep 19, 2020	Decoderreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Closed-Loop Blood Glucose Control	Sep 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Private Reinforcement Learning with PAC and Regret Guarantees	Sep 18, 2020	Decision MakingPrivacy Preserving	—Unverified	0
Reinforcement Learning for Weakly Supervised Temporal Grounding of Natural Language in Untrimmed Videos	Sep 18, 2020	cross-modal alignmentreinforcement-learning	—Unverified	0
Efficient Reinforcement Learning Development with RLzoo	Sep 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 395 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified