Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10351–10400 of 15113 papers

Title	Date	Tasks	Status
Reinforcement Learning-based N-ary Cross-Sentence Relation Extraction	Sep 26, 2020	reinforcement-learningReinforcement Learning	—Unverified
Lineage Evolution Reinforcement Learning	Sep 26, 2020	reinforcement-learningReinforcement Learning	—Unverified
Complementary Meta-Reinforcement Learning for Fault-Adaptive Control	Sep 26, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified
Graph neural induction of value iteration	Sep 26, 2020	Deep Reinforcement LearningGraph Neural Network	—Unverified
Inverse Rational Control with Partially Observable Continuous Nonlinear Dynamics	Sep 26, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Bootstrapped Q-learning with Context Relevant Observation Pruning to Generalize in Text-based Games	Sep 24, 2020	Q-LearningReinforcement Learning (RL)	CodeCode Available
Motion Planning by Reinforcement Learning for an Unmanned Aerial Vehicle in Virtual Open Space with Static Obstacles	Sep 24, 2020	Motion Planningreinforcement-learning	—Unverified
Sim-to-Real Transfer in Deep Reinforcement Learning for Robotics: a Survey	Sep 24, 2020	Deep Reinforcement LearningDomain Adaptation	—Unverified
ReLeaSER: A Reinforcement Learning Strategy for Optimizing Utilization Of Ephemeral Cloud Resources	Sep 23, 2020	CPUreinforcement-learning	—Unverified
Probabilistic Machine Learning for Healthcare	Sep 23, 2020	BIG-bench Machine Learningreinforcement-learning	—Unverified
Robust Reinforcement Learning-based Autonomous Driving Agent for Simulation and Real World	Sep 23, 2020	Autonomous DrivingDeep Reinforcement Learning	—Unverified
What is the Reward for Handwriting? -- Handwriting Generation by Imitation Learning	Sep 23, 2020	Handwriting generationImitation Learning	—Unverified
Demand Responsive Dynamic Pricing Framework for Prosumer Dominated Microgrids using Multiagent Reinforcement Learning	Sep 23, 2020	Decision Makingreinforcement-learning	—Unverified
A Multi-Agent Deep Reinforcement Learning Approach for a Distributed Energy Marketplace in Smart Grids	Sep 23, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Is Q-Learning Provably Efficient? An Extended Analysis	Sep 22, 2020	Q-Learningreinforcement-learning	—Unverified
A Centralised Soft Actor Critic Deep Reinforcement Learning Approach to District Demand Side Management through CityLearn	Sep 22, 2020	Deep Reinforcement LearningManagement	CodeCode Available
Distributed Structured Actor-Critic Reinforcement Learning for Universal Dialogue Management	Sep 22, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Deep Reinforcement Learning for On-line Dialogue State Tracking	Sep 22, 2020	Deep Reinforcement LearningDialogue Management	—Unverified
SUMBT+LaRL: Effective Multi-domain End-to-end Neural Task-oriented Dialog System	Sep 22, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning Approaches in Social Robotics	Sep 21, 2020	Decision Makingreinforcement-learning	—Unverified
Mobile Cellular-Connected UAVs: Reinforcement Learning for Sky Limits	Sep 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Rethinking Supervised Learning and Reinforcement Learning in Task-Oriented Dialogue Systems	Sep 21, 2020	DecoderMulti-Label Classification	CodeCode Available
Deep Reinforcement Learning Methods for Structure-Guided Processing Path Optimization	Sep 21, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
Dynamic Horizon Value Estimation for Model-based Reinforcement Learning	Sep 21, 2020	Model-based Reinforcement LearningNovelty Detection	—Unverified
Human Engagement Providing Evaluative and Informative Advice for Interactive Reinforcement Learning	Sep 21, 2020	reinforcement-learningReinforcement Learning	—Unverified
Contextual Bandits for adapting to changing User preferences over time	Sep 21, 2020	Incremental LearningMulti-Armed Bandits	—Unverified
Learning a Contact-Adaptive Controller for Robust, Efficient Legged Locomotion	Sep 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
DISPATCH: Design Space Exploration of Cyber-Physical Systems	Sep 21, 2020	Active LearningBayesian Optimization	—Unverified
Learn to Exceed: Stereo Inverse Reinforcement Learning with Concurrent Policy Optimization	Sep 21, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Regret Bounds and Reinforcement Learning Exploration of EXP-based Algorithms	Sep 20, 2020	Multi-Armed Banditsreinforcement-learning	—Unverified
Lyapunov-Based Reinforcement Learning for Decentralized Multi-Agent Control	Sep 20, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Multiplayer Support for the Arcade Learning Environment	Sep 20, 2020	Atari Gamesreinforcement-learning	—Unverified
Construction of Polar Codes with Reinforcement Learning	Sep 19, 2020	Decoderreinforcement-learning	—Unverified
A Contraction Approach to Model-based Reinforcement Learning	Sep 18, 2020	Imitation Learningmodel	—Unverified
GRAC: Self-Guided and Self-Regularized Actor-Critic	Sep 18, 2020	Decision MakingDeep Reinforcement Learning	CodeCode Available
HTMRL: Biologically Plausible Reinforcement Learning with Hierarchical Temporal Memory	Sep 18, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Reinforcement Learning for Closed-Loop Blood Glucose Control	Sep 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Private Reinforcement Learning with PAC and Regret Guarantees	Sep 18, 2020	Decision MakingPrivacy Preserving	—Unverified
Efficient Reinforcement Learning Development with RLzoo	Sep 18, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning for Weakly Supervised Temporal Grounding of Natural Language in Untrimmed Videos	Sep 18, 2020	cross-modal alignmentreinforcement-learning	—Unverified
Reconstructing Actions To Explain Deep Reinforcement Learning	Sep 17, 2020	Atari GamesDeep Reinforcement Learning	—Unverified
Reward Maximisation through Discrete Active Inference	Sep 17, 2020	Decision MakingModel-based Reinforcement Learning	—Unverified
Knowledge-Assisted Deep Reinforcement Learning in 5G Scheduler Design: From Theoretical Framework to Implementation	Sep 17, 2020	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
GeneraLight: Improving Environment Generalization of Traffic Signal Control via Meta Reinforcement Learning	Sep 17, 2020	ClusteringGenerative Adversarial Network	—Unverified
DRL-FAS: A Novel Framework Based on Deep Reinforcement Learning for Face Anti-Spoofing	Sep 16, 2020	Deep Reinforcement LearningFace Anti-Spoofing	—Unverified
Theory of Mind with Guilt Aversion Facilitates Cooperative Reinforcement Learning	Sep 16, 2020	reinforcement-learningReinforcement Learning	—Unverified
Time your hedge with Deep Reinforcement Learning	Sep 16, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Transfer Learning in Deep Reinforcement Learning: A Survey	Sep 16, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Reinforcement Learning for Strategic Recommendations	Sep 15, 2020	reinforcement-learningReinforcement Learning	—Unverified
Soft policy optimization using dual-track advantage estimator	Sep 15, 2020	MuJoCoReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 208 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified