Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10651–10700 of 15113 papers

Title	Date	Tasks	Status
Integrating Logical Rules Into Neural Multi-Hop Reasoning for Drug Repurposing	Jul 10, 2020	Link Predictionreinforcement-learning	—Unverified
Representations for Stable Off-Policy Reinforcement Learning	Jul 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Pre-trained Word Embeddings for Goal-conditional Transfer Learning in Reinforcement Learning	Jul 10, 2020	Language ModelingLanguage Modelling	—Unverified
MAPS: Multi-agent Reinforcement Learning-based Portfolio Management System	Jul 10, 2020	ManagementMulti-agent Reinforcement Learning	—Unverified
Vizarel: A System to Help Better Understand RL Agents	Jul 10, 2020	reinforcement-learningReinforcement Learning	—Unverified
Weakness Analysis of Cyberspace Configuration Based on Reinforcement Learning	Jul 9, 2020	reinforcement-learningReinforcement Learning	—Unverified
On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms	Jul 9, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Learning Retrospective Knowledge with Reverse Reinforcement Learning	Jul 9, 2020	Anomaly Detectionreinforcement-learning	—Unverified
Fast reinforcement learning with generalized policy updates	Jul 9, 2020	Decision MakingProblem Decomposition	—Unverified
A Kernel-Based Approach to Non-Stationary Reinforcement Learning in Metric Spaces	Jul 9, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Attention or memory? Neurointerpretable agents in space and time	Jul 9, 2020	Atari GamesDimensionality Reduction	—Unverified
Low Dose CT Denoising via Joint Bilateral Filtering and Intelligent Parameter Optimization	Jul 9, 2020	Deep LearningDeep Reinforcement Learning	—Unverified
Learning to Prune Deep Neural Networks via Reinforcement Learning	Jul 9, 2020	Deep Reinforcement LearningModel Compression	—Unverified
EVO-RL: Evolutionary-Driven Reinforcement Learning	Jul 9, 2020	OpenAI Gymreinforcement-learning	—Unverified
A Natural Actor-Critic Algorithm with Downside Risk Constraints	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Discourse Coherence, Reference Grounding and Goal Oriented Dialogue	Jul 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Auto-MAP: A DQN Framework for Exploring Distributed Execution Plans for DNN Workloads	Jul 8, 2020	Deep LearningEfficient Exploration	—Unverified
Responsive Safety in Reinforcement Learning by PID Lagrangian Methods	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified
Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning	Jul 7, 2020	Offline RLreinforcement-learning	—Unverified
Towards a practical measure of interference for reinforcement learning	Jul 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
Predictive Maintenance for Edge-Based Sensor Networks: A Deep Reinforcement Learning Approach	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sharp Analysis of Smoothed Bellman Error Embedding	Jul 7, 2020	reinforcement-learningReinforcement Learning	—Unverified
The LoCA Regret: A Consistent Metric to Evaluate Model-Based Behavior in Reinforcement Learning	Jul 7, 2020	General Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available
Necessary and Sufficient Conditions for Inverse Reinforcement Learning of Bayesian Stopping Time Problems	Jul 7, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
A deep reinforcement learning model based on deterministic policy gradient for collective neural crest cell migration	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning with Interactive Feedback in a Human-Robot Environment	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Cognitive Radio Network Throughput Maximization with Deep Reinforcement Learning	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Deep Reinforcement Learning and its Neuroscientific Implications	Jul 7, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Consensus Multi-Agent Reinforcement Learning for Volt-VAR Control in Power Distribution Networks	Jul 6, 2020	Deep Reinforcement LearningManagement	—Unverified
Integrating Distributed Architectures in Highly Modular RL Libraries	Jul 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available
Efficient Connected and Automated Driving System with Multi-agent Graph Reinforcement Learning	Jul 6, 2020	Decision Makingreinforcement-learning	—Unverified
Unsupervised Paraphrasing via Deep Reinforcement Learning	Jul 5, 2020	Deep Reinforcement LearningDiversity	—Unverified
Mission schedule of agile satellites based on Proximal Policy Optimization Algorithm	Jul 5, 2020	reinforcement-learningReinforcement Learning	—Unverified
Decentralized Reinforcement Learning: Global Decision-Making via Local Economic Transactions	Jul 5, 2020	Decision Makingreinforcement-learning	—Unverified
Discount Factor as a Regularizer in Reinforcement Learning	Jul 4, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Variational Policy Gradient Method for Reinforcement Learning with General Utilities	Jul 4, 2020	reinforcement-learningReinforcement Learning	—Unverified
Strategies for Using Proximal Policy Optimization in Mobile Puzzle Games	Jul 3, 2020	Reinforcement Learning (RL)	—Unverified
Temporal-Logic-Based Reward Shaping for Continuing Reinforcement Learning Tasks	Jul 3, 2020	reinforcement-learningReinforcement Learning	—Unverified
Hedging using reinforcement learning: Contextual k-Armed Bandit versus Q-learning	Jul 3, 2020	FrictionQ-Learning	—Unverified
A Unifying View of Optimism in Episodic Reinforcement Learning	Jul 3, 2020	reinforcement-learningReinforcement Learning	—Unverified
An Autonomous Free Airspace En-route Controller using Deep Reinforcement Learning Techniques	Jul 3, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Conceptual Framework for Externally-influenced Agents: An Assisted Reinforcement Learning Review	Jul 3, 2020	Decision Makingreinforcement-learning	—Unverified
Learning to search efficiently for causally near-optimal treatments	Jul 2, 2020	Causal InferenceReinforcement Learning (RL)	CodeCode Available
ε-BMC: A Bayesian Ensemble Approach to Epsilon-Greedy Exploration in Model-Free Reinforcement Learning	Jul 2, 2020	Reinforcement Learning (RL)	CodeCode Available
Decentralized Deep Reinforcement Learning for Network Level Traffic Signal Control	Jul 2, 2020	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Deep reinforcement learning driven inspection and maintenance planning under incomplete information and constraints	Jul 2, 2020	Bayesian InferenceDeep Reinforcement Learning	—Unverified
Human-centered collaborative robots with deep reinforcement learning	Jul 2, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Learning "What-if" Explanations for Sequential Decision-Making	Jul 2, 2020	counterfactualCounterfactual Reasoning	—Unverified
BOSH: Bayesian Optimization by Sampling Hierarchically	Jul 2, 2020	Bayesian Optimizationreinforcement-learning	—Unverified
Robust Inverse Reinforcement Learning under Transition Dynamics Mismatch	Jul 2, 2020	reinforcement-learningReinforcement Learning	CodeCode Available

Show:10 25 50

← PrevPage 214 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified