Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10201–10250 of 15113 papers

Title	Date	Tasks	Status	Hype
Relational-Grid-World: A Novel Relational Reasoning Environment and An Agent Model for Relational Information Extraction	Jul 12, 2020	Decision MakingReinforcement Learning (RL)	—Unverified	0
An Equivalence between Loss Functions and Non-Uniform Sampling in Experience Replay	Jul 12, 2020	Deep Reinforcement LearningMuJoCo	CodeCode Available	1
Adversarial jamming attacks and defense strategies via adaptive deep reinforcement learning	Jul 12, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Learning Abstract Models for Strategic Exploration and Fast Reward Transfer	Jul 12, 2020	Atari GamesModel-based Reinforcement Learning	—Unverified	0
Data-Efficient Reinforcement Learning with Self-Predictive Representations	Jul 12, 2020	Atari Games 100kData Augmentation	CodeCode Available	1
Investigation of Sentiment Controllable Chatbot	Jul 11, 2020	Chatbotreinforcement-learning	—Unverified	0
An Asymptotically Optimal Multi-Armed Bandit Algorithm and Hyperparameter Optimization	Jul 11, 2020	Bayesian OptimizationData Augmentation	CodeCode Available	1
Simulating multi-exit evacuation using deep reinforcement learning	Jul 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Long-Term Planning with Deep Reinforcement Learning on Autonomous Drones	Jul 11, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Vizarel: A System to Help Better Understand RL Agents	Jul 10, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
MAPS: Multi-agent Reinforcement Learning-based Portfolio Management System	Jul 10, 2020	ManagementMulti-agent Reinforcement Learning	—Unverified	0
Pre-trained Word Embeddings for Goal-conditional Transfer Learning in Reinforcement Learning	Jul 10, 2020	Language ModelingLanguage Modelling	—Unverified	0
Representations for Stable Off-Policy Reinforcement Learning	Jul 10, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Integrating Logical Rules Into Neural Multi-Hop Reasoning for Drug Repurposing	Jul 10, 2020	Link Predictionreinforcement-learning	—Unverified	0
Fast reinforcement learning with generalized policy updates	Jul 9, 2020	Decision MakingProblem Decomposition	—Unverified	0
Learning Retrospective Knowledge with Reverse Reinforcement Learning	Jul 9, 2020	Anomaly Detectionreinforcement-learning	—Unverified	0
A Kernel-Based Approach to Non-Stationary Reinforcement Learning in Metric Spaces	Jul 9, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Learning to Prune Deep Neural Networks via Reinforcement Learning	Jul 9, 2020	Deep Reinforcement LearningModel Compression	—Unverified	0
Attention or memory? Neurointerpretable agents in space and time	Jul 9, 2020	Atari GamesDimensionality Reduction	—Unverified	0
EVO-RL: Evolutionary-Driven Reinforcement Learning	Jul 9, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Low Dose CT Denoising via Joint Bilateral Filtering and Intelligent Parameter Optimization	Jul 9, 2020	Deep LearningDeep Reinforcement Learning	—Unverified	0
One Policy to Control Them All: Shared Modular Policies for Agent-Agnostic Control	Jul 9, 2020	Allreinforcement-learning	CodeCode Available	1
On the Reliability and Generalizability of Brain-inspired Reinforcement Learning Algorithms	Jul 9, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Weakness Analysis of Cyberspace Configuration Based on Reinforcement Learning	Jul 9, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
SUNRISE: A Simple Unified Framework for Ensemble Learning in Deep Reinforcement Learning	Jul 9, 2020	Deep Reinforcement LearningDiversity	CodeCode Available	1
Discourse Coherence, Reference Grounding and Goal Oriented Dialogue	Jul 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
A Natural Actor-Critic Algorithm with Downside Risk Constraints	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Auto-MAP: A DQN Framework for Exploring Distributed Execution Plans for DNN Workloads	Jul 8, 2020	Deep LearningEfficient Exploration	—Unverified	0
Responsive Safety in Reinforcement Learning by PID Lagrangian Methods	Jul 8, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
A deep reinforcement learning model based on deterministic policy gradient for collective neural crest cell migration	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning with Interactive Feedback in a Human-Robot Environment	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning and its Neuroscientific Implications	Jul 7, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Cognitive Radio Network Throughput Maximization with Deep Reinforcement Learning	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Necessary and Sufficient Conditions for Inverse Reinforcement Learning of Bayesian Stopping Time Problems	Jul 7, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Towards a practical measure of interference for reinforcement learning	Jul 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Predictive Maintenance for Edge-Based Sensor Networks: A Deep Reinforcement Learning Approach	Jul 7, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Near-Optimal Provable Uniform Convergence in Offline Policy Evaluation for Reinforcement Learning	Jul 7, 2020	Offline RLreinforcement-learning	—Unverified	0
Provably Safe PAC-MDP Exploration Using Analogies	Jul 7, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Sharp Analysis of Smoothed Bellman Error Embedding	Jul 7, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
The LoCA Regret: A Consistent Metric to Evaluate Model-Based Behavior in Reinforcement Learning	Jul 7, 2020	General Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	0
Efficient Connected and Automated Driving System with Multi-agent Graph Reinforcement Learning	Jul 6, 2020	Decision Makingreinforcement-learning	—Unverified	0
Consensus Multi-Agent Reinforcement Learning for Volt-VAR Control in Power Distribution Networks	Jul 6, 2020	Deep Reinforcement LearningManagement	—Unverified	0
Enhancing SAT solvers with glue variable predictions	Jul 6, 2020	CPUGPU	CodeCode Available	1
LFQ: Online Learning of Per-flow Queuing Policies using Deep Reinforcement Learning	Jul 6, 2020	Deep Reinforcement LearningFairness	CodeCode Available	1
Counterfactual Data Augmentation using Locally Factored Dynamics	Jul 6, 2020	counterfactualData Augmentation	CodeCode Available	1
Learning Implicit Credit Assignment for Cooperative Multi-Agent Reinforcement Learning	Jul 6, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
Integrating Distributed Architectures in Highly Modular RL Libraries	Jul 6, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Maximum Entropy Gain Exploration for Long Horizon Multi-goal Reinforcement Learning	Jul 6, 2020	Multi-Goal Reinforcement Learningreinforcement-learning	CodeCode Available	1
Meta-Learning through Hebbian Plasticity in Random Networks	Jul 6, 2020	Lifelong learningNavigate	CodeCode Available	1
Mission schedule of agile satellites based on Proximal Policy Optimization Algorithm	Jul 5, 2020	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 205 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified