Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12251–12300 of 15113 papers

Title	Date	Tasks	Status
Automated quantum programming via reinforcement learning for combinatorial optimization	Aug 21, 2019	Combinatorial Optimizationreinforcement-learning	CodeCode Available
Analyzing Cyber-Physical Systems from the Perspective of Artificial Intelligence	Aug 21, 2019	reinforcement-learningReinforcement Learning	—Unverified
Learning to Sit: Synthesizing Human-Chair Interactions via Hierarchical Control	Aug 20, 2019	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified
A Deep Actor-Critic Reinforcement Learning Framework for Dynamic Multichannel Access	Aug 20, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
ARAML: A Stable Adversarial Training Framework for Text Generation	Aug 20, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning is not a Causal problem	Aug 20, 2019	reinforcement-learningReinforcement Learning	—Unverified
A Domain-Knowledge-Aided Deep Reinforcement Learning Approach for Flight Control Design	Aug 19, 2019	Deep Reinforcement LearningLearning Theory	—Unverified
A survey on intrinsic motivation in reinforcement learning	Aug 19, 2019	reinforcement-learningReinforcement Learning	—Unverified
An Autonomous Performance Testing Framework using Self-Adaptive Fuzzy Reinforcement Learning	Aug 19, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Transfer in Deep Reinforcement Learning using Knowledge Graphs	Aug 19, 2019	Deep Reinforcement LearningKnowledge Graphs	—Unverified
Reinforcement Learning Applications	Aug 19, 2019	Recommendation Systemsreinforcement-learning	—Unverified
Mitigating Multi-Stage Cascading Failure by Reinforcement Learning	Aug 19, 2019	reinforcement-learningReinforcement Learning	—Unverified
Online Feature Selection for Activity Recognition using Reinforcement Learning with Multiple Feedback	Aug 16, 2019	Activity Recognitionfeature selection	—Unverified
Performing Deep Recurrent Double Q-Learning for Atari Games	Aug 16, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
A model of discrete choice based on reinforcement learning under short-term memory	Aug 16, 2019	reinforcement-learningReinforcement Learning (RL)	—Unverified
Iterative Update and Unified Representation for Multi-Agent Reinforcement Learning	Aug 16, 2019	Lifelong learningMulti-agent Reinforcement Learning	—Unverified
Imitation Learning for Sentence Generation with Dilated Convolutions Using Adversarial Training	Aug 15, 2019	DiversityGenerative Adversarial Network	CodeCode Available
Deep reinforcement learning in World-Earth system models to discover sustainable management strategies	Aug 15, 2019	Deep Reinforcement LearningManagement	CodeCode Available
Playing a Strategy Game with Knowledge-Based Reinforcement Learning	Aug 15, 2019	reinforcement-learningReinforcement Learning	—Unverified
Privacy-Preserved Task Offloading in Mobile Blockchain with Deep Reinforcement Learning	Aug 15, 2019	Deep Reinforcement LearningEdge-computing	—Unverified
Towards End-to-End Learning for Efficient Dialogue Agent by Modeling Looking-ahead Ability	Aug 15, 2019	reinforcement-learningReinforcement Learning	—Unverified
Secure Computation Offloading in Blockchain based IoT Networks with Deep Reinforcement Learning	Aug 15, 2019	Deep Reinforcement LearningManagement	—Unverified
Sample-efficient Deep Reinforcement Learning with Imaginary Rollouts for Human-Robot Interaction	Aug 15, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Model-based Lookahead Reinforcement Learning	Aug 15, 2019	continuous-controlContinuous Control	—Unverified
Reinforcement Learning Based Graph-to-Sequence Model for Natural Question Generation	Aug 14, 2019	Graph Neural NetworkGraph-to-Sequence	CodeCode Available
Skill Transfer in Deep Reinforcement Learning under Morphological Heterogeneity	Aug 14, 2019	DecoderDeep Reinforcement Learning	—Unverified
Towards Diverse and Accurate Image Captions via Reinforcing Determinantal Point Process	Aug 14, 2019	DiversityImage Captioning	CodeCode Available
Multi-Agent Manipulation via Locomotion using Hierarchical Sim2Real	Aug 13, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Reinforcement Learning based Interconnection Routing for Adaptive Traffic Optimization	Aug 13, 2019	BIG-bench Machine Learningreinforcement-learning	CodeCode Available
Reward Tampering Problems and Solutions in Reinforcement Learning: A Causal Influence Diagram Perspective	Aug 13, 2019	reinforcement-learningReinforcement Learning	—Unverified
From Crystallized Adaptivity to Fluid Adaptivity in Deep Reinforcement Learning -- Insights from Biological Systems on Adaptive Flexibility	Aug 13, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Is Deep Reinforcement Learning Really Superhuman on Atari? Leveling the playing field	Aug 13, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Generative Question Refinement with Deep Reinforcement Learning in Retrieval-based QA System	Aug 13, 2019	Deep Reinforcement LearningQuestion Answering	CodeCode Available
Competitive Multi-Agent Deep Reinforcement Learning with Counterfactual Thinking	Aug 13, 2019	counterfactualDecision Making	—Unverified
Fast Adaptation with Meta-Reinforcement Learning for Trust Modelling in Human-Robot Interaction	Aug 12, 2019	Meta-LearningMeta Reinforcement Learning	—Unverified
A review on Deep Reinforcement Learning for Fluid Mechanics	Aug 12, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Superstition in the Network: Deep Reinforcement Learning Plays Deceptive Games	Aug 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Review of Cooperative Multi-Agent Deep Reinforcement Learning	Aug 11, 2019	ArticlesDeep Reinforcement Learning	—Unverified
Large-Scale Traffic Signal Control Using a Novel Multi-Agent Reinforcement Learning	Aug 10, 2019	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Behaviour Suite for Reinforcement Learning	Aug 9, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Learning to Grasp from 2.5D images: a Deep Reinforcement Learning Approach	Aug 8, 2019	Deep Reinforcement LearningPosition	—Unverified
Incremental Reinforcement Learning --- a New Continuous Reinforcement Learning Frame Based on Stochastic Differential Equation methods	Aug 8, 2019	Autonomous Drivingreinforcement-learning	—Unverified
Vision-based Navigation Using Deep Reinforcement Learning	Aug 8, 2019	Deep Reinforcement LearningEfficient Neural Network	CodeCode Available
Free-Lunch Saliency via Attention in Atari Agents	Aug 7, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Batch Recurrent Q-Learning for Backchannel Generation Towards Engaging Agents	Aug 6, 2019	Imitation LearningQ-Learning	—Unverified
A physics-informed reinforcement learning approach for the interfacial area transport in two-phase flow	Aug 6, 2019	reinforcement-learningReinforcement Learning	—Unverified
Promoting Coordination through Policy Regularization in Multi-Agent Deep Reinforcement Learning	Aug 6, 2019	continuous-controlContinuous Control	—Unverified
Speech Driven Backchannel Generation using Deep Q-Network for Enhancing Engagement in Human-Robot Interaction	Aug 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
DoorGym: A Scalable Door Opening Environment And Baseline Agent	Aug 5, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Reusability and Transferability of Macro Actions for Reinforcement Learning	Aug 5, 2019	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 246 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified