Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 10801–10850 of 15113 papers

Title	Date	Tasks	Status	Hype
A Text-based Deep Reinforcement Learning Framework for Interactive Recommendation	Apr 14, 2020	Deep Reinforcement LearningInteractive Recommendation	CodeCode Available	1
A non-cooperative meta-modeling game for automated third-party calibrating, validating, and falsifying constitutive laws with parallelized adversarial attacks	Apr 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
K-spin Hamiltonian for quantum-resolvable Markov decision processes	Apr 13, 2020	Q-LearningReinforcement Learning	—Unverified	0
Aspect and Opinion Aware Abstractive Review Summarization with Reinforced Hard Typed Decoder	Apr 13, 2020	Decoderreinforcement-learning	—Unverified	0
A Deep Reinforcement Learning Framework for Continuous Intraday Market Bidding	Apr 13, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Thinking While Moving: Deep Reinforcement Learning with Concurrent Control	Apr 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Kernel-Based Reinforcement Learning: A Finite-Time Analysis	Apr 12, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reinforcement Learning via Reasoning from Demonstration	Apr 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
PatchAttack: A Black-box Texture-based Attack with Reinforcement Learning	Apr 12, 2020	Adversarial DefenseClustering	CodeCode Available	1
Deep Reinforcement Learning for Process Control: A Primer for Beginners	Apr 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Certifiable Robustness to Adversarial State Uncertainty in Deep Reinforcement Learning	Apr 11, 2020	Adversarial RobustnessCollision Avoidance	—Unverified	0
Self Punishment and Reward Backfill for Deep Q-Learning	Apr 10, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available	0
Reinforcement Learning via Gaussian Processes with Neural Network Dual Kernels	Apr 10, 2020	Gaussian Processesreinforcement-learning	—Unverified	0
Reinforced Anytime Bottom Up Rule Learning for Knowledge Graph Completion	Apr 9, 2020	Knowledge Graph Completionreinforcement-learning	—Unverified	0
Topological Quantum Compiling with Reinforcement Learning	Apr 9, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Quantifying the Impact of Non-Stationarity in Reinforcement Learning-Based Traffic Signal Control	Apr 9, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Policy Gradient using Weak Derivatives for Reinforcement Learning	Apr 9, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
Re-conceptualising the Language Game Paradigm in the Framework of Multi-Agent Reinforcement Learning	Apr 9, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning (DRL): Another Perspective for Unsupervised Wireless Localization	Apr 9, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Stochastic Approximation with Markov Noise: Analysis and applications in reinforcement learning	Apr 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Adaptive Stress Testing without Domain Heuristics using Go-Explore	Apr 8, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Learning from Learners: Adapting Reinforcement Learning Agents to be Competitive in a Card Game	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
CURL: Contrastive Unsupervised Representations for Reinforcement Learning	Apr 8, 2020	Atari GamesAtari Games 100k	CodeCode Available	1
Adaptive Transformers in RL	Apr 8, 2020	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available	1
Continual Learning with Gated Incremental Memories for sequential data processing	Apr 8, 2020	Continual LearningReinforcement Learning	CodeCode Available	1
Solving the scalarization issues of Advantage-based Reinforcement Learning Algorithms	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0
Multi-Agent Task-Oriented Dialog Policy Learning with Role-Aware Reward Decomposition	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1
Monte-Carlo Siamese Policy on Actor for Satellite Image Super Resolution	Apr 8, 2020	Image Super-Resolutionreinforcement-learning	—Unverified	0
Resource Management for Blockchain-enabled Federated Learning: A Deep Reinforcement Learning Approach	Apr 8, 2020	CPUDeep Reinforcement Learning	—Unverified	0
An Application of Deep Reinforcement Learning to Algorithmic Trading	Apr 7, 2020	Algorithmic TradingDeep Reinforcement Learning	CodeCode Available	1
Guided Dialog Policy Learning without Adversarial Learning in the Loop	Apr 7, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Online Constrained Model-based Reinforcement Learning	Apr 7, 2020	Autonomous RacingGaussian Processes	—Unverified	0
Optimistic Agent: Accurate Graph-Based Value Estimation for More Successful Visual Navigation	Apr 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Uniform State Abstraction For Reinforcement Learning	Apr 6, 2020	continuous-controlContinuous Control	—Unverified	0
Technical Report: Adaptive Control for Linearizable Systems Using On-Policy Reinforcement Learning	Apr 6, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Networked Multi-Agent Reinforcement Learning with Emergent Communication	Apr 6, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Weakly-Supervised Reinforcement Learning for Controllable Behavior	Apr 6, 2020	continuous-controlContinuous Control	—Unverified	0
Intrinsic Exploration as Multi-Objective RL	Apr 6, 2020	continuous-controlContinuous Control	—Unverified	0
Adaptive Partial Scanning Transmission Electron Microscopy with Reinforcement Learning	Apr 6, 2020	compressed sensingreinforcement-learning	CodeCode Available	0
Multi-agent Reinforcement Learning for Resource Allocation in IoT networks with Edge Computing	Apr 5, 2020	Cloud ComputingDistributed Computing	—Unverified	0
Reinforcement Learning Architectures: SAC, TAC, and ESAC	Apr 5, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Stylistic Dialogue Generation via Information-Guided Reinforcement Learning Strategy	Apr 5, 2020	Dialogue Generationreinforcement-learning	—Unverified	0
Reinforced Multi-task Approach for Multi-hop Question Generation	Apr 5, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified	0
MRI Reconstruction with Interpretable Pixel-Wise Operations Using Reinforcement Learning	Apr 3, 2020	compressed sensingDeep Reinforcement Learning	CodeCode Available	1
Reinforcement Learning for Mixed-Integer Problems Based on MPC	Apr 3, 2020	Model Predictive ControlQ-Learning	—Unverified	0
Multi-agent Reinforcement Learning for Networked System Control	Apr 3, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Learning 2-opt Heuristics for the Traveling Salesman Problem via Deep Reinforcement Learning	Apr 3, 2020	Deep LearningDeep Reinforcement Learning	CodeCode Available	1
A Deep Ensemble Multi-Agent Reinforcement Learning Approach for Air Traffic Control	Apr 3, 2020	Decision MakingManagement	—Unverified	0
Continuous Motion Planning with Temporal Logic Specifications using Deep Neural Networks	Apr 2, 2020	Motion Planningreinforcement-learning	—Unverified	0
Average Reward Adjusted Discounted Reinforcement Learning: Near-Blackwell-Optimal Policies for Real-World Applications	Apr 2, 2020	reinforcement-learningReinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 217 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified