Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11101–11150 of 15113 papers

Title	Date	Tasks	Status
Extending Deep Reinforcement Learning Frameworks in Cryptocurrency Market Making	Apr 15, 2020	Deep Reinforcement LearningManagement	—Unverified
ActionSpotter: Deep Reinforcement Learning Framework for Temporal Action Spotting in Videos	Apr 15, 2020	Action DetectionAction Spotting	—Unverified
A reinforcement learning application of guided Monte Carlo Tree Search algorithm for beam orientation selection in radiation therapy	Apr 14, 2020	Anatomyreinforcement-learning	—Unverified
Extrapolation in Gridworld Markov-Decision Processes	Apr 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Actor-Critic Deep Reinforcement Learning for Solving Job Shop Scheduling Problems	Apr 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
A Demonstration of Issues with Value-Based Multiobjective Reinforcement Learning Under Stochastic State Transitions	Apr 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning Approach to Vibration Compensation for Dynamic Feed Drive Systems	Apr 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Thinking While Moving: Deep Reinforcement Learning with Concurrent Control	Apr 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
A non-cooperative meta-modeling game for automated third-party calibrating, validating, and falsifying constitutive laws with parallelized adversarial attacks	Apr 13, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
K-spin Hamiltonian for quantum-resolvable Markov decision processes	Apr 13, 2020	Q-LearningReinforcement Learning	—Unverified
Aspect and Opinion Aware Abstractive Review Summarization with Reinforced Hard Typed Decoder	Apr 13, 2020	Decoderreinforcement-learning	—Unverified
A Deep Reinforcement Learning Framework for Continuous Intraday Market Bidding	Apr 13, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Kernel-Based Reinforcement Learning: A Finite-Time Analysis	Apr 12, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning via Reasoning from Demonstration	Apr 12, 2020	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning for Process Control: A Primer for Beginners	Apr 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Certifiable Robustness to Adversarial State Uncertainty in Deep Reinforcement Learning	Apr 11, 2020	Adversarial RobustnessCollision Avoidance	—Unverified
Self Punishment and Reward Backfill for Deep Q-Learning	Apr 10, 2020	Atari GamesDeep Reinforcement Learning	CodeCode Available
Reinforcement Learning via Gaussian Processes with Neural Network Dual Kernels	Apr 10, 2020	Gaussian Processesreinforcement-learning	—Unverified
Policy Gradient using Weak Derivatives for Reinforcement Learning	Apr 9, 2020	OpenAI Gymreinforcement-learning	—Unverified
Reinforced Anytime Bottom Up Rule Learning for Knowledge Graph Completion	Apr 9, 2020	Knowledge Graph Completionreinforcement-learning	—Unverified
Re-conceptualising the Language Game Paradigm in the Framework of Multi-Agent Reinforcement Learning	Apr 9, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Quantifying the Impact of Non-Stationarity in Reinforcement Learning-Based Traffic Signal Control	Apr 9, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Deep Reinforcement Learning (DRL): Another Perspective for Unsupervised Wireless Localization	Apr 9, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Adaptive Stress Testing without Domain Heuristics using Go-Explore	Apr 8, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Learning from Learners: Adapting Reinforcement Learning Agents to be Competitive in a Card Game	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Resource Management for Blockchain-enabled Federated Learning: A Deep Reinforcement Learning Approach	Apr 8, 2020	CPUDeep Reinforcement Learning	—Unverified
Stochastic Approximation with Markov Noise: Analysis and applications in reinforcement learning	Apr 8, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Solving the scalarization issues of Advantage-based Reinforcement Learning Algorithms	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available
Monte-Carlo Siamese Policy on Actor for Satellite Image Super Resolution	Apr 8, 2020	Image Super-Resolutionreinforcement-learning	—Unverified
Optimistic Agent: Accurate Graph-Based Value Estimation for More Successful Visual Navigation	Apr 7, 2020	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Online Constrained Model-based Reinforcement Learning	Apr 7, 2020	Autonomous RacingGaussian Processes	—Unverified
Guided Dialog Policy Learning without Adversarial Learning in the Loop	Apr 7, 2020	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Adaptive Partial Scanning Transmission Electron Microscopy with Reinforcement Learning	Apr 6, 2020	compressed sensingreinforcement-learning	CodeCode Available
Intrinsic Exploration as Multi-Objective RL	Apr 6, 2020	continuous-controlContinuous Control	—Unverified
Technical Report: Adaptive Control for Linearizable Systems Using On-Policy Reinforcement Learning	Apr 6, 2020	reinforcement-learningReinforcement Learning	—Unverified
Uniform State Abstraction For Reinforcement Learning	Apr 6, 2020	continuous-controlContinuous Control	—Unverified
Networked Multi-Agent Reinforcement Learning with Emergent Communication	Apr 6, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Weakly-Supervised Reinforcement Learning for Controllable Behavior	Apr 6, 2020	continuous-controlContinuous Control	—Unverified
Stylistic Dialogue Generation via Information-Guided Reinforcement Learning Strategy	Apr 5, 2020	Dialogue Generationreinforcement-learning	—Unverified
Reinforced Multi-task Approach for Multi-hop Question Generation	Apr 5, 2020	Multi-hop Question AnsweringQuestion Answering	—Unverified
Multi-agent Reinforcement Learning for Resource Allocation in IoT networks with Edge Computing	Apr 5, 2020	Cloud ComputingDistributed Computing	—Unverified
Reinforcement Learning Architectures: SAC, TAC, and ESAC	Apr 5, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for Mixed-Integer Problems Based on MPC	Apr 3, 2020	Model Predictive ControlQ-Learning	—Unverified
Multi-agent Reinforcement Learning for Networked System Control	Apr 3, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
A Deep Ensemble Multi-Agent Reinforcement Learning Approach for Air Traffic Control	Apr 3, 2020	Decision MakingManagement	—Unverified
Exploration of Reinforcement Learning for Event Camera using Car-like Robots	Apr 2, 2020	Autonomous VehiclesCollision Avoidance	—Unverified
Information State Embedding in Partially Observable Cooperative Multi-Agent Reinforcement Learning	Apr 2, 2020	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Average Reward Adjusted Discounted Reinforcement Learning: Near-Blackwell-Optimal Policies for Real-World Applications	Apr 2, 2020	reinforcement-learningReinforcement Learning	—Unverified
Continuous Motion Planning with Temporal Logic Specifications using Deep Neural Networks	Apr 2, 2020	Motion Planningreinforcement-learning	—Unverified
Value Driven Representation for Human-in-the-Loop Reinforcement Learning	Apr 2, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 223 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified