Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8251–8300 of 15113 papers

Title	Date	Tasks	Status	Hype
A Reinforcement Learning Environment for Multi-Service UAV-enabled Wireless Systems	May 11, 2021	BenchmarkingEdge-computing	CodeCode Available	1
Hierarchical RNNs-Based Transformers MADDPG for Mixed Cooperative-Competitive Environments	May 11, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Composable Energy Policies for Reactive Motion Generation and Reinforcement Learning	May 11, 2021	Motion Generationreinforcement-learning	—Unverified	0
Return-based Scaling: Yet Another Normalisation Trick for Deep RL	May 11, 2021	Atari Gamesreinforcement-learning	—Unverified	0
Zero-Shot Reinforcement Learning on Graphs for Autonomous Exploration Under Uncertainty	May 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning from Reformulations in Conversational Question Answering over Knowledge Graphs	May 11, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	1
Spectral Normalisation for Deep Reinforcement Learning: an Optimisation Perspective	May 11, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Efficient Self-Supervised Data Collection for Offline Robot Learning	May 10, 2021	Diversityreinforcement-learning	—Unverified	0
Adaptive Policy Transfer in Reinforcement Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Dynamic Multichannel Access via Multi-agent Reinforcement Learning: Throughput and Fairness Guarantees	May 10, 2021	FairnessMulti-agent Reinforcement Learning	—Unverified	0
A Deep Reinforcement Learning Approach to Audio-Based Navigation in a Multi-Speaker Environment	May 10, 2021	Deep Reinforcement LearningNavigate	CodeCode Available	0
Age of Information Aware VNF Scheduling in Industrial IoT Using Deep Reinforcement Learning	May 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement learning of rare diffusive dynamics	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Parameter-free Gradient Temporal Difference Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
PEARL: Parallelized Expert-Assisted Reinforcement Learning for Scene Rearrangement Planning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning with Expert Trajectory For Quantitative Trading	May 9, 2021	Q-Learningreinforcement-learning	—Unverified	0
Improving Cost Learning for JPEG Steganography by Exploiting JPEG Domain Knowledge	May 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Differentiable Neural Architecture Search for Extremely Lightweight Image Super-Resolution	May 9, 2021	GPUImage Super-Resolution	CodeCode Available	1
A parallel-network continuous quantitative trading model with GARCH and PPO	May 8, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
RAIL: A modular framework for Reinforcement-learning-based Adversarial Imitation Learning	May 8, 2021	Imitation LearningOpenAI Gym	—Unverified	0
Scalable, Decentralized Multi-Agent Reinforcement Learning Methods Inspired by Stigmergy and Ant Colonies	May 8, 2021	Multi-agent Reinforcement LearningNavigate	—Unverified	0
Evening the Score: Targeting SARS-CoV-2 Protease Inhibition in Graph Generative Models for Therapeutic Candidates	May 7, 2021	Drug DesignDrug Discovery	CodeCode Available	1
Deep reinforcement learning-designed radiofrequency waveform in MRI	May 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Using reinforcement learning to design an AI assistantfor a satisfying co-op experience	May 7, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified	0
Model-based Multi-agent Policy Optimization with Adaptive Opponent-wise Rollouts	May 7, 2021	Multi-agent Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Reward prediction for representation learning and reward shaping	May 7, 2021	PredictionReinforcement Learning (RL)	—Unverified	0
Deep Graph Convolutional Reinforcement Learning for Financial Portfolio Management -- DeepPocket	May 6, 2021	Managementreinforcement-learning	—Unverified	0
A Reinforcement Learning-based Economic Model Predictive Control Framework for Autonomous Operation of Chemical Reactors	May 6, 2021	Model Predictive Controlparameter estimation	—Unverified	0
Meta-Learning-Based Deep Reinforcement Learning for Multiobjective Optimization Problems	May 6, 2021	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	1
Time-Aware Q-Networks: Resolving Temporal Irregularity for Deep Reinforcement Learning	May 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Safety Enhancement for Deep Reinforcement Learning in Autonomous Separation Assurance	May 5, 2021	Data AugmentationDeep Reinforcement Learning	—Unverified	0
Solving Sokoban with forward-backward reinforcement learning	May 5, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Survey on Multi-Agent Q-Learning frameworks for resource management in wireless sensor network	May 5, 2021	ManagementQ-Learning	—Unverified	0
UVIP: Model-Free Approach to Evaluate Reinforcement Learning Algorithms	May 5, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Learning Algorithms for Regenerative Stopping Problems with Applications to Shipping Consolidation in Logistics	May 5, 2021	Deep Reinforcement LearningImitation Learning	—Unverified	0
Reinforcement Learning for Scalable Logic Optimization with Graph Neural Networks	May 4, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
On the Linear convergence of Natural Policy Gradient Algorithm	May 4, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified	0
On Lottery Tickets and Minimal Task Representations in Deep Reinforcement Learning	May 4, 2021	Behavioural cloningDeep Reinforcement Learning	—Unverified	0
Data-Efficient Reinforcement Learning for Malaria Control	May 4, 2021	Decision MakingModel-based Reinforcement Learning	—Unverified	0
Deep Reinforcement Learning for Adaptive Exploration of Unknown Environments	May 4, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Generative Adversarial Reward Learning for Generalized Behavior Tendency Inference	May 3, 2021	Recommendation Systemsreinforcement-learning	—Unverified	0
Learning swimming escape patterns for larval fish under energy constraints	May 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Hierarchical Reinforcement Learning for Air-to-Air Combat	May 3, 2021	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Robotic Surgery With Lean Reinforcement Learning	May 3, 2021	Q-Learningreinforcement-learning	CodeCode Available	0
RL-IoT: Reinforcement Learning to Interact with IoT Devices	May 3, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reinforcement Learning for Ridesharing: An Extended Survey	May 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reducing Bus Bunching with Asynchronous Multi-Agent Reinforcement Learning	May 2, 2021	Graph AttentionInductive Learning	—Unverified	0
CARL-DTN: Context Adaptive Reinforcement Learning based Routing Algorithm in Delay Tolerant Network	May 2, 2021	Q-Learningreinforcement-learning	—Unverified	0
InferNet for Delayed Reinforcement Tasks: Addressing the Temporal Credit Assignment Problem	May 2, 2021	Atari GamesOffline RL	—Unverified	0

Show:10 25 50

← PrevPage 166 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified