Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9051–9075 of 15113 papers

Title	Date	Tasks	Status
A Survey on Reinforcement Learning-Aided Caching in Mobile Edge Networks	May 12, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified
Adversarial Reinforcement Learning in Dynamic Channel Access and Power Control	May 12, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Acting upon Imagination: when to trust imagined trajectories in model based reinforcement learning	May 12, 2021	Model-based Reinforcement LearningModel Predictive Control	—Unverified
Composable Energy Policies for Reactive Motion Generation and Reinforcement Learning	May 11, 2021	Motion Generationreinforcement-learning	—Unverified
Hierarchical RNNs-Based Transformers MADDPG for Mixed Cooperative-Competitive Environments	May 11, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Zero-Shot Reinforcement Learning on Graphs for Autonomous Exploration Under Uncertainty	May 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Return-based Scaling: Yet Another Normalisation Trick for Deep RL	May 11, 2021	Atari Gamesreinforcement-learning	—Unverified
Reinforcement learning of rare diffusive dynamics	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Parameter-free Gradient Temporal Difference Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
PEARL: Parallelized Expert-Assisted Reinforcement Learning for Scene Rearrangement Planning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Efficient Self-Supervised Data Collection for Offline Robot Learning	May 10, 2021	Diversityreinforcement-learning	—Unverified
Age of Information Aware VNF Scheduling in Industrial IoT Using Deep Reinforcement Learning	May 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Deep Reinforcement Learning Approach to Audio-Based Navigation in a Multi-Speaker Environment	May 10, 2021	Deep Reinforcement LearningNavigate	CodeCode Available
Dynamic Multichannel Access via Multi-agent Reinforcement Learning: Throughput and Fairness Guarantees	May 10, 2021	FairnessMulti-agent Reinforcement Learning	—Unverified
Adaptive Policy Transfer in Reinforcement Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Improving Cost Learning for JPEG Steganography by Exploiting JPEG Domain Knowledge	May 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning with Expert Trajectory For Quantitative Trading	May 9, 2021	Q-Learningreinforcement-learning	—Unverified
A parallel-network continuous quantitative trading model with GARCH and PPO	May 8, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Scalable, Decentralized Multi-Agent Reinforcement Learning Methods Inspired by Stigmergy and Ant Colonies	May 8, 2021	Multi-agent Reinforcement LearningNavigate	—Unverified
RAIL: A modular framework for Reinforcement-learning-based Adversarial Imitation Learning	May 8, 2021	Imitation LearningOpenAI Gym	—Unverified
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified
Using reinforcement learning to design an AI assistantfor a satisfying co-op experience	May 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reward prediction for representation learning and reward shaping	May 7, 2021	PredictionReinforcement Learning (RL)	—Unverified
Time-Aware Q-Networks: Resolving Temporal Irregularity for Deep Reinforcement Learning	May 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Reinforcement Learning-based Economic Model Predictive Control Framework for Autonomous Operation of Chemical Reactors	May 6, 2021	Model Predictive Controlparameter estimation	—Unverified

Show:10 25 50

← PrevPage 363 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified