Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9051–9100 of 15113 papers

Title	Date	Tasks	Status
A Survey on Reinforcement Learning-Aided Caching in Mobile Edge Networks	May 12, 2021	BIG-bench Machine Learningreinforcement-learning	—Unverified
Adversarial Reinforcement Learning in Dynamic Channel Access and Power Control	May 12, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Acting upon Imagination: when to trust imagined trajectories in model based reinforcement learning	May 12, 2021	Model-based Reinforcement LearningModel Predictive Control	—Unverified
Composable Energy Policies for Reactive Motion Generation and Reinforcement Learning	May 11, 2021	Motion Generationreinforcement-learning	—Unverified
Hierarchical RNNs-Based Transformers MADDPG for Mixed Cooperative-Competitive Environments	May 11, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Zero-Shot Reinforcement Learning on Graphs for Autonomous Exploration Under Uncertainty	May 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Return-based Scaling: Yet Another Normalisation Trick for Deep RL	May 11, 2021	Atari Gamesreinforcement-learning	—Unverified
Reinforcement learning of rare diffusive dynamics	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Parameter-free Gradient Temporal Difference Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
PEARL: Parallelized Expert-Assisted Reinforcement Learning for Scene Rearrangement Planning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Efficient Self-Supervised Data Collection for Offline Robot Learning	May 10, 2021	Diversityreinforcement-learning	—Unverified
Age of Information Aware VNF Scheduling in Industrial IoT Using Deep Reinforcement Learning	May 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Deep Reinforcement Learning Approach to Audio-Based Navigation in a Multi-Speaker Environment	May 10, 2021	Deep Reinforcement LearningNavigate	CodeCode Available
Dynamic Multichannel Access via Multi-agent Reinforcement Learning: Throughput and Fairness Guarantees	May 10, 2021	FairnessMulti-agent Reinforcement Learning	—Unverified
Adaptive Policy Transfer in Reinforcement Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified
Improving Cost Learning for JPEG Steganography by Exploiting JPEG Domain Knowledge	May 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning with Expert Trajectory For Quantitative Trading	May 9, 2021	Q-Learningreinforcement-learning	—Unverified
A parallel-network continuous quantitative trading model with GARCH and PPO	May 8, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Scalable, Decentralized Multi-Agent Reinforcement Learning Methods Inspired by Stigmergy and Ant Colonies	May 8, 2021	Multi-agent Reinforcement LearningNavigate	—Unverified
RAIL: A modular framework for Reinforcement-learning-based Adversarial Imitation Learning	May 8, 2021	Imitation LearningOpenAI Gym	—Unverified
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified
Using reinforcement learning to design an AI assistantfor a satisfying co-op experience	May 7, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reward prediction for representation learning and reward shaping	May 7, 2021	PredictionReinforcement Learning (RL)	—Unverified
Time-Aware Q-Networks: Resolving Temporal Irregularity for Deep Reinforcement Learning	May 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
A Reinforcement Learning-based Economic Model Predictive Control Framework for Autonomous Operation of Chemical Reactors	May 6, 2021	Model Predictive Controlparameter estimation	—Unverified
Deep Graph Convolutional Reinforcement Learning for Financial Portfolio Management -- DeepPocket	May 6, 2021	Managementreinforcement-learning	—Unverified
Learning Algorithms for Regenerative Stopping Problems with Applications to Shipping Consolidation in Logistics	May 5, 2021	Deep Reinforcement LearningImitation Learning	—Unverified
Solving Sokoban with forward-backward reinforcement learning	May 5, 2021	reinforcement-learningReinforcement Learning	—Unverified
Safety Enhancement for Deep Reinforcement Learning in Autonomous Separation Assurance	May 5, 2021	Data AugmentationDeep Reinforcement Learning	—Unverified
Survey on Multi-Agent Q-Learning frameworks for resource management in wireless sensor network	May 5, 2021	ManagementQ-Learning	—Unverified
UVIP: Model-Free Approach to Evaluate Reinforcement Learning Algorithms	May 5, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Reinforcement Learning for Scalable Logic Optimization with Graph Neural Networks	May 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
On Lottery Tickets and Minimal Task Representations in Deep Reinforcement Learning	May 4, 2021	Behavioural cloningDeep Reinforcement Learning	—Unverified
On the Linear convergence of Natural Policy Gradient Algorithm	May 4, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified
Data-Efficient Reinforcement Learning for Malaria Control	May 4, 2021	Decision MakingModel-based Reinforcement Learning	—Unverified
Generative Adversarial Reward Learning for Generalized Behavior Tendency Inference	May 3, 2021	Recommendation Systemsreinforcement-learning	—Unverified
Hierarchical Reinforcement Learning for Air-to-Air Combat	May 3, 2021	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Learning swimming escape patterns for larval fish under energy constraints	May 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Robotic Surgery With Lean Reinforcement Learning	May 3, 2021	Q-Learningreinforcement-learning	CodeCode Available
Reinforcement Learning for Ridesharing: An Extended Survey	May 3, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reducing Bus Bunching with Asynchronous Multi-Agent Reinforcement Learning	May 2, 2021	Graph AttentionInductive Learning	—Unverified
Curious Exploration and Return-based Memory Restoration for Deep Reinforcement Learning	May 2, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available
BACKDOORL: Backdoor Attack against Competitive Reinforcement Learning	May 2, 2021	Atari GamesBackdoor Attack	—Unverified
InferNet for Delayed Reinforcement Tasks: Addressing the Temporal Credit Assignment Problem	May 2, 2021	Atari GamesOffline RL	—Unverified
CARL-DTN: Context Adaptive Reinforcement Learning based Routing Algorithm in Delay Tolerant Network	May 2, 2021	Q-Learningreinforcement-learning	—Unverified
Better than the Best: Gradient-based Improper Reinforcement Learning for Network Scheduling	May 1, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Nearest-Neighbor-based Collision Avoidance for Quadrotors via Reinforcement Learning	Apr 30, 2021	Collision AvoidanceGeneral Reinforcement Learning	—Unverified
Discrete-Time Mean Field Control with Environment States	Apr 30, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Mitigating Political Bias in Language Models Through Reinforced Calibration	Apr 30, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Mean Field MARL Based Bandwidth Negotiation Method for Massive Devices Spectrum Sharing	Apr 30, 2021	Decision MakingDistributed Optimization	—Unverified

Show:10 25 50

← PrevPage 182 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified