Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8251–8275 of 15113 papers

Title	Date	Tasks	Status	Hype
A Reinforcement Learning Environment for Multi-Service UAV-enabled Wireless Systems	May 11, 2021	BenchmarkingEdge-computing	CodeCode Available	1
Hierarchical RNNs-Based Transformers MADDPG for Mixed Cooperative-Competitive Environments	May 11, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Composable Energy Policies for Reactive Motion Generation and Reinforcement Learning	May 11, 2021	Motion Generationreinforcement-learning	—Unverified	0
Return-based Scaling: Yet Another Normalisation Trick for Deep RL	May 11, 2021	Atari Gamesreinforcement-learning	—Unverified	0
Zero-Shot Reinforcement Learning on Graphs for Autonomous Exploration Under Uncertainty	May 11, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Reinforcement Learning from Reformulations in Conversational Question Answering over Knowledge Graphs	May 11, 2021	Conversational Question AnsweringKnowledge Graphs	CodeCode Available	1
Spectral Normalisation for Deep Reinforcement Learning: an Optimisation Perspective	May 11, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Efficient Self-Supervised Data Collection for Offline Robot Learning	May 10, 2021	Diversityreinforcement-learning	—Unverified	0
Adaptive Policy Transfer in Reinforcement Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Dynamic Multichannel Access via Multi-agent Reinforcement Learning: Throughput and Fairness Guarantees	May 10, 2021	FairnessMulti-agent Reinforcement Learning	—Unverified	0
A Deep Reinforcement Learning Approach to Audio-Based Navigation in a Multi-Speaker Environment	May 10, 2021	Deep Reinforcement LearningNavigate	CodeCode Available	0
Age of Information Aware VNF Scheduling in Industrial IoT Using Deep Reinforcement Learning	May 10, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement learning of rare diffusive dynamics	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Parameter-free Gradient Temporal Difference Learning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
PEARL: Parallelized Expert-Assisted Reinforcement Learning for Scene Rearrangement Planning	May 10, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning with Expert Trajectory For Quantitative Trading	May 9, 2021	Q-Learningreinforcement-learning	—Unverified	0
Improving Cost Learning for JPEG Steganography by Exploiting JPEG Domain Knowledge	May 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Differentiable Neural Architecture Search for Extremely Lightweight Image Super-Resolution	May 9, 2021	GPUImage Super-Resolution	CodeCode Available	1
A parallel-network continuous quantitative trading model with GARCH and PPO	May 8, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
RAIL: A modular framework for Reinforcement-learning-based Adversarial Imitation Learning	May 8, 2021	Imitation LearningOpenAI Gym	—Unverified	0
Scalable, Decentralized Multi-Agent Reinforcement Learning Methods Inspired by Stigmergy and Ant Colonies	May 8, 2021	Multi-agent Reinforcement LearningNavigate	—Unverified	0
Evening the Score: Targeting SARS-CoV-2 Protease Inhibition in Graph Generative Models for Therapeutic Candidates	May 7, 2021	Drug DesignDrug Discovery	CodeCode Available	1
Deep reinforcement learning-designed radiofrequency waveform in MRI	May 7, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Using reinforcement learning to design an AI assistantfor a satisfying co-op experience	May 7, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Utilizing Skipped Frames in Action Repeats via Pseudo-Actions	May 7, 2021	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 331 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified