Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6926–6950 of 15113 papers

Title	Date	Tasks	Status	Hype
Context Meta-Reinforcement Learning via Neuromodulation	Oct 30, 2021	continuous-controlContinuous Control	CodeCode Available	0
On Joint Learning for Solving Placement and Routing in Chip Design	Oct 30, 2021	GPUreinforcement-learning	CodeCode Available	1
Reinforced Workload Distribution Fairness	Oct 29, 2021	FairnessReinforcement Learning (RL)	—Unverified	0
Mixed Cooperative-Competitive Communication Using Multi-Agent Reinforcement Learning	Oct 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Communicate with Reinforcement Learning for an Adaptive Traffic Control System	Oct 29, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
GalilAI: Out-of-Task Distribution Detection using Causal Active Experimentation for Safe Transfer RL	Oct 29, 2021	Out of Distribution (OOD) DetectionReinforcement Learning (RL)	—Unverified	0
Attacking Video Recognition Models with Bullet-Screen Comments	Oct 29, 2021	Adversarial AttackAdversarial Attack on Video Classification	CodeCode Available	1
Brick-by-Brick: Combinatorial Construction with Deep Reinforcement Learning	Oct 29, 2021	Deep Reinforcement LearningObject	—Unverified	0
Adaptive Discretization in Online Reinforcement Learning	Oct 29, 2021	Managementreinforcement-learning	—Unverified	0
Data Informed Residual Reinforcement Learning for High-Dimensional Robotic Tracking Control	Oct 28, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Open Problem: Tight Online Confidence Intervals for RKHS Elements	Oct 28, 2021	Reinforcement Learning (RL)	—Unverified	0
Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in Partially Observed Markov Decision Processes	Oct 28, 2021	Causal InferenceManagement	CodeCode Available	0
Efficient Meta Subspace Optimization	Oct 28, 2021	Reinforcement Learning (RL)	CodeCode Available	0
URLB: Unsupervised Reinforcement Learning Benchmark	Oct 28, 2021	continuous-controlContinuous Control	CodeCode Available	1
D2RLIR : an improved and diversified ranking function in interactive recommendation systems based on deep reinforcement learning	Oct 28, 2021	Deep Reinforcement LearningDiversity	—Unverified	0
An Adaptable Approach to Learn Realistic Legged Locomotion without Examples	Oct 28, 2021	Reinforcement Learning (RL)	—Unverified	0
Accelerating Robotic Reinforcement Learning via Parameterized Action Primitives	Oct 28, 2021	Efficient Explorationreinforcement-learning	—Unverified	0
Bayesian Sequential Optimal Experimental Design for Nonlinear Models Using Policy Gradient Reinforcement Learning	Oct 28, 2021	Experimental Designreinforcement-learning	—Unverified	0
Extracting Expert's Goals by What-if Interpretable Modeling	Oct 28, 2021	Additive modelsreinforcement-learning	—Unverified	0
Choosing the Best of Both Worlds: Diverse and Novel Recommendations through Multi-Objective Reinforcement Learning	Oct 28, 2021	DiversityMulti-Objective Reinforcement Learning	—Unverified	0
A Law of Iterated Logarithm for Multi-Agent Reinforcement Learning	Oct 27, 2021	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection	Oct 27, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Stabilising viscous extensional flows using Reinforcement Learning	Oct 27, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning	Oct 27, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Model based Multi-agent Reinforcement Learning with Tensor Decompositions	Oct 27, 2021	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 278 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified