Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6901–6950 of 15113 papers

Title	Date	Tasks	Status	Hype
Learning Multiresolution Matrix Factorization and its Wavelet Networks on Graphs	Nov 2, 2021	Reinforcement Learning (RL)	CodeCode Available	0
Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement Learning Approach	Nov 2, 2021	continuous-controlContinuous Control	—Unverified	0
OnSlicing: Online End-to-End Network Slicing with Reinforcement Learning	Nov 2, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Integrating Pretrained Language Model for Dialogue Policy Learning	Nov 2, 2021	Language ModelingLanguage Modelling	—Unverified	0
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics	Nov 2, 2021	D4RLData Augmentation	—Unverified	0
Learning Large Neighborhood Search Policy for Integer Programming	Nov 1, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
Rewards with Negative Examples for Reinforced Topic-Focused Abstractive Summarization	Nov 1, 2021	Abstractive Text SummarizationDeep Reinforcement Learning	—Unverified	0
A Collaborative Multi-agent Reinforcement Learning Framework for Dialog Action Decomposition	Nov 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Feedback Attribution for Counterfactual Bandit Learning in Multi-Domain Spoken Language Understanding	Nov 1, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified	0
A Generative Framework for Simultaneous Machine Translation	Nov 1, 2021	Machine Translationreinforcement-learning	—Unverified	0
Neuro-Symbolic Approaches for Text-Based Policy Learning	Nov 1, 2021	Reinforcement Learning (RL)text-based games	CodeCode Available	0
Learning Task Sampling Policy for Multitask Learning	Nov 1, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Decentralized Cooperative Reinforcement Learning with Hierarchical Information Structure	Nov 1, 2021	Multi-agent Reinforcement LearningMulti-Armed Bandits	—Unverified	0
Learning to Operate an Electric Vehicle Charging Station Considering Vehicle-grid Integration	Nov 1, 2021	Model Predictive Controlreinforcement-learning	—Unverified	0
Human-Level Control without Server-Grade Hardware	Nov 1, 2021	Cloud ComputingCPU	CodeCode Available	0
Machine Learning aided Crop Yield Optimization	Nov 1, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
Settling the Horizon-Dependence of Sample Complexity in Reinforcement Learning	Nov 1, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Investigation of Independent Reinforcement Learning Algorithms in Multi-Agent Environments	Nov 1, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
An Actor-Critic Method for Simulation-Based Optimization	Oct 31, 2021	Adversarial AttackReinforcement Learning (RL)	—Unverified	0
Decentralized Multi-Agent Reinforcement Learning: An Off-Policy Method	Oct 31, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
Learning Coordinated Terrain-Adaptive Locomotion by Imitating a Centroidal Dynamics Planner	Oct 30, 2021	Imitation LearningReinforcement Learning (RL)	—Unverified	0
Adjacency constraint for efficient hierarchical reinforcement learning	Oct 30, 2021	continuous-controlContinuous Control	—Unverified	0
A Decentralized Reinforcement Learning Framework for Efficient Passage of Emergency Vehicles	Oct 30, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Convergence and Optimality of Policy Gradient Methods in Weakly Smooth Settings	Oct 30, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Intrusion Prevention through Optimal Stopping	Oct 30, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Context Meta-Reinforcement Learning via Neuromodulation	Oct 30, 2021	continuous-controlContinuous Control	CodeCode Available	0
On Joint Learning for Solving Placement and Routing in Chip Design	Oct 30, 2021	GPUreinforcement-learning	CodeCode Available	1
Reinforced Workload Distribution Fairness	Oct 29, 2021	FairnessReinforcement Learning (RL)	—Unverified	0
Mixed Cooperative-Competitive Communication Using Multi-Agent Reinforcement Learning	Oct 29, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Learning to Communicate with Reinforcement Learning for an Adaptive Traffic Control System	Oct 29, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified	0
GalilAI: Out-of-Task Distribution Detection using Causal Active Experimentation for Safe Transfer RL	Oct 29, 2021	Out of Distribution (OOD) DetectionReinforcement Learning (RL)	—Unverified	0
Attacking Video Recognition Models with Bullet-Screen Comments	Oct 29, 2021	Adversarial AttackAdversarial Attack on Video Classification	CodeCode Available	1
Brick-by-Brick: Combinatorial Construction with Deep Reinforcement Learning	Oct 29, 2021	Deep Reinforcement LearningObject	—Unverified	0
Adaptive Discretization in Online Reinforcement Learning	Oct 29, 2021	Managementreinforcement-learning	—Unverified	0
Data Informed Residual Reinforcement Learning for High-Dimensional Robotic Tracking Control	Oct 28, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Open Problem: Tight Online Confidence Intervals for RKHS Elements	Oct 28, 2021	Reinforcement Learning (RL)	—Unverified	0
Proximal Reinforcement Learning: Efficient Off-Policy Evaluation in Partially Observed Markov Decision Processes	Oct 28, 2021	Causal InferenceManagement	CodeCode Available	0
Efficient Meta Subspace Optimization	Oct 28, 2021	Reinforcement Learning (RL)	CodeCode Available	0
URLB: Unsupervised Reinforcement Learning Benchmark	Oct 28, 2021	continuous-controlContinuous Control	CodeCode Available	1
D2RLIR : an improved and diversified ranking function in interactive recommendation systems based on deep reinforcement learning	Oct 28, 2021	Deep Reinforcement LearningDiversity	—Unverified	0
An Adaptable Approach to Learn Realistic Legged Locomotion without Examples	Oct 28, 2021	Reinforcement Learning (RL)	—Unverified	0
Accelerating Robotic Reinforcement Learning via Parameterized Action Primitives	Oct 28, 2021	Efficient Explorationreinforcement-learning	—Unverified	0
Bayesian Sequential Optimal Experimental Design for Nonlinear Models Using Policy Gradient Reinforcement Learning	Oct 28, 2021	Experimental Designreinforcement-learning	—Unverified	0
Extracting Expert's Goals by What-if Interpretable Modeling	Oct 28, 2021	Additive modelsreinforcement-learning	—Unverified	0
Choosing the Best of Both Worlds: Diverse and Novel Recommendations through Multi-Objective Reinforcement Learning	Oct 28, 2021	DiversityMulti-Objective Reinforcement Learning	—Unverified	0
A Law of Iterated Logarithm for Multi-Agent Reinforcement Learning	Oct 27, 2021	Decision MakingMulti-agent Reinforcement Learning	—Unverified	0
Reinforcement Learning in Linear MDPs: Constant Regret and Representation Selection	Oct 27, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Stabilising viscous extensional flows using Reinforcement Learning	Oct 27, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
The ODE Method for Asymptotic Statistics in Stochastic Approximation and Reinforcement Learning	Oct 27, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Model based Multi-agent Reinforcement Learning with Tensor Decompositions	Oct 27, 2021	Model-based Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 139 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified