Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1131–1140 of 15113 papers

Title	Date	Tasks	Status	Hype
Multi-Agent Reinforcement Learning for Traffic Signal Control through Universal Communication Method	Apr 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
HyperNCA: Growing Developmental Networks with Neural Cellular Automata	Apr 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Reward Reports for Reinforcement Learning	Apr 22, 2022	Chatbotreinforcement-learning	CodeCode Available	1
6GAN: IPv6 Multi-Pattern Target Generation via Generative Adversarial Nets with Reinforcement Learning	Apr 21, 2022	Decision Makingreinforcement-learning	CodeCode Available	1
Comparing Deep Reinforcement Learning Algorithms in Two-Echelon Supply Chains	Apr 20, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
A Reinforcement Learning-based Volt-VAR Control Dataset and Testing Environment	Apr 20, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
COptiDICE: Offline Constrained Reinforcement Learning via Stationary Distribution Correction Estimation	Apr 19, 2022	Offline RLOff-policy evaluation	CodeCode Available	1
FedKL: Tackling Data Heterogeneity in Federated Reinforcement Learning by Penalizing KL Divergence	Apr 18, 2022	Federated Learningreinforcement-learning	CodeCode Available	1
Can Question Rewriting Help Conversational Question Answering?	Apr 13, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
Reinforcement learning on graphs: A survey	Apr 13, 2022	Graph Miningreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 114 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified