Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1126–1150 of 15113 papers

Title	Date	Tasks	Status	Hype
CCLF: A Contrastive-Curiosity-Driven Learning Framework for Sample-Efficient Reinforcement Learning	May 2, 2022	Data AugmentationQ-Learning	CodeCode Available	1
Large Neighborhood Search based on Neural Construction Heuristics	May 2, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
TTOpt: A Maximum Volume Quantized Tensor Train-based Optimization and its Application to Reinforcement Learning	Apr 30, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Accelerating Robot Learning of Contact-Rich Manipulations: A Curriculum Learning Study	Apr 27, 2022	Contact-rich ManipulationReinforcement Learning (RL)	CodeCode Available	1
RAMBO-RL: Robust Adversarial Model-Based Offline Reinforcement Learning	Apr 26, 2022	Offline RLreinforcement-learning	CodeCode Available	1
Multi-Agent Reinforcement Learning for Traffic Signal Control through Universal Communication Method	Apr 26, 2022	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	1
HyperNCA: Growing Developmental Networks with Neural Cellular Automata	Apr 25, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Reward Reports for Reinforcement Learning	Apr 22, 2022	Chatbotreinforcement-learning	CodeCode Available	1
6GAN: IPv6 Multi-Pattern Target Generation via Generative Adversarial Nets with Reinforcement Learning	Apr 21, 2022	Decision Makingreinforcement-learning	CodeCode Available	1
A Reinforcement Learning-based Volt-VAR Control Dataset and Testing Environment	Apr 20, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Comparing Deep Reinforcement Learning Algorithms in Two-Echelon Supply Chains	Apr 20, 2022	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
COptiDICE: Offline Constrained Reinforcement Learning via Stationary Distribution Correction Estimation	Apr 19, 2022	Offline RLOff-policy evaluation	CodeCode Available	1
FedKL: Tackling Data Heterogeneity in Federated Reinforcement Learning by Penalizing KL Divergence	Apr 18, 2022	Federated Learningreinforcement-learning	CodeCode Available	1
Can Question Rewriting Help Conversational Question Answering?	Apr 13, 2022	Conversational Question AnsweringQuestion Answering	CodeCode Available	1
Reinforcement learning on graphs: A survey	Apr 13, 2022	Graph Miningreinforcement-learning	CodeCode Available	1
Confidence Estimation Transformer for Long-term Renewable Energy Forecasting in Reinforcement Learning-based Power Grid Dispatching	Apr 10, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Grounding Hindsight Instructions in Multi-Goal Reinforcement Learning for Robotics	Apr 8, 2022	Multi-Goal Reinforcement Learningreinforcement-learning	CodeCode Available	1
Offline Reinforcement Learning for Safer Blood Glucose Control in People with Type 1 Diabetes	Apr 7, 2022	Offline RLReinforcement Learning (RL)	CodeCode Available	1
Federated Reinforcement Learning with Environment Heterogeneity	Apr 6, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Multi-Agent Distributed Reinforcement Learning for Making Decentralized Offloading Decisions	Apr 5, 2022	Decision MakingFairness	CodeCode Available	1
Jump-Start Reinforcement Learning	Apr 5, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1
Inferring Rewards from Language in Context	Apr 5, 2022	Instruction FollowingReinforcement Learning (RL)	CodeCode Available	1
Value Gradient weighted Model-Based Reinforcement Learning	Apr 4, 2022	modelModel-based Reinforcement Learning	CodeCode Available	1
Adaptive Risk-Tendency: Nano Drone Navigation in Cluttered Environments with Distributional Reinforcement Learning	Mar 28, 2022	Distributional Reinforcement LearningDrone navigation	CodeCode Available	1
Reinforcement Learning with Action-Free Pre-Training from Videos	Mar 25, 2022	Predictionreinforcement-learning	CodeCode Available	1

Show:10 25 50

← PrevPage 46 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified