Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 571–580 of 15113 papers

Title	Date	Tasks	Status	Hype
Maximum Entropy Reinforcement Learning via Energy-Based Normalizing Flow	May 22, 2024	IngenuityMuJoCo	CodeCode Available	1
CausalPlayground: Addressing Data-Generation Requirements in Cutting-Edge Causality Research	May 21, 2024	Reinforcement Learning (RL)	CodeCode Available	1
Feasibility Consistent Representation Learning for Safe Reinforcement Learning	May 20, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	1
Reinformer: Max-Return Sequence Modeling for Offline RL	May 14, 2024	D4RLOffline RL	CodeCode Available	1
Value Augmented Sampling for Language Model Alignment and Personalization	May 10, 2024	Language ModelingLanguage Modelling	CodeCode Available	1
Human-centric Reward Optimization for Reinforcement Learning-based Automated Driving using Large Language Models	May 7, 2024	In-Context LearningReinforcement Learning (RL)	CodeCode Available	1
Simulating the Economic Impact of Rationality through Reinforcement Learning and Agent-Based Modelling	May 3, 2024	Multi-agent Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1
No Representation, No Trust: Connecting Representation, Collapse, and Trust Issues in PPO	May 1, 2024	MuJoCoReinforcement Learning (RL)	CodeCode Available	1
Pessimistic Value Iteration for Multi-Task Data Sharing in Offline Reinforcement Learning	Apr 30, 2024	Offline RLReinforcement Learning (RL)	CodeCode Available	1
A fast balance optimization approach for charging enhancement of lithium-ion battery packs through deep reinforcement learning	Apr 24, 2024	Deep Reinforcement Learningenergy management	CodeCode Available	1

Show:10 25 50

← PrevPage 58 of 1512Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified