Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2251–2275 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
Critic-Guided Decoding for Controlled Text Generation	Dec 21, 2022	Language ModelingLanguage Modelling	CodeCode Available	1	5
Reinformer: Max-Return Sequence Modeling for Offline RL	May 14, 2024	D4RLOffline RL	CodeCode Available	1	5
Critic-Guided Decision Transformer for Offline Reinforcement Learning	Dec 21, 2023	D4RLOffline RL	CodeCode Available	1	5
Bridging Imagination and Reality for Model-Based Deep Reinforcement Learning	Oct 23, 2020	Deep Reinforcement LearningModel-based Reinforcement Learning	CodeCode Available	1	5
CropGym: a Reinforcement Learning Environment for Crop Management	Apr 9, 2021	ManagementOpenAI Gym	CodeCode Available	1	5
CROP: Conservative Reward for Model-based Offline Policy Optimization	Oct 26, 2023	D4RLOffline RL	CodeCode Available	1	5
An Inductive Bias for Distances: Neural Nets that Respect the Triangle Inequality	Feb 14, 2020	Inductive BiasMetric Learning	CodeCode Available	1	5
Cross-Domain Policy Adaptation by Capturing Representation Mismatch	May 24, 2024	Reinforcement Learning (RL)Representation Learning	CodeCode Available	1	5
Bridging RL Theory and Practice with the Effective Horizon	Apr 19, 2023	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
Cross-Embodiment Robot Manipulation Skill Transfer using Latent Space Alignment	Jun 4, 2024	DecoderReinforcement Learning (RL)	CodeCode Available	1	5
Bridging State and History Representations: Understanding Self-Predictive RL	Jan 17, 2024	Deep Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	1	5
Cross-Modal Contrastive Learning of Representations for Navigation using Lightweight, Low-Cost Millimeter Wave Radar for Adverse Environmental Conditions	Jan 10, 2021	Autonomous NavigationContrastive Learning	CodeCode Available	1	5
Learning Goal Embeddings via Self-Play for Hierarchical Reinforcement Learning	Nov 22, 2018	Hierarchical Reinforcement LearningMuJoCo	CodeCode Available	0	5
Learning Goal-Oriented Visual Dialog via Tempered Policy Gradient	Jul 2, 2018	Deep Reinforcement LearningPolicy Gradient Methods	CodeCode Available	0	5
Learning Generalizable Device Placement Algorithms for Distributed Machine Learning	Dec 1, 2019	BIG-bench Machine LearningReinforcement Learning	CodeCode Available	0	5
Learning Generalizable Representations for Reinforcement Learning via Adaptive Meta-learner of Behavioral Similarities	Dec 26, 2022	Data Augmentationreinforcement-learning	CodeCode Available	0	5
Learning Graph-Enhanced Commander-Executor for Multi-Agent Navigation	Feb 8, 2023	Hierarchical Reinforcement LearningMulti-agent Reinforcement Learning	CodeCode Available	0	5
Learning from Multiple Independent Advisors in Multi-agent Reinforcement Learning	Jan 26, 2023	Multi-agent Reinforcement LearningQ-Learning	CodeCode Available	0	5
Learning from Sparse Offline Datasets via Conservative Density Estimation	Jan 16, 2024	D4RLDensity Estimation	CodeCode Available	0	5
A Semi-Supervised Approach for Low-Resourced Text Generation	Jun 3, 2019	DecoderDenoising	CodeCode Available	0	5
Behavior Prior Representation learning for Offline Reinforcement Learning	Nov 2, 2022	Offline RLreinforcement-learning	CodeCode Available	0	5
Learning from Learners: Adapting Reinforcement Learning Agents to be Competitive in a Card Game	Apr 8, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	0	5
Learning from Trajectories via Subgoal Discovery	Nov 3, 2019	Imitation LearningReinforcement Learning	CodeCode Available	0	5
Learning from Ambiguous Demonstrations with Self-Explanation Guided Reinforcement Learning	Oct 11, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0	5
Behavior Estimation from Multi-Source Data for Offline Reinforcement Learning	Nov 29, 2022	Offline RLreinforcement-learning	CodeCode Available	0	5

Show:10 25 50

← PrevPage 91 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified