Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 2176–2200 of 15113 papers

Title	Date	Tasks	Status	Hype	Score
LCRL: Certified Policy Synthesis via Logically-Constrained Reinforcement Learning	Sep 21, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Learning a Decentralized Multi-arm Motion Planner	Nov 5, 2020	Motion PlanningMulti-agent Reinforcement Learning	CodeCode Available	1	5
Connecting Deep-Reinforcement-Learning-based Obstacle Avoidance with Conventional Global Planners using Waypoint Generators	Apr 8, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
An End-to-End Reinforcement Learning Approach for Job-Shop Scheduling Problems Based on Constraint Programming	Jun 9, 2023	Combinatorial OptimizationFeature Engineering	CodeCode Available	1	5
Blockchain Framework for Artificial Intelligence Computation	Feb 23, 2022	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
B-Pref: Benchmarking Preference-Based Reinforcement Learning	Nov 4, 2021	Benchmarkingreinforcement-learning	CodeCode Available	1	5
Contrastive Active Inference	Oct 19, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Abstract-to-Executable Trajectory Translation for One-Shot Task Generalization	Oct 14, 2022	Few-Shot Imitation LearningReinforcement Learning (RL)	CodeCode Available	1	5
Conservative Q-Learning for Offline Reinforcement Learning	Jun 8, 2020	continuous-controlContinuous Control	CodeCode Available	1	5
Consistency Models as a Rich and Efficient Policy Class for Reinforcement Learning	Sep 29, 2023	Image GenerationOffline RL	CodeCode Available	1	5
Reliable Conditioning of Behavioral Cloning for Offline Reinforcement Learning	Oct 11, 2022	Offline RLreinforcement-learning	CodeCode Available	1	5
Bellman: A Toolbox for Model-Based Reinforcement Learning in TensorFlow	Mar 26, 2021	Model-based Reinforcement Learningreinforcement-learning	CodeCode Available	1	5
An Equivalence between Loss Functions and Non-Uniform Sampling in Experience Replay	Jul 12, 2020	Deep Reinforcement LearningMuJoCo	CodeCode Available	1	5
Constrained episodic reinforcement learning in concave-convex and knapsack settings	Jun 9, 2020	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
BOME! Bilevel Optimization Made Easy: A Simple First-Order Approach	Sep 19, 2022	Bilevel OptimizationContinual Learning	CodeCode Available	1	5
Large Neighborhood Search based on Neural Construction Heuristics	May 2, 2022	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1	5
Constrained Variational Policy Optimization for Safe Reinforcement Learning	Jan 28, 2022	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Constrained Update Projection Approach to Safe Policy Optimization	Sep 15, 2022	Reinforcement Learning (RL)Safe Reinforcement Learning	CodeCode Available	1	5
Contextualized Rewriting for Text Summarization	Jan 31, 2021	Extractive Summarizationreinforcement-learning	CodeCode Available	1	5
Believe What You See: Implicit Constraint Approach for Offline Multi-Agent Reinforcement Learning	Jun 7, 2021	Multi-agent Reinforcement LearningOffline RL	CodeCode Available	1	5
Constraint-Guided Reinforcement Learning: Augmenting the Agent-Environment-Interaction	Apr 24, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
Constructions in combinatorics via neural networks	Apr 29, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
M2CURL: Sample-Efficient Multimodal Reinforcement Learning via Self-Supervised Representation Learning for Robotic Manipulation	Jan 30, 2024	reinforcement-learningReinforcement Learning	CodeCode Available	1	5
A Deep Reinforced Model for Zero-Shot Cross-Lingual Summarization with Bilingual Semantic Similarity Rewards	Jun 27, 2020	Machine Translationreinforcement-learning	CodeCode Available	1	5
Large Language Model as a Policy Teacher for Training Reinforcement Learning Agents	Nov 22, 2023	Decision MakingLanguage Modeling	CodeCode Available	1	5

Show:10 25 50

← PrevPage 88 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified