Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 6526–6550 of 15113 papers

Title	Date	Tasks	Status	Hype
An Efficient Combinatorial Optimization Model Using Learning-to-Rank Distillation	Dec 24, 2021	Combinatorial OptimizationDeep Reinforcement Learning	CodeCode Available	0
Rediscovering Affordance: A Reinforcement Learning Perspective	Dec 24, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
On the Unreasonable Efficiency of State Space Clustering in Personalization Tasks	Dec 24, 2021	Clusteringreinforcement-learning	CodeCode Available	0
Learning to Walk with Dual Agents for Knowledge Graph Reasoning	Dec 23, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	1
Improving the Efficiency of Off-Policy Reinforcement Learning by Accounting for Past Decisions	Dec 23, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Missing Velocity in Dynamic Obstacle Avoidance based on Deep Reinforcement Learning	Dec 23, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Safety and Liveness Guarantees through Reach-Avoid Reinforcement Learning	Dec 23, 2021	Deep Reinforcement LearningQ-Learning	CodeCode Available	1
Local Advantage Networks for Cooperative Multi-Agent Reinforcement Learning	Dec 23, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Alpha-Mini: Minichess Agent with Deep Reinforcement Learning	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Adversarial Deep Reinforcement Learning for Improving the Robustness of Multi-agent Autonomous Driving Policies	Dec 22, 2021	Autonomous DrivingDeep Reinforcement Learning	CodeCode Available	1
A Deep Reinforcement Learning Approach for Solving the Traveling Salesman Problem with Drone	Dec 22, 2021	Combinatorial OptimizationComputational Efficiency	CodeCode Available	1
Deep Reinforcement Learning for Optimal Power Flow with Renewables Using Graph Information	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Graph augmented Deep Reinforcement Learning in the GameRLand3D environment	Dec 22, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Evaluating the Robustness of Deep Reinforcement Learning for Autonomous Policies in a Multi-agent Urban Driving Environment	Dec 22, 2021	Autonomous DrivingBenchmarking	CodeCode Available	0
Direct Behavior Specification via Constrained Reinforcement Learning	Dec 22, 2021	continuous-controlContinuous Control	CodeCode Available	1
Maximum Entropy Population-Based Training for Zero-Shot Human-AI Coordination	Dec 22, 2021	DiversityReinforcement Learning (RL)	CodeCode Available	1
Newsvendor Model with Deep Reinforcement Learning	Dec 22, 2021	Deep Reinforcement Learningmodel	CodeCode Available	0
Reinforcement Learning based Sequential Batch-sampling for Bayesian Optimal Experimental Design	Dec 21, 2021	Deep Reinforcement LearningExperimental Design	—Unverified	0
Nearly Optimal Policy Optimization with Stable at Any Time Guarantee	Dec 21, 2021	4kReinforcement Learning (RL)	—Unverified	0
Off Environment Evaluation Using Convex Risk Minimization	Dec 21, 2021	Reinforcement Learning (RL)	CodeCode Available	0
Soft Actor-Critic with Cross-Entropy Policy Optimization	Dec 21, 2021	Reinforcement Learning (RL)	CodeCode Available	0
District Cooling System Control for Providing Operating Reserve based on Safe Deep Reinforcement Learning	Dec 21, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Do Androids Dream of Electric Fences? Safety-Aware Reinforcement Learning with Latent Shielding	Dec 21, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Aerial Base Station Positioning and Power Control for Securing Communications: A Deep Q-Network Approach	Dec 21, 2021	PositionQ-Learning	—Unverified	0
A Scalable Deep Reinforcement Learning Model for Online Scheduling Coflows of Multi-Stage Jobs for High Performance Computing	Dec 21, 2021	Deep Reinforcement LearningGraph Neural Network	—Unverified	0

Show:10 25 50

← PrevPage 262 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified