Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7176–7200 of 15113 papers

Title	Date	Tasks	Status	Hype
Collective eXplainable AI: Explaining Cooperative Strategies and Agent Contribution in Multiagent Reinforcement Learning with Shapley Values	Oct 4, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	1
Automating Privilege Escalation with Deep Reinforcement Learning	Oct 4, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
DRL-Clusters: Buffer Management with Clustering based Deep Reinforcement Learning	Oct 3, 2021	ClusteringDeep Reinforcement Learning	—Unverified	0
Meta-Reinforcement Learning via Buffering Graph Signatures for Live Video Streaming Events	Oct 3, 2021	Meta-LearningMeta Reinforcement Learning	CodeCode Available	0
Decentralized Safe Reinforcement Learning for Voltage Control	Oct 3, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
A Novel Automated Curriculum Strategy to Solve Hard Sokoban Planning Instances	Oct 3, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Parallel Actors and Learners: A Framework for Generating Scalable RL Implementations	Oct 3, 2021	CPUGPU	—Unverified	0
Mapping Language to Programs using Multiple Reward Components with Inverse Reinforcement Learning	Oct 2, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Seeking Visual Discomfort: Curiosity-driven Representations for Reinforcement Learning	Oct 2, 2021	Diversityreinforcement-learning	—Unverified	0
Feel-Good Thompson Sampling for Contextual Bandits and Reinforcement Learning	Oct 2, 2021	Multi-Armed Banditsregression	—Unverified	0
BRAC+: Improved Behavior Regularized Actor Critic for Offline Reinforcement Learning	Oct 2, 2021	Offline RLreinforcement-learning	CodeCode Available	0
Terminal Adaptive Guidance for Autonomous Hypersonic Strike Weapons via Reinforcement Learning	Oct 1, 2021	Meta-Learningreinforcement-learning	—Unverified	0
Offline Reinforcement Learning with Reverse Model-based Imagination	Oct 1, 2021	Data Augmentationmodel	CodeCode Available	1
Safety aware model-based reinforcement learning for optimal control of a class of output-feedback nonlinear systems	Oct 1, 2021	Model-based Reinforcement Learningreinforcement-learning	—Unverified	0
Motion Planning for Autonomous Vehicles in the Presence of Uncertainty Using Reinforcement Learning	Oct 1, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified	0
Multi-lane Cruising Using Hierarchical Planning and Reinforcement Learning	Oct 1, 2021	Hierarchical Reinforcement LearningMotion Planning	—Unverified	0
A Cramér Distance perspective on Quantile Regression based Distributional Reinforcement Learning	Oct 1, 2021	Distributional Reinforcement Learningquantile regression	CodeCode Available	0
Cellular traffic offloading via Opportunistic Networking with Reinforcement Learning	Oct 1, 2021	Q-Learningreinforcement-learning	—Unverified	0
Guiding Evolutionary Strategies by Differentiable Robot Simulators	Oct 1, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
DNN-Opt: An RL Inspired Optimization for Analog Circuit Sizing using Deep Neural Networks	Oct 1, 2021	Reinforcement Learning (RL)	—Unverified	0
Divergence-Regularized Multi-Agent Actor-Critic	Oct 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Decentralized Graph-Based Multi-Agent Reinforcement Learning Using Reward Machines	Sep 30, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Neural Network Verification in Control	Sep 30, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
MOLUCINATE: A Generative Model for Molecules in 3D Space	Sep 30, 2021	Positionreinforcement-learning	CodeCode Available	1
Trajectory Planning with Deep Reinforcement Learning in High-Level Action Spaces	Sep 30, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 288 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified