Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9126–9150 of 15113 papers

Title	Date	Tasks	Status
CVLight: Decentralized Learning for Adaptive Traffic Signal Control with Connected Vehicles	Apr 21, 2021	Reinforcement Learning (RL)Traffic Signal Control	—Unverified
Reinforcement Learning for Traffic Signal Control: Comparison with Commercial Systems	Apr 21, 2021	Q-Learningreinforcement-learning	—Unverified
Tackling Variabilities in Autonomous Driving	Apr 21, 2021	Autonomous DrivingDeep Reinforcement Learning	—Unverified
Policy Fusion for Adaptive and Customizable Reinforcement Learning Agents	Apr 21, 2021	reinforcement-learningReinforcement Learning	—Unverified
Model-aided Deep Reinforcement Learning for Sample-efficient UAV Trajectory Design in IoT Networks	Apr 21, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
Model-predictive control and reinforcement learning in multi-energy system case studies	Apr 20, 2021	BenchmarkingModel Predictive Control	—Unverified
Network Defense is Not a Game	Apr 20, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Outcome-Driven Reinforcement Learning via Variational Inference	Apr 20, 2021	reinforcement-learningReinforcement Learning	—Unverified
Scalable Synthesis of Verified Controllers in Deep Reinforcement Learning	Apr 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Network-wide traffic signal control optimization using a multi-agent deep reinforcement learning	Apr 20, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Prospective Artificial Intelligence Approaches for Active Cyber Defence	Apr 20, 2021	Causal InferencePosition	—Unverified
DRL: Deep Reinforcement Learning for Intelligent Robot Control -- Concept, Literature, and Future	Apr 20, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Discovering an Aid Policy to Minimize Student Evasion Using Offline Reinforcement Learning	Apr 20, 2021	ClusteringDecision Making	—Unverified
GLiDE: Generalizable Quadrupedal Locomotion in Diverse Environments with a Centroidal Model	Apr 20, 2021	Model Predictive ControlReinforcement Learning (RL)	—Unverified
Agent-Centric Representations for Multi-Agent Reinforcement Learning	Apr 19, 2021	Inductive BiasMulti-agent Reinforcement Learning	—Unverified
Constraints Satisfiability Driven Reinforcement Learning for Autonomous Cyber Defense	Apr 19, 2021	Decision Makingreinforcement-learning	—Unverified
Approximated Multi-Agent Fitted Q Iteration	Apr 19, 2021	Decision Makingreinforcement-learning	—Unverified
Adaptive learning for financial markets mixing model-based and model-free RL for volatility targeting	Apr 19, 2021	Deep Reinforcement Learningmodel	—Unverified
Deep Reinforcement Learning in a Monetary Model	Apr 19, 2021	Deep Reinforcement Learningmodel	—Unverified
Training Value-Aligned Reinforcement Learning Agents Using a Normative Prior	Apr 19, 2021	reinforcement-learningReinforcement Learning	—Unverified
Probabilistic Mixture-of-Experts for Efficient Deep Reinforcement Learning	Apr 19, 2021	Deep Reinforcement LearningMixture-of-Experts	CodeCode Available
Singular Perturbation-based Reinforcement Learning of Two-Point Boundary Optimal Control Systems	Apr 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement learning for linear-convex models with jumps via stability analysis of feedback controls	Apr 19, 2021	Reinforcement Learning (RL)	—Unverified
Quick Learner Automated Vehicle Adapting its Roadmanship to Varying Traffic Cultures with Meta Reinforcement Learning	Apr 18, 2021	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified
Reinforcement learning based process optimization and strategy development in conventional tunneling	Apr 17, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available

Show:10 25 50

← PrevPage 366 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified