Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7301–7325 of 15113 papers

Title	Date	Tasks	Status
Learning Relative Return Policies With Upside-Down Reinforcement Learning	Feb 23, 2022	reinforcement-learningReinforcement Learning	—Unverified
Drawing Inductor Layout with a Reinforcement Learning Agent: Method and Application for VCO Inductors	Feb 23, 2022	Reinforcement Learning (RL)	—Unverified
Comparative analysis of machine learning methods for active flow control	Feb 23, 2022	Bayesian OptimizationBIG-bench Machine Learning	—Unverified
Consistent Dropout for Policy Gradient Reinforcement Learning	Feb 23, 2022	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning in Practice: Opportunities and Challenges	Feb 23, 2022	Combinatorial OptimizationMeta-Learning	—Unverified
Training Characteristic Functions with Reinforcement Learning: XAI-methods play Connect Four	Feb 23, 2022	counterfactualExplainable Artificial Intelligence (XAI)	—Unverified
Reinforcement Learning from Demonstrations by Novel Interactive Expert and Application to Automatic Berthing Control Systems for Unmanned Surface Vessel	Feb 23, 2022	Model Predictive Controlreinforcement-learning	—Unverified
Multi-fidelity reinforcement learning framework for shape optimization	Feb 22, 2022	Deep Reinforcement Learningreinforcement-learning	—Unverified
Sequential Information Design: Markov Persuasion Process and Its Efficient Reinforcement Learning	Feb 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reward-Free Policy Space Compression for Reinforcement Learning	Feb 22, 2022	reinforcement-learningReinforcement Learning	—Unverified
A policy gradient approach for optimization of smooth risk measures	Feb 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Behaviour-Diverse Automatic Penetration Testing: A Curiosity-Driven Multi-Objective Deep Reinforcement Learning Approach	Feb 22, 2022	Deep Reinforcement LearningMulti-Objective Reinforcement Learning	—Unverified
Continual Auxiliary Task Learning	Feb 22, 2022	reinforcement-learningReinforcement Learning	—Unverified
A Decentralized Communication Framework based on Dual-Level Recurrence for Multi-Agent Reinforcement Learning	Feb 22, 2022	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Behaviour-neutral Smart Charging of Plugin Electric Vehicles: Reinforcement learning approach	Feb 22, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Autonomous Warehouse Robot using Deep Q-Learning	Feb 21, 2022	Deep Reinforcement LearningNavigate	—Unverified
Learning Causal Overhypotheses through Exploration in Children and Computational Models	Feb 21, 2022	Causal InferenceEfficient Exploration	—Unverified
CCPT: Automatic Gameplay Testing and Validation with Curiosity-Conditioned Proximal Trajectories	Feb 21, 2022	Deep Reinforcement LearningGame Design	—Unverified
Accelerating Primal-dual Methods for Regularized Markov Decision Processes	Feb 21, 2022	reinforcement-learningReinforcement Learning (RL)	—Unverified
Hybrid Learning for Orchestrating Deep Learning Inference in Multi-user Edge-cloud Networks	Feb 21, 2022	Cloud ComputingDeep Learning	—Unverified
A Multi-Agent Reinforcement Learning Framework for Off-Policy Evaluation in Two-sided Markets	Feb 21, 2022	ManagementMulti-agent Reinforcement Learning	CodeCode Available
Rule Mining over Knowledge Graphs via Reinforcement Learning	Feb 21, 2022	Knowledge Graphsreinforcement-learning	—Unverified
Reinforcement Learning Framework for Server Placement and Workload Allocation in Multi-Access Edge Computing	Feb 21, 2022	Cloud ComputingCombinatorial Optimization	—Unverified
PooL: Pheromone-inspired Communication Framework forLarge Scale Multi-Agent Reinforcement Learning	Feb 20, 2022	Multi-agent Reinforcement LearningQ-Learning	—Unverified
Selective Credit Assignment	Feb 20, 2022	Predictionreinforcement-learning	—Unverified

Show:10 25 50

← PrevPage 293 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified