Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7801–7850 of 15113 papers

Title	Date	Tasks	Status
On the (In)Tractability of Reinforcement Learning for LTL Objectives	Nov 24, 2021	reinforcement-learningReinforcement Learning	—Unverified
SatNet: A Benchmark for Satellite Scheduling Optimization	Nov 24, 2021	Combinatorial OptimizationEvolutionary Algorithms	—Unverified
Reversible Action Design for Combinatorial Optimization with ReinforcementLearning	Nov 24, 2021	Combinatorial OptimizationQ-Learning	—Unverified
Reinforcement Learning based Path Exploration for Sequential Explainable Recommendation	Nov 24, 2021	Explainable RecommendationKnowledge Graphs	—Unverified
Reinforcement Learning for Volt-Var Control: A Novel Two-stage Progressive Training Strategy	Nov 23, 2021	Ingenuityreinforcement-learning	—Unverified
Semantic-Aware Collaborative Deep Reinforcement Learning Over Wireless Cellular Networks	Nov 23, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
Symbol-Based Over-the-Air Digital Predistortion Using Reinforcement Learning	Nov 23, 2021	reinforcement-learningReinforcement Learning	—Unverified
Generating GPU Compiler Heuristics using Reinforcement Learning	Nov 23, 2021	Deep Reinforcement LearningGPU	—Unverified
Inducing Functions through Reinforcement Learning without Task Specification	Nov 23, 2021	Decision Makingimage-classification	—Unverified
Fixed Points in Cyber Space: Rethinking Optimal Evasion Attacks in the Age of AI-NIDS	Nov 23, 2021	Continual LearningMulti-agent Reinforcement Learning	—Unverified
Independent Learning in Stochastic Games	Nov 23, 2021	Autonomous DrivingReinforcement Learning (RL)	—Unverified
An application of reinforcement learning to residential energy storage under real-time pricing	Nov 22, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
A Free Lunch from the Noise: Provable and Practical Exploration for Representation Learning	Nov 22, 2021	Reinforcement Learning (RL)Representation Learning	—Unverified
Efficient Bayesian Inverse Reinforcement Learning via Conditional Kernel Density Estimation	Nov 22, 2021	BIRLDensity Estimation	—Unverified
Real-World Dexterous Object Manipulation based Deep Reinforcement Learning	Nov 22, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available
Multi-agent Bayesian Deep Reinforcement Learning for Microgrid Energy Management under Communication Failures	Nov 22, 2021	Deep Reinforcement Learningenergy management	—Unverified
Reinforcement Learning for Few-Shot Text Generation Adaptation	Nov 22, 2021	DiversityDomain Adaptation	CodeCode Available
UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning Leveraging Planning	Nov 22, 2021	Decision MakingOffline RL	—Unverified
Off-Policy Correction For Multi-Agent Reinforcement Learning	Nov 22, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Renewable energy integration and microgrid energy trading using multi-agent deep reinforcement learning	Nov 21, 2021	Deep Reinforcement Learningenergy trading	—Unverified
Vulcan: Solving the Steiner Tree Problem with Graph Neural Networks and Deep Reinforcement Learning	Nov 21, 2021	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified
Offline Reinforcement Learning: Fundamental Barriers for Value Function Approximation	Nov 21, 2021	Decision MakingOffline RL	—Unverified
Reinforcement Learning with General LTL Objectives is Intractable	Nov 21, 2021	reinforcement-learningReinforcement Learning	—Unverified
A Hybrid Neuro-Symbolic approach for Text-Based Games using Inductive Logic Programming	Nov 21, 2021	Inductive logic programmingNatural Language Understanding	—Unverified
Explainable Biomedical Recommendations via Reinforcement Learning Reasoning on Knowledge Graphs	Nov 20, 2021	Drug DiscoveryKnowledge Graphs	—Unverified
HeterPS: Distributed Deep Learning With Reinforcement Learning Based Scheduling in Heterogeneous Environments	Nov 20, 2021	Distributed Computingreinforcement-learning	—Unverified
Triples-to-Text Generation with Reinforcement Learning Based Graph-augmented Neural Networks	Nov 20, 2021	reinforcement-learningReinforcement Learning	—Unverified
Towards Safe, Explainable, and Regulated Autonomous Driving	Nov 20, 2021	Autonomous DrivingAutonomous Vehicles	—Unverified
Reinforcement Learning with Adaptive Curriculum Dynamics Randomization for Fault-Tolerant Robot Control	Nov 19, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Machine Learning for Mechanical Ventilation Control (Extended Abstract)	Nov 19, 2021	BIG-bench Machine LearningReinforcement Learning (RL)	—Unverified
Uncertainty-aware Low-Rank Q-Matrix Estimation for Deep Reinforcement Learning	Nov 19, 2021	continuous-controlContinuous Control	—Unverified
Learn Quasi-stationary Distributions of Finite State Markov Chain	Nov 19, 2021	reinforcement-learningReinforcement Learning	—Unverified
An Improved Reinforcement Learning Model Based on Sentiment Analysis	Nov 19, 2021	reinforcement-learningReinforcement Learning	—Unverified
Lifelong Reinforcement Learning with Temporal Logic Formulas and Reward Machines	Nov 18, 2021	Lifelong learningreinforcement-learning	—Unverified
A Survey of Zero-shot Generalisation in Deep Reinforcement Learning	Nov 18, 2021	Deep Reinforcement LearningOffline RL	—Unverified
Reinforcement Learning on Human Decision Models for Uniquely Collaborative AI Teammates	Nov 18, 2021	Decision Makingreinforcement-learning	CodeCode Available
Successor Feature Landmarks for Long-Horizon Goal-Conditioned Reinforcement Learning	Nov 18, 2021	Efficient Explorationreinforcement-learning	CodeCode Available
SEIHAI: A Sample-efficient Hierarchical AI for the MineRL Competition	Nov 17, 2021	Imitation Learningreinforcement-learning	—Unverified
Self-Learning Tuning for Post-Silicon Validation	Nov 17, 2021	reinforcement-learningReinforcement Learning	—Unverified
Route Optimization via Environment-Aware Deep Network and Reinforcement Learning	Nov 16, 2021	Decision Makingreinforcement-learning	—Unverified
MAD for Robust Reinforcement Learning in Machine Translation	Nov 16, 2021	Machine Translationreinforcement-learning	—Unverified
Post-processing Networks: A Method for Optimizing Pipeline Task-oriented Dialogue Systems using Reinforcement Learning	Nov 16, 2021	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning with Feedback from Multiple Humans with Diverse Skills	Nov 16, 2021	reinforcement-learningReinforcement Learning	—Unverified
Probing the Robustness of Trained Metrics for Conversational Dialogue Systems	Nov 16, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Improving Learning from Demonstrations by Learning from Experience	Nov 16, 2021	Imitation LearningMuJoCo	—Unverified
A Multi-Document Coverage Reward for RELAXed Multi-Document Summarization	Nov 16, 2021	Computational EfficiencyDocument Summarization	—Unverified
Empathetic Persuasion: Reinforcing Empathy and Persuasiveness in Dialogue Systems	Nov 16, 2021	Language ModelingLanguage Modelling	—Unverified
Compressive Features in Offline Reinforcement Learning for Recommender Systems	Nov 16, 2021	Q-LearningRecommendation Systems	—Unverified
Causal policy ranking	Nov 16, 2021	counterfactualCounterfactual Reasoning	—Unverified
Context-Aware Language Modeling for Goal-Oriented Dialogue Systems	Nov 16, 2021	Data AugmentationGoal-Oriented Dialogue Systems	—Unverified

Show:10 25 50

← PrevPage 157 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified