Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7651–7675 of 15113 papers

Title	Date	Tasks	Status
Data Augmentation through Expert-guided Symmetry Detection to Improve Performance in Offline Reinforcement Learning	Dec 18, 2021	Data AugmentationDensity Estimation	CodeCode Available
Model-Based Safe Reinforcement Learning with Time-Varying State and Control Constraints: An Application to Intelligent Vehicles	Dec 18, 2021	Collision Avoidancecontinuous-control	—Unverified
Symmetry-aware Neural Architecture for Embodied Visual Navigation	Dec 17, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Personalized Lane Change Decision Algorithm Using Deep Reinforcement Learning Approach	Dec 17, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Unsupervised Compressive Text Summarisation with Reinforcement Learning	Dec 17, 2021	Hallucinationreinforcement-learning	—Unverified
Distillation of RL Policies with Formal Guarantees via Variational Abstraction of Markov Decision Processes (Technical Report)	Dec 17, 2021	Reinforcement Learning (RL)	CodeCode Available
Contrastive Explanations for Comparing Preferences of Reinforcement Learning Agents	Dec 17, 2021	Autonomous Drivingreinforcement-learning	—Unverified
Learning Reward Machines: A Study in Partially Observable Reinforcement Learning	Dec 17, 2021	Partially Observable Reinforcement LearningProblem Decomposition	—Unverified
Deep Reinforcement Learning-based Authentic Dialogue Generation To Protect Youth From Cybergrooming	Dec 17, 2021	ChatbotDeep Reinforcement Learning	—Unverified
Centralizing State-Values in Dueling Networks for Multi-Robot Reinforcement Learning Mapless Navigation	Dec 16, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
CONQRR: Conversational Query Rewriting for Retrieval with Reinforcement Learning	Dec 16, 2021	Conversational Question AnsweringPassage Retrieval	—Unverified
Goal-Directed Story Generation: Augmenting Generative Language Models with Reinforcement Learning	Dec 16, 2021	Deep Reinforcement LearningGraph Attention	—Unverified
Deep Reinforcement Learning Policies Learn Shared Adversarial Features Across MDPs	Dec 16, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Inherently Explainable Reinforcement Learning in Natural Language	Dec 16, 2021	Graph Attentionreinforcement-learning	CodeCode Available
Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation	Dec 16, 2021	BenchmarkingDeep Reinforcement Learning	—Unverified
Unsupervised Reinforcement Learning in Multiple Environments	Dec 16, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Automatic tuning of hyper-parameters of reinforcement learning algorithms using Bayesian optimization with behavioral cloning	Dec 15, 2021	Bayesian OptimizationMeta-Learning	—Unverified
DeepScalper: A Risk-Aware Reinforcement Learning Framework to Capture Fleeting Intraday Trading Opportunities	Dec 15, 2021	Algorithmic TradingDecision Making	—Unverified
Feature-Attending Recurrent Modules for Generalization in Reinforcement Learning	Dec 15, 2021	Objectreinforcement-learning	CodeCode Available
Conjugated Discrete Distributions for Distributional Reinforcement Learning	Dec 14, 2021	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Biased Gradient Estimate with Drastic Variance Reduction for Meta Reinforcement Learning	Dec 14, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
CEM-GD: Cross-Entropy Method with Gradient Descent Planner for Model-Based Reinforcement Learning	Dec 14, 2021	continuous-controlContinuous Control	CodeCode Available
Assessing Human Interaction in Virtual Reality With Continually Learning Prediction Agents Based on Reinforcement Learning Algorithms: A Pilot Study	Dec 14, 2021	Continual LearningReinforcement Learning (RL)	—Unverified
Quantifying Multimodality in World Models	Dec 14, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Scientific Discovery and the Cost of Measurement -- Balancing Information and Cost in Reinforcement Learning	Dec 14, 2021	Reinforcement Learning (RL)scientific discovery	—Unverified

Show:10 25 50

← PrevPage 307 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified