Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7651–7700 of 15113 papers

Title	Date	Tasks	Status
Data Augmentation through Expert-guided Symmetry Detection to Improve Performance in Offline Reinforcement Learning	Dec 18, 2021	Data AugmentationDensity Estimation	CodeCode Available
Model-Based Safe Reinforcement Learning with Time-Varying State and Control Constraints: An Application to Intelligent Vehicles	Dec 18, 2021	Collision Avoidancecontinuous-control	—Unverified
Symmetry-aware Neural Architecture for Embodied Visual Navigation	Dec 17, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Personalized Lane Change Decision Algorithm Using Deep Reinforcement Learning Approach	Dec 17, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Unsupervised Compressive Text Summarisation with Reinforcement Learning	Dec 17, 2021	Hallucinationreinforcement-learning	—Unverified
Distillation of RL Policies with Formal Guarantees via Variational Abstraction of Markov Decision Processes (Technical Report)	Dec 17, 2021	Reinforcement Learning (RL)	CodeCode Available
Contrastive Explanations for Comparing Preferences of Reinforcement Learning Agents	Dec 17, 2021	Autonomous Drivingreinforcement-learning	—Unverified
Learning Reward Machines: A Study in Partially Observable Reinforcement Learning	Dec 17, 2021	Partially Observable Reinforcement LearningProblem Decomposition	—Unverified
Deep Reinforcement Learning-based Authentic Dialogue Generation To Protect Youth From Cybergrooming	Dec 17, 2021	ChatbotDeep Reinforcement Learning	—Unverified
Centralizing State-Values in Dueling Networks for Multi-Robot Reinforcement Learning Mapless Navigation	Dec 16, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
CONQRR: Conversational Query Rewriting for Retrieval with Reinforcement Learning	Dec 16, 2021	Conversational Question AnsweringPassage Retrieval	—Unverified
Goal-Directed Story Generation: Augmenting Generative Language Models with Reinforcement Learning	Dec 16, 2021	Deep Reinforcement LearningGraph Attention	—Unverified
Deep Reinforcement Learning Policies Learn Shared Adversarial Features Across MDPs	Dec 16, 2021	Atari GamesDeep Reinforcement Learning	—Unverified
Inherently Explainable Reinforcement Learning in Natural Language	Dec 16, 2021	Graph Attentionreinforcement-learning	CodeCode Available
Benchmarking Safe Deep Reinforcement Learning in Aquatic Navigation	Dec 16, 2021	BenchmarkingDeep Reinforcement Learning	—Unverified
Unsupervised Reinforcement Learning in Multiple Environments	Dec 16, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Automatic tuning of hyper-parameters of reinforcement learning algorithms using Bayesian optimization with behavioral cloning	Dec 15, 2021	Bayesian OptimizationMeta-Learning	—Unverified
DeepScalper: A Risk-Aware Reinforcement Learning Framework to Capture Fleeting Intraday Trading Opportunities	Dec 15, 2021	Algorithmic TradingDecision Making	—Unverified
Feature-Attending Recurrent Modules for Generalization in Reinforcement Learning	Dec 15, 2021	Objectreinforcement-learning	CodeCode Available
Conjugated Discrete Distributions for Distributional Reinforcement Learning	Dec 14, 2021	Atari GamesDistributional Reinforcement Learning	CodeCode Available
Biased Gradient Estimate with Drastic Variance Reduction for Meta Reinforcement Learning	Dec 14, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
CEM-GD: Cross-Entropy Method with Gradient Descent Planner for Model-Based Reinforcement Learning	Dec 14, 2021	continuous-controlContinuous Control	CodeCode Available
Assessing Human Interaction in Virtual Reality With Continually Learning Prediction Agents Based on Reinforcement Learning Algorithms: A Pilot Study	Dec 14, 2021	Continual LearningReinforcement Learning (RL)	—Unverified
Quantifying Multimodality in World Models	Dec 14, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified
Scientific Discovery and the Cost of Measurement -- Balancing Information and Cost in Reinforcement Learning	Dec 14, 2021	Reinforcement Learning (RL)scientific discovery	—Unverified
Representation and Invariance in Reinforcement Learning	Dec 14, 2021	reinforcement-learningReinforcement Learning	—Unverified
Meta-CPR: Generalize to Unseen Large Number of Agents with Communication Pattern Recognition Module	Dec 14, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
Reinforcing Semantic-Symmetry for Document Summarization	Dec 14, 2021	Document Summarizationreinforcement-learning	—Unverified
Programmatic Reward Design by Example	Dec 14, 2021	Reinforcement Learning (RL)	—Unverified
Teaching a Robot to Walk Using Reinforcement Learning	Dec 13, 2021	OpenAI GymQ-Learning	—Unverified
A Benchmark for Low-Switching-Cost Reinforcement Learning	Dec 13, 2021	Atari Gamesreinforcement-learning	—Unverified
Continual Learning In Environments With Polynomial Mixing Times	Dec 13, 2021	Atari GamesContinual Learning	CodeCode Available
Contextual Exploration Using a Linear Approximation Method Based on Satisficing	Dec 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Control-Tutored Reinforcement Learning: Towards the Integration of Data-Driven and Model-Based Control	Dec 11, 2021	OpenAI GymQ-Learning	—Unverified
Formalising the Foundations of Discrete Reinforcement Learning in Isabelle/HOL	Dec 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
Federated Reinforcement Learning at the Edge	Dec 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
MedAttacker: Exploring Black-Box Adversarial Attacks on Risk Prediction Models in Healthcare	Dec 11, 2021	Adversarial AttackPosition	—Unverified
Zero-Shot Uncertainty-Aware Deployment of Simulation Trained Policies on Real-World Robots	Dec 10, 2021	continuous-controlContinuous Control	—Unverified
Quantum Architecture Search via Continual Reinforcement Learning	Dec 10, 2021	Continual LearningDeep Reinforcement Learning	—Unverified
A Validation Tool for Designing Reinforcement Learning Environments	Dec 10, 2021	Offline RLreinforcement-learning	—Unverified
How Private Is Your RL Policy? An Inverse RL Based Analysis Framework	Dec 10, 2021	Adversarial AttackAutonomous Driving	CodeCode Available
Blockwise Sequential Model Learning for Partially Observable Reinforcement Learning	Dec 10, 2021	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available
Encoding priors in the brain: a reinforcement learning model for mouse decision making	Dec 10, 2021	Decision Makingreinforcement-learning	—Unverified
Edge-Compatible Reinforcement Learning for Recommendations	Dec 10, 2021	Edge-computingRecommendation Systems	—Unverified
High-Dimensional Stock Portfolio Trading with Deep Reinforcement Learning	Dec 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
DR3: Value-Based Deep Reinforcement Learning Requires Explicit Regularization	Dec 9, 2021	Atari GamesD4RL	—Unverified
Reinforcement Learning with Almost Sure Constraints	Dec 9, 2021	Navigatereinforcement-learning	—Unverified
Cooperative Multi-Agent Reinforcement Learning with Hypergraph Convolution	Dec 9, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Recent Advances in Reinforcement Learning in Finance	Dec 8, 2021	Decision MakingPortfolio Optimization	—Unverified
Suboptimal and trait-like reinforcement learning strategies correlate with midbrain encoding of prediction errors	Dec 8, 2021	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 154 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified