Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7351–7400 of 15113 papers

Title	Date	Tasks	Status	Hype
Convergent and Efficient Deep Q Learning Algorithm	Sep 29, 2021	Q-Learningreinforcement-learning	—Unverified	0
Learning Invariant Reward Functions through Trajectory Interventions	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Faster Reinforcement Learning with Value Target Lower Bounding	Sep 29, 2021	Atari Gamescontinuous-control	—Unverified	0
EqR: Equivariant Representations for Data-Efficient Reinforcement Learning	Sep 29, 2021	Atari GamesInductive Bias	—Unverified	0
Generalisation in Lifelong Reinforcement Learning through Logical Composition	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Benchmarking Sample Selection Strategies for Batch Reinforcement Learning	Sep 29, 2021	BenchmarkingImitation Learning	—Unverified	0
Coordinated Attacks Against Federated Learning: A Multi-Agent Reinforcement Learning Approach	Sep 29, 2021	Federated LearningMulti-agent Reinforcement Learning	—Unverified	0
Know Your Action Set: Learning Action Relations for Reinforcement Learning	Sep 29, 2021	Graph AttentionRecommendation Systems	CodeCode Available	1
Disentangling Generalization in Reinforcement Learning	Sep 29, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Effects of Conservatism on Offline Learning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified	0
Information-Bottleneck-Based Behavior Representation Learning for Multi-agent Reinforcement learning	Sep 29, 2021	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified	0
Formulation and validation of a car-following model based on deep reinforcement learning	Sep 29, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Improving Safety in Deep Reinforcement Learning using Unsupervised Action Planning	Sep 29, 2021	continuous-controlContinuous Control	—Unverified	0
A Two-Time-Scale Stochastic Optimization Framework with Applications in Control and Reinforcement Learning	Sep 29, 2021	Reinforcement Learning (RL)Stochastic Optimization	—Unverified	0
Conditional Value-at-Risk for Quantitative Trading: A Direct Reinforcement Learning Approach	Sep 29, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Explanation-Aware Experience Replay in Rule-Dense Environments	Sep 29, 2021	Autonomous DrivingReinforcement Learning (RL)	CodeCode Available	0
Untangling Braids with Multi-agent Q-Learning	Sep 29, 2021	OpenAI GymQ-Learning	—Unverified	0
Online Robust Reinforcement Learning with Model Uncertainty	Sep 29, 2021	modelQ-Learning	—Unverified	0
Vision-Guided Quadrupedal Locomotion in the Wild with Multi-Modal Delay Randomization	Sep 29, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Mitigation of Adversarial Policy Imitation via Constrained Randomization of Policy (CRoP)	Sep 29, 2021	Deep Reinforcement LearningImitation Learning	—Unverified	0
Deep Reinforcement Learning Versus Evolution Strategies: A Comparative Survey	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Identifying Reasoning Flaws in Planning-Based RL Using Tree Explanations	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
An Offline Deep Reinforcement Learning for Maintenance Decision-Making	Sep 28, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0
Longitudinal Deep Truck: Deep learning and deep reinforcement learning for modeling and control of longitudinal dynamics of heavy duty trucks	Sep 28, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Quantitative Trading	Sep 28, 2021	Decision Makingreinforcement-learning	—Unverified	0
Making Curiosity Explicit in Vision-based RL	Sep 28, 2021	DiversityReinforcement Learning (RL)	—Unverified	0
Adaptive Informative Path Planning Using Deep Reinforcement Learning for UAV-based Active Sensing	Sep 28, 2021	Deep Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Exploratory State Representation Learning	Sep 28, 2021	DiversityEfficient Exploration	CodeCode Available	0
Exploring More When It Needs in Deep Reinforcement Learning	Sep 28, 2021	continuous-controlContinuous Control	—Unverified	0
Deep Reinforcement Learning with Adjustments	Sep 28, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
A First-Occupancy Representation for Reinforcement Learning	Sep 28, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Learning of Parameters in Behavior Trees for Movement Skills	Sep 27, 2021	Reinforcement Learning (RL)	CodeCode Available	1
Efficiently Training On-Policy Actor-Critic Networks in Robotic Deep Reinforcement Learning with Demonstration-like Sampled Exploration	Sep 27, 2021	Deep Reinforcement LearningMuJoCo	—Unverified	0
From internal models toward metacognitive AI	Sep 27, 2021	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
DRL-based Slice Placement under Realistic Network Load Conditions	Sep 27, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
MiniHack the Planet: A Sandbox for Open-Ended Reinforcement Learning Research	Sep 27, 2021	Deep Reinforcement LearningNetHack	—Unverified	0
Model-Free Reinforcement Learning for Optimal Control of MarkovDecision Processes Under Signal Temporal Logic Specifications	Sep 27, 2021	Motion Planningreinforcement-learning	—Unverified	0
Towards Reinforcement Learning for Pivot-based Neural Machine Translation with Non-autoregressive Transformer	Sep 27, 2021	Machine TranslationNMT	—Unverified	0
On the Feasibility of Learning Finger-gaiting In-hand Manipulation with Intrinsic Sensing	Sep 26, 2021	Reinforcement Learning (RL)	—Unverified	0
MetaDrive: Composing Diverse Driving Scenarios for Generalizable Reinforcement Learning	Sep 26, 2021	BenchmarkingDecision Making	CodeCode Available	2
Prioritized Experience-based Reinforcement Learning with Human Guidance for Autonomous Driving	Sep 26, 2021	Autonomous Drivingreinforcement-learning	CodeCode Available	1
Deep Reinforcement Learning for Wireless Scheduling in Distributed Networked Control	Sep 26, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
L^2NAS: Learning to Optimize Neural Architectures via Continuous-Action Reinforcement Learning	Sep 25, 2021	Hyperparameter OptimizationNeural Architecture Search	—Unverified	0
Stackelberg Actor-Critic: Game-Theoretic Reinforcement Learning Algorithms	Sep 25, 2021	OpenAI Gymreinforcement-learning	CodeCode Available	1
Emergent behavior and neural dynamics in artificial agents tracking turbulent plumes	Sep 25, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Neuroprospecting with DeepRL agents	Sep 24, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Go-Blend behavior and affect	Sep 24, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Sampling Quasi-Newton Methods for Zeroth-Order Stochastic Optimization	Sep 24, 2021	Reinforcement Learning (RL)Stochastic Optimization	—Unverified	0
Learnable Triangulation for Deep Learning-based 3D Reconstruction of Objects of Arbitrary Topology from Single RGB Images	Sep 24, 2021	3D Object Reconstruction3D Reconstruction	—Unverified	0
The f-Divergence Reinforcement Learning Framework	Sep 24, 2021	Decision MakingDeep Reinforcement Learning	—Unverified	0

Show:10 25 50

← PrevPage 148 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified