Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 8951–9000 of 15113 papers

Title	Date	Tasks	Status	Hype
Empirical Evaluation of Supervision Signals for Style Transfer Models	Jan 15, 2021	Machine Translationreinforcement-learning	—Unverified	0
Controlling the Risk of Conversational Search via Reinforcement Learning	Jan 15, 2021	Conversational Searchreinforcement-learning	CodeCode Available	1
Affordance-based Reinforcement Learning for Urban Driving	Jan 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning for Haptic Shared Control in Unknown Tasks	Jan 15, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Local Navigation and Docking of an Autonomous Robot Mower using Reinforcement Learning and Computer Vision	Jan 15, 2021	Navigateobject-detection	—Unverified	0
Stochastic Learning Approach to Binary Optimization for Optimal Design of Experiments	Jan 15, 2021	Experimental DesignReinforcement Learning (RL)	—Unverified	0
Reinforcement learning based recommender systems: A survey	Jan 15, 2021	Collaborative FilteringDeep Reinforcement Learning	—Unverified	0
Robusta: Robust AutoML for Feature Selection via Reinforcement Learning	Jan 15, 2021	AutoMLFeature Importance	—Unverified	0
Learning and Fast Adaptation for Grid Emergency Control via Deep Meta Reinforcement Learning	Jan 13, 2021	Deep Reinforcement LearningMeta Reinforcement Learning	—Unverified	0
Evaluating Soccer Player: from Live Camera to Deep Reinforcement Learning	Jan 13, 2021	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	1
Continuous Deep Q-Learning with Simulator for Stabilization of Uncertain Discrete-Time Systems	Jan 13, 2021	Q-LearningReinforcement Learning (RL)	CodeCode Available	0
Contrastive Behavioral Similarity Embeddings for Generalization in Reinforcement Learning	Jan 13, 2021	reinforcement-learningReinforcement Learning	CodeCode Available	0
Memory-Augmented Reinforcement Learning for Image-Goal Navigation	Jan 13, 2021	Data AugmentationNavigate	CodeCode Available	1
Queue-Learning: A Reinforcement Learning Approach for Providing Quality of Service	Jan 12, 2021	AttributeCloud Computing	—Unverified	0
Linear Representation Meta-Reinforcement Learning for Instant Adaptation	Jan 12, 2021	continuous-controlContinuous Control	—Unverified	0
Automated Synthesis of Steady-State Continuous Processes using Reinforcement Learning	Jan 12, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Implicit Unlikelihood Training: Improving Neural Text Generation with Reinforcement Learning	Jan 11, 2021	Language ModelingLanguage Modelling	CodeCode Available	1
First-Order Problem Solving through Neural MCTS based Reinforcement Learning	Jan 11, 2021	reinforcement-learningReinforcement Learning	—Unverified	0
Action Priors for Large Action Spaces in Robotics	Jan 11, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	0
Independent Policy Gradient Methods for Competitive Reinforcement Learning	Jan 11, 2021	Policy Gradient Methodsreinforcement-learning	—Unverified	0
Solving Common-Payoff Games with Approximate Policy Iteration	Jan 11, 2021	DecoderDeep Reinforcement Learning	CodeCode Available	0
Deep Interactive Bayesian Reinforcement Learning via Meta-Learning	Jan 11, 2021	Meta-Learningreinforcement-learning	—Unverified	0
Cross-Modal Contrastive Learning of Representations for Navigation using Lightweight, Low-Cost Millimeter Wave Radar for Adverse Environmental Conditions	Jan 10, 2021	Autonomous NavigationContrastive Learning	CodeCode Available	1
Identifying Decision Points for Safe and Interpretable Reinforcement Learning in Hypotension Treatment	Jan 9, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Robust and Scalable Routing with Multi-Agent Deep Reinforcement Learning for MANETs	Jan 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified	0
Deep Reinforcement Learning with Function Properties in Mean Reversion Strategies	Jan 9, 2021	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Safe Coupled Deep Q-Learning for Recommendation Systems	Jan 8, 2021	Q-LearningRecommendation Systems	—Unverified	0
A Reinforcement Learning Based Encoder-Decoder Framework for Learning Stock Trading Rules	Jan 8, 2021	DecoderDeep Reinforcement Learning	CodeCode Available	1
Evolving Reinforcement Learning Algorithms	Jan 8, 2021	Atari GamesMeta-Learning	CodeCode Available	1
Simulating SQL Injection Vulnerability Exploitation Using Q-Learning Reinforcement Learning Agents	Jan 8, 2021	Q-Learningreinforcement-learning	CodeCode Available	1
An Adaptive Multi-Agent Physical Layer Security Framework for Cognitive Cyber-Physical Systems	Jan 7, 2021	Reinforcement Learning (RL)	—Unverified	0
CoachNet: An Adversarial Sampling Approach for Reinforcement Learning	Jan 7, 2021	continuous-controlContinuous Control	—Unverified	0
Attention Actor-Critic algorithm for Multi-Agent Constrained Co-operative Reinforcement Learning	Jan 7, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Coding for Distributed Multi-Agent Reinforcement Learning	Jan 7, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Active Screening for Recurrent Diseases: A Reinforcement Learning Approach	Jan 7, 2021	Combinatorial Optimizationreinforcement-learning	—Unverified	0
qRRT: Quality-Biased Incremental RRT for Optimal Motion Planning in Non-Holonomic Systems	Jan 7, 2021	Motion PlanningOptimal Motion Planning	—Unverified	0
The Distracting Control Suite -- A Challenging Benchmark for Reinforcement Learning from Pixels	Jan 7, 2021	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Off-Policy Meta-Reinforcement Learning Based on Feature Embedding Spaces	Jan 6, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning with Latent Flow	Jan 6, 2021	Atari Gamescontinuous-control	CodeCode Available	1
Smoothed functional-based gradient algorithms for off-policy reinforcement learning: A non-asymptotic viewpoint	Jan 6, 2021	Off-policy evaluationReinforcement Learning (RL)	—Unverified	0
Provably Efficient Reinforcement Learning with Linear Function Approximation Under Adaptivity Constraints	Jan 6, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Geometric Entropic Exploration	Jan 6, 2021	Reinforcement Learning (RL)	—Unverified	0
Deep Reinforcement Learning with Quantum-inspired Experience Replay	Jan 6, 2021	Atari GamesDeep Reinforcement Learning	—Unverified	0
Enhanced Audit Techniques Empowered by the Reinforcement Learning Pertaining to IFRS 16 Lease	Jan 5, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
An A* Curriculum Approach to Reinforcement Learning for RGBD Indoor Robot Navigation	Jan 5, 2021	Deep Reinforcement LearningGPU	—Unverified	0
Reinforcement Learning based Collective Entity Alignment with Adaptive Features	Jan 5, 2021	Decision MakingEntity Alignment	CodeCode Available	0
Markov Chain Monte Carlo Policy Optimization	Jan 4, 2021	continuous-controlContinuous Control	—Unverified	0
MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control	Jan 4, 2021	Deep Reinforcement LearningMeta-Learning	CodeCode Available	1
A novel policy for pre-trained Deep Reinforcement Learning for Speech Emotion Recognition	Jan 4, 2021	Cross-corpusDeep Reinforcement Learning	CodeCode Available	0
Derivative-Free Policy Optimization for Linear Risk-Sensitive and Robust Control Design: Implicit Regularization and Sample Complexity	Jan 4, 2021	continuous-controlContinuous Control	—Unverified	0

Show:10 25 50

← PrevPage 180 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified