Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11901–11950 of 15113 papers

Title	Date	Tasks	Status
Single Episode Policy Transfer in Reinforcement Learning	Oct 17, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Adaptive Discretization for Episodic Reinforcement Learning in Metric Spaces	Oct 17, 2019	Q-Learningreinforcement-learning	CodeCode Available
Adaptive Curriculum Generation from Demonstrations for Sim-to-Real Visuomotor Control	Oct 17, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Adaptive Trade-Offs in Off-Policy Learning	Oct 16, 2019	Off-policy evaluationreinforcement-learning	—Unverified
Conditional Importance Sampling for Off-Policy Learning	Oct 16, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning meets Graph Neural Networks: exploring a routing optimization use case	Oct 16, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available
Creativity in Robot Manipulation with Deep Reinforcement Learning	Oct 16, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Soft Actor-Critic for Discrete Action Settings	Oct 16, 2019	Atari Gamesreinforcement-learning	CodeCode Available
Parallel Exploration via Negatively Correlated Search	Oct 16, 2019	Atari GamesDiversity	—Unverified
Reinforcement Learning for Robotic Manipulation using Simulated Locomotion Demonstrations	Oct 16, 2019	Objectreinforcement-learning	CodeCode Available
Reinforced Bit Allocation under Task-Driven Semantic Distortion Metrics	Oct 16, 2019	General ClassificationQuantization	—Unverified
Model-free Reinforcement Learning in Infinite-horizon Average-reward Markov Decision Processes	Oct 15, 2019	Multi-Armed Banditsreinforcement-learning	CodeCode Available
On the Reduction of Variance and Overestimation of Deep Q-Learning	Oct 14, 2019	Q-Learningreinforcement-learning	—Unverified
Actor Critic with Differentially Private Critic	Oct 14, 2019	reinforcement-learningReinforcement Learning	—Unverified
A unified view of likelihood ratio and reparameterization gradients and an optimal importance sampling scheme	Oct 14, 2019	reinforcement-learningReinforcement Learning	—Unverified
Coordination of PV Smart Inverters Using Deep Reinforcement Learning for Grid Voltage Regulation	Oct 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
On the Expressivity of Neural Networks for Deep Reinforcement Learning	Oct 14, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available
Dynamic Graph Configuration with Reinforcement Learning for Connected Autonomous Vehicle Trajectories	Oct 14, 2019	Autonomous Vehiclesreinforcement-learning	—Unverified
Federated Transfer Reinforcement Learning for Autonomous Driving	Oct 14, 2019	Autonomous DrivingCollision Avoidance	—Unverified
Policy Poisoning in Batch Reinforcement Learning and Control	Oct 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Neural Program Synthesis By Self-Learning	Oct 13, 2019	CPUProgram Synthesis	—Unverified
Rethinking Exposure Bias In Language Modeling	Oct 13, 2019	Language ModelingLanguage Modelling	—Unverified
QoS and Jamming-Aware Wireless Networking Using Deep Reinforcement Learning	Oct 13, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Uncertainty Quantification and Exploration for Reinforcement Learning	Oct 12, 2019	reinforcement-learningReinforcement Learning	—Unverified
Influence-Based Multi-Agent Exploration	Oct 12, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Curiosity-Driven Recommendation Strategy for Adaptive Learning via Deep Reinforcement Learning	Oct 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Autonomous Navigation via Deep Reinforcement Learning for Resource Constraint Edge Nodes using Transfer Learning	Oct 12, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available
Building HVAC Scheduling Using Reinforcement Learning via Neural Network Based Model Approximation	Oct 11, 2019	Deep Reinforcement LearningModel-based Reinforcement Learning	—Unverified
Network Randomization: A Simple Technique for Generalization in Deep Reinforcement Learning	Oct 11, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available
Improving Gradient Estimation in Evolutionary Strategies With Past Descent Directions	Oct 11, 2019	reinforcement-learningReinforcement Learning	—Unverified
Green Deep Reinforcement Learning for Radio Resource Management: Architecture, Algorithm Compression and Challenge	Oct 11, 2019	Decision MakingDeep Reinforcement Learning	—Unverified
Modeling Cyber-Physical Human Systems via an Interplay Between Reinforcement Learning and Game Theory	Oct 11, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
RLCard: A Toolkit for Reinforcement Learning in Card Games	Oct 10, 2019	Board GamesCard Games	CodeCode Available
Hierarchical Reinforcement Learning with Advantage-Based Auxiliary Rewards	Oct 10, 2019	Hierarchical Reinforcement LearningMuJoCo	CodeCode Available
Autonomous Driving using Safe Reinforcement Learning by Incorporating a Regret-based Human Lane-Changing Decision Model	Oct 10, 2019	Autonomous DrivingAutonomous Vehicles	—Unverified
Fast Task-Adaptation for Tasks Labeled Using Natural Language in Reinforcement Learning	Oct 9, 2019	Lifelong learningreinforcement-learning	—Unverified
Linear-Quadratic Mean-Field Reinforcement Learning: Convergence of Policy Gradient Methods	Oct 9, 2019	Policy Gradient Methodsreinforcement-learning	—Unverified
Defensive Escort Teams via Multi-Agent Deep Reinforcement Learning	Oct 9, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improving Generalization in Meta Reinforcement Learning using Learned Objectives	Oct 9, 2019	Meta Reinforcement Learningreinforcement-learning	—Unverified
Integrating Behavior Cloning and Reinforcement Learning for Improved Performance in Dense and Sparse Reward Environments	Oct 9, 2019	Q-Learningreinforcement-learning	—Unverified
Imagined Value Gradients: Model-Based Policy Optimization with Transferable Latent Dynamics Models	Oct 9, 2019	Model-based Reinforcement LearningReinforcement Learning	—Unverified
Ctrl-Z: Recovering from Instability in Reinforcement Learning	Oct 9, 2019	continuous-controlContinuous Control	—Unverified
A Dual-Hormone Closed-Loop Delivery System for Type 1 Diabetes Using Deep Reinforcement Learning	Oct 9, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Black-box Optimizer with Implicit Natural Gradient	Oct 9, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Multiple-objective Reinforcement Learning for Inverse Design and Identification	Oct 9, 2019	reinforcement-learningReinforcement Learning	—Unverified
Model-based Reinforcement Learning for Predictions and Control for Limit Order Books	Oct 9, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Model-Based Reinforcement Learning Exploiting State-Action Equivalence	Oct 9, 2019	modelModel-based Reinforcement Learning	—Unverified
TorchBeast: A PyTorch Platform for Distributed RL	Oct 8, 2019	OpenAI GymReinforcement Learning	CodeCode Available
Tactical Reward Shaping: Bypassing Reinforcement Learning with Strategy-Based Goals	Oct 8, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Reinforcement Learning with Structured Hierarchical Grammar Representations of Actions	Oct 7, 2019	Atari GamesQ-Learning	—Unverified

Show:10 25 50

← PrevPage 239 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified