Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9201–9250 of 15113 papers

Title	Date	Tasks	Status	Hype
Nearly Minimax Optimal Reinforcement Learning for Linear Mixture Markov Decision Processes	Dec 15, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Smoothing Deep Reinforcement Learning for Power Control for Spectrum Sharing in Cognitive Radios	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Train a snake with reinforcement learning algorithms	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for the Beginning of Starcraft II Game	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Super Reinforcement Bros: Playing Super Mario Bros with Reinforcement Learning	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Optimal Portfolio Liquidation	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Virtual Autonomous Driving with Reinforcement Learning	Dec 14, 2020	Autonomous DrivingQ-Learning	—Unverified	0
Reinforcement Learning in 20Q Game with Generic Knowledge Bases	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Mobile Robots Autonomous Exploration with Reinforcement Learning	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Towards Understanding Deep Policy Gradients: A Case Study on PPO	Dec 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Using Enhanced Gaussian Cross-Entropy in Imitation Learning to Digging the First Diamond in Minecraft	Dec 14, 2020	Imitation LearningMinecraft	—Unverified	0
Optimization of Multi-Factor Model in Quantitative Trading Based On Reinforcement Learning	Dec 14, 2020	Decision Makingreinforcement-learning	—Unverified	0
Reinforcement Learning for Contact-Rich Tasks: Robotic Peg Insertion Strategies	Dec 14, 2020	Contact-rich ManipulationDeep Reinforcement Learning	CodeCode Available	1
Ranking Items in Large-Scale Item Search Engines with Reinforcement Learning	Dec 14, 2020	Decision Makingreinforcement-learning	—Unverified	0
Mobile Robots Exploration via Deep Reinforcement Learning	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Based Adaptive WalkingAssistance Control of a Lower Limb Exoskeleton	Dec 14, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Predict+Optimize	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Portfolio Management with Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	—Unverified	0
Reinforcement Learning Based Character Controlling	Dec 14, 2020	motion predictionreinforcement-learning	—Unverified	0
Increasing Data Efficiency of Driving Agent By World Model	Dec 14, 2020	Autonomous Drivingreinforcement-learning	CodeCode Available	0
Cloud Database Tuning with Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	CodeCode Available	0
Learn to Play Tetris with Deep Reinforcement Learning	Dec 14, 2020	Deep Reinforcement LearningImitation Learning	—Unverified	0
Evading Web Application Firewalls with Reinforcement Learning	Dec 14, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
IPM Move Planner: AN EFFICIENT EXPLOITING DEEP REINFORCEMENT LEARNING WITH MONTE CARLO TREE SEARCH	Dec 14, 2020	BlockingDeep Reinforcement Learning	—Unverified	0
Learn To Manage Portfolio With Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	—Unverified	0
Demystify Painting with RL	Dec 14, 2020	Decision MakingReinforcement Learning (RL)	—Unverified	0
Deploying Reinforcement Learning in Water Transport	Dec 14, 2020	Q-Learningreinforcement-learning	—Unverified	0
Automatic Source Code Summarization via Reinforcement Learning	Dec 14, 2020	Cloud ComputingCode Summarization	—Unverified	0
Learning Mobile Robot Navigation in the Dense Crowd with Deep Reinforcement Learning	Dec 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
A case for new neural network smoothness constraints	Dec 14, 2020	Adversarial RobustnessBIG-bench Machine Learning	—Unverified	0
Exponential Lower Bounds for Batch Reinforcement Learning: Batch RL can be Exponentially Harder than Online RL	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Learning Visual Robotic Control Efficiently with Contrastive Pre-training and Data Augmentation	Dec 14, 2020	Data Augmentationreinforcement-learning	—Unverified	0
SAT-MARL: Specification Aware Training in Multi-Agent Reinforcement Learning	Dec 14, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Policy Gradient RL Algorithms as Directed Acyclic Graphs	Dec 14, 2020	Meta Reinforcement Learningreinforcement-learning	CodeCode Available	1
Sim-to-real reinforcement learning applied to end-to-end vehicle control	Dec 14, 2020	Collision Avoidancereinforcement-learning	CodeCode Available	1
Specializing Inter-Agent Communication in Heterogeneous Multi-Agent Reinforcement Learning using Agent Class Information	Dec 14, 2020	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Learning for MPC with Stability & Safety Guarantees	Dec 14, 2020	Model Predictive Controlreinforcement-learning	—Unverified	0
Active Hierarchical Imitation and Reinforcement Learning	Dec 14, 2020	Active LearningImitation Learning	—Unverified	0
A Reinforcement Learning Formulation of the Lyapunov Optimization: Application to Edge Computing Systems with Queue Stability	Dec 14, 2020	Deep Reinforcement LearningEdge-computing	—Unverified	0
Evolutionary learning of interpretable decision trees	Dec 14, 2020	Evolutionary AlgorithmsOpenAI Gym	CodeCode Available	0
Reinforcement Learning with Subspaces using Free Energy Paradigm	Dec 13, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Tutoring Reinforcement Learning via Feedback Control	Dec 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Semi-supervised reward learning for offline reinforcement learning	Dec 12, 2020	Behavioural cloningreinforcement-learning	—Unverified	0
Noise-Robust End-to-End Quantum Control using Deep Autoregressive Policy Networks	Dec 12, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Regularizing Action Policies for Smooth Control with Reinforcement Learning	Dec 11, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
OPAC: Opportunistic Actor-Critic	Dec 11, 2020	continuous-controlContinuous Control	—Unverified	0
Performance-Weighed Policy Sampling for Meta-Reinforcement Learning	Dec 10, 2020	Meta-LearningMeta Reinforcement Learning	—Unverified	0
Blending MPC & Value Function Approximation for Efficient Reinforcement Learning	Dec 10, 2020	Model Predictive Controlreinforcement-learning	—Unverified	0
Flatland-RL : Multi-Agent Reinforcement Learning on Trains	Dec 10, 2020	Imitation LearningMulti-agent Reinforcement Learning	—Unverified	0
An Efficient Asynchronous Method for Integrating Evolutionary and Gradient-based Policy Search	Dec 10, 2020	continuous-controlContinuous Control	CodeCode Available	1

Show:10 25 50

← PrevPage 185 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified