Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9201–9225 of 15113 papers

Title	Date	Tasks	Status	Hype
Nearly Minimax Optimal Reinforcement Learning for Linear Mixture Markov Decision Processes	Dec 15, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Smoothing Deep Reinforcement Learning for Power Control for Spectrum Sharing in Cognitive Radios	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Train a snake with reinforcement learning algorithms	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for the Beginning of Starcraft II Game	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Super Reinforcement Bros: Playing Super Mario Bros with Reinforcement Learning	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Optimal Portfolio Liquidation	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Virtual Autonomous Driving with Reinforcement Learning	Dec 14, 2020	Autonomous DrivingQ-Learning	—Unverified	0
Reinforcement Learning in 20Q Game with Generic Knowledge Bases	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Mobile Robots Autonomous Exploration with Reinforcement Learning	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Towards Understanding Deep Policy Gradients: A Case Study on PPO	Dec 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified	0
Using Enhanced Gaussian Cross-Entropy in Imitation Learning to Digging the First Diamond in Minecraft	Dec 14, 2020	Imitation LearningMinecraft	—Unverified	0
Optimization of Multi-Factor Model in Quantitative Trading Based On Reinforcement Learning	Dec 14, 2020	Decision Makingreinforcement-learning	—Unverified	0
Reinforcement Learning for Contact-Rich Tasks: Robotic Peg Insertion Strategies	Dec 14, 2020	Contact-rich ManipulationDeep Reinforcement Learning	CodeCode Available	1
Ranking Items in Large-Scale Item Search Engines with Reinforcement Learning	Dec 14, 2020	Decision Makingreinforcement-learning	—Unverified	0
Mobile Robots Exploration via Deep Reinforcement Learning	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Reinforcement Learning Based Adaptive WalkingAssistance Control of a Lower Limb Exoskeleton	Dec 14, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified	0
Reinforcement Learning for Predict+Optimize	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified	0
Portfolio Management with Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	—Unverified	0
Reinforcement Learning Based Character Controlling	Dec 14, 2020	motion predictionreinforcement-learning	—Unverified	0
Increasing Data Efficiency of Driving Agent By World Model	Dec 14, 2020	Autonomous Drivingreinforcement-learning	CodeCode Available	0
Cloud Database Tuning with Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	CodeCode Available	0
Learn to Play Tetris with Deep Reinforcement Learning	Dec 14, 2020	Deep Reinforcement LearningImitation Learning	—Unverified	0
Evading Web Application Firewalls with Reinforcement Learning	Dec 14, 2020	OpenAI Gymreinforcement-learning	—Unverified	0
IPM Move Planner: AN EFFICIENT EXPLOITING DEEP REINFORCEMENT LEARNING WITH MONTE CARLO TREE SEARCH	Dec 14, 2020	BlockingDeep Reinforcement Learning	—Unverified	0
Learn To Manage Portfolio With Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 369 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified