Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 9851–9875 of 15113 papers

Title	Date	Tasks	Status
SAT-MARL: Specification Aware Training in Multi-Agent Reinforcement Learning	Dec 14, 2020	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Smoothing Deep Reinforcement Learning for Power Control for Spectrum Sharing in Cognitive Radios	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Optimal Portfolio Liquidation	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Ranking Items in Large-Scale Item Search Engines with Reinforcement Learning	Dec 14, 2020	Decision Makingreinforcement-learning	—Unverified
Mobile Robots Autonomous Exploration with Reinforcement Learning	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Reinforcement Learning for the Beginning of Starcraft II Game	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Portfolio Management with Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	—Unverified
Virtual Autonomous Driving with Reinforcement Learning	Dec 14, 2020	Autonomous DrivingQ-Learning	—Unverified
Reinforcement Learning Based Adaptive WalkingAssistance Control of a Lower Limb Exoskeleton	Dec 14, 2020	reinforcement-learningReinforcement Learning (RL)	—Unverified
Reinforcement Learning Based Character Controlling	Dec 14, 2020	motion predictionreinforcement-learning	—Unverified
Reinforcement Learning for Predict+Optimize	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Specializing Inter-Agent Communication in Heterogeneous Multi-Agent Reinforcement Learning using Agent Class Information	Dec 14, 2020	Multi-agent Reinforcement LearningReinforcement Learning (RL)	—Unverified
Towards Understanding Deep Policy Gradients: A Case Study on PPO	Dec 14, 2020	Decision MakingDeep Reinforcement Learning	—Unverified
Optimization of Multi-Factor Model in Quantitative Trading Based On Reinforcement Learning	Dec 14, 2020	Decision Makingreinforcement-learning	—Unverified
Mobile Robots Exploration via Deep Reinforcement Learning	Dec 14, 2020	Deep Reinforcement Learningreinforcement-learning	—Unverified
Reinforcement Learning in 20Q Game with Generic Knowledge Bases	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified
Using Enhanced Gaussian Cross-Entropy in Imitation Learning to Digging the First Diamond in Minecraft	Dec 14, 2020	Imitation LearningMinecraft	—Unverified
Evolutionary learning of interpretable decision trees	Dec 14, 2020	Evolutionary AlgorithmsOpenAI Gym	CodeCode Available
Cloud Database Tuning with Reinforcement Learning	Dec 14, 2020	Managementreinforcement-learning	CodeCode Available
Deploying Reinforcement Learning in Water Transport	Dec 14, 2020	Q-Learningreinforcement-learning	—Unverified
Evading Web Application Firewalls with Reinforcement Learning	Dec 14, 2020	OpenAI Gymreinforcement-learning	—Unverified
Demystify Painting with RL	Dec 14, 2020	Decision MakingReinforcement Learning (RL)	—Unverified
Active Hierarchical Imitation and Reinforcement Learning	Dec 14, 2020	Active LearningImitation Learning	—Unverified
A Reinforcement Learning Formulation of the Lyapunov Optimization: Application to Edge Computing Systems with Queue Stability	Dec 14, 2020	Deep Reinforcement LearningEdge-computing	—Unverified
Exponential Lower Bounds for Batch Reinforcement Learning: Batch RL can be Exponentially Harder than Online RL	Dec 14, 2020	reinforcement-learningReinforcement Learning	—Unverified

Show:10 25 50

← PrevPage 395 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified