Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7676–7700 of 15113 papers

Title	Date	Tasks	Status
Representation and Invariance in Reinforcement Learning	Dec 14, 2021	reinforcement-learningReinforcement Learning	—Unverified
Meta-CPR: Generalize to Unseen Large Number of Agents with Communication Pattern Recognition Module	Dec 14, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
Reinforcing Semantic-Symmetry for Document Summarization	Dec 14, 2021	Document Summarizationreinforcement-learning	—Unverified
Programmatic Reward Design by Example	Dec 14, 2021	Reinforcement Learning (RL)	—Unverified
Teaching a Robot to Walk Using Reinforcement Learning	Dec 13, 2021	OpenAI GymQ-Learning	—Unverified
A Benchmark for Low-Switching-Cost Reinforcement Learning	Dec 13, 2021	Atari Gamesreinforcement-learning	—Unverified
Continual Learning In Environments With Polynomial Mixing Times	Dec 13, 2021	Atari GamesContinual Learning	CodeCode Available
Contextual Exploration Using a Linear Approximation Method Based on Satisficing	Dec 13, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Control-Tutored Reinforcement Learning: Towards the Integration of Data-Driven and Model-Based Control	Dec 11, 2021	OpenAI GymQ-Learning	—Unverified
Formalising the Foundations of Discrete Reinforcement Learning in Isabelle/HOL	Dec 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
Federated Reinforcement Learning at the Edge	Dec 11, 2021	reinforcement-learningReinforcement Learning	—Unverified
MedAttacker: Exploring Black-Box Adversarial Attacks on Risk Prediction Models in Healthcare	Dec 11, 2021	Adversarial AttackPosition	—Unverified
Zero-Shot Uncertainty-Aware Deployment of Simulation Trained Policies on Real-World Robots	Dec 10, 2021	continuous-controlContinuous Control	—Unverified
Quantum Architecture Search via Continual Reinforcement Learning	Dec 10, 2021	Continual LearningDeep Reinforcement Learning	—Unverified
A Validation Tool for Designing Reinforcement Learning Environments	Dec 10, 2021	Offline RLreinforcement-learning	—Unverified
How Private Is Your RL Policy? An Inverse RL Based Analysis Framework	Dec 10, 2021	Adversarial AttackAutonomous Driving	CodeCode Available
Blockwise Sequential Model Learning for Partially Observable Reinforcement Learning	Dec 10, 2021	Partially Observable Reinforcement Learningreinforcement-learning	CodeCode Available
Encoding priors in the brain: a reinforcement learning model for mouse decision making	Dec 10, 2021	Decision Makingreinforcement-learning	—Unverified
Edge-Compatible Reinforcement Learning for Recommendations	Dec 10, 2021	Edge-computingRecommendation Systems	—Unverified
High-Dimensional Stock Portfolio Trading with Deep Reinforcement Learning	Dec 9, 2021	Deep Reinforcement LearningQ-Learning	—Unverified
DR3: Value-Based Deep Reinforcement Learning Requires Explicit Regularization	Dec 9, 2021	Atari GamesD4RL	—Unverified
Reinforcement Learning with Almost Sure Constraints	Dec 9, 2021	Navigatereinforcement-learning	—Unverified
Cooperative Multi-Agent Reinforcement Learning with Hypergraph Convolution	Dec 9, 2021	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available
Recent Advances in Reinforcement Learning in Finance	Dec 8, 2021	Decision MakingPortfolio Optimization	—Unverified
Suboptimal and trait-like reinforcement learning strategies correlate with midbrain encoding of prediction errors	Dec 8, 2021	Reinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 308 of 605Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified