Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 7901–7950 of 15113 papers

Title	Date	Tasks	Status
FinRL: Deep Reinforcement Learning Framework to Automate Trading in Quantitative Finance	Nov 7, 2021	Deep Reinforcement LearningFriction	—Unverified
Optimization of the Model Predictive Control Meta-Parameters Through Reinforcement Learning	Nov 7, 2021	Model Predictive Controlreinforcement-learning	—Unverified
A Deep Reinforcement Learning Approach for Composing Moving IoT Services	Nov 6, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
d3rlpy: An Offline Deep Reinforcement Learning Library	Nov 6, 2021	D4RLDeep Reinforcement Learning	CodeCode Available
Development of collective behavior in newborn artificial agents	Nov 6, 2021	Deep Reinforcement LearningObject Recognition	—Unverified
Exponential Bellman Equation and Improved Regret Bounds for Risk-Sensitive Reinforcement Learning	Nov 6, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
AI-based Radio Resource Management and Trajectory Design for PD-NOMA Communication in IRS-UAV Assisted Networks	Nov 6, 2021	ManagementReinforcement Learning (RL)	—Unverified
Learning to Cooperate with Unseen Agent via Meta-Reinforcement Learning	Nov 5, 2021	Meta Reinforcement Learningreinforcement-learning	—Unverified
Improving RNA Secondary Structure Design using Deep Reinforcement Learning	Nov 5, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
An Algorithmic Theory of Metacognition in Minds and Machines	Nov 5, 2021	Bayesian OptimizationReinforcement Learning (RL)	—Unverified
Perturbational Complexity by Distribution Mismatch: A Systematic Analysis of Reinforcement Learning in Reproducing Kernel Hilbert Space	Nov 5, 2021	Reinforcement Learning (RL)	—Unverified
Supervised Advantage Actor-Critic for Recommender Systems	Nov 5, 2021	Q-LearningRecommendation Systems	—Unverified
Successor Feature Neural Episodic Control	Nov 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Model-Free Risk-Sensitive Reinforcement Learning	Nov 4, 2021	Decision Makingmodel	—Unverified
Towards Learning to Speak and Hear Through Multi-Agent Communication over a Continuous Acoustic Channel	Nov 4, 2021	Language AcquisitionMulti-agent Reinforcement Learning	—Unverified
Value Function Spaces: Skill-Centric State Abstractions for Long-Horizon Reasoning	Nov 4, 2021	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified
Control of a fly-mimicking flyer in complex flow using deep reinforcement learning	Nov 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Generalization in Dexterous Manipulation via Geometry-Aware Multi-Task Learning	Nov 4, 2021	Multi-Task LearningObject	—Unverified
Causal versus Marginal Shapley Values for Robotic Lever Manipulation Controlled using Deep Reinforcement Learning	Nov 4, 2021	Deep Reinforcement LearningExplainable artificial intelligence	—Unverified
Attacking Deep Reinforcement Learning-Based Traffic Signal Control Systems with Colluding Vehicles	Nov 4, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Infinite Time Horizon Safety of Bayesian Neural Networks	Nov 4, 2021	reinforcement-learningReinforcement Learning	CodeCode Available
Imagine Networks	Nov 4, 2021	reinforcement-learningReinforcement Learning	—Unverified
Is Bang-Bang Control All You Need? Solving Continuous Control with Bernoulli Policies	Nov 3, 2021	AllBenchmarking	—Unverified
Image-Guided Navigation of a Robotic Ultrasound Probe for Autonomous Spinal Sonography Using a Shadow-aware Dual-Agent Framework	Nov 3, 2021	AnatomyDecision Making	—Unverified
Autonomous Attack Mitigation for Industrial Control Systems	Nov 3, 2021	Decision MakingDeep Reinforcement Learning	—Unverified
AlphaD3M: Machine Learning Pipeline Synthesis	Nov 3, 2021	AutoMLBIG-bench Machine Learning	—Unverified
Model-Based Episodic Memory Induces Dynamic Hybrid Controls	Nov 3, 2021	modelreinforcement-learning	—Unverified
Smooth Imitation Learning via Smooth Costs and Smooth Policies	Nov 3, 2021	continuous-controlContinuous Control	—Unverified
Online Service Provisioning in NFV-enabled Networks Using Deep Reinforcement Learning	Nov 3, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Tuning the Weights: The Impact of Initial Matrix Configurations on Successor Features Learning Efficacy	Nov 3, 2021	Reinforcement Learning (RL)Representation Learning	—Unverified
What Robot do I Need? Fast Co-Adaptation of Morphology and Control using Graph Neural Networks	Nov 3, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
OnSlicing: Online End-to-End Network Slicing with Reinforcement Learning	Nov 2, 2021	Deep Reinforcement Learningreinforcement-learning	—Unverified
Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement Learning Approach	Nov 2, 2021	continuous-controlContinuous Control	—Unverified
Integrating Pretrained Language Model for Dialogue Policy Learning	Nov 2, 2021	Language ModelingLanguage Modelling	—Unverified
Learning Multiresolution Matrix Factorization and its Wavelet Networks on Graphs	Nov 2, 2021	Reinforcement Learning (RL)	CodeCode Available
Koopman Q-learning: Offline Reinforcement Learning via Symmetries of Dynamics	Nov 2, 2021	D4RLData Augmentation	—Unverified
A Collaborative Multi-agent Reinforcement Learning Framework for Dialog Action Decomposition	Nov 1, 2021	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
Investigation of Independent Reinforcement Learning Algorithms in Multi-Agent Environments	Nov 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Feedback Attribution for Counterfactual Bandit Learning in Multi-Domain Spoken Language Understanding	Nov 1, 2021	counterfactualMulti-agent Reinforcement Learning	—Unverified
Decentralized Cooperative Reinforcement Learning with Hierarchical Information Structure	Nov 1, 2021	Multi-agent Reinforcement LearningMulti-Armed Bandits	—Unverified
Learning to Operate an Electric Vehicle Charging Station Considering Vehicle-grid Integration	Nov 1, 2021	Model Predictive Controlreinforcement-learning	—Unverified
A Generative Framework for Simultaneous Machine Translation	Nov 1, 2021	Machine Translationreinforcement-learning	—Unverified
Human-Level Control without Server-Grade Hardware	Nov 1, 2021	Cloud ComputingCPU	CodeCode Available
Learning Task Sampling Policy for Multitask Learning	Nov 1, 2021	reinforcement-learningReinforcement Learning (RL)	—Unverified
Rewards with Negative Examples for Reinforced Topic-Focused Abstractive Summarization	Nov 1, 2021	Abstractive Text SummarizationDeep Reinforcement Learning	—Unverified
Settling the Horizon-Dependence of Sample Complexity in Reinforcement Learning	Nov 1, 2021	reinforcement-learningReinforcement Learning	—Unverified
Machine Learning aided Crop Yield Optimization	Nov 1, 2021	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified
Neuro-Symbolic Approaches for Text-Based Policy Learning	Nov 1, 2021	Reinforcement Learning (RL)text-based games	CodeCode Available
Decentralized Multi-Agent Reinforcement Learning: An Off-Policy Method	Oct 31, 2021	Multi-agent Reinforcement LearningQ-Learning	—Unverified
An Actor-Critic Method for Simulation-Based Optimization	Oct 31, 2021	Adversarial AttackReinforcement Learning (RL)	—Unverified

Show:10 25 50

← PrevPage 159 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified