Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11951–12000 of 15113 papers

Title	Date	Tasks	Status	Hype
Robust Opponent Modeling via Adversarial Ensemble Reinforcement Learning in Asymmetric Imperfect-Information Games	Sep 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
ModelicaGym: Applying Reinforcement Learning to Modelica Models	Sep 18, 2019	Q-Learningreinforcement-learning	CodeCode Available	1
Segregation Dynamics with Reinforcement Learning and Agent Based Modeling	Sep 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Sample Efficient Policy Gradient Methods with Recursive Variance Reduction	Sep 18, 2019	Policy Gradient Methodsreinforcement-learning	CodeCode Available	0
Fine-Tuning Language Models from Human Preferences	Sep 18, 2019	DescriptiveLanguage Modelling	CodeCode Available	3
A Hierarchical Two-tier Approach to Hyper-parameter Optimization in Reinforcement Learning	Sep 18, 2019	Bayesian Optimizationreinforcement-learning	—Unverified	0
Stock market microstructure inference via multi-agent reinforcement learning	Sep 17, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Controllable Length Control Neural Encoder-Decoder via Reinforcement Learning	Sep 17, 2019	Decoderreinforcement-learning	—Unverified	0
Attraction-Repulsion Actor-Critic for Continuous Control Reinforcement Learning	Sep 17, 2019	continuous-controlContinuous Control	—Unverified	0
Emergent Tool Use From Multi-Agent Autocurricula	Sep 17, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	2
Hierarchical Reinforcement Learning for Open-Domain Dialog	Sep 17, 2019	Hierarchical Reinforcement LearningOpen-Domain Dialog	—Unverified	0
Generating Black-Box Adversarial Examples for Text Classifiers Using a Deep Reinforced Model	Sep 17, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Review of Tracking, Prediction and Decision Making Methods for Autonomous Driving	Sep 17, 2019	Autonomous DrivingDecision Making	—Unverified	0
Adversarial Feature Training for Generalizable Robotic Visuomotor Control	Sep 17, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
MDP Playground: An Analysis and Debug Testbed for Reinforcement Learning	Sep 17, 2019	MuJoCoOpenAI Gym	CodeCode Available	0
Meta Reinforcement Learning for Sim-to-real Domain Adaptation	Sep 16, 2019	Domain AdaptationMeta-Learning	—Unverified	0
Off-road Autonomous Vehicles Traversability Analysis and Trajectory Planning Based on Deep Inverse Reinforcement Learning	Sep 16, 2019	Autonomous Vehiclesreinforcement-learning	—Unverified	0
Selective Network Discovery via Deep Reinforcement Learning on Embedded Spaces	Sep 16, 2019	AttributeDecision Making	—Unverified	0
Leveraging human Domain Knowledge to model an empirical Reward function for a Reinforcement Learning problem	Sep 16, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Control Synthesis from Linear Temporal Logic Specifications using Model-Free Reinforcement Learning	Sep 16, 2019	Motion Planningreinforcement-learning	CodeCode Available	0
Data Centers Job Scheduling with Deep Reinforcement Learning	Sep 16, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
State Representation Learning from Demonstration	Sep 15, 2019	Imitation LearningReinforcement Learning	—Unverified	0
Wield: Systematic Reinforcement Learning With Progressive Randomization	Sep 15, 2019	General Classificationreinforcement-learning	—Unverified	0
Policy Prediction Network: Model-Free Behavior Policy with Model-Based Learning in Continuous Action Space	Sep 15, 2019	continuous-controlContinuous Control	—Unverified	0
Model Based Planning with Energy Based Models	Sep 15, 2019	modelReinforcement Learning	—Unverified	0
Driving in Dense Traffic with Model-Free Reinforcement Learning	Sep 15, 2019	continuous-controlContinuous Control	CodeCode Available	0
Learning to Recover Sparse Signals	Sep 14, 2019	compressed sensingreinforcement-learning	—Unverified	0
Active Learning for Risk-Sensitive Inverse Reinforcement Learning	Sep 14, 2019	Active Learningreinforcement-learning	—Unverified	0
Flight Controller Synthesis Via Deep Reinforcement Learning	Sep 14, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Node Injection Attacks on Graphs via Reinforcement Learning	Sep 14, 2019	Node Classificationreinforcement-learning	—Unverified	0
Towards an Adaptive Robot for Sports and Rehabilitation Coaching	Sep 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Petri Net Machines for Human-Agent Interaction	Sep 13, 2019	Deep Reinforcement LearningReinforcement Learning	—Unverified	0
Say What I Want: Towards the Dark Side of Neural Dialogue Models	Sep 13, 2019	ChatbotReinforcement Learning	—Unverified	0
Reinforcement Learning: a Comparison of UCB Versus Alternative Adaptive Policies	Sep 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
DL2: A Deep Learning-driven Scheduler for Deep Learning Clusters	Sep 13, 2019	Deep LearningFairness	CodeCode Available	0
AITuning: Machine Learning-based Tuning Tool for Run-Time Communication Libraries	Sep 13, 2019	BIG-bench Machine LearningDeep Reinforcement Learning	—Unverified	0
HJB Optimal Feedback Control with Deep Differential Value Functions and Action Constraints	Sep 13, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning for Portfolio Management	Sep 12, 2019	Data AugmentationManagement	CodeCode Available	0
Joint Inference of Reward Machines and Policies for Reinforcement Learning	Sep 12, 2019	Q-Learningreinforcement-learning	—Unverified	0
Efficiently Breaking the Curse of Horizon in Off-Policy Evaluation with Double Reinforcement Learning	Sep 12, 2019	Off-policy evaluationreinforcement-learning	—Unverified	0
Maximum Likelihood Constraint Inference for Inverse Reinforcement Learning	Sep 12, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Modeling Sensorimotor Coordination as Multi-Agent Reinforcement Learning with Differentiable Communication	Sep 12, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Modelling Working Memory using Deep Recurrent Reinforcement Learning	Sep 11, 2019	Decision Makingreinforcement-learning	—Unverified	0
Reinforcement Learning Models of Human Behavior: Reward Processing in Mental Disorders	Sep 11, 2019	Decision MakingQ-Learning	—Unverified	0
Mutual-Information Regularization in Markov Decision Processes and Actor-Critic Learning	Sep 11, 2019	MuJoCoQ-Learning	—Unverified	0
Predicting optimal value functions by interpolating reward functions in scalarized multi-objective reinforcement learning	Sep 11, 2019	Autonomous VehiclesMulti-Objective Reinforcement Learning	CodeCode Available	0
RecSim: A Configurable Simulation Platform for Recommender Systems	Sep 11, 2019	Interactive RecommendationRecommendation Systems	CodeCode Available	0
Reinforcement Learning for Temporal Logic Control Synthesis with Probabilistic Satisfaction Guarantees	Sep 11, 2019	Decision MakingDecision Making Under Uncertainty	CodeCode Available	1
On Memory Mechanism in Multi-Agent Reinforcement Learning	Sep 11, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Correlation Priors for Reinforcement Learning	Sep 11, 2019	Decision MakingImitation Learning	—Unverified	0

Show:10 25 50

← PrevPage 240 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified