Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 14001–14050 of 15113 papers

Title	Date	Tasks	Status	Hype
Cooperative Multi-Agent Reinforcement Learning for Low-Level Wireless Communication	Jan 14, 2018	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Fuzzing	Jan 14, 2018	Q-Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning of Cell Movement in the Early Stage of C. elegans Embryogenesis	Jan 14, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Autonomous Driving in Reality with Reinforcement Learning and Image Translation	Jan 13, 2018	Autonomous DrivingCar Racing	—Unverified	0
Expected Policy Gradients for Reinforcement Learning	Jan 10, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified	0
DeepTraffic: Crowdsourced Hyperparameter Tuning of Deep Reinforcement Learning Systems for Multi-Agent Dense Traffic Navigation	Jan 9, 2018	Autonomous DrivingAutonomous Navigation	CodeCode Available	0
Distributed Deep Reinforcement Learning: Learn how to play Atari games in 21 minutes	Jan 9, 2018	Atari GamesCPU	CodeCode Available	0
Trading the Twitter Sentiment with Reinforcement Learning	Jan 7, 2018	BIG-bench Machine LearningQ-Learning	—Unverified	0
Sample-Efficient Reinforcement Learning through Transfer and Architectural Priors	Jan 7, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
Competitive Multi-agent Inverse Reinforcement Learning with Sub-optimal Demonstrations	Jan 7, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Using reinforcement learning to learn how to play text-based games	Jan 6, 2018	reinforcement-learningReinforcement Learning	CodeCode Available	0
Faster Deep Q-learning using Neural Episodic Control	Jan 6, 2018	Deep Reinforcement LearningQ-Learning	—Unverified	0
Deep Reinforcement Learning based Optimal Control of Hot Water Systems	Jan 4, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Soft Actor-Critic: Off-Policy Maximum Entropy Deep Reinforcement Learning with a Stochastic Actor	Jan 4, 2018	Continuous ControlDecision Making	CodeCode Available	1
Jointly Learning to Construct and Control Agents using Deep Reinforcement Learning	Jan 4, 2018	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
DeepMind Control Suite	Jan 2, 2018	continuous-controlContinuous Control	CodeCode Available	1
Learning objects from pixels	Jan 1, 2018	Atari GamesObject	—Unverified	0
AUTOMATA GUIDED HIERARCHICAL REINFORCEMENT LEARNING FOR ZERO-SHOT SKILL COMPOSITION	Jan 1, 2018	Deep Reinforcement LearningHierarchical Reinforcement Learning	—Unverified	0
Latent forward model for Real-time Strategy game planning with incomplete information	Jan 1, 2018	Atari GamesDecision Making	—Unverified	0
Faster Reinforcement Learning with Expert State Sequences	Jan 1, 2018	Imitation Learningreinforcement-learning	—Unverified	0
Learning to Treat Sepsis with Multi-Output Gaussian Process Deep Recurrent Q-Networks	Jan 1, 2018	Deep Reinforcement LearningGaussian Processes	—Unverified	0
Learning Dynamic State Abstractions for Model-Based Reinforcement Learning	Jan 1, 2018	Atari GamesDecision Making	—Unverified	0
Learning Gaussian Policies from Smoothed Action Value Functions	Jan 1, 2018	continuous-controlContinuous Control	—Unverified	0
Domain Adaptation for Deep Reinforcement Learning in Visually Distinct Games	Jan 1, 2018	Deep Reinforcement LearningDomain Adaptation	—Unverified	0
Exploring Deep Recurrent Models with Reinforcement Learning for Molecule Design	Jan 1, 2018	Drug DiscoveryOpenAI Gym	—Unverified	0
Combination of Supervised and Reinforcement Learning For Vision-Based Autonomous Control	Jan 1, 2018	MuJoCoreinforcement-learning	—Unverified	0
Alpha-divergence bridges maximum likelihood and reinforcement learning in neural sequence generation	Jan 1, 2018	Machine Translationreinforcement-learning	—Unverified	0
A dynamic game approach to training robust deep policies	Jan 1, 2018	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Autonomous Vehicle Fleet Coordination With Deep Reinforcement Learning	Jan 1, 2018	Autonomous VehiclesDecision Making	—Unverified	0
Reward Estimation via State Prediction	Jan 1, 2018	Predictionreinforcement-learning	—Unverified	0
Neuron as an Agent	Jan 1, 2018	counterfactualMulti-agent Reinforcement Learning	—Unverified	0
Using Deep Reinforcement Learning to Generate Rationales for Molecules	Jan 1, 2018	Deep Reinforcement LearningDrug Design	—Unverified	0
Long Term Memory Network for Combinatorial Optimization Problems	Jan 1, 2018	Combinatorial OptimizationDeep Reinforcement Learning	—Unverified	0
Policy Gradient For Multidimensional Action Spaces: Action Sampling and Entropy Bonus	Jan 1, 2018	Atari GamesDeep Reinforcement Learning	—Unverified	0
LSD-Net: Look, Step and Detect for Joint Navigation and Multi-View Recognition with Deep Reinforcement Learning	Jan 1, 2018	Deep Reinforcement LearningGeneral Classification	—Unverified	0
Predicting Multiple Actions for Stochastic Continuous Control	Jan 1, 2018	continuous-controlContinuous Control	—Unverified	0
Neural Task Graph Execution	Jan 1, 2018	Reinforcement LearningReinforcement Learning (RL)	—Unverified	0
Representing Entropy : A short proof of the equivalence between soft Q-learning and policy gradients	Jan 1, 2018	Q-Learningreinforcement-learning	—Unverified	0
Model-based imitation learning from state trajectories	Jan 1, 2018	Imitation Learningmodel	—Unverified	0
Now I Remember! Episodic Memory For Reinforcement Learning	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Reinforcement Learning via Replica Stacking of Quantum Measurements for the Training of Quantum Boltzmann Machines	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
Universal Agent for Disentangling Environments and Tasks	Jan 1, 2018	Hierarchical Reinforcement Learningreinforcement-learning	—Unverified	0
Residual Loss Prediction: Reinforcement Learning With No Incremental Feedback	Jan 1, 2018	Multi-Armed BanditsPrediction	CodeCode Available	0
NerveNet: Learning Structured Policy with Graph Neural Networks	Jan 1, 2018	Benchmarkingcontinuous-control	CodeCode Available	0
LatentPoison -- Adversarial Attacks On The Latent Space	Jan 1, 2018	DecoderGeneral Classification	—Unverified	0
Do Deep Reinforcement Learning Algorithms really Learn to Navigate?	Jan 1, 2018	Deep Reinforcement LearningNavigate	—Unverified	0
Learning Robust Rewards with Adverserial Inverse Reinforcement Learning	Jan 1, 2018	Decision MakingDeep Reinforcement Learning	—Unverified	0
Learning an Embedding Space for Transferable Robot Skills	Jan 1, 2018	reinforcement-learningReinforcement Learning	—Unverified	0
A Hierarchical Model for Device Placement	Jan 1, 2018	Deep Reinforcement LearningMachine Translation	—Unverified	0
Action-dependent Control Variates for Policy Optimization via Stein Identity	Jan 1, 2018	Policy Gradient Methodsreinforcement-learning	—Unverified	0

Show:10 25 50

← PrevPage 281 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified