Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12851–12900 of 15113 papers

Title	Date	Tasks	Status
Multi-Preference Actor Critic	Apr 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
HOList: An Environment for Machine Learning of Higher-Order Theorem Proving	Apr 5, 2019	Automated Theorem ProvingBIG-bench Machine Learning	CodeCode Available
Self-Adapting Goals Allow Transfer of Predictive Models to New Tasks	Apr 4, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
Random Projection in Neural Episodic Control	Apr 3, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
PaintBot: A Reinforcement Learning Approach for Natural Media Painting	Apr 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
Deep Reinforcement Learning on a Budget: 3D Control and Reasoning Without a Supercomputer	Apr 3, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Jointly Pre-training with Supervised, Autoencoder, and Value Losses for Deep Reinforcement Learning	Apr 3, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Centerline Depth World Reinforcement Learning-based Left Atrial Appendage Orifice Localization	Apr 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Finding and Visualizing Weaknesses of Deep Reinforcement Learning Agents	Apr 2, 2019	Autonomous DrivingDecision Making	—Unverified
Meta-learning Convolutional Neural Architectures for Multi-target Concrete Defect Classification with the COncrete DEfect BRidge IMage Dataset	Apr 2, 2019	General ClassificationMeta-Learning	CodeCode Available
Personalized Cancer Chemotherapy Schedule: a numerical comparison of performance and robustness in model-based and model-free scheduling methodologies	Apr 2, 2019	Deep Reinforcement Learningmodel	—Unverified
Guided Meta-Policy Search	Apr 1, 2019	continuous-controlContinuous Control	—Unverified
Dynamically Optimal Treatment Allocation	Apr 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Distributed Power Control for Large Energy Harvesting Networks: A Multi-Agent Deep Reinforcement Learning Approach	Apr 1, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Cooperative Multi-Agent Reinforcement Learning Framework for Scalping Trading	Mar 31, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Power Control for Wireless VBR Video Streaming: From Optimization to Reinforcement Learning	Mar 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
Risk Averse Robust Adversarial Reinforcement Learning	Mar 31, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Lane Change Decision-making through Deep Reinforcement Learning with Rule-based Constraints	Mar 30, 2019	Autonomous DrivingDecision Making	—Unverified
Learning Good Representation via Continuous Attention	Mar 29, 2019	ObjectObject Recognition	—Unverified
Autonomous Highway Driving using Deep Reinforcement Learning	Mar 29, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Improved Reinforcement Learning with Curriculum	Mar 29, 2019	Board Gamesreinforcement-learning	—Unverified
Towards Brain-inspired System: Deep Recurrent Reinforcement Learning for Simulated Self-driving Agent	Mar 29, 2019	Decision MakingOpenAI Gym	—Unverified
Robust Data Detection for MIMO Systems with One-Bit ADCs: A Reinforcement Learning Approach	Mar 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Regularizing Trajectory Optimization with Denoising Autoencoders	Mar 28, 2019	DenoisingModel-based Reinforcement Learning	—Unverified
Meta-Learning surrogate models for sequential decision making	Mar 28, 2019	Bayesian OptimisationDecision Making	—Unverified
Wasserstein Dependency Measure for Representation Learning	Mar 28, 2019	Object Recognitionreinforcement-learning	—Unverified
How to pick the domain randomization parameters for sim-to-real transfer of reinforcement learning policies?	Mar 28, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Autoregressive Policies for Continuous Control Deep Reinforcement Learning	Mar 27, 2019	continuous-controlContinuous Control	CodeCode Available
Generalized Off-Policy Actor-Critic	Mar 27, 2019	counterfactualMuJoCo	—Unverified
Constructing Parsimonious Analytic Models for Dynamic Systems via Symbolic Regression	Mar 27, 2019	Decision Makingregression	CodeCode Available
Understanding the Relation Between Maximum-Entropy Inverse Reinforcement Learning and Behaviour Cloning	Mar 27, 2019	continuous-controlContinuous Control	—Unverified
Reinforcement Learning Based Text Style Transfer without Parallel Training Corpus	Mar 26, 2019	Decoderreinforcement-learning	—Unverified
Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to ATARI games	Mar 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Failure-Scenario Maker for Rule-Based Agent using Multi-agent Adversarial Reinforcement Learning and its Application to Autonomous Driving	Mar 26, 2019	Autonomous DrivingMulti-agent Reinforcement Learning	—Unverified
Energy Storage Management via Deep Q-Networks	Mar 26, 2019	ManagementReinforcement Learning	—Unverified
Interactions between Representation Learning and Supervision	Mar 25, 2019	Continual LearningDimensionality Reduction	—Unverified
Q-Learning for Continuous Actions with Cross-Entropy Guided Policies	Mar 25, 2019	Q-LearningReinforcement Learning	—Unverified
On the use of Deep Autoencoders for Efficient Embedded Reinforcement Learning	Mar 25, 2019	CPUGPU	—Unverified
Sub-Task Discovery with Limited Supervision: A Constrained Clustering Approach	Mar 24, 2019	ClusteringConstrained Clustering	—Unverified
Temporal Logic Guided Safe Reinforcement Learning Using Control Barrier Functions	Mar 23, 2019	reinforcement-learningReinforcement Learning	—Unverified
Neural Program Planner for Structured Predictions	Mar 23, 2019	Machine TranslationProgram Synthesis	—Unverified
Macro Action Reinforcement Learning with Sequence Disentanglement using Variational Autoencoder	Mar 22, 2019	DisentanglementGeneral Reinforcement Learning	—Unverified
Symbolic Regression Methods for Reinforcement Learning	Mar 22, 2019	Decision MakingFriction	—Unverified
Improving Safety in Reinforcement Learning Using Model-Based Architectures and Human Intervention	Mar 22, 2019	reinforcement-learningReinforcement Learning	—Unverified
Jet grooming through reinforcement learning	Mar 22, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Deep Hierarchical Reinforcement Learning Based Recommendations via Multi-goals Abstraction	Mar 22, 2019	Hierarchical Reinforcement LearningRecommendation Systems	—Unverified
Explaining Reinforcement Learning to Mere Mortals: An Empirical Study	Mar 22, 2019	reinforcement-learningReinforcement Learning	—Unverified
DQN with model-based exploration: efficient learning on environments with sparse rewards	Mar 22, 2019	Atari GamesOpenAI Gym	—Unverified
Distributed off-Policy Actor-Critic Reinforcement Learning with Policy Consensus	Mar 21, 2019	Multi-agent Reinforcement Learningreinforcement-learning	—Unverified
End-to-End Safe Reinforcement Learning through Barrier Functions for Safety-Critical Continuous Control Tasks	Mar 21, 2019	continuous-controlContinuous Control	CodeCode Available

Show:10 25 50

← PrevPage 258 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified