Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 12701–12750 of 15113 papers

Title	Date	Tasks	Status
Similarities between policy gradient methods (PGM) in Reinforcement learning (RL) and supervised learning (SL)	Apr 12, 2019	Decision MakingPolicy Gradient Methods	—Unverified
Knowledge Flow: Improve Upon Your Teachers	Apr 11, 2019	Reinforcement LearningReinforcement Learning (RL)	—Unverified
Model-Free Reinforcement Learning for Financial Portfolios: A Brief Survey	Apr 10, 2019	ManagementPortfolio Optimization	—Unverified
ReinBo: Machine Learning pipeline search and configuration with Bayesian Optimization embedded Reinforcement Learning	Apr 10, 2019	Bayesian OptimizationBIG-bench Machine Learning	CodeCode Available
Safer Deep RL with Shallow MCTS: A Case Study in Pommerman	Apr 10, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
RL-Based User Association and Resource Allocation for Multi-UAV enabled MEC	Apr 8, 2019	Edge-computingReinforcement Learning	—Unverified
"Jam Me If You Can'': Defeating Jammer with Deep Dueling Neural Network Architecture and Ambient Backscattering Augmented Communications	Apr 8, 2019	Deep Reinforcement LearningQ-Learning	—Unverified
Creating Pro-Level AI for a Real-Time Fighting Game Using Deep Reinforcement Learning	Apr 8, 2019	Board GamesDeep Reinforcement Learning	—Unverified
Teaching GANs to Sketch in Vector Format	Apr 7, 2019	Generative Adversarial NetworkReinforcement Learning	—Unverified
Reinforced Imitation in Heterogeneous Action Space	Apr 6, 2019	Imitation LearningReinforcement Learning	—Unverified
Reinforcement Learning with Attention that Works: A Self-Supervised Approach	Apr 6, 2019	Atari Gamesreinforcement-learning	—Unverified
Multi-Preference Actor Critic	Apr 5, 2019	reinforcement-learningReinforcement Learning	—Unverified
HOList: An Environment for Machine Learning of Higher-Order Theorem Proving	Apr 5, 2019	Automated Theorem ProvingBIG-bench Machine Learning	CodeCode Available
Self-Adapting Goals Allow Transfer of Predictive Models to New Tasks	Apr 4, 2019	Model-based Reinforcement Learningreinforcement-learning	—Unverified
PaintBot: A Reinforcement Learning Approach for Natural Media Painting	Apr 3, 2019	reinforcement-learningReinforcement Learning	—Unverified
Jointly Pre-training with Supervised, Autoencoder, and Value Losses for Deep Reinforcement Learning	Apr 3, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Deep Reinforcement Learning on a Budget: 3D Control and Reasoning Without a Supercomputer	Apr 3, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Random Projection in Neural Episodic Control	Apr 3, 2019	Deep Reinforcement LearningReinforcement Learning	CodeCode Available
Meta-learning Convolutional Neural Architectures for Multi-target Concrete Defect Classification with the COncrete DEfect BRidge IMage Dataset	Apr 2, 2019	General ClassificationMeta-Learning	CodeCode Available
Finding and Visualizing Weaknesses of Deep Reinforcement Learning Agents	Apr 2, 2019	Autonomous DrivingDecision Making	—Unverified
Centerline Depth World Reinforcement Learning-based Left Atrial Appendage Orifice Localization	Apr 2, 2019	reinforcement-learningReinforcement Learning	—Unverified
Personalized Cancer Chemotherapy Schedule: a numerical comparison of performance and robustness in model-based and model-free scheduling methodologies	Apr 2, 2019	Deep Reinforcement Learningmodel	—Unverified
Guided Meta-Policy Search	Apr 1, 2019	continuous-controlContinuous Control	—Unverified
Distributed Power Control for Large Energy Harvesting Networks: A Multi-Agent Deep Reinforcement Learning Approach	Apr 1, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Dynamically Optimal Treatment Allocation	Apr 1, 2019	reinforcement-learningReinforcement Learning	CodeCode Available
Cooperative Multi-Agent Reinforcement Learning Framework for Scalping Trading	Mar 31, 2019	Deep Reinforcement LearningMulti-agent Reinforcement Learning	—Unverified
Power Control for Wireless VBR Video Streaming: From Optimization to Reinforcement Learning	Mar 31, 2019	reinforcement-learningReinforcement Learning	—Unverified
Risk Averse Robust Adversarial Reinforcement Learning	Mar 31, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Lane Change Decision-making through Deep Reinforcement Learning with Rule-based Constraints	Mar 30, 2019	Autonomous DrivingDecision Making	—Unverified
Autonomous Highway Driving using Deep Reinforcement Learning	Mar 29, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified
Learning Good Representation via Continuous Attention	Mar 29, 2019	ObjectObject Recognition	—Unverified
Improved Reinforcement Learning with Curriculum	Mar 29, 2019	Board Gamesreinforcement-learning	—Unverified
Towards Brain-inspired System: Deep Recurrent Reinforcement Learning for Simulated Self-driving Agent	Mar 29, 2019	Decision MakingOpenAI Gym	—Unverified
Robust Data Detection for MIMO Systems with One-Bit ADCs: A Reinforcement Learning Approach	Mar 29, 2019	reinforcement-learningReinforcement Learning	—Unverified
Wasserstein Dependency Measure for Representation Learning	Mar 28, 2019	Object Recognitionreinforcement-learning	—Unverified
Regularizing Trajectory Optimization with Denoising Autoencoders	Mar 28, 2019	DenoisingModel-based Reinforcement Learning	—Unverified
Meta-Learning surrogate models for sequential decision making	Mar 28, 2019	Bayesian OptimisationDecision Making	—Unverified
How to pick the domain randomization parameters for sim-to-real transfer of reinforcement learning policies?	Mar 28, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available
Understanding the Relation Between Maximum-Entropy Inverse Reinforcement Learning and Behaviour Cloning	Mar 27, 2019	continuous-controlContinuous Control	—Unverified
Constructing Parsimonious Analytic Models for Dynamic Systems via Symbolic Regression	Mar 27, 2019	Decision Makingregression	CodeCode Available
Generalized Off-Policy Actor-Critic	Mar 27, 2019	counterfactualMuJoCo	—Unverified
Autoregressive Policies for Continuous Control Deep Reinforcement Learning	Mar 27, 2019	continuous-controlContinuous Control	CodeCode Available
Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to ATARI games	Mar 26, 2019	Atari GamesDeep Reinforcement Learning	CodeCode Available
Energy Storage Management via Deep Q-Networks	Mar 26, 2019	ManagementReinforcement Learning	—Unverified
Failure-Scenario Maker for Rule-Based Agent using Multi-agent Adversarial Reinforcement Learning and its Application to Autonomous Driving	Mar 26, 2019	Autonomous DrivingMulti-agent Reinforcement Learning	—Unverified
Reinforcement Learning Based Text Style Transfer without Parallel Training Corpus	Mar 26, 2019	Decoderreinforcement-learning	—Unverified
Interactions between Representation Learning and Supervision	Mar 25, 2019	Continual LearningDimensionality Reduction	—Unverified
Q-Learning for Continuous Actions with Cross-Entropy Guided Policies	Mar 25, 2019	Q-LearningReinforcement Learning	—Unverified
On the use of Deep Autoencoders for Efficient Embedded Reinforcement Learning	Mar 25, 2019	CPUGPU	—Unverified
Sub-Task Discovery with Limited Supervision: A Constrained Clustering Approach	Mar 24, 2019	ClusteringConstrained Clustering	—Unverified

Show:10 25 50

← PrevPage 255 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified