Reinforcement Learning (RL)

Reinforcement Learning (RL) involves training an agent to take actions in an environment to maximize a cumulative reward signal. The agent interacts with the environment and learns by receiving feedback in the form of rewards or punishments for its actions. The goal of reinforcement learning is to find the optimal policy or decision-making strategy that maximizes the long-term reward.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 11701–11750 of 15113 papers

Title	Date	Tasks	Status	Hype
Towards a Reinforcement Learning Environment Toolbox for Intelligent Electric Motor Control	Oct 21, 2019	Model Predictive ControlOpenAI Gym	CodeCode Available	0
Momentum in Reinforcement Learning	Oct 21, 2019	Atari Gamesreinforcement-learning	—Unverified	0
Good, Better, Best: Textual Distractors Generation for Multiple-Choice Visual Question Answering via Reinforcement Learning	Oct 21, 2019	Data AugmentationDecision Making	—Unverified	0
Adversarial Skill Networks: Unsupervised Robot Skill Learning from Video	Oct 21, 2019	continuous-controlContinuous Control	CodeCode Available	0
Deep Reinforcement Learning Control of Quantum Cartpoles	Oct 21, 2019	Deep LearningDeep Reinforcement Learning	CodeCode Available	1
Human-Like Decision Making: Document-level Aspect Sentiment Classification via Hierarchical Reinforcement Learning	Oct 21, 2019	Decision MakingGeneral Classification	—Unverified	0
Dealing with Sparse Rewards in Reinforcement Learning	Oct 21, 2019	Deep Reinforcement Learningreinforcement-learning	CodeCode Available	0
Autonomous Industrial Management via Reinforcement Learning: Self-Learning Agents for Decision-Making -- A Review	Oct 20, 2019	Decision MakingFault Detection	—Unverified	0
RLScheduler: An Automated HPC Batch Job Scheduler Using Reinforcement Learning	Oct 20, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Policy Learning for Malaria Control	Oct 20, 2019	Bayesian OptimizationDecision Making	CodeCode Available	0
Towards More Sample Efficiency in Reinforcement Learning with Data Augmentation	Oct 19, 2019	Data AugmentationDeep Reinforcement Learning	CodeCode Available	0
Natural Question Generation with Reinforcement Learning Based Graph-to-Sequence Model	Oct 19, 2019	Graph Neural NetworkGraph-to-Sequence	CodeCode Available	0
Opinion shaping in social networks using reinforcement learning	Oct 19, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
A Structured Prediction Approach for Generalization in Cooperative Multi-Agent Reinforcement Learning	Oct 19, 2019	Multi-agent Reinforcement Learningreinforcement-learning	CodeCode Available	0
Active 6D Multi-Object Pose Estimation in Cluttered Scenarios with Deep Reinforcement Learning	Oct 19, 2019	Deep Reinforcement LearningObject	—Unverified	0
Explainable AI: Deep Reinforcement Learning Agents for Residential Demand Side Cost Savings in Smart Grids	Oct 19, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
OffWorld Gym: open-access physical robotics environment for real-world reinforcement learning benchmark and research	Oct 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Multi-View Reinforcement Learning	Oct 18, 2019	Decision Makingreinforcement-learning	CodeCode Available	0
On Connections between Constrained Optimization and Reinforcement Learning	Oct 18, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
On the Sample Complexity of Actor-Critic Method for Reinforcement Learning with Function Approximation	Oct 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Unsupervised Context Rewriting for Open Domain Conversation	Oct 18, 2019	DecoderReinforcement Learning	—Unverified	0
Graph Convolutional Policy for Solving Tree Decomposition via Reinforcement Learning Heuristics	Oct 18, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Adaptive Discretization for Episodic Reinforcement Learning in Metric Spaces	Oct 17, 2019	Q-Learningreinforcement-learning	CodeCode Available	0
Adaptive Curriculum Generation from Demonstrations for Sim-to-Real Visuomotor Control	Oct 17, 2019	Reinforcement LearningReinforcement Learning (RL)	CodeCode Available	0
Single Episode Policy Transfer in Reinforcement Learning	Oct 17, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
Reinforcement Learning for Robotic Manipulation using Simulated Locomotion Demonstrations	Oct 16, 2019	Objectreinforcement-learning	CodeCode Available	0
Soft Actor-Critic for Discrete Action Settings	Oct 16, 2019	Atari Gamesreinforcement-learning	CodeCode Available	0
Parallel Exploration via Negatively Correlated Search	Oct 16, 2019	Atari GamesDiversity	—Unverified	0
Reinforced Bit Allocation under Task-Driven Semantic Distortion Metrics	Oct 16, 2019	General ClassificationQuantization	—Unverified	0
On Learning Paradigms for the Travelling Salesman Problem	Oct 16, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Adaptive Trade-Offs in Off-Policy Learning	Oct 16, 2019	Off-policy evaluationreinforcement-learning	—Unverified	0
Creativity in Robot Manipulation with Deep Reinforcement Learning	Oct 16, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Deep Reinforcement Learning meets Graph Neural Networks: exploring a routing optimization use case	Oct 16, 2019	Decision MakingDeep Reinforcement Learning	CodeCode Available	0
Conditional Importance Sampling for Off-Policy Learning	Oct 16, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Model-free Reinforcement Learning in Infinite-horizon Average-reward Markov Decision Processes	Oct 15, 2019	Multi-Armed Banditsreinforcement-learning	CodeCode Available	0
Reinforcement learning with a network of spiking agents	Oct 15, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	1
Dynamic Graph Configuration with Reinforcement Learning for Connected Autonomous Vehicle Trajectories	Oct 14, 2019	Autonomous Vehiclesreinforcement-learning	—Unverified	0
A unified view of likelihood ratio and reparameterization gradients and an optimal importance sampling scheme	Oct 14, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
Actor Critic with Differentially Private Critic	Oct 14, 2019	reinforcement-learningReinforcement Learning	—Unverified	0
On the Expressivity of Neural Networks for Deep Reinforcement Learning	Oct 14, 2019	Deep Reinforcement LearningMuJoCo	CodeCode Available	0
Coordination of PV Smart Inverters Using Deep Reinforcement Learning for Grid Voltage Regulation	Oct 14, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Federated Transfer Reinforcement Learning for Autonomous Driving	Oct 14, 2019	Autonomous DrivingCollision Avoidance	—Unverified	0
On the Reduction of Variance and Overestimation of Deep Q-Learning	Oct 14, 2019	Q-Learningreinforcement-learning	—Unverified	0
Rethinking Exposure Bias In Language Modeling	Oct 13, 2019	Language ModelingLanguage Modelling	—Unverified	0
Stabilizing Transformers for Reinforcement Learning	Oct 13, 2019	General Reinforcement LearningLanguage Modeling	CodeCode Available	1
Policy Poisoning in Batch Reinforcement Learning and Control	Oct 13, 2019	reinforcement-learningReinforcement Learning	CodeCode Available	0
QoS and Jamming-Aware Wireless Networking Using Deep Reinforcement Learning	Oct 13, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Neural Program Synthesis By Self-Learning	Oct 13, 2019	CPUProgram Synthesis	—Unverified	0
Curiosity-Driven Recommendation Strategy for Adaptive Learning via Deep Reinforcement Learning	Oct 12, 2019	Deep Reinforcement Learningreinforcement-learning	—Unverified	0
Autonomous Navigation via Deep Reinforcement Learning for Resource Constraint Edge Nodes using Transfer Learning	Oct 12, 2019	Autonomous NavigationDeep Reinforcement Learning	CodeCode Available	0

Show:10 25 50

← PrevPage 235 of 303Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	PPG	Mean Normalized Performance	0.76	—	Unverified
2	PPO	Mean Normalized Performance	0.58	—	Unverified