Robot Manipulation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 430 papers

Title	Date	Tasks	Status	Hype
OpenVLA: An Open-Source Vision-Language-Action Model	Jun 13, 2024	Imitation LearningLanguage Modelling	CodeCode Available	9
On the Vulnerability of LLM/VLM-Controlled Robotics	Feb 15, 2024	Language ModellingRobot Manipulation	CodeCode Available	7
UniVLA: Learning to Act Anywhere with Task-centric Latent Actions	May 9, 2025	Robot ManipulationVision-Language-Action	CodeCode Available	5
3D Diffusion Policy: Generalizable Visuomotor Policy Learning via Simple 3D Representations	Mar 6, 2024	Imitation LearningRobot Manipulation	CodeCode Available	5
Evaluating Real-World Robot Manipulation Policies in Simulation	May 9, 2024	Robotic GraspingRobot Manipulation	CodeCode Available	5
Magma: A Foundation Model for Multimodal AI Agents	Feb 18, 2025	Autonomous Web NavigationImage to text	CodeCode Available	5
OpenHelix: A Short Survey, Empirical Analysis, and Open-Source Dual-System VLA Model for Robotic Manipulation	May 6, 2025	Robot ManipulationVision-Language-Action	CodeCode Available	3
Latent Action Pretraining from Videos	Oct 15, 2024	QuantizationRobot Manipulation	CodeCode Available	3
Video Prediction Policy: A Generalist Robot Policy with Predictive Visual Representations	Dec 19, 2024	Contrastive LearningImage Reconstruction	CodeCode Available	3
Affordance-based Robot Manipulation with Flow Matching	Sep 2, 2024	Action GenerationRobot Manipulation	CodeCode Available	3
3D Diffuser Actor: Policy Diffusion with 3D Scene Representations	Feb 18, 2024	DenoisingRobot Manipulation	CodeCode Available	3
LIBERO: Benchmarking Knowledge Transfer for Lifelong Robot Learning	Jun 5, 2023	Benchmarking	CodeCode Available	3
3D Diffuser Actor: Policy Diffusion with 3D Scene Representations	Feb 16, 2024	DenoisingRobot Manipulation	CodeCode Available	3
Towards Generalist Robot Policies: What Matters in Building Vision-Language-Action Models	Dec 18, 2024	Representation LearningRobot Manipulation	CodeCode Available	3
SoFar: Language-Grounded Orientation Bridges Spatial Reasoning and Object Manipulation	Feb 18, 2025	Object RearrangementRobot Manipulation	CodeCode Available	3
RLVR-World: Training World Models with Reinforcement Learning	May 20, 2025	reinforcement-learningReinforcement Learning	CodeCode Available	3
PhysTwin: Physics-Informed Reconstruction and Simulation of Deformable Objects from Videos	Mar 23, 2025	4D reconstructionDeformable Object Manipulation	CodeCode Available	3
RT-1: Robotics Transformer for Real-World Control at Scale	Dec 13, 2022	DiversityRobot Manipulation	CodeCode Available	3
DreamVLA: A Vision-Language-Action Model Dreamed with Comprehensive World Knowledge	Jul 6, 2025	Image GenerationMultimodal Reasoning	CodeCode Available	3
RVT-2: Learning Precise Manipulation from Few Demonstrations	Jun 12, 2024	Robot ManipulationRobot Manipulation Generalization	CodeCode Available	3
Moto: Latent Motion Token as the Bridging Language for Learning Robot Manipulation from Videos	Dec 5, 2024	Robot Manipulation	CodeCode Available	2
Equivariant Diffusion Policy	Jul 1, 2024	Imitation LearningRobot Manipulation	CodeCode Available	2
FurnitureBench: Reproducible Real-World Benchmark for Long-Horizon Complex Manipulation	May 22, 2023	Imitation LearningMotion Planning	CodeCode Available	2
Efficient Diffusion Transformer Policies with Mixture of Expert Denoisers for Multitask Learning	Dec 17, 2024	Denoising	CodeCode Available	2
Act3D: 3D Feature Field Transformers for Multi-Task Robotic Manipulation	Jun 30, 2023	Action DetectionPose Prediction	CodeCode Available	2

Show:10 25 50

← PrevPage 1 of 18Next →

All datasets CALVIN RLBench SimplerEnv-Google Robot MimicGen SimplerEnv-Widow X

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DreamVLA	avg. sequence length (D to D)	4.44	—	Unverified
2	VPP	avg. sequence length (D to D)	4.29	—	Unverified
3	RoboVLMs	avg. sequence length (D to D)	4.25	—	Unverified
4	Openhelix	avg. sequence length (D to D)	4.08	—	Unverified
5	UP-VLA	avg. sequence length (D to D)	4.08	—	Unverified
6	GR-MG	avg. sequence length (D to D)	4.04	—	Unverified
7	MoDE	avg. sequence length (D to D)	4.01	—	Unverified
8	RoboUniView	avg. sequence length (D to D)	3.86	—	Unverified
9	UniVLA	avg. sequence length (D to D)	3.8	—	Unverified
10	RoboDual	avg. sequence length (D to D)	3.66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EquAct	Succ. Rate (18 tasks, 100 demo/task)	89.4	—	Unverified
2	SAM2Act	Succ. Rate (18 tasks, 100 demo/task)	86.8	—	Unverified
3	ARP+	Succ. Rate (18 tasks, 100 demo/task)	84.9	—	Unverified
4	3D-LOTUS	Succ. Rate (18 tasks, 100 demo/task)	83.1	—	Unverified
5	RVT-2	Succ. Rate (18 tasks, 100 demo/task)	81.4	—	Unverified
6	3D Diffuser Actor	Succ. Rate (18 tasks, 100 demo/task)	81.3	—	Unverified
7	Mini Diffuser	Succ. Rate (18 tasks, 100 demo/task)	77.6	—	Unverified
8	SAM-E	Succ. Rate (18 tasks, 100 demo/task)	70.6	—	Unverified
9	Auto-λ	Succ. Rate (10 tasks, 100 demos/task)	69.3	—	Unverified
10	Act3D	Succ. Rate (18 tasks, 100 demo/task)	65	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SoFar	Visual Matching	0.75	—	Unverified
2	SpatialVLA	Visual Matching	0.72	—	Unverified
3	Dita-300M	Visual Matching	0.69	—	Unverified
4	RT-2-X	Visual Matching	0.61	—	Unverified
5	RoboVLM	Visual Matching	0.56	—	Unverified
6	RT-1-X	Visual Matching	0.53	—	Unverified
7	TraceVLA	Visual Matching	0.46	—	Unverified
8	OpenVLA	Visual Matching	0.28	—	Unverified
9	Octo-Base	Visual Matching	0.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SDP	Succ. Rate (12 tasks, 100 demo/task)	76	—	Unverified
2	EquiDiff (Voxel)	Succ. Rate (12 tasks, 100 demo/task)	63.9	—	Unverified
3	EquiDiff (Image)	Succ. Rate (12 tasks, 100 demo/task)	53.7	—	Unverified
4	DP (Evaluated in EquiDiff)	Succ. Rate (12 tasks, 100 demo/task)	42	—	Unverified
5	DP3 (Evaluated in EquiDiff)	Succ. Rate (12 tasks, 100 demo/task)	23.9	—	Unverified
6	BC RNN (Evaluated in EquiDiff)	Succ. Rate (12 tasks, 100 demo/task)	22.9	—	Unverified
7	ACT (Evaluated in EquiDiff)	Succ. Rate (12 tasks, 100 demo/task)	21.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SoFar	Average	0.58	—	Unverified
2	SpatialVLA	Average	0.34	—	Unverified
3	Octo-Small	Average	0.3	—	Unverified
4	Octo-Base	Average	0.16	—	Unverified
5	RoboVLM	Average	0.14	—	Unverified
6	RT-1-X	Average	0.01	—	Unverified
7	OpenVLA	Average	0.01	—	Unverified