Robot Manipulation

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–75 of 430 papers

Title	Date	Tasks	Status	Hype
Multimodal Fusion and Vision-Language Models: A Survey for Robot Vision	Apr 3, 2025	3D Object Detectioncross-modal alignment	CodeCode Available	1
One-Shot Object Affordance Detection in the Wild	Aug 8, 2021	Action RecognitionAffordance Detection	CodeCode Available	1
Mean Shift Mask Transformer for Unseen Object Instance Segmentation	Nov 21, 2022	ClusteringImage Segmentation	CodeCode Available	1
ManiSkill2: A Unified Benchmark for Generalizable Manipulation Skills	Feb 9, 2023	GPUImitation Learning	CodeCode Available	1
Modeling Fine-Grained Hand-Object Dynamics for Egocentric Video Representation Learning	Mar 2, 2025	Large Language ModelMulti-Instance Retrieval	CodeCode Available	1
CALVIN: A Benchmark for Language-Conditioned Policy Learning for Long-Horizon Robot Manipulation Tasks	Dec 6, 2021	Continuous ControlImitation Learning	CodeCode Available	1
CACTI: A Framework for Scalable Multi-Task Multi-Scene Visual Imitation Learning	Dec 12, 2022	Data AugmentationImage Generation	CodeCode Available	1
On the Efficacy of 3D Point Cloud Reinforcement Learning	Jun 11, 2023	3D Point Cloud Reinforcement LearningInductive Bias	CodeCode Available	1
Motion Policy Networks	Oct 21, 2022	Motion GenerationMotion Planning	CodeCode Available	1
BusyBot: Learning to Interact, Reason, and Plan in a BusyBoard Environment	Jul 17, 2022	Causal DiscoveryRobot Manipulation	CodeCode Available	1
Coarse-to-Fine Q-attention: Efficient Learning for Visual Robotic Manipulation via Discretisation	Jun 23, 2021	Continuous ControlQ-Learning	CodeCode Available	1
Coarse-to-fine Q-attention with Tree Expansion	Apr 26, 2022	Robot Manipulation	CodeCode Available	1
BundleTrack: 6D Pose Tracking for Novel Objects without Instance or Category-Level 3D Models	Aug 1, 2021	3D Object Tracking6D Pose Estimation	CodeCode Available	1
Leveraging Locality to Boost Sample Efficiency in Robotic Manipulation	Jun 15, 2024	Imitation LearningInductive Bias	CodeCode Available	1
LTLDoG: Satisfying Temporally-Extended Symbolic Constraints for Safe Diffusion-based Planning	May 7, 2024	Offline RLRobot Manipulation	CodeCode Available	1
PixL2R: Guiding Reinforcement Learning Using Natural Language by Mapping Pixels to Rewards	Jul 30, 2020	reinforcement-learningReinforcement Learning (RL)	CodeCode Available	1
Language-Conditioned Imitation Learning for Robot Manipulation Tasks	Oct 22, 2020	Imitation LearningRobot Manipulation	CodeCode Available	1
Bingham Policy Parameterization for 3D Rotations in Reinforcement Learning	Feb 8, 2022	continuous-controlContinuous Control	CodeCode Available	1
Language Reward Modulation for Pretraining Reinforcement Learning	Aug 23, 2023	reinforcement-learningReinforcement Learning	CodeCode Available	1
HO-Cap: A Capture System and Dataset for 3D Reconstruction and Pose Tracking of Hand-Object Interaction	Jun 10, 2024	3D Reconstructionhand-object pose	CodeCode Available	1
GUARD: A Safe Reinforcement Learning Benchmark	May 23, 2023	Autonomous DrivingDiversity	CodeCode Available	1
Instruction-driven history-aware policies for robotic manipulations	Sep 11, 2022	Robot ManipulationRobot Manipulation Generalization	CodeCode Available	1
3DFlowAction: Learning Cross-Embodiment Manipulation from 3D Flow World Model	Jun 6, 2025	Optical Flow EstimationRobot Manipulation	CodeCode Available	1
Goal-Conditioned Imitation Learning using Score-based Diffusion Policies	Apr 5, 2023	DenoisingImitation Learning	CodeCode Available	1
Generating Annotated Training Data for 6D Object Pose Estimation in Operational Environments with Minimal User Interaction	Mar 17, 2021	6D Pose Estimation using RGBPose Estimation	CodeCode Available	1

Show:10 25 50

← PrevPage 3 of 18Next →

All datasets CALVIN RLBench SimplerEnv-Google Robot MimicGen SimplerEnv-Widow X

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DreamVLA	avg. sequence length (D to D)	4.44	—	Unverified
2	VPP	avg. sequence length (D to D)	4.29	—	Unverified
3	RoboVLMs	avg. sequence length (D to D)	4.25	—	Unverified
4	Openhelix	avg. sequence length (D to D)	4.08	—	Unverified
5	UP-VLA	avg. sequence length (D to D)	4.08	—	Unverified
6	GR-MG	avg. sequence length (D to D)	4.04	—	Unverified
7	MoDE	avg. sequence length (D to D)	4.01	—	Unverified
8	RoboUniView	avg. sequence length (D to D)	3.86	—	Unverified
9	UniVLA	avg. sequence length (D to D)	3.8	—	Unverified
10	RoboDual	avg. sequence length (D to D)	3.66	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	EquAct	Succ. Rate (18 tasks, 100 demo/task)	89.4	—	Unverified
2	SAM2Act	Succ. Rate (18 tasks, 100 demo/task)	86.8	—	Unverified
3	ARP+	Succ. Rate (18 tasks, 100 demo/task)	84.9	—	Unverified
4	3D-LOTUS	Succ. Rate (18 tasks, 100 demo/task)	83.1	—	Unverified
5	RVT-2	Succ. Rate (18 tasks, 100 demo/task)	81.4	—	Unverified
6	3D Diffuser Actor	Succ. Rate (18 tasks, 100 demo/task)	81.3	—	Unverified
7	Mini Diffuser	Succ. Rate (18 tasks, 100 demo/task)	77.6	—	Unverified
8	SAM-E	Succ. Rate (18 tasks, 100 demo/task)	70.6	—	Unverified
9	Auto-λ	Succ. Rate (10 tasks, 100 demos/task)	69.3	—	Unverified
10	Act3D	Succ. Rate (18 tasks, 100 demo/task)	65	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SoFar	Visual Matching	0.75	—	Unverified
2	SpatialVLA	Visual Matching	0.72	—	Unverified
3	Dita-300M	Visual Matching	0.69	—	Unverified
4	RT-2-X	Visual Matching	0.61	—	Unverified
5	RoboVLM	Visual Matching	0.56	—	Unverified
6	RT-1-X	Visual Matching	0.53	—	Unverified
7	TraceVLA	Visual Matching	0.46	—	Unverified
8	OpenVLA	Visual Matching	0.28	—	Unverified
9	Octo-Base	Visual Matching	0.17	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SDP	Succ. Rate (12 tasks, 100 demo/task)	76	—	Unverified
2	EquiDiff (Voxel)	Succ. Rate (12 tasks, 100 demo/task)	63.9	—	Unverified
3	EquiDiff (Image)	Succ. Rate (12 tasks, 100 demo/task)	53.7	—	Unverified
4	DP (Evaluated in EquiDiff)	Succ. Rate (12 tasks, 100 demo/task)	42	—	Unverified
5	DP3 (Evaluated in EquiDiff)	Succ. Rate (12 tasks, 100 demo/task)	23.9	—	Unverified
6	BC RNN (Evaluated in EquiDiff)	Succ. Rate (12 tasks, 100 demo/task)	22.9	—	Unverified
7	ACT (Evaluated in EquiDiff)	Succ. Rate (12 tasks, 100 demo/task)	21.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	SoFar	Average	0.58	—	Unverified
2	SpatialVLA	Average	0.34	—	Unverified
3	Octo-Small	Average	0.3	—	Unverified
4	Octo-Base	Average	0.16	—	Unverified
5	RoboVLM	Average	0.14	—	Unverified
6	RT-1-X	Average	0.01	—	Unverified
7	OpenVLA	Average	0.01	—	Unverified