Autonomous Driving

Autonomous driving is the task of driving a vehicle without human conduction.

Many of the state-of-the-art results can be found at more general task pages such as 3D Object Detection and Semantic Segmentation.

(Image credit: Exploring the Limitations of Behavior Cloning for Autonomous Driving)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 501–550 of 6092 papers

Title	Date	Tasks	Status	Hype
TUMTraffic-VideoQA: A Benchmark for Unified Spatio-Temporal Video Understanding in Traffic Scenes	Feb 4, 2025	Autonomous DrivingMultiple-choice	CodeCode Available	1
Event-aided Semantic Scene Completion	Feb 4, 2025	Autonomous DrivingScene Understanding	CodeCode Available	1
SimBEV: A Synthetic Multi-Task Multi-Sensor Driving Data Generation Tool and Dataset	Feb 4, 2025	3D Object DetectionAutonomous Driving	CodeCode Available	1
TransRAD: Retentive Vision Transformer for Enhanced Radar Object Detection	Jan 29, 2025	Autonomous Drivingobject-detection	CodeCode Available	1
SliceOcc: Indoor 3D Semantic Occupancy Prediction with Vertical Slice Representation	Jan 28, 2025	3D Semantic Occupancy PredictionAutonomous Driving	CodeCode Available	1
Dream to Drive with Predictive Individual World Model	Jan 28, 2025	Autonomous Drivingmodel	CodeCode Available	1
MetaOcc: Surround-View 4D Radar and Camera Fusion Framework for 3D Occupancy Prediction with Dual Training Strategies	Jan 26, 2025	Autonomous DrivingPrediction	CodeCode Available	1
3DLabelProp: Geometric-Driven Domain Generalization for LiDAR Semantic Segmentation in Autonomous Driving	Jan 24, 2025	Autonomous DrivingDomain Generalization	CodeCode Available	1
A Survey of World Models for Autonomous Driving	Jan 20, 2025	Anomaly DetectionAutonomous Driving	CodeCode Available	1
DSTIGCN: Deformable Spatial-Temporal Interaction Graph Convolution Network for Pedestrian Trajectory Prediction	Jan 16, 2025	Autonomous DrivingPedestrian Trajectory Prediction	CodeCode Available	1
LEO: Boosting Mixture of Vision Encoders for Multimodal Large Language Models	Jan 13, 2025	Autonomous Driving	CodeCode Available	1
AD-L-JEPA: Self-Supervised Spatial World Models with Joint Embedding Predictive Architecture for Autonomous Driving with LiDAR Data	Jan 9, 2025	3D Object DetectionAutonomous Driving	CodeCode Available	1
Implicit Guidance and Explicit Representation of Semantic Information in Points Cloud: A Survey	Jan 7, 2025	ArticlesAutonomous Driving	CodeCode Available	1
RadarNeXt: Real-Time and Reliable 3D Object Detector Based On 4D mmWave Imaging Radar	Jan 4, 2025	3D Object Detection3D Object Detection (RoI)	CodeCode Available	1
Pseudo Visible Feature Fine-Grained Fusion for Thermal Object Detection	Jan 1, 2025	Autonomous DrivingMamba	CodeCode Available	1
PIDLoc: Cross-View Pose Optimization Network Inspired by PID Controllers	Jan 1, 2025	Autonomous DrivingPose Estimation	CodeCode Available	1
OmniStereo: Real-time Omnidireactional Depth Estimation with Multiview Fisheye Cameras	Jan 1, 2025	Autonomous DrivingDepth Estimation	CodeCode Available	1
TiGDistill-BEV: Multi-view BEV 3D Object Detection via Target Inner-Geometry Learning Distillation	Dec 30, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	1
DriveEditor: A Unified 3D Information-Guided Framework for Controllable Object Editing in Driving Scenes	Dec 27, 2024	Autonomous DrivingNovel View Synthesis	CodeCode Available	1
Generating Traffic Scenarios via In-Context Learning to Learn Better Motion Planner	Dec 24, 2024	Autonomous DrivingDataset Generation	CodeCode Available	1
Pre-training a Density-Aware Pose Transformer for Robust LiDAR-based 3D Human Pose Estimation	Dec 18, 2024	3D Human Pose EstimationAutonomous Driving	CodeCode Available	1
DriveTester: A Unified Platform for Simulation-Based Autonomous Driving Testing	Dec 17, 2024	Autonomous Driving	CodeCode Available	1
ViPOcc: Leveraging Visual Priors from Vision Foundation Models for Single-View 3D Occupancy Prediction	Dec 15, 2024	Autonomous DrivingDepth Estimation	CodeCode Available	1
WiseAD: Knowledge Augmented End-to-End Autonomous Driving with Vision-Language Model	Dec 13, 2024	Autonomous DrivingDecision Making	CodeCode Available	1
Towards Flexible 3D Perception: Object-Centric Occupancy Completion Augments 3D Object Detection	Dec 6, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	1
COOOL: Challenge Of Out-Of-Label A Novel Benchmark for Autonomous Driving	Dec 6, 2024	Anomaly DetectionAutonomous Driving	CodeCode Available	1
MVCTrack: Boosting 3D Point Cloud Tracking via Multimodal-Guided Virtual Cues	Dec 3, 2024	3D Single Object TrackingAutonomous Driving	CodeCode Available	1
Trajectory-based Road Autolabeling with Lidar-Camera Fusion in Winter Conditions	Dec 3, 2024	Autonomous DrivingRoad Segmentation	CodeCode Available	1
SEED4D: A Synthetic Ego--Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark	Dec 1, 2024	2k4D reconstruction	CodeCode Available	1
A Multi-Loss Strategy for Vehicle Trajectory Prediction: Combining Off-Road, Diversity, and Directional Consistency Losses	Nov 29, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
From Open Vocabulary to Open World: Teaching Vision Language Models to Detect Novel Objects	Nov 27, 2024	Autonomous DrivingObject	CodeCode Available	1
WHALES: A Multi-agent Scheduling Dataset for Enhanced Cooperation in Autonomous Driving	Nov 20, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
Robust 3D Semantic Occupancy Prediction with Calibration-free Spatial Transformation	Nov 19, 2024	3D Semantic Occupancy PredictionAutonomous Driving	CodeCode Available	1
ALOcc: Adaptive Lifting-based 3D Semantic Occupancy and Cost Volume-based Flow Prediction	Nov 12, 2024	3D Semantic Occupancy PredictionAutonomous Driving	CodeCode Available	1
Large-scale moral machine experiment on large language models	Nov 11, 2024	Autonomous DrivingComputational Efficiency	CodeCode Available	1
LSSInst: Improving Geometric Modeling in LSS-Based BEV Perception with Instance Representation	Nov 9, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	1
IGDrivSim: A Benchmark for the Imitation Gap in Autonomous Driving	Nov 7, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
Learning Multiple Initial Solutions to Optimization Problems	Nov 4, 2024	Autonomous Driving	CodeCode Available	1
ROAD-Waymo: Action Awareness at Scale for Autonomous Driving	Nov 3, 2024	Autonomous DrivingBenchmarking	CodeCode Available	1
Polar R-CNN: End-to-End Lane Detection with Fewer Anchors	Nov 3, 2024	Autonomous DrivingLane Detection	CodeCode Available	1
An Efficient Approach to Generate Safe Drivable Space by LiDAR-Camera-HDmap Fusion	Oct 29, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
SpikMamba: When SNN meets Mamba in Event-based Human Action Recognition	Oct 22, 2024	Action RecognitionAutonomous Driving	CodeCode Available	1
Explainability of Point Cloud Neural Networks Using SMILE: Statistical Model-Agnostic Interpretability with Local Explanations	Oct 20, 2024	Autonomous Driving	CodeCode Available	1
Real-time Stereo-based 3D Object Detection for Streaming Perception	Oct 16, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	1
TEOcc: Radar-camera Multi-modal Occupancy Prediction via Temporal Enhancement	Oct 15, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	1
CAFuser: Condition-Aware Multimodal Fusion for Robust Semantic Perception of Driving Scenes	Oct 14, 2024	Autonomous DrivingPanoptic Segmentation	CodeCode Available	1
LoLI-Street: Benchmarking Low-Light Image Enhancement and Beyond	Oct 13, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	1
PRFusion: Toward Effective and Robust Multi-Modal Place Recognition with Image and Point Cloud Fusion	Oct 7, 2024	Autonomous Driving	CodeCode Available	1
Spatial-Temporal Multi-Cuts for Online Multiple-Camera Vehicle Tracking	Oct 3, 2024	Autonomous DrivingMulti-Object Tracking	CodeCode Available	1
Open3DTrack: Towards Open-Vocabulary 3D Multi-Object Tracking	Oct 2, 2024	3D Multi-Object TrackingAutonomous Driving	CodeCode Available	1

Show:10 25 50

← PrevPage 11 of 122Next →

All datasets CARLA Leaderboard Town05 Long Town05 Short

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ReasonNet	Driving Score	79.95	—	Unverified
2	InterFuser	Driving Score	76.18	—	Unverified
3	TCP	Driving Score	75.14	—	Unverified
4	TF++ WP	Driving Score	66.32	—	Unverified
5	Learning From All Vehicles (LAV)	Driving Score	61.85	—	Unverified
6	TransFuser	Driving Score	61.18	—	Unverified
7	TransFuser (Reproduced)	Driving Score	55.04	—	Unverified
8	TCP (Reproduced)	Driving Score	47.91	—	Unverified
9	Latent TransFuser	Driving Score	45.2	—	Unverified
10	GRIAD	Driving Score	36.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Geometric Fusion	RC	69.17	—	Unverified
2	TransFuser	RC	56.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Geometric Fusion	RC	86.91	—	Unverified
2	TransFuser	RC	78.41	—	Unverified