Autonomous Driving

Autonomous driving is the task of driving a vehicle without human conduction.

Many of the state-of-the-art results can be found at more general task pages such as 3D Object Detection and Semantic Segmentation.

(Image credit: Exploring the Limitations of Behavior Cloning for Autonomous Driving)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 151–200 of 6092 papers

Title	Date	Tasks	Status	Hype
FlexCloud: Direct, Modular Georeferencing and Drift-Correction of Point Cloud Maps	Feb 1, 2025	Autonomous Drivingmotion prediction	CodeCode Available	2
STAMP: Scalable Task And Model-agnostic Collaborative Perception	Jan 24, 2025	Autonomous Driving	CodeCode Available	2
GS-LiDAR: Generating Realistic LiDAR Point Clouds with Panoramic Gaussian Splatting	Jan 22, 2025	Autonomous DrivingNeRF	CodeCode Available	2
Generative Planning with 3D-vision Language Pre-training for End-to-End Autonomous Driving	Jan 15, 2025	Autonomous DrivingTrajectory Planning	CodeCode Available	2
LeapVAD: A Leap in Autonomous Driving via Cognitive Perception and Dual-Process Thinking	Jan 14, 2025	Autonomous DrivingDecision Making	CodeCode Available	2
Online Video Understanding: OVBench and VideoChat-Online	Dec 31, 2024	Autonomous DrivingQuestion Answering	CodeCode Available	2
Mapping the Mind of an Instruction-based Image Editing using SMILE	Dec 20, 2024	Autonomous Driving	CodeCode Available	2
AutoTrust: Benchmarking Trustworthiness in Large Vision Language Models for Autonomous Driving	Dec 19, 2024	Autonomous DrivingBenchmarking	CodeCode Available	2
Joint Perception and Prediction for Autonomous Driving: A Survey	Dec 18, 2024	Autonomous Drivingmotion prediction	CodeCode Available	2
DINO-Foresight: Looking into the Future with DINO	Dec 16, 2024	Autonomous DrivingScene Understanding	CodeCode Available	2
HGSFusion: Radar-Camera Fusion with Hybrid Generation and Synchronization for 3D Object Detection	Dec 16, 2024	3D Object Detection3D Object Detection on View-of-Delft (val)	CodeCode Available	2
GEM: A Generalizable Ego-Vision Multimodal World Model for Fine-Grained Ego-Motion, Object Dynamics, and Scene Composition Control	Dec 15, 2024	Autonomous Driving	CodeCode Available	2
GaussianWorld: Gaussian World Model for Streaming 3D Occupancy Prediction	Dec 13, 2024	Autonomous DrivingPrediction	CodeCode Available	2
GaussianAD: Gaussian-Centric End-to-End Autonomous Driving	Dec 13, 2024	Autonomous DrivingDecision Making	CodeCode Available	2
Doe-1: Closed-Loop Autonomous Driving with Large World Model	Dec 12, 2024	Autonomous DrivingDecision Making	CodeCode Available	2
DrivingRecon: Large 4D Gaussian Reconstruction Model For Autonomous Driving	Dec 12, 2024	4D reconstructionAutonomous Driving	CodeCode Available	2
GPD-1: Generative Pre-training for Driving	Dec 11, 2024	Autonomous DrivingDecision Making	CodeCode Available	2
DriveMM: All-in-One Large Multimodal Model for Autonomous Driving	Dec 10, 2024	AllAutonomous Driving	CodeCode Available	2
Driv3R: Learning Dense 4D Reconstruction for Autonomous Driving	Dec 9, 2024	4D reconstructionAutonomous Driving	CodeCode Available	2
Stag-1: Towards Realistic 4D Driving Simulation with Video Generation Model	Dec 6, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	2
SADG: Segment Any Dynamic Gaussian Without Object Trackers	Nov 28, 2024	3D ReconstructionAutonomous Driving	CodeCode Available	2
OpenAD: Open-World Autonomous Driving Benchmark for 3D Object Detection	Nov 26, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
Monocular Lane Detection Based on Deep Learning: A Survey	Nov 25, 2024	3D Lane DetectionAutonomous Driving	CodeCode Available	2
Towards Satellite Image Road Graph Extraction: A Global-Scale Dataset and A Novel Method	Nov 23, 2024	Autonomous Driving	CodeCode Available	2
DriveMLLM: A Benchmark for Spatial Understanding with Multimodal Large Language Models in Autonomous Driving	Nov 20, 2024	Autonomous Drivingmotion prediction	CodeCode Available	2
GaussianPretrain: A Simple Unified 3D Gaussian Representation for Visual Pre-training in Autonomous Driving	Nov 19, 2024	3D Object DetectionAutonomous Driving	CodeCode Available	2
Motif Channel Opened in a White-Box: Stereo Matching via Motif Correlation Graph	Nov 19, 2024	Autonomous DrivingStereo Matching	CodeCode Available	2
DrivingSphere: Building a High-fidelity 4D World for Closed-loop Simulation	Nov 18, 2024	Autonomous DrivingDecision Making	CodeCode Available	2
On Deep Learning for Geometric and Semantic Scene Understanding Using On-Vehicle 3D LiDAR	Nov 1, 2024	3D Semantic SegmentationAutonomous Driving	CodeCode Available	2
CARLA2Real: a tool for reducing the sim2real gap in CARLA simulator	Oct 23, 2024	Autonomous DrivingSelf-Driving Cars	CodeCode Available	2
UniDrive: Towards Universal Driving Perception Across Camera Configurations	Oct 17, 2024	Autonomous Driving	CodeCode Available	2
WeatherDG: LLM-assisted Diffusion Model for Procedural Weather Generation in Domain-Generalized Semantic Segmentation	Oct 15, 2024	Autonomous DrivingLanguage Modeling	CodeCode Available	2
BEVLoc: Cross-View Localization and Matching via Birds-Eye-View Synthesis	Oct 8, 2024	Autonomous DrivingContrastive Learning	CodeCode Available	2
DeMo: Decoupling Motion Forecasting into Directional Intentions and Dynamic States	Oct 8, 2024	Autonomous DrivingMamba	CodeCode Available	2
Motion Forecasting in Continuous Driving	Oct 8, 2024	Autonomous DrivingMotion Forecasting	CodeCode Available	2
GSPR: Multimodal Place Recognition Using 3D Gaussian Splatting for Autonomous Driving	Oct 1, 2024	Autonomous DrivingAutonomous Vehicles	CodeCode Available	2
DAOcc: 3D Object Detection Assisted Multi-Sensor Fusion for 3D Occupancy Prediction	Sep 30, 2024	3D Object Detection3D Semantic Occupancy Prediction	CodeCode Available	2
Learning Multiple Probabilistic Decisions from Latent World Model in Autonomous Driving	Sep 24, 2024	Autonomous DrivingImitation Learning	CodeCode Available	2
OPUS: Occupancy Prediction Using a Sparse Set	Sep 14, 2024	Autonomous DrivingPrediction	CodeCode Available	2
MiniDrive: More Efficient Vision-Language Models with Multi-Level 2D Features as Text Tokens for Autonomous Driving	Sep 11, 2024	Autonomous DrivingFeature Engineering	CodeCode Available	2
A Comprehensive Survey on Evidential Deep Learning and Its Applications	Sep 7, 2024	Autonomous DrivingDeep Learning	CodeCode Available	2
AllWeatherNet:Unified Image Enhancement for Autonomous Driving under Adverse Weather and Lowlight-conditions	Sep 3, 2024	Autonomous DrivingDeep Attention	CodeCode Available	2
Make Your ViT-based Multi-view 3D Detectors Faster via Token Compression	Sep 1, 2024	Autonomous Driving	CodeCode Available	2
Enhancing Vectorized Map Perception with Historical Rasterized Maps	Sep 1, 2024	Autonomous Driving	CodeCode Available	2
UTrack: Multi-Object Tracking with Uncertain Detections	Aug 30, 2024	Autonomous DrivingMulti-Object Tracking	CodeCode Available	2
RoboSense: Large-scale Dataset and Benchmark for Egocentric Robot Perception and Navigation in Crowded and Unstructured Environments	Aug 28, 2024	Autonomous DrivingAutonomous Navigation	CodeCode Available	2
Drone-assisted Road Gaussian Splatting with Cross-view Uncertainty	Aug 27, 2024	Autonomous DrivingNeural Rendering	CodeCode Available	2
TripleMixer: A 3D Point Cloud Denoising Model for Adverse Weather	Aug 25, 2024	Autonomous DrivingDenoising	CodeCode Available	2
MART: MultiscAle Relational Transformer Networks for Multi-agent Trajectory Prediction	Jul 31, 2024	Autonomous DrivingPrediction	CodeCode Available	2
Multi-Agent Trajectory Prediction with Difficulty-Guided Feature Enhancement Network	Jul 26, 2024	Autonomous DrivingDecoder	CodeCode Available	2

Show:10 25 50

← PrevPage 4 of 122Next →

All datasets CARLA Leaderboard Town05 Long Town05 Short

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ReasonNet	Driving Score	79.95	—	Unverified
2	InterFuser	Driving Score	76.18	—	Unverified
3	TCP	Driving Score	75.14	—	Unverified
4	TF++ WP	Driving Score	66.32	—	Unverified
5	Learning From All Vehicles (LAV)	Driving Score	61.85	—	Unverified
6	TransFuser	Driving Score	61.18	—	Unverified
7	TransFuser (Reproduced)	Driving Score	55.04	—	Unverified
8	TCP (Reproduced)	Driving Score	47.91	—	Unverified
9	Latent TransFuser	Driving Score	45.2	—	Unverified
10	GRIAD	Driving Score	36.79	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Geometric Fusion	RC	69.17	—	Unverified
2	TransFuser	RC	56.36	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Geometric Fusion	RC	86.91	—	Unverified
2	TransFuser	RC	78.41	—	Unverified