Computational Efficiency

Methods and optimizations to reduce the computational resources (e.g., time, memory, or power) needed for training and inference in models. This involves techniques that streamline processing, optimize algorithms, or leverage hardware to enhance performance without compromising accuracy.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 4891 papers

Title	Date	Tasks	Status	Hype
LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control	Jul 3, 2024	Computational EfficiencyFace Reenactment	CodeCode Available	11
TinyLlama: An Open-Source Small Language Model	Jan 4, 2024	Computational EfficiencyLanguage Modeling	CodeCode Available	11
Enhancing Fourier Neural Operators with Local Spatial Features	Mar 22, 2025	Computational Efficiency	CodeCode Available	7
Muon is Scalable for LLM Training	Feb 24, 2025	Computational Efficiency	CodeCode Available	7
Revisiting PCA for time series reduction in temporal dimension	Dec 27, 2024	Computational EfficiencyDimensionality Reduction	CodeCode Available	7
PromptWizard: Task-Aware Prompt Optimization Framework	May 28, 2024	Computational EfficiencyDiversity	CodeCode Available	7
VMamba: Visual State Space Model	Jan 18, 2024	Computational EfficiencyLanguage Modeling	CodeCode Available	7
Mamba: Linear-Time Sequence Modeling with Selective State Spaces	Dec 1, 2023	2D Pose EstimationCommon Sense Reasoning	CodeCode Available	6
U-Net v2: Rethinking the Skip Connections of U-Net for Medical Image Segmentation	Nov 29, 2023	Computational EfficiencyDecoder	CodeCode Available	6
RWKV: Reinventing RNNs for the Transformer Era	May 22, 2023	Computational EfficiencyNatural Language Inference	CodeCode Available	6
YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception	Jun 21, 2025	Computational Efficiencyobject-detection	CodeCode Available	5
Continuous Thought Machines	May 8, 2025	Computational EfficiencyQuestion Answering	CodeCode Available	5
Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts	Feb 27, 2025	Computational EfficiencyGPU	CodeCode Available	5
FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration	Jan 24, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos	Jan 21, 2025	Computational EfficiencyDepth Estimation	CodeCode Available	5
Exploring GLU Expansion Ratios: A Study of Structured Pruning in LLaMA-3.2 Models	Dec 26, 2024	Computational EfficiencyNetwork Pruning	CodeCode Available	5
MambaIRv2: Attentive State Space Restoration	Nov 22, 2024	Computational EfficiencyImage Restoration	CodeCode Available	5
CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion	Mar 8, 2024	Computational EfficiencyImage Generation	CodeCode Available	5
Partition Generative Modeling: Masked Modeling Without Masks	May 24, 2025	Computational EfficiencyLanguage Modeling	CodeCode Available	4
High-performance training and inference for deep equivariant interatomic potentials	Apr 22, 2025	Computational Efficiency	CodeCode Available	4
Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts	Sep 24, 2024	Computational EfficiencyMixture-of-Experts	CodeCode Available	4
On the limits of agency in agent-based models	Sep 14, 2024	Computational Efficiencycounterfactual	CodeCode Available	4
T-MAC: CPU Renaissance via Table Lookup for Low-Bit LLM Deployment on Edge	Jun 25, 2024	Computational EfficiencyCPU	CodeCode Available	4
RaDe-GS: Rasterizing Depth in Gaussian Splatting	Jun 3, 2024	Computational EfficiencyNovel View Synthesis	CodeCode Available	4
Universal and Extensible Language-Vision Models for Organ Segmentation and Tumor Detection from Abdominal Computed Tomography	May 28, 2024	Computational EfficiencyComputed Tomography (CT)	CodeCode Available	4
LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit	May 9, 2024	BenchmarkingComputational Efficiency	CodeCode Available	4
An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models	Mar 11, 2024	Computational EfficiencyVideo Understanding	CodeCode Available	4
Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation	Feb 7, 2024	Cardiac SegmentationComputational Efficiency	CodeCode Available	4
TRIPS: Trilinear Point Splatting for Real-Time Radiance Field Rendering	Jan 11, 2024	Computational EfficiencyNovel View Synthesis	CodeCode Available	4
RL4CO: an Extensive Reinforcement Learning for Combinatorial Optimization Benchmark	Jun 29, 2023	Combinatorial OptimizationComputational Efficiency	CodeCode Available	4
TorchRL: A data-driven decision-making library for PyTorch	Jun 1, 2023	Computational EfficiencyDecision Making	CodeCode Available	4
Vocos: Closing the gap between time-domain and Fourier-based neural vocoders for high-quality audio synthesis	Jun 1, 2023	Audio SynthesisComputational Efficiency	CodeCode Available	4
Hierarchically Coherent Multivariate Mixture Networks	May 11, 2023	Computational EfficiencyTime Series	CodeCode Available	4
A Convergent Single-Loop Algorithm for Relaxation of Gromov-Wasserstein in Graph Data	Mar 12, 2023	Computational Efficiency	CodeCode Available	4
AudioLDM: Text-to-Audio Generation with Latent Diffusion Models	Jan 29, 2023	AudioCapsAudio Generation	CodeCode Available	4
FourCastNet 3: A geometric approach to probabilistic machine-learning weather forecasting at scale	Jul 16, 2025	Computational EfficiencyGPU	CodeCode Available	3
NeuralOM: Neural Ocean Model for Subseasonal-to-Seasonal Simulation	May 27, 2025	Computational EfficiencyGraph Neural Network	CodeCode Available	3
TensorNEAT: A GPU-accelerated Library for NeuroEvolution of Augmenting Topologies	Apr 11, 2025	Computational EfficiencyGPU	CodeCode Available	3
GPU-accelerated Evolutionary Many-objective Optimization Using Tensorized NSGA-III	Apr 8, 2025	Computational EfficiencyCPU	CodeCode Available	3
WeatherMesh-3: Fast and accurate operational global weather forecasting	Mar 28, 2025	Computational EfficiencyGPU	CodeCode Available	3
Unlock Pose Diversity: Accurate and Efficient Implicit Keypoint-based Spatiotemporal Diffusion for Audio-driven Talking Portrait	Mar 17, 2025	Computational EfficiencyDiversity	CodeCode Available	3
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System	Mar 12, 2025	ChunkingComputational Efficiency	CodeCode Available	3
MetaDE: Evolving Differential Evolution by Differential Evolution	Feb 13, 2025	Computational EfficiencyGPU	CodeCode Available	3
FlashVideo:Flowing Fidelity to Detail for Efficient High-Resolution Video Generation	Feb 7, 2025	Computational EfficiencyText-to-Video Generation	CodeCode Available	3
CoverM: Read alignment statistics for metagenomics	Jan 20, 2025	Computational Efficiency	CodeCode Available	3
Dataset Distillation with Neural Characteristic Function: A Minmax Perspective	Jan 1, 2025	Computational EfficiencyDataset Distillation	CodeCode Available	3
A Survey on Inference Optimization Techniques for Mixture of Experts Models	Dec 18, 2024	Computational EfficiencyDistributed Computing	CodeCode Available	3
On the Efficiency of NLP-Inspired Methods for Tabular Deep Learning	Nov 26, 2024	Computational EfficiencyDeep Learning	CodeCode Available	3
Star Attention: Efficient LLM Inference over Long Sequences	Nov 26, 2024	Computational Efficiency	CodeCode Available	3
Nd-BiMamba2: A Unified Bidirectional Architecture for Multi-Dimensional Data Processing	Nov 22, 2024	Computational EfficiencyCPU	CodeCode Available	3

Show:10 25 50

← PrevPage 1 of 98Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ViTaL	Hamming Loss	0.05	—	Unverified