Computational Efficiency

Methods and optimizations to reduce the computational resources (e.g., time, memory, or power) needed for training and inference in models. This involves techniques that streamline processing, optimize algorithms, or leverage hardware to enhance performance without compromising accuracy.

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–50 of 4891 papers

Title	Date	Tasks	Status	Hype
TinyLlama: An Open-Source Small Language Model	Jan 4, 2024	Computational EfficiencyLanguage Modeling	CodeCode Available	11
LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control	Jul 3, 2024	Computational EfficiencyFace Reenactment	CodeCode Available	11
PromptWizard: Task-Aware Prompt Optimization Framework	May 28, 2024	Computational EfficiencyDiversity	CodeCode Available	7
Revisiting PCA for time series reduction in temporal dimension	Dec 27, 2024	Computational EfficiencyDimensionality Reduction	CodeCode Available	7
Enhancing Fourier Neural Operators with Local Spatial Features	Mar 22, 2025	Computational Efficiency	CodeCode Available	7
Muon is Scalable for LLM Training	Feb 24, 2025	Computational Efficiency	CodeCode Available	7
VMamba: Visual State Space Model	Jan 18, 2024	Computational EfficiencyLanguage Modeling	CodeCode Available	7
Mamba: Linear-Time Sequence Modeling with Selective State Spaces	Dec 1, 2023	2D Pose EstimationCommon Sense Reasoning	CodeCode Available	6
U-Net v2: Rethinking the Skip Connections of U-Net for Medical Image Segmentation	Nov 29, 2023	Computational EfficiencyDecoder	CodeCode Available	6
RWKV: Reinventing RNNs for the Transformer Era	May 22, 2023	Computational EfficiencyNatural Language Inference	CodeCode Available	6
MambaIRv2: Attentive State Space Restoration	Nov 22, 2024	Computational EfficiencyImage Restoration	CodeCode Available	5
Comet: Fine-grained Computation-communication Overlapping for Mixture-of-Experts	Feb 27, 2025	Computational EfficiencyGPU	CodeCode Available	5
YOLOv13: Real-Time Object Detection with Hypergraph-Enhanced Adaptive Visual Perception	Jun 21, 2025	Computational Efficiencyobject-detection	CodeCode Available	5
CogView3: Finer and Faster Text-to-Image Generation via Relay Diffusion	Mar 8, 2024	Computational EfficiencyImage Generation	CodeCode Available	5
Exploring GLU Expansion Ratios: A Study of Structured Pruning in LLaMA-3.2 Models	Dec 26, 2024	Computational EfficiencyNetwork Pruning	CodeCode Available	5
FireRedASR: Open-Source Industrial-Grade Mandarin Speech Recognition Models from Encoder-Decoder to LLM Integration	Jan 24, 2025	Automatic Speech RecognitionAutomatic Speech Recognition (ASR)	CodeCode Available	5
Continuous Thought Machines	May 8, 2025	Computational EfficiencyQuestion Answering	CodeCode Available	5
Video Depth Anything: Consistent Depth Estimation for Super-Long Videos	Jan 21, 2025	Computational EfficiencyDepth Estimation	CodeCode Available	5
A Convergent Single-Loop Algorithm for Relaxation of Gromov-Wasserstein in Graph Data	Mar 12, 2023	Computational Efficiency	CodeCode Available	4
T-MAC: CPU Renaissance via Table Lookup for Low-Bit LLM Deployment on Edge	Jun 25, 2024	Computational EfficiencyCPU	CodeCode Available	4
RaDe-GS: Rasterizing Depth in Gaussian Splatting	Jun 3, 2024	Computational EfficiencyNovel View Synthesis	CodeCode Available	4
LLMC: Benchmarking Large Language Model Quantization with a Versatile Compression Toolkit	May 9, 2024	BenchmarkingComputational Efficiency	CodeCode Available	4
AudioLDM: Text-to-Audio Generation with Latent Diffusion Models	Jan 29, 2023	AudioCapsAudio Generation	CodeCode Available	4
Mamba-UNet: UNet-Like Pure Visual Mamba for Medical Image Segmentation	Feb 7, 2024	Cardiac SegmentationComputational Efficiency	CodeCode Available	4
Vocos: Closing the gap between time-domain and Fourier-based neural vocoders for high-quality audio synthesis	Jun 1, 2023	Audio SynthesisComputational Efficiency	CodeCode Available	4
Universal and Extensible Language-Vision Models for Organ Segmentation and Tumor Detection from Abdominal Computed Tomography	May 28, 2024	Computational EfficiencyComputed Tomography (CT)	CodeCode Available	4
High-performance training and inference for deep equivariant interatomic potentials	Apr 22, 2025	Computational Efficiency	CodeCode Available	4
Hierarchically Coherent Multivariate Mixture Networks	May 11, 2023	Computational EfficiencyTime Series	CodeCode Available	4
Partition Generative Modeling: Masked Modeling Without Masks	May 24, 2025	Computational EfficiencyLanguage Modeling	CodeCode Available	4
On the limits of agency in agent-based models	Sep 14, 2024	Computational Efficiencycounterfactual	CodeCode Available	4
TorchRL: A data-driven decision-making library for PyTorch	Jun 1, 2023	Computational EfficiencyDecision Making	CodeCode Available	4
Time-MoE: Billion-Scale Time Series Foundation Models with Mixture of Experts	Sep 24, 2024	Computational EfficiencyMixture-of-Experts	CodeCode Available	4
TRIPS: Trilinear Point Splatting for Real-Time Radiance Field Rendering	Jan 11, 2024	Computational EfficiencyNovel View Synthesis	CodeCode Available	4
An Image is Worth 1/2 Tokens After Layer 2: Plug-and-Play Inference Acceleration for Large Vision-Language Models	Mar 11, 2024	Computational EfficiencyVideo Understanding	CodeCode Available	4
RL4CO: an Extensive Reinforcement Learning for Combinatorial Optimization Benchmark	Jun 29, 2023	Combinatorial OptimizationComputational Efficiency	CodeCode Available	4
On the Efficiency of NLP-Inspired Methods for Tabular Deep Learning	Nov 26, 2024	Computational EfficiencyDeep Learning	CodeCode Available	3
Effects of charging and discharging capabilities on trade-offs between model accuracy and computational efficiency in pumped thermal electricity storage	Nov 8, 2024	Computational Efficiency	CodeCode Available	3
EMCAD: Efficient Multi-scale Convolutional Attention Decoding for Medical Image Segmentation	May 11, 2024	Computational EfficiencyDecoder	CodeCode Available	3
NeuralOM: Neural Ocean Model for Subseasonal-to-Seasonal Simulation	May 27, 2025	Computational EfficiencyGraph Neural Network	CodeCode Available	3
MoC: Mixtures of Text Chunking Learners for Retrieval-Augmented Generation System	Mar 12, 2025	ChunkingComputational Efficiency	CodeCode Available	3
DUFOMap: Efficient Dynamic Awareness Mapping	Mar 3, 2024	Computational Efficiency	CodeCode Available	3
MAPE-PPI: Towards Effective and Efficient Protein-Protein Interaction Prediction via Microenvironment-Aware Protein Embedding	Feb 22, 2024	Computational EfficiencyPrediction	CodeCode Available	3
MetaDE: Evolving Differential Evolution by Differential Evolution	Feb 13, 2025	Computational EfficiencyGPU	CodeCode Available	3
Nd-BiMamba2: A Unified Bidirectional Architecture for Multi-Dimensional Data Processing	Nov 22, 2024	Computational EfficiencyCPU	CodeCode Available	3
CoverM: Read alignment statistics for metagenomics	Jan 20, 2025	Computational Efficiency	CodeCode Available	3
HyperSIGMA: Hyperspectral Intelligence Comprehension Foundation Model	Jun 17, 2024	Computational EfficiencyEarth Observation	CodeCode Available	3
Consistency Models Made Easy	Jun 20, 2024	Computational EfficiencyGPU	CodeCode Available	3
Human-like Episodic Memory for Infinite Context LLMs	Jul 12, 2024	Computational EfficiencyEvent Segmentation	CodeCode Available	3
Is Mamba Effective for Time Series Forecasting?	Mar 17, 2024	Computational EfficiencyMamba	CodeCode Available	3
GSFusion: Online RGB-D Mapping Where Gaussian Splatting Meets TSDF Fusion	Aug 22, 2024	Computational Efficiency	CodeCode Available	3

Show:10 25 50

← PrevPage 1 of 98Next →

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	ViTaL	Hamming Loss	0.05	—	Unverified