Long-range modeling

A new task for testing the long-sequence modeling capabilities and efficiency of language models.

Image credit: SCROLLS: Standardized CompaRison Over Long Language Sequences

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1–25 of 95 papers

Title	Date	Tasks	Status	Hype
Mamba: Linear-Time Sequence Modeling with Selective State Spaces	Dec 1, 2023	2D Pose EstimationCommon Sense Reasoning	CodeCode Available	6
MedMamba: Vision Mamba for Medical Image Classification	Mar 6, 2024	Classificationimage-classification	CodeCode Available	4
MambaAD: Exploring State Space Models for Multi-class Unsupervised Anomaly Detection	Apr 9, 2024	Anomaly DetectionDecoder	CodeCode Available	3
LION: Linear Group RNN for 3D Object Detection in Point Clouds	Jul 25, 2024	3D Object DetectionLong-range modeling	CodeCode Available	3
Investigating Efficiently Extending Transformers for Long Input Summarization	Aug 8, 2022	16kLong-range modeling	CodeCode Available	3
MambaVC: Learned Visual Compression with Selective State Spaces	May 24, 2024	Long-range modelingState Space Models	CodeCode Available	2
TaskExpert: Dynamically Assembling Multi-Task Representations with Memorial Mixture-of-Experts	Jul 28, 2023	Long-range modelingMixture-of-Experts	CodeCode Available	2
DVMSR: Distillated Vision Mamba for Efficient Super-Resolution	May 5, 2024	Image Super-ResolutionLong-range modeling	CodeCode Available	2
nnMamba: 3D Biomedical Image Segmentation, Classification and Landmark Detection with State Space Model	Feb 5, 2024	3D Medical Imaging SegmentationImage Segmentation	CodeCode Available	2
Emulating Self-attention with Convolution for Efficient Image Super-Resolution	Mar 9, 2025	Computational EfficiencyImage Super-Resolution	CodeCode Available	2
PoseMamba: Monocular 3D Human Pose Estimation with Bidirectional Global-Local Spatio-Temporal State Space Model	Aug 7, 2024	3D Human Pose EstimationLong-range modeling	CodeCode Available	2
MambaFusion: Height-Fidelity Dense Global Fusion for Multi-modal 3D Object Detection	Jul 6, 2025	3D Object DetectionAttribute	CodeCode Available	2
Liquid Structural State-Space Models	Sep 26, 2022	Heart rate estimationLong-range modeling	CodeCode Available	2
Mega: Moving Average Equipped Gated Attention	Sep 21, 2022	Image ClassificationInductive Bias	CodeCode Available	2
LKM-UNet: Large Kernel Vision Mamba UNet for Medical Image Segmentation	Mar 12, 2024	Image SegmentationLong-range modeling	CodeCode Available	2
MambaMorph: a Mamba-based Framework for Medical MR-CT Deformable Registration	Jan 25, 2024	Computed Tomography (CT)Image Registration	CodeCode Available	2
Simplified State Space Layers for Sequence Modeling	Aug 9, 2022	Computational EfficiencyListOps	CodeCode Available	2
Hungry Hungry Hippos: Towards Language Modeling with State Space Models	Dec 28, 2022	8kCoreference Resolution	CodeCode Available	2
Classification of Long Sequential Data using Circular Dilated Convolutional Neural Networks	Jan 6, 2022	Audio ClassificationClassification	CodeCode Available	1
ChordMixer: A Scalable Neural Attention Model for Sequences with Different Lengths	Jun 12, 2022	ChunkingDocument Classification	CodeCode Available	1
Adapting Pretrained Text-to-Text Models for Long Text Sequences	Sep 21, 2022	Long-range modelingQuestion Answering	CodeCode Available	1
Efficient Long-Text Understanding with Short-Text Models	Aug 1, 2022	ArticlesDecoder	CodeCode Available	1
CAB: Comprehensive Attention Benchmarking on Long Sequence Modeling	Oct 14, 2022	BenchmarkingLanguage Modeling	CodeCode Available	1
Fourier Transformer: Fast Long Range Modeling by Removing Sequence Redundancy with FFT Operator	May 24, 2023	Abstractive Text SummarizationDocument Summarization	CodeCode Available	1
Long Range Arena: A Benchmark for Efficient Transformers	Nov 8, 2020	16kBenchmarking	CodeCode Available	1

Show:10 25 50

← PrevPage 1 of 4Next →

No leaderboard results yet.