Long-range modeling

A new task for testing the long-sequence modeling capabilities and efficiency of language models.

Image credit: SCROLLS: Standardized CompaRison Over Long Language Sequences

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 51–95 of 95 papers

Title	Date	Tasks	Status	Hype
Image Super-Resolution With Non-Local Sparse Attention	Jun 19, 2021	Image Super-ResolutionLong-range modeling	CodeCode Available	1
DSANet: Dynamic Segment Aggregation Network for Video-Level Representation Learning	May 25, 2021	Action RecognitionLong-range modeling	CodeCode Available	1
Long Range Arena: A Benchmark for Efficient Transformers	Nov 8, 2020	16kBenchmarking	CodeCode Available	1
Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition	Mar 31, 2020	3D Action RecognitionAction Recognition	CodeCode Available	1
V4D:4D Convolutional Neural Networks for Video-level Representation Learning	Feb 18, 2020	Long-range modelingRepresentation Learning	CodeCode Available	1
LaCache: Ladder-Shaped KV Caching for Efficient Long-Context Modeling of Large Language Models	Jul 14, 2025	Long-range modeling	CodeCode Available	0
Med-URWKV: Pure RWKV With ImageNet Pre-training For Medical Image Segmentation	Jun 12, 2025	Image SegmentationLong-range modeling	—Unverified	0
M2Restore: Mixture-of-Experts-based Mamba-CNN Fusion Framework for All-in-One Image Restoration	Jun 9, 2025	AllImage Restoration	—Unverified	0
CDPDNet: Integrating Text Guidance with Hybrid Vision Encoders for Medical Image Segmentation	May 25, 2025	Image SegmentationLong-range modeling	CodeCode Available	0
Hybrid-Emba3D: Geometry-Aware and Cross-Path Feature Hybrid Enhanced State Space Model for Point Cloud Classification	May 16, 2025	Long-range modelingMamba	CodeCode Available	0
ZipIR: Latent Pyramid Diffusion Transformer for High-Resolution Image Restoration	Apr 11, 2025	2kImage Restoration	—Unverified	0
vGamba: Attentive State Space Bottleneck for efficient Long-range Dependencies in Visual Recognition	Mar 27, 2025	Computational EfficiencyLong-range modeling	CodeCode Available	0
An Uncertainty Principle for Linear Recurrent Neural Networks	Feb 13, 2025	Long-range modeling	—Unverified	0
Is Long Range Sequential Modeling Necessary For Colorectal Tumor Segmentation?	Feb 10, 2025	Image SegmentationLong-range modeling	—Unverified	0
ReGNet: Reciprocal Space-Aware Long-Range Modeling for Crystalline Property Prediction	Feb 4, 2025	Computational EfficiencyLong-range modeling	—Unverified	0
Exploring Historical Information for RGBE Visual Tracking with Mamba	Jan 1, 2025	DecoderLong-range modeling	—Unverified	0
MambaXCTrack: Mamba-based Tracker with SSM Cross-correlation and Motion Prompt for Ultrasound Needle Tracking	Nov 13, 2024	Inductive BiasLong-range modeling	—Unverified	0
S7: Selective and Simplified State Space Layers for Sequence Modeling	Oct 4, 2024	Computational EfficiencyLong-range modeling	—Unverified	0
Shuffle Mamba: State Space Models with Random Shuffle for Multi-Modal Image Fusion	Sep 3, 2024	Long-range modelingMamba	—Unverified	0
Pose Magic: Efficient and Temporally Consistent Human Pose Estimation with a Hybrid Mamba-GCN Network	Aug 6, 2024	3D Human Pose EstimationComputational Efficiency	—Unverified	0
Short-Long Convolutions Help Hardware-Efficient Linear Attention to Focus on Long Sequences	Jun 12, 2024	Language ModelingLanguage Modelling	—Unverified	0
SMR: State Memory Replay for Long Sequence Modeling	May 27, 2024	Language ModelingLanguage Modelling	—Unverified	0
MambaLLIE: Implicit Retinex-Aware Low Light Enhancement with Global-then-Local State Space	May 25, 2024	Image EnhancementLong-range modeling	—Unverified	0
RS3Mamba: Visual State Space Model for Remote Sensing Images Semantic Segmentation	Apr 3, 2024	Long-range modelingMamba	—Unverified	0
Part Representation Learning with Teacher-Student Decoder for Occluded Person Re-identification	Dec 15, 2023	DecoderHuman Parsing	CodeCode Available	0
Dimension Mixer: Group Mixing of Input Dimensions for Efficient Function Approximation	Nov 30, 2023	Long-range modeling	CodeCode Available	0
Advancing Regular Language Reasoning in Linear Recurrent Neural Networks	Sep 14, 2023	Language ModellingLong-range modeling	CodeCode Available	0
Improving FHB Screening in Wheat Breeding Using an Efficient Transformer Model	Aug 7, 2023	Image SegmentationLong-range modeling	—Unverified	0
AICT: An Adaptive Image Compression Transformer	Jul 12, 2023	DecoderImage Compression	—Unverified	0
Focus Your Attention (with Adaptive IIR Filters)	May 24, 2023	Language ModellingLong-range modeling	—Unverified	0
A General-Purpose Multilingual Document Encoder	May 11, 2023	Cross-Lingual TransferDocument Classification	CodeCode Available	0
RFR-WWANet: Weighted Window Attention-Based Recovery Feature Resolution Network for Unsupervised Image Registration	May 7, 2023	Computational EfficiencyImage Registration	CodeCode Available	0
HST-MRF: Heterogeneous Swin Transformer with Multi-Receptive Field for Medical Image Segmentation	Apr 10, 2023	Image SegmentationLesion Segmentation	—Unverified	0
CoLT5: Faster Long-Range Transformers with Conditional Computation	Mar 17, 2023	Long-range modeling	—Unverified	0
Token Transformer: Can class token help window-based transformer build better long-range interactions?	Nov 11, 2022	image-classificationImage Classification	—Unverified	0
Pose Guided Human Image Synthesis with Partially Decoupled GAN	Oct 7, 2022	DecoderImage Generation	—Unverified	0
CNSNet: A Cleanness-Navigated-Shadow Network for Shadow Removal	Sep 6, 2022	Long-range modelingShadow Removal	CodeCode Available	0
How to Train Your HiPPO: State Space Models with Generalized Orthogonal Basis Projections	Jun 24, 2022	Long-range modelingState Space Models	—Unverified	0
On the Parameterization and Initialization of Diagonal State Space Models	Jun 23, 2022	Long-range modelingState Space Models	—Unverified	0
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0
Diagonal State Spaces are as Effective as Structured State Spaces	Mar 27, 2022	Long-range modeling	—Unverified	0
Dyadformer: A Multi-modal Transformer for Long-Range Modeling of Dyadic Interactions	Sep 20, 2021	Long-range modeling	—Unverified	0
Long-Range Modeling of Source Code Files with eWASH: Extended Window Access by Syntax Hierarchy	Sep 17, 2021	Code CompletionCode Generation	—Unverified	0
Sparse Factorization of Large Square Matrices	Sep 16, 2021	Long-range modeling	CodeCode Available	0
Gated Relational Graph Attention Networks	Jan 1, 2021	Graph AttentionLong-range modeling	—Unverified	0

Show:10 25 50

← PrevPage 2 of 2Next →

No leaderboard results yet.