Long-range modeling

A new task for testing the long-sequence modeling capabilities and efficiency of language models.

Image credit: SCROLLS: Standardized CompaRison Over Long Language Sequences

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–95 of 95 papers

Title	Date	Tasks	Status	Hype
How to Train Your HiPPO: State Space Models with Generalized Orthogonal Basis Projections	Jun 24, 2022	Long-range modelingState Space Models	CodeCode Available	0
On the Parameterization and Initialization of Diagonal State Space Models	Jun 23, 2022	Long-range modelingState Space Models	CodeCode Available	0
0/1 Deep Neural Networks via Block Coordinate Descent	Jun 19, 2022	10-shot image generation	—Unverified	0
ChordMixer: A Scalable Neural Attention Model for Sequences with Different Lengths	Jun 12, 2022	ChunkingDocument Classification	CodeCode Available	1
UL2: Unifying Language Learning Paradigms	May 10, 2022	Arithmetic ReasoningCommon Sense Reasoning	CodeCode Available	1
Paramixer: Parameterizing Mixing Links in Sparse Factors Works Better than Dot-Product Self-Attention	Apr 22, 2022	Long-range modeling	CodeCode Available	1
Diagonal State Spaces are as Effective as Structured State Spaces	Mar 27, 2022	Long-range modeling	CodeCode Available	0
SCROLLS: Standardized CompaRison Over Long Language Sequences	Jan 10, 2022	DecoderLong-range modeling	CodeCode Available	1
Classification of Long Sequential Data using Circular Dilated Convolutional Neural Networks	Jan 6, 2022	Audio ClassificationClassification	CodeCode Available	1
LongT5: Efficient Text-To-Text Transformer for Long Sequences	Dec 15, 2021	Abstractive Text SummarizationLong-range modeling	CodeCode Available	1
Efficiently Modeling Long Sequences with Structured State Spaces	Oct 31, 2021	Data AugmentationLanguage Modeling	CodeCode Available	1
Dyadformer: A Multi-modal Transformer for Long-Range Modeling of Dyadic Interactions	Sep 20, 2021	Long-range modeling	—Unverified	0
Long-Range Modeling of Source Code Files with eWASH: Extended Window Access by Syntax Hierarchy	Sep 17, 2021	Code CompletionCode Generation	—Unverified	0
Sparse Factorization of Large Square Matrices	Sep 16, 2021	Long-range modeling	CodeCode Available	0
Image Super-Resolution With Non-Local Sparse Attention	Jun 19, 2021	Image Super-ResolutionLong-range modeling	CodeCode Available	1
DSANet: Dynamic Segment Aggregation Network for Video-Level Representation Learning	May 25, 2021	Action RecognitionLong-range modeling	CodeCode Available	1
Gated Relational Graph Attention Networks	Jan 1, 2021	Graph AttentionLong-range modeling	—Unverified	0
Long Range Arena: A Benchmark for Efficient Transformers	Nov 8, 2020	16kBenchmarking	CodeCode Available	1
Disentangling and Unifying Graph Convolutions for Skeleton-Based Action Recognition	Mar 31, 2020	3D Action RecognitionAction Recognition	CodeCode Available	1
V4D:4D Convolutional Neural Networks for Video-level Representation Learning	Feb 18, 2020	Long-range modelingRepresentation Learning	CodeCode Available	1

Show:10 25 50

← PrevPage 4 of 4Next →

No leaderboard results yet.