Optical Character Recognition

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 76–100 of 526 papers

Title	Date	Tasks	Status	Hype	Score
MCSCSet: A Specialist-annotated Dataset for Medical-domain Chinese Spelling Correction	Oct 21, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1	5
ODM: A Text-Image Further Alignment Pre-training Approach for Scene Text Detection and Spotting	Mar 1, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1	5
Meta-Album: Multi-domain Meta-Dataset for Few-Shot Image Classification	Feb 16, 2023	Few-Shot Image ClassificationFew-Shot Learning	CodeCode Available	1	5
Benchmarking Vision-Language Models on Optical Character Recognition in Dynamic Video Environments	Feb 10, 2025	BenchmarkingOptical Character Recognition	CodeCode Available	1	5
Fully Unsupervised Diversity Denoising with Convolutional Variational Autoencoders	Jun 10, 2020	Cell SegmentationDenoising	CodeCode Available	1	5
DocParser: End-to-end OCR-free Information Extraction from Visually Rich Documents	Apr 24, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1	5
Focus, Distinguish, and Prompt: Unleashing CLIP for Efficient and Flexible Scene Text Retrieval	Aug 1, 2024	AttributeOptical Character Recognition	CodeCode Available	1	5
Digitizing Historical Balance Sheet Data: A Practitioner's Guide	Mar 31, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1	5
LogicOCR: Do Your Large Multimodal Models Excel at Logical Reasoning on Text-Rich Images?	May 18, 2025	Logical ReasoningMultimodal Reasoning	CodeCode Available	1	5
A Large Multi-Target Dataset of Common Bengali Handwritten Graphemes	Oct 1, 2020	Multi-Label ClassificationOptical Character Recognition	CodeCode Available	1	5
Operationalizing a National Digital Library: The Case for a Norwegian Transformer Model	Apr 19, 2021	Language ModelingLanguage Modelling	CodeCode Available	1	5
Toxicity of the Commons: Curating Open-Source Pre-Training Data	Oct 29, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1	5
FAWA: Fast Adversarial Watermark Attack on Optical Character Recognition (OCR) Systems	Dec 15, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	1	5
Judge a Book by its Cover: Investigating Multi-Modal LLMs for Multi-Page Handwritten Document Transcription	Feb 27, 2025	Handwritten Text RecognitionHTR	CodeCode Available	0	5
It Takes Two to Tango: Combining Visual and Textual Information for Detecting Duplicate Video-Based Bug Reports	Jan 22, 2021	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0	5
ASTER: An Attentional Scene Text Recognizer with Flexible Rectification	Jun 25, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0	5
A Skip-connected Multi-column Network for Isolated Handwritten Bangla Character and Digit recognition	Apr 27, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0	5
IDPL-PFOD2: A New Large-Scale Dataset for Printed Farsi Optical Character Recognition	Dec 2, 2023	Optical Character RecognitionPrinted Text Recognition	CodeCode Available	0	5
iExam: A Novel Online Exam Monitoring and Analysis System Based on Face Detection and Recognition	Jun 27, 2022	Face DetectionFace Recognition	CodeCode Available	0	5
License Plate Detection and Recognition in Unconstrained Scenarios	Sep 1, 2018	License Plate DetectionLicense Plate Recognition	CodeCode Available	0	5
Arrow-Guided VLM: Enhancing Flowchart Understanding via Arrow Direction Encoding	May 9, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0	5
Are VLMs Really Blind	Oct 29, 2024	Language ModelingLanguage Modelling	CodeCode Available	0	5
Advancing Multilingual Handwritten Numeral Recognition with Attention-driven Transfer Learning	Mar 18, 2024	Handwritten Digit RecognitionOptical Character Recognition	CodeCode Available	0	5
A model of diffuse Galactic Radio Emission from 10 MHz to 100 GHz	Feb 12, 2008	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available	0	5
Handwritten Code Recognition for Pen-and-Paper CS Education	Aug 7, 2024	HallucinationLanguage Modeling	CodeCode Available	0	5

Show:10 25 50

← PrevPage 4 of 22Next →

No leaderboard results yet.