Optical Character Recognition (OCR)

Optical Character Recognition or Optical Character Reader (OCR) is the electronic or mechanical conversion of images of typed, handwritten or printed text into machine-encoded text, whether from a scanned document, a photo of a document, a scene-photo (for example the text on signs and billboards in a landscape photo, license plates in cars...) or from subtitle text superimposed on an image (for example: from a television broadcast)

Papers

Recently Added Most Hyped Most Active Needs Verification Most Verified

Showing 1151–1200 of 1209 papers

Title	Date	Tasks	Status
Chandojnanam: A Sanskrit Meter Identification and Utilization System	Sep 29, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
VisionThink: Smart and Efficient Vision Language Model via Reinforcement Learning	Jul 17, 2025	Language ModelingLanguage Modelling	CodeCode Available
AdaVideoRAG: Omni-Contextual Adaptive Retrieval-Augmented Efficient Long Video Understanding	Jun 16, 2025	Optical Character Recognition (OCR)RAG	CodeCode Available
Ekush: A Multipurpose and Multitype Comprehensive Database for Online Off-Line Bangla Handwritten Characters	Jul 17, 2019	Optical Character Recognition (OCR)	CodeCode Available
NRTR: A No-Recurrence Sequence-to-Sequence Model For Scene Text Recognition	Jun 4, 2018	DecoderOptical Character Recognition (OCR)	CodeCode Available
An Unsupervised Normalization Algorithm for Noisy Text: A Case Study for Information Retrieval and Stance Detection	Jan 9, 2021	Information RetrievalOptical Character Recognition (OCR)	CodeCode Available
Centurio: On Drivers of Multilingual Ability of Large Vision-Language Model	Jan 9, 2025	Language ModelingLanguage Modelling	CodeCode Available
TransDocs: Optical Character Recognition with word to word translation	Apr 15, 2023	Deep LearningDocument Translation	CodeCode Available
SUT: a new multi-purpose synthetic dataset for Farsi document image analysis	Nov 27, 2023	Document Classificationdocument-image-classification	CodeCode Available
Object detection deep learning networks for Optical Character Recognition	May 1, 2019	Deep LearningDocument Classification	CodeCode Available
Efficient Video-Based ALPR System Using YOLO and Visual Rhythm	Jan 4, 2025	License Plate RecognitionOptical Character Recognition	CodeCode Available
Relation-Rich Visual Document Generator for Visual Information Extraction	Apr 14, 2025	Diversitydocument understanding	CodeCode Available
A Survey of Deep Learning Approaches for OCR and Document Understanding	Nov 27, 2020	document understandingOptical Character Recognition (OCR)	CodeCode Available
An Efficient and Layout-Independent Automatic License Plate Recognition System Based on the YOLO detector	Sep 4, 2019	Data AugmentationGPU	CodeCode Available
Reproducibility, Replicability, and Insights into Visual Document Retrieval with Late Interaction	May 12, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Case Study of a highly automated Layout Analysis and OCR of an incunabulum: 'Der Heiligen Leben' (1488)	Jan 20, 2017	Optical Character Recognition (OCR)	CodeCode Available
Crossing Language Borders: A Pipeline for Indonesian Manhwa Translation	Jan 3, 2025	Machine TranslationObject Detection	CodeCode Available
Efficient Multi-domain Text Recognition Deep Neural Network Parameterization with Residual Adapters	Jan 1, 2024	Multi-Task LearningOptical Character Recognition	CodeCode Available
Transfer Learning for OCRopus Model Training on Early Printed Books	Dec 15, 2017	Optical Character Recognition (OCR)Transfer Learning	CodeCode Available
Calibrated Structured Prediction	Dec 1, 2015	Medical DiagnosisOptical Character Recognition	CodeCode Available
A Gaussian Process Upsampling Model for Improvements in Optical Character Recognition	May 7, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
SynFinTabs: A Dataset of Synthetic Financial Tables for Information and Table Extraction	Dec 5, 2024	ArticlesDataset Generation	CodeCode Available
Syntactic Language Change in English and German: Metrics, Parsers, and Convergences	Feb 18, 2024	Optical Character Recognition (OCR)Sentence	CodeCode Available
Efficient License Plate Recognition in Videos Using Visual Rhythm and Accumulative Line Analysis	Jan 8, 2025	License Plate DetectionLicense Plate Recognition	CodeCode Available
EATEN: Entity-aware Attention for Single Shot Visual Text Extraction	Sep 20, 2019	DecoderEntity Extraction using GAN	CodeCode Available
Adversarial Training with OCR Modality Perturbation for Scene-Text Visual Question Answering	Mar 14, 2024	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Synthetic Document Question Answering in Hungarian	May 29, 2025	Optical Character Recognition (OCR)Question Answering	CodeCode Available
Corpus for Coreference Resolution on Scientific Papers	May 1, 2014	coreference-resolutionCoreference Resolution	CodeCode Available
Calamari - A High-Performance Tensorflow-based Deep Learning Package for Optical Character Recognition	Jul 5, 2018	GPUOptical Character Recognition	CodeCode Available
CORD: A Consolidated Receipt Dataset for Post-OCR Parsing	Sep 14, 2019	Optical Character Recognition (OCR)Semantic Parsing	CodeCode Available
Early evidence of how LLMs outperform traditional systems on OCR/HTR tasks for historical records	Jan 20, 2025	HTROptical Character Recognition (OCR)	CodeCode Available
Advancing Post-OCR Correction: A Comparative Study of Synthetic Data	Aug 5, 2024	Optical Character Recognition (OCR)Synthetic Data Generation	CodeCode Available
Robust Scene Text Recognition with Automatic Rectification	Mar 12, 2016	Optical Character Recognition (OCR)Scene Text Detection	CodeCode Available
Building a Part-of-Speech Tagged Corpus for Drenjongke (Bhutia)	Dec 1, 2020	Optical Character Recognition (OCR)POS	CodeCode Available
Time-Aware Word Embeddings for Three Lebanese News Archives	May 1, 2020	Optical Character Recognition (OCR)Word Embeddings	CodeCode Available
OCR-Reasoning Benchmark: Unveiling the True Capabilities of MLLMs in Complex Text-Rich Image Reasoning	May 22, 2025	Optical Character Recognition (OCR)Visual Reasoning	CodeCode Available
RoundTripOCR: A Data Generation Technique for Enhancing Post-OCR Error Correction in Low-Resource Devanagari Languages	Dec 14, 2024	Machine TranslationOptical Character Recognition	CodeCode Available
Convolution-based Probability Gradient Loss for Semantic Segmentation	Apr 10, 2024	Optical Character Recognition (OCR)Semantic Segmentation	CodeCode Available
E2TIMT: Efficient and Effective Modal Adapter for Text Image Machine Translation	May 9, 2023	DecoderMachine Translation	CodeCode Available
SAFL: A Self-Attention Scene Text Recognizer with Focal Loss	Jan 1, 2022	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
E2E-MLT - an Unconstrained End-to-End Method for Multi-Language Scene Text	Jan 30, 2018	Optical Character Recognition (OCR)	CodeCode Available
Brno Mobile OCR Dataset	Jul 2, 2019	BinarizationDenoising	CodeCode Available
Comparative analysis of optical character recognition methods for Sámi texts from the National Library of Norway	Jan 13, 2025	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
DuoSearch: A Novel Search Engine for Bulgarian Historical Documents	May 30, 2023	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
ASTER: An Attentional Scene Text Recognizer with Flexible Rectification	Jun 25, 2018	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
An agentic system with reinforcement-learned subsystem improvements for parsing form-like documents	May 16, 2025	FormLanguage Modeling	CodeCode Available
Binary Document Image Super Resolution for Improved Readability and OCR Performance	Dec 6, 2018	Image Super-ResolutionInformation Retrieval	CodeCode Available
A Skip-connected Multi-column Network for Isolated Handwritten Bangla Character and Digit recognition	Apr 27, 2020	Optical Character RecognitionOptical Character Recognition (OCR)	CodeCode Available
Adapting the Tesseract Open-Source OCR Engine for Tamil and Sinhala Legacy Fonts and Creating a Parallel Corpus for Tamil-Sinhala-English	Sep 13, 2021	Optical Character Recognition (OCR)	CodeCode Available
BiblioPage: A Dataset of Scanned Title Pages for Bibliographic Metadata Extraction	Mar 25, 2025	document understandingobject-detection	CodeCode Available

Show:10 25 50

← PrevPage 24 of 25Next →

All datasets Benchmarking Chinese Text Recognition: Datasets, Baselines, and an Empirical Study VideoDB's OCR Benchmark Public Collection FSNS - Test I2L-140K SUT im2latex-100k

Benchmark Results

#	Model	Metric	Claimed	Verified	Status
1	DTrOCR	Accuracy (%)	89.6	—	Unverified
2	DTrOCR 105M	Accuracy (%)	89.6	—	Unverified
3	MaskOCR-L	Accuracy (%)	82.6	—	Unverified
4	TransOCR	Accuracy (%)	72.8	—	Unverified
5	SRN	Accuracy (%)	65	—	Unverified
6	MORAN	Accuracy (%)	64.3	—	Unverified
7	SEED	Accuracy (%)	61.2	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	GPT-4o	Average Accuracy	76.22	—	Unverified
2	Gemini-1.5 Pro	Average Accuracy	76.13	—	Unverified
3	Claude-3 Sonnet	Average Accuracy	67.71	—	Unverified
4	RapidOCR	Average Accuracy	56.98	—	Unverified
5	EasyOCR	Average Accuracy	49.3	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	STREET	Sequence error	27.54	—	Unverified
2	SEE	Sequence error	22	—	Unverified
3	AttentionOCR_Inception-resnet-v2_Location	Sequence error	15.8	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-NOPOOL	BLEU	89.09	—	Unverified
2	I2L-STRIPS	BLEU	89	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	Tesseract	Character Error Rate (CER)	0.08	—	Unverified
2	EasyOCR	Character Error Rate (CER)	0.07	—	Unverified

#	Model	Metric	Claimed	Verified	Status
1	I2L-STRIPS	BLEU	88.86	—	Unverified