Tifinagh OCR Dataset: 39,101 Synthetic Images for Script Recognition

Name: Tifinagh OCR Dataset: 39,101 Synthetic Images for Script Recognition
Creator: Tamazight
Published: 2026-04-25T00:25:36
Keywords: Image, Optical Character Recognition, Computer Vision, Synthetic Images, Multilingual Ocr, Tifinagh Script, Synthetic

by TamazightUpdated 2mo ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

Tamazight created a collection of 39,101 synthetic PNG images for training and evaluating OCR and vision-language models for the Tifinagh script. The dataset features a variety of fonts, background colors, and text styles in a rectangular format. It was last updated on the Hugging Face platform in April 2026.

Use Cases

Train OCR models for Tifinagh script based on the described synthetic image collection.
Evaluate the robustness of vision-language models on diverse Tifinagh text styles and backgrounds.
Benchmark model performance on a synthetic dataset with controlled font and color variations.
Develop tools for digitizing or processing Tifinagh text from images.

Strengths

Contains 39,101 synthetic images, providing a substantial volume for model training.
Designed with diversity in fonts, background colors, and text styles to improve model robustness.

Limitations

Dataset composition is synthetic, which may not fully represent real-world image conditions.
Column-level documentation is absent; field semantics must be inferred after download.
Description metadata is limited; actual data quality requires manual inspection after download.

Provenance

Source: Tamazight on Hugging Face.
Collection Method: Synthetically generated images.
Time Range: null
Freshness: Last updated 2026-04-25 02:38:57; freshness should be verified.
Geography: null

null

Image Optical Character Recognition Computer Vision Synthetic Images Multilingual Ocr Tifinagh Script Synthetic

Related Datasets

Quality Score

C41

Description

51

Source

36

Reputation

40

Access

26

Community

36 downloads

1 likes

0 views

Dataset Info

Author: Tamazight
Created: Apr 25, 2026
Updated: Apr 25, 2026
Last synced: May 27, 2026

Access

26

Community

36 downloads

1 likes

0 views

Dataset Info

Author: Tamazight
Created: Apr 25, 2026
Updated: Apr 25, 2026
Last synced: May 27, 2026

Tifinagh OCR Dataset: 39,101 Synthetic Images for Script Recognition

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info