DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

MBART-VI-OCR-Adaptation: Multilingual Text Data for OCR Enhancement | DataSalon

Home Computer VisionMBART-VI-OCR-Adaptation: Multilingual Text Data for OCR Enhancement

Computer Vision

MBART-VI-OCR-Adaptation: Multilingual Text Data for OCR Enhancement

Available on 1 platform

Description

A dataset named 'mbart-vi-ocr-adaptation-254000' hosted on Kaggle. The title suggests it contains text data, likely for adapting the mBART multilingual model to Optical Character Recognition tasks, potentially involving Vietnamese language. The dataset's specific content, size, and origin are not detailed in the provided metadata.

Use Cases

Fine-tuning mBART for post-OCR text correction in Vietnamese (inferred from domain, verify after download)
Training a language model to improve text recognition accuracy from scanned documents (inferred from domain, verify after download)
Benchmarking multilingual OCR adaptation techniques (inferred from domain, verify after download)

Strengths

Published on Kaggle, a major platform for data science resources.

Limitations

Metadata is minimal; actual content requires verification after download.
Row count, file formats, and column definitions are unknown, which limits suitability assessment.
License and authorship information are unavailable, affecting reproducibility and usage rights.

Provenance

Source: Kaggle

License is unknown; users must verify terms before commercial use.

Text Machine Translation Multilingual Nlp OCR Mbart

Related Datasets

Quality Score

D16

Description

Source

Reputation

Quality Score

D16

Description

Source

Reputation

Access

Community

0 views

Dataset Info

Last synced: Jun 11, 2026

Access

Community

0 views

Dataset Info

Last synced: Jun 11, 2026

MBART-VI-OCR-Adaptation: Multilingual Text Data for OCR Enhancement

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info