DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

PaperPDF: PDF-WuKong Dataset for Multimodal Long Document Reading | DataSalon

Home Multimodal & LLMPaperPDF: PDF-WuKong Dataset for Multimodal Long Document Reading

Multimodal & LLM

PaperPDF: PDF-WuKong Dataset for Multimodal Long Document Reading

Name: PaperPDF: PDF-WuKong Dataset for Multimodal Long Document Reading
Creator: yh0075
Published: 2024-10-16T07:10:27
Keywords: Document Understanding, Pdf Processing, Multimodal Ai, Computer Vision, Research Data, Multimodal

by yh0075·Updated 1y ago

Available on 1 platform

Description

PDF-WuKong is a dataset for training and evaluating large multimodal models on long PDF documents. The data accompanies the research paper 'PDF-WuKong: A Large Multimodal Model for Efficient Long PDF Reading with End-to-End Sparse Sampling'. Author yh0075 uploaded it to Hugging Face on 2025-01-06.

Use Cases

Training multimodal language models for PDF comprehension based on the described end-to-end sparse sampling method.
Benchmarking model performance on long document reading tasks using the provided PDF corpus.
Extracting structured text and image information from XML-based PDF documents using the included code.

Strengths

Dataset is directly linked to a named research paper, providing a clear academic context.
Last updated on 2025-01-06, indicating recent maintenance.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.

Provenance

Source: yh0075 on Hugging Face.
Collection Method: Likely extracted from PDF documents for the PDF-WuKong research project.
Time Range: null
Freshness: Last updated 2025-01-06 02:17:02.
Geography: null

null

Multimodal Document Understanding Pdf Processing Multimodal Ai Computer Vision Research Data

Related Datasets

Quality Score

D36

Description

Source

Reputation

Quality Score

D36

Description

Source

Reputation

Access

Community

434 downloads

9 likes

0 views

Dataset Info

Author: yh0075
Created: Oct 16, 2024
Updated: Jan 6, 2025
Last synced: Apr 30, 2026

Access

Community

434 downloads

9 likes

0 views

Dataset Info

Author: yh0075
Created: Oct 16, 2024
Updated: Jan 6, 2025
Last synced: Apr 30, 2026

PaperPDF: PDF-WuKong Dataset for Multimodal Long Document Reading

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info