Deepfashion Multimodal

Name: Deepfashion Multimodal
Creator: Marqo
Published: 2024-08-07T00:51:38
Keywords: Size Categories10 Kn100 K, Librarypolars, Modalitytext, Librarymlcroissant, Modalityimage, Librarydatasets, Librarypandas, Parquet, Regionus

by MarqoUpdated 1y ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

This multimodal fashion dataset provides image-text pairs annotated across categories, style, colors, materials, keywords, and fine-details. It is specifically curated to evaluate vision-language models like Marqo-FashionCLIP and Marqo-FashionSigLIP using fine-grained attribute metadata.

Use Cases

Train vision-language models using the text descriptions and image pairs for contrastive learning
Develop attribute-based search systems using the colors, materials, and style columns
Perform fine-grained fashion classification using the categories and fine-details labels
Benchmark retrieval accuracy for fashion-specific models using the keywords and metadata

Strengths

Includes multi-attribute labels for categories, style, and colors
Provides fine-grained metadata including materials and specific keywords
Contains textual descriptions paired with visual fashion data
Used as the evaluation benchmark for Marqo-FashionCLIP and Marqo-FashionSigLIP models

Parquet Size Categories10 Kn100 K Librarypolars Modalitytext Librarymlcroissant Modalityimage Librarydatasets Librarypandas Regionus

Related Datasets

Quality Score

D35

Description

39

Source

36

Reputation

36

Access

22

Community

301 downloads

9 likes

0 views

Dataset Info

Author: Marqo
Created: Aug 7, 2024
Updated: Aug 28, 2024
Last synced: Apr 13, 2026

Access

22

Community

301 downloads

9 likes

0 views

Dataset Info

Author: Marqo
Created: Aug 7, 2024
Updated: Aug 28, 2024
Last synced: Apr 13, 2026

Deepfashion Multimodal

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info