RedCaps: 12M Reddit Image-Text Pairs

Name: RedCaps: 12M Reddit Image-Text Pairs
Creator: kdexd
Published: 2022-03-02T23:29:22
Keywords: Source Datasetsoriginal, Task Categoriesimage To Text, Languageen, Language Creatorsfound, Size Categories10 Mn100 M, Task Idsimage Captioning, Licensecc By 40, Annotations Creatorsfound, Regionus, Multilingualitymonolingual, Arxiv211111431

by kdexdUpdated 2y ago

Available on 1 platform

Sign in to view source links and access this dataset

Description

12 million image-text pairs sourced from 350 manually curated subreddits covering diverse objects and scenes. The dataset utilizes subreddit names as coarse labels to guide composition without requiring manual per-instance annotation.

Use Cases

Train vision-language models for image captioning using the image-text pairs
Perform zero-shot classification by leveraging the coarse labels derived from the 350 subreddit names
Analyze linguistic variations in image descriptions across different subreddit communities

Strengths

12,000,000 image-text pairs collected from the Reddit platform
Includes data from 350 manually curated subreddits providing topical diversity
Uses subreddit names as coarse-grained labels for dataset steering

Source Datasetsoriginal Task Categoriesimage To Text Languageen Language Creatorsfound Size Categories10 Mn100 M Task Idsimage Captioning Licensecc By 40 Annotations Creatorsfound Regionus Multilingualitymonolingual Arxiv211111431

Related Datasets

Quality Score

D32

Description

24

Source

44

Reputation

31

Access

22

Community

914 downloads

59 likes

0 views

Dataset Info

Author: kdexd
Created: Mar 2, 2022
Updated: Jan 18, 2024
Last synced: Jun 3, 2026

Access

22

Community

914 downloads

59 likes

0 views

Dataset Info

Author: kdexd
Created: Mar 2, 2022
Updated: Jan 18, 2024
Last synced: Jun 3, 2026

RedCaps: 12M Reddit Image-Text Pairs

Description

Use Cases

Strengths

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info