DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

OmniEdit Filtered 1.2M: Training Data for a Multitask Image Editor | DataSalon

Home Multimodal & LLMOmniEdit Filtered 1.2M: Training Data for a Multitask Image Editor

Multimodal & LLM

OmniEdit Filtered 1.2M: Training Data for a Multitask Image Editor

Name: OmniEdit Filtered 1.2M: Training Data for a Multitask Image Editor
Creator: TIGER-Lab
Published: 2024-11-11T07:40:47
Keywords: Image, Multimodal Training, Computer Vision, Ai Training, Multimodal

by TIGER-Lab·Updated 1y ago

Available on 1 platform

Description

TIGER-Lab's OmniEdit Filtered 1.2M dataset, last updated December 2024, is designed for training a general-purpose image editing model. The dataset was created by filtering data using large multimodal models like GPT-4o for quality assessment. It provides supervision for seven distinct image editing tasks.

Use Cases

Train a unified image editor based on supervision from seven specialist models mentioned in the description
Benchmark filtering techniques for training data using large multimodal model scores as described
Develop models capable of handling image editing at any aspect ratio as referenced in the description

Strengths

Dataset is associated with a published research paper and project website.
Data quality was improved using importance sampling based on scores from large multimodal models like GPT-4o.

Limitations

Description metadata is limited; actual data quality requires manual inspection after download.
Column-level documentation is absent; field semantics must be inferred after download.
Row count is unknown, which may limit suitability assessment.

Provenance

Source: TIGER-Lab
Collection Method: Filtered using supervision from specialist models and importance sampling with large multimodal model scores.
Time Range: null
Freshness: Last updated 2024-12-06 02:57:59; freshness should be verified.
Geography: null

null

Image Multimodal Multimodal Training Computer Vision Ai Training

Related Datasets

Quality Score

D39

Description

Source

Reputation

Quality Score

D39

Description

Source

Reputation

Access

Community

7.0K downloads

124 likes

0 views

Dataset Info

Author: TIGER-Lab
Created: Nov 11, 2024
Updated: Dec 6, 2024
Last synced: Jul 12, 2026

Access

Community

7.0K downloads

124 likes

0 views

Dataset Info

Author: TIGER-Lab
Created: Nov 11, 2024
Updated: Dec 6, 2024
Last synced: Jul 12, 2026

OmniEdit Filtered 1.2M: Training Data for a Multitask Image Editor

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info