20 Benchmark Classification Datasets for Feature Selection Evaluation

Name: 20 Benchmark Classification Datasets for Feature Selection Evaluation
Creator: gabriel lima
Published: 2026-05-04T11:53:06
License: CC-BY-4.0
Keywords: Machine Learning, CSV, Benchmark, Healthcare, Computer Vision, Tabular, Agriculture, Classification, Feature Selection

by gabriel limaUpdated 1mo ago

71.6 MB20files

Available on 1 platform

Sign in to view source links and access this dataset

Description

20 publicly available classification datasets selected for diversity in dimensionality, sample size, class distribution, and application domain. Gabriel Lima compiled these datasets for evaluating a Model-Agnostic Multivariate Separability Index, and they are provided in CSV format. The collection was last updated on May 4, 2026.

Use Cases

Benchmarking feature selection algorithms based on datasets with varying levels of class overlap.
Evaluating model performance across heterogeneous domains based on datasets from healthcare, agriculture, and signal recognition.
Analyzing feature redundancy and noise in classification tasks based on the described statistical conditions.

Strengths

Contains 20 datasets spanning multiple fields, including healthcare, agriculture, and signal recognition.
Datasets are selected to ensure diversity in dimensionality, sample size, class distribution, and application domain.
Files are provided in CSV format and are ready for direct use in machine learning tasks.

Limitations

Row count is unknown, which may limit suitability assessment.
Column-level documentation is absent; field semantics must be inferred after download.

Provenance

Source: figshare
Collection Method: Compiled from 20 publicly available classification datasets.
Freshness: Last updated 2026-05-04 11:53:06; freshness should be verified.

License is CC-BY-4.0.

Tabular CSV Machine Learning Benchmark Healthcare Computer Vision Agriculture Classification Feature Selection

Related Datasets

Quality Score

C49

Description

55

Source

43

Reputation

35

Access

72

Community

0 views

Dataset Info

License: CC-BY-4.0
Author: gabriel lima
Files: 20
Created: May 4, 2026
Updated: May 4, 2026
DOI
Last synced: May 4, 2026

Access

72

Community

0 views

Dataset Info

License: CC-BY-4.0
Author: gabriel lima
Files: 20
Created: May 4, 2026
Updated: May 4, 2026
DOI
Last synced: May 4, 2026

20 Benchmark Classification Datasets for Feature Selection Evaluation

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info