DataSalon

Discover quality datasets for AI training — aggregated from 40+ platforms, curated by AI.

ProductSearch Datasets Browse Topics Rankings Community API / MCP

ResourcesDocumentation Blog Changelog Status

LegalPrivacy Policy Terms of Service Cookie Policy

Qwen3.5-2B-Base Blind Spots: 32 Stress-Test Prompts and Failure Cases | DataSalon

Home Reinforcement LearningQwen3.5-2B-Base Blind Spots: 32 Stress-Test Prompts and Failure Cases

Reinforcement Learning

Qwen3.5-2B-Base Blind Spots: 32 Stress-Test Prompts and Failure Cases

Name: Qwen3.5-2B-Base Blind Spots: 32 Stress-Test Prompts and Failure Cases
Creator: Elshawaf1
Published: 2026-03-07T19:47:15
Keywords: Librarypolars, Languageen, Size Categoriesn1 K, Modalitytext, Librarymlcroissant, Librarydatasets, Librarypandas, Parquet, Regionus, Licensemit

by Elshawaf1·Updated 3mo ago

Available on 1 platform

Description

This text dataset documents 10 failure cases and 32 stress-test prompts for the Qwen3.5-2B-Base model, authored by Elshawaf1 in March 2026. It maps specific model blind spots to identify training opportunities for future fine-tuning.

Use Cases

Fine-tuning Qwen3.5-2B-Base using the 32 prompts to mitigate specific failure modes
Evaluating small language models against the 10 documented failure cases
Researching adversarial prompt engineering for the Qwen model family

Strengths

MIT licensed
32 targeted stress-test prompts
Specific to Qwen3.5-2B-Base architecture

Limitations

Small sample size of 32 records
Model-specific focus limits generalizability to other LLMs
Unknown column schema

Provenance

Source: Elshawaf1 via Hugging Face
Collection Method: annotated
Freshness: Last updated March 2026.
Geography: United States

Experiments were conducted in Google Colab; see the Hugging Face dataset page for full reproduction details and MIT license terms.

Parquet Librarypolars Languageen Size Categoriesn1 K Modalitytext Librarymlcroissant Librarydatasets Librarypandas Regionus Licensemit

Related Datasets

Quality Score

D36

Description

Source

Reputation

Quality Score

D36

Description

Source

Reputation

Access

Community

23 downloads

1 likes

0 views

Dataset Info

Author: Elshawaf1
Created: Mar 7, 2026
Updated: Mar 9, 2026

Access

Community

23 downloads

1 likes

0 views

Dataset Info

Author: Elshawaf1
Created: Mar 7, 2026
Updated: Mar 9, 2026

Qwen3.5-2B-Base Blind Spots: 32 Stress-Test Prompts and Failure Cases

Description

Use Cases

Strengths

Limitations

Provenance

Related Topics

Related Datasets

Quality Score

Community

Dataset Info

Community

Dataset Info